ANOVA 를 통해 세 군의 평균을 비교한다고 해보자.
귀무가설은
H₀ : 세 그룹의 차이는 없다.
$$ \mu_{A}=\mu_{B}=\mu_{C} $$
대립가설은
H₁ : 세 그룹의 차이는 존재한다. = Not H₀
만약 귀무가설이 기각 된다면, 어딘가에서 차이가 있다는 의미인데, 아직 어떤 비교군에서 차이가 있었는지 모른다.
귀무가설이 기각 된 경우는 다음과 같은 상황들 중 한 상황이었을 것이다.
- A ≠ B ≠ C
- A ≠ B = C
- A = B ≠ C
- A ≠ C = B
위 네 경우 중 어떤 상황 때문에 귀무가설이 기각되었는지 검정하는 것이 다중비교 (Multiple Comparison Test) 혹은 사후검정(post-hoc test) 라 한다.
위 네 가지 상황 중 어떤 상황 때문에 분산분석의 귀무가설이 기각 되었는지 확인하기 위해서는
- A - B
- A - C
- B - C
이렇게 세 가지 짝이 필요하다. 이와 같이 비교를 위한 짝의 집합 (set of comparisons)을 Family이다.
Family에 속한 짝 비교가 시행될 때 발생하는 1종 오류 (ɑ) 를 "Family-wise error (FWE)" 라고 칭한다.
(1) 1번 A-B 차이를 검정
제일 먼저, 1번 짝인 A-B의 차이 유무를 유의수준 (ɑ)을 5%로 검정을 하고자 한다.
이 때, 귀무가설과 대립가설은 다음과 같다.
H₀ : A = B
H₁ : not H₀
이 두 그룹의 비교를 위해 student t-test를 시행하였고, 유의한 차이가 없었다.
만약 이 때, 차이가 없는데도 불구하고 귀무가설을 기각하는 것을 제 1종의 오류라 한다.
⇨ 여기서 제 1종의 오류는 5%, 귀무가설이 참일 확률은 95%이다.
(2) 1번 A-B 차이 & 2번 A-C 차이 검정
이번에는 1번과 2번을 각각 유의수준 5%로 검정을 하고자 다음 두 개의 비교군을 대상으로 student t-test를 시행하고자 한다.
이 때, 귀무가설과 대립가설은 다음과 같다.
H₀ : A = B & A = C
H₁ : not H₀
1번과 2번에서 각각 student t-test를 시행한 결과 각각 유의한 차이가 없었다.
여기에서 제 1종의 오류는 귀무가설 ① A - B & ② A - C 모두 같음이 맞는데도 불구하고 아니라는 결론을 내리는 것이므로,
만약 ① A - B 혹은 ② A - C 에서 한 개라도 차이가 있다고 결론 내리거나, 두 비교군 모두 차이가 있다고 결론을 내리면 제 1종의 오류가 된다.
이 경우, ①번 혹은 ②번, 둘 중 한 개에서만 잘못 결론을 내려도 귀무가설이 기각된다.
① A - B 에서 귀무가설이 참일 확률은 0.95, ② A - C 에서 귀무가설이 참일 확률은 0.95 이므로,
⇨ 이 두 개의 비교군에서 모두 귀무가설이 참일 확률은 0.95*0.95=0.9025로, 90.25%가 된다.
⇨ 따라서 제 1종의 오류가 발생할 확률은 1-0.9025=0.0975이므로, 9.75%가 된다.
(3) 1번 A-B 차이 & 2번 A-C & 3번 B-C 차이 검정
이번에는 1번과 2번, 3번 모두 각각 유의수준 5%로 검정을 하고자 세 개의 비교군을 대상으로 student t-test를 시행하고자 한다.
이 때, 귀무가설과 대립가설은 다음과 같다.
H₀ : A = B & A = C & B = C
H₁ : not H₀
1번과 2번, 3번에서 각각 student t-test를 시행한 결과 각각 유의한 차이가 없었다.
여기에서 제 1종의 오류는 ① A - B & ② A - C & ③ B - C 각 군에서 모두 같음이 맞는데도 불구하고 아니라는 결론을 내리는 것이므로,
만약 ① A - B 혹은 ② A - C 혹은 ③ B - C 에서 한 개라도 차이가 있다고 결론 내리면 제 1종의 오류가 된다.
따라서 실제로 차이가 유의하지 않음에도, 우연에 의해 세 개 중에 한 개라도 유의하다고 나오면, 위 귀무가설이 기각되는 제 1종의 오류가 발생하게 된다.
① A - B 에서 귀무가설이 참일 확률은 0.95, ② A - C 에서 귀무가설이 참일 확률은 0.95 ③ B - C 에서 귀무가설이 참일 확률은 0.95이므로,
⇨ 이 세 개의 비교군에서 모두 귀무가설이 참일 확률은 0.95*0.95*0.95=0.8574로, 85.74%가 된다.
⇨ 따라서 제 1종의 오류가 발생할 확률은 1-0.8574=0.1426이므로, 14.75%가 된다.
📝 예시를 들어보자.
- 두 개의 과목이 있고 이 두 과목 모두 세 문제가 있는 시험이 있다.
한 과목은 세 개 중에 한 개라도 맞추면 통과할 수 있고, 나머지 한 과목은 세 개 중 세 문제를 모두 맞춰야 통과할 수 있다면 무엇을 선택할 것인가?
위 문제를 생각해보면 당연히 세 개 중 한 개라도 맞추면 시험을 통과하는 과목을 선택할 것이다. 세 개 중 세 개를 모두 맞출 확률보다 세 개 중 한 개를 맞출 확률이 더 높기 때문이다.
위 다중비교 (Multiple Comparison tests)도 위 예시와 마찬가지의 문제이다.
세 번째 검정처럼 세 가지를 동시에 만족해야 귀무가설을 기각할 수 없다면, 만약 한 개라도 틀릴 경우 제 1종의 오류를 범하게 된다.
따라서 이를 조정해 줄 필요가 있고, 이 조정에는 본페로니 등 여러 가지 방법이 있다.
이 방법들에 대해서는 다음 글에서 다루도록 하겠다.
'STATISTICS' 카테고리의 다른 글
베이지안 확률 (Bayesian Probability) - 기초 (0) | 2023.02.12 |
---|---|
Design of Studies: 연구의 종류, 후향 vs 전향 연구 (0) | 2023.02.11 |
Effect size : 효과 크기와 유의확률 (p-value) (2) (0) | 2022.12.25 |
Effect size : 효과 크기와 유의확률 (p-value) (1) (1) | 2022.12.25 |
Two-sample independent t-test (독립 이표본 검정을 위한 가정들에 대한 논쟁) (0) | 2022.10.09 |