통계를 처음 공부할 때, 마주하는 아주 중요한 개념들이 있다.
특히 통계적인 검정을 하고자 할 때, 기초적 검정이든 고급 검정이든 이번에 정리하고자 하는 개념들은 항상 사용되기 때문에 확실하게 알고 가는 것이 좋다. (항상 헷갈림)
📙 1. '알파α'
통계학개론과 같은 교재에서 '검정(hypothesis test)' 파트에 도달하면 가장 먼저 나오는 단어(?) 중에 하나가 '알파α'이다.
통계에서 알파α는 유의 수준(significance level)이라는 개념을 갖고 있다.
유의 수준은 제 1종의 오류(=귀무가설이 사실인데 기각하는 오류)를 허용할 확률이다.
유의 수준으로는 5%가 많이 사용되는데, 이는 제 1종의 오류를 허용할 확률이 5%라는 의미이다.
따라서 통계 검정시 유의 확률(p-value)이 유의 수준(significance level)인 5%보다 작으면 귀무가설을 기각하게 되는 것이다.
알파를 간단하게 정리하면 다음과 같이 나타낼 수 있다.
📌 알파 = 유의 수준 = 제 1종의 오류 = 위양성
α (alpha) = significance level = type 1 error = false positive
📘 2. '베타β'
검정(hypothesis test) 파트에서 알파 다음으로 나오는 개념이 '베타β'이다.
알파α가 제 1종의 오류를 나타냈다면,
베타β는 제 2종의 오류(=귀무가설이 거짓인데도 기각하지 않는 오류)를 나타낸다.
제 2종의 오류는 제 1종의 오류보다는 상대적으로 덜 치명적이긴 하지만, 여전히 오류라는 사실을 벗어날 수 없다.
베타를 간단하게 정리하면 다음과 같이 나타낼 수 있다.
📌 베타 = 제 2종의 오류 = 위음성
β (beta) = type 2 error = false negative
이를 그림으로 나타나면 다음과 같다. (출처는 scribbr)
검정력(=Power)
📋통계에서 검정력(=Power)이라 불리는 개념은 1에서 베타를 뺀 것이다.
즉, '검정력=Power'는 1에서 제 2종의 오류 확률을 뺀 것으로,
귀무가설이 거짓일 때 귀무가설을 기각할 확률이며,
이는 대립가설이 참일 때 대립가설을 받아들일 확률로,
True Positive일 확률이다.
검정력을 간단하게 정리하면 다음과 같다.
📌 Power in statistics
= 1 - β (beta)
= 1 - type 2 error
= 1 - Pr(False Negative)
= True Positive
= probability of accepting an alternative hypothesis when the alternative hypothesis is true.
=Pr(reject H0 | H1 is true)
= Sensitivity
따라서 높은 통계적 검정력이란 의미는 제 2종의 오류의 risk가 작다는 것을 의미한다.
"High statistical power" means there is small risk of having type 2 errors(false negative).
이론적으로는 제 2종의 오류와 제 1종의 오류를 모두 줄이는 것이 좋지만 불가능하다.
알파를 작게하면 베타가 커지고, 베타를 줄이면 알파가 커진다.
예를 들어, Bonferroni correction을 하게 되면 제 1종의 오류를 줄이게 되는, 매우 보수적인 방법이다.
따라서 Bonferroni correction을 적용하면 제 2종의 오류 확률이 증가하게 된다.
반대도 마찬가지이다.
제 2종의 오류를 줄이려 한다면 귀무가설을 기각할 확률이 증가하므로 제 1종의 오류가 증가하게 된다.
아래 표를 가지고도 생각해볼 수 있다.
Predicted | |||
---|---|---|---|
Positive | Negative | ||
Actual | Positive | True Positive (TP) | False Negative (FN) = beta |
Negative | False Positive (FP) = alpha |
True Negative (TN) |
'STATISTICS' 카테고리의 다른 글
McNemar Test (맥니마 검정법) - (2) 검정통계량 (0) | 2022.10.04 |
---|---|
McNemar Test (맥니마 검정법) - (1) 이항형 대응쌍에 대한 종속비율들의 비교 (0) | 2022.10.04 |
통계 기초 : 표준오차 vs 표준편차 (standard error & standard deviation) 차이 (0) | 2022.10.04 |
삼차원 분할표와 심슨의 역설 Simpson's paradox & 오즈비 (2) | 2022.10.04 |
오즈비의 신뢰구간 ; 95% confidence interval of Odds Ratio (1) | 2022.10.04 |