반응형

이번 글에서는 통계적 검정에 있어서 많은 논란이 (?) 있어 왔던 모수적 검정과 비모수적 검정 방법에 대해 이야기 해보고자 한다.

 

이런건 예시를 들어서 하는게 제일 좋으므로, 바로 예시를 보면서 모수검정을 할지 비모수검정을할지, 그 의사결정 과정은 어떻게 되는지 살펴보도록 하겠다.

 

시중에 나와 있는 과자들의 평균 무게가 15g 이라고 한다.

이를 검정하기 위해 총 25개 종류의 과자를 모았고, 유의수준 5%에서 검정한다고 치자.

표본 = (15, 19, 14,  3, 10, 18, 22, 11, 5, 20, 14, 22, 25, 26, 27, 5, 19, 27, 25, 28, 25, 9, 29, 3, 8) 

이와 같이 25개 종류의 과자들을 샘플로 선택하였고, 평균을 구해보니 17.16g 이었다.

 

그럼, 이 때 귀무가설과 대립가설은 다음과 같다.

$$ H_{0} :  \overline{X}=15 $$

$$ H_{1} : not ~ H_{0} $$

 

 

이를 검정하기 위해서는 대표적인 parametric test (모수검정)인 one-sample t-test를 시행할 수 있다.

혹은 wilconxon signed-rank test와 같은 비모수 검정법을 이용 할 수 있다.

 

그럼 우리 예시를 검정하기 위해 어떤 test를 사용하면 좋을까?

 

1. 정규성 검정 후 검정법 선택

많은 통계 교과서 혹은 통계 강의에서 t-test 전에, 우선 샘플데이터들이 정규분포를 만족하는지 검정해야 한다고 서술한다.

이를 정규성 검정이라고 하는데, 정규성 검정의 대표적인 test는 shapiro-wilk's 검정이 있다.

만약 shapiro-wilk's 검정에서 p-value가 0.05보다 크면 정규성을 만족한다고 보고, 그대로 t-test를 진행하며, p-value가 0.05보다 작게 나오면 정규성을 만족하지 못하여 비모수 검정 선택을 거의 교과서적인(?) 정석으로 나타내는 경우가 많다.

 

뿐만 아니라 논문을 작성할 때, demographics 표에서 정규성 검정을 통과한 항목들은 평균과 표준편차로 작성, 정규성 검정을 통과하지 못한 항목들은 중앙값과 (최소값, 최대값) 혹은 중앙값과 (사분위수) 등으로 표현하기도 한다.

 

그러나 shapiro-wilk's 검정은 샘플사이즈의 영향을 크게 받기 때문에, 대략 히스토그램을 그린 후 해당 분포가 대략 정규분포를 따르는 것처럼 보이면 정규성을 만족한다고 보고 t-test를 시행할 수 있다. 

 

 

2. 샘플사이즈 고려 후 검정법 선택

한편 또 다른 통계 교과서, 강의들에서는 정규성을 만족하는지 살펴볼 필요 없이 샘플 크기가 대략 30개 이상이면 바로 t-test를 진행해도 무방하다고 말하기도 한다. 중심극한정리에 따라 샘플 수가 커질수록 표본평균은 정규분포를 따르게 되므로 샘플크기가 크다면 굳이 정규성 검정을 할 필요 없이 바로 power가 더 높은 모수 검정 (parametric test) 을 진행해도 좋다는 입장이다.

 

다만, medical data는 그 특성 상 한쪽으로 치우친 (extrememly skewed data) 가 있는데, 그런 경우는 샘플사이즈가 25를 넘어도, outlier 때문에 non-parametric test를 사용하는 것이 권장된다.

 

 

 

📖자 그럼 우리의 경우 어떤 검정법을 사용하는 것이 좋을까?

 

① 우리 데이터의 샘플 사이즈는 25이다. 30개 이상은 아니지만, 그렇다고 엄청나게 적은 수의 샘플사이즈는 아니다. 

-> 음.. 좀 애매하다. 데이터 분포를 살펴봐야겠다!

 

② 그럼 정규성 만족 여부를 살펴볼까? 앞서 말했듯이 shapiro-wilk's 검정보다는 히스토그램을 그려 정규성을 만족하는지 보는 것이 좋다. 우리 샘플 데이터의 히스토그램은 다음과 같다.

 

자, 위 히스토그램을 보고, 정규분포에 근사한다고 할 수 있을까?

-> 완전한 정규분포 모양은 아니지만.. 또 완전 치우친 분포도 아니고, outlier 값도 없는 것 같은데..

 

이런 경우가 제일 어렵다.


일단 최근 많은 통계논문들에서 t-test전 정규성 검정을 반드시 해야할 필요는 없다고 서술하고 있다. 

 

우리 예시와 같은 경우에는 t-test도 무리가 없을 것 같다. 

그 이유는

1. 데이터 분포가 한쪽으로 극단적으로 치우쳐진 것이 아니라는 점

2. 샘플사이즈가 25개 정도 된다는 점이다.

 

 

많은 데이터를 보면서 감을 익히는 것과 꾸준히 통계 최신 논문들을 읽는 것이 좋다.

 

 

반응형

+ Recent posts