반응형

앞선 글에 이어서 대응쌍을 이루는 이항형 반응변수에 대한 주변동질성 검정법을 더 살펴보고자 한다. 

 

N₁₁ N₁₂
N₂₁ N₂₂

 

❗ 대응쌍을 이루는 이항형 반응변수일 때, 주변동질성 검정법의 귀무가설은 다음과 같다.
$$ H_{0}: P(Y_{1}=1)=P(Y_{2}=1) $$
$$ H_{0}: \pi_{12}=\pi_{21} $$
 
만약 귀무가설이 참이라면, n12와 n21가 비슷한 값을 가질 것이다. 

n* = n12 + n21 가 두 칸의 도수합이라고 하면, 이렇게 두 개로 나뉘는 것은 binomial variate이기 때문이다.

 

귀무가설 H0 : π12 = π21 하에서 n* 관측값이 n12와 n21가 될 확률은 1/2이다.

따라서 n12와 n21는 "성공횟수"와 "실패횟수"로, n* 번 시행일 때 성공의 확률이 1/2인 이항분포를 따른다.

 

n*이 10보다 클 때, 이 이항분포는 평균과 표준편차가 다음과 같은 정규분포와 비슷하게 된다.  

$$ mean=\frac{1}{2}n^{*},  sd = \sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})} $$

따라서 표준화된 정규분포의 검정통계량은 다음과 같다.

$$ z=\frac{n_{12}-(\frac{1}{2})n^{*}}{\sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})}} = \frac{n_{12}-n_{21}}{\sqrt{n_{12}+n_{21}}} $$

 

앞선 글에서 사용했던 표를 다시 가져와서 이 검정통계량에 대입해보면 

  Belt-Tightening  
Higher tax Agree Disagree Total
Agree 227 132 359
Disagree 107 678 785
Total 334 810 1144


n12는 132, n21는 107이므로, 검정통계량 z는 다음과 같다.

 
$$ z= \frac{132-107}{\sqrt{132+107}}=1.62 $$
이에 대한 p-value는 0.106으로 유의수준 5% 하에서 귀무가설을 기각하지 못한다.
 
 
이를 R로 진행하면 다음과 같다.
먼저 데이터를 불러오고 위와 같은 표의 형태로 만들어준다.
 
 
위와 같은 형태의 표를 McNemar test의 input으로 넣어주고 continuity correction은 사용하지 않으므로 correct 옵션은 F로 해준다.
 
 
R에서는 z검정통계량 대신, 자유도가 1이고 근사적으로 카이제곱분포를 따르는 z통계량을 제시한다. z2=(1.62)2=2.6151이고, 이에 대한 p-value는 0.106이다.

 

❗ 앞서 사용한 표를 다시 가져와 종속인 두 비율의 차이에 대한 추정에 대해 얘기하고자 한다.

 

  Belt-Tightening  
Higher tax Agree Disagree Total
Agree 227 132 359
Disagree 107 678 785
Total 334 810 1144

 

증세에 "예"라고 대답할 확률은 P(Y1=1), 긴축에 "예"라고 대답할 확률은 P(Y2=1) 이다.

 

이 두 비율의 차이인 P(Y1=1) - P(Y2=1)에 대한 신뢰구간은 유의성검정보다 더 많은 정보를 준다.

 

 

P(Y1=1)=π1112이며, P(Y2=1)=π1121 이므로 이 두 비율의 차이는 π1221 이다.

반응형
반응형

두 표본이 있다. 

한 표본의 개체와 다른 표본의 개체가 짝지어진 경우의 범주형 반응변수를 비교하고 싶을 때,

두 표본의 반응변수들을 대응쌍(matched pairs)이라 한다. 

 

대응쌍의 예시로는

1) longitudinal 연구에서 동일한 대상을 시간의 흐름에 따라 반복적으로 관측하는 경우.

 - ex. 식습관을 바꾸기 전의 체중과 바꾼 후의 체중

2) 같은 범주를 갖는 유사한 반응변수들이 두 개 이상 되는 설문조사의 경우.

 - ex. 환경 개선을 위해 자발적으로 (1) 더 높은 세금을 지불할 의향이 있는지, (2) 생활수준 긴축을 받아들일 의향이 있는지. 

 

  Belt-Tightening  
Higher tax Agree Disagree Total
Agree 227 132 359
Disagree 107 678 785
Total 334 810 1144

 

 

위 표에서 행의 marginal counts (359, 785)는 더 높은 세금을 지불할 의향이 있는가의 도수, 

열의 marginal counts (334, 810)은 생활수준을 긴축할 의향이 있는가의 도수이다.

 

 

❗이 두 가지 질문에 "예"라고 응답할 확률은 어떻게 비교할 수 있는가?

 

(1) 더 높은 세금을 지불할 의향이 있는가? "예"라고 대답한 표본 비율 = 359/1144=0.314

(2) 생활수준 긴축의 의향이 있는가? "예"라고 대답한 표본 비율 = 334/1144=0.292

 
 

 ❓표본 오즈비는?

$$ \frac{227\times678}{132\times107}=10.9 $$

두 질문에 대한 의견에는 강한 상관성이 존재한다.

 

 

질문 1에 "예"라고 응답할 확률은 

$$ P(Y_{1}=1)=\pi_{11}+\pi_{12} $$
 

질문 2에 "예"라고 응답할 확률은 

$$ P(Y_{2}=1)=\pi_{11}+\pi_{21} $$
 

만약 위 두 확률이 같다면 "아니오"라고 응답할 확률도 동일하게 된다.

 

두 확률이 같다면 다음과 같이 표현할 수 있고,

 

$$ P(Y_{1}=1)=P(Y_{2}=1) $$
$$ P(Y_{1}=1)-P(Y_{2}=1)=(\pi_{11}+\pi_{12})-(\pi_{11}+\pi_{21})=\pi_{12}-\pi_{21} $$

따라서

$$ \pi_{12}=\pi_{21} $$

위 식이 성립한다면 주변동질성 Marginal Homogeneity이 존재한다고 할 수 있다.

 

이와 같이 대응쌍을 이루는 이항형 반응변수일 때,

주변동질성 검정법의 귀무가설은 다음과 같다.

 

$$ H_{0}: P(Y_{1}=1)=P(Y_{2}=1) $$
$$ H_{0}: \pi_{12}=\pi_{21} $$
 
 
반응형

+ Recent posts