만약 여러분이 통계학자가 아니라면, 수많은 통계 결과를 봤을 때 마치 이상한 나라의 앨리스가 된 듯한 기분을 느낄 수도 있습니다. 신비로운 유령들이 불쑥 나타나는 환상의 세계로 갑자기 빨려 들어간 것처럼 말이죠.
예를 들어 t-검정 결과의 T와 P를 생각해보세요.
결과를 보다 보면 앨리스처럼 "갈수록 신기해지는군!"이라는 말이 절로 나올지도 모릅니다.
이러한 값은 대체 무엇이며 어떻게 도출되는 것일까요? P값을 사용하여 결과의 통계적 유의성을 여러 번 파악한 경험이 있더라도 그 유래에 대해서는 잘 알지 못할 수 있습니다.
T와 P는 불가분의 관계로, 트위들 디와 트위들 덤(Tweedledee and Tweedledum)처럼 늘 함께합니다. 왜일까요?
보통 t-검정은 모집단 평균(2-표본 t) 간 유의한 차이 또는 모집단 평균과 귀무 가설에서의 값(1-표본 t) 간 유의한 차이를 찾기 위해 실시합니다. t-값은 표본 데이터 변동에 비례한 차이의 크기를 측정합니다. 다르게 표현하면 T는 계산된 차이를 표준 오차 단위로 나타낸 것으로, T의 크기가 클수록 귀무 가설에 대한 증거가 큽니다 즉, 유의한 차이가 있다는 증거가 더 명확한 것입니다. 반면 T가 0에 가까울수록 유의미한 차이가 없을 가능성이 커집니다.
결과의 t-값은 전체 모집단의 표본 1개에서만 계산된 것이라는 사실에 유의하세요. 같은 모집단에서 데이터 표본을 무작위로 추출하는 일을 반복하면 무작위 표본 추출 오류로 인해 t-값이 매번 조금씩 달라집니다. 단, 무작위 표본 추출 오류는 데이터에서 예상되는 무작위 변동일 뿐 잘못이라고 할 수는 없습니다.
동일 모집단의 여러 무작위 표본의 t-값은 얼마나 다를 수 있을까요? 표본 데이터의 t-값은 예상 t-값과 얼마나 차이가 있을까요?
이에 대한 답은 t-분포를 통해 얻을 수 있습니다.
예를 들어 위의 t-검정 결과와 같이 1-표본 t-검정을 사용하여(표본 = 20회의 관찰) 모집단 평균이 귀무 가설에서의 값보다 큰지(예: 5) 알아보는 경우를 가정해 보겠습니다.
분포 곡선의 정점은 대다수의 t-값이 해당하는 수치를 나타냅니다. 즉, 대부분의 경우 t-값은 0에 가깝습니다. 이는 당연한 일인데, 모집단의 대표 표본을 무작위로 선택하면 이러한 무작위 표본의 대다수는 전체 집단의 모평균에 가까우므로, 그 차이(및 계산된 t-값)가 0에 가까워지기 때문입니다.
T값이(음, 양 모두) 클 가능성은 낮습니다. 분포 곡선의 좌우 '꼬리' 끝부분은 0과 멀리 떨어진 극단적인 t값을 얻는 사례를 나타냅니다. 예를 들어 음영 영역은 2.8 이상의 t-값을 얻을 확률을 나타냅니다. 분포 곡선 아래 어디든지 무작위로 던질 수 있는 마법 다트를 상상해 보세요. 이 다트가 음영 영역에 꽂힐 확률은 얼마나 될까요? 계산된 확률은 0.005712이며, 이를 반올림하면 0.006인데 이는 t-검정 결과의 p-값에 해당합니다!
즉, 동일한 모집단(여기서는 가설 평균이 5인 모집단)에서 표본 추출 시 t-값이 2.8 이상일 확률은 약 0.006입니다.
극도로 미미한 확률이죠! 이에 비하면 카드 5개로 치는 포커에서 숫자가 같은 카드 3장이 나올 확률이 3배 이상 높습니다(≈ 0.021).
동일 모집단에서 표본을 추출했을 때 이 이상의 t-값을 얻을 확률이 이토록 낮다면 이 표본이 같은 집단(가설 평균이 5인 모집단)에서 추출되지 않았으며 평균이 5보다 큰 다른 모집단에서 추출되었을 가능성이 높습니다.
정확히 말하자면, P값이 매우 낮으므로(알파 수준 미만) 귀무 가설을 기각하고 통계적으로 유의 한 차이가 있다는 결론을 내리게 됩니다.
이처럼 T와 P는 불가분의 관계입니다. 귀무 가설 하에서 결과의 '극단성'을 수량화하는 두 가지 방법으로 T와 P를 해석하셔도 좋습니다. T나 P 중 하나를 변경하면 나머지 하나도 반드시 변경됩니다.
t-값의 절대값이 클수록 p-값은 작아지며, 귀무 가설에 대한 증거가 커집니다. 이는 위의 6단계에서 t-분포에 대해 여러 t-값을 입력하면서 확인할 수 있습니다.
위의 t-분포 예시는 모집단의 평균이 귀무 가설에서의 값보다 큰지 확인하기 위한 단측 t-검정에 기반합니다. 따라서 t-분포 예시는 t-값이 2.8일 확률을 한 방향(분포의 오른쪽 꼬리)으로만 나타냅니다.
양측 t-검정(양방향)에서 t-값이 2.8인 경우 p-값을 찾으려면 t-분포를 어떻게 활용해야 할까요?
힌트: Minitab에서 5단계의 옵션을 조정하면 두 꼬리의 확률을 확인할 수 있습니다. Minitab이 없는 경우 30일 동안 무료 평가판을 사용해 보세요.