t-검정은 간편하게 평균을 비교할 수 있는 통계 가설 검정입니다. 1-표본 t-검정을 사용하면 표본 평균을 가설값이나 목표값과 비교할 수 있으며, 2-표본 t-검정을 사용하면 두 집단의 평균을 비교할 수 있습니다. 또한 쌍체 t-검정을 사용하면 관찰 결과가 연결된 2개 집단(예: 전과 후)을 비교할 수 있습니다.
t-검정의 원리는 무엇이며 t-값은 어떻게 활용할 수 있을까요? 이번 시리즈에서는 공식과 수치보다는 개념과 그래프를 중심으로 이러한 질문에 대한 답변을 알아보겠습니다. Minitab과 같은 통계 소프트웨어를 사용하는 주된 이유는 복잡한 계산에 시달리는 일 없이 결과 해석에 집중하기 위함이니까요.
이 글에서는 t-값과 t-분포를 소개하고, t-검정에서 이 두 가지를 이용하여 확률을 계산하고 가설을 검정하는 방법을 설명합니다.
t-값이란?
t-검정의 이름은 검정 결과가 t-값에 기반하는 데서 유래합니다. t-값은 통계학자들이 말하는 검정 통계량에 해당하며, 검정 통계량은 가설 검정 과정에서 표본 데이터를 이용하여 계산되는 표준화 된 값을 의미합니다. 검정 통계량을 계산하는 절차에서는 데이터를 귀무 가설의 기대치와 비교합니다.
각각의 t-검정에서는 특정 절차를 통해 표본 데이터가 하나의 t-값으로 함축됩니다. t-값 계산식은 표본 평균을 귀무 가설과 비교하며, 표본 크기와 데이터의 변동성을 모두 포함합니다. t-값이 0이면 표본 결과가 귀무 가설과 정확히 일치하는 것입니다. 표본 데이터와 귀무 가설의 차이가 증가할수록 t-값의 절대값도 증가합니다.
t-검정 결과, 표본 데이터의 t-값이 2로 도출되었다고 가정해보겠습니다. 이 같은 결과는 대체 무슨 의미일까요? 귀무 가설이 참이라면 이게 흔하다는 뜻일까요, 아니면 희귀하다는 뜻일까요?
't-값 = 2'는 그 자체로는 아무 의미도 없습니다. t-값은 원본 데이터의 단위나 우리에게 익숙한 단위에 해당하지 않습니다. 따라서 개별 t-값을 해석하려면 먼저 이러한 값의 맥락을 이해해야 합니다. t-분포는 바로 이 지점에서 빛을 발합니다.
t-분포란 무엇일까요?
단일 연구용으로 t-검정을 실시하면 단일 t-값이 도출됩니다. 단, 같은 모집단에서 같은 크기의 무작위 표본을 여러 개 추출하여 동일한 t-검정을 실시하면 그 결과로 도출된 여러 t-값의 분포를 그릴 수 있습니다. 이러한 분포 유형을 표본 분포라고 합니다.
다행히 통계에서 t-분포의 속성을 파악하기가 용이하므로 표본을 많이 수집하지 않아도 표본 분포를 그릴 수 있습니다. t-분포는 표본 크기와 밀접한 연관성을 지니는 자유도(DF)에 의해 정해지므로 표본 크기마다 t-분포가 다릅니다. Minitab의 확률 분포도를 사용하면 t-분포를 그래프로 나타낼 수 있습니다.
t-분포는 귀무 가설이 참인 모집단에서 반복해서 무작위로 표본을 추출한다고 가정합니다. 결과가 귀무 가설과 얼마나 일치하는지 확인하려면 연구의 t-값을 t-분포에 대입하면 됩니다.
위 그래프는 자유도가 20인 t-분포로, 표본 크기가 21인 1-표본 t-검정의 t-분포입니다. 이 t-분포는 종 모양의 대칭 분포이며 정규 분포와 모양이 비슷하지만 꼬리 부분이 더 두텁습니다. 그래프에 나타난 확률 밀도 함수(PDF)는 각 t-값의 우도를 설명합니다.
그래프의 정점이 0에서 나타나므로 귀무 가설과 가까운 표본값이 도출될 가능성이 가장 높습니다. 이는 t-분포가 귀무 가설이 참이라고 가정하므로 의미가 있습니다. 양쪽 방향으로 0에서 멀어질수록 t-값의 우도도 낮아집니다. 즉, 귀무 가설이 참이면 귀무 가설과 크게 다른 표본이 도출될 가능성이 낮습니다.
t-값이 2라면 표본 데이터와 귀무 가설 간 긍정적인 차이가 있는 것입니다. 그래프에 나타난 바에 따르면, 귀무 가설이 참인 경우 -2에서 +2까지의 t-값이 도출될 합리적 확률이 존재합니다. 즉 우리의 t-값(2)은 희귀한 값이지만 얼마나 희귀한지는 알 수 없습니다. 우리의 궁극적인 목적은 도출된 t-값이 귀무 가설의 확실한 기각이 가능할 정도로 희귀한지 파악하는 것이므로, 이를 위해서는 확률을 계산해야 합니다.
t-값과 t-분포를 사용하여 확률 계산하기
모든 가설 검정의 기반은 특정 표본의 검정 통계량을 알려진 확률 분포에 대입하는 것입니다. t-검정의 경우, t-값을 올바른 t-분포에 대입하면 해당 t-값에 관한 확률을 계산할 수 있습니다.
또한 확률을 통해 귀무 가설이 참이라는 가정하에서 F-값이 얼마나 흔한지 또는 얼마나 희귀한지 확인할 수 있습니다. 확률이 일정 수준 이하라면 표본에서 관찰된 효과가 귀무 가설에 부합하지 않는다는 결론을 내릴 수 있습니다. 표본 데이터의 증거는 전체 집단에 대해 귀무 가설을 기각할 수 있을 정도로 강력합니다.
아까의 t-값에 관한 확률을 계산하기 전에 먼저 2가지 사항을 고려해야 합니다.
첫째, 양측검정을 진행할 것이므로 t-값은 +2와 -2를 사용합니다. 양측검정을 사용하면 양쪽 방향의 차이를 검정할 수 있습니다. 예를 들어 양측 2-표본 t-검정을 이용하면 집단 1과 2의 차이가 양 또는 음의 방향으로 통계적 유의성을 지니는지 파악할 수 있습니다. 단측검정은 양과 음 중 한쪽 방향만 평가할 수 있습니다.
둘째, t-값의 범위에 대해 0이 아닌 확률만 계산할 수 있습니다. 아래 그래프를 보면 t-값의 범위는 분포 곡선 아래 영역 전체의 일정 비율에 상응하며, 이것이 바로 확률입니다. 특정 지정값은 곡선 아래 영역을 생성하지 않습니다. 따라서 모든 특정 지정값의 확률은 0입니다.
이러한 사실을 기억하며 t-값이 2를 초과하거나 -2 미만인 곡선 부분 아래의 영역을 칠해보겠습니다.
위 그래프는 귀무 가설이 참이라는 가정하에 귀무 가설에서 최소한 우리 표본 데이터의 차이만큼 극단적인 차이가 관찰될 확률을 나타냅니다. 색칠한 영역은 확률이 각각 0.02963으로, 확률의 합계는 0.05926입니다. 귀무 가설이 참이면 t-값은 거의 6%의 확률로 이러한 영역에 포함됩니다.
이 확률의 이름이 바로 p-값입니다. 아마 여러분도 들어보셨을 겁니다. 우리의 t-값이 이 영역에 포함될 가능성은 상당히 낮지만, 일반적인 유의 수준인 0.05보다는 높으므로 귀무 가설 전체를 기각할 정도로 낮지는 않습니다.
p-값을 올바르게 해석하는 방법을 알아보세요.
t-분포와 표본 크기
위에서 언급했듯이, t-분포는 표본 크기와 밀접하게 연관된 DF에 의해 정해집니다. DF가 증가할수록 꼬리 부분의 확률 밀도가 감소하고 중앙값 주변으로 분포가 밀집됩니다. 아래 그래프는 각각 자유도가 5와 30인 t-분포를 나타냅니다.
자유도가 더 낮은 t-분포는 꼬리가 더 두꺼운데, 이는 t-분포가 작은 표본을 분석하는 경우 불확실성이 증가한다는 사실을 반영하도록 설계되었기 때문입니다. 즉, 표본 크기가 작은 경우, 귀무 가설이 참이라고 해도 표본 통계가 귀무 가설과 멀어질 확률이 높아집니다.
크기가 작은 표본은 희귀할 가능성도 더 높으며, 이는 t-값에 관한 확률에도 영향을 미칩니다. 자유도가 각각 5와 30인 경우 양측검정에서 t-값이 2라면 p-값이 각각 10.2%와 5.4%로 나타납니다. 즉, 크기가 큰 표본이 더 좋은 것이죠.
지금까지 t-값과 t-분포를 함께 활용하여 확률을 도출하는 방법을 설명했습니다. 각 유형의 t-검정 원리 및 t-값 계산 방법을 알아보려면 이 시리즈의 글 중 t-검정 이해하기: 1-표본, 2-표본, 쌍체 t-검정을 읽어보세요.
분산 분석 F-검정에 대해 알아보려면 제 글 중 분산 분석(ANOVA)과 F-검정 이해하기를 읽어보세요.