t-검정 이해하기: 1-표본, 2-표본, 쌍체 t-검정 Understanding t-Tests: 1-sample, 2-sample, and Paired t-Tests

통계학에서 t-검정은 평균을 비교할 수 있는 가설 검정의 일종입니다. t-검정은 표본 데이터를 t-값이라는 단일 숫자로 요약하기 때문에 이와 같은 이름을 얻었습니다. t-검정에서 t-값이 계산되는 방법을 이해하면 t-검정의 원리를 파악할 수 있습니다.

이번 게시물에서는 방정식보다 개념을 중심으로 t-검정의 원리를 설명하겠습니다. 다만 이 글에는 신호 대 잡음비(S/N비) 비유를 사용해 설명하는 두 개의 간단한 방정식이 포함되어 있습니다.

Minitab Statistical Software는 1-표본 t-검정, 쌍체 t-검정 및 2-표본 t-검정을 지원합니다. 각 t-검정이 표본 데이터를 t-값으로 줄이는 방법을 알아보겠습니다.

1-표본 T-검정의 T-값 계산법

t-검정의 원리를 이해하려면 이 프로세스를 이해해야 합니다. 먼저 공식을 보여드린 다음 원리를 설명하겠습니다.

formula to calculate t for a 1-sample t-test

이 공식은 비율입니다. 일반적인 경우 t-값을 신호 대 잡음비에 빗대어 설명하곤 합니다.

신호(효과 크기라고도 함)

분자는 신호입니다. 표본 평균에서 귀무 가설값을 빼면 됩니다. 표본 평균이 10이고 귀무 가설값은 6이라면 차이(신호)는 4입니다.

표본 평균과 귀무 가설값 간 차이가 없다면 분자의 신호 및 전체 비율의 값은 0이 됩니다. 예를 들어, 표본 평균이 6이고 귀무 가설값도 6이라면 차이(신호)는 0입니다.

표본 평균과 귀무 가설 평균 간 차이가 양 또는 음의 방향으로 증가할수록 신호의 강도도 강해집니다.

Photo of a packed stadium to illustrate high background noise

관람객이 가득한 경기장의 사진(배경 잡음이 큰 경우를 나타냄)

잡음

분모는 잡음입니다. 분모의 방정식은 평균의 표준 오차라고도 하는 변동성의 척도입니다. 이 통계는 표본이 모집단의 평균을 얼마나 정확하게 추정하는지 나타냅니다. 수치가 클수록 표본 추정치에 무작위 오류가 많아 정확도가 떨어지는 것입니다.

이러한 무작위 오류가 바로 '잡음'입니다. 잡음이 많으면 귀무 가설이 참이어도 표본 평균과 귀무 가설값 간 차이가 더 커집니다. 신호가 잡음 요인과 구별될 정도로 큰지 확인하기 위해 잡음 요인을 분모에 포함했습니다.

신호 대 잡음비

신호값과 잡음값 모두 데이터 단위에 포함됩니다. 신호가 6이고 잡음이 2이면 t-값은 3입니다. 이 t-값은 차이가 표준 오차 크기의 3배임을 나타냅니다. 단, 차이의 크기가 같지만 데이터의 변동성이 더 큰 경우(6), t-값은 1이 됩니다. 즉, 신호의 크기가 잡음과 같습니다.

이처럼 t-값을 통해 신호가 잡음과 얼마나 잘 구별되는지 확인할 수 있습니다. 신호가 비교적 크고 잡음이 비교적 작으면 t-값이 커집니다. 신호가 잡음과 구별되지 않는 경우에는 모집단 수준에 실제 차이가 있는 것이 아니라 표본의 무작위 오류로 인해 표본 추정치와 귀무 가설값 간 차이가 관찰되었을 가능성이 높습니다.

쌍체 T-검정은 1-표본 T-검정과 같습니다

많은 분들이 쌍체 t-검정을 언제 사용해야 하는지 그리고 이 검정의 원리 때문에 혼란스러워하시는데요. 비밀 하나 알려 드릴까요? 쌍체 t-검정과 1-표본 t-검정은 사실 다르게 보일 뿐 같은 검정입니다. 앞에서 살펴보았듯이, 1-표본 t-검정은 하나의 표본 평균을 귀무 가설값과 비교합니다. 쌍체 t-검정은 쌍을 이루는 관측치를 계산한 다음(예: 전과 후) 이 차이에 대해 1-표본 t-검정을 수행합니다.

이 데이터 세트로 검정을 실시하면 평균 차이, t-값, p-값과 차이의 신뢰 구간 등 모든 결과가 같다는 것을 확인할 수 있습니다.

Minitab worksheet with paired t-test example paired t-test output

1-sample t-test output

쌍체 t-검정이 쌍체 차이에 대해 1-표본 t-검정을 실시한다는 사실을 이해하면 쌍체 t-검정의 원리와 사용해야 할 때를 파악할 수 있습니다. 각 관측치 쌍 간의 차이를 계산하는 것이 의미가 있는지만 확인하면 됩니다.

예를 들어 '전'과 '후'가 시험 점수를 나타내고, '전'과 '후' 사이에 개입이 있었다고 가정해보겠습니다. 예시 워크시트의 각 행에 표시된 '전'의 점수와 '후'의 점수가 같은 과목의 점수라면 이러한 방식으로 점수차를 계산하는 것이 의미가 있으며 쌍체 t-검정이 적합합니다. 그러나 각 행에 표시된 점수가 각각 다른 과목의 점수라면 점수차를 계산하는 것이 의미가 없습니다. 이 경우 아래에서 설명할 2-표본 t-검정과 같이 다른 검정을 사용해야 합니다.

쌍체 t-검정을 사용하면 t-검정을 실시하기 전에 차이를 계산하는 단계를 줄일 수 있습니다. 단, 이 경우 쌍을 이루는 차이가 의미가 있어야 합니다!

쌍체 t-검정을 사용하는 것이 적합한 경우 2-표본 t-검정보다 더욱 강력할 수 있습니다. 자세한 내용은 쌍체 t 개요를 참조하세요.

2-표본 T-검정의 T-값 계산법

2-표본 t-검정은 두 그룹의 표본 데이터를 t-값으로 요약합니다. 이 과정은 1-표본 t 검정과 매우 비슷하여 마찬가지로 신호 대 잡음비 비유를 사용할 수 있습니다. 2-표본 t-검정은 쌍체 t-검정과 달리 각 표본의 독립된 그룹을 필요로 합니다.

아래 공식을 살펴보면서 좀 더 자세히 알아보겠습니다.

formula to cacalculate t for a 2-sample t-test

2-표본 t 검정에서도 분자는 신호이며, 두 표본의 평균 간 차이로 계산됩니다. 예를 들어 그룹 1의 평균이 10이고 그룹 2의 평균은 4라면, 두 평균의 차이는 6입니다.

2-표본 t-검정의 기본 귀무 가설은 두 그룹이 같다는 것입니다. 공식에서 두 그룹이 같은 경우 차이(및 전체 비율) 또한 0이 된다는 사실을 확인할 수 있습니다. 두 그룹의 차이가 양 또는 음의 방향으로 증가할수록 신호의 강도도 강해집니다.

2-표본 t-검정에서도 분모가 잡음이지만, Minitab에서는 서로 다른 두 값을 사용할 수 있습니다. 즉, 두 그룹의 변동성이 같거나 다르다고 가정할 수 있으며 Minitab은 이러한 가정에 해당하는 변동성 추정치를 사용합니다. 어느 쪽을 가정하든, 신호를 잡음과 비교하여 신호가 얼마나 구별되는지 확인하는 원칙은 동일합니다.

1-표본 t 검정과 마찬가지로, 분자의 차이가 분모의 잡음값을 늘리면 t-값은 작아집니다. 그룹이 서로 다른지 확인하려면 큰 t-값이필요합니다.

T-값의 의미는?

각각의 t-검정에서는 절차를 통해 표본 데이터가 t-값으로 요약됩니다. 계산식은 표본 평균을 귀무 가설과 비교하며, 표본 크기와 데이터의 변동성을 모두 포함합니다. t-값이 0이면 표본 결과가 귀무 가설과 정확히 일치하는 것입니다. 통계학에서는 표본 추정치와 귀무 가설 간 차이를 효과 크기라고 합니다. 차이가 커질수록 t-값의 절대값도 커집니다.

그럼 예를 들어 t-값이 2라면 무슨 의미일까요? 앞서 살펴본 내용에 따르면, t-값이 2라면 관찰된 차이가 데이터 변동성 크기의 2배라는 뜻입니다. 하지만 우리는 단순히 신호 대 잡음비를 파악하는 것보다 가설을 평가하는 데 t-검정을 사용합니다. 효과 크기가 통계적으로 유의한지 확인해야 하니까요.

t-검정을 통해 가설을 평가하고 통계적 유의성을 파악하는 방법은 t-검정 이해하기: t-값과 t-분포 게시물을 참조하세요.