비모수 검정과 모수 검정 중에서 선택하기 Choosing Between a Nonparametric Test and a Parametric Test

Minitab Blog Editor | 7/10/2020

주제: Hypothesis Testing, 통계, 가설검정

통계를 사용하는 사람들은 대부분 비모수 분석보다는 모수 분석을 많이 접합니다. 비모수 검정은 데이터가 특정한 분포를 따른다고 가정하지 않으므로 무분포 검정이라고도 합니다.

혹시 데이터가 모수 검정의 가정(특히 정규 분포 데이터에 대한 가정)을 충족하지 않을 때 비모수 검정을 사용해야 한다는 말을 들어본 적이 있으신가요? 이는 간단하면서 좋은 방법처럼 보이지만, 추가로 고려해야 할 사항이 몇 가지 있습니다.

여기서는 다음을 언제 사용해야 하는지 파악하는 방법을 알려드리겠습니다.

  • 모수 분석(집단 평균 검정의 목적으로)
  • 비모수 분석(집단 중위수 검정의 목적으로)

특히 비모수 검정을 사용해야 하는 중요한 이유를 중점적으로 살펴보겠습니다. 이는 좀 더 자주 언급되어야 하지만 좀처럼 찾아보기 힘든 주제이기도 합니다.

평균 및 중위값 가설 검정

N비모수 검정은 모수 검정의 평행 우주와도 같은 존재입니다. 다음 표는 Minitab Statistical Software 에서 지원되는 가설 검정의 연관 쌍을 나타냅니다.

모수 검정(평균)

비모수 검정(중위수)

1-표본 t 검정

1-표본 부호, 1-표본 Wilcoxon

2-표본 t 검정

Mann-Whitney 검정

일원 분산 분석

Kruskal-Wallis, Mood의 중위수 검정

요인 실험계획법(요인 1개 및 블럭화 변수 1개)

Friedman 검정

 

모수 검정을 사용하는 이유

이유 1: 모수 검정은 비대칭 분포와 비정규 분포에 적합합니다.

아래 표의 표본 크기에 관한 지침을 충족하는 경우, 모수 검정은 의외로 비정규 연속 데이터에 적합합니다. 이러한 지침은 Minitab의 통계학자들이 실시한 시뮬레이션 연구에 기반합니다. 해당 연구에 대한 자세한 내용은 Minitab의 기술 문서를 참조하세요.

모수 분석

비정규 데이터용 표본 크기 가이드라인

1-표본 t 검정

>20

2-표본 t 검정

각 집단>15

일원 분산 분석

  • 집단이 2~9개인 경우, 각 집단 >15.
  • 집단이 10~12개인 경우, 각 집단 >20.

이유 2: 모수 검정은 각 집단의 산포가 다른 경우 적합합니다.

비모수 검정은 데이터가 정규 분포를 따른다고 가정하지 않으나, 충족하기 어려운 다른 가정을 포함합니다. 집단을 비교하는 비모수 검정은 일반적으로 모든 집단의 데이터 산포가 동일해야 한다고 가정합니다. 집단의 산포가 다르면 비모수 검정을 통해 유효한 결과를 얻지 못할 수 있습니다.

반면 2-표본 t 검정이나 일원 분산 분석을 사용하는 경우, 옵션 하위 대화 상자로 이동하여 등분산 가정을 선택 취소하기만 하면 됩니다. 이제 집단의 산포가 달라도 유효한 검정 결과를 얻을 수 있습니다!

이유 3: 통계적 검정력

보통 모수 검정은 비모수 검정에 비해 통계적 검정력이 크므로, 실존하는 유의미한 효과를 감지할 가능성도 높습니다.

Minitab에 문의하기

비모수 검정을 사용하는 이유

이유 1: 중위수는 연구 영역을 나타내기에 더 적절합니다.

Comparing two skewed distributions이는 비모수 검정을 사용해야 하는 좋은 이유지만, 충분히 알려지지 않고 있습니다. 비정규 데이터로도 모수 검정을 실시할 수는 있지만, 평균은 데이터의 집중경향치를 나타내는 최적의 측정치가 아닙니다.

예를 들어 소득처럼 치우친 분포의 중심은 각각 50%가 이상 이하에 위치하는 중위수를 통해 더 효과적으로 측정할 수 있습니다. 예를 들어 표본에 몇 억만장자를 추가하면 보통사람의 소득이 변화하지 않았는데도 수학적인 평균은 크게 높아집니다.

분포가 일정 수준 이상 치우친 경우 평균은 분포의 꼬리 끝부분 쪽의 변화에 큰 영향을 받는 반면, 중위수는 여전히 분포의 중심을 더 정확하게 반영합니다. 이 두 분포의 경우, 각 분포에서 표본을 100개씩 무작위로 추출하면 평균은 매우 다르게 나타나지만, 중위수는 크게 다르지 않은 것으로 나타납니다.

다음의 두 블로그 게시물에도 이러한 내용이 설명되어 있습니다.

이유 2: 표본 크기가 매우 작습니다.

모수 검정의 표본 크기 지침을 충족하지 못하며 보유한 데이터가 정규 분포 데이터인지 확실하지 않은 경우에는 비모수 검정을 사용하는 것이 좋습니다. 표본 크기가 극도로 작으면 분포 검정의 검증력이 유의한 결과를 도출할 수 있는 수준에 미치지 못해 데이터 분포를 파악하기가 어려울 수도 있습니다.

이러한 경우 마땅한 대안이 없는 어려운 상황에 처하게 됩니다. 비모수 검정은 원래 모수 검정에 비해 검정력이 약한데, 표본 크기까지 작으면 검정력이 더 약화되기 때문입니다.

이유 3: 순서형 데이터, 순위형 데이터 또는 제거할 수 없는 특이치가 있습니다.

전형적인 모수 검정은 연속형 데이터만을 평가할 수 있으며, 특이치로 인해 결과가 크게 변할 수 있습니다. 반면 일부 비모수 검정은 순서형 데이터와 순위형 데이터의 처리가 가능하며 특이치에 큰 영향을 받지 않습니다. 단, 각 비모수 검정에는 고유의 데이터 요건이 있으므로 비모수 검정의 가정을 확인해야 합니다.

리커트 데이터의 두 집단을 비교하려는 경우 제가 작성한 리커트 항목 데이터를 분석하는 최적의 방법: 2 표본 T-검정과 Mann-Whitney 검정의 비교 게시물을 참조하세요.

결론

데이터가 모수 검정의 가정을 충족하지 못하면 모수 검정과 비모수 검정 중에서 선택해야 한다고 생각하는 경우가 많습니다. 표본 크기가 작고 비정규 데이터를 보유한 경우라면 모수 검정과 비모수 검정 사이에서 선택해야 할 수 있습니다. 그러나 많은 경우, 모수 검정의 비정규 데이터 처리도 가능하므로 이러한 선택을 할 때는 다른 사항을 고려해야 합니다. 역으로 비모수 검정에도 무시할 수 없는 엄격한 가정이 존재합니다.

대부분의 경우 이는 데이터 분포의 중심을 더욱 정확하게 나타내는 것이 평균인지 중위수 인지에 따라 결정됩니다.

  • 평균이 분포의 중심을 정확하게 나타내며 표본 크기가 일정 수준 이상이면 검정력이 더 강한 모수 검정을 사용하세요.
  • 반면, 중위수가 분포의 중심을 더 정확하게 나타낸다면 표본 크기가 크더라도 비모수 검정을 사용하는 것이 좋습니다.

마지막으로 표본 크기가 매우 작다면 어쩔 수 없이 비모수 검정을 사용해야 합니다. 가능하다면 다음에는 데이터를 더 많이 수집하세요! 보시다시피 지침에 명시된 표본 크기는 아주 큰 수준이 아닙니다. 표본 크기가 매우 작고 효과가 다소 약한 비모수 검정을 실시한다면 실제로 존재하는 유의한 효과를 발견 할 가능성이 매우 낮아질 수 있다는 사실에 유의하세요.