검정력과 표본 크기 - 보험 상품에 통계 분석 활용 Power and Sample Size – Your Insurance Policy for Statistical Analysis

Gillian Groom | 27 October, 2021

주제: ANOVA, Design of Experiments - DOE, Hypothesis Testing, Minitab Statistical Software

차량이 손상되면 보험금을 지급해주는 보험 상품에 가입하셨나요? 그렇다면 차량이 손상될 것을 알고 보험료를 지불하시나요? 아니겠죠. 아마 여러분은 만약에 차량에 손상이 발생하면 보험금을 지급 받아 수리 비용을 감당하기 위해 보험료를 지불하실 겁니다.

가설 검정과 실험 설계 등 통계 분석을 실시할 때 우리는 모든 데이터에 대한 질문의 답변을 찾기 위해 표본 데이터를 사용합니다. 이러한 답변의 신뢰성은 분석하는 표본의 크기에 따라 달라집니다. 신뢰할 수 없는 통계 분석을 수행할 위험을 최소화하기 위해 데이터를 수집하기 전에 검정력 및 표본 크기를 사용하여 효과가 있는 경우 해당 효과를 찾는 데 필요한 데이터의 양을 결정할 수 있습니다. 이에 대한 최소 권장 값은 80%입니다.

이러한 이유로 저는 검정력 및 표본 크기 계산을 통계 분석의 보험으로 생각합니다. 자동차 보험 가입 및 보험금 청구와 비교하여 이렇게 생각하는 이유를 설명해드리겠습니다. 검정력 분석의 사용과 해석에 대해 자세히 알아보려면 Minitab Essentials 교육 과정과 실험 설계 과정 - 요인 설계에서 가설 검정을 위해 Minitab워크시트를 사용하는 방법을 (공개 교육 일정 확인 및 자세히 알아보기).
 

You need to know which type of analysis you need before starting, just like you choose the type of insurance you want before asking for a quote.

1. 필요한 분석 유형 파악하기

새로운 자동차 보험 상품을 선택할 때는 견적을 요청하기 전에 어떤 유형의 보험 상품을 원하는지 정해야 합니다. 이에 따라 보험의 계산 방식이 결정되니까요. 검정력 분석도 마찬가지여서, 실행할 분석의 유형을 알아야 합니다. 즉, 1-표본 t-검정, ANOVA 또는 요인 설계 중 어떤 것을 실시할지 알아야 하는 것이죠. 필요한 분석 유형을 아는 것은 최적의 계산 방법을 선택하기 위한 첫 단계입니다.

2. 허용 가능한 위험이란? - 유의 수준 설정하기

보험 견적을 받을 때는 초과금 또는 공제금을 얼마만큼 지불할 의향이 있느냐는 질문을 받게 됩니다. 공제금이 클수록 보험료가 낮습니다. 보험료가 낮은 경우 단점은 사고가 발생했을 때 자기부담금이 크다는 것입니다. 이로 인해 추가금액을 지불할 수 없는 경우 심각한 문제가 야기될 수 있습니다.

검정력 및 표본 크기 계산에서는 유의 수준을 설정해야 합니다(Minitab의 기본값은 0.05). 이 숫자를 크게 설정할수록 필요한 표본 크기는 작아집니다. 이렇게 하는 경우 단점은 잘못된 의사결정을 할 가능성이 높아진다는 것입니다. 이 경우 귀무 가설을 기각(제1종 오류)할 확률, 즉 실제로 효과가 존재하지 않는데도 효과가 존재한다는 결론이 도출될 확률이 높아집니다.

검정력 및 표본 크기에서 가치 있는 통찰력을 얻으려면 유의 수준을 선택하기 전에 (단순 금전적 비용뿐 아니라) 비용을 이해해야 합니다.

3. 위험 추정 - 차이와 표준 편차 사용하기

자동차 보험을 신청할 때 보험회사는 여러분의 인구 통계학적 정보, 차량, 운전 경험과 운전 습관 등 다양한 질문을 합니다. 보험회사는 이러한 정보를 활용하여 여러분이 사고를 겪거나 차량을 도난 당할 위험을 추정하고, 이 추정치를 사용해 보험료를 산정합니다.

검정력 분석 계산에서도 위험을 적절히 추정할 수 있도록 미리 정보를 제공해야 합니다. 첫째, 얼마나 큰 효과가 실제적으로 중요한지에 관한 정보를 제공해야 합니다. 예를 들어 초코바를 판매하는 경우, 광고한 중량에서 얼마만큼 차이가 나면 고객이 불만을 제기하거나 생산 비용이 허용할 수 없을 정도로 증가하나요(Minitab 검정력 분석 대화상자에서는'차이'라고 함)? 두 번째 입력 항목은 공정의 표준 편차입니다. 이 항목은 변동성을 추정하는데 사용됩니다.

이러한 정보는 모두 위험을 계산하는 데 사용됩니다.

4. 계획 중에는 결과를 알 수 없음

자동차 보험 상품을 구매할 때 여러분은 보험 청구를 할 위험이 존재한다는 사실을 알고 있으며, 최악의 상황이 발생하는 경우 보장 범위가 충분하기를 원하지만 정말 보험 청구를 하게 될지는 확실히 알 수 없습니다. 데이터 분석 중에도 비슷한 일이 일어납니다. 데이터 분석을 계획할 때는 분석으로 답변을 찾을 수 있는 질문이 있다고 생각하고, 질문에 대한 답변을 찾을 수 있을 정도로 충분한 데이터를 수집하기를 원하지만 분석을 마칠 때까지는 결론이 어떨지 알 수 없습니다.

5. 보험료 규모 - 표본 크기

보험회사에 모든 정보를 제공하면 회사가 여러분의 보장 항목에 대한 보험료를 산출할 것입니다. 보험료가 예산을 초과하면 일부 요인을 조정하여 보험료를 낮출 수 있습니다.

검정력 분석이 표본 크기를 제시했는데 그만큼의 데이터를 수집할 수 없는 경우, 보험료와 마찬가지로 입력 요인 일부를 변경할 수 있습니다. 또한 검정력 분석에서는 이미 사용한(또는 사용할 수 있는) 표본 크기의 상세 정보를 입력하고 검정력을 추정할 수도 있습니다. 검정력이 80% 미만이면 선택한 표본 크기가 공정의 문제나 기회를 식별할 수 있을 만큼 충분히 크지 않다는 것입니다.


검정력 분석의 사용과 해석에 대해 자세히 알아보고 싶으시다면 Minitab 교육을 수강해보세요. Minitab Essentials 과정에는 검정력 분석을 가설 검정에 사용하는 방법을 알아볼 수 있으며, 실험 설계를 실행하는 경우 실험설계 - 요인 설계에 대한 내용에서 배울 수 있습니다.