대학에 다닐 때 어딜 가든 잘 어울리는 친구 하나가 있었습니다. 그 친구는 교수님들과 점심을 먹은 후, 공원에 있는 히피(hippie)들과 어울리고, 저녁에는 동네 폭주족들과 어울렸습니다. 다음 날에는 운동을 하는 친구들과 풋볼을 즐기고, 이후에는 게이머 친구들과 밤새도록 랜 파티를 했습니다. 주말에는 보통 펑크록커들과 함께 캠퍼스에서 공연을 보았고, 그렇지 않을 때는 몇몇 이웃과 함께 맥주 파티를 했으며, 물리학 동아리의 친구들과 함께 D&D 게임을 하며 주말을 마무리했습니다.
그 친구는 카멜레온과도 같았고 함께 어울리는 사람들의 특성에 맞추는 모습을 보였습니다. 그러한 유연성 덕분에 그는 놀라울 정도로 다양한 사교 모임에서 환영받는 존재가 되었습니다.
그 친구의 이름은 Jeff Weibull로, 인기가 너무나도 많은 나머지 지역의 통계학자들은 그의 이름을 따서 'Weibull(와이블) 분포'라고 이름을 지었습니다.
사실 마지막 부분은 제가 지어낸 이야기입니다. Jeff의 성은 실제로는 'Weibull'이 아니었으며 Weibull 분포는 완전히 다른 사람의 이름을 따서 만들어졌습니다. 하지만 처음으로 Weibull 분포에 대해 배웠을 때 저는 곧바로 Jeff와 다양한 사회 환경에 완벽하게 어울릴 수 있는 그 친구의 능력이 떠올랐습니다.
Jeff가 다양한 사교 모임에서 카멜레온과 같았던 것처럼 Weibull 분포도 다른 유형의 분포의 특성을 가정할 수 있습니다. 이 때문에 Weibull 분포는 엔지니어와 품질 관련 실무자들 사이에서 매우 큰 인기를 얻었고, 이로 인해 신뢰성 데이터를 모델링하는 데 가장 많이 사용되는 분포가 되었습니다. 이들이 Weibull 분포를 데이터 분석에 활용하는 이유는 다양한 데이터 집합을 모델링하기에 충분히 유연하기 때문입니다.
오른쪽으로 치우친 데이터가 있습니까? Weibull 분포로 모델링할 수 있습니다. 왼쪽으로 치우친 데이터는 어떨까요? 이 역시 Weibull 분포로 모델링할 수 있습니다. 대칭 데이터는 어떨까요? 역시 가능합니다. 바로 이러한 유연성 때문에 엔지니어들은 Weibull 분포를 사용하여 진공관과 축전기(커패시터)부터 볼 베어링과 릴레이에 이르기까지 모든 제품의 신뢰성과 재료 강도를 평가합니다.
Weibull 분포는 감소하거나 증가하거나 지속되는 위험 함수도 모델링할 수 있으므로 제품 수명의 모든 단계를 설명할 수 있습니다.
그렇다면 Weibull 분포는 얼마나 유연할까요? Minitab Statistical Software에서 그래프 > 확률 분포도를 사용하여 몇 가지 예시를 살펴보겠습니다. (이 과정을 따라해보고 싶은데 아직 Minitab을 다운로드하지 않으셨다면 30일 무료 평가판을 다운로드해 보세요.)
'단일 보기'를 선택하고 분포 드롭다운 메뉴에서 'Weibull 분포'를 선택하세요. 대화 상자에서 형상, 척도, 분계점 등 세 가지 모수를 지정하도록 안내합니다.
분계점은 분포가 0에서 치우친 방향을 나타내며, 음의 분계점인 경우 분포가 0에서 왼쪽으로 치우치고 양의 분계점인 경우 오른쪽으로 치우칩니다. 모든 데이터는 분계점보다 커야 합니다. 척도 모수는 데이터의 63.2 백분위수를 의미하며, 평균이 정규 곡선의 위치를 결정하는 것처럼 Weibull 곡선과 임계값의 관계를 결정합니다. 우리 예시에서는 10을 사용할 것이며, 이는 테스트된 제품의 63.2%가 임계값 시간 이후 처음 10시간 이내에 고장난다는 것을 의미합니다. 형상 모수는 Weibull 곡선의 형상을 설명합니다. 형상을 바꾸면 여러 수명 분포의 특성을 모델링할 수 있습니다.
이 글에서는 형상 모수가 Weibull 곡선에 미치는 영향을 특히 중점적으로 살펴보겠습니다. 저는 하나씩 살펴보겠지만 단일 분포도에서 모든 모수를 함께 보고 싶다면 위에 표시된 대화 상자에서 '모수 변경’ 옵션을 선택하세요.
형상이 0과 1 사이인 분포부터 살펴보겠습니다. 아래 그래프는 확률이 무한대에서부터 급감하는 것을 보여줍니다. 고장률 측면에서 이 분포에 맞는 데이터는 초기 고장의 횟수가 높으며 결함이 있는 제품(불량품)이 표본에서 제거됨에 따라 시간이 지나면서 감소합니다. 이러한 초기 고장은 제품 수명의 초기 단계에 발생하기 때문에 종종 'Infant Mortality'라고 부릅니다.
형상이 1인 Weibull 분포는 1/알파(알파=척도 모수)에서부터 급감합니다. 근본적으로 이는 시간이 지나면서 고장률이 일정하게 유지된다는 것을 의미합니다. 이러한 형상의 Weibull 분포는 무작위 고장 및 복합 원인 고장에 해당하며 제품의 유통기한을 모델링하는 데 사용할 수 있습니다.
형상 값이 1과 2 사이일 때 Weibull 분포는 빠르게 최대치까지 증가했다가 시간이 지나면서 감소합니다. 고장률은 전반적으로 증가하며, 초기에 가장 급격하게 증가합니다. 이 형상은 초기의 마모 고장을 나타냅니다.
형상 값이 2가 되면 Weibull 분포는 선형적으로 증가하는 고장률을 모델링합니다. 이 경우 제품 수명에 걸쳐 마모 고장의 위험이 꾸준히 증가합니다. 이러한 형태의 Weibull 분포는 Rayleigh(레일리) 분포로도 알려져 있습니다.
형상 값을 3과 4 사이에 두면 Weibull 분포는 정규 곡선과 같이 종 모양의 대칭형으로 나타납니다. 이러한 형태의 Weibull 분포는 대부분의 고장이 발생했을 때 제품 수명의 마지막 기간 동안 발생하는 급격한 마모 고장을 모델링합니다.
형상 값이 10 이상일 때 Weibull 분포는 극단값 분포와 유사합니다. 역시 이 형태의 분포도 제품 수명의 최종 기간을 모델링할 수 있습니다.
신뢰성과 관련하여 Weibull은 주로 가장 먼저 찾는 분포입니다. 하지만 중요한 것은 다른 분포로도 다양한 분포 형상을 모델링할 수 있다는 것입니다. 여러분의 데이터에 가장 적합한 분포는 Weibull 분포의 형태가 아닐 수도 있습니다. 예를 들어 화학 반응이나 부식으로 인한 제품 고장은 주로 로그 정규 분포를 사용해 모델링합니다.
Minitab의 분포 ID그림을 사용하면 데이터의 적합성을 평가할 수 있습니다 (통계분석 > 신뢰성/생존 분석 > 분포 분석(우측 관측 중단 또는 임의 관측 중단)). 더 자세한 내용은 Jim Frost가 작성한 데이터 분포 파악하기에 관한 이 글을 확인해 보세요.
출시 기간과 제품 신뢰성이 경쟁력을 제공하는 급변하는 산업에서 세계 최고의 조명 회사 Signify(필립스 조명)가 어떻게 새로운 혁신을 신속하게 검증하는지 확인해 보십시오. 1시간 동안 진행되는 웹 세미나에서는 W.D. van Driel 교수와 P. Watté 박사가 Signify에서 Minitab Statistical Software를 사용하여 신뢰성을 위한 설계(DfR, Design for Reliability)에 대해 설명합니다. 실제 사례를 통해 개발 비용을 절감하고 설계의 성능과 컴플라이언스를 개선하며 제품 설계 안정성 테스트를 가속화하는 방법을 알아보세요. 향후 몇 년 동안 높은 사양을 충족할 수 있는 제품을 개발한다면 제품 고장 및 비용이 많이 드는 클레임의 위험과 결과를 줄일 수 있는 방법을 알 수 있을 것입니다. (웨비나는 영어로 진행됩니다.)