화학 공학 엔지니어가 분산분석(ANOVA)를 알아야 하는 이유 Why Chemical Engineers Should Get to Know ANOVA

일반적으로 화학 공학엔지니어는 화학 제조 공정을 개발하고 설계하는 일을 합니다. 이는 다른 엔지니어들과 달리 화학, 물질, 연료, 약품, 식품, 기타 생성물의 제조 또는 사용과 관련된 문제를 해결하기 위해 화학, 생물학, 물리학, 수학의 원리를 적용해야 할 수도 있음을 의미합니다. 과학에만 전념하고 통계에는 별다른 시간을 쏟지 않았더라도 걱정하지 마세요. Minitab이 도와드리겠습니다! 지금부터 분산 분석(ANOVA)이 화학 공학 엔지니어의 비밀 무기가 될 수 있는 이유에 대해 알아보겠습니다.

ANOVA를 알아야 하는 이유

많은 산업 응용 분야에서는 그룹 간의 차이가 있는지 알아내기 위한 실험을 진행합니다. 통계학 용어로 말하면 요인(factor)을 고려합니다. 요인이 촉매 유형인 경우 해당 요인의 수준(예: Catalyst 1, Catalyst 2, Catalyst 3, Catalyst 4)이 통계적으로 서로 유의미하게 다른지 파악해야 합니다. 그룹 전체의 측정이 연속적이고 다른 특정 가정이 충족되면 ANOVA를 사용하여 그룹의 평균을 비교합니다. 어떤 의미에서 '분산 분석'은 잘못된 이름입니다. 우리는 그룹의 평균을 비교하는 데 관심이 있기 때문입니다. 하지만 그룹 수준 내 그리고 그룹 간의 데이터 변동(variation)을 분석하여 그룹 평균이 통계적으로 다른지 여부를 판단할 수 있습니다.

인사이트를 쉽게 공유하고 이해할 수 있는 더 많은 시각화와 그래프에 대해 알아보세요!

ANOVA는 모평균(기호 µ로 표시)이 모두 같다는 귀무 가설을 검정합니다. 모평균은 표본 평균을 사용하여 추정합니다. 이 귀무 가설이 기각되면 모평균이 모두 같지 않다는 결론을 내립니다.

귀무 가설은 다음과 같습니다.

Ho: µ_{Catalyst 1} = µ_{Catalyst 2} = µ_{Catalyst 3}= µ_{Catalyst 4}

screenshot_1_KR

쉽게 설명하자면, 그룹 전체의 평균이 모두 같다고 가정하고 그와 반대되는 증거를 수집합니다. 즉 이러한 평균 간에 큰 차이가 발견되면 그러한 믿음을 거부하고 그룹 수준 내에서 차이가 있다고 가정할 가능성이 더 높습니다.

일원 분산 분석 (A ONE-WAY ANOVA)의 예

화학 공학 엔지니어가 4가지 다른 촉매(Catalyst)를 사용한 제품의 수율(product yield)을 비교한다고 상상해 보세요. 제품을 사용하여 촉매를 가열하여 반응을 관찰합니다. ANOVA를 사용하면 서로 다른 촉매를 사용할 경우 수율에 큰 차이가 있는지 여부를 확인할 수 있습니다.

먼저 화학 공학 엔지니어는 아래에 표시된 것처럼 데이터를 수집합니다.

screenshot_2_KR

그런 다음, 일원 분산 분석을 진행합니다.

제품 수율(Product Yield) 분산분석의 p-값이 작습니다. 이는 귀무 가설이 참인 경우, 즉 촉매 평균이 모두 같다면 이러한 결과를 관찰했을 가능성이 매우 낮음을 나타냅니다. p-값이 5% 유의 수준(α=0.05) 보다 작기 때문에 귀무 가설은 기각됩니다. 따라서 평균 수율이 촉매 그룹에 따라 다르다는 결론을 내렸습니다.

screenshot_3_KR

이제 화학 공학 엔지니어는 일부 그룹 평균이 다르다는 것을 알고 있습니다. 그렇다면 다음 논리적 질문은 무엇일까요?

TUKEY 방식을 사용하여 다중 비교 수행

ANOVA는 일부 그룹 평균이 다르다는 사실을 알려주었지만, 화학 공학 엔지니어가 어떤 그룹 평균이 다른지 파악하려면 더욱 심층적인 비교가 필요합니다. Minitab은 바로 이러한 이유로 '비교'를 제공합니다. 이 예에서 화학 공학 엔지니어는 Tukey 비교를 사용하여 그룹 쌍 간의 차이를 공식적으로 검정하고 통계적으로 유의하게 다른 그룹을 식별합니다.

Tukey의 다중 비교 검정은 평균 집합 중 어떤 평균이 나머지와 다른지 판단하는 데 사용할 수 있는 여러 검정 중 가장 보수적인 검정입니다. Tukey 방식은 ANOVA 이후에 사용됩니다(사후 검정이라고도 부름). 또한 요인 수준 평균 간의 모든 쌍별 차이에 대한 신뢰 구간을 생성하는 동시에 프레임 오류율(FER: Family Error Rate)을 지정한 수준으로 제어할 수 있습니다.

screenshot_4_KR

이 예에서 Tukey 동시 신뢰 구간이 포함된 그래프는 Catalyst 2와 4 간의 평균 차이에 대한 신뢰 구간이 3.114~15.886임을 보여줍니다. 이 범위에는 0이 포함되지 않으며, 이는 이러한 평균 간의 차이가 유의함을 나타냅니다. 화학 공학 엔지니어는 이 차이 추정치를 사용하여 차이가 실제로 유미한지 여부를 확인할 수 있습니다.

반대로, 나머지 평균 쌍에 대한 신뢰 구간은 모두 0을 포함하며, 이는 차이가 유의하지 않음을 나타냅니다.

차이를 식별하기 위해 여러 번의 T-검정을 진행하지 않는 이유는 무엇일까요?

좋은 질문입니다. 자주 듣는 질문이기도 합니다. 이는 실수할 위험, 특히 통계적으로 유의미하다고 잘못된 결론을 내릴 위험(제 1종 오류)과 관련이 있습니다. 하나의 검정을 진행할 때 실제로는 차이가 없는데 차이가 있다고 말할 확률이 5%입니다. 4개의 촉매에 대해 6개의 t-검정이 발생합니다!

우연으로 최소 하나의 유의한 결과를 관찰할 확률은 얼마일까요?

P(적어도 하나의 유의한 결과) = 1 - P(유의한 결과 없음)

= 1 − (1 − 0.05)⁶

≈ 0.264

따라서 6개의 검정을 고려하면 모든 검정이 실제로 유의하지 않더라도, 최소한 하나의 유의한 결과를 관찰 할 확률이 26%입니다. 사후 검정은 실험별 오류율을 제어합니다. 간단히 말해서, 촉매 쌍이 서로 다르다고 잘못 선언할 확률이 5%를 유지하도록 해야 합니다. 이것이 바로 Tukey 검정이 하는 역할입니다!

답은 ANOVA에 있습니다

화학 공학 엔지니어는 ANOVA를 사용하여 혼합물을 테스트하고 결과가 통계적으로 유의한지 확인할 수 있습니다. 또한 비교 검정을 사용하여 전체 그룹이 다른지 아니면 그룹의 하위 세그먼트가 다른지도 판단할 수 있습니다. 이 예에서는 촉매(Catalyst) 2와 촉매(Catalyst) 4만 제품 수율(Product Yield)과 관련하여 통계적으로 유의미한 차이가 있습니다. 이 정보를 기반으로 화학 공학 엔지니어는 다른 촉매들을 살펴보며 어느 촉매가 가장 비용 효율적이고, 수명이 가장 길고, 비슷한 양의 제품을 산출하는지 쉽게 판단할 수 있습니다.