化学エンジニアがANOVAを知っておくべき理由 Why Chemical Engineers Should Get to Know ANOVA

化学エンジニアならば、化学製造工程を開発、設計しているという方も多いことでしょう。その場合、他のエンジニアとは異なり、化学、生物学、物理学、数学の原理を応用して、化学物質、燃料、薬品、食品、その他の多くの製品の製造または使用に関する問題の解決に取り組んでいるのではないでしょうか。科学に専念するあまり、統計にほとんど時間をかけられなかったとしても、心配は無用です。Minitabがあります！分散分析 (ANOVA) が化学エンジニアの秘密兵器になり得る理由について、お話しします。

ANOVAを知っておくべき理由

工業的応用の多くには、グループが異なるかどうかについて理解することを目標とする実験が含まれます。統計的には、ある因子、例えるならば、触媒の種類などを考察し、その因子の水準 (触媒1、触媒2、触媒3、触媒4など) の間で統計的に有意な差があるかを理解しようとします。グループ全体の測定値が連続し、他の特定の仮定が満たされている場合、ANOVAを使用してグループの平均を比較します。グループの平均を比較することに関心があるため、「分散分析」は、ある意味、誤った名称です。ですが、グループ水準内およびグループ間のデータ変動を分析することにより、グループの平均に統計的な差があるかを判断できます。

簡単に洞察を共有し、理解を得られる視覚化とグラフの詳細をご覧ください！

ANOVAは、母平均 (記号µ) がすべて等しいという帰無仮説を検定します。標本平均を用いて、母平均を推定します。この帰無仮説が棄却された場合、母平均のすべてが等しいわけではないという結論になります。

帰無仮説：

Ho: µ触媒1 = µ触媒2 = µ触媒 3 = µ触媒 4

Boxplot of Product Yield (003)

わかりやすい言い方にすると、グループ全体の平均がすべて等しいという仮説を立てて、それに対する証拠すなわち平均間の大きな差を観測した場合にその仮説を棄却し、グループ水準内に差があるという仮説になる可能性が高いという証拠を集めます。

一元配置分散分析の例

化学エンジニアが、4つの異なる触媒を使用した場合の生成物の収率を比較するとします。反応を得るために、触媒を生成物と一緒に加熱します。ANOVAを用いることで、触媒が異なる場合に生成物の収率が大きく違ってくるかを判断できます。

まず、以下のように、データを収集します。

Catalyst data

次に、一元配置分散分析を実行します。

生成物の収率ANOVAのp値は小さいです。帰無仮説が真である場合すなわち触媒平均がすべて等しい場合、この結果が観察される可能性は非常に低いということです。p値が5%の有意水準未満なので (アルファ = 0.05)、帰無仮説を棄却します。触媒グループ間で、平均生成物収率に差があるとの結論にいたります。

Analysis of variance

化学エンジニアは、グループの平均の一部に差があるとわかっています。次なる論理的な疑問とは、「どれか？」です。

TUKEYの多重比較方法の使用

ANOVAで、グループの平均の一部に差があるとわかりましたが、どのグループの平均に差があるのかを理解するには、詳細な比較が必要です。Minitabは、これゆえに、「比較」を提供します。この例では、化学エンジニアがTukey比較を用いて、グループのペア間の差を公式に検定し、統計的に有意な差のあるグループを把握します。

Tukey多重比較検定は、一連の平均の中でどの平均に他の平均との差があるかを判断する検定の中で、最も保守的な検定です。Tukeyの方法はANOVAの後で使用し (それゆえに事後検定と呼ばれます)、系列過誤率を指定水準に調整しながら、因子水準平均の間のすべてのペアワイズ差の信頼区間を作成するために使用可能です。

Tukey Simultaneous 95% CIs

この例のTukeyの同時信頼区間を含むグラフでは、触媒2と4の平均間の差の信頼区間が3.114～15.886です。この区間にはゼロが含まれておらず、この平均の差が大きいことを示しています。この差の推定値から、差が実際に有意かを判断できます。

逆に、平均の残りのペアの信頼区間すべてに、ゼロが含まれており、差が有意でないことを示しています。

一連のT検定を差の判定に実行しない理由は？

これはよくある重要な質問です！答えは、間違うリスク、具体的には、統計的に有意な差があるという誤った結論にいたるリスクがあるからです。これをアルファリスクと呼びます。1つの検定を実行すると、実際には差がないにもかかわらず、差があると言ってしまう確率は5%です。4つの触媒の場合、6つのt検定になります！

少なくとも1つの有意な結果を偶然に観察する確率はどれぐらいでしょうか？

P(少なくとも1つの有意な結果) = 1 − P(有意な結果なし)

= 1 − (1 − 0.05)⁶

≈ 0.264

したがって、6つの検定を考慮に入れると、すべての検定が実際には有意でなくても、26%の確率で少なくとも1つの有意な結果が観察されます。事後検定は、実験ごとの過誤率を調整します。つまり、触媒のペアに差があると誤って言ってしまう確率が5%のままであることを確認します。これが、Tukey検定なのです！

答えはANOVAに

化学エンジニアは、ANOVAを用いることで、混合物を検定して、結果が統計的に有意かを確認できます。同様に重要なこととして、比較検定を用いて、グループ全体に差があるのか、グループのサブセグメントだけに差があるのかを判断することもできます。この例では、触媒2と触媒4のみに、生成物収率に関して、統計的に有意な差があります。化学エンジニアは、この情報に基づいて、他の触媒を調べ、同じ量の生成物になることを知りながら、どの触媒の費用効果が最も高いか、寿命が最も長いか、または取得が最も簡単かを判断することもできます。