Ganz allgemein gesprochen: Wenn Sie Chemieingenieur sind, entwickeln und planen Sie vermutlich Prozesse für die Herstellung von chemischen Erzeugnissen. Im Gegensatz zu anderen Ingenieuren müssen Sie dabei Prinzipien der Chemie, Biologie, Physik und Mathematik anwenden, um Probleme im Zusammenhang mit der Produktion oder dem Einsatz von Chemikalien, Treibstoffen, Wirkstoffen, Nahrungsmitteln und vielen anderen Produkten zu lösen. Wenn Sie neben Ihren Kenntnissen in all diesen Fachgebieten nicht auch noch Statistikexperte sind, müssen Sie sich keine Gedanken machen: Minitab ist an Ihrer Seite! Sprechen wir darüber, warum eine Varianzanalyse (ANOVA) eine Geheimwaffe für Chemieingenieure darstellen kann.
In vielen industriellen Anwendungsbereichen werden Versuche durchgeführt, um festzustellen, ob Gruppen unterschiedlich sind. Statistisch ausgedrückt betrachten wir einen Faktor, z. B. einen Katalysatortyp, und möchten nachvollziehen, ob die Stufen dieses Faktors, z. B. Katalysator 1, Katalysator 2, Katalysator 3 und Katalysator 4, statistisch signifikant voneinander abweichen. Wenn die Messwerte in den Gruppen stetig sind und bestimmte weitere Annahmen erfüllt werden, vergleichen wir mit einer ANOVA die Mittelwerte der Gruppen. Die Bezeichnung „Varianzanalyse“ ist gewissermaßen nicht ganz richtig, weil wir eigentlich die Mittelwerte der Gruppen vergleichen möchten. Durch das Analysieren der Streuung bzw. Varianz in den Daten innerhalb der Gruppenstufen und zwischen den Gruppen können wir aber bestimmen, ob die Gruppenmittelwerte statistisch unterschiedlich sind.
Mit einer ANOVA wird die Nullhypothese getestet, dass die Mittelwerte der Grundgesamtheiten (durch µ dargestellt) alle gleich sind. Wir schätzen die Mittelwerte der Grundgesamtheiten mit Hilfe der Mittelwerte der Stichproben. Wenn diese Nullhypothese zurückgewiesen wird, schließen wir daraus, dass die Mittelwerte der Grundgesamtheiten nicht alle gleich sind.
Die Nullhypothese:
Ho: µKatalysator 1 = µKatalysator 2 = µKatalysator 3 = µKatalysator 4
Einfach ausgedrückt, nehmen wir an, dass die Mittelwerte in allen Gruppen gleich sind, und sammeln dann Belege, um dies zu widerlegen. Wenn also große Differenzen zwischen den Mittelwerten beobachtet werden, werden wir die Annahme eher zurückweisen und davon ausgehen, dass Differenzen innerhalb der Gruppenstufen bestehen.
Stellen Sie sich eine Chemieingenieurin vor, die die Produktausbeute bei der Verwendung von vier verschiedenen Katalysatoren vergleichen möchte. Sie erhitzt den Katalysator mit dem Produkt, um eine Reaktion herbeizuführen. Mit einer ANOVA kann sie dann bestimmen, ob die Produktausbeute mit verschiedenen Katalysatoren signifikant variiert.
Zunächst erfasst sie Daten, wie unten dargestellt.
Dann führt sie eine einfache ANOVA durch.
Der p-Wert für die ANOVA zur Produktausbeute ist klein. Dies deutet darauf hin, dass es nur eine geringe Wahrscheinlichkeit gibt, diese Ergebnisse zu beobachten, wenn die Nullhypothese wahr wäre, also die Mittelwerte für die Katalysatoren alle gleich sind. Da der p-Wert unter einem Signifikanzniveau von 5 % liegt (wir verwenden Alpha = 0,05), weisen wir die Nullhypothese zurück. Wir schließen daraus, dass die mittlere Produktausbeute bei den verschiedenen Katalysatorgruppen unterschiedlich ist.
Die Ingenieurin weiß so, dass einige der Gruppenmittelwerte voneinander abweichen. Die nächste Frage ist logischerweise, welche Mittelwerte dies sind.
Auch wenn die ANOVA gezeigt hat, dass einige der Gruppenmittelwerte von den anderen abweichen, benötigt die Ingenieurin einen weitergehenden Vergleich, um erkennen zu können, welche Gruppenmittelwerte sich unterscheiden. Aus diesem Grund gibt es in Minitab Vergleichsfunktionen. In unserem Beispiel verwendet die Ingenieurin die Vergleiche nach Tukey, um die Daten formal auf das Vorliegen von Differenzen zwischen den Gruppenpaaren zu testen und zu ermitteln, welche statistisch signifikant voneinander abweichen.
Der Tukey-Mehrfachvergleichstest ist der konservativste einer Reihe von unterschiedlichen Tests, mit denen ermittelt werden kann, welche Mittelwerte in einer Menge von den anderen abweichen. Der Tukey-Test wird nach einer ANOVA eingesetzt (daher wird er auch als Post-hoc-Test bezeichnet). Er kann verwendet werden, um Konfidenzintervalle für alle paarweisen Differenzen zwischen Mittelwerten von Faktorstufen zu erstellen, während die simultane Irrtumswahrscheinlichkeit auf einer angegebenen Stufe gehalten wird.
In unserem Beispiel zeigt die Grafik mit den simultanen Konfidenzintervallen nach Tukey, dass das Konfidenzintervall für die Differenz zwischen den Mittelwerten von Katalysator 2 und 4 zwischen 3,114 und 15,886 liegt. Dieser Bereich enthält nicht den Wert null. Dies deutet darauf hin, dass die Differenz zwischen diesen Mittelwerten signifikant ist. Die Ingenieurin kann mit dieser Schätzung der Differenz bestimmen, ob die Differenz praktisch signifikant ist.
Umgekehrt enthalten die Konfidenzintervalle aller weiteren Mittelwertpaare den Wert null. Dies weist darauf hin, dass die Differenzen nicht signifikant sind.
Dies ist eine gute Frage, die häufig gestellt wird. Die Antwort hängt mit dem Fehlerrisiko zusammen, genauer mit dem Risiko, fälschlicherweise zu schließen, dass eine statistisch signifikante Differenz vorhanden ist. Dies wird als Alpha-Risiko bezeichnet. Wenn wir einen Test durchführen, besteht eine Wahrscheinlichkeit von 5 %, dass wir das Vorliegen einer Differenz feststellen, die in der Realität nicht vorhanden ist. Bei den vier Katalysatoren müssten sechs t-Tests durchgeführt werden
Wie hoch ist die Wahrscheinlichkeit, dass rein zufällig mindestens ein signifikantes Ergebnis beobachtet wird?
P(mindestens ein signifikantes Ergebnis) = 1 − P(keine signifikanten Ergebnisse)
= 1 − (1 − 0,05)6
≈ 0,264
Wenn also sechs Tests betrachtet werden, besteht eine Wahrscheinlichkeit von 26 %, dass mindestens ein signifikantes Ergebnis beobachtet wird, selbst wenn alle Tests eigentlich nicht signifikant sind. Mit Post-hoc-Tests wird die Irrtumswahrscheinlichkeit des gesamten Experiments kontrolliert. Einfacher ausgedrückt, möchten wir sicherstellen, dass die Wahrscheinlichkeit, bei einem beliebigen Paar von Katalysatoren fälschlicherweise das Vorliegen einer Differenz festzustellen, bei 5 % bleibt. Genau das ist die Funktion des Tukey-Tests.
Mit einer ANOVA kann die Chemieingenieurin in unserem Beispiel verschiedene Mischungen testen und sehen, ob die Ergebnisse statistisch signifikant voneinander abweichen. Genauso wichtig: Sie kann mit Vergleichstests außerdem bestimmen, ob die gesamte Gruppe oder nur eine Teilgruppe abweicht. In unserem Beispiel weichen nur Katalysator 2 und 4 in Bezug auf die Produktausbeute statistisch signifikant ab. Auf der Grundlage dieser Informationen und mit dem Wissen, dass die Produktausbeute ähnlich sein wird, kann die Chemieingenieurin jetzt die anderen Katalysatoren betrachten und bestimmen, welcher am kostengünstigsten ist, die längste Haltbarkeit hat oder am einfachsten zu beschaffen ist.