Äquivalenztests für die Qualitätsanalyse (Teil I): Was möchten Sie beweisen?

Minitab Blog Editor | 25 April, 2021

Themen: Minitab Statistical Software, Pharmaindustrie, Äquivalenztests

Mehr Optionen bedeuten mehr Entscheidungen.

Mit Äquivalenztests stehen Ihnen jetzt mehr statistische Werkzeuge zur Verfügung, mit denen der Mittelwert einer Stichprobe im Vergleich zu einem Sollwert oder Mittelwert einer anderen Stichprobe getestet werden kann.

Äquivalenztests sind in der Biomedizin weit verbreitet. Hersteller von pharmazeutischen Produkten müssen oft prüfen, ob die Bioaktivität eines generischen Wirkstoffs der eines bereits behördlich zugelassenen Markenwirkstoffs entspricht.

Doch in welchen Situationen könnte ein Äquivalenztest bei der Qualitätsverbesserung anstelle eines regulären t-Tests eingesetzt werden?

HYPOTHESENTESTS INTERPRETIEREN: EINE GÄNGIGE FALLE

Angenommen, ein Hersteller findet einen neuen Zulieferer, der ein günstigeres Material anbietet. Hierdurch könnte ein teureres Material ersetzt werden, das momentan im Produktionsprozess genutzt wird. Das neue Material soll genauso gut wie das zurzeit verwendete Material sein. Es sollte das Endprodukt weder zu biegsam noch zu steif machen

Um sicherzustellen, dass der Austausch die Qualität nicht beeinträchtigt, werden zwei Zufallsstichproben aus dem (stabilen) Produktionsprozess gezogen: eine mit dem neuen Material und eine mit dem zurzeit verwendeten Material.

Danach wird mit einem regulären t-Test bei zwei Stichproben („Statistik“ > „Statistische Standardverfahren“ > „t-Test, 2 Stichproben“ in der Minitab Statistical Software ausgewertet, ob die mittlere Biegsamkeit des Produkts bei beiden Materialien gleich ist

________________________________________

t-Test und KI bei zwei Stichproben: aktuell, neu

t-Test und KI bei zwei Stichproben: aktuell gegen neu
             N    Mittelwert   StdAbw    SE des Mittelwerts
aktuell   9   34,092   0,261     0,087
neu      10   33,971  0,581     0,18

Differenz = μ (aktuell) - μ (neu)
Schätzwert für Differenz:  0,121
95%-KI für Differenz:  (-0,322; 0,564)
T Test der Differenz = 0 (vs ≠): t-Wert = 0,60  p-Wert = 0,562  DF = 12
________________________________________

Da der p-Wert nicht kleiner als das Alpha-Niveau (0,05) ist, kommt der Analytiker zu dem Schluss, dass die beiden Mittelwerte nicht unterschiedlich sind. Auf der Grundlage dieser Ergebnisse wechselt das Unternehmen den Zulieferer. Dabei vertraut man auf die statistische Analyse, die belegt hat, dass durch das neue Material Kosten gespart werden können, ohne die Qualität des Produkts zu verringern.

Die Testergebnisse sind ein Erfolg auf ganzer Linie. Alle freuen sich. Alle fallen sich in die Arme. Sektkorken knallen. Es gibt nur ein kleines Problem.

Die statistische Analyse hat nicht wirklich belegt, dass die Mittelwerte gleich waren.

WO SOLL DIE BEWEISLAST LIEGEN?

Bei einem Hypothesentest ist H1 die Alternativhypothese, die bewiesen werden muss. Normalerweise bildet die Alternativhypothese das ab, was belegt oder nachgewiesen werden soll. Mit einem regulären t-Test bei zwei Stichproben stellen Sie eigentlich folgende Frage: „Habe ich genug Nachweise, um jenseits eines Restzweifels (Ihr Alpha-Niveau) zu belegen, dass die Mittelwerte der Grundgesamtheiten unterschiedlich sind?“

Hierfür werden die Hypothesen wie folgt formuliert:

Wenn der p-Wert kleiner als das Alpha-Niveau ist, schließen Sie, dass die Mittelwerte signifikant voneinander abweichen. Wenn der p-Wert nicht kleiner als das Alpha-Niveau ist, haben Sie damit allerdings nicht belegt, dass die Mittelwerte gleich sind. Es gibt nur nicht genug Nachweise dafür, dass sie nicht gleich sind.

Fehlende Nachweise für eine Aussage sind kein Beweis für das Gegenteil. Wenn Sie nicht genug Nachweise dafür haben, dass A wahr ist, belegt dies nicht, dass A falsch ist.

Äquivalenztests wurden speziell im Hinblick auf dieses Problem entwickelt. In einem Äquivalenztest bei zwei Stichproben sind die Null- und die Alternativhypothese im Vergleich zu einem regulären t-Test bei zwei Stichproben umgekehrt.

So wird die Beweislast umgekehrt. Außerdem wird umgekehrt, welche Konsequenzen es hat, wenn fälschlicherweise H0 für den Test geschlossen wird.

BEISPIEL: UNSCHULDSVERMUTUNG IM VERGLEICH ZUR SCHULDVERMUTUNG

Die folgende Analogie kann dieses Konzept veranschaulichen.

Vor Gericht liegt die Beweislast so, dass die Schuld nachgewiesen werden muss. Der Verdächtige gilt als unschuldig (H0), bis das Gegenteil bewiesen wurde (H1). In den Medien ist die Beweislast häufig umgekehrt: Der Verdächtige gilt als schuldig (H0), bis er seine Unschuld beweisen kann (H1).

Diese Verschiebung der Beweislast kann zu unterschiedlichen Schlüssen führen. Daher herrscht in den Medien häufig große Aufregung, wenn ein als schuldig geltender Verdächtiger freigesprochen wird, weil vor Gericht nicht genügend Beweise für seine Schuld vorgebracht werden konnten. Solange die Medien und die Gerichte mit gegensätzlichen Null- und Alternativhypothesen arbeiten, gelangen sie in manchen Fällen auf der Grundlage derselben Beweise zu unterschiedlichen Ergebnissen.

Doch warum gehen sie nicht von Anfang an von anderen Hypothesen aus? Weil beide Seiten anscheinend unterschiedliche Vorstellungen davon haben, was der schlimmere Fehler wäre. Juristisch gesehen besteht der größere Fehler darin, eine unschuldige Person zu verurteilen, als einen Schuldigen freizusprechen. Für die Medien scheint die Lage umgekehrt zu sein. (Vielleicht weil eine Schuldvermutung eine höhere Auflage verspricht als eine Unschuldsvermutung?)

BEI EINER VERSCHIEBUNG DER BEWEISLAST KANN SICH DIE SCHLUSSFOLGERUNG ÄNDERN

Gehen wir zurück zu der Qualitätsanalyse im ersten Beispiel. Um keine Kunden zu verlieren, möchte das Unternehmen lieber fälschlicherweise annehmen, dass die Qualität mit dem preisgünstigeren Material nicht gleich ist (auch wenn sie eigentlich gleich ist), als fälschlicherweise davon auszugehen, dass sie gleich ist (wenn dies tatsächlich nicht der Fall ist).

Um besser zeigen zu können, dass die Mittelwerte gleich sind, wird ein Äquivalenztests bei zwei Stichproben durchgeführt („Statistik“ > „Äquivalenztests“ > „2 Stichproben“).

________________________________________

Äquivalenztest, 2 Stichproben: Mittelwert(neu) - Mittelwert(aktuell)

Test
Nullhypothese:         Differenz ≤ -0,4 oder Differenz ≥ 0,4
Alternativhypothese:  -0,4 < Differenz < 0,4
α-Niveau:                 0,05

Nullhypothese    DF  t-Wert  p-Wert
Differenz ≤ -0,4  12   1,3717    0,098
Differenz ≥ 0,4   12  -2,5646    0,012

Der größere der beiden p-Werte ist 0,98. Äquivalenz kann angenommen werden.
________________________________________

Wenn der Äquivalenztest mit denselben Daten durchgeführt wird, zeigen die Ergebnisse jetzt, dass nicht genug Nachweise vorliegen, um zu behaupten, dass die Mittelwerte gleich sind. Das Unternehmen kann sich nicht sicher sein, dass die Produktqualität nicht beeinträchtigt wird, wenn es das kostengünstigere Material einsetzt. Durch die Verwendung eines Äquivalenztests hat das Unternehmen höhere Maßstäbe beim Auswerten einer möglichen Änderung beim Prozessmittelwert angelegt.

Hinweis: Wenn Sie die Ausgabe oben betrachten, sehen Sie noch einen weiteren Punkt, in dem der Äquivalenztest von einem regulären t-Test abweicht. Die Nullhypothese wird mit zwei einseitigen t-Tests geprüft. Außerdem wird bei dem Test ein Äquivalenzbereich verwendet, der definiert, wie groß die Differenz zwischen Mittelwerten ist, die Sie als praktisch insignifikant betrachten. Dies werden wir im nächsten Beitrag genauer betrachten.

KURZE ZUSAMMENFASSUNG

Wenn Sie die Wahl zwischen einem Äquivalenztest und einem regulären t-Test haben, fragen Sie sich, was Sie belegen oder nachweisen möchten. Das, was wahr sein soll, muss als Alternativhypothese für den Test festgelegt werden, und dort muss die Beweislast liegen. Das Ergebnis, bei dem es weniger nachteilig ist, wenn es fälschlicherweise angenommen wird, muss die Nullhypothese sein. Wenn Sie klar beweisen möchten, dass zwei Mittelwerte gleich sind oder dass ein Mittelwert identisch mit einem Sollwert ist, sollten Sie eher einen Äquivalenztest als einen regulären t-Test wählen.

Möchten Sie Äquivalenztest in der aktuellen Version von Minitab ausprobieren?

Kostenlose Demoversion herunterladen Minitab Statistical Software