Wenn Sie kein Statistiker sind, fühlen Sie sich beim Lesen statistischer Ausgaben vielleicht manchmal wie bei Alice im Wunderland. Sie betreten eine fantastische Welt, in der merkwürdige und mysteriöse Phantasmen aus dem Nichts auftauchen.
Betrachten Sie z. B. den t- und den p-Wert in den Ergebnissen eines t-Tests. „Verquerer und verquerer“ denken Sie vermutlich wie Alice, wenn Sie diese Ausgabe sehen.Was sind diese Werte eigentlich? Wo kommen sie her? Auch wenn Sie p-Werte schon unzählige Male verwendet haben, um die statistische Signifikanz Ihrer Ergebnisse zu interpretieren, sind Ihnen die Ursprünge dieses Werts womöglich unbekannt.
t und p sind untrennbar miteinander verbunden. Sie gehen Hand in Hand, wie Zwiddeldum und Zwiddeldei. Und das ist der Grund:
Wenn Sie einen t-Test durchführen, möchten Sie normalerweise einen Beleg für einen signifikanten Unterschied zwischen den Mittelwerten der Grundgesamtheiten (t-Test bei zwei Stichproben) oder zwischen dem Mittelwert der Grundgesamtheit und einem Hypothesenwert finden (t-Test bei einer Stichprobe). Mit dem t-Wert wird die Größe der Differenz relativ zur Streuung in den Stichprobendaten gemessen. Anders ausgedrückt, ist t einfach die berechnete Differenz, dargestellt in Einheiten des Standardfehlers. Je größer der Betrag von t ist, umso stärker spricht dies gegen die Nullhypothese. Dies bedeutet, dass ein stärkerer Beleg für eine signifikante Differenz vorliegt. Je näher t an 0 liegt, umso wahrscheinlicher ist es, dass keine signifikante Differenz vorhanden ist.
Der t-Wert in der Ausgabe wird allerdings nur anhand einer Stichprobe aus der gesamten Grundgesamtheit berechnet. Wenn Sie mehrere Zufallsstichproben aus der gleichen Grundgesamtheit nehmen, erhalten Sie aufgrund des Stichprobenfehlers jedes Mal einen etwas anderen t-Wert. (Dies ist eigentlich kein Fehler, sondern einfach die in den Daten zu erwartende zufällige Streuung.)
Wie unterschiedlich können die t-Werte bei vielen Zufallsstichproben aus der gleichen Grundgesamtheit sein? Und wie hoch ist der t-Wert aus Ihren Stichprobendaten im Vergleich zu den erwarteten t-Werten?
Dies können Sie mit einer t-Verteilung herausfinden.
Nehmen wir zur Veranschaulichung an, dass Sie mit einem t-Test bei einer Stichprobe ermitteln möchten, ob der Mittelwert der Grundgesamtheit bei einer Stichprobe mit 20 Beobachtungen größer als ein Hypothesenwert wie z. B. 5 ist (siehe Ausgabe des t-Tests oben).
Der höchste Punkt (Gipfel) der Verteilungskurve zeigt, in welchen Bereich die meisten t-Werte fallen werden. In den meisten Fällen würden Sie erwarten, dass die t-Werte bei 0 liegen. Das erscheint logisch, oder? Denn wenn Sie zufällig repräsentative Stichproben aus einer Grundgesamtheit auswählen, sollte der Mittelwert der meisten dieser Zufallsstichproben in der Nähe des Mittelwerts der gesamten Grundgesamtheit liegen. Die Differenz (und damit die berechneten t-Werte) liegt damit nahe 0.
t-Werte mit höheren Beträgen (positiv oder negativ) sind unwahrscheinlicher. Der linke und rechte Randbereich der Verteilungskurve stellen extreme t-Werte dar, die stark von 0 abweichen. Der eingefärbte Bereich zeigt z. B. die Wahrscheinlichkeit dafür, einen t-Wert von 2,8 oder höher zu erhalten. Stellen Sie sich einen Zauberpfeil vor, der immer an irgendeiner zufälligen Stelle unter der Verteilungskurve landet. Wie hoch ist die Wahrscheinlichkeit, dass er den eingefärbten Bereich trifft? Die berechnete Wahrscheinlichkeit beträgt 0,005712. Aufgerundet ist das 0,006, was dem p-Wert in den Ergebnissen des t-Tests entspricht!
Anders ausgedrückt beträgt die Wahrscheinlichkeit, bei Stichproben aus derselben Grundgesamtheit (hier eine Grundgesamtheit mit einem Hypothesenmittelwert von 5) einen t-Wert größer oder gleich 2,8 zu erhalten, ungefähr 0,006.
Wie wahrscheinlich ist das? Nicht besonders! Im Vergleich dazu ist die Wahrscheinlichkeit, in einem Pokerblatt mit fünf Karten einen Drilling zu erhalten, ungefähr drei Mal so hoch (≈ 0,021).
Wenn also die Wahrscheinlichkeit für einen so großen t-Wert bei einer Stichprobe aus dieser Grundgesamtheit so gering ist, was ist dann wahrscheinlicher? Es ist wahrscheinlicher, dass die Stichprobe nicht aus dieser Grundgesamtheit (mit dem Hypothesenmittelwert 5) stammt. Es ist viel wahrscheinlicher, dass die Stichprobe aus einer anderen Grundgesamtheit mit einem Mittelwert größer als 5 gezogen wurde.
Das heißt: Da der p-Wert sehr niedrig ist (< Alpha-Niveau), lehnen Sie die Nullhypothese ab und schließen, dass eine statistisch signifikante Differenz vorliegt.
So sind t und p untrennbar miteinander verbunden. Betrachten Sie sie einfach als unterschiedliche Möglichkeiten, um zu quantifizieren, wie „extrem“ Ihre Ergebnisse unter der Nullhypothese sind. Sie können einen Wert nicht ändern, ohne dass sich auch der andere ändert.
Je größer der absolute Wert von t ist, umso kleiner ist der p-Wert und umso stärker ist der Beleg gegen die Nullhypothese. (Sie können dies überprüfen, indem Sie oben in Schritt 6 höhere oder niedrigere t-Werte für die t-Verteilung eingeben.)
Das Beispiel zur t-Verteilung oben basiert auf einem einseitigen t-Test, um zu bestimmen, ob der Mittelwert der Grundgesamtheit größer als ein Hypothesenwert ist. Das Beispiel zeigt daher die dem t-Wert 2,8 zugeordnete Wahrscheinlichkeit nur für eine Richtung (den rechten Randbereich der Verteilung).
Wie können Sie anhand der t-Verteilung den p-Wert für einen t-Wert von 2,8 bei einem beidseitigen t-Test (beide Richtungen) ermitteln?
Hinweis: Passen Sie in Schritt 5 die Optionen in Minitab an, um die Wahrscheinlichkeit für beide Randbereiche zu ermitteln. Wenn Sie nicht über Minitab verfügen, können Sie eine kostenlose 30-Tage-Demoversion herunterladen.