Die nichtparametrische Wirtschaft: Was ist eigentlich der Durchschnitt?

Minitab Blog Editor | 3/7/2021

Themen: Datenanalysen, Datenkompetenz, #durchschnitt, grundlegende Statistiken

Die Nachrichten aus DACH klingen wie eine kaputte Schallplatte: „Unsicherheit wegen der europäischen Wirtschaft ... enttäuschende Arbeitsmarktzahlen ... beständig hohe Inflation ... steigender Druck auf die Durchschnittsbürger, um am Monatsende genug übrig zu haben ... “

>Wie wäre es zur Abwechslung mit guten Nachrichten?

Laut Versicherungswirtschaftheute (Oktober 2020) stieg Die Gesamtvergütung für einen Dax-Vorsitz im Median leicht, um 2,3 Prozent auf 334.000 Euro im Vergleich zu 2018; für den MDax-Vorsitz legte sie um deutliche 5,9 Prozent auf 194.600 Euro zu.

Moment – wenn ich das noch einmal lese, bin ich etwas verwirrt ...

Erstens ist die Wirtschaft gerade angeschlagen, und trotzdem gibt es für die Vorsitzender von Unternehmen Gehaltserhöhungen in bisher unbekannten Ausmaßen? Wenn die Top-Unternehmen die Bezahlung ihrer Führungskräfte derartig steigern, müsste das doch auf eine bessere Wirtschaftslage hindeuten, an der ALLE teilhaben können?

Was bedeutet „Durchschnitt“?

Zweitens müssen Sie beachten, dass ich das DURCHSCHNITTLICHE Haushaltseinkommen erwähnt habe und dann vom MEDIAN der Gehälter und im selben Satz vom DURCHSCHNITT gesprochen habe, als handele es sich um dasselbe Maß. Ist der Durchschnitt denn nicht der Mittelwert?

Wenn in den Nachrichten vom „Durchschnitt“ die Rede ist, ist meistens das arithmetische Mittel gemeint. Beim Einkommen ist der Mittelwert allerdings der Wert, der ermittelt wird, indem alle Einkommen addiert und dann durch die Anzahl der betrachteten Personen geteilt werden. Um hingegen den Median zu ermitteln, müsste man alle Personen nach Einkommenshöhe sortiert in eine Reihe stellen. Der Medianem> ist dann das Gehalt der Person, die in der Mitte der Reihe steht. Darauf gehe ich gleich näher ein.

Wir wissen also, dass der Median der Gehälter von Vorsitzendern in einem Jahr um 2,3 % gestiegen ist. Ich möchte aber wissen, wie die Regierung ermittelt, ob wir als Gesamtgesellschaft besser dastehen als vor einem Jahr. Bei der Beantwortung dieser Frage besteht das Risiko, dass solche extremen Änderungen in nur einem Jahr das Bild verzerren und es so aussehen lassen, als ginge es allen besser, als dies tatsächlich der Fall ist. Lassen Sie mich das hier demonstrieren:

Gehen wir für unsere Zwecke davon aus, dass die Regierung nur das durchschnittliche Haushaltseinkommen als Indikator für die Wirtschaftslage betrachtet. Gehen wir außerdem davon aus, dass letztes Jahr Daten aus unterschiedlichen Bevölkerungsgruppen zufällig erfasst wurden und wir dieselben Daten jetzt wieder erheben. Ein Statistiker würde nun zunächst an einen t-Test bei zwei Stichproben denken, um zu bestimmen, ob die beiden unabhängigen Durchschnittseinkommen signifikant voneinander abweichen. Im Idealfall würden die Daten mit einem Jahr Abstand von denselben Personen erfasst werden, um einen t-Test bei verbundenen Stichproben durchzuführen. Bleiben wir zunächst beim t-Test bei zwei Stichproben. Da ich keinen Zugriff auf die Datenbanken der Regierung habe, arbeite ich mit Dummy-Daten, die nach meinen Berechnungen die Realität grob abbilden sollten.

t-Test bei zwei Stichproben für den Mittelwert

Ich wähle also Minitab „Statistik“ > „Statistische Standardverfahren“ > „t-Test, 2 Stichproben“ aus und fülle das Dialogfeld wie in der folgenden Abbildung dargestellt aus:

 
Aus der obigen Ausgabe des t-Tests bei zwei Stichproben können wir schließen, dass das durchschnittliche Haushaltseinkommen 2012 auf der Grundlage der Dummy-Daten signifikant höher als das durchschnittliche Haushaltseinkommen 2011 ist. Der Mittelwert ist von 33.276 £ auf 35.936 £ gestiegen, und der p-Wert beträgt 0,039. Da der p-Wert niedriger als das Signifikanzniveau von 0,05 ist, können wir schließen, dass die Mittelwerte der Stichproben unterschiedlich sind.

Sollten wir uns damit zufriedengeben? Nein. Ist Ihnen aufgefallen, dass ich in meiner ursprünglichen Beschreibung eines t-Tests bei zwei Stichproben bewusst nicht angegeben habe, was ich mit „Durchschnitt“ meine? Es ist jetzt klar, dass ich hier Mittelwerte vergleiche, wenn von Anfang an alles auf die Betrachtung von Medianen hindeutete. Ich tat dies absichtlich, damit ich zeigen kann, dass unsere Wirtschaft nicht mit parametrischen Begrifflichkeiten erfassbar ist.

Das Problem mit dem Mittelwert

Warum sollten wir in diesem Fall keine Mittelwerte vergleichen? Dies lässt sich am besten demonstrieren, indem wir einige Daten mit der Histogrammfunktion darstellen. Diese findet sich in der Minitab Statistical Software im Menü Grafiken > Histogramm. Beachten Sie, dass ich das Histogramm mit einem etwas abweichenden Dummy-Datensatz erstellt habe, damit das Problem mit dem Mittelwert klarer zu erkennen ist:
 

Die Abbildung oben zeigt die Verteilung der Haushaltseinkommen in Großbritannien im Januar 2011 und im Januar 2012. Ich habe alle höheren Einkommen (über 150.000 £) gruppiert und violett dargestellt sowie zur Verdeutlichung Referenzlinien für den Mittelwert und den Median hinzugefügt.

Wir können den Effekt der Steigerung bei Top-Einkommen deutlich erkennen, wenn wir die violetten Balken ganz rechts im Diagramm betrachten. Außerdem ist offensichtlich, dass die Daten nicht normalverteilt sind, da sie eine Untergrenze von 0 aufweisen und nicht symmetrisch verteilt sind.

Betrachten Sie jetzt die beiden Maße für den Durchschnitt – der Mittelwert und der Median vermitteln sehr unterschiedliche Bilder. Der Mittelwert ist von 33.276 £ auf 35.936 £ gestiegen. Der Median bleibt allerdings unverändert bei 25.993 £.

Der hier verwendete t-Test bei zwei Stichproben ist ein parametrisches Verfahren, das auch mit nicht normalverteilten Daten verwendet werden kann, solange ein sinnvoller Stichprobenumfang gegeben ist (mindestens 15 Beobachtungen). Ich möchte nicht zu sehr ins Detail gehen, aber falls Sie sich näher mit dem Thema beschäftigen möchten: Dies hängt mit den Eigenschaften des zentralen Grenzwertsatzes zusammen. Aus statistischer Sicht spricht also nichts dagegen, anhand der Ausgabe des t-Tests bei zwei Stichproben zu schließen, dass ein signifikanter Unterschied zwischen den durchschnittlichen Haushaltseinkommen im Januar 2011 und im Januar 2012 besteht. Dies ist aber nur richtig, wenn wir akzeptieren, dass der Mittelwert den Durchschnitt wirklich abbildet.

Und das ist der Knackpunkt – in vielen Studien, auch in Lean Six Sigma-Projekten, haben Sie mit Daten zu tun, bei denen der Mittelwert nicht unbedingt die beste Darstellung des Durchschnitts ist. Ich habe schon viele Projekte gesehen, in denen der Median bevorzugt wird, insbesondere bei nicht symmetrischen Daten, die eine Untergrenze von 0 aufweisen. Dabei kann es sich z. B. um die Zeit zum Abschließen einer Aufgabe oder um ordinale Daten aus Umfrageergebnissen handeln.

Einsatz von nichparametrischen Hypothesentests

Betrachten Sie noch einmal die oben gezeigten Histogramme. Mir sagt mein gesunder Menschenverstand, dass der Median bei diesen Daten möglicherweise ein genauerer Indikator für den Durchschnitt als der Mittelwert ist. Schließlich suchen wir nach einem Maß für den Durchschnitt, das sich auf die Mehrheit der Haushalte in Großbritannien bezieht, um den Effekt ungewöhnlich hoher Einkommen zu minimieren. In Minitab gibt es eine Reihe nichtparametrischer Werkzeuge, mit denen Sie genau dies erreichen. Diese können Sie unter „Statistik“ > „Nichtparametrische Tests“ aufrufen. Für die meisten parametrischen Hypothesentests gibt es auch eine nichtparametrische Entsprechung:

  • Vorzeichentest, 1 Stichprobe: Hiermit wird ein Vorzeichentest bei einer Stichprobe des Medians durchgeführt, und die entsprechende Punktschätzung und das Konfidenzintervall werden berechnet. Dies stellt eine nichtparametrische Alternative zum z-Test bei einer Stichprobe und dem t-Test bei einer Stichprobe dar.
  • Wilcoxon-Test, 1 Stichprobe: Hiermit wird ein Wilcoxon-Rangtest bei einer Stichprobe des Medians durchgeführt, und die entsprechende Punktschätzung und das Konfidenzintervall werden berechnet. Dies stellt eine nichtparametrische Alternative zum z-Test bei einer Stichprobe und dem t-Test bei einer Stichprobe dar.
  • Mann-Whitney: Führt einen Hypothesentest durch, in dem die Gleichheit der Mediane von zwei Grundgesamtheiten geprüft wird, und berechnet die entsprechende Punktschätzung und das Konfidenzintervall. Dies stellt eine nichtparametrische Alternative zum t-Test bei zwei Stichproben dar.
  • Kruskal-Wallis: Führt einen Hypothesentest durch, in dem die Gleichheit der Mediane der Grundgesamtheiten für ein einfaktorielles Design geprüft wird (zwei oder mehr Grundgesamtheiten). Dies ist eine nichtparametrische Alternative zur einfachen Varianzanalyse.
  • Mood-Median-Test: Führt einen Hypothesentest durch, in dem die Gleichheit der Mediane der Grundgesamtheiten in einem einfaktoriellen Design geprüft wird. Der Mood-Median-Test stellt wie der Kruskal-Wallis-Test eine nichtparametrische Alternative zur häufig verwendeten einfachen Varianzanalyse dar.
  • Friedman: Führt eine nichtparametrische Analyse eines Versuchs mit randomisierten Blöcken durch. Dies ist eine nichtparametrische Alternative zur zweifachen Varianzanalyse.

Wenden wir also den Mann-Whitney-Test auf dieselben Daten an (Statistik > Nichtparametrische Tests > Mann-Whitney) :

 

Wir erhalten einen p-Wert von 0,4997; dieser ist größer als das Signifikanzniveau von 0,05. Anders ausgedrückt zeigt dieser Test, dass es in den Stichprobendaten keinen Beleg dafür gibt, dass der Median der Haushaltseinkommen im Januar 2012 signifikant höher als im Jahr 2011 ist – ein durchaus anderer (und genauerer) Schluss als das Ergebnis des t-Tests bei zwei Stichproben!

Wir können also als Fazit ziehen, dass die Gehaltssteigerungen in den obersten Einkommensklassen vermutlich kein Zeichen dafür sind, dass die Gesellschaft im Ganzen von einer besseren wirtschaftlichen Lage profitiert. Wahrscheinlich ist dies vielmehr auf eine Reihe anderer Faktoren zurückzuführen, z. B. die Angleichung von Managergehältern an globale Standards und der starke Wettbewerb insbesondere im Bankensektor.

Ich hoffe, dass dieser Artikel zeigt, warum es wichtig ist, zuerst zu bestimmen, wie ein Durchschnittswert realistisch abgebildet wird. Erst danach sollten Hypothesentests zum Einsatz kommen. Außerdem haben Sie einen Einblick in die nichtparametrischen Werkzeuge erhalten, die in Minitab verfügbar sind.

Quelle: https://versicherungswirtschaft-heute.de/maerkte-und-vertrieb/2020-10-19/weniger-gehalt-fuer-baete-und-co-krise-laesst-gehaelter-der-dax-vorstaende-schrumpfen/

Flexible, praktische Minitab-Schulungen: In den von Statistikexperten geleiteten Kursen erfahren Sie, wie Sie Einblicke in Ihre Daten erhalten und die Qualität Ihrer Produkte und Dienstleistungen verbessern.