Körperfettanteil anhand des BMI prognostizieren, Teil 1

Minitab Blog Editor | 3/8/2022

Themen: Datenanalysen, Minitab Statistical Software, Regressionsanalysen

Wäre es nicht toll, wenn Sie etwas, was für Sie wichtig ist, prognostizieren könnten? Natürlich – und besonders toll wäre es, wenn Sie wüssten, wie präzise Ihre Prognosen sind. Sie benötigen dazu keine hellseherischen Fähigkeiten – Sie haben ja die Statistical Software ! Sie finden diese Vorhersagefunktionen in der Regression, dem allgemeinen linearen Modell (ANOVA), der Versuchsplanung (DOE) und den Entscheidungsbäumen (CART®, TreeNet®, Random Forests®).

PROGNOSEN MIT DER REGRESSIONSANALYSE

Wir betrachten Prognosen mit der Regressionsanalyse am Beispiel des BMI einer Person, anhand dessen der Körperfettanteil prognostiziert werden soll. Um es ein bisschen interessanter zu machen, vergleichen wir die Prognosen in Minitab mit denen von Körperfettwaagen, die die bioelektrische Impedanzanalyse (BIA) nutzen.

Prognosen in Minitab unterscheiden sich vom Hellsehen. Zunächst einmal prognostizieren wir häufig nicht die Zukunft, wie auch beim Beispiel in diesem Blog. Die Prognose bei der Regression bezeichnet das Schätzen des Werts einer Variablen anhand von angenommenen Werten anderer Eingabevariablen, die damit in Verbindung stehen.

Und im Gegensatz zu Vorahnungen tauchen statistische Prognosen nicht einfach in Ihrem Kopf auf. Sie müssen vielmehr Daten erfassen und ein mathematisches Modell entwickeln, das die Beziehung zwischen einer oder mehreren Variablen und der Variablen beschreibt, die Sie prognostizieren möchten. Die Genauigkeit Ihrer Prognose hängt davon ab, wie gut das Modell an die Daten angepasst ist. Im Gegenzug für Ihre Vorarbeit erstellt Minitab nicht nur Prognosen, sondern schätzt auch ihre Genauigkeit ab!

Für eine genaue Prognose sind folgende Schritte erforderlich::

  1. Hintergrundrecherchen anstellen, damit Sie wissen, womit Sie arbeiten!
  2. Daten erfassen.
  3. Verschiedene Regressionsmodelle anpassen und evaluieren.
  4. Das beste Modell ermitteln.
  5. Prognostizieren!

Szenario

Ich habe bereits Daten zu 92 Mädchen im Alter zwischen 12 und 14 erfasst. Dazu gehören Größe, Gewicht und Körperfettanteil, der mit einem Hologic DXA-Ganzkörpersystem gemessen wurde. DXA-Messungen gelten als eines der besten Verfahren zum Bestimmen des Körperfettanteils. Sie finden die Daten hier.

Der Grundgedanke bei diesem Beispiel ist, dass DXA-Messungen teurer und weniger gut zugänglich sind als die Bestimmung des BMI. Daher wäre es hilfreich, wenn anhand des BMI der Körperfettanteil bestimmt werden könnte. Der BMI gibt allgemein an, ob das Gewicht in einem passenden Bereich für die Körpergröße liegt. Allerdings ist der BMI kein perfekter Messwert, weil nicht zwischen dem Gewicht von Muskeln und dem von Fettgewebe unterschieden werden kann. Bei dieser Analyse soll daher bestimmt werden, ob der BMI als Messwert ausreicht.

REGRESSIONSMODELL

Für diesen Artikel habe ich das Modell auf die Endfassung reduziert. Dieser Prozess wird in einem anderen Blog-Beitrag beschrieben. Hier zeige ich nur, warum das endgültige Modell gut geeignet ist. Ich habe beim Reduzieren insbesondere verglichen, wie sich das Einbinden von Größe, Gewicht und ihrer Quadrate in das Modell im Vergleich zum Einbinden des BMI und seines Quadrats auswirken. Durch das Einbinden der quadrierten Terme wollte ich die Krümmung modellieren. Beide Ansätze führten zu nahezu identischen Ergebnissen. Dies ist nicht weiter überraschend, weil der BMI aus Größe und Gewicht berechnet wird (Gewicht in Kilogramm/Größe in Metern zum Quadrat). Ich habe mich für die Verwendung des BMI als Prädiktor entschieden, weil dies in den Ergebnissen leichter dargestellt werden kann.

Da wir einen Prädiktor (BMI) und eine Antwortvariable (Körperfettanteil) haben, können wir die Beziehung mit einer Darstellung der Anpassungslinie abbilden.

Anpassungslinie_ Koerperfettanteil vs. BMI

Hier lässt sich die gekrümmte Beziehung erkennen, wegen der ich den quadrierten Term eingebunden habe. Die Anpassungslinie folgt den Daten sehr gut, weil die Beobachtungen über die gesamte Spannweite entlang der Linie zufällig verteilt sind. R-Quadrat liegt bei 76,1 %, was nicht herausragend, aber auch nicht wirklich schlecht ist. Der Wert spiegelt das unvollkommene Wesen von BMI-Werten wider. Wir beurteilen nun die Residuendiagramme unten, um das Modell noch genauer zu prüfen. Denken Sie daran: Wenn das Modell keine gute Anpassung aufweist, sind die Prognosen nicht aussagekräftig.

Noch eine Bemerkung zu den Implikationen der gekrümmten Beziehung für die BMI-Rohwerte in dieser Grundgesamtheit: Wir denken im Allgemeinen, dass BMI-Werte linear sind. Das heißt wir gehen davon aus, dass eine Steigerung des BMI um 1 dieselbe Zunahme bei der Körperfettmenge darstellt, egal, ob wir bei 16 oder 30 beginnen. Die gekrümmte Beziehung oben zeigt, dass dies nicht stimmt. Die Änderung bei der Körperfettmenge ist abhängig von dem BMI-Wert, mit dem Sie anfangen. Dies führt dazu, dass BMI-Rohwerte häufig die Körperfettmenge bei Menschen mit sehr geringen oder sehr hohem BMI überschätzen. Bei BMI-Werten im mittleren Bereich wird die Körperfettmenge oft unterschätzt. Durch die Regressionsanalyse werden die BMI-Rohwerte für diese Grundgesamtheit also verbessert, indem die Krümmung korrekt modelliert wird. Das haben wir die Minitab Statistiksoftware zu verdanken!

Residuendiagramme fuer Koerperfettanteil

Die Residuen im Wahrscheinlichkeitsnetz für Normalverteilung oben folgen einer geraden Linie, was auf eine Normalverteilung hinweist. Im Diagramm „Residuen vs. Anpassungen“ scheinen die Residuen zufällig um Null gestreut zu sein. Diese Daten wurden nicht in einer zeitlichen Reihenfolge erfasst, daher können wir das Diagramm „Residuen vs. Reihenfolge“ ignorieren. Im Histogramm ließen sich Ausreißer erkennen, hier liegen aber keine vor. (Verwenden Sie Histogramme nicht, um die Normalverteilung zu beurteilen, weil sie zu irreführenden Ergebnissen führen können.)

Da das Modell gut angepasst ist, können wir mit der Prognose beginnen. Im zweiten Teil dieser Reihe generieren wir die Prognosen, bewerten die Genauigkeit und vergleichen die Prognosen von Minitab mit denen der BIA-Waagen !

Wenn Sie etwas über Regression lernen wollen, schauen Sie sich unsere Schulungskurse zu diesem Thema an! Weiterlesen >

Blended LEarning: Lernen Sie, wie Sie mit Minitab Schulungen die Datenanalyse meistern