Prädiktive Analysen mit der Regression in der Minitab Statistiksoftware – Teil I

Dennis Corbin | 02 September, 2021

Themen: Praediktiven Analysen, Minitab Statistical Software, Regressionsanalysen

Auf dem Markt gibt es eine Vielzahl neuer Werkzeuge für prädiktive Analysen und das maschinelle Lernen, doch die Regression ist nach wie vor ein bewährtes Verfahren zum Erstellen prädiktiver Modelle. Mit einer Regression lässt sich die Beziehung zwischen einer Antwortvariablen und verschiedenen Prädiktoren modellieren. Prädiktive Werkzeuge müssen in Unternehmen allerdings richtig implementiert werden. Die Regression in der Minitab Statistical Software kann dabei helfen, aussagekräftige prädiktive Modelle zu erstellen!

In der Minitab Statistical Software können Regressionsanalysen so einfach wie nie zuvor durchgeführt werden:

  • Prädiktive Modelle erstellen, verifizieren und visualisieren.
  • Prognosefähigkeit des Modells validieren.
  • Analyse und Modellauswahl automatisieren.
  • Neue Ergebnisse prognostizieren und Parameter optimieren.

An dieser Stelle legen wir den Schwerpunkt auf das Erstellen, Verifizieren und Visualisieren eines prädiktiven Modells. In Teil 2 dieser Serie von Blog-Artikeln gehen wir dann auf fortschrittlichere Funktionen zum Validieren der Prognoseleistung, Automatisieren der Analyse und Modellauswahl sowie zum Prognostizieren neuer Ergebnisse und Optimieren von Parametern ein.

Mit der Regression können verschiedene Fragen beantwortet werden, die sich in praktisch allen Branchen stellen, z. B. Marketing, Finanzen, Fertigung, Medizintechnik, Pharma oder Lebensmittelproduktion. So lässt sich bestimmen, welche Eingaben den Wert einer Antwortvariablen prognostizieren können und welche die stärksten Auswirkungen haben. Mit aussagekräftigen Regressionsmodellen können sogar erwartete Werte berechnet und die Auswirkungen von geplanten Änderungen prognostiziert werden. Denken Sie jedoch stets daran, dass diese Modelle keine Kausalität, sondern nur Assoziationen aufdecken können.

PRÄDIKTIVE MODELLE IN DER MINITAB STATISTICAL SOFTWARE ERSTELLEN, VERIFIZIEREN UND VISUALISIEREN

Mit der Regression in Minitab kann quantifiziert werden, wie stetige und kategoriale Prädiktoren eine Antwortvariable beeinflussen. Dabei können dem Regressionsmodell mit den integrierten Funktionen bequem komplexe Terme, also Wechselwirkungen und Polynomialterme, hinzugefügt werden.

Betrachten wir als Beispiel einen Lebensmittelproduzenten. Die Ingenieure des Unternehmens müssen bestimmen, wie sich drei mögliche Verpackungsausführungen und die Zeit in Stunden auf die Haltbarkeit eines Produkts (gemessen als Feuchtigkeitsgehalt) auswirken. Insbesondere sollen die ersten 72 Stunden nach der Versiegelung der Verpackung betrachtet werden.

die Prädiktoren umfasst. In diesem Beispiel würde das Modell eine separate Konstante für jede Verpackungsausführung enthalten, jedes Modell würde aber dieselbe Steigung aufweisen. Durch das Hinzufügen von Polynomialtermen und Wechselwirkungen kann eine robustere Analyse erzielt werden.

Unter Statistik > Regression > Regression > Regressionsmodell anpassen werden die Antwortvariable, die stetigen Prädiktoren und die kategorialen Prädiktoren eingegeben. Über die Schaltfläche Modell kann das Modell dann unkompliziert mit Wechselwirkungen und Polynomialtermen angereichert werden, um genauere Prognosen zu erhalten. In einem Pareto-Diagramm können schließlich die Auswirkungen dieser Terme im Modell dargestellt werden, während mit Residuendiagrammen die Modellannahmen geprüft werden.

predictive-analytics-regression-pt-1-pareto-dialogs

Das Pareto-Diagramm der Effekte in der Abbildung unten ist eine einfache Darstellung der signifikanten und nicht signifikanten Terme. Wenn der standardisierte Effekt eines Terms die rote Linie kreuzt, liegt der p-Wert unter dem angegebenen Alpha, in diesem Fall 0,05. Dies bedeutet, dass der Term signifikant ist. Die Länge des Balkens zeigt die relative Auswirkung der Terme im Modell: sowohl Stunden als auch Verpackungsausführung sind unverzichtbar, um den Feuchtigkeitsgehalt dieses Produkts zu erklären.

predictive-analytics-regression-pt-1-pareto-chart-standardized-effects

Das prädiktive Modell für die Feuchtigkeit enthält Stunden2, quadrierte Stunden, Verpackungsausführung und die Wechselwirkungen zwischen diesen Termen. In Minitab wird das Modell vereinfacht, indem jeweils ein separates Modell für die drei Verpackungsausführungen angezeigt wird. Der Unterschied zwischen den Konstanten und Steigungen bei den verschiedenen Ausführungen ist auf die signifikanten Wechselwirkungen zurückzuführen.

predictive-analytics-regression-pt-1-regression-equation-output

Mit Residuendiagrammen können die Annahmen der Regression verifiziert werden. Sie zeigen Abweichungen von der Normalverteilung, ungleiche Varianzen oder fehlende Unabhängigkeit und können so belegen, dass eine Analyse gültig und geeignet ist.

predictive-analytics-regression-pt-1-residual-plots-moisture

Nachdem alles sorgfältig geprüft wurde, sollen natürlich die Ergebnisse präsentiert werden. Mit Faktordiagrammen können die numerischen Ausgaben in Form von leicht verständlichen Grafiken dargestellt werden, um das Modell zu visualisieren. Wenn das Ziel darin besteht, den Feuchtigkeitsgehalt des Produkts in den wichtigen ersten 72 Stunden zu minimieren, ist Ausführung 2 die beste Wahl.

predictive-analytics-regression-pt-1-interaction-plot-moisture

Die Regression ist kein neues Verfahren – aber sie ist ein äußerst leistungsfähiges Modellierungswerkzeug, das jeder beherrschen sollte, der Daten analysiert. Mit der Minitab Statistiksoftware können prädiktive Modelle ganz einfach und unkompliziert erstellt und visualisiert werden.

Wenn Sie Minitab Statistical Software noch nicht verwenden, um Ihre Daten optimal auszuwerten, laden Sie eine kostenlose 30-Tage-Demoversion mit vollem Funktionsumfang herunter.

Kostenlose Demoversion

Notabene: in Teil 2 dieser Serie von Blog-Artikeln gehen wir dann auf fortschrittlichere Funktionen zum Validieren der Prognoseleistung, Automatisieren der Analyse und Modellauswahl sowie zum Prognostizieren neuer Ergebnisse und Optimieren von Parametern ein.