ARIMA: So erhalten Sie beim Analysieren von Zeitreihendaten die relevanten Informationen

Um aus Zeitreihendaten die benötigten Informationen zu erhalten, sind Können und Erfahrung, vielleicht auch Inspiration und Fingerspitzengefühl gefragt. In diesem Artikel wird beschrieben, wie Sie Zeitreihendaten mit fortgeschrittenen Werkzeugen analysieren, die in Grundlagen-Schulungsprogrammen zur Statistik selten behandelt werden.

In der Fertigungs- und Dienstleistungsbranche sind Zeitreihendaten weit verbreitet. Beispiele:

Die Anzahl der Tage, die ein Kunde darauf wartet, eine Antwort auf einen Hypothekenantrag zu erhalten
Die Zeit, die benötigt wird, bis ein Anruf bei einer Bank entgegengenommen wird
Die Zeit, die Mitarbeiter in einem Center für technischen Support für Telefonate mit Kunden aufwenden
Der Verkauf mit Helikoptermotoren im zeitlichen Verlauf
Die Zeit, die Mitarbeiter eines Pharmaunternehmens zum Ausfüllen von wichtigen Dokumenten benötigen

Das Analysieren solcher Daten scheint zunächst einfach zu sein – ist dies jedoch wirklich der Fall?

Beim Analysieren von Zeitreihendaten besteht der erste Schritt häufig im Erstellen von statistischen Regelkarten. Wir können beispielsweise ein Verlaufsdiagramm erstellen, indem wir Statistik > Qualitätswerkzeuge > Verlaufsdiagramm auswählen und das Dialogfeld wie folgt ausfüllen:

Es reicht niemals aus, die Datenanalyse einfach nach einer bestimmten Anleitung durchzuführen. Zum Extrahieren der benötigen Informationen aus Zeitreihendaten sind zweifellos Können und Erfahrung erforderlich, jedoch benötigen Sie auch Inspiration und Fingerspitzengefühl, um Prozesse ordnungsgemäß zu überwachen, damit entsprechende Korrekturen vorgenommen werden können.

Dank meiner Erfahrungen in den Honeywell Master Black Belt-Schulungen und bei der Betreuung der Veranstaltungen von Minitab konnte ich Zeitreihendaten mit weniger bekannten, fortgeschrittenen Werkzeugen analysieren, die in Grundlagen-Schulungsprogrammen zur Statistik häufig außer Acht gelassen werden. Dieser Artikel soll Ihnen zeigen, wie Sie einige dieser Verfahren in der Minitab Statistical Software anwenden.

Kontakt zu Minitab >

Nachdem auf OKgeklickt wurde, generiert Minitab das folgende Diagramm:

Beim Analysieren von Zeitreihendaten besteht der erste Schritt häufig im Erstellen von statistischen Regelkarten. Wir können beispielsweise ein Verlaufsdiagramm erstellen, indem wir Statistik > Qualitätswerkzeuge > Verlaufsdiagramm auswählen

Unerfahrene Benutzer versuchen eventuell, eine I/MR-Karte zu erstellen, indem sie Statistik > Regelkarten > Regelkarten für Variablen (Einzelwerte) > I/MR auswählen.

Um die Verwendung von Regelkarten wie diese zu rechtfertigen, müssen jedoch Standardannahmen erfüllt werden. Insbesondere müssen die Daten normal und unabhängig voneinander verteilt sein, mit dem Mittelwert μ und der Standardabweichung σ1.

Die Eingriffsgrenzen auf der I-Karte basieren auf dem Mittelwert der gleitenden Spannweite: der absoluten Differenz zwischen den einzelnen aufeinander folgenden Paaren von Punkten. Wenn zwischen den Punkten keine Unabhängigkeit besteht, liegt eine als Autokorrelation bezeichnete Bedingung vor, d. h., die Differenz zwischen den aufeinander folgenden Paaren von Punkten ist gering. Das bedeutet, dass die gleitende Spannweite unnatürlich gering ist, und dies führt zu einer Zunahme der Rate falscher Alarme auf der I-Karte.

Wie können Sie erkennen, ob Daten autokorreliert sind?

Offensichtlich kann die Verwendung einer I-Karte mit autokorrelierten Daten Probleme verursachen. Daher ist es hilfreich zu wissen, ob die Daten autokorreliert sind. Glücklicherweise wird dies durch den Assistenten in der Minitab Statistical Software überprüft, ohne dass wir in der Software komplizierte Optionen verwenden müssen.

Wenn wir Assistant > Regelkarten > I/MR-Karte auswählen und dann das Dialogfeld wie unten dargestellt ausfüllen, gibt der Assistent eine Warnung aus.

Der Assistent informiert uns außerdem über die Autokorrelation und ihre Folgen:

Wir hätten zum Erstellen der I/MR-Karte von vornherein den Assistenten verwenden sollen. Ohne den Assistenten ziehen viele Benutzer falsche Schlussfolgerungen.

Umgang mit der Autokorrelation in Minitab

Bedeutet die Autokorrelation, dass die Daten nicht verwendet werden können? Doch, das geht, aber wir müssen eine differenziertere Vorgehensweise verfolgen.

Um die Korrelationen zwischen den Daten zu verschiedenen Zeitpunkten, die um einen oder mehrere Perioden auseinander liegen, zu ermitteln, können wir eine Analyse der Autokorrelation und der partiellen Autokorrelation durchführen. So können wir bestimmen, ob zwischen den Daten zum Zeitpunkt t und zu den Zeitpunkten t-1, t-2 bis t-k Korrelationen vorhanden sind.

Wir wählen Statistik > Zeitreihen > Autokorrelation.

Minitab erzeugt die folgende Ausgabe:

Die partielle Autokorrelationsfunktion lässt sich entsprechend durch folgende Auswahl berechnen: Statistik > Zeitreihen > Partielle Autokorrelationsfunktion

Die vertikalen Linien, die über die horizontalen roten gepunkteten Linien herausragen, geben eine starke Korrelation zwischen Zeitpunkten an, die um ein und zwei Perioden auseinander liegen. Jetzt können wir die Autokorrelation eliminieren, indem wir jeden dritten Datenpunkt auf einer I/MR-Karte darstellen. Wählen Sie Statistik > Regelkarten > Regelkarten für Variablen (Einzelwerte) >I/MRR aus.

Minitab erzeugt das folgende Diagramm:

Der Prozess scheint unter Kontrolle zu sein, und die zugrunde liegenden Annahmen wurden erfüllt. Jedoch wurden zwei Drittel der Daten ausgelassen. In Anbetracht der geringen Anzahl von Werten in der Zeitreihenspalte hätten wir die Daten auch in relativ große Teilgruppen unterteilen können, um eine relativ geringe Anzahl von Punkten auf der X-quer-Karte zu erhalten. Keine dieser Optionen ist ideal.

Die beste Lösung ist die Verwendung der Zeitreihenmodellierung, insbesondere der ARIMA-Methode (Autoregressive Integrated Moving Average, autoregressive integrierte gleitende Durchschnitte). Diese Methode ist in Industrie- und Unternehmenskreisen nicht sehr bekannt, sie lässt sich jedoch relativ leicht anwenden, sofern einige grundlegende Schritte verstanden wurden. Zum Ermitteln der besten Lösung ist jedoch möglicherweise etwas Fingerspitzengefühl erforderlich. Dabei muss die Person, die die Analyse durchführt, eventuell mehr Kunstgriffe als wissenschaftliche Kenntnisse anwenden.

Erstellen eines ARIMA-Modells

Bei der ARIMA-Modellierung werden ganz einfach Daten aus der jüngeren oder entfernteren Vergangenheit genutzt, um die vorhandenen Daten zu modellieren und zuverlässige Vorhersagen zum zukünftigen Verhalten zu treffen. Es soll ein zugrunde liegendes Modell bestimmt werden, das die Änderung im Prozess erklärt. Jeder Punkt, der von diesem prognostizierten Verhalten abweicht, lässt sich als Ausnahmebedingung auffassen, da er nicht den allgemeinen Änderungen in den Daten entspricht.

Damit ein ARIMA-Modell erstellt werden kann, müssen die Daten stationär sein; das bedeutet, dass der Prozess weder einen Aufwärts- noch einen Abwärtstrend aufweisen darf. Mit anderen Worten, es muss eine bestimmte Stabilität des Prozessmittelwerts erreicht werden. Die ursprünglichen Daten waren nicht stationär, sondern es schien ein Aufwärtstrend im zeitlichen Verlauf vorhanden zu sein. Mit dem Werkzeug „Differenz“ in Minitab lassen sich die Daten in stationäre Daten ändern Statistik > Zeitreihen > Differenz.

Die folgende Grafik wird erzeugt:

Die Daten, auf die wir eine Differenz der Ordnung 1 angewendet haben, scheinen stationär geworden zu sein und keinen eindeutigen Aufwärts- oder Abwärtstrend aufzuweisen. Daher können wir diese Daten zum Bestimmen eines ARIMA-Modells verwenden.

Zunächst führen wir eine Analyse der Autokorrelation und partiellen Autokorrelation der Daten aus, deren Differenz gebildet wurde. Minitab liefert die folgenden Ergebnisse:

Jetzt müssen wir die Muster in der Autokorrelations- und partiellen Autokorrelationsfunktion interpretieren. Ein hilfreiches Dokument hierzu ist Forecasting, Methods and Applications von Makridakis, Wheelwright und Hyndman (John Wiley and Sons, Third Edition, 1998).

Die Autokorrelationsfunktion weist ein sinusförmiges Muster und Spitzen für die Lags 1 bis 3 auf. Dies lässt auf ein autoregressives Modell der Ordnung 3 bzw. AR(3) schließen. Sinusförmiges Verhalten der partiellen Autokorrelationsfunktion und Spitzen bis zu Lag 3 lassen auf ein Modell des gleitenden Durchschnitts der Ordnung 3 bzw. MA(3) schließen. Die Zeitreihenmodellierung kann zuweilen ein iterativer oder sogar unsicherer Prozess sein, jedoch legen diese Grafiken nahe, dass sich zunächst die Verwendung des ARIMA(3,1,3)-Modells empfiehlt.

Jeder Teil des ARIMA-Modells hat eine bestimmte Aufgabe in den Prognosen des Modells. Der autoregressive Teil des Modells prognostiziert den Wert zum Zeitpunkt t, indem frühere Werte in der Reihe zum Zeitpunkt t-1, t-2 usw. berücksichtigt werden. Der gleitende Durchschnitt verwendet frühere Residuenwerte, d. h. die Differenzen zwischen dem tatsächlichen Wert und dem auf Grundlage des Modells prognostizierten Wert zum Zeitpunkt t.

Wir können bestimmen, wie gut sich das ARIMA(3,1,3)-Modell für die Daten eignet, indem wir Statistik > Zeitreihen > ARIMA auswählen.

Minitab erzeugt die folgende Ausgabe:

Die p-Werte sind nur auf einem Niveau von 10 % für den Koeffizienten der Ordnung 1 des autoregressiven Teils des Modells und den Koeffizienten der Ordnung 3 des Teils mit dem gleitenden Durchschnitt des Modells signifikant. Zudem deutet die Ljung-Box-Chi-Quadrat-Statistik, mit der die gesamte Zufälligkeit des Modells überprüft wird, darauf hin, dass ein saisonaler Effekt von mindestens der Ordnung 1 auftritt.

Darum verfeinern wir die Interpretation dieser Daten, indem wir ein ARIMA(1,1,3)(1,0,0)₁₂ -Modell erstellen. Diese Notation ist einfacher als es zunächst scheint. Der erste Satz Klammern besagt, dass die Lags für den autoregressiven (AR) Teil und den integrierten Teil (I) des Modells 1 lauten und dass der gleitende Durchschnitt (MA) auf Lag 3 basiert. Der zweite Satz Klammern gibt den saisonalen Effekt an, von dem wir annehmen, dass er einem Zyklus von 12 Perioden, d. h. einem Jahreszyklus, um AR(1) folgt. Lassen Sie uns das Modell testen.

Der autoregressive Koeffizient der Ordnung 1, der saisonale Koeffizient und der Koeffizient der Ordnung 3 für den gleitenden Durchschnitt sind auf dem Alpha-Niveau von 10 % signifikant. Dies bedeutet, dass es sich möglicherweise um ein effizientes Modell handelt. Die Summe der Quadrate, die als Maß der Summe der quadrierten Differenzen zwischen den einzelnen ursprünglichen Datenpunkten und ihren mit diesem ARIMA-Modell geschätzten Werten dient, ist recht klein. Außerdem weist die Ljung-Box-Chi-Quadrat-Statistik keine Korrelationen zwischen Punkten mit einer Differenz von 12 oder 24 Lags auf. Die Korrelationen wurden durch den Einschluss des saisonalen Koeffizienten eliminiert.

Jetzt möchten wir bestimmen, wie gut das Modell auf die ursprünglichen Werte passt, und ermitteln, was das Modell für die Zukunft des Prozesses prognostiziert. Um die Anpassung des Modells zu bestimmen, wählen wir Grafiken > Zeitreihendiagramm > Mehrfach aus.

Minitab erzeugt die folgende Grafik:

Wählen Sie „Prognosen“, und füllen Sie die Dialogfelder wie folgt aus, bevor Sie in jedem Dialogfeld auf „OK“ klicken:Um die prognostizierten zukünftigen Werte anzuzeigen, wählen Sie Statistik > Zeitreihen > ARIMA, und dann „Grafiken“ aus. Minitab erzeugt die folgende Grafik mit Prognosen:

Das prognostizierte zukünftige Verhalten des Prozesses ist in Anbetracht der früheren Daten plausibel. Mit einer größeren Menge von Daten lässt sich das Konfidenzintervall von 95 % noch weiter verringern.

Wie in der Regressions- oder ANOVA-Modellierung muss bei der ARIMA-Modellierung unbedingt das Verhalten der Residuenwerte untersucht werden, um zu bestimmen, ob sie normalverteilt und zufällig sind und eine konstante Streuung aufweisen.

Bei diesen Residuenwerten handelt es sich um die Differenzen zwischen dem beobachteten Wert zum Zeitpunkt t und dem auf Grundlage des ARIMA-Modells prognostizierten Wert. Die Differenzen können negativ oder positiv sein. Gelegentlich können sie 0 sein, wenn es sich um eine perfekte Anpassung handelt.

Die Annahmen sind weitgehend erfüllt, mit Ausnahme einer nicht konstanten Streuung in der Darstellung der Residuen vs. Anpassungen. Der Grund hierfür ist, dass das Modell für frühe Datenpunkte eine bessere Anpassung als für neuere Datenpunkte liefert.

Für diese Residuenwerte liegt keine Autokorrelation vor. Daher empfiehlt es sich, die Residuenwerte mit dem Assistenten auf einer I/MR-Karte darzustellen, um zu ermitteln, welche Punkte vom erwarteten Verhalten abweichen, d. h., welche Punkte nicht dem Modell entsprechen.

Wir wählen Assistent > Regelkarten > I/MR-Karte.

Minitab erzeugt die folgende Ausgabe:

Ein Datenpunkt, und zwar 26, lag außerhalb der Eingriffsgrenzen. Eine mögliche Ursache hierfür ist eine unerwartete und drastische Änderung zwischen Punkt 25 und 26. Gemäß dem ARIMA-Modell ist eine Entwicklung in diesem Prozess zu erwarten, jedoch interpretieren wir die Datenreihe so, dass dieser speziellen Änderung nur eine einzige Ausnahmebedingung zugrunde liegt.

Angenommen, Sie versuchen, die Änderungen im Wert einer bestimmten Aktie zu verstehen, und der neueste Trend war ein Abwärtstrend, da das Unternehmen starkem Wettbewerb ausgesetzt ist. Sie können dieses Phänomen mit dem ARIMA-Verfahren modellieren. Wenn der CEO des Unternehmens, der an der Börse kein hohes Ansehen genießt, ankündigt, dass er seine Position in einem Jahr aufgibt, kann dies zu einer abrupten Wertsteigerung der Aktie führen, so dass das auf Grundlage des aktuellen Modells erwartete Ergebnis für diesen Tag übertroffen wird. Dies würde sich in den Residuen widerspiegeln und eine eindeutige Ausnahmebedingung sein.

Was stellt das ARIMA-Modell tatsächlich dar?

Die folgenden Ausführungen sind vor allem für fortgeschrittene Benutzer interessant, da einige Ableitungen recht komplex sind.

Der prognostizierte Wert zum Zeitpunkt t hängt von den früheren Werten in der Reihe und gleichermaßen von den früheren Residuenwerten ab.

Es ist hilfreich, die Grundlagen der Notation zu kennen, insbesondere die Notation mit Verzögerungsoperatoren, die in der Zeitreihenanalyse allgemein verwendet wird.

Yt ist der Datenwert zum Zeitpunkt t
Yt-Dach ist der auf Grundlage des Modells prognostizierte Wert zum Zeitpunkt t
et ist der Residuenwert zum Zeitpunkt t, d. h. die Differenz Yt -Yt-Dach

Häufig wird der Verzögerungsoperator B verwendet.

BY t = Y t-1
B(BYt) =B2 Yt =Yt-2

Wie ist das ARIMA(1,1,3)(1,0,0)12-Modell konzipiert?

Das Modell besteht aus zwei Teilen: Autoregression (AR) und gleitender Durchschnitt (MA). Außerdem muss eine Differenzbildung der Ordnung 1 eingeschlossen werden (Yt-Yt-1).

Autoregressive Komponenten

Beginnen wir mit der autoregressiven Seite der Gleichung, die von den früheren Werten in der Reihe abhängt. Diese Komponente des Modells enthält drei verschiedene Teile:

Autoregressiver Term der Ordnung 1: (1-φ₁B)Yt=Y_t-φ1Yt-1

Saisonale AR(1): (1-θB₁₂)Yt=Yt-θY_t-12

Nicht saisonale Differenz: (1-B)Y^t=Yt-Yt-1

Der autoregressive Term der Ordnung 1, die saisonale AR(1) und die nicht saisonale Differenz werden multipliziert und dann abgearbeitet.

(1-φ₁B) (1-θB₁₂) (1-B)Y_t = (1-φ1B-θB12+φ1B-θB13)(1-B)Yt = (1-B)Yt - φ1B(1-B)Yt -θB12(1-B)Yt +φ1θB13(1-B)Yt=Yt-Yt-1-φ1(Yt-1-Yt-2)-θ(Yt-12-Yt-13)+φ1θYt-13-Yt-14)

Beachten Sie, dass das Modell sowohl die neueren Datenwerte Yt-1, Yt-2 als auch viel ältere Datenwerte enthält, z. B. Yt-13 und Yt-14.

Komponenten des gleitenden Durchschnitts

Die Seite mit dem gleitenden Durchschnitt der Gleichung lässt sich weitaus leichter konstruieren. Sie beruht auf den Residuen der früheren Perioden im Hinblick auf den Zeitpunkt t, d. h. den Zeitpunkt, für den mit dem Modell eine Vorhersage getroffen werden soll. Für diesen „gleitenden Durchschnitt“ gilt nicht die klassische Definition. Herkömmlicherweise werden zum Erstellen eines gleitenden Durchschnitts der Ordnung 3 die Mittelwerte von 3 aufeinander folgenden Datenpunkten auf einer Karte verfolgt. Wir verwenden jedoch eine vollkommen andere Vorgehensweise.

Der Teil des gleitenden Durchschnitts im Modell lautet:

(1-ψ₁B-ψ₂B²-ψ₃B³)e_t =
e_t-ψ₁e

Die autoregressive Seite der Gleichung und die Seite mit dem gleitenden Durchschnitt werden als gleich definiert, indem auf der rechten Seite der konstante Term addiert wird. Das Ergebnis lautet wie folgt.-ψ_Yt-Yt-1-_φ_{1(Yt-1-Yt-2)-}_φ₁_θ_{(Yt-12-Yt-13)+}_φ₁_θ_{(Yt-13-Yt-14)=}_β_{+ et}_ψ_1et-1-_ψ_2et-2-_ψ_3et-32e_t-2-ψ₃e_t-3

Y_t-Y_t-1-φ₁(Y_t-1-Y_t-2)-φ₁θ(Y_t-12-Y_t-13)+φ₁θ(Y_t-13-Y_t-14)=β+ e_tψ₁e

Wenn Yt auf der linken Seite der Gleichung und alle anderen Terme auf der rechten Seite angeordnet werden, lautet das Ergebnis, ausgedrückt als prognostizierter Wert zum Zeitpunkt t, wie folgt:-ψ₂e_Yt=_β_{+Yt-1 +}_φ_{1(Yt-1-Yt-2) +}_θ_{(Yt-12-Yt-13) +}_φ₁_θ_{(Yt-13-Yt-14)-}_ψ_1et-1-_ψ_2et-2-_ψ_{3et-3+ et}-ψ₃e_t-3

Wenn Y_t auf der linken Seite der Gleichung und alle anderen Terme auf der rechten Seite angeordnet werden, lautet das Ergebnis, ausgedrückt als prognostizierter Wert zum Zeitpunkt t, wie folgt:

Y_t= β+Y_t-1 +φ₁(Y_t-1-Y_t-2) +θ(Y_t-12-Y_t-13) +φ₁θ(Y_t-13-Y_t-14)-ψ₁e_t-1-ψ_{Wir können den prognostizierten Wert zum Zeitpunkt t wie im klassischen Regressionsmodell ableiten. Das bedeutet, wenn Yt= Modell + et, dann Y-Dacht = Modell Daher ist Y-Dacht =}_β_{+Yt-1 +}_φ_{1(Yt-1-Yt-2) +}_θ_{(Yt-12-Yt-13)-}_φ₁_θ_{(Yt-13-Yt-14)-}_ψ_1et-1-_ψ_2et-2-_ψ_3et-3e_t-2-ψ₃e_t-3+ e_t

Wir können den prognostizierten Wert zum Zeitpunkt t wie im klassischen Regressionsmodell ableiten. Das bedeutet, wenn Y_t= Modell+ e_t, then Yhat_t = Modell Daher ist Y-Dach_t = β+Y_t-1 +φ₁(Y_t-1-Y_t-2) +θ(Y_t-12-Y_t-13)-φ₁θ(Y_t-13-Y_t-14)-ψ₁e_{Y-Dacht = 0,00066 + Yt-1 + 0,4139(Yt-1-Yt-2) + 0,9817(Yt-12-Yt-13) – 0,4139*0,9817(Yt-13-Yt-14) – (-0,1549)*et-1 - 0,1507*et-2 - 0,8431*et-3}-ψ₂e_t-2-ψ₃e_t-3

Y-Dach_t = 0.00066 + Y_t-1 + 0.4139(Y_t-1-Y_t-2) + 0.9817(Y_t-12-Y_t-13) – 0.4139*0.9817(Y_t-13-Y_{Der prognostizierte Wert in der 16. Periode wird wie folgt ausgedrückt:}) – (-0.1549)*e_{Y-Dach16 = 0,00066 + Y15 + 0,4139(Y15 – Y14) + 0,9817(Y4 – Y3) – 0,4139*0,9817(Y3 – Y2) – (-0,1549)*e15 - 0,1507*e14 - 0,8431*e13} - 0.1507*e_t-2 - 0.8431*e_t-3

Der prognostizierte Wert in der 16. Periode wird wie folgt ausgedrückt:

Y-Dach₁₆ = 0.00066 + Y₁₅ + 0.4139(Y₁₅ – Y₁₄) + 0.9817(Y₄ – _Y3) – 0.4139*0.9817(Y_{Lassen Sie uns jetzt veranschaulichen, wie diese Gleichung verwendet werden kann.} – Y_{Die folgende Tabelle enthält die ursprünglichen Daten für die Perioden t=-4 bis t=+11. Dabei ist t=1 die erste Periode, für die Daten vorliegen. Die ursprünglichen Daten für die Perioden t=1 bis t=11 befinden sich in den Zellen B8 bis B17.}) – (-0.1549)*e₁₅ - 0.1507*e₁₄ - 0.8431*e_{Der erste Schritt der Analyse erfolgt in Minitab im Hintergrund, wenn zum Anpassen des ARIMA-Modells Y0, Y-1,Y-2usw. berechnet wird. Dabei werden im Grunde prognostizierte Datenwerte vor t=1 erzeugt.}

Lassen Sie uns jetzt veranschaulichen, wie diese Gleichung verwendet werden kann.

Die folgende Tabelle enthält die ursprünglichen Daten für die Perioden t=-4 bis t=+11. Dabei ist t=1 die erste Periode, für die Daten vorliegen. Die ursprünglichen Daten für die Perioden t=1 bis t=11 befinden sich in den Zellen B8 bis B17.

Der erste Schritt der Analyse erfolgt in Minitab im Hintergrund, wenn zum Anpassen des ARIMA-Modells Y₀, Y_-1,Y_{Die rückwärts gerichtete Prognose für den Zeitpunkt 0 lautet 1,623. Daher ist Y1-Y0=1,623 und folglich ist Y0=59,7-1,6=58,1. Dies entspricht anforderungsgemäß Zelle B6. Der gleiche Prozess lässt sich für Y-1,Y-2usw. anwenden (aufwärts in Spalte B der oben gezeigten Tabelle). Y0-Y-1=-2,121 Y-1=Y0+2,121=58,1+2,1=60,2. Dies entspricht Zelle B5.}

Es scheint nicht sinnvoll zu sein, Y₀ zu berechnen, da dieser Wert vor dem Untersuchungszeitraum liegt. Rückwärts gerichtete Prognosen werden ausgeführt und können im Sessionfenster angezeigt werden:

Die rückwärts gerichtete Prognose für den Zeitpunkt 0 lautet 1,623. Daher ist Y₁-Y₀=1,623 und folglich ist Y₀=59,7-1,6=58,1. Dies entspricht anforderungsgemäß Zelle B6. Der gleiche Prozess lässt sich für Y_-1,Y-2_{usw. anwenden (aufwärts in Spalte B der oben gezeigten Tabelle). Y0-Y-1.}

Die endgültige Gleichung für die 10. Periode lautet:

Y-Dach <_t = 0,00066 + Y_t-1 + 0,4139(Y_t-1 – Y_t-2) + 0,9817(Y_t-12 – Y_t-13) – 0,4139*0.9817(Y_t-13 – Y_{Y-Dach10 = 0,00066 + Y9 + 0,4139(Y9 – Y8) + 0,9817(Y-2 – Y-3) – 0,4139*0,9817(Y-3 – Y-4) – (-0,1549)*e9 - 0,1507*e8 - 0,8431*e7}) – (-0,1549)*e_t-1 - 0,1507*e_t-2 - ,.8431*e_t-3

Y-Dach₁₀ = 0,00066 + Y₉ + 0,4139(Y₉ – Y₈) + 0,9817(Y_-2 – Y_-3) – 0,4139*0,9817(Y_{Y9 ist Zelle B15 in der Tabelle oben = 63,6 Y8 ist Zelle B14 = 61,9 Y-2 ist Zelle B4 = 60,444 Y-3 ist Zelle B3 = 60,535 Y-4 ist Zelle B2 = 58,809 e9 ist Zelle D15 = -0,000376466 e8 ist Zelle D14 = 0,012395082 e7 ist Zelle D13 = 0,039578177} – Y_-4) – (-0.1549)*e₉ - 0.1507*e₈ - 0.8431*e₇

Auf die gleiche Weise lassen sich auf Grundlage dieses Modells die prognostizierten Werte jeder Periode bestimmen.

Schlussfolgerungen

Die meisten Fachleute analysieren Zeitreihen- oder Prozessdaten auf eine eher vereinfachende Weise. Dabei nutzen sie hauptsächlich Verlaufsdiagramme oder einfache Shewhart-Regelkarten, z. B. I/MR-, X-quer/R- oder X-quer/S-Karten.

Jedoch kann Autokorrelation in den Daten die Rate falscher Alarme in die Höhe treiben. Das Modellieren der Daten mit einem differenzierten Verfahren der Zeitreihenmodellierung wie ARIMA kann sinnvoll sein. Bei richtiger Anwendung kann ARIMA eine gute Anpassung an vorhandene Daten und korrekte Prognosen von zukünftigem Verhalten bieten, was in einer von Unwägbarkeiten geprägten Welt wichtig ist. ARIMA-Verfahren sind aber eher komplex und weniger bekannt als einfachere Analysen. Wenn die Grundsätze verstanden wurden, lassen sich mit Minitab jedoch relativ leicht nützliche Zeitreihenmodelle erstellen. Nachdem das ARIMA-Modell erstellt wurde, empfiehlt es sich zudem, die Residuenwerte auszuwerten, um zu bestimmen, ob Ausnahmebedingungen vorhanden sind.

Kontakt zu Minitab >

¹Montgomery, Douglas (2005). Introduction to Statistical Quality Control. John Wiley and Sons, 5th Edition. Page 438.

Mit Minitab Statistical Software erschließen, visualisieren und analysieren Sie Ihre Daten, um selbst die komplexesten Herausforderungen zu lösen und Fehler zu verhindern, noch bevor sie auftreten. Jetzt überall in der Cloud verfügbar.

ARIMA: So erhalten Sie beim Analysieren von Zeitreihendaten die relevanten Informationen

Nachdem auf OKgeklickt wurde, generiert Minitab das folgende Diagramm:

Wie können Sie erkennen, ob Daten autokorreliert sind?

Umgang mit der Autokorrelation in Minitab

Erstellen eines ARIMA-Modells

Was stellt das ARIMA-Modell tatsächlich dar?

Wie ist das ARIMA(1,1,3)(1,0,0)12-Modell konzipiert?

Autoregressive Komponenten

Komponenten des gleitenden Durchschnitts

Schlussfolgerungen

Eventuell gefällt Ihnen auch