Als ich noch im technischen Support von Minitab gearbeitet habe, wurde ich oft von Kunden gefragt, was der Unterschied zwischen Cpk und Ppk ist. Das ist eine gute Frage, vor allem, weil in der Praxis häufig direkt mit Cpk gearbeitet wird, ohne Ppk überhaupt in Betracht zu ziehen. Es ist wie beim 80er-Jahre-Popduo Wham! – Cpk ist George Michael und Ppk ist der andere Sänger.
Doch wir sollten uns jetzt nicht mit voluminösen Frisuren, Schulterpolstern und Stulpen befassen, sondern erst einmal rationale Teilgruppen definieren und dann die Unterschiede zwischen Cpk und Ppk genauer betrachten.
Eine rationale Teilgruppe ist eine Gruppe von Messwerten, die unter denselben Bedingungen erfasst wurden. Teilgruppen sollen eine zufällige Momentaufnahme eines Prozesses darstellen. Die Messwerte, aus denen eine Teilgruppe besteht, sollten daher zu einem ähnlichen Zeitpunkt erfasst werden. Wenn Sie z. B. pro Stunde 5 Stichproben ziehen, beträgt die Teilgruppengröße 5.
Mit einer Prozessfähigkeitsanalyse soll sichergestellt werden, dass ein Prozess die Kundenspezifikationen erfüllen kann. Dies wird mit Prozessfähigkeitsstatistiken wie Cpk und Ppk ausgewertet. Wenn wir die Formeln für Cpk und Ppk bei der Prozessfähigkeit für normalverteilte Daten betrachten, sehen wir, dass sie fast identisch sind:
Der einzige Unterschied ist der Nenner für die Statistiken für die Ober- und Untergrenze: Cpk wird mit der Standardabweichung INNERHALB berechnet, während für Ppk die GESAMT-Standardabweichung verwendet wird. Damit ich Sie jetzt nicht mit den Details zu den Formeln für die Standardabweichungen langweilen muss, stellen Sie sich die Standardabweichung (innerhalb) als den Durchschnitt der Standardabweichungen der Teilgruppen vor. Die Gesamtstandardabweichung stellt dagegen die Streuung aller Daten dar. Dies bedeutet Folgendes:
Betrachten wir zur Veranschaulichung einen Datensatz, bei dem 10 Tage lang täglich 5 Messwerte erfasst wurden.
Wie die Grafik links zeigt, gibt es wenig Shift und Drift zwischen den Teilgruppen im Vergleich zur Streuung innerhalb der Teilgruppen selbst. Die Standardabweichung (innerhalb) und die Gesamtstandardabweichung sind daher ähnlich, weshalb auch Cpk und Ppk ähnlich sind (1,13 bzw. 1,07).
In diesem Beispiel arbeite ich mit denselben Daten und derselben Teilgruppengröße, habe die Daten aber etwas gemischt und in andere Teilgruppen aufgeteilt. (In der Praxis würde man das natürlich niemals tun – ich möchte hier aber etwas Bestimmtes zeigen.)
Weil wir dieselben Daten verwendet haben, sind die Gesamtstandardabweichung und Ppk gleich geblieben. Doch das war es auch schon mit den Ähnlichkeiten.
Sehen Sie sich den Wert von Cpk an. Er liegt bei 3,69, d. h., er ist deutlich besser als der vorherige Wert von 1,13. Betrachten Sie das Teilgruppendiagramm. Können Sie sehen, warum der Cpk-Wert höher ist? Die Grafik zeigt, dass die Punkte innerhalb der einzelnen Teilgruppen deutlich näher beieinander liegen als zuvor. Ich habe vorhin gesagt, dass wir die Standardabweichung (innerhalb) als den Durchschnitt der Standardabweichungen der Teilgruppen betrachten können. Eine geringere Streuung innerhalb der Teilgruppen bedeutet also eine kleinere Standardabweichung (innerhalb). Und das führt zu einem höheren Wert von Cpk.
Darin liegt die Gefahr, wenn Sie nur von Cpk sprechen und Ppk wie den weniger bekannten Duopartner von George Michael behandeln (nichts für ungut, Mr. Namenlos). Wie wir anhand der Beispiele oben sehen konnten, stellt Cpk nur einen Teil der Wahrheit dar. Wenn Sie also das nächste Mal die Prozessfähigkeit untersuchen, denken Sie sowohl an Cpk als auch an Ppk. Und wenn der Prozess stabil ist und über die Zeit wenig Streuung aufweist, sollten die beiden Werte sowieso ungefähr gleich sein.
(Hinweis: Es ist möglich – und auch kein Problem –, dass Ppk größer als Cpk ist, insbesondere bei einer Teilgruppengröße von 1. Die Erklärung dafür hebe ich mir aber für einen anderen Artikel auf.)