Wenn Sie kein Programmierer sind, lässt Sie vielleicht schon der bloße Gedanke daran, prädiktive Analysen zum Ermitteln von Fehlerursachen in einem Prozess zu verwenden, den Mut verlieren.
Wir möchten Ihnen zeigen, dass das nicht der Fall sein muss! Das ist unser zweiter Blog-Artikel zu einfacheren Methoden, Programmiersprachen zu verwenden, unterstützt durch die R- und Python-Integrationen in Minitab. Hier können Sie das erste Beispiel zum Erstellen von Python-basierten Visualisierungen nachlesen.
In diesem Blog-Artikel erläutern wir, wie Sie in Minitab mit R ein neuronales Netz erstellen, um die Ergebnisse aus unserem eigenen Modul „Prädiktive Analysen“ zu ergänzen und zu vergleichen.
WAS IST R?
R ist eine Open-Source-Programmiersprache, die sich für verschiedene datenbezogene Aufgaben wie Datentransformation, -modellierung und -visualisierung einsetzen lässt. R umfasst einen Katalog von Bibliotheken für die Datenanalyse und Statistik sowie Algorithmen für das maschinelle Lernen. Jedoch muss der Benutzer dafür die Syntax erlernen.
WARUM IST R IN MINITAB INTEGRIERT WORDEN?
Die Minitab Statistical Software ist das bevorzugte Werkzeug für Experten, um Fehler zu reduzieren. Die Software bietet sowohl statistische, als auch prädiktive Analysen in einer benutzerfreundlichen Oberfläche.
Durch die Integration in die Minitab Statistical Software können Sie äußerst leistungsstarke R-Skripts nutzen. Dies vereinfacht das ansonsten möglicherweise schwierige Verfahren für die Bereitstellung für Nicht-R-Programmierer. Unsere Integration ermöglicht mehr Anwendern die Nutzung von R-Skripts und vergrößert damit die Vorteile, die sie erzielen können.
Die Desktop-Anwendung der Minitab Statistical Software bietet ein spezielles Paket für die R-Integration mit dem Namen mtbr. Weitere Informationen erhalten Sie unter https://support.minitab.com/de-de/minitab/21/integration/.
Mit der Programmiersprache R neuronale Netze in Minitab erstellen
Das Szenario:
Susan ist Qualitätsingenieurin bei einem Teilehersteller. Kürzlich sind bei einem der Produkte Qualitätsprobleme aufgetreten. Aufgrund vieler mangelhaften Chargen sind die Kosten und Bestellrückstände gestiegen.
Die Herausforderung:
Susan muss herausfinden, wie die Fehlerrate für den Prozess reduziert werden kann. Glücklicherweise verfügt sie über Daten zu den Produktionsparametern und ob jede Charge gut oder schlecht war.
Susan möchte die prädiktive Analyse nutzen, um folgende Aspekte zu untersuchen:
- Welche Produktionsparameter beeinflussen die Chance, dass eine Charge schlecht ist?
- Auf welcher Stufe müssen diese Parameter gehalten werden, um die Chance einer schlechten Charge zu minimieren?
Sie möchte verschiedene Modelle der prädiktiven Analyse ausprobieren, um das Modell zu ermitteln, das sich am besten für ihre Daten eignet.
Erfreulicherweise hat Susan die Wahl zwischen Regressionsmodellen und CART® in der Minitab Statistical Software sowie den Random Forests®- und TreeNet®-Modellen im Add-On „Prädiktive Analysen“.
DIE ÜBERRASCHUNG
Einen Moment, Susan! Ihr Vorgesetzter hat etwas von neuronalen Netzen gehört und möchte diese ausprobieren. Sie sind zwar nicht in Minitab enthalten, können aber in R erstellt werden.
Da Susan keine erfahrene R-Anwenderin ist, kann sie das R-Skript über die R-Integration in Minitab ausführen. Daraus ergeben sich verschiedene Vorteile.
Die R-Integration in Minitab vereinfacht den gesamten Prozess für sie, da alle Daten und Ausgaben in Minitab verbleiben.
Susan muss ihre Analysen nicht auf zwei unterschiedliche Programme aufteilen, sondern kann alles in Minitab erledigen und die Leistung und Ergebnisse der verschiedenen Modelle leicht vergleichen.
Davon ausgehend kann Susan ganz einfach eine Präsentation für ihren Vorgesetzten zusammenstellen, indem sie alle Minitab-Ausgaben (Tabellen, Grafiken, usw.) in eine PowerPoint-Präsentation exportiert.
Tutorial: Analyse durchführen
Wie führt Susan also ihre Analyse mit den prädiktiven Analysen und der R-Integration in Minitab durch?
Zuerst lädt sie die Daten in Minitab. Ihr Unternehmen nutzt Minitab Connect, um die Produktionsdaten aus verschiedenen Datenquellen automatisch zu erfassen. Sie kann diese Daten also ganz einfach in Minitab laden.
Nachdem die Daten in Minitab geladen wurden, kann sie loslegen! Lassen Sie uns zunächst die Daten anschauen.
Die Daten in den Spalten C1 bis C8 sollen verwendet werden, um zu ermitteln, ob eine Charge schlecht ist (Spalte „Fehler“ = 1). Sie möchte die Modelle verwenden, die in Minitab verfügbar sind.
Dazu wählt Sie Automatisiertes maschinelles Lernen in Minitab® aus. Damit werden alle Minitab-Modelle auf den Datensatz angewendet und anschließend kann das Modell mit der besten Leistung ausgewählt werden. So lässt sich viel Zeit sparen.
Die besten in Minitab verfügbaren Modelle sind die Random Forests- und TreeNet-Modelle. Das TreeNet-Modell hat die beste Fehlklassifikationsquote von 0,8 % (0,008). Dies bedeutet, dass lediglich 0,8 % der Prognosen, ob eine Charge gut oder schlecht ist, falsch sind. Susan wählt das TreeNet-Modell aus, da es nützlichere und aussagekräftigere Ausgaben als das Random Forests-Modell bietet.
Als Nächstes soll ein neuronales Netz in R angepasst werden. Dazu soll die R-Integration in Minitab zur Anwendung kommen. Hier ist ein Beispiel für das Skript.
Als Teil der Ausgabe können wir das neuronale Netz visualisieren.
Die Eingabeschicht links (erste Reihe von Knoten) erhält Informationen aus jeder der acht Eingabevariablen. Über jeder Linie befinden sich die synaptischen Gewichtungen. Diese beeinflussen die nächste Schicht des Netzes. Es gibt eine verborgene Schicht aus zwei Neuronen und die blauen Kreise stellen den Bias dar, welcher der Konstante in regulären Regressionsmodellen entspricht. Die wahre Magie versteckt sich in der verborgenen Schicht! Das Ausgabeneuron rechts entspricht der Variablen „Fehler“.
Das Skript wird als R-Skript (.R) gespeichert. Um es aus Minitab auszuführen, verwenden wir den Befehl RSCRIPT gefolgt vom Namen des Skripts in Anführungszeichen.
Das Modell weist eine Fehlklassifikationsquote von 7 % auf und ist damit nicht so genau wie das TreeNet-Modell. Daher entscheidet sich Susan, das TreeNet-Modell zu verwenden.
Als Nächstes verwendet sie die TreeNet-Ausgabe, um zu ermitteln, welche Parameter am meisten dazu beitragen, dass eine Charge schlecht ausfällt. Einer der Vorteile der Minitab-Modelle ist der Umfang der standardmäßig ausgegebenen zusätzlichen Informationen (wie die Grafiken unten), die ein Verständnis des Modells vereinfachen.
O2, Produktionsrate, Kaustikum und MgSO4 scheinen die Fehlerrate stark zu beeinflussen. Um eine Verbesserung zu erzielen, muss Susan verstehen, welche Auswirkungen diese Parameter haben. Dabei kann die TreeNet-Ausgabe helfen.
Auf welcher Stufe müssen diese Parameter also gehalten werden, um die Chance einer schlechten Charge zu minimieren?
Höhere Werte in der Grafik bedeuten eine geringere Chance einer schlechten Charge. Diese Grafiken zeigen Folgendes:
- O2 sollte bei 20,5 bis 22 % gehalten werden
- Eine niedrigere Produktionsrate führt zu einer niedrigeren Fehlerrate
- Kaustikum sollte bei 60 bis 70 % gehalten werden
- MgSO4-Werte über 6 % führen zu einer geringeren Chance einer schlechten Charge
Susan führt auf dieser Grundlage Kontrollpläne für jeden der einflussreichen Parameter ein, um sie jeweils in dem Bereich zu halten, in dem die Chancen für eine schlechte Charge gering sind.
Die Fehlerrate wurde reduziert, alle sind glücklich, und Susan wird befördert 🤩👌
Möchten Sie diese Analyse selbst ausprobieren?
Sie können den Datensatz und das R-Skript hier herunterladen.
Dieser Link führt Sie zu den Supportseiten zu der R-Integration in Minitab.
Und hier finden Sie ein Video, dass Sie durch die Installationsschritte, das Testen von R in Minitab und das Ausführen des R-Skripts für neuronale Netze in Minitab führt.