Merkmalskonstruktion (Feature Engineering) für das maschinelle Lernen einfach erklärt

Andrea Grgic | 23 June, 2021

Themen: Machine Learning, Minitab Statistical Software, Praediktiven Analysen, Merkmalskonstruktion, Feature Engineering

Stellen Sie sich vor, dass Sie etwas in einem Online-Shop bestellen und Ihnen ein Produkt empfohlen wird, das perfekt zu diesem bestellten Artikel passt. Sie legen diesen Artikel in den Einkaufswagen und freuen sich darüber, dass der Shop ausgehend von Ihrem Verhalten im Web genau die Artikel vorschlagen konnte, die Sie gut gebrauchen können. Oder wie sieht es mit dem traurigen Umstand aus, dass Sie gerade die letzte Folge Ihrer absoluten Lieblingsserie auf Netflix geschaut haben – und dann erhalten Sie auf der Basis der soeben beendeten Sendung und den Genres, die Sie normalerweise auf der Plattform genießen, großartige Vorschläge für Sendungen, die Ihnen vielleicht gefallen könnten? Beide Beispiele veranschaulichen die Leistungsfähigkeit der prädiktiven Analyse, bei der Unternehmen aktuelle und historische Kundendaten analysieren, um Prognosen aufzustellen. Möglicherweise ist es nicht ganz so offensichtlich, aber diese beiden Beispiele zeigen außerdem, wie wichtig es ist, saubere und sorgfältig ausgewählte Daten als Grundlage für Ihre Analysen zu nutzen. Ist es möglich, ein prädiktives Modell noch leistungsfähiger zu machen? Ja, mit der Merkmalskonstruktion (Feature Engineering).

Auch wenn die Merkmalskonstruktion in der Welt der Datenanalytik erst kürzlich wieder zu einem hochaktuellen Thema wurde, ist dies kein neues Konzept, da es sich hierbei um eine wesentliche Vorarbeit für den Erfolg bei maschinellem Lernen (Machine Learning) und prädiktiven Analysen. Wenn Sie mehr über die Merkmalskonstruktion lesen, werden Sie diese Vorstellung möglicherweise auch in den fundamentalen Datenprozessen wiedererkennen, die als Datenbearbeitung, -vorbereitung   oder -normalisierung bezeichnet werden.

In diesem Blog-Artikel gehen wir auf die Grundlagen und Bedeutung der Merkmalskonstruktion ein und erläutern, wie Sie einige der gängigsten Techniken für die Merkmalskonstruktion in der Minitab Statistical Software erfolgreich für Ihr Unternehmen einsetzen können.


WAS IST DIE MERKMALSKONSTRUKTION (FEATURE ENGINEERING)?

Wenn Sie Ihre Daten optimal ausnutzen und das am besten angepasste prädiktive Modell erhalten möchten, besteht der erste wesentliche Schritt in der Merkmalskonstruktion. Die Merkmalskonstruktion ist die Phase, bei der auf der Grundlage von Kenntnissen des Prozesses und der resultierenden Daten die Eigenschaften bzw. Merkmale extrahiert werden, die für prädiktive Modelle benötigt werden. Merkmale werden meist in Form von strukturierten Spalten (auch als Attribute bezeichnet) bereitgestellt; zur Bearbeitung können Merkmale aufgeteilt, Merkmale kombiniert oder neue Merkmale erstellt (neu kodiert) werden. Saubere und hochwertige Daten sind wesentlich für die korrekte Merkmalskonstruktion sowie die Leistungsfähigkeit und Genauigkeit des Modells – nur so erhalten Sie die bestmöglichen Ergebnisse aus Ihrem prädiktiven Modell.

FeatureEngineering-blog_DE

WARUM IST DIE MERKMALSKONSTRUKTION WICHTIG?

Die Merkmalskonstruktion (Feature Engineering) ist ein wichtiger Schritt bei der Untersuchung und Vorbereitung von Daten.

Dies sind die Vorteile der Merkmalskonstruktion:
        1. Diese Phase hilft Ihnen dabei, die Daten genau zu strukturieren und sicherzustellen, dass der Datensatz zu dem Algorithmus für das maschinelle Lernen passt.
        2. Die Leistung und Genauigkeit des durch das maschinelle Lernen erstellten Modells werden gesteigert.
        3. Sie erhalten ein tieferes Verständnis Ihrer Daten, was zu weiteren Einblicken führt.

Beispiel für die Merkmalskonstruktion bei kategorialen Daten in der Minitab Statistical Software
Merkmalskonstruktion-FeatureEngineering

WAS SIND DIE BESTEN TECHNIKEN FÜR DIE MERKMALSKONSTRUKTION (Feature Engineering)? 

Wählen Sie die Techniken anhand der Bedürfnisse Ihres Unternehmens aus. So profitieren Sie am meisten von Ihren Daten. Marilyn Wheatley, Minitab Solutions Architect bei uns im Haus, stellt die sieben Techniken für die Merkmalskonstruktion in der Minitab Statistical Software vor, die Sie noch heute einsetzen können. In dem White Paper führt Marilyn uns durch die Verfahren für die Techniken und erklärt, wie diese in der Minitab Statistical Software genutzt werden.

Wir bei Minitab helfen Experten wie Prozessspezialisten, Datenwissenschaftlern und Wirtschaftsanalytikern, Prozesswissen zu nutzen, um datengestützte Lösungen für die komplexesten geschäftlichen Herausforderungen zu finden.

Möchten Sie die sieben Techniken für die Merkmalskonstruktion meistern?

Whitepaper herunterladen