2010年代終わりに、私は世界的な大手家電メーカーで、Six Sigmaマスターブラックベルトとして働き、品質改善プロジェクトを率いていました。 問題を解決するためのSix Sigmaブラックベルトの新人を教えることで、毎年約3,000万ドルを貯蓄することができ、成功を収めました。当時、予測分析ツールを組み合わせることに消極的だったことをはっきりと覚えています。 こんな大切なことに気づいていなかったとは!
当時、ブラックベルトは、データに基づいて計画された実験を通じて問題に取り組むように教えられていました。例えば、洗濯機の1台の新しい欠陥に対するサービスチケットが山積みになり始めたときに、問題を正確に測定し、問題に関する変動を理解し、実験計画法(DOE)を使用して理論の原因と結果および予測されるソリューションを学習できることを確認しました。 製造業の新時代(インダストリー4.0と呼ばれることもあります)で、利用可能なデータが増え続けており、経営幹部は回答がどんどん迅速になることを期待していました。
私たちの問題解決者コミュニティには、問題に優先順位を付けるための確立された方法がありました。 サービスインシデント率(SIR)レポートを待ち、どの問題が最も頻繁に発生するかを確認することが多くありました。残念ながら、SIRは遅い指標で、お客様の家で問題が発生してから半年経過することもよくありました。私たちのジレンマは明らかでした。問題をもっと早く解決しなければなりません。
問題が表面化するのに必要な時間だけではなく、スモールデータからビッグデータへの移行にも困難がありました。 ブラックベルトでは、大量のデータを実験計画法(DOE)のため削減していましたし、それが通例でした! これがマスターブラックベルトから教わった方法だと思っていたのです。
製造分野の主幹エンジニア、マスターブラックベルトなどの技術リーダーは、新語「ビッグデータ」の概念のためツールを採用し始めました。 ビッグデータを使用すれば、現場の故障を工場データにリンクさせて、保証コストなどを予測、軽減し、品質を改善できるという期待がありました。 このデータを何年も何十年も持っていたのに、すべてをまとめることはなかったので、新しい概念でした。
サービスインシデントに取り組んでいるサービス技術者は、お客様の家で壊れた機器のテストデータとシリアル番号を集めました。でも、開発データも製造データも現場サービスデータと明確にリンクされていませんでした。
問題の一因は、データストレージ手法が異なることでした。 膨大なデータソースを処理する方法を知りませんでしたし、これらを組み合わせる方法を学ぶ予算もないのが通例でした。 仮に組み合わせることができても、すべてから洞察を得る一般的な方法はありませんでした。
ようやく、私たちは数百万ドルを投資して、コンサルタントから、膨大なデータソースを集めて分析の準備をすることを手伝ってもらいました。「データレイクを掘る」のは簡単な作業ではありません。 データレイクはビッグデータ界の用語ですが、膨大なデータソースをまとめた経緯を説明するために使っています。さて、シリアル番号別の現場の故障を同じシリアル番号の製造データにリンクさせられる、より大きなデータセットができました。 故障が発生した機器の共通点に関する洞察を得ることができるようになったのです。
洞察を得る難しさは、このブログを読んでもなかなか伝わらないでしょう。 製造で収集されたテストメトリックはたくさんあります。 変動はほとんどなく、このすべての予測変数の間には多重共線性がたくさんあります。 y=バルブ故障を数百の予測xと適合させてみても、データは乱雑になり、回帰分析でわかることはあまりありません。 R二乗は低すぎます。 これらの古いモデル化技法はあまり信頼できませんでした。
コンサルタントから、予測分析を始めることをすすめられました。 これは乱雑なデータの処理に優れていました! パイロット工場で兆候を見つけ、改善を行って、新しい方法をテストしました。こうして、洞察を得るためにデータを集計して準備する方法ができあがりました。
このデータウェアハウスとコンサルティングへの投資から大きな利益を得るために、バイスプレジデントが関わりました。というのも、当時、新しいコンサルタントから多くの洞察を得る手伝いをしてもらったものの、コンサルタントは技術者ではなかったため、予測分析での発見事項にあまりピンときていなかったのです。 家電がどう動くのか知りませんでした。 どのデータサイエンティストも知っていたことは、複数の最終工程検査メトリックが失敗を予測するということです。
高額なプロセスが2年過ぎて、私の会社は、コンサルタントから十分に学び、分析を引き継ぐことができたと判断しました。 具体的には、品質バイスプレジデントとリードマスターブラックベルトの「スカンクワークス」チームと、パイロット工場のエンジニア数人が、コンサルタントの発見事項を再現できるようになったのです。
私たちの小さなチームは予測分析が得意になりました。 でも、この予測分析方法論を全社的に拡大することは非常に困難でした。 予測分析を使用するのは難しかったため、少数の人しか克服できなかったのです。 会社の残りの人は、この一連の話すら知らなかったのです。それで、多くの人を教育などできるでしょうか?リードマスターブラックベルトが洞察を集め、問題を解決するためのリソースを備えたエンジニアリングチームのみを教えることが決まりました。 これはすごく効率的というわけではありませんでした。 当時、社内で予測分析の専門知識を磨き上げ、専門家を育てるのは難しすぎました。
分類木と回帰木、Random Forests®、TreeNetなどの予測分析ツールのオプションと出力を見てください。 大きなデータセットを開いて、[分析]をクリックするだけではないのです。 たくさんのスキルが必要です。 データサイエンスが難しいのは、そのためです!
2010年代終わりから2020年代初めにかけて、予測分析を利用する製品と、古い方法の利用を続ける製品を分離しました。 予測分析により、保証予測、素早い品質改善、故障防止が可能になりました。 より古い方法を使用している製品では、サービスインシデント率レポートを取得するのに6か月待ち、最も頻繁に発生する問題を解決するのにSix Sigmaツールを使用していました。
今日の予測分析は、私が10年以上前に初めて使用したときよりもはるかに進んでいます。以前のような複雑で特殊なタスクではありません。Minitabの予測分析と自動機械学習で一般的な予測分析へのアクセスが可能になっています。 データから最適なモデルが提案され、シンプルなユーザーインターフェイスで代替モデルをリクエストできます。
データを集計および準備するMinitab ConnectとMinitab予測分析および自動機械学習を組み合わせて、洞察を得て生活を楽にし、結果を素早く得て向上させる方法を見てください。Minitabの製品をこのように製造で使用すると、品質改善と保証予測が実質的にリアルタイムで可能になります。 これらのツールが出る前は、品質改善には半年以上かかり、保証予測は、今年のデータではなく、前年のデータに基づいていました。 これらは、お客様や利害関係者にとって、数百万ドルの価値があります。