先月、私の大好きなブランド、ディズニーとマクドナルドが楽しいプロモーションのために提携しました。Disney Corporationの100周年を記念して、マクドナルドはディズニー100ハッピーミールキャンペーンします。 ハッピーミールのボックスには、それぞれクラシックなディズニー、ピクサー、マーベル、スター・ウォーズなど、ディズニーのお気に入りの小さなプラスチックのフィギュアが2体入っています。巷の噂ではフィギュアは全部で62体、大注目のアイテムということです。是非手に入れなければなりません。統計の専門家として、私はデータを集め、データ分析をして、すべてのフィギュアを手にできる確率を計算します。
しかし、すべてお教えしましょう。データ主導型の問題解決に関する確かな知識を持っているにもかかわらず、私はデータ収集プロセスでいくつかの間違いを犯しました。そこで得た教訓をいくつか共有したいと思います。
教訓1:データ収集計画を立てる
私はこのプロジェクトに興奮していたので、事前調査、プロジェクト計画、戦略立案を行う前にデータの収集を始めました。これらのおもちゃは期間限定でしか入手できないことを考えると、これは間違いでした。実際、残りの短い時間で62体のフィギュアをすべて集めるという目標を達成する上で、事前の計画が不十分であることはおそらく最大の問題でしょう。
とはいえ、最初のデータポイントは成功しました。Minitabワークシートの1行目では、誰もが欲しがるミッキーマウスとキャプテン・マーベルの組み合わせを手に入れることで大成功したことがわかります。
フィギュアがかわいかったので、追い続ける価値があると判断しました。しかし、地元のマクドナルドはおもちゃだけの販売はしません。ハッピーミールでしか手に入らないので、チキン・マックナゲットが大好きな私でも、食べられる量には限りがあります。最低限の回数、つまりレストランに通う回数で必要な結果を得る方法をもっと考えるべきでした。
教訓2:潜在的な障害物についてブレーンストーミングする
翌日、私はMinitabワークシートの2行目を収集するためにお気に入りのマクドナルド店に戻りました。
大失敗でした!ミッキーマウスとキャプテン・マーベルのコンボはすでに持っています。バイナリ結果の変数があることに気付きました。レストランに通うたびに、まだ持っていないフィギュアを2体手に入れた場合は成功、そうでない場合は失敗になります。
私は失敗から学ぼうとしていますが、これは私がすでに知っていたことを思い出させてくれました。
どのような結果が得られるか、データ収集時にどのような問題が発生する可能性があるか、またこれらの問題にどのように対処するかについてブレインストーミングをせずに、決してデータの収集を始めてはいけません。Minitab Workspaceには、このための優れたブレーンストーミングツールがあります。
また、たくさんの質問をしてください。
2番目のデータポイントは、実際これらの質問をするきっかけになりました。
- 組み合わせはいつも同じか?例えば、ミッキーは常にキャプテン・マーベルとペアか? この質問の答えは「はい」であることがわかりました。これは、62文字のすべてを得るには31通りの箱が必要になるだけであることを意味するため、重要な情報です。
- 配布方法はどうなっているのか? 各マクドナルドにはこれらのフィギュアが入った箱がランダムで配られ、受け取った各箱には31通りのキャラクターの組み合わせのうち1つだけが含まれていることがわかりました。レストランはまた、1つの箱の在庫を使い切ってから、次の箱のキャラクターを配り始めます。これにより、行2が重複していた理由が説明されます。このレストランでは、まだミッキー/キャプテン・マーベルのペアのすべてを使い切っていなかったのです。
教訓3:結果に影響を与える可能性のあるすべての要因を考慮する
データの3番目行3に対する私の戦略は、まだ持っていないキャラクターの組み合わせを入手する可能性を高めるために、別のレストランの場所を選ぶことでした。そのため、3日目は南ではなく北へ向かいます。
フィギュアが手に入らなかったので、新たな疑問が生じました。
- レストランBでおもちゃがなくなったのは、私が遅すぎたからか? (その日は遅い時間にランチに出かけました。)
- サプライチェーンに混乱をもたらすことがあるのでしょうか?
- それとも何か他のことが作用しているのでしょうか?
重要な要素、つまり時間帯を見逃していたかもしれないことに気づきました。
教訓4:注意深く設計された実験は、長い目で見れば時間と回数の節約になる
時間の影響を知るために、数時間早くしてレストランBをもう一度試してみることにしました。また、レストラン通いの回数が増えるとしても、レストランAに戻りたいとも思いました。これにより、これら2つの店舗がどのくらいの速さで在庫を使い切っているかについて、もう少し詳しい情報が得られかもしれないためです。(直接聞いてみましたが、教えてもらえませんでした。)
で、4行目と5行目があります。
レストランBはまた失敗でしが、幸いにもその後で成功しました!
私は自分の行き当たりばったりの方法から学びましたが、5つの行のデータ内のレストラン因子については限られた情報しか得ていませんでした。また、私は昼食時にしかデータを収集していないため、時間帯の影響があるかどうかはまだわかりません。この組み合わせに夕食を追加する必要性について考えるにつれ、これには、replicated 2-factor, 4-run designed experiment(2因子4回実験の反復計画実験)を利用した方がよいことに気づきました。もし私がこれを行っていたら、Minitabはランダム化された実験計画法の形でデータ収集戦略を立ててくれたことでしょう。
しかし、この時点ですでにレストラン通いを5回行っており、軌道修正する必要があります。
- 場所の影響があるようですが、どちらの訪問でもおもちゃがなかったので、1つの場所では有益な結果が得られません。少なくとももう1軒レストランを組み合わせに加える必要があります。(おもちゃの配布方法を考えると、レストランを増やせばもっと良いでしょうが、余分な時間とお金をかける価値はないかもしれません。)
- レストランでその日の後半に在庫がなくなる可能性がある場合、夕食時のデータを集めることでこの仮説を検証できるでしょうか? 重複の可能性を考慮すると、同じ場所への訪問を分散する必要があるのでしょうか?
- 31個の可能なフィギュアの組み合わせのうち2個を得るのに、4日と5回の訪問が必要でした。このプロモーションが今週で終了することを考えると、もっと多くのハッピーミールを食べるようにするか、友人に協力を求める必要があります。(できれば、私とは別のマクドナルドの近くに住んでいる友人が望ましいです。)
結論
私のデータは現在、成功が4回、失敗が3回となっています。データ収集を1日2回にして、新しいレストランを追加して大成功を収めました。
データ駆動型の問題解決には、必ずしも複雑な統計ツールを使う必要はありません。そして、データの最初の行を収集する前に、一歩下がって計画を立てたほうがよいです。ただし、収集されたデータが不完全であっても、まったくデータがないよりはましでしょう。
同じものがあって分けてもいいハッピーミールのおもちゃをお持ちなら、教えてください。