这个月,我最喜欢的两个品牌迪士尼和麦当劳合作推出了有趣的促销活动。为庆祝迪士尼公司成立 100 周年,麦当劳推出迪士尼 100 周年开心乐园餐! 每个开心乐园餐盒都包含两个迪士尼最火的小塑料玩偶,包括经典的迪士尼、皮克斯、漫威和星球大战。坊间传言,总共有 62 个小雕像,它们是抢手货。我必须拥有它们,作为一名统计师,我将收集数据并使用数据分析来计算我可以得到全部玩偶的概率!
但说白了……尽管我对数据驱动问题解决有扎实的了解,但我在数据收集过程中犯了一些错误,我想分享一些经验教训。
经验教训 1: 制定数据收集计划
我对这个项目非常兴奋,因此在进行任何初步研究、项目规划或制定战略之前我就开始收集数据。鉴于这些玩具的供应时间有限,这是一个错误。事实上,没有足够的预先计划可能是我在短时间内集齐全部 62 个雕像的目标的最大障碍。
也就是说,我的第一个数据点是成功的。在我的 Minitab 工作表的第 1 行中,你会看到我获得令人垂涎的米老鼠和惊奇队长组合,成绩不错:
雕像很可爱,所以我认为值得继续我的追求。但我当地的麦当劳不只卖玩具。你只能在开心乐园餐里获得,尽管我很喜欢他们的麦乐鸡,但我也只能吃这么多。我真的应该多想想如何在最少的次数(或者说是最少的餐厅次数)下得到我想要的结果。
经验教训 2: 头脑风暴潜在障碍
第二天,我回到我最喜欢的麦当劳店,收集我的 Minitab 工作表的第 2 行数据,然后……
史诗级失败!我已经有了米老鼠/惊奇队长组合。我现在意识到我有一个二元结果变量。每次前往餐厅要么成功(我获得了两个我还没有的雕像),要么失败(没有获得还没有的雕像)。
我尝试从失败中学习,这提醒我一些我已经知道的事情:
在收集数据之前,一定要对可能看到的结果、收集数据时可能出现的问题以及如何解决这些问题进行头脑风暴。Minitab Workspace 为此提供了一些很棒的头脑风暴工具 。
另外,要提出问题,很多问题。
我的第二个数据点确实让我提出了这些问题……
经验教训 3: 考虑所有可能会影响结果的因素
对于我的第 3 行数据,我的策略是选择不同的餐厅位置,以把握更好的机会获得我尚未拥有的角色组合。所以,第三天,我向北而不是向南……
雕像断货,这带来了一系列新问题:
我意识到我可能没有考虑到一个重要因素——时段。
经验教训 4: 长远看,精心设计的实验将节省您的时间和前往的次数
为了尽可能地控制时间效应,我决定再次尝试 B 餐厅,但要提前几个小时。我也想回到 A 餐厅,尽管这增加了前往餐厅的次数。我希望这将提供更多关于这两个地点的库存消耗速度的信息。 (我试过直接询问他们,但他们不肯透露这个信息。)
所以,这是第 4 行和第 5 行:
B 餐厅又失败了,幸好随后成功了!
虽然我从随意的方法中吸取了教训,但我在五行数据中只收到了有关餐厅因素的有限信息。我仍然不知道是否存在时段效应,因为我只在午餐时间收集数据。当我思考添加晚餐的必要性时,我意识到更好的方法是使用复制的 2 因素、4 轮设计的实验。如果我这样做了,Minitab 就会以随机实验设计的形式为我制定数据收集策略。
但此时,我已经去过了 5 次餐厅,我需要纠正路线。
结论
我的数据现在是 4 次成功和 3 次失败。我已经改为每天收集两次数据,并新增加了一家餐厅,并获得很大的成功。
数据驱动的问题解决并不总是需要涉及复杂的统计工具。在收集第一行数据之前,最好先退后一步并进行计划。但即使收集的数据不完善,也可能比没有数据要好。
噢,如果你有任何重复的开心乐园餐玩具愿意分享,请告诉我。