지난 달 디즈니와 맥도날드에서 함께 협업하여 재미있는 프로모션을 진행합니다. 이 두 브랜드는 제가 가장 좋아하는 브랜드랍니다. 디즈니 기업의 창립 창립 100주년을 기념하기 위해 맥도날드는 디즈니 100주년 기념 해피밀을 판매하고 있습니다! 각 해피밀 박스에는 클래식 디즈니, 픽사, 마블, 스타워즈 등 가장 많은 사랑을 받은 디즈니 캐릭터의 작은 플라스틱 피규어 2점이 들어 있습니다. 들리는 소문에 따르면 총 62개의 피규어가 마련되어 있으며 모두 핫한 인기 아이템이라고 합니다. 저는 이 한정판 피규어들을 모두 가지고 싶었기 때문에 통계학자로서 데이터를 수집하고 데이터 분석을 사용하여 모든 피규어를 가질 수 있는 확률을 계산해 보려고 합니다!
그러나 솔직히 말씀드리자면, 저는 물론 데이터 중심의 문제 해결 방식을 잘 알고 있습니다. 다만 데이터 수집 과정에서 실수를 경험했고 거기에서 배운 몇 가지 교훈들을 공유해 보려고 합니다.
교훈 1: 데이터 수집 계획 세우기
저는 이 프로젝트에 대해 너무나도 기대가 컸기 때문에 예비 조사나 프로젝트 계획 또는 전략을 세우기 전에 먼저 데이터를 수집하기 시작했습니다. 이러한 피규어가 한정 상품이라는 점이 데이터 수집 과정의 큰 실수였습니다. 사실, 짧은 시간 동안 62개의 피규어를 모두 수집하겠다는 목표를 달성할 때 사전 계획이 부족한 것이 아마도 가장 큰 장애물이기 때문입니다.
하지만 첫 번째 데이터 포인트는 성공적이었습니다. 저의 Minitab 워크시트 1번 행을 보면 간절히 원했던 미키 마우스와 캡틴 마블의 조합을 받는 것으로 높은 점수를 땄다는 걸 볼 수 있을 것입니다.
피규어들은 귀여웠고 저는 계속해서 퀘스트를 이어가리라고 다짐했습니다. 하지만 인근 맥도날드에서는 피규어 판매만 진행하려 하지 않았습니다. 해피밀을 사야 피규어 하나를 받을 수 있었기 때문에 치킨 맥너겟을 좋아하는 저는 수많은 해피밀을 먹었습니다. 정말이지 최소한의 시도, 즉 그야말로 매장을 최소한으로 방문하는 것으로 필요한 결과를 얻는 방법에 대해 더 많이 생각해 봤어야 했습니다.
교훈 2: 잠재적인 장애물에 대해 브레인스토밍하기
그 다음날 Minitab 워크시트의 2번 행의 피규어를 모으기 위해 가장 즐겨 찾는 맥도날드 매장에 다시 방문했는데…
완전히 실패하고 말았습니다! 미키 마우스/캡틴 마블 콤보는 이미 받았는데 말이죠. 그제서야 이진법의 결과 변수를 세웠다는 걸 깨달았습니다. 매번 매장 방문에 성공하는 경우, 아직 수집하지 않은 두 개의 피규어를 받게 될 수도 있지만 실패하면 피규어를 받지 못합니다.
저는 실패에서 교훈을 얻으려고 노력하는데, 그것은 이미 알고 있었던 사실을 깨닫게 해주었습니다.
어떤 결과를 얻을 수 있는지, 데이터를 수집할 때 어떤 문제가 일어날 수 있는지, 그리고 이러한 문제를 어떻게 해결할 것인지를 중심으로 브레인스토밍하지 않은 채로 절대 데이터 수집을 시작하지 말라는 것이었습니다. Minitab Workspace는 이에 대한 몇 가지 유용한 브레인스토밍 도구를 마련해 두었습니다.
또한 질문해야 합니다. 그것도 아주 많이요.
저의 두 번째 데이터 포인트는 아래와 같은 질문을 하게 만들었습니다…
-
조합은 항상 같은가요? 예를 들어, 미키 마우스는 항상 캡틴 마블과 조합되나요? 이 질문에 대한 대답은 그렇다는 것을 확인했습니다. 62개의 캐릭터를 모두 받기 위해서는 31개의 고유한 상자를 받으면 된다는 뜻이기 때문에 이 점이 아주 중요한 정보였던 것입니다.
-
배포는 어떻게 이루어질까요? 각 맥도날드 매장은 이 피규어 상자를 무작위로 제공 받습니다. 다만 매장에서 받는 각 상자에는 캐릭터 조합 31가지 중 하나만 들어 있다는 점을 알게 되었습니다. 또한 매장에서는 하나의 박스 재고를 소진하고 나서야 다음 상자의 캐릭터를 배포하기 시작할 수 있습니다. 이를 통해 2번 행이 중복이라고 할 수 있는 이유를 알 수 있습니다. 이 매장에서는 공급 받은 미키/캡틴 마블 쌍을 모두 소진하지 않았던 것입니다.
교훈 3: 결과에 영향을 줄 수 있는 모든 요인 고려하기
데이터 3번 행에 대한 저의 3번째 전략은 아직 없는 캐릭터 조합을 받을 확률을 높이기 위해 다른 매장을 선택하는 것이었습니다. 그래서 3일차에는 남쪽이 아니라 북쪽으로 갔죠. 그리고…
피규어는 없었습니다. 그래서 새로운 질문들이 생겼습니다.
- B 매장의 피규어가 없었던 이유가 제가 너무 늦게 갔기 때문이었을까요? (그날 점심 식사 시간이 늦어졌습니다.)
- 공급망에 차질을 일으키는 요인이 있습니까?
- 아니면 다른 요인이 작용하고 있습니까?
중요한 요인을 놓쳤다는 것을 깨달았죠. 바로 시간대였습니다.
교훈 4: 신중하게 설계된 실험이 결국 시간과 방문 횟수를 줄일 수 있습니다
시간 효과를 활용하고자, B 매장에 몇 시간 일찍 가 보기로 결정했습니다. 또한 매장 방문 횟수가 추가되더라도 매장 A에도 다시 가 보고 싶었습니다. 제가 바랐던 것은 이를 통해 이 두 매장의 재고 소진 속도가 얼마나 빠른지에 대해 조금 더 많은 정보를 얻는 것이었습니다. (매장에 직접 물어보기도 했지만 매장에서는 이 정보를 공개하지 않았습니다.)
그러면 이제 4, 5번 행을 보겠습니다.
B 매장에서 또 한 번 실패했지만 다행히 그 다음에는 성공했습니다!
저의 무작위 방법론에서 교훈을 얻기는 했지만 데이터 다섯 개 행에서는 매장 요인에 대해서 제한된 정보만을 받았습니다. 그리고 시간대 효과가 있는지는 여전히 모릅니다. 왜냐하면 점심 시간에만 데이터를 수집해 왔으니까요. 이 조합에 저녁 식사를 추가해야 할 필요성에 대해 숙고하면서, 반복 2요인, 4회 방문 설정 실험을 사용하는 것이 더 나은 접근 방식이었겠다는 점을 실감했습니다. 그렇게 했다면 Minitab은 무작위 실험 설계의 형태로 데이터 수집 전략을 세워 주었겠지요.
하지만 이 시점에서는 이미 매장을 5회 방문했고 경로를 수정할 필요가 있었습니다.
- 매장 효과가 있는 것처럼 보이지만, 제가 갔던 두 번 모두 피규어가 없었기 때문에 하나의 매장에서는 유용한 결과를 얻을 수 없습니다. 그 조합에 최소한 매장 한 곳을 더 추가해야 합니다. (피규어가 배포되는 방식을 고려할 때, 더 많은 매장을 추가하면 더 좋지만 추가적인 시간과 돈을 들일 가치가 없을 수 있습니다.)
- 매장에서 하루 중 시간이 뒤로 갈수록 재고가 떨어질 가능성이 있다면 저녁 시간 데이터를 수집하여 이 가정을 시험하는 것이 가능할까요? 중복이 발생할 가능성을 고려할 때, 같은 매장에 시간을 두고 여러 번 방문해야 할까요?
- 4일, 5회 방문을 통해서, 나올 수 있는 31개의 피규어 콤보 중에서 2가지를 받았습니다. 이 프로모션은 이번 주에 끝난다는 점을 고려할 때 해피밀을 훨씬 더 많이 먹기 시작하거나 친구들로부터 도움을 받아야 합니다. (저와는 다른 맥도날드 매장 근처에 사는 친구에게 부탁하면 더 좋겠지요.)
결론
이제 저의 데이터는 4회 성공, 3회 실패를 가리키고 있습니다. 하루에 2회 데이터 수집하는 것으로 옮겼고 새로운 매장을 조합에 추가하여 성공에 이르렀습니다.
데이터 중심의 문제 해결을 위해 반드시 복잡한 통계적 도구가 필요한 것은 아닙니다. 또한 데이터의 1번째 행을 수집하기 전 항상 한 발 뒤로 물러나서 계획하는 것이 더 좋습니다. 하지만 불완전한 방식으로 수집된 데이터 또한 데이터가 전혀 없는 것보다는 아마도 더 나을 것입니다.
아, 그리고 나누어 줄 생각이 있는 중복 해피밀 피규어가 있으시다면 저에게 알려주시기 바랍니다.