톰 행크스와 운세 기계 졸타가 나오는 영화 ‘빅’을 기억하시나요? 모든 세대는 신탁이 미래를 예측하는 (일반적으로 어떤 큰 문제를 해결하는) ‘빅’, ‘매트릭스’, ‘머니볼’, ‘왕좌의 게임’과 같은 멋진 쇼를 경험하지만… Minitab Model Ops만큼 신뢰할 수 있는 것은 없습니다.
저는 여러분의 업무에 머신 러닝이 도움이 되기를 바라는 수많은 문제가 있을 것임을 확신합니다. 저와 함께 일하는 많은 고객이 바로 이러한 문제를 위해 Minitab Predictive Analytics Module을 사용합니다. 예측 분석 또는 회귀 분석을 사용하는 고객은 Minitab Model Ops로 모델을 배포할 수 있습니다. 졸타가 말을 하게 하려면 졸타의 애니마트로닉 입에 25센트 동전을 던져 넣어야 했습니다. 예측 분석은 이보다 훨씬 더 쉽게 사용할 수 있습니다.
예언(오라클)의 눈은 ‘매트릭스’에서 가장 중요한 것입니다. 아마도 데자뷰를 제외하고는 문제를 다시 쓰고 모든 사람의 기억을 지워줄 수 있는 검은 고양이일 것입니다. 세라프, 네오, 트리니티 그리고 동료들이 그녀를 보호하는 동안 스미스 요원과 메로빈지언이 그녀를 찾고 있었던 것을 기억하시나요? 그녀의 모델은 다른 모델보다 더 좋았습니다. Minitab의 TreeNet(또는 어쩌면 MARS)은 요즘 직장에서 제가 가장 좋아하는 예언입니다!
‘머니볼’은 통계 모델을 사용하여 야구 팀의 선수명단을 구성하는 방법을 규정합니다. 이것은 고객이 저번에 저에게 다음과 같이 질문한 것과 매우 비슷합니다. “저는 다중 선형 및 이항 로지스틱 회귀, CART, TreeNet, Random Forest, MARS를 공부하고 있습니다. 어떤 방법이 예측 및 처방 분석에 속하나요?”
저는 이 질문이 매우 통찰력 있는 질문이라고 생각했습니다. 최소한 브래드 피트와 조나 힐이 데이터를 기반으로 오클랜드 A를 재건하는 것만큼이나 흥미로웠습니다. 예측을 사용할 수 없다면 예측이 무슨 소용이 있을까요? 단순히 제품 또는 공정의 작동 방식을 아는 것보다는 이를 운영하는 방법을 처방하는 것이 좋지 않을까요? 예측만으로는 문제 해결의 계층 구조에 단 한 걸음만 내딛을 수 있습니다. 모델을 실시간 데이터에 연결하여 공정을 제어하거나 오류를 방지하는 데 사용할 수 있다면...그것이 바로 힘이며, 그게 바로 Minitab Model Ops입니다.
이 웨비나에서 Minitab Model Ops의 활용 방법을 알아보세요.
예측 분석의 실제 사례
다음은 몇 가지 사례입니다. 제 아내는 항상 이 블로그에서 이야기만 하지 말고 독자들에게 뭔가를 할 수 있는 방법을 알려주라고 저에게 얘기합니다! 그녀 역시 MBB입니다. 그녀는 여러분을 이해합니다.
제가 대학 졸업 후 첫 직장에서 일을 할 때 그곳에서는 자동차 부품에 측정 장치를 배치하는 조립 공정이 있었습니다. 설치 및 민감도는 공장의 온도 및 습도와 같은 여러 요인에 따라 달랐습니다. 회귀 모델은 실제 환경 조건을 부품의 성능 저하 위험과 연관시키기 위해 만들어졌습니다. 이것은 온도와 습도를 기록하는 관리와는 다릅니다… 이것은 부품이 여전히 만들어지고 있을 때 미래의 위험을 예측하기 위한 입력으로 두 가지를 모두 사용하는 모델입니다. 그 당시에는 엄청난 작업이었지만, 이제는 우리의 솔루션을 통해 쉽게 모델링하고 훨씬 더 정확하게 만들 수 있습니다.
한 Minitab 고객이 최근 예측 분석을 사용하여 지세와 농사법의 복잡한 관계를 모델링하여 수질 오염을 예측하고 예방했습니다. 우리는 온라인 포털을 통해 개인이나 기업이 세부 정보를 입력하고 오염 가능성을 예측할 수 있도록 노력하고 있습니다.
예측 분석을 사용하는 것은 매우 쉽습니다. 회귀 분석(많은 엔지니어 친구들에게 친숙한 고전적인 도구)보다 쉽고 회귀 분석은 저를 종종 실망시킵니다… 우리 중 일부는 어린 시절부터 y=f(x) 방정식을 만들었습니다(아니면 적어도 고전적인 TI86 계산기가 방정식을 알려주고 그래프를 만들게 했었습니다. 기억나시나요?). 예측 분석은 회귀 분석이 찾을 수 없는 신호를 찾아냅니다.
- Minitab을 열기만 하면 과거 또는 관찰 데이터를 얻을 수 있습니다… 일반적으로 행이 100개 이상이면 가장 좋습니다(머신 러닝 옵션은 모델 검증 방법을 통해 데이터를 분할하므로… 데이터가 너무 적으면 모델링하기가 어렵습니다).
- 그런 다음 통계분석 > 예측 분석(대부분의 사람들이 가장 좋아하는 6개 항목 바로 아래, 품질 도구 밑, 신뢰성 바로 밑에 있음... 이 하위 메뉴에서는 머신러닝 알고리즘 2개를 확인할 수 있습니다.)으로 이동하세요. 수치 응답(*분석 중인 큰 Y에 대한 열은 숫자일 뿐)이 있는 경우 CART 회귀 분석을 시도해 보세요. 또는 범주 응답(통과/실패... 또는 스크래치/움푹 들어감/손상 없음... 또는 심각도 순위, 연속형 숫자가 아닌 것)이 있는 경우 CART 분류를 시도해 보세요.
이보다 더 놀라운 알고리즘이 있지만, 이 알고리즘들은 바로 지금 무료로 설치할 수 있습니다(Minitab 버전 19.2020 이상이 있는 경우!).
Minitab Predictive Analytics 및 Model Ops는 이 블로그에서 보여드린 개념을 가능하게 합니다. 우리가 방법을 보여드릴 수 있는 경우 알려주세요. CART(데이터에서 숨겨진 신호를 훨씬 더 많이 찾을 수 있음)보다 더 고급인 알고리즘을 안내해 드릴 수 있다면 정말 기쁠 것입니다. 여기에는 자동화된 머신러닝(Auto ML)이라는 간편한 버튼이 있습니다. 여러분 스스로 어느 정도의 비판적인 사고를 하는 한, Auto ML은 기존 모델을 포함한 모든 모델을 실행하고 데이터에 가장 적합한 모델을 알려줄 수 있습니다. 우리는 Minitab Model Ops를 사용하여 이러한 모델을 실시간 데이터에 연결하는 방법도 논의할 수 있습니다. 원하신다면 DOE의 회귀 방정식도 사용할 수 있습니다… 저는 이 방정식이 업계의 기존 친구들 대부분이 우리가 이미 알고 사랑하는 전통을 뛰어넘는 성장에 대해 생각해 볼 수 있는 방법을 고려하는 유용한 다리가 될 것이라고 생각합니다…
예측 분석을 사용하는 더 많은 실습 경험을 원하시나요?