Minitab의 회귀 분석을 사용한 예측 분석 - Part I Predictive Analytics using Minitab's Regression – Part I

Dennis Corbin | 27 July, 2021

주제: Regression Analysis, Predictive Analytics, Articles, Minitab Statistical Software

시장에는 여러 새로운 예측 분석 및 머신 러닝 도구가 있지만, 회귀 분석은 예측 모형을 구축하기 위한 전통적인 도구입니다. 회귀 분석을 통해 사용자는 반응과 다양한 예측 변수 사이의 관계를 모형화할 수 있습니다. 기업은 예측 도구를 올바르게 구현해야 하고, Minitab의 회귀 분석은 예측 모델링 능력을 달성하는 데 유용할 수 있습니다!

Minitab Statistical Software를 사용하면 회귀 분석이 그 어느 때보다도 쉬워집니다.

  • 예측 모형을 만들고 검증하고 시각화할 수 있습니다.
  • 모형의 예측력을 검증할 수 있습니다.
  • 분석과 모형 선택을 자동화할 수 있습니다.
  • 새로운 결과를 예측하고 매개변수를 최적화할 수 있습니다.


오늘은 예측 모형을 만들고 검증하고 시각화하는 방법에 대해 집중적으로 알아볼 것입니다. 예측력을 검증하고 분석과 모형 선택을 자동화하고 새로운 결과를 예측하고 매개변수를 최적화하는 고급 기능에 대해서는 Part 2를 참조하세요.

회귀 분석은 마케팅, 금융, 제조, 의료 기기, 제약, 식품 과학 등과 같은 거의 모든 산업의 전문가들이 흔히 직면하는 광범위한 문제에 대한 답을 얻는 데 도움이 되고, 어떤 입력이 반응을 예측할 수 있고 가장 영향력 있는지 결정할 수 있습니다. 강력한 회귀 분석 모형은 기대값을 계산하고 향후 변경 사항의 영향을 예측하는 데에도 사용할 수 있습니다. 하지만 이런 모형은 인과 관계가 아닌 연관성을 암시함을 기억하세요.

MINITAB STATISTICAL SOFTWARE에서 예측 모형 만들기, 검증 및 시각화

Minitab 회귀 분석은 연속형 및 범주형 예측 변수가 관심 반응에 미치는 영향을 정량화하는 데 유용하고, 기본 제공 기능을 사용하여 예측 모형, 교호작용 및 다항식 항에 복잡한 항을 쉽게 추가할 수 있습니다.

식품 제조 회사의 사례를 예로 들어 보겠습니다. 회사 엔지니어들은 세 개의 잠재적인 포장 디자인과 시간이 제품의 유효 기간(수분을 기준으로 측정)에 미치는 영향을 확인해야 합니다. 이들은 포장 밀봉 후 첫 72시간을 집중적으로 분석합니다.

회귀 분석은 종종 선형 모형을 예측 변수에 대한 주 효과와 적합 시키는 데에만 사용됩니다. 이 예에서는 각 포장 디자인마다 별도의 절편이 모형에 포함되지만 각 모형의 기울기는 같습니다. 다항식 항과 교호작용을 추가하면 분석이 더 강력해질 것입니다.

반응 변수, 연속형 예측 변수 및 범주형 예측 변수를 입력한 후 통계분석 > 회귀 분석 > 회귀 분석> 적합 회귀 모형에서 ‘모형’ 버튼을 누르면 모형에 복잡성을 쉽게 추가하여 교호작용과 다항식 항을 사용해 더 정확하게 예측할 수 있습니다. 파레토(Pareto) 그림은 이런 항이 모형에 미치는 영향을 나타내고, 잔차 그림은 모형 가정을 확인하는 데 사용됩니다.

predictive-analytics-regression-pt-1-pareto-dialogs

아래의 Pareto 효과도는 유의한 항과 유의하지 않은 항을 비교하여 보여주는 간단한 그래프입니다. 항의 표준화된 효과가 빨간색 선과 교차하면 p-값이 지정된 알파 값((이 사례에서는 0.05)보다 작으므로 유의합니다. 막대 크기는 모형에서 갖는 상대적인 영향력을 나타냅니다. 시간과 패키지 설계는 모두 이 제품의 수분 함량을 이해하는 데 필수적입니다.

predictive-analytics-regression-pt-1-pareto-chart-standardized-effects

수분 예측 모형에는 시간, 시간2, 패키지 설계 및 각 항 사이의 교호작용이 포함됩니다. Minitab은 세 가지 패키지 설계에 대해 각각 별도의 모형을 표시하여 모형을 단순화합니다. 설계 간 상수 및 기울기의 차이는 유의한 교호작용 때문입니다.

predictive-analytics-regression-pt-1-regression-equation-output

잔차 그림은 분석가가 회귀 분석의 가정을 검증하는 데 유용합니다. 정규성 이탈, 비등분산 또는 독립성 결여 유무를 확인하여 분석이 유효하고 적절한지 확인하세요.

predictive-analytics-regression-pt-1-residual-plots-moisture

분석가는 모든 조사를 마친 후 결과를 발표해야 합니다. 요인 그림은 숫자 출력을 읽기 쉬운 그래프로 표시하는 모형을 시각화하는 데 유용합니다. 중요한 72시간 기간 동안 제품의 수분량을 최소화하는 것이 목표라면 설계 2가 가장 효과적입니다.

predictive-analytics-regression-pt-1-interaction-plot-moisture

회귀 분석은 새로운 개념이 아니지만, 데이터 분석가라면 꼭 알아야 하는 매우 강력한 모형화 도구입니다. Minitab을 사용하면 예측 모형을 쉽고 편리하게 만들고 시각화할 수 있습니다.

아직도 Minitab의 힘을 활용하여 데이터의 가치를 극대화하지 않고 있다면 지금 모든 기능을 사용할 수 있는 Minitab Statistical Software 30일 평가판을 무료로 다운로드하세요.