使用 Minitab 回归进行预测分析 – 第一部分 | Predictive Analytics using Minitab's Regression – Part I

Dennis Corbin | 11 November, 2022

主题: Regression Analysis, Articles, Minitab Statistical Software

尽管市场上有许多新的预测分析和机器学习工具,但 Minitab 回归仍是构建预测模型的经典工具。回归允许用户对响应与各种预测变量之间的关系进行建模。公司需要正确使用预测工具,而 Minitab 回归可以帮助实现有意义的预测建模能力!

Minitab Statistical Software 让执行回归分析变得前所未有的简单: 

  • 构建、验证和可视化预测模型。 

  • 验证模型的预测能力。 

  • 自动化分析和模型选择。 

  • 预测新结果并优化参数。

     

今天,我们将重点介绍构建、验证和可视化预测模型(请查看第 2 部分,了解有关验证预测能力、自动化分析和模型选择以及预测新结果和优化参数的更高级功能!)。 

回归有助于回答几乎所有行业(如营销、金融、制造、医疗器械、制药、食品科学等)专业人士经常面临的一系列问题,也可以确定哪些输入可以预测响应,哪些输入最有影响力。强大的回归模型甚至可以用来计算期望值和预测未来变化的影响。请记住,这些模型并不意味着因果关系,而是关联。

构建、验证和可视化 MINITAB STATISTICAL SOFTWARE 中的预测模型

Minitab 回归可以帮助量化连续和类别预测变量如何影响相关响应,并可以使用内置功能来向预测模型、交互作用和多项式项轻松添加复杂项。 

以食品制造公司为例。该公司的工程师需要确定三种潜在包装设计和时间(以小时为单位)如何影响其产品的稳定期(以水分来衡量)。他们重点关注密封包装后首个 72 小时。 

回归分析通常用于拟合仅包含预测变量主效应的线性模型。在本示例中,模型将包含每个包装设计的单独截距,但每个模型将具有相同的斜率。添加多项式项和交互作用将是更强大的分析。 

统计 > 回归 > 回归 > 拟合回归模型中输入响应、连续预测变量和类别预测变量后,模型按钮可以轻松增加模型的复杂度,以便通过交互作用和多项式项进行更准确的预测.Pareto 图显示这些模型中的项产生的影响,残差图用于检查模型假定。 

predictive-analytics-regression-pt-1-pareto-dialogs

 

下方的Pareto 效应图是一个简单的图形,显示了显著项与非显著项。如果某个项的标准化效应越过红线,则 p 值小于指定的 alpha 值,在本例中该值为 0.05,表明该项为显著项。条形图的大小显示了模型中各项的相对影响:小时数和包装设计对于了解产品中的水分含量至关重要。

predictive-analytics-regression-pt-1-pareto-chart-standardized-effects

水分预测模型包括小时数、小时数2、包装设计以及各项之间的交互作用。Minitab 为三种包装设计中的每一种显示单独模型,从而简化模型设计之间的常量和斜率的差异由显著的交互作用造成。 

predictive-analytics-regression-pt-1-regression-equation-output

残差图帮助分析师验证回归的假定。检查是否偏离正态、不等方差或缺乏独立性,以确保分析有效且适当。 

predictive-analytics-regression-pt-1-residual-plots-moisture

完成所有必要的调查后,分析师需要展示其调查结果。因子图有助于将数字化输出展示为简单易懂的图形,以便将模型可视化。如果目标是在关键的 72 小时内最大限度地降低产品中的含水量,则设计 2 将是最佳选择。 

predictive-analytics-regression-pt-1-interaction-plot-moisture

回归并不是新功能 - 但回归是非常强大的建模工具,所有数据分析师都应该掌握。Minitab 使构建和可视化预测模型变得简单易访问

 

如果您尚未利用 Minitab 的强大功能从数据中获取最大价值,请立即下载功能完备的 Minitab Statistical Software 30 天免费试用版