功效和样本数量 - 用于统计分析的保险单 | Power and Sample Size – Your Insurance Policy for Statistical Analysis

Minitab Blog Editor | 7/29/2022

主题: ANOVA, Design of Experiments - DOE, Hypothesis Testing, Minitab Statistical Software

如果您的汽车受损,您有保险单来支付修车费用吗?您支付保险费是因为您知道汽车会受损吗?不,您付了钱,这样如果您的汽车受损,您就可以得到赔偿。 

当我们进行统计分析时,比如假设检验和试验设计,我们使用的是数据样本来回答有关所有数据的问题。这些答案的可靠性受分析的样本数量的影响。为了将不可靠统计分析的风险降至最低,我们可以在收集任何数据之前使用功效和样本数量来确定需要多少数据才有可能发现这种影响(如果有的话)。  这方面的最小推荐值为 80% 

出于这个原因,我喜欢将功效和样本数量计算作为统计分析的保险单。让我通过将其与购买汽车保险并提出索赔相比较来解释一下原因。如果您想更多地了解功效分析的使用和详解,在 Minitab 基础培训课程中对使用 Minitab 进行假设检验就有所介绍,这是全天试验设计课程 — 因子设计的重点(如需了解更多信息,请参阅公开培训时间表)。  

You need to know which type of analysis you need before starting, just like you choose the type of insurance you want before asking for a quote.

1.确定您需要的分析类型 

在选择新的车辆保险时,您需要在询问报价之前确定所需的保险类型。这将决定保险的计算方法。功效分析也是如此。您需要知道想做哪种类型的分析。例如,您是在进行单样本 t 检验、方差分析还是因子设计?了解您需要的分析类型是选择最佳计算方法的第一步。 

 

2.什么是可接受的风险?- 设置显著性水平 

当询问保险报价时,您会被问到准备支付多少自负额或免赔额。免赔额越高,您的保费就越低。低保费的缺点是,如果真的发生事故,自付费用会较高。如果您无法负担额外的费用,则会产生严重的影响。  

在功效和样本数量计算中,要求您设置显著性水平(Minitab 中的默认值为 0.05)。这个值设置得越大,所需的样本数量就越少。这样做的负面影响是您做出错误决定的可能性会更高。在这种情况下,否定原假设(类型 I 错误)的概率会增加,即在没有影响的情况下却发现有影响。  

为了让功效和样本数量提供有价值的见解,在选择显著性水平之前,您需要对成本有所了解(可能不仅仅是货币成本)。 

3.评估风险 – 使用差异和标准差 

当您申请汽车保险时,保险公司会询问您关于您所属的年龄段、您的汽车型号、驾驶经验和驾驶习惯等各种问题。保险公司通过这些信息来评估您发生事故或车辆被盗的风险,然后使用这些信息来确定您的保费。 

在功效分析计算中,您还需要预先提供信息以正确评估风险。首先,您需要提供有关影响的实际重要性的信息。例如,如果您正在销售巧克力棒,与广告宣传的重量有多大差异才会导致客户投诉或生产成本不可接受地增加(在 Minitab 功效分析对话框中,这被称为差异)。第二个需要提供的是过程的标准差,用于评估变异性。 

将这些信息综合起来有助于计算风险。 

4.在计划期间结果不得而知 

当您为汽车投保时,您知道有提出索赔的风险,并且您想确保当最坏的情况发生时能获得足够的给付额。但是,您不确定是否需要提交索赔。在数据分析过程中也会发生类似的情况。如果您计划进行数据分析,您认为有一个问题可以通过分析来回答,希望收集足够的数据来回答该问题,但在完成分析之前,您无法确定结论是什么。 

5.保费 - 样本数量 

一旦您向保险公司提供了所有信息,他们就会告诉您需要缴纳多少保费来满足您提出的给付额。如果保费远远超过预算,您可以通过调整一些因子来降低保费。 

功效分析会提供一个样本数量,就像保费一样,如果您无法收集那么多数据,您可以更改一些输入因子。功效分析还允许您输入已使用(或可使用)的样本数量的详细信息,并评估功效。  如果功效小于 80%,则您选择的样本数量还不够多,无法很好地识别过程中的问题或机会。 


如果您想更多地了解功效分析的使用和详解,为什么不来参加 Minitab 培训Minitab 基础课程介绍了它在假设检验中的使用,如果您正在进行试验设计,我们的试验设计入门课程 - 因子设计将会对此进行介绍。