必须定期校准测量设备才能确保它们可以正常工作。 尽管校准涉及到广泛的应用和场景,但目标很简单:确保设备测量符合标准。 大多数质量体系都需要一个令人满意的测量系统,包括所有测量仪器的正式校准、定期校准和记录校准。 工程师们所面临的一个常见问题是如何验证两台仪器是否以相似的方式测量部件。
如何确定两台仪器是否提供可比较的测量值?
一种方法是通过拟合一条简单线性回归线来比较这两台仪器,然后使用模型拟合来查看在整个测量范围内,这些值是否相同。 简单线性回归模型是两个连续变量之间的线性关系:一个响应和一个预测变量。
示例:
假设有一家医疗设备制造商想要确定其血压计是否与市场上的类似型号相当。 为了验证这两台仪器提供可比较的测量值,该制造商选择了代表需要进行测量比较的一系列值的人员。于是,该制造商同时使用这两台仪器对这些人员进行测量。 该公司使用这两台仪器对 60 人的随机样本进行收缩压测量,获取读数并记录相应的数据。 所示为 60 行样本,每行均包含使用当前仪器和新仪器分别获得的测量值。
Row | New | Current |
1 | 100 | 100 |
2 | 122 | 120 |
3 | 129 | 132 |
4 | 136 | 139 |
5 | 110 | 110 |
6 | 111 | 110 |
7 | 137 | 137 |
8 | 134 | 133 |
9 | 141 | 140 |
10 | 112 | 112 |
在这种情况下,我们将当前读数指定为预测(或 X)变量,将新读数指定为响应(或 Y)变量。 对该数据拟合回归线表明,当前测量设备读数可以很好地预测新测量设备读数。 R 平方统计量表明,当前测量设备解释了新测量设备中观测到的 98.8% 的变异。
回归方程为:
New = 1.387 + 0.9894 Current
从这些数据来看,当前测量值一定可以很好地预测新测量值。 在实践中,我们看到工程师使用预测模型来确认新设备能否像当前设备一样进行测量。 还有其他应用场景;有些情况下需要进行更快的测量。 例如,某些部件或样本必须在装运前使用实验室测量进行测量。 但是,实验室测量可能需要数小时,具体取决于测量过程。 提供即时结果的测量方法可用于预测实验室测量,这为操作员和工程师提供潜在问题的即时反馈。
当我们假设水平方向或 X 方向没有误差时,简单线性回归方法是正确的。 在本例中,这将意味着我们当前的测量系统不包含任何误差。 我们知道,对于测量系统来说,这种假设是不合理的 — 因此使用简单线性回归不是最佳的统计方法。 但不用担心,还有另一种易于使用的方法。
请在我们的虚拟培训课程中,亲身体验各种图形和统计工具
什么是正交回归?
正交回归又称为 Deming 回归,可用于确定两台仪器或两种方法是否提供可比较的测量值。正交回归还检查了两个连续变量之间的线性关系:一个响应变量 (Y) 和一个预测变量 (X)。 与简单线性回归(最小二乘回归)不同,正交回归中的响应和预测变量都包含测量误差。 回想一下,在简单回归中,只有响应变量包含测量误差。 如果在两个变量都包含测量误差时使用简单回归来确定可比性,则结果取决于计算过程假设哪个变量没有测量误差。 正交回归解决了这个问题,因此变量的作用对结果几乎没有影响。
在简单线性回归中,目标是最小化 y 值和拟合线上相应值之间垂直距离的平方和。在正交回归中,目标是最小化从数据点到拟合线的正交(垂直)距离。 尽管这些方法之间的差异似乎很小,但在评估规格相关的测量值和部件时,可能会得出明显不同的结果。
让我们用正交回归来分析血压计数据。
正交回归需要您指定 X(当前)和 Y(新)中的误差方差比。 当 X 和 Y 的测量方法相同时,方差可能相等,这将导致比率等于 1。 但对其进行估计是一种不错的方法。 在为正交回归收集数据之前,工程师对每台血压计进行了单独的研究,以估计测量变异。 通过对每台测量设备进行独立的量具重复性与再现性研究来计算误差方差比,以便生成每台设备重复性方差分量。两个重复性方差分量的比率估计值可用作“误差方差比”字段的输入。 新血压计的方差为 1.08。另一家公司的血压计的变异为 1.2。工程师决定将新血压计指定为响应变量,将另一家公司的当前血压计指定为预测变量。通过这些分配,误差方差比为 1.08 / 1.2 = 0.9。
正交回归结果
拟合线图显示,这些点接近于回归线,这表明该模型能够拟合数据。 我们在这里展示了最小二乘拟合和正交拟合。 两个拟合方程显示在可视图的左下角。
正交回归方程为: New = 0.644 + 0.995 Current
请注意,尽管两条线看起来非常相似,但正交回归方程与简单线性回归方程是不同的。 我们可以使用正交回归方程来了解这两台测量仪器的等价。
如果符合下面的任一情况,则结果表明血压计不等价:
- 斜率的置信区间不包含 1。
- 常量的置信区间不包含 0。
通常情况下,95% 的置信水平的工作效果很好。95% 的置信水平表明,如果从总体中抽取 100 个随机样本,大约有 95 个样本的置信区间将包含系数实际值。对于给定的数据集,置信水平越低,产生的置信区间越窄;置信水平越高,产生的置信区间越宽。
结果表明,常量置信区间约为 -2.78 至 4.06,包含 0。当前仪器的斜率置信区间约为 0.97 至 1.02,包含 1。这些结果并不能证明这两台血压计的测量值不同。根据这些结果,该公司能得出结论,其新测量设备的性能与市场上的当前设备一样好。
结论
校准两种测量系统时,正交回归可以确定仪器或方法是否提供可比较的测量值。 与简单线性回归(又称为最小二乘回归)不同,正交回归中的响应和预测变量都包含测量误差。 使用正交回归,医疗设备制造商可以自信地得出结论,其测量仪器与当前市场上的测量仪器相当。
您可以在大多数统计软件包(包括 Minitab Statistical Software)中找到正交回归。