측정 기기는 제대로 작동하도록 주기적으로 교정해야 합니다. 다양한 용도와 상황에 적용 가능한 교정의 목표는 간단합니다. 바로 기기가 표준에 맞게 측정되고 있는지 확인 하는 것입니다. 대다수의 품질 시스템은 모든 측정 기기의 공식적, 주기적 및 문서화된 교정을 포함하는 적절한 측정 시스템을 요구합니다. 이 과정에서 엔지니어는 두 기기가 유사한 방식으로 부품을 측정하는지 확인하는 방법을 고민하게 됩니다.
Minitab의 방법은 단순 선형 회귀 분석을 적합하여 두 측정 기기를 비교한 다음 모형 적합을 사용하여 여러 측정의 값이 동일한지 확인하는 것입니다. 단순 선형 회귀 분석은 두 개의 연속 변수(하나의 반응과 하나의 예측 변수) 사이의 선형 관계를 모형화합니다.
의료기기 제조사가 자사의 혈압계가 시장의 유사한 모델과 동등한지 확인하려고 합니다. 이 제조사는 두 기기가 비교 가능한 측정값을 제공하는지 확인하기 위해 비교 가능한 측정이 필요한 여러 값 범위를 나타내는 사람들을 선정하고 두 기기를 이용하여 해당 대상을 측정했습니다. 두 기기를 사용하여 무작위로 선정된 표본 60명의 수축기 혈압을 측정하고 이 데이터를 기록했습니다. 60개의 행이 표본을 나타내며, 각 행은 기존 기기와 신형 기기를 사용하여 측정한 값을 표시합니다.
행 | 새 측정값 | 현재 측정값 |
1 | 100 | 100 |
2 | 122 | 120 |
3 | 129 | 132 |
4 | 136 | 139 |
5 | 110 | 110 |
6 | 111 | 110 |
7 | 137 | 137 |
8 | 134 | 133 |
9 | 141 | 140 |
10 | 112 | 112 |
이 사례에서는 현재 측정값을 예측(X) 변수로, 새 측정값을 반응(Y) 변수로 지정합니다. 회귀선을 이 데이터에 적합하면 현재 측정 기구의 측정값이 새 측정 기구의 측정값을 상당히 정확하게 예측한다는 사실을 확인할 수 있습니다. R-제곱 통계량은 현재 측정 기기가 새 측정 기기에서 관찰된 변동의 98.8%를 설명한다는 사실을 나타냅니다.
회귀 방정식은 다음과 같습니다.
새 측정값(New) = 1.387 + 0.9894 현재 측정값(Current)
이 데이터에서 현재 측정값이 새 측정값을 상당히 정확하게 예측할 수 있다는 사실을 확인할 수 있습니다. 실제로 엔지니어들은 예측 모형을 사용하여 새 기기가 기존 기기만큼 정확한 측정이 가능하다는 사실을 확인하곤 합니다. 또 다른 활용사례로는 더 빠른 측정이 필요한 경우를 들 수 있습니다. 예를 들어, 일부 부품이나 샘플을 배송하기 전에 실험실 측정을 통해 측정해야 할 수 있습니다. 그러나 실험실 측정은 프로세스에 따라 몇 시간이 소요되기도 합니다. 즉시 결과가 도출되는 측정 방법을 사용하여 실험실 측정을 예측할 수 있으며, 이를 통해 작업자와 엔지니어가 잠재적인 문제를 즉시 파악할 수 있습니다.
단순 선형 회귀 분석은 수평(가로 방향), 즉 X 방향에 오류가 없다고 가정할 수 있을 때 좋은 방법입니다. 이 예에서 이는 현재의 측정 시스템에 오류가 없음을 의미합니다. 측정 시스템의 경우 가정은 합리적이지 않으므로, 단순 선형 회귀 분석이 최적의 통계 방법이 아닙니다. 하지만 걱정하지 마세요. 단순 선형 회귀 분석만큼이나 쉽게 사용할 수 있는 다른 방법이 있습니다.
Deming 회귀 분석이라고도 하는 직교 회귀 분석은 두 기기나 방법이 비교 가능한 측정값을 도출하는지 파악하는 데 사용할 수 있습니다. 또한 직교 회귀 분석은 두 개의 연속 변수, 즉 하나의 반응(Y)과 하나의 예측 변수(X) 사이의 선형 관계를 점검합니다. 단순 선형 회귀 분석(최소 제곱 회귀 분석)과는 달리, 직교 회귀 분석에서는 반응과 예측 변수 모두 측정 오류를 포함합니다. 반면, 단순 선형 회귀 분석에서는 반응 변수만 측정 오류를 포함합니다. 두 변수 모두 측정 오류를 포함하는 경우에 단순 회귀 분석을 사용하여 비교 가능성을 결정하면 계산이 측정 오류가 없는 것으로 가정하는 변수가 무엇이냐에 따라 결과가 달라집니다. 직교 회귀 분석은 이 문제를 해결하여 변수의 역할이 결과에 거의 영향을 미치지 않게 합니다.
단순 선형 회귀 분석의 목표는 y값과 적합선의 해당 값 사이의 수직거리의 제곱 합을 최소화하는 것입니다. 직교 회귀 분석의 목표는 데이터 점에서 적합선 사이의 직교(직각) 거리를 최소화하는 것입니다. 이러한 접근법의 차이점은 사소해 보일 수 있지만, 사양과 관련된 측정과 부품을 평가하는 경우에는 상당히 다른 결론이 도출될 수 있습니다.
그러면 직교 회귀 분석을 사용하여 혈압계 데이터를 분석해보겠습니다.
직교 회귀 분석에서는 X(현재)와 Y(신규)의 오차 분산 비율을 지정해야 합니다. X와 Y의 측정 방법이 동일하다면 분산이 같을 가능성이 높으므로 비율이 1이 됩니다. 그러나 이를 추정하는 것이 좋습니다. 엔지니어들은 직교 회귀 분석의 데이터를 수집하기 전에 각 혈압계에 대해 별도의 연구를 수행하여 측정 변동을 추정했습니다. 또한 각 측정 기기에 대해 독립적인 Gage 반복성 및 재현성 연구(Gage R&R)를 수행하여 각 기기의 반복성에 대한 분산 성분을 도출하였습니다. 반복성에 대한 두 분산 성분의 비율 추정을 오차 분산 비율 필드의 입력으로 사용할 수 있습니다. 신형 혈압계의 분산은 1.08이었습니다. 타사 혈압계의 분산은 1.2였습니다. 엔지니어는 신형 혈압계를 반응 변수로, 타사 혈압계를 예측 변수로 지정했습니다. 이렇게 지정하는 경우, 오차 분산 비율은 1.08 / 1.2 = 0.9입니다.
적합선 그림을 보면 점이 회귀선에 가깝다는 것을 보여줍니다. 이는 모형이 데이터에 적합하다는 사실을 나타냅니다. 다음은 최소 제곱 적합치와 직교 적합치를 보여줍니다. 두 개의 적합 방정식은 그림 왼쪽 하단에서 확인할 수 있습니다.
직교 회귀 방정식은 다음과 같습니다. 새 측정값(New) = 0.644 + 0.995 현재 측정값(Current)
비록 선이 매우 유사해 보이기는 하지만, 직교 회귀 방정식은 단순 회귀 방정식과 다릅니다. 직교 회귀 방정식을 사용하여 두 측정 기기의 동등성을 파악할 수 있습니다.
다음 조건 중 하나에 해당하는 경우 결과는 혈압계가 동등하지 않다는 사실을 입증하는 것입니다.
보통 95%의 신뢰 수준이면 충분합니다. 95%의 신뢰 수준은 모집단에서 100개의 표본을 무작위로 선택하는 경우 그 중 약 95개 표본의 신뢰 구간이 계수의 실제값을 포함한다는 의미입니다. 데이터 집합의 신뢰 수준이 낮아질수록 구간이 좁아지며, 신뢰 수준이 높아질수록 구간이 넓어집니다.
결과에서 상수에 대한 신뢰 구간(약 -2.78~4.06)은 0을 포함한다는 사실을 확인할 수 있습니다. 현재(Current) 기울기에 대한 신뢰 구간(약 0.97~1.02)은 1을 포함합니다. 따라서 이 결과는 혈압계의 측정이 다름을 나타내는 증거를 제공하지 못합니다. 이러한 결과에 기반하여 이 제조사는 자사의 신형 측정 기기가 시장에 출시된 기존의 기기와 성능이 동일하다는 결론을 내릴 수 있습니다.
두 측정 시스템을 교정하는 경우 직교 회귀 분석을 통해 기기 또는 방법이 비교 가능한 측정값을 제공하는지 파악할 수 있습니다. 최소 제곱 회귀 분석이라고도 하는 단순 선형 회귀 분석과는 달리, 직교 선형 회귀 분석에서는 반응과 예측 변수 모두 측정 오류를 포함합니다. 의료기기 제조사는 직교 회귀 분석을 사용하여 자사의 측정 기구가 시장에 출시된 기존의 측정 기구와 동일하다는 결론을 내릴 수 있습니다.
직교 회귀 분석은 Minitab Statistical Software를 포함한 대부분의 통계 패키지에 포함되어 있습니다.