입원 시 환자의 체류 기간 예측 분석 및 파악하기 Predictive Analytics and Determining Patient Length of Stay at Time of Admission

José Padilla 22 August, 2020

Topics: Regression Analysis, Healthcare, Predictive Analytics, Minitab Statistical Software, regression trees, CART

Outside a hospital병원 입원부터 퇴원까지의 기간을 일수로 측정한 체류 기간은 적절하게 접근하지 않는 경우 대다수의 의료기관에 큰 비용을 초래할 수 있습니다. 또한 환자 흐름을 최적화하면 적합한 치료를 더욱 신속하게 제공하고, 대기 시간 및 입원 관련 위험에 대한 노출을 최소화하고, 병상, 의료 기기와 가용 병원 인력 등의 자원을 효율적으로 사용할 수 있습니다.

과거의 병원 데이터와 머신 러닝을 통합하여 환자 흐름과 리소스 계획 최적화하기

Centers for Medicare & Medicaid Services에 따르면 미국의 의료 지출 중 1/3이 입원 환자 치료로 인해 발생하므로, 환자의 병원 입원 기간을 관리하는 것은 매우 중요합니다. 그러나 이는 간단한 일이 아닙니다. 환자의 연령, 성별, 병력 및 기타 요소는 입원부터 퇴원까지의 기간에 각기 다른 정도의 영향을 미칩니다.

다행히 Minitab 에서 제공하는 예측 분석 도구는 대량의 가용 데이터를 활용하여 개별 환자의 결과를 예측할 수 있습니다. 다음은 환자의 입원 기간을 최적화하려는 한 의료 기관의 예입니다.

 

헬스케어 솔루션에 대한 정보 제공

데이터 분석 및 프로세스 개선 관련 뉴스 구독하기

 

예: 예측 분석을 사용하여 접수 즉시 환자의 입원 기간 예측

오리건주(Oregon)의 중소 병원이 자원을 더욱 효율적으로 계획하고 사용하는 것을 목표로 정했다고 가정해 보겠습니다. 이 병원의 운영팀은 지난 2년간 내원한 환자 8,500명 가량의 정보가 포함된 데이터 세트를 보유하고 있습니다. 이 데이터 세트에는 연령, 성별, 결혼 상태 등의 일반적인 정보부터 통증 수준, 종양 크기, 적혈구 수, 백혈구 수와 같은 의학적 정보까지 21가지 예측 변수 또는 관심 변수가 포함되어 있습니다. 다음은 Minitab의 환자 워크시트입니다.

Minitab worksheet of 20 predictors related to patient length of stay

워크시트에는 데이터 열이 22개 있는데, 첫 21개 열은 환자의 체류 기간을 예측하는 데 사용할 예측 변수 또는 변수를 나타내며 22번째 열은 입원 기간을 나타냅니다.  

 

회귀 트리를 사용하여 체류 기간 데이터 분석하기

머신 러닝 알고리즘은 가용 데이터를 사용하여 컴퓨터가 패턴을 인식하도록 '가르칩니다'. Minitab은 CART®(Classification and Regression Trees, 분류 및 회귀 트리)라는 예측 분석 도구를 제공합니다. 회귀 트리는 데이터를 유사한 응답 값으로 가장 적절하게 분류하는 예측 변수 설정에 기반하여 데이터를 파티션으로 분할하는 예/아니요 규칙을 생성하는 방식으로 작동하는 의사결정 트리 알고리즘입니다. 이 도구를 사용하면 다음을 수행할 수 있습니다.

  1. 입원 기간에 영향을 미치는 가장 중요한 변수 파악
  2. 평균 입원 기간의 연장이나 단축을 초래할 가능성이 높은 예측 변수 설정의 조합 파악
  3. 결과 시각화
  4. 이해하기 쉬우며 실시간으로 절차에 활용 및 적용할 수 있는 비즈니스 규칙 생성

회귀 트리를 생성하려면 통계 > 예측 분석 > CART® 회귀...를 클릭하세요.

다음은 완성된 대화 상자입니다.

CART Regression dialog box in Minitab

Minitab의 결과 창에 아래와 같이 트리 다이어그램이 표시됩니다. 트리 다이어그램에는 두 가지 형태의 노드가 있습니다. 보시다시피 다른 노드로 분할된 노드도 있고, 분할되지 않은 노드도 있는데 분할되지 않은 노드를 단말 노드(Terminal node)라고 합니다. 회귀 분석 트리의 각 단말 노드는 특정한 예측 변수 설정의 조합을 나타냅니다. 단말 노드의 수는 트리의 크기를 나타냅니다. 이 예에서 Minitab의 트리에는 단말 노드가 10개 있으므로 트리 크기는 10이 됩니다.

minitab-patient-los-regression-tree

결과 창에는 아래의 상대 변수 중요도 그래프도 표시됩니다. 이 그래프는 각 예측 변수가 환자 입원 기간의 변동성 설명에서 차지하는 상대적 중요도(%)를 나타냅니다. 이 예에서는 연령이 입원 기간 예측에 가장 중요한 변수이며, 암 진행 단계, 결혼 상태, 흡연 이력, 종양 수, 백혈구 수 또한 체류 기간 예측에 기여합니다.

Relative Variable Importance graph from CART Regression on patient length of stay

 

모형을 사용하여 환자의 체류 기간 예측하

Minitab의 예측... 옵션을 사용하면 이 모형을 통해 손쉬운 예측이 가능합니다. 다음은 새로운 케이스에 대한 예측입니다.

Predict dialog box in Minitab

 

아래는 이 예측의 결과입니다.

Output from Minitab prediction

설정의 결과에 각 예측 변수에 대해 입력한 값이 표시됩니다. 설정의 예측 아래에는 적합 값(이 경우에는 예상되는 평균 입원 기간)이 표시됩니다. 이러한 정보를 바탕으로 이 병원은 다음을 예측할 수 있습니다.

53세 기혼 남성

    • 암 2기 환자
    • 흡연 이력 없음
    • 내원 시 통증 수준 4에 해당하는 통증을 보고
    • 위의 다른 정보와 일치...

... 병원 입원 기간은 5.43일로 예상됩니다.

 

더욱 개선된 OpEx 팀의 환자 체류 기간 예측 정확도

병원 운영팀은 Minitab 의 CART 회귀 분석을 통해 환자 내원 시 파악한 정보에 기반하여 환자의 입원 기간을 정확하게 예측하는 데 필요한 데이터를 확보할 수 있습니다. 또한 다양한 증상의 환자들의 평균 입원 기간을 파악한 후에는 적절한 자원을 갖출 수 있도록 계획을 조정할 수 있습니다.

의료 분야의 솔루션 분석 사용 사례를 더 자세히 알아보거나 체험할 준비가 되셨나요?

Minitab에 문의하기