환자 재원 일수 및 흐름 예측

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

이 Azure 솔루션은 병원 관리자가 기계 학습의 기능을 사용하여 입원 기간 예측, 용량 플랜, 리소스 사용률을 개선하는 데 도움이 됩니다. 최고 의료 정보 책임자는 예측 모델을 사용하여 업무가 과중한 시설과 해당 시설 내에서 강화할 리소스를 결정할 수 있습니다. 진료 라인 관리자는 모델을 사용하여 환자의 퇴원을 처리하기에 적절한 직원 리소스가 있는지 여부를 결정할 수 있습니다.

아키텍처

의료 디바이스 및 Azure 서비스를 사용하는 원격 환자 모니터링 아키텍처의 다이어그램

이 아키텍처의 Visio 파일을 다운로드합니다.

데이터 흐름

다음 데이터 흐름은 위의 다이어그램에 해당합니다.

  1. EHR(전자 건강 기록) 및 EMR(전자 의료 기록)에서 익명화된 의료 데이터는 적절한 런타임(예: Azure, 자체 호스팅)과 함께 Azure Data Factory를 사용하여 추출됩니다. 이 시나리오에서는 ODBC, Oracle, SQL과 같은 Azure Data Factory 커넥터 중 하나를 사용하여 익명화된 데이터가 일괄 처리 추출에 액세스할 수 있다고 가정합니다. FHIR 데이터와 같은 다른 데이터 원본은 Azure Functions와 같은 중간 수집 서비스를 포함해야 할 수 있습니다.

  2. Azure Data Factory 데이터는 Data Factory를 통해 Azure Data Lake Storage(gen 2)로 흐릅니다. 이 프로세스 중에는 Azure Data Factory 데이터가 저장되지 않으며, 이 단계에서 연결 끊기와 같은 오류를 처리/다시 시도할 수 있습니다.

  3. Azure Machine Learning은 2단계에서 수집된 데이터에 기계 학습 알고리즘/파이프라인을 적용하는 데 사용됩니다. 알고리즘은 요구 사항에 따라 이벤트 기반, 예약 또는 수동으로 적용할 수 있습니다. 특히 여기에는 다음이 포함됩니다.

    3.1 학습 - 수집된 데이터는 선형 회귀 및 그라데이션 향상된 의사 결정 트리와 같은 알고리즘의 조합을 사용하여 기계 학습 모델을 학습하는 데 사용됩니다. 이러한 알고리즘은 일반적으로 파이프라인에서 다양한 프레임워크(예: scikit-learn)를 통해 제공되며, 사전/사후 처리 파이프라인 단계를 포함할 수 있습니다. 예를 들어 기존 사전 처리된(예: null 행 삭제) EMR/EHR 데이터에서 들어오는 입원 유형과 같은 환자 상태 요인을 사용하여 선형 회귀와 같은 회귀 모델을 학습시킬 수 있습니다. 그러면 모델은 새로운 환자 재원 일수를 예측할 수 있습니다.

    3.2 유효성 검사 - 모델 성능은 기존 모델/테스트 데이터와 비교되며 API(애플리케이션 프로그래밍 인터페이스)와 같은 다운스트림 사용량 대상과도 비교됩니다.

    3.3 배포 - 모델은 다른 대상 환경에서 사용하기 위해 컨테이너를 사용하여 패키지됩니다.

    3.4 모니터링 - 시간이 지남에 따라 성능이 저하되지 않도록 모델 예측을 수집하고 모니터링합니다. 이 모니터링 데이터를 사용하여 필요에 따라 모델에 대한 수동 또는 자동화된 재학습/업데이트를 트리거하기 위해 경고를 보낼 수 있습니다. 추출된 모니터링 데이터의 유형에 따라 Azure Monitor와 같은 추가 서비스가 필요할 수 있습니다.

  4. Azure Machine Learning 출력은 Azure Synapse Analytics로 흐릅니다. 모델 출력(예상 환자 재원 일수)은 확장 가능한 기존 환자 데이터와 결합되어 다운스트림 사용량 전용 SQL 풀과 같은 레이어를 제공합니다. 이 시점에서 Synapse Analytics를 통해 병원당 평균 재원 일수와 같은 추가 분석을 수행할 수 있습니다.

  5. Azure Synapse Analytics는 Power BI에 데이터를 제공합니다. 특히 Power BI는 4단계에서 서비스 레이어에 연결하여 데이터를 추출하고 필요한 의미적 모델링을 추가로 적용합니다.

  6. Power BI는 진료 라인 관리자 및 병원 리소스 코디네이터의 분석에 사용됩니다.

구성 요소

  • ADF(Azure Data Factory)는 추가 비용 없이 90개 이상의 유지 관리 없는 기본 제공 커넥터와 데이터 원본을 시각적으로 통합할 수 있는 완전 관리형 서버리스 데이터 통합 및 오케스트레이션 서비스를 제공합니다. 이 시나리오에서 ADF는 데이터를 수집하고 데이터 흐름을 오케스트레이션하는 데 사용됩니다.

  • ADLS(Azure Data Lake Storage)는 고성능 분석 워크로드를 위한 확장성 있고 안전한 데이터 레이크입니다. 이 시나리오에서 ADLS는 확장 가능하고 비용 효율적인 데이터 스토리지 레이어로 사용됩니다.

  • AML(Azure Machine Learning) 서비스는 다음을 통해 엔드투엔드 LOS 예측 기계 학습 수명 주기를 가속화합니다.

    • 기계 학습 모델을 빌드, 학습, 배포하고 팀 협업을 촉진할 수 있는 광범위한 생산적인 환경을 통해 데이터 과학자와 개발자에게 권한을 부여합니다.
    • 업계 최고의 MLOps(기계 학습 운영 또는 기계 학습용 DevOps)를 사용하여 출시 시간을 단축합니다.
    • 책임 있는 기계 학습을 위해 설계된 안전하고 신뢰할 수 있는 플랫폼에서 혁신합니다.

    이 시나리오에서 AML은 환자 재원 일수를 예측하고 엔드투엔드 모델 수명 주기를 관리하는 데 사용되는 모델을 생성하는 데 사용되는 서비스입니다.

  • Azure Synapse Analytics: 데이터 통합, 엔터프라이즈 데이터 웨어하우징 및 빅데이터 분석을 결합하는 무제한 분석 서비스입니다. 이 시나리오에서 Synapse는 모델 예측을 기존 데이터 모델에 통합하고 다운스트림 사용을 위한 고속 서비스 레이어를 제공하는 데 사용됩니다.

  • Power BI는 엔터프라이즈 규모에서 셀프 서비스 분석을 제공하므로 다음을 수행할 수 있습니다.

    • 모두를 위한 비즈니스 인텔리전스를 사용하여 데이터 기반 문화를 생성합니다.
    • 민감도 레이블 지정, 엔드투엔드 암호화, 실시간 액세스 모니터링을 비롯한 업계 최고의 데이터 보안 기능을 사용하여 데이터를 안전하게 유지합니다.

    이 시나리오에서 Power BI는 최종 사용자 대시보드를 생성하고 해당 대시보드에 필요한 모든 의미적 모델링을 적용하는 데 사용됩니다.

대안

  • Azure Synapse Analytics Spark 및 Azure Databricks와 같은 Spark 서비스는 데이터 과학 팀의 데이터 확장 및 기술 집합에 따라 기계 학습을 수행하는 대안으로 사용할 수 있습니다.
  • MLFlow는 고객 기술 세트/환경에 따라 Azure Machine Learning의 대안으로 엔드투엔드 수명 주기를 관리하는 데 사용할 수 있습니다.
  • Azure Synapse Analytics 파이프라인은 주로 특정 고객 환경에 따라 대부분의 경우 Azure Data Factory 대신 사용할 수 있습니다.

시나리오 정보

의료 시설을 운영하는 사람들의 경우, LOS(재원 일수)(환자 입원에서 퇴원까지의 일 수)이 중요합니다. 그러나, 그 수는 같은 의료 시스템 내에서도 시설, 질병 상태, 전문 분야에 따라 다를 수 있으므로 환자 흐름을 추적하고 그에 따라 계획하기 어려울 수 있습니다.

이 솔루션은 입원에 대한 LOS 모델을 사용하도록 설정합니다. LOS는 환자가 지정된 병원 시설에 입원한 최초 날짜에서 퇴원한 날짜까지의 일수로 정의됩니다. 동일한 의료 시스템 내에서도 다양한 시설, 질병 상태, 전문 분야에 따라 LOS의 상당한 변화가 있을 수 있습니다.

환자의 재원 일수와 치료의 질과의 관련성과 같은 연구 결과에서는 위험 조정 LOS가 길수록 받은 치료의 질이 낮다는 상관 관계가 있다는 것을 보여 주었습니다. 입원 시 고급 LOS 예측은 공급자에게 현재 환자 LOS와 비교하기 위한 메트릭으로 사용할 수 있는 예상 LOS를 제공함으로써 환자가 받는 치료의 질을 향상시킬 수 있습니다. 이를 통해 예상보다 LOS가 긴 환자가 적절한 치료를 받도록 할 수 있습니다. LOS 예측은 또한 정확한 퇴원 계획을 세우는 데 도움이 되기 때문에 재입원과 같은 다양한 다른 품질 측정값을 낮출 수 있습니다.

잠재적인 사용 사례

병원 관리에는 환자의 가족뿐만 아니라 보다 신뢰할 수 있는 재원 일수 예측의 혜택을 기대할 수 있는 두 가지 비즈니스 사용자가 있습니다.

  • CMIO(최고 의료 정보 책임자)는 의료 조직의 정보학/기술과 의료 전문가 간의 격차를 해소합니다. 이들의 업무에는 일반적으로 분석을 통해 병원 네트워크 내에서 리소스가 적절하게 할당되고 있는지 확인하는 작업이 포함됩니다. CMIO는 어떤 시설의 업무가 과중한지, 특히 이러한 리소스를 수요에 맞게 재조정하기 위해 강화해야 할 수 있는 리소스를 결정할 수 있어야 합니다.
  • 진료 라인 관리자는 환자 진료와 직접 관련이 있습니다. 이 역할은 개별 환자의 상태를 모니터링하고, 직원이 환자의 특정 진료 요구 사항을 충족할 수 있는지 확인해야 합니다. 진료 라인 관리자는 정확한 의료 결정을 내리고 올바른 리소스를 사전에 맞출 수 있습니다. 예를 들어 다음과 같는 경우 LOS를 예측할 수 있습니다.
    • 환자 위험에 대한 초기 평가는 특히 ICU에서와 같이 리소스가 제한된 경우 더 나은 리소스 플랜 및 할당을 위해 중요하기 때문입니다.
    • 진료 라인 관리자는 직원 리소스가 환자의 퇴원을 처리하기에 적절한지 여부를 결정할 수 있습니다.
  • ICU에서 LOS를 예측하는 것은 환자와 그 가족뿐만 아니라 보험 회사에도 유익합니다. 병원에서 퇴원할 것으로 예상되는 날짜는 환자와 그 가족이 진료비를 파악하고 추정하는 데 도움이 됩니다. 이것은 또한 가족에게 환자의 회복 속도에 대한 아이디어를 제공하고, 퇴원을 계획하고, 예산을 관리하는 데 도움이 됩니다.

고려 사항

이러한 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 일단의 지침 원칙인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Microsoft Azure Well-Architected Framework를 참조하세요.

비용 최적화

비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 방법을 찾는 것입니다. 자세한 내용은 비용 최적화 핵심 요소 개요를 참조하세요.

이 솔루션의 가장 비싼 구성 요소는 컴퓨팅이며 데이터 볼륨을 사용하여 컴퓨팅을 비용 효율적으로 확장하는 여러 가지 방법이 있습니다. 한 가지 예는 단일 노드 솔루션이 아닌 데이터 엔지니어링 작업에 Azure Synapse Analytics Spark 또는 Azure Databricks와 같은 Spark 서비스를 사용하는 것입니다. Spark는 수평으로 확장되며 수직으로 확장되는 대규모 단일 노드 솔루션에 비해 비용 효율적입니다.

이 아키텍처에 구성된 모든 Azure 구성 요소에 대한 가격 책정은 이 Azure 가격 계산기 저장된 예상치에서 찾을 수 있습니다. 이 추정치는 월요일부터 금요일, 오전 9시부터 오후 5시까지 실행되는 기본 구현에 대해 예상 선불 및 월별 비용을 표시하도록 구성됩니다.

운영 우수성

운영 우수성에서는 프로덕션에서 애플리케이션을 배포하고 계속 실행하는 운영 프로세스를 다룹니다. 자세한 내용은 운영 우수성 핵심 요소 개요를 참조하세요.

MLOps(견고한 기계 학습 운영) 사례 및 구현은 이러한 유형의 솔루션을 프로덕션화하는 데 중요한 역할을 합니다. 자세한 내용은 MLOps(기계 학습 운영)를 참조하세요.

성능 효율성

성능 효율성은 사용자가 배치된 요구 사항을 효율적인 방식으로 충족하기 위해 워크로드의 크기를 조정할 수 있는 기능입니다. 자세한 내용은 성능 효율성 핵심 요소 개요를 참조하세요.

이 시나리오에서 데이터 사전 처리는 Azure Machine Learning에서 수행됩니다. 이 디자인은 중소 규모의 데이터 볼륨에서 작동하지만 거의 실시간 SLA가 있는 대규모 데이터 볼륨 또는 시나리오는 성능 관점에서 어려움을 겪을 수 있습니다. 이러한 유형의 문제를 해결하는 한 가지 방법은 데이터 엔지니어링 또는 데이터 과학 워크로드에 Azure Synapse Analytics Spark 또는 Azure Databricks와 같은 Spark 서비스를 사용하는 것입니다. Spark는 수평으로 확장되며 의도적으로 분산되어 대규모 데이터 세트를 매우 효과적으로 처리할 수 있습니다.

보안

우수한 보안은 중요한 데이터 및 시스템에 대한 고의적인 공격과 악용을 방어합니다. 자세한 내용은 보안 요소의 개요를 참조하세요.

중요

이 아키텍처는 익명화된 의료 데이터와 익명화되지 않은 의료 데이터 모두에서 작동합니다. 그러나 보안 구현을 위해 상태 데이터는 EHR 및 EMR 원본에서 익명화된 형태로 원본화하는 것이 좋습니다.

Azure Machine Learning에 사용할 수 있는 보안 및 거버넌스 기능에 대한 자세한 내용은 Azure Machine Learning을 위한 엔터프라이즈 보안 및 거버넌스를 참조하세요.

참가자

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

주요 작성자:

  • Dhanshri More | 수석 클라우드 솔루션 설계자
  • DJ Dean | 수석 클라우드 솔루션 설계자

비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.

다음 단계

이 아키텍처 구현과 관련된 기술 및 리소스:

이 아키텍처와 관련된 추가 Azure 아키텍처 센터 콘텐츠를 참조하세요.