Прогнозирование продолжительности пребывания и потока пациента

Фабрика данных Azure
Azure Data Lake Storage
Машинное обучение Azure
Azure Synapse Analytics
Power BI

Это решение Azure помогает администраторам лечебных учреждений задействовать возможности машинного обучения и с их помощью прогнозировать продолжительность госпитализации, а также улучшать планирование загрузки отделений и использование ресурсов. Главный медицинский сотрудник может использовать прогнозную модель, чтобы определить, какие объекты перенацениваются и какие ресурсы для укрепления в этих объектах. Менеджер по линии ухода может использовать модель, чтобы определить, есть ли достаточные ресурсы персонала для обработки освобождения пациента.

Архитектура

Схема архитектуры удаленного мониторинга пациентов с помощью медицинских устройств и служб Azure.

Скачайте файл Visio для этой архитектуры.

Поток данных

Следующий поток данных соответствует приведенной выше схеме:

  1. Анонимные данные о работоспособности из электронных записей здравоохранения (EHR) и электронных медицинских записей (EMR) извлекаются с помощью Фабрика данных Azure с соответствующей средой выполнения (например, Azure, локальной). В этом сценарии предполагается, что анонимные данные доступны для пакетного извлечения с помощью одного из соединителей Фабрика данных Azure, таких как ODBC, Oracle, SQL. Для других источников данных, таких как данные FHIR, может потребоваться включение промежуточной службы приема, например Функции Azure.

  2. Фабрика данных Azure данные передаются через фабрику данных в Azure Data Lake Storage (2-го поколения). Данные не хранятся в Фабрика данных Azure во время этого процесса, и такие ошибки, как удаленные подключения, могут обрабатываться или извлекаться во время этого шага.

  3. Машинное обучение Azure используется для применения алгоритмов и конвейеров машинного обучения к данным, полученные на шаге 2. Алгоритмы могут применяться на основе событий, запланированных или вручную в зависимости от требований. В частности, это включает в себя:

    3.1 Обучение . Прием данных используется для обучения модели машинного обучения с помощью сочетания алгоритмов, таких как линейное регрессия и дерево градиентных решений. Эти алгоритмы предоставляются с помощью различных платформ (например, scikit-learn) обычно в конвейере и могут включать этапы конвейера предварительной или последующей обработки. Например, данные EMR/EHR могут использоваться для обучения модели регрессии, например линейной регрессии. Затем модель сможет предсказать новую продолжительность пребывания пациента.

    3.2 Проверка . Производительность модели сравнивается с существующими моделями или тестируемыми данными, а также с любыми нижестоящими целевыми объектами потребления, такими как интерфейсы программирования приложений (API).

    3.3 Развертывание . Модель упаковается с помощью контейнера для использования в разных целевых средах.

    3.4 Монитор . Прогнозы модели собираются и отслеживаются, чтобы производительность не ухудшалась с течением времени. Оповещения можно отправлять для активации ручного или автоматического переобучения или обновления модели при необходимости с помощью этих данных мониторинга. Обратите внимание, что могут потребоваться дополнительные службы, такие как Azure Monitor, в зависимости от типа извлеченных данных мониторинга.

  4. Машинное обучение Azure потоки выходных данных в Azure Synapse Analytics. Выходные данные модели (прогнозируемая продолжительность пребывания пациента) объединяются с существующими данными пациента в масштабируемом слое, например выделенном пуле SQL для потребления нижестоящего потока. Дополнительные аналитические данные, такие как средняя продолжительность пребывания в больнице, можно сделать с помощью Synapse Analytics на этом этапе.

  5. Azure Synapse Analytics предоставляет данные в Power BI. В частности, Power BI подключается к уровню обслуживания на шаге (4) для извлечения данных и применения дополнительного семантического моделирования.

  6. Power BI используется для анализа руководителем линии ухода и координатором ресурсов больницы.

Компоненты

  • Фабрика данных Azure (ADF) предоставляет полностью управляемые, бессерверные службы интеграции и оркестрации данных, способные визуально интегрировать источники данных с более чем 90+ встроенными соединителями без дополнительных затрат. В этом сценарии ADF используется для приема данных и оркестрации потоков данных.

  • Azure Data Lake (ADLS) предоставляет масштабируемое безопасное озеро данных для высокопроизводительной аналитики. В этом сценарии ADLS используется как масштабируемый и экономичный уровень хранения данных.

  • службы Машинное обучение Azure (AML) ускоряют полный жизненный цикл машинного обучения лос-анджелеса, выполнив следующие действия.

    • Расширение возможностей специалистов по обработке и анализу данных и разработчиков с широким спектром эффективных возможностей для создания, обучения и развертывания моделей машинного обучения и содействия совместной работе команды.
    • Ускорение времени на рынок с помощью ведущих в отрасли MLOps — операций машинного обучения или DevOps для машинного обучения.
    • Инновации на безопасной доверенной платформе, предназначенной для ответственного машинного обучения.

    В этом сценарии AML — это служба, используемая для создания модели, используемой для прогнозирования длительности пребывания пациентов и управления комплексным жизненным циклом модели.

  • Azure Synapse Analytics: безграничная служба аналитики, которая объединяет интеграцию данных, хранение корпоративных данных и аналитику больших данных. В этом сценарии Synapse используется для включения прогнозов модели в существующую модель данных, а также для обеспечения высокого уровня обслуживания для потребления нижестоящего потока.

  • Power BI предоставляет самостоятельную аналитику в масштабе предприятия, что позволяет:

    • Создайте язык и региональные параметры, управляемые данными, с бизнес-аналитикой для всех.
    • Обеспечение безопасности данных с помощью ведущих в отрасли возможностей безопасности данных, включая метку конфиденциальности, сквозное шифрование и мониторинг доступа в режиме реального времени.

    В этом сценарии Power BI используется для создания панелей мониторинга конечных пользователей и применения любого семантического моделирования, необходимого для этих панелей мониторинга.

Альтернативные варианты

  • Службы Spark, такие как Azure Synapse Analytics Spark и Azure Databricks, можно использовать в качестве альтернативы для выполнения машинного обучения в зависимости от масштаба данных и набора навыков команды по обработке и анализу данных.
  • MLFlow можно использовать для управления комплексным жизненным циклом в качестве альтернативы Машинное обучение Azure в зависимости от набора навыков или среды клиента.
  • Конвейеры Azure Synapse Analytics можно использовать в качестве альтернативы Фабрика данных Azure в большинстве случаев в зависимости от конкретной клиентской среды.

Подробности сценария

Для людей, работающих в медицинском учреждении, продолжительность пребывания (LOS) — количество дней от приема пациентов до выписки — имеет значение. Однако это число может различаться в разных учреждениях и в разных условиях заболевания и специальностях, даже в одной системе здравоохранения, что делает его трудно отслеживать поток пациентов и планировать соответствующим образом.

Это решение позволяет прогнозной модели для ЛОС для приемов в больнице. LOS определяется в количестве дней от первоначальной даты приема до даты, когда пациент выписан из любого данного больничного учреждения. Существует значительный вариант LOS на различных объектах, заболеваниях и специальностях, даже в одной системе здравоохранения.

Исследования, такие как продолжительность пребывания пациентов, связанных с качеством ухода? показали, что более длительный риск скорректированный ЛОС коррелируется с более низким качеством ухода. Расширенный прогноз LOS во время приема может повысить качество лечения пациентов, давая поставщикам ожидаемый ЛОС, который они могут использовать в качестве метрики для сравнения с текущим пациентом LOS. Это может помочь обеспечить пациентов с более длительным, чем ожидалось, ЛОС получают соответствующее внимание. Прогнозирование LOS также помогает с точным планированием разрядов, что приводит к снижению различных других мер качества, таких как ремиссии.

Потенциальные варианты использования

Существует два разных бизнес-пользователей в управлении больницами, которые могут ожидать, чтобы получить выгоду от более надежных прогнозов продолжительности пребывания, а также семей пациентов:

  • Главный медицинский информационный директор (CMIO), который перестраивает разделение между информатиками/технологиями и медицинскими специалистами в организации здравоохранения. В его обязанности обычно входит анализ, который позволяет определить, правильно ли распределены ресурсы в сети медицинских учреждений. CMIO должен иметь возможность определить, какие объекты перераспределяются, и в частности, какие ресурсы на этих объектах могут быть усилены, чтобы перестроить такие ресурсы с спросом.
  • Менеджер по линии ухода, который непосредственно участвует в уходе за пациентами. Эта роль требует мониторинга состояния отдельных пациентов и обеспечения того, чтобы сотрудники были доступны для удовлетворения конкретных требований к уходу своих пациентов. Менеджер по уходу может принимать точные медицинские решения и выравнивать правильные ресурсы заранее. Например, возможность прогнозирования ЛОС:
    • как начальная оценка риска пациентов имеет решающее значение для лучшего планирования ресурсов и распределения ресурсов, особенно если ресурсы ограничены, как и в ICUs.
    • позволяет менеджерам по линии ухода определить, будут ли сотрудники достаточными для обработки освобождения пациента.
  • Прогнозирование ЛОС в ICU также полезно для пациентов и их семей, а также страховых компаний. Ожидаемая дата выписки из больницы помогает пациентам и их семьям понять и оценить медицинские расходы. Это также дает семьям представление о скорости восстановления пациента, и помогает им планировать разгрузку и управлять их бюджетами.

Рекомендации

Эти рекомендации реализуют основные принципы платформы Azure Well-Architected Framework, которая является набором руководящих принципов, которые можно использовать для улучшения качества рабочей нагрузки. Дополнительные сведения см. в статье Microsoft Azure Well-Architected Framework.

Оптимизация затрат

Оптимизация затрат заключается в поиске способов уменьшения ненужных расходов и повышения эффективности работы. Дополнительные сведения см. в разделе Обзор критерия "Оптимизация затрат".

Самым дорогим компонентом этого решения является вычисление, и существует несколько способов масштабирования вычислительных ресурсов с объемом данных. Один из примеров — использовать службу Spark, например Azure Synapse Analytics Spark или Azure Databricks для работы по проектированию данных, а не решение одного узла. Spark горизонтально масштабируется и более экономично по сравнению с крупными, вертикально масштабируемыми решениями с одним узлом.

Цены на все компоненты Azure, настроенные в этой архитектуре, можно найти в этой оценке калькулятора цен Azure. Эта оценка настроена для отображения предполагаемых предварительных и ежемесячных затрат для базовой реализации, которая выполняется 9 утра-5 вечера в понедельник по пятницу.

Эффективность работы

Оперативное превосходство охватывает процессы операций, которые развертывают приложение и продолжают работать в рабочей среде. Дополнительные сведения см. в разделе "Общие сведения о принципах эффективности работы".

Практика и реализация твердых Машинное обучение операций (MLOps) играет важную роль в производстве этого типа решения. Дополнительные сведения см. в разделе "Операции машинного обучения" (MLOps).

Оптимизация производительности

Уровень производительности — это способность вашей рабочей нагрузки эффективно масштабироваться в соответствии с требованиями, предъявляемыми к ней пользователями. Дополнительные сведения см. в разделе "Общие сведения о эффективности производительности".

В этом сценарии предварительная обработка данных выполняется в Машинное обучение Azure. Хотя эта конструкция будет работать для небольших и средних томов данных, большие объемы данных или сценарии с соглашениями об уровне обслуживания практически в режиме реального времени могут бороться с точки зрения производительности. Одним из способов решения этой проблемы является использование службы Spark, такой как Azure Synapse Analytics Spark или Azure Databricks для проектирования данных или рабочих нагрузок обработки и анализа данных. Spark масштабируется горизонтально и распределяется по проектированию, что позволяет обрабатывать большие наборы данных очень эффективно.

Безопасность

Безопасность обеспечивает гарантии от преднамеренного нападения и злоупотребления ценными данными и системами. Дополнительные сведения см. в разделе "Общие сведения о компоненте безопасности".

Внимание

Эта архитектура будет работать как с анонимными, так и неанонимизированными данными о работоспособности. Однако для обеспечения безопасной реализации рекомендуется, чтобы данные о работоспособности были источником в анонимизированной форме из источников EHR и EMR.

Дополнительные сведения о функциях безопасности и управления, доступных для Машинное обучение Azure, см. в разделе "Корпоративная безопасность и управление" для Машинное обучение Azure

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.

Основные авторы:

  • Dhanshri More | Главный архитектор облачных решений
  • DJ Дин | Главный архитектор облачных решений

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги

Технологии и ресурсы, связанные с реализацией этой архитектуры:

Дополнительные сведения о центре архитектуры Azure, связанном с этой архитектурой: