Predicción de la duración de la estancia y el flujo de pacientes

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

Esta solución de Azure ayuda a los administradores del hospital a usar el potencial del aprendizaje automático para predecir el tiempo de estancia de las admisiones hospitalarias, con el fin de mejorar la planificación de la capacidad y la utilización de los recursos. Un director de informática médica puede usar un modelo predictivo para determinar qué instalaciones están sobrecargadas y qué recursos se deben reforzar dentro de esas instalaciones. Un responsable de la línea de atención al paciente puede usar un modelo para determinar si los recursos de personal son adecuados para controlar el alta de un paciente.

Architecture

Diagrama de la arquitectura de supervisión remota de pacientes mediante dispositivos sanitarios y servicios de Azure.

Descargue un archivo Visio de esta arquitectura.

Flujo de datos

El siguiente flujo de datos corresponde al diagrama anterior:

  1. Los datos de salud anonimizados de los registros de salud electrónicos (EHR) y los registros médicos electrónicos (EMR) se extraen mediante Azure Data Factory con el tiempo de ejecución adecuado (por ejemplo, Azure, autohospedado). En este escenario, se supone que se puede acceder a los datos anonimizados para su extracción por lotes mediante uno de los conectores de Azure Data Factory, como ODBC, Oracle y SQL. Otros orígenes de datos, como los datos FHIR, pueden requerir la inclusión de un servicio de ingesta intermedio como Azure Functions.

  2. Los datos de Azure Data Factory fluyen a través de Data Factory a Azure Data Lake Storage (gen2). No se almacenan datos en Azure Data Factory durante este proceso y los pasos con errores, como las conexiones eliminadas, se pueden controlar o reintentar durante este paso.

  3. Azure Machine Learning se usa para aplicar algoritmos o canalizaciones de aprendizaje automático a los datos ingeridos en el paso 2. Los algoritmos se pueden aplicar en función de eventos, mediante programación o de forma manual, según los requisitos. En concreto, incluye:

    3.1 Entrenamiento: los datos ingeridos se usan para entrenar un modelo de Machine Learning mediante una combinación de algoritmos como la regresión lineal y el árbol de decisión ampliado por degradado. Estos algoritmos se proporcionan a través de varios marcos (por ejemplo, scikit-learn) normalmente en una canalización y pueden incluir pasos de canalización previos y posteriores al procesamiento. Por ejemplo, los factores de salud del paciente, como el tipo de admisión, procedentes de los datos EMR/EHR existentes, previamente procesados (por ejemplo, se han quitado las filas nulas), podrían usarse para entrenar un modelo de regresión como la Regresión lineal. Después, el modelo sería capaz de predecir la duración de una nueva estancia del paciente.

    3.2 Validación: el rendimiento del modelo se compara con datos de modelos o de prueba existentes y también con los objetivos de consumo de bajada, como interfaces de programación de aplicaciones (API).

    3.3 Implementación: el modelo se empaqueta mediante un contenedor para su uso en diferentes entornos de destino.

    3.4 Supervisión: las predicciones del modelo se recopilan y supervisan para garantizar que el rendimiento no se degrada con el tiempo. Se pueden enviar alertas para desencadenar reentrenamiento o actualizaciones manuales o automatizadas en el modelo, según sea necesario, mediante estos datos de supervisión. Tenga en cuenta que es posible que se necesiten servicios adicionales como Azure Monitor, en función del tipo de datos de supervisión extraídos.

  4. Flujos de salida de Azure Machine Learning para Azure Synapse Analytics. La salida del modelo (duración prevista de la estancia del paciente) se combina con los datos de pacientes existentes en una capa de servicio escalable como el grupo de SQL dedicado para el consumo de bajada. Ahora, se pueden realizar análisis adicionales, como la duración media de estancia por hospital, mediante Synapse Analytics.

  5. Azure Synapse Analytics proporciona datos a Power BI. En concreto, Power BI se conecta a la capa de servicio en el paso (4) para extraer los datos y aplicar el modelado semántico adicional necesario.

  6. Power BI se usa para el análisis por parte del administrador de la línea de atención al paciente y el coordinador de recursos del hospital.

Componentes

  • Azure Data Factory (ADF) proporciona una integración de datos sin servidor totalmente administrada y un servicio de orquestación capaz de integrar visualmente orígenes de datos con más de 90 conectores integrados, sin mantenimiento y sin costo adicional. En este escenario, ADF se usa para ingerir datos y organizar los flujos de datos.

  • Azure Data Lake (ADLS) proporciona un lago de datos seguro y escalable para el análisis de alto rendimiento. En este escenario, ADLS se usa como una capa de almacenamiento de datos escalable y rentable.

  • Los servicios de Azure Machine Learning (AML) aceleran el ciclo de vida de aprendizaje automático de la predicción de la duración de la estancia de un extremo a otro, mediante:

    • La capacitación de los científicos de datos y desarrolladores con una amplia gama de experiencias productivas para crear, entrenar e implementar modelos de Machine Learning y fomentar la colaboración en equipo.
    • Aceleración del tiempo de comercialización con MLOps líder del sector: operaciones de aprendizaje automático o DevOps para el aprendizaje automático.
    • Innovación en una plataforma segura y de confianza diseñada para el aprendizaje automático responsable.

    En este escenario, AML es el servicio que se usa para generar el modelo empleado para predecir la duración de la estancia del paciente y para administrar el ciclo de vida del modelo de un extremo a otro.

  • Azure Synapse Analytics: servicio de análisis ilimitado que combina la integración de datos, el almacenamiento de datos empresariales y el análisis de macrodatos. En este escenario, Synapse se usa para incorporar las predicciones del modelo en el modelo de datos existente y también para proporcionar una capa de servicio de alta velocidad para el consumo de bajada.

  • Power BI proporciona análisis de autoservicio a escala empresarial, lo que le permite:

    • Crear una referencia cultural controlada por datos con inteligencia empresarial para todos.
    • Mantener seguros los datos con funcionalidades de seguridad de datos líderes del sector, como el etiquetado de confidencialidad, el cifrado de un extremo a otro y la supervisión del acceso en tiempo real.

    En este escenario, Power BI se usa para crear paneles de usuario final y aplicar cualquier modelado semántico necesario en esos paneles.

Alternativas

  • Los servicios de Spark, como Azure Synapse Analytics Spark y Azure Databricks, se pueden usar como alternativa para realizar el aprendizaje automático, según la escala de datos y el conjunto de aptitudes del equipo de ciencia de datos.
  • MLFlow se puede usar para administrar el ciclo de vida de un extremo a otro como alternativa a Azure Machine Learning en función del conjunto de aptitudes o el entorno del cliente.
  • Las canalizaciones de Azure Synapse Analytics se pueden usar como alternativa a Azure Data Factory en la mayoría de los casos, dependiendo en gran medida del entorno de cliente específico.

Detalles del escenario

Para las personas que dirigen un centro de atención sanitaria, la duración de la estancia (LOS: el número de días transcurridos desde la admisión del paciente hasta su alta) importa. Sin embargo, dicho número puede variar no solo en función del centro sino también de las especialidades y de las condiciones de las enfermedades, incluso dentro del mismo sistema sanitario, lo que dificulta el seguimiento del flujo y planificación de los pacientes en consecuencia.

Esta solución permite contar con un modelo predictivo para la duración de la estancia en las admisiones hospitalarias. La duración de la estancia se define como el número de días que transcurren desde la fecha de admisión inicial hasta la fecha en la que el paciente es dado de alta en un centro hospitalario determinado. Puede haber una variación significativa de la duración de la estancia entre los distintos centros, las condiciones de la enfermedad y las especialidades, incluso dentro del mismo sistema sanitario.

Estudios como ¿Está la duración de la estancia de los pacientes relacionada con la calidad de atención? han demostrado que una duración de la estancia mayor ajustada al riesgo se correlaciona con una menor calidad de atención recibida. La predicción avanzada de la duración de la estancia en el momento de la admisión puede mejorar la calidad de atención al paciente, proporcionando a los proveedores la duración de la estancia esperada que pueden usar como métrica para comparar con la duración de la estancia actual del paciente. Esto puede ayudar a garantizar que los pacientes con una duración de la estancia mayor de la esperada reciban la atención adecuada. La predicción de la duración de la estancia también ayuda al planeamiento preciso de las altas, lo que reduce otras medidas de calidad, como las readmisiones.

Posibles casos de uso

Hay dos usuarios empresariales diferentes en la administración de hospitales que podrán beneficiarse de unas predicciones más confiables sobre la duración de las estancias, así como las familias de los pacientes:

  • El director de informática médica (CMIO), que se encuentra en la línea divisoria entre los profesionales informáticos o técnicos y los profesionales sanitarios en un centro de atención médica. Sus tareas suelen incluir el uso de análisis para determinar si se están asignando correctamente los recursos en una red de hospital. El CMIO debe ser capaz de determinar qué instalaciones están sobrecargadas y, en concreto, qué recursos de esas instalaciones se deben reforzar para reajustar esos recursos con la demanda.
  • El administrador de la línea de atención al paciente, que está directamente implicado en la atención a los pacientes. Este rol requiere la supervisión del estado de cada paciente y asegurarse de que hay personal disponible para atender las necesidades de atención específicas de los pacientes. El administrador de la línea de atención al paciente puede tomar decisiones médicas precisas y alinear los recursos adecuados con antelación. Por ejemplo, la capacidad de predecir la duración de la estancia:
    • Como evaluación inicial del riesgo de los pacientes es fundamental para una mejor planificación y asignación de recursos, especialmente cuando los recursos están limitados, como en las UCI.
    • Permite a los administradores de la línea de atención al paciente determinar si los recursos de personal serán los adecuados para administrar el alta de un paciente.
  • Predecir la duración de la estancia en la UCI también es beneficioso para los pacientes y sus familias, así como compañías de seguros. Una fecha prevista de alta del hospital ayuda a los pacientes y a sus familias a comprender y calcular los costos médicos. También proporciona a las familias una idea sobre el ritmo de recuperación de un paciente, y les ayuda a planear el alta y a administrar sus presupuestos.

Consideraciones

Estas consideraciones implementan los pilares del marco de buena arquitectura de Azure, que es un conjunto de principios guía que se pueden usar para mejorar la calidad de una carga de trabajo. Para más información, consulte Marco de buena arquitectura de Microsoft Azure.

Optimización de costos

La optimización de costos trata de buscar formas de reducir los gastos innecesarios y mejorar las eficiencias operativas. Para más información, vea Información general del pilar de optimización de costos.

El componente más caro de esta solución es el proceso y hay varias maneras de escalar el proceso de forma rentable con el volumen de datos. Un ejemplo sería usar un servicio Spark como Azure Synapse Analytics Spark o Azure Databricks para el trabajo de ingeniería de datos, en lugar de una solución de nodo único. Spark se escala horizontalmente y es más rentable en comparación con las soluciones de un solo nodo grandes y escaladas verticalmente.

Los precios de todos los componentes de Azure configurados en esta arquitectura se pueden encontrar en este presupuesto guardado de la Calculadora de precios de Azure. Este presupuesto está configurado para mostrar los costos iniciales y mensuales estimados, para una implementación básica que se ejecuta de lunes a viernes, de las 09:00 a las 17:00 horas.

Excelencia operativa

La excelencia operativa abarca los procesos de las operaciones que implementan una aplicación y la mantienen en ejecución en producción. Para más información, consulte Introducción al pilar de excelencia operativa.

Una práctica e implementación sólidas de operaciones de aprendizaje automático (MLOps) desempeña un papel fundamental en la producción de este tipo de solución. Para más información, consulte Operaciones de aprendizaje automático (MLOps).

Eficiencia del rendimiento

La eficiencia del rendimiento es la capacidad de la carga de trabajo para escalar con el fin de satisfacer de manera eficiente las demandas que los usuarios hayan ejercido sobre ella. Para obtener más información, vea Resumen del pilar de eficiencia del rendimiento.

En este escenario, el procesamiento previo de datos se realiza en Azure Machine Learning. Aunque este diseño funcionará para volúmenes de datos pequeños a medianos, los grandes volúmenes de datos o escenarios con acuerdos de nivel de servicio casi en tiempo real pueden tener dificultades desde el punto de vista del rendimiento. Una manera de abordar este tipo de preocupación es usar un servicio Spark como Azure Synapse Analytics Spark o Azure Databricks para cargas de trabajo de ingeniería de datos o ciencia de datos. Spark se escala horizontalmente y se distribuye por diseño, lo que le permite procesar grandes conjuntos de datos de forma muy eficaz.

Seguridad

La seguridad proporciona garantías contra ataques deliberados y el abuso de datos y sistemas valiosos. Para más información, consulte Introducción al pilar de seguridad.

Importante

Esta arquitectura funcionará con datos de salud anonimizados y no anonimizados. Sin embargo, para una implementación segura, se recomienda que los datos de salud se originen en forma anonimizada de orígenes EHR y EMR.

Para más información sobre las características de seguridad y gobernanza disponibles para Azure Machine Learning, consulte Seguridad y gobernanza empresarial para Azure Machine Learning.

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Creadores de entidad de seguridad:

  • Dhanshri More | Arquitecto principal de soluciones en la nube
  • DJ Dean | Arquitecto principal de soluciones en la nube

Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.

Pasos siguientes

Tecnologías y recursos relacionados con la implementación de esta arquitectura:

Consulte el contenido adicional del Centro de arquitectura de Azure relacionado con esta arquitectura: