Implementar y configurar las transformaciones de OMOP en soluciones de datos de atención sanitaria
Nota
Este contenido se está actualizando actualmente.
Las transformaciones de OMOP permiten la preparación de datos para análisis estandarizados a través de los estándares comunitarios abiertos de la Observational Medical Outcomes Partnership (OMOP). Puede usar esta capacidad después de implementar soluciones de datos de atención sanitaria y la funcionalidad Fundamentos de datos de Healthcare en su área de trabajo de Fabric.
Las transformaciones de OMOP son una capacidad opcional bajo soluciones de datos de atención sanitaria en Microsoft Fabric. Tiene la flexibilidad de decidir si usarla o no, según sus necesidades o escenarios específicos.
- Implementar soluciones de datos de atención sanitaria en Microsoft Fabric.
- Instale los cuadernos básicos y las canalizaciones en Implementar fundamentos de datos de atención sanitaria.
Puede implementar la capacidad mediante el módulo de configuración que se explica en Soluciones de datos de atención sanitaria: Implementar fundamentos de datos de atención sanitaria. Sin embargo, el paso de selección de datos de ejemplo de este módulo no implementa datos de ejemplo para esta capacidad. Los datos de ejemplo de las transformaciones de OMOP se instalan exclusivamente en su entorno de soluciones de datos de atención sanitaria una vez que termina de implementar la capacidad.
Si no usó el módulo de configuración para implementar la capacidad y desea usar el icono de capacidad en su lugar, siga estos pasos:
Vaya a la página principal de soluciones de datos de atención sanitaria en Fabric.
Seleccione el icono de transformación de OMOP.
En la página de la capacidad, seleccione Implementar en espacio de trabajo.
La implementación puede tardar unos minutos en completarse. No cierre la pestaña ni el explorador mientras la implementación esté en curso. Mientras espera, puedes trabajar en otra pestaña.
Una vez completada la implementación, puede ver una notificación en la barra de mensajes.
Seleccione Administrar capacidad en la barra de mensajes para ir a la página Administración de capacidades.
Aquí puede ver, configurar y administrar los artefactos implementados con la capacidad.
La capacidad instala los siguientes artefactos en el entorno de soluciones de datos de atención sanitaria:
Artefacto | Tipo |
---|---|
healthcare#_msft_gold_omop | Almacén de lago |
healthcare#_msft_omop_silver_gold_transformation | Bloc de notas |
healthcare#_msft_omop_drug_exposure_era_sample | Bloc de notas |
healthcare#_msft_omop_drug_exposure_insights_sample | Bloc de notas |
healthcare#_msft_omop_analytics | Canalización de datos |
healthcare#_msft_omop_semantic_model | Modelo semántico |
Vocab-HDS | Datos de ejemplo |
El cuaderno healthcare#_msft_omop_silver_gold_transformation usa las API de OMOP enviadas como parte de la biblioteca de soluciones de datos de atención sanitaria para la transformación de datos. El cuaderno transforma los recursos del almacén de lago healthcare#_msft_silver en Common Data Model de OMOP. A continuación, los datos transformados se insertan en el almacén de lago de OMOP.
El cuaderno se implementa con los valores preconfigurados necesarios para ejecutar la canalización de datos de transformación de OMOP. Algunos parámetros de configuración heredan de la configuración global y se pueden reemplazar en el nivel del cuaderno. De manera predeterminada, no es necesario que realice cambio en los archivos de configuración del cuaderno. Si es necesario, puede revisar o modificar la configuración seleccionando los archivos de configuración y los cuadernos correspondientes en su entorno.
Para obtener más información sobre la ejecución del cuaderno, consulte Usar transformaciones de OMOP.
El modelo semántico OMOP, healthcare#_msft_omop_semantic_model, es un modelo semántico personalizado basado en el almacén de lago oro OMOP. Incluye algunas relaciones clave CDM de OMOP versión 5.4 entre las siguientes tablas de OMOP:
- Ubicación
- Personaa
- Observación
- Procedure_Occurrence
- Condition_Occurrence
- Nota
- Drug_Exposure
- Visit_Ocurrence
- Image_Occurrence
- Medida
Estas relaciones del conjunto mínimo necesario para generar informes de Power BI en la capacidad Descubrir y crear cohortes (versión preliminar) en soluciones de datos de atención sanitaria. Puede usar este modelo semántico como base, agregando más tablas y relaciones de OMOP desde el almacén de lago OMOP para crear informes de Power BI personalizados a partir de los datos del almacén de lago estándar de OMOP.
En el cuaderno de ejemplo healthcare#_msft_omop_drug_exposure_era_sample se muestra cómo generar los registros de tabla drug_era en OMOP mediante el lenguaje PySpark (Python) en un Azure Synapse Analytics cuaderno, principalmente con fines exploratorios. La generación de registros de tabla drug_era sigue el script de ejemplo de la era de fármacos OHDSI, que se adapta para funcionar con PySpark en Azure Synapse Analytics. El código generador de la era de fármacos se incluye en la biblioteca personalizada de Python, que se empaqueta como un archivo de wheel (WHL) y se carga en un grupo de Apache Spark para facilitar el acceso.
Antes de ejecutar el cuaderno, tenga en cuenta los siguientes requisitos previos:
Asegúrese de que la base de datos de OMOP tiene datos válidos en las tablas siguientes:
- drug_exposure
- Concepto de
- concept_ancestor
Puede generar estos datos utilizando los datos de ejemplo o sus propios datos ejecutando la canalización de datos de FHIR a OMOP.
Asegúrese de que el paquete de wheel de biblioteca personalizado está conectado al grupo de Spark que usa para ejecutar este cuaderno.
El parámetro de configuración clave para este cuaderno es el omop_database_name
. Este parámetro identifica el nombre de la base de datos de OMOP que contiene los datos para generar la tabla drug_era. Actualice este valor solo si la base de datos de OMOP difiere del valor predeterminado en el archivo de configuración global.
Si la tabla drug_exposure de OMOP se rellena con datos válidos, este cuaderno invoca el módulo DrugEraGenerator que encadena períodos de tiempo en los que una persona está expuesta a un ingrediente farmacológico activo, lo que deja un intervalo de 30 días. El módulo DrugEraGenerator elimina todos los registros de drug_era existentes y genera nuevos registros, basados en los datos de OMOP más recientes.
Para obtener más información sobre la ejecución del cuaderno, consulte Usar los cuadernos de ejemplo de transformaciones de OMOP.
El cuaderno de ejemplo healthcare#_msft_omop_drug_exposure_insights_sample muestra un análisis exploratorio en la tabla drug_era mediante PySpark en un cuaderno de Azure Synapse Analytics. El análisis genera un histograma que muestra las exposiciones a los fármacos secundarias de los pacientes a los ingredientes activos, estratificadas por género y edad para un año específico. La tabla drug_era se genera mediante una biblioteca DrugEraGenerator personalizada que invoca el cuaderno anterior healthcare#_msft_omop_drug_exposure_era_sample. Este análisis amplía la Consulta de exposición a fármacos DEX03: Distribución de la edad, estratificada por drogas mediante la incorporación de la estratificación basada tanto en el género como en la edad.
Antes de ejecutar el cuaderno, tenga en cuenta los siguientes requisitos previos:
- Si desea editar la configuración del cuaderno, asegúrese de hacer una copia de este cuaderno. No actualice el cuaderno directamente.
- Asegúrese de que la tabla drug_era contiene datos ejecutando el cuaderno de la era de exposición a fármacos. La ejecución de este cuaderno reemplaza los registros de drug_era existentes por nuevos registros, basados en los datos de OMOP más recientes .
- Utilice este cuaderno tal cual para el análisis exploratorio y cree una copia para realizar análisis personalizados.
A continuación se describen los parámetros de configuración de cuaderno clave. Puede modificar estos parámetros para un análisis exploratorio alternativo de la exposición de los pacientes a fármacos:
primary_drug_concept_id
: La exposición al ingrediente activo principal para los pacientes.secondary_drug_concept_id
: La exposición al ingrediente activo secundario para los pacientes.year
: El año objetivo durante el cual los pacientes estuvieron expuestos activamente a los fármacos primarios y secundarios.
Para obtener más información sobre la ejecución del cuaderno, consulte Usar los cuadernos de ejemplo de transformaciones de OMOP.