Анализ данных наблюдений пациентов с помощью OHDSI с cdM OMOP

Azure Pipelines
База данных SQL Azure
Масштабируемые наборы виртуальных машин Azure
хранилище BLOB-объектов Azure
Реестр контейнеров Azure

Наблюдение Обработка и анализ данных и инфоратики (OHDSI) создали и поддерживает стандарт общей модели данных партнерства OMOP CDM и связанные средства программного обеспечения OHDSI для визуализации и анализа клинических данных о работоспособности. Эти средства упрощают разработку и выполнение анализа на основе стандартных, пациентов, данных наблюдения.

OHDSI в Azure позволяет организациям, которые хотят использовать CDM OMOP и связанные аналитические средства для легкого развертывания и управления решением на платформе Azure.

Terraform — это зарегистрированный товарный знак или товарный знак HashiCorp в США и/или других странах. Никакое одобрение HashiCorp не подразумевается использованием этого знака.

Архитектура

Diagram that shows an architecture for analyzing patient data by using OHDSI.

Скачайте файл Visio для этой архитектуры.

На предыдущей схеме показана архитектура решения на высоком уровне. Решение состоит из двух основных групп ресурсов:

  • Группа ресурсов начальной загрузки. Содержит базовый набор ресурсов Azure, поддерживающих развертывание группы ресурсов OMOP.
  • Группа ресурсов OMOP. Содержит ресурсы Azure, относящиеся к OHDSI.

Azure Pipelines управляет всеми службами автоматизации развертывания.

Эта статья предназначена в первую очередь для команд разработчиков DevOps. Если вы планируете развернуть этот сценарий, у вас должен быть опыт работы с портал Azure и Azure DevOps.

Workflow

  1. Разверните группу ресурсов Начальной загрузки для поддержки ресурсов и разрешений, необходимых для развертывания ресурсов OHDSI.
  2. Разверните группу ресурсов OMOP для ресурсов Azure, относящихся к OHDSI. Этот шаг должен завершить настройку, связанную с инфраструктурой.
  3. Подготовьте OMOP CDM и словари для развертывания модели данных и заполнения управляемых словарей OMOP в CDM в SQL Azure.
  4. Развертывание приложений OHDSI:
    1. Настройте пользовательский интерфейс Atlas и WebAPI с помощью образа BroadSea WebTools. Atlas — это веб-интерфейс, который интегрирует функции из различных приложений OHDSI. Он поддерживается уровнем WebAPI .
    2. Настройте Ахиллес и Synthea с помощью образа BroadSea Methods. Ахиллес — это скрипт на основе R, который выполняет оценку характеризации и качества данных в CDM OMOP. Скрипт Synthea ETL — это необязательное средство, которое позволяет пользователям загружать искусственные данные пациентов в CDM OMOP.

Компоненты

  • Идентификатор Microsoft Entra — это мультитенантный облачный каталог и служба управления удостоверениями. Идентификатор Microsoft Entra используется для управления разрешениями для развертывания среды.
  • Azure Pipelines автоматически выполняет сборку и тестирует проекты кода. Эта служба Azure DevOps сочетает непрерывную интеграцию (CI) и непрерывную поставку (CD). Azure Pipelines использует эти методики для постоянного и последовательного тестирования и сборки кода и отправки его в любой целевой объект. Конвейеры определяют и запускают этот подход развертывания для OHDSI в Azure.
  • Azure Масштабируемые наборы виртуальных машин позволяет создавать группу разнородных виртуальных машин с балансировкой нагрузки и управлять ими. Эти виртуальные машины координирует развертывание среды.
  • Хранилище BLOB-объектов Azure — это служба хранения, оптимизированная для хранения больших объемов неструктурированных данных. Большой двоичный объект служба хранилища используется для хранения файла состояния Terraform и необработанных файлов словаря OMOP (перед приемом в CDM).
  • Azure Key Vault — это служба Azure для хранения и доступа к секретам, ключам и сертификатам с улучшенной безопасностью. Key Vault обеспечивает безопасность с поддержкой HSM и аудит доступа с помощью элементов управления доступом на основе ролей, интегрированных с идентификатором Microsoft Entra. В этой архитектуре Key Vault хранит все секреты, включая ключи API, пароли, криптографические ключи и сертификаты.
  • База данных SQL Azure — это полностью управляемая платформа как служба (PaaS). База данных SQL обрабатывает функции управления базами данных, такие как обновление, исправление, резервное копирование и мониторинг. Эта служба содержит CDM OMOP и все связанные реляционные данные.
  • Azure Брандмауэр веб-приложений помогает защитить приложения от распространенных веб-атак, таких как уязвимости OWASP, внедрение SQL и межсайтовые скрипты. Эта технология является облачной. Это не требует лицензирования и оплаты по мере использования.
  • Реестр контейнеров Azure позволяет создавать, хранить и управлять образами контейнеров и артефактами в частном реестре для всех типов развертываний контейнеров. В этом решении хранятся образы приложений OHDSI (BroadSea WebTools и BroadSea Methods) для развертывания в службе приложение Azure.
  • Служба приложений Azure — это служба на базе HTTP для размещения веб-приложений, интерфейсов REST API и серверной части мобильных решений. Эта служба поддерживает приложения WebAPI и Atlas OHDSI.

Альтернативные варианты

Если требуется больше масштабируемости или контроля, рассмотрите следующие варианты:

Подробности сценария

Возможность федерации, согласования, визуализации, сегментирования и анализа данных клинических пациентов быстро стала популярным вариантом использования в отрасли здравоохранения. Многие организации, в том числе академические учреждения, государственные учреждения и организации в частном секторе, ищут способы использования данных о здоровье пациентов для ускорения исследований и разработки. К сожалению, большинство ИТ-команд борются эффективно сотрудничать с исследователями, чтобы обеспечить рабочую среду, где исследователи могут чувствовать себя продуктивными и расширенными.

OHDSI — это инициатива, которая включает тысячи сотрудников в более чем 70 странах и регионах. Он предлагает одно из немногих доступных решений в формате с открытым исходным кодом для исследователей. OHDSI создал и поддерживает стандарт CDM OMOP и связанные средства программного обеспечения OHDSI для визуализации и анализа клинических данных о работоспособности.

Потенциальные варианты использования

Некоторые типы медицинских организаций могут воспользоваться этим решением, в том числе:

  • Академические институты, которые хотят позволить научным исследователям решать исследования наблюдений с помощью клинических данных.
  • Правительственные учреждения, которые хотят федеративные большие объемы разрозненных источников данных для ускорения научного обнаружения.
  • Частный сектор компании, которые хотят оптимизировать идентификацию потенциальных пациентов для клинических испытаний.

Рекомендации

Эти рекомендации реализуют основные принципы платформы Azure Well-Architected Framework, которая представляет собой набор руководящих принципов, которые можно использовать для улучшения качества рабочей нагрузки. Дополнительные сведения см. в статье Microsoft Azure Well-Architected Framework.

Надежность

Надежность гарантирует, что ваше приложение позволит вам выполнить ваши обязательства перед клиентами. Дополнительные сведения см. в разделе "Обзор основы надежности".

База данных SQL включает базы данных, избыточные между зонами базы данных, группы отработки отказа, гео-реплика и автоматическое резервное копирование. Эти функции позволяют приложению продолжать работу, когда происходят события обслуживания или сбой. Дополнительные сведения см. в статье Azure SQL Database availability capabilities (Возможности доступности Базы данных Azure SQL).

Возможно, вы хотите использовать приложение Аналитика для мониторинга работоспособности приложения. С помощью приложения Аналитика вы можете создавать оповещения и реагировать на проблемы с производительностью, влияющие на взаимодействие с клиентом. Дополнительные сведения см. в статье Что такое Application Insights?.

Дополнительные сведения о надежности см. в статье "Проектирование надежных приложений Azure".

Безопасность

Безопасность обеспечивает гарантии от преднамеренного нападения и злоупотребления ценными данными и системами. Дополнительные сведения см. в разделе "Общие сведения о компоненте безопасности".

В этом сценарии используются управляемые удостоверения для ресурсов Azure, которые предоставляют удостоверение для приложения, используемого при подключении к ресурсам, поддерживающим проверку подлинности Microsoft Entra. Управляемые удостоверения устраняют необходимость управления секретами и учетными данными для каждого ресурса Azure.

База данных SQL использует многоуровневый подход для защиты данных клиентов. Он охватывает безопасность сети, управление доступом, защиту от угроз и защиту информации. Дополнительные сведения о безопасности Базы данных SQL, см. в разделе What is the Azure SQL Database service? Availability capabilities (Обзор службы Базы данных SQL Azure. Возможности доступности).

Если сеть с высоким уровнем безопасности является критически важным требованием, рекомендуется использовать Приватный канал Azure для подключения Служба приложений к SQL Azure. Это позволяет удалить общедоступный интернет-доступ к базе данных SQL, которая обычно используется вектором атаки. Вы также можете использовать частные конечные точки для служба хранилища Azure для доступа к данным через приватный канал Azure с повышенной безопасностью. Эти реализации в настоящее время не включены в решение, но их можно добавить, если вам нужно.

Общие рекомендации по проектированию безопасных решений см. в документации по безопасности Azure.

Оптимизация затрат

Оптимизация затрат заключается в сокращении ненужных расходов и повышении эффективности работы. Дополнительные сведения см. в разделе Обзор критерия "Оптимизация затрат".

Получить более четкое представление о затратах на выполнение этого сценария в Azure можно с помощью калькулятора цен Azure. Эта оценка использует конфигурацию по умолчанию всех ресурсов Azure, развернутых через инфраструктуру в качестве кода. Эти оценки затрат могут изменяться на основе размера данных и из-за других ресурсов в организации, которые могут быть общими, например идентификатора Microsoft Entra или Azure DevOps.

Уровень производительности

Уровень производительности — это способность вашей рабочей нагрузки эффективно масштабироваться в соответствии с требованиями, предъявляемыми к ней пользователями. Дополнительные сведения см. в разделе "Общие сведения о эффективности производительности".

В этом сценарии используется Служба приложений, который можно использовать при необходимости для автоматического масштабирования числа экземпляров, поддерживающих пользовательский интерфейс Atlas. Эта функция позволяет поддерживать спрос конечных пользователей. Дополнительные сведения об автомасштабировании см. в рекомендациях по автомасштабированию.

Дополнительные сведения см. в списке проверка эффективности производительности.

Развертывание этого сценария

Дополнительные сведения о развертывании набора инструментов OHDSI см. в следующих ресурсах:

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.

Основные авторы:

Другие участник:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги