AI 和机器学习在手术干预方面起着关键作用。 对于患者来说,接受手术的决定可能会彻底改变生活。 预测个人结局的能力使患者和医生能够采取适当的行动并更好地了解相关风险。 本文提供了一个参考体系结构,演示如何实现手术风险预测。
体系结构
下载此体系结构的 Visio 文件。
工作流
数据源
以患者为中心的数据来源于快速医疗保健互操作性资源 (FHIR®)、实时电子健康记录 (EHR)、本地和第三方数据源。
重要
使用以患者为中心的数据时,需要确保仔细处理个人身份数据并将其排除在训练和测试数据集之外。
预测手术风险时,请考虑以下数据点:
- 患者人口统计信息
- 现有合并症及其严重程度相关信息
- 患者当前用药计划相关信息
- 患者术前血液检测信息
- 其他健康相关的关键信息
数据准备
数据准备是收集、合并、结构化和组织数据的过程,因此可用于生成机器学习模型、商业智能 (BI) 以及分析和数据可视化应用程序。
- Azure 数据工厂转换、协调和加载已准备好进行进一步处理的数据。
- 使用 Azure API for FHIR 可快速交换数据。
- Azure Synapse Analytics 处理数据并触发 Azure 机器学习试验。
- Azure Data Lake 将描述以患者为中心的信息的表格数据存储在平面文件中。
AI/机器学习 - 训练
模型训练是使用机器学习算法根据数据学习模式并选择能够预测以前未见过患者的手术风险的模型的过程。
Azure 机器学习训练模型。 Azure 机器学习是一个用于加速和管理机器学习项目生命周期的云服务。 生命周期包括训练模型、部署模型和管理机器学习操作 (MLOps)。
对于此用例,需要使用可以解释的模型。 借助负责任 AI 工具箱中的交互式可解释性仪表板,利益干系人可以清楚地了解在确定所有患者的特定风险方面起关键作用的因素。 负责任 AI 工具箱还提供患者层面的解释。 这种解释有助于临床医生为特定的治疗定制治疗方案。
负责任 AI 工具箱提供了一个交互式仪表板,用于检测模型中对受保护阶层(如性别和种族)的偏倚。 由于训练数据基于接受手术的患者,利益干系人需要了解模型提取的数据中任何固有的偏倚。 当所选模型偏向受保护阶层时,可以使用负责任 AI 工具箱进行模型缓解。
AI/机器学习 - 推理
机器学习推理是将事先看不到的数据点馈送到机器学习模型以计算输出(例如数字评分)的过程。 在本例中,它用于确定患者的风险。
模型注册表内置在 Azure 机器学习中。 它用于在 Azure 云中存储模型并控制其版本。 使用模型注册表,可轻松组织和跟踪定型的模型。
需要部署经过训练的机器学习模型,以便可以在其中馈送新的数据进行推理。 建议的部署目标是 Azure 托管终结点。
对于任何排队等待手术的新患者,都可以使用已部署的模型,并根据患者的历史健康信息推断可能存在的风险。 临床医生和患者可以了解手术的风险,并确定适当的治疗过程。
分析工作负荷
模型评分结果将保存回到分析系统(在本例中为收集了输入数据的 Azure Synapse Analytics 和 Azure Data Lake)。 这有助于将风险预测的结果提供给前端的患者和临床医生,用于监测模型,并对预测模型进行重新训练,以帮助他们从新获得的数据中学习。
前端模型使用
可以通过 Web 应用平台使用评分结果:Power BI 和 Power Apps。 还可以通过患者和临床医生 Web 门户和应用程序访问结果。 这使患者和临床医生能够访问最新信息以及历史信息,以便进行更准确的诊断并制定最佳治疗方案。
组件
- Azure Synapse Analytics 是一项企业分析服务,可以缩短在数据仓库和大数据系统中生成见解所需的时间。 Azure Synapse 汇集了企业数据仓库中所用 SQL 技术的精华、用于大数据的 Spark 技术、用于日志和时序分析的 Azure 数据资源管理器、用于数据集成和提取、转换、加载 (ETL)/提取、加载、转换 (ELT) 的管道,以及与其他 Azure 服务(如 Power BI、Azure Cosmos DB 和 Azure 机器学习)的深度集成。
- 使用 Azure API for FHIR,可通过 FHIR API 快速交换数据。 它由云中的托管平台即服务 (PaaS) 产品/服务提供支持。 借助于此 API,使用健康数据的任何人都可以更轻松地在云中引入、管理和保存受保护健康信息 (PHI)。
- Azure 数据工厂是一个基于云的数据集成服务,可以自动执行数据移动和转换。
- Azure Data Lake 是一个不受限制的数据存储服务,用于存储各种形状和格式的数据。 它可以轻松与 Azure 中的分析工具集成。 它提供企业级安全性和监视支持。 可将它用于存档、数据湖、高性能计算、机器学习和云原生工作负荷。 此解决方案为机器学习数据提供了本地数据存储,并为训练机器学习模型提供了高级数据缓存。
- Azure 机器学习是企业级机器学习服务,使用它可以更方便地开发模型并将其部署到各种机器学习计算目标。 它为各种技能水平的用户提供低代码设计器、自动化机器学习和支持各种集成开发环境的托管 Jupyter 笔记本环境。
- 负责任 AI 工具箱是一组集成工具,可帮助你使负责任的 AI 可操作化。 使用此工具箱,可以评估模型并更快地做出面向用户的决策。
- Azure 机器学习终结点是 HTTPS 终结点,客户端可以调用它们来接收已训练模型的推理(评分)输出。 终结点提供具有密钥令牌身份验证的稳定评分 URI。
- Power BI 是软件即服务 (SaaS),用于提供业务分析和直观沉浸式和交互式见解。 它提供丰富的一组连接器用于连接各种数据源,它还提供简单的转换功能和复杂的可视化。
- Power Apps 是一组应用、服务和连接器,以及一个数据平台,它提供了一个快速开发环境来生成满足业务需求的自定义应用。 可以使用 Power Apps 快速构建连接到数据的商业应用程序。 数据可以存储在基础数据平台 (Microsoft Dataverse) 或各种在线和本地数据源中,例如 SharePoint、Microsoft 365、Dynamics 365 和 SQL Server。
备选方法
- 在此解决方案中,Azure 机器学习提供数据建模和部署。 你还可以使用代码优先方法在 Azure Databricks 中生成解决方案。
- 作为 Azure Synapse 的替代方案,你可以使用 Azure Databricks 进行数据探索和操作。
- 可以使用 Grafana(而不是 Power BI)进行可视化。
- 可将数据暂存在 Azure SQL 数据库而不是 Data Lake 中。 可以使用数据工厂进行数据暂存和分析。
方案详细信息
数据收集技术的进步和数据标准(传输、内容、术语和安全性)的发展,推动了医疗保健行业 AI 和机器学习的不断变革。 这种转变在患者诊疗和提供商管理方面尤其具有开创性。 它还给予了保险和制药公司一个提供数字连接系统的机会,使他们能够全面了解患者的健康状况和整体医疗历史。
风险分层可以使用二进制或多类分类模型。 如果采用二元分类,结果即为手术带来成功或风险结局。 在多类分类方法中,有机会进一步细化结果为成功、中度或重度/死亡。 对于任一方法,都需要以患者为中心的数据,包括人口统计信息、合并症、当前药物计划、血液检测报告,以及任何其他可以揭示患者整体健康状况的信息。
开发一个能够向患者解释潜在手术结局的透明系统必须是此类模型的主要目标。 透明度和可解释性有助于临床医生与患者进行有意义的对话,并让他们在手术前制定治疗计划。
承认患者来自不同背景也很重要。 你需要创建一个不偏向于性别和种族等受保护阶层的模型。 一个不偏不倚的模型可为患者提供公正的医疗支持,无论他们的背景如何,以最大限度地提高他们获得积极手术结局的机会。 本文中的体系结构使用负责任 AI 工具箱中的可解释性和偏倚检测工具。
世界上最大的医疗保健组织之一,英国的国家卫生服务中心,使用 Azure 机器学习平台和负责任 AI 工具箱来构建骨科手术的风险分层模型。 有关详细信息,请参阅两名 NHS 外科医生正在使用 Azure AI 来识别手术期间面临更高风险的患者。
或观看此简短视频:
Azure Active Directory 现已更名为 Microsoft Entra ID。 有关详细信息,请参阅 Azure AD 的新名称。
可能的用例
该解决方案非常适合医疗保健行业。 风险分层模型适用于以下方案:
- 临床医学。 预测接受骨科手术、心脏手术、眼科手术和其他类型手术的患者的手术结局。
- 公共卫生。 帮助医疗专业人员和决策者了解特定疾病在地理区域居民中的传播情况,例如,确定有多少居民易感染新冠肺炎。
- 流行病学。 实施临床试验,以更好地了解与安慰剂相比的治疗结果。
注意事项
这些注意事项实施 Azure 架构良好的框架的支柱原则,即一套可用于改进工作负荷质量的指导原则。 有关详细信息,请参阅 Microsoft Azure 架构良好的框架。
选择此体系结构中的技术是因为它们的可伸缩性和可用性,目的是管理和控制成本。
可靠性
可靠性可确保应用程序符合你对客户的承诺。 有关详细信息,请参阅可靠性支柱概述。
此体系结构中的组件具有高可靠性。 但是,机器学习和分析任务由两个部分构成:训练和生产部署。 用于训练的资源通常不需要高可用性。 对于生产部署,Azure 机器学习终结点完全支持高可用性。
安全性
安全性针对蓄意攻击及滥用宝贵数据和系统提供保障措施。 有关详细信息,请参阅安全性支柱概述。
此方案提供内置于组件中的更高安全性。 它还提供可通过 Microsoft Entra 身份验证或基于角色的访问控制管理的权限。 请考虑遵循以下 Azure 机器学习企业安全最佳做法来建立合适的安全级别。
Azure Synapse 提供企业级和行业领先的安全功能,提供组件隔离以保护数据、提高网络安全性和改进威胁防护。 在出现安全漏洞的情况下,组件隔离可以最大限度地减少暴露。 Azure Synapse 还支持数据模糊处理来保护敏感的个人数据。
Azure Data Lake 提供所有级别的安全功能,从改进的数据保护和数据掩码到改进的威胁防护。 有关详细信息,请参阅 Azure Data Lake 安全性。
有关此体系结构的安全功能的详细信息,请参阅以下资源:
重要
在处理医疗保健数据时,需要确保仔细处理患者的个人身份数据并遵循 HIPAA 标准。 如果需要个人身份数据,可能需要实施进一步的 enclave 或同态加密解决方案。
成本优化
成本优化是关于寻找减少不必要的费用和提高运营效率的方法。 有关详细信息,请参阅成本优化支柱概述。
- 资源的可伸缩性取决于支持根据需要优化成本的分析工作负荷、训练和部署工作负荷。
- 要估计此解决方案的实现成本,请使用 Azure 定价计算器并输入本文所述的服务。 成本优化支柱概述也很有帮助。
卓越运营
卓越运营涵盖了部署应用程序并使其在生产环境中保持运行的运营流程。 有关详细信息,请参阅卓越运营支柱概述。
遵循 MLOps 准则,标准化和管理可跨多个工作区缩放的端到端机器学习生命周期。 在进入生产环境之前,请确保实施的解决方案支持对模型的重新训练周期和自动重新部署进行持续推理。 下面是可以考虑使用的一些资源:
作为 Azure 机器学习的一部分,负责任 AI 基于 AI 开发和使用的六大支柱:公平性、可靠性和安全性、隐私和安全性、包容性、透明度和问责制。 有关概述和实施详细信息,请参阅什么是负责任 AI?。
性能效率
性能效率是指工作负荷能够以高效的方式扩展以满足用户对它的需求。 有关详细信息,请参阅性能效率要素概述。
此方案中的大多数组件都可以根据分析活动级别进行纵向扩展或缩减。 Azure Synapse 提供可伸缩性和高性能,并且可以在活动水平较低时减少或暂停。
可以根据数据量和训练模型所需的计算资源来缩放 Azure 机器学习。 可以根据预期的负载和评分服务缩放部署和计算资源。
有关设计可缩放解决方案的详细信息,请参阅性能效率清单。
作者
本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。
主要作者:
- Manasa Ramalinga | 美国国家 CSA 团队首席云解决方案架构师
其他参与者:
- Mick Alberts | 技术文档撰写人
要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。
后续步骤
- 什么是 Azure 健康数据服务?
- 适用于 FHIR 的 Azure API
- 什么是 Azure 机器学习?
- 使用 MLflow 和 Azure 机器学习跟踪 ML 模型
- Azure 数据工厂文档
- 什么是 Azure Synapse Analytics?
- 什么是 Azure SQL 数据库?
- 什么是 Power BI?
- 什么是 Microsoft Cloud for Healthcare?