編集

次の方法で共有


手術のリスク予測を実装する

Azure Machine Learning
Azure Synapse Analytics
Azure Data Factory
Azure Data Lake
Power BI

AI と機械学習は、外科的介入に関して重要な役割を果たします。 患者にとって、手術を受ける決定は人生を変える可能性があります。 個々の結果を予測する能力により、患者と医師は適切な行動を取り、関連するリスクをより深く理解することができます。 この記事では、手術のリスク予測を実装する方法を示す参照アーキテクチャを提供します。

アーキテクチャ

手術リスク階層化を実装するためのアーキテクチャを示す図。

このアーキテクチャの Visio ファイルをダウンロードします。

ワークフロー

  1. データ ソース

    患者中心のデータは、高速ヘルスケア相互運用性リソース (FHIR®)、リアルタイム電子医療記録 (EHR)、オンプレミス、およびサードパーティのデータ ソースから提供されます。

    重要

    患者中心のデータを使用する場合は、個人を特定できるデータが慎重に処理され、トレーニング データセットとテスト データセットから除外されていることを確認する必要があります。

    手術リスクを予測するときは、次のデータ ポイントを考慮します。

    • 患者の人口統計情報
    • 既存の併存疾患とその重大度に関する情報
    • 患者の現在の投薬計画に関する情報
    • 患者の術前血液検査情報
    • その他の重要な健康関連情報
  2. データ準備

    "データの準備" は、機械学習モデル、ビジネス インテリジェンス (BI)、分析アプリケーション、データ可視化アプリケーションの構築に使用できるように、データを収集、結合、構造化、整理するプロセスです。

    • Azure Data Factory は、さらに処理する準備が整ったデータを変換し、調整して、読み込みます。
    • Azure API for FHIR を使用すると、高速でデータを交換できます。
    • Azure Synapse Analytics はデータを処理し、Azure Machine Learning の実験をトリガーします。
    • Azure Data Lake は、患者中心の情報が記述されている表形式データをフラット ファイルに格納します。
  3. AI と機械学習 - トレーニング

    "モデル トレーニング" は、機械学習アルゴリズムを使ってデータに基づいてパターンを学習し、事前にわからない患者の手術リスクを予測できるモデルを作成するプロセスです。

    Azure Machine Learning によってモデルがトレーニングされます。 Azure Machine Learning は、機械学習プロジェクトのライフサイクルを加速したり管理したりするためのクラウド サービスです。 このライフサイクルには、トレーニング モデル、モデルのデプロイ、機械学習運用 (MLOps) の管理が含まれます。

    このユース ケースでは、説明できるモデルを使用する必要があります。 責任ある AI ツールボックスの対話型解釈可能性ダッシュボードの助けを借りて、利害関係者は、すべての患者について特定のリスクを決定するときに重要な役割を果たす要因を明確に理解できます。 責任ある AI ツールボックスは、患者レベルでの解釈も提供します。 この解釈は、臨床医が特定の治療のための治療をカスタマイズするのに役立ちます。

    責任ある AI ツールボックスには、モデル内の性別や人種などの保護されたクラスに対する偏りを検出するための対話型ダッシュボードが用意されています。 トレーニング データは手術を受けた患者に基づいているため、利害関係者は、モデルが取得したデータに固有の偏りを理解する必要があります。 選択したモデルに保護されたクラスに対する偏りがあるときは、モデルのリスク軽減に責任ある AI ツールボックスを使用できます。

  4. AI と機械学習 - 推論

    "機械学習推論" は、以前にはなかったデータ ポイントを機械学習モデルにフィードして、数値スコアなどの出力を計算するプロセスです。 この場合は、患者に対するリスクを判断するために使用されます。

    モデル レジストリが Azure Machine Learning に組み込まれます。 このレジストリは、Azure クラウドでのモデルの保存とバージョン管理に使われます。 モデルのレジストリでは、トレーニングしたモデルの整理と追跡が容易に行えます。

    トレーニングが済んだ機械学習モデルを、推論のために新しいデータをフィードできるよう、デプロイする必要があります。 推奨されるデプロイ ターゲットは、Azure マネージド エンドポイントです。

    手術待ち行列の新しい患者について、デプロイされたモデルを使って、患者の過去の健康情報に基づいて考えられるリスクを推測することができます。 臨床医と患者は、手術のリスクを理解し、適切な治療コースを決定することができます。

  5. 分析ワークロード

    モデルのスコアリングの結果は分析システム (この例では Azure Synapse Analytics と Azure Data Lake) に戻されて保存され、そこで入力データが収集されます。 これにより、患者と臨床医による使用、モデルの監視、予測モデルの再トレーニングのために、リスク予測の結果をフロントエンドに提供し、新しく利用可能なデータから学習するのに役立ちます。

  6. フロントエンド モデルの使用

    スコアリングの結果は、Web アプリ プラットフォーム (Power BIPower Apps) を通して使用できます。 結果には、患者や臨床医の Web ポータルとアプリケーションを介してアクセスすることもできます。 これにより、患者と臨床医は、より正確な診断のために、最新の情報と履歴情報にアクセスし、最良の治療コースをキュレーションすることができます。

コンポーネント

  • Azure Synapse Analytics は、データ ウェアハウスやビッグ データ システム全体にわたって分析情報を取得する時間を早めるエンタープライズ分析サービスです。 Azure Synapse は、エンタープライズ データ ウェアハウスで使われる SQL テクノロジ、ビッグ データに使われる Spark テクノロジ、ログと時系列分析のための Azure Data Explorer、データ統合と Extract/Transform/Load (ETL) および Extract/Load/Transform (ELT) のためのパイプライン、Power BI、Azure Cosmos DB、Azure Machine Learning などの他の Azure サービスとの緊密な統合の長所を組み合わせたものです。
  • Azure API for FHIR を使うと、FHIR API シリーズを介して迅速にデータを交換できます。 これは、クラウド内のマネージド PaaS (サービスとしてのプラットフォーム) オファリングによって支えられています。 この API により、医療データを取り扱うすべての人がクラウド上で保護医療情報 (PHI) を簡単に取り込み、管理、保持できるようになります。
  • Azure Data Factory は、データの移動や変換を自動化するクラウドベースのデータ統合サービスです。
  • Azure Data Lake は、さまざまなシェイプや形式のデータを収容するための無制限のデータ ストレージ サービスです。 Azure 内の分析ツールと簡単に統合できます。 エンタープライズ レベルのセキュリティとモニターがサポートされています。 アーカイブ、データ レイク、ハイパフォーマンス コンピューティング、機械学習、クラウドネイティブ ワークロードに使用できます。 このソリューションでは、機械学習データ用のローカル データ ストアと、機械学習モデルをトレーニングするための高品質のデータ キャッシュを提供します。
  • Azure Machine Learning は、広範囲な機械学習のコンピューティング先に対するモデルの開発とデプロイを容易に行えるようにする、エンタープライズ レベルの機械学習サービスです。 このサービスは、ローコード デザイナー、自動機械学習、さまざまな統合開発環境をサポートするホストされた Jupyter Notebook 環境を、あらゆるスキル レベルのユーザーに提供します。
  • 責任ある AI ツールボックスは、責任ある AI の運用化に役立つ統合ツールのコレクションです。 このツールボックスを使うと、モデルを評価し、ユーザー向けの意思決定をいっそう迅速に行うことができます。
  • Azure Machine Learning エンドポイントは、トレーニング済みモデルの推論 (スコアリング) 出力を受信するためにクライアントが呼び出すことができる HTTPS エンドポイントです。 エンドポイントは、キー トークン認証を使用して安定したスコアリング URI を提供します。
  • Power BI は、ビジネス分析と視覚的にイマーシブでインタラクティブな分析情報を提供する、サービスとしてのソフトウェア (SaaS) です。 さまざまなデータ ソースへの豊富なコネクタのセット、簡単な変換機能、高度な視覚化が提供されます。
  • Power Apps は、アプリ、サービス、コネクタのスイートと、ビジネス ニーズに合わせてカスタム アプリを構築するための迅速な開発の環境を提供するデータ プラットフォームです。 Power Apps を使うと、データに接続するビジネス アプリを短時間で構築できます。 データは、基になるデータ プラットフォーム (Microsoft Dataverse) またはオンラインやオンプレミスのさまざまなデータ ソース (SharePoint、Microsoft 365、Dynamics 365、SQL Server など) に格納できます。

代替

  • Azure Machine Learning で、このソリューションでのデータのモデリングとデプロイが提供されます。 コード優先の方法を使用して、Azure Databricks でソリューションをビルドすることもできます。
  • Azure Synapse の代わりに、Azure Databricks をデータの探索と操作に使うことができます。
  • Power BI の代わりに Grafana を視覚化に使用できます。
  • Data Lake の代わりに、Azure SQL Database でデータをステージできます。 Data Factory をデータのステージングと解析に使用できます。

シナリオの詳細

データ収集テクノロジの進歩と、データ標準 (トランスポート、コンテンツ、用語、セキュリティ) の発展により、医療業界では AI と機械学習の変革が拡大しています。 この変革は、患者の治療とプロバイダーの管理において特に画期的です。 また、保険や製薬会社は、患者の福祉と医療履歴全体を総合的に見ることができるデジタル接続システムを提供できるようになります。

リスク階層化では、バイナリ分類モデルまたは多クラス分類モデルを使用できます。 二項分類の結果は、成功または危険な結果をもたらす手術になります。 多クラス分類アプローチでは、成功、中等度、または重度や死亡として結果をさらに絞り込む機会があります。 いずれの方法でも、人口統計情報、併存疾患、現在の投薬計画、血液検査レポート、患者の全体的な健康を明らかにできるものなど、患者中心のデータが必要です。

可能性のある外科的結果を患者に説明できるようにする透明なシステムの開発を、このようなモデルの主要な目標にする必要があります。 透明性と解釈可能性は、臨床医が患者と有意義な会話をするのに役立ち、手術が行われる前に治療計画を立てることができます。

また、患者が多様な背景を持っていることを認識することも重要です。 性別や人種などの保護されたクラスに偏りのないモデルを作成する必要があります。 偏りのないモデルは、患者の背景に関係なく、偏りのない医療サポートを提供し、患者がよい外科的結果を得る可能性が最大になります。 この記事のアーキテクチャでは、責任ある AI ツールボックスの解釈可能性とバイアス検出ツールを使います。

世界最大の医療機関の 1 つである英国の National Health Services は、Azure 機械学習プラットフォームと責任ある AI ツールボックスを、整形外科手術のリスク階層化モデルに使っています。 詳しくは、「NHS の 2 人の外科医師が Azure AI を使用して、手術中にリスクが増した患者を特定している」をご覧ください。

または、この短いビデオをご覧ください。


現在 Azure Active Directory は Microsoft Entra ID になりました。 詳細については、「Azure AD の新しい名前」を参照してください。

考えられるユース ケース

このソリューションは、医療業界に最適です。 リスク階層モデルは、次のシナリオに適用されます。

  • 臨床医学。 整形外科手術、心臓手術、眼科手術、他の種類の手術を受けている患者の手術結果を予測します。
  • 公衆衛生。 たとえば、COVID に感染しやすい住民の数の特定など、医療専門家や政策立案者が地理的な地域の住民への特定の病気の拡大を把握するのに役立ちます。
  • 疫学。 臨床試験を実施し、偽薬と比較して治療の結果をよりよく理解します。

考慮事項

これらの考慮事項は、ワークロードの品質向上に使用できる一連の基本原則である Azure Well-Architected Framework の要素を組み込んでいます。 詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

このアーキテクチャのテクノロジは、コストの管理とコントロールを目的として、スケーラビリティと可用性を考慮して選択されました。

[信頼性]

信頼性により、顧客に確約したことをアプリケーションで確実に満たせるようにします。 詳細については、「信頼性の重要な要素の概要」を参照してください。

このアーキテクチャのコンポーネントは、高い信頼性を備えています。 しかし、機械学習と分析のタスクは、トレーニングと運用環境デプロイという 2 つの部分で構成されています。 トレーニングに必要なリソースには、通常は高可用性は必要ありません。 運用環境デプロイの場合、高可用性は Azure Machine Learning エンドポイントで完全にサポートされています。

セキュリティ

セキュリティは、重要なデータやシステムの意図的な攻撃や悪用に対する保証を提供します。 詳細については、「セキュリティの重要な要素の概要」を参照してください。

このシナリオでは、コンポーネントに組み込まれているセキュリティが強化されます。 また、Microsoft Entra 認証またはロールベースのアクセス制御を利用して管理できるアクセス許可も提供されます。 適切なセキュリティ レベルを確立するには、「Azure Machine Learning のエンタープライズ セキュリティに関するベスト プラクティス」を考慮してください。

Azure Synapse は、データを保護し、ネットワークのセキュリティを強化し、脅威からの保護を向上させるためのコンポーネントの分離を提供する、エンタープライズ グレードで業界をリードするセキュリティ機能を備えています。 コンポーネントの分離により、セキュリティの脆弱性が発生した場合の露出を最小限に抑えることができます。 Azure Synapse により、機密性の高い個人データを保護するためのデータ難読化も可能になります。

Azure Data Lake は、向上したデータ保護やデータ マスキングから強化された脅威防止まで、あらゆるレベルのセキュリティ機能を提供します。 詳しくは、Azure Data Lake のセキュリティに関する記事をご覧ください。

このアーキテクチャのセキュリティ機能について詳しくは、次のリソースをご覧ください。

重要

医療データを処理するときは、患者の個人を特定できるデータを慎重に処理し、HIPAA の標準に従うようにする必要があります。 個人を特定できるデータが必要な場合は、エンクレーブまたは同等の暗号化ソリューションをさらに実装することが必要になる場合があります。

コストの最適化

コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法を検討することです。 詳しくは、コスト最適化の柱の概要に関する記事をご覧ください。

  • リソースのスケーラビリティは、必要に応じてコストを最適化するために有効にされる分析ワークロード、トレーニング、デプロイ ワークロードに基づいています。
  • このソリューションの実装コストを見積もるには、Azure の料金計算ツールを使用し、この記事で記述されているサービスを入力します。 「コスト最適化の柱の概要」も役立ちます。

オペレーショナル エクセレンス

オペレーショナル エクセレンスは、アプリケーションをデプロイし、それを運用環境で実行し続ける運用プロセスをカバーします。 詳細については、「オペレーショナル エクセレンスの重要な要素の概要」を参照してください。

MLOps のガイドラインに従って、複数のワークスペース間でスケーラブルな、エンドツーエンドの機械学習のライフサイクルを標準化し管理します。 運用環境に移行する前に、実装されたソリューションが、モデルの再トレーニング サイクルと自動再デプロイを使用して継続的な推論をサポートしていることを確認します。 考慮すべきリソースを次に示します。

Azure Machine Learning の一部としての責任ある AI は、AI の開発と使用の 6 つの柱 (公平性、信頼性と安全性、プライバシーとセキュリティ、包括性、透明性、説明責任) に基づいています。 概要と実装について詳しくは、「責任ある AI とは?」をご覧ください。

パフォーマンス効率

パフォーマンス効率とは、ユーザーによって行われた要求に合わせて効率的な方法でワークロードをスケーリングできることです。 詳細については、「パフォーマンス効率の柱の概要」を参照してください。

このシナリオのほとんどのコンポーネントは、解析アクティビティのレベルに応じてスケールアップまたはスケールダウンできます。 Azure Synapse はスケーラビリティとハイ パフォーマンスを提供し、アクティビティのレベルが低いときは削減または一時停止できます。

Azure Machine Learning は、データの量とモデル トレーニングに必要なコンピューティング リソースに基づいてスケーリングできます。 予想される負荷とスコアリング サービスに基づいて、デプロイとコンピューティング リソースをスケーリングできます。

スケーラブルなソリューションの設計の詳細については、「パフォーマンス効率のチェックリスト」を参照してください。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパル作成者:

  • Manasa Ramalinga | プリンシパル クラウド ソリューション アーキテクト、米国ナショナル CSA チーム

その他の共同作成者:

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ