透過性のためのメモとは
AI システムには、テクノロジとそれを使用するユーザーが影響を受け、デプロイされる環境が含まれます。 意図した目的に合わせてシステムを構築するためには、テクノロジの仕組み、それぞれの機能と制限、最高のパフォーマンスを実現させる方法に関する理解が不可欠です。 Microsoft の透過性のためのメモは、AI テクノロジがどのように機能するか、システム所有者が選択できる、システムのパフォーマンスと動作に影響する選択肢、およびテクノロジ、人、環境を含むシステム全体について考える重要性を理解する助けとなるように用意されています。 独自のシステムを開発または展開するときに透過性のためのメモを使用することも、システムを使用するユーザーやシステムの影響を受けるユーザーと共有することもできます。 Microsoft の透明性に関する注意事項は、Microsoft における AI に関する原則の実践という幅広い取り組みの一環です。 詳細については、Microsoft AI の原則を参照してください。
放射線分析情報の基本
イントロダクション
Radiology Insights (RI) は、エラーと不整合 (不一致) に関するフィードバックとして品質チェックを提供することを目的としたモデルであり、レポートの完全なコンテキストを使用して重要な結果を特定して伝達するのに役立ちます。 放射線科医によって文書化された測定値 (サイズ) を含むフォローアップ推奨および臨床所見も特定されます。
- Radiology Insights は、Project Health Insights Azure AI サービス内で提供される組み込みの AI ソフトウェア モデルです
- Radiology Insights は外部参照を提供しません。 Radiology Insights は、Health Insights モデルとして、提供された入力に推論を提供し、モデルの結論を深く理解するための参照として使用します。
Azure Health Insights の 放射線インサイト 機能は、自然言語処理手法を使って、非構造化医療放射線医学ドキュメントを処理します。 この機能では、ユーザーが放射線医学ワークフローのコンテキストにおいて財務上および臨床上の結果を効果的に監視、理解、改善するのに役立つ数種類の推論が追加されます。 現在システムでサポートされている推論の種類は、AgeMismatch、SexMismatch、LateralityDiscrepancy、CompleteOrderDiscrepancy、LimitedOrderDiscrepancy、Finding、CriticalResult、FollowupRecommendation、RadiologyProcedure、Communication です。
これらの推論を使用して、臨床分析をサポートしたり、ドキュメント作成プロセス中にリアルタイムの支援を提供したりできます。
- RI を使用すると、放射線ワークフロー データのスライスとサイコロが可能になり、重要な分析情報が作成され、実用的な情報が得られます。
- RIは過去の分析を可能にし、介入を必要とする強みを明らかにし、特定の領域を明らかにする意味のある洞察を生成することによって未来を改善します。
- RI を使用すると、品質チェックの作成と、不一致と考えられる重大な結果に対する自動のインライン アラートが可能になります。
- RI は、証拠ベースの臨床上の意思決定を推進する AI 主導の自動化されたガイダンス サポートと品質チェックを使用して、フォローアップの推奨事項の一貫性を向上させます。
Radiology Insights は、現在のオファリングの一部として英語で非構造化テキストを受け取ることができ、名前付きエンティティ認識 (NER) に Text Analytics for Health (TA4H) を使用し、識別されたエンティティ間の関係の抽出、否定や条件付きなどのアサーションの表面化、検出されたエンティティを一般的なボキャブラリにリンクします。
キーワード
任期 | 定義 |
---|---|
ドキュメント | RIモデルの入力は放射線医学臨床文書であり、物語情報の横には患者情報と手順順序仕様を含むメタデータも含まれています。 |
[モダリティ] | モダリティとは、身体の医療画像をキャプチャするために使用される特定の種類のイメージング技術または技術を指します。 各モダリティは、診断と治療に役立つ画像を生成するために、異なる物理的原理(X線、音波、磁場など)を採用しています。 |
推論 | RI モデルの出力は、処理されたドキュメントに追加された推論または注釈の一覧です。 |
AgeMismatch | メタデータ内の年齢情報とストーリー テキストの間に不一致がある場合にトリガーされる注釈。 |
SexMismatch | メタデータ内の性情報と物語テキストの間に不一致がある場合にトリガーされる注釈 (患者の参照、性別固有の調査結果、性別固有の身体部分を含む)。 |
LateralityDiscrepancy | メタデータとストーリー テキスト内の横方向の情報の間、またはレポート テキストの結果とインプレッション セクションの間に不一致がある場合にトリガーされる注釈。 |
CompleteOrderDiscrepancy | 完全な研究が指示されたメタデータ内の情報に従って、レポート テキストに関連する身体部位がすべて含まれていない場合にトリガーされる注釈。 |
LimitedOrderDiscrepancy | メタデータに存在する処置順序に従って身体部位の一部を選択すべき状況で、レポート テキストに関連する身体部位がすべて含まれている場合にトリガーされる注釈。 |
発見 | レポート テキストで見つかった、臨床的に関連性のある概念に関連する臨床情報のアセンブリを識別して強調表示する注釈。 |
重要結果 | 規制コンプライアンスに従って特定の制限時間内に伝達する必要があるレポート テキスト内の結果を識別して強調表示する注釈。 |
FollowupRecommendation | レポート テキスト内の 1 つ以上の推奨事項を識別して強調表示し、構造化データ フィールドのセットに各推奨事項の正規化を提供する注釈。 |
放射線診断手順 | Loinc/Radlex コードを使用したメタ データに存在するプロシージャの順序情報の正規化。 |
通信 | レポートテキスト内で、受信者に結果が厳密に、または非厳密に伝えられているかどうかを示し、強調する注釈。 |
臨床ガイダンス | 臨床指導は意思決定ツリーと見なされ、医療提供者が臨床状態に対して最も適切なイメージングまたは治療上の決定を行うのを助けるために、証拠ベースのガイドライン(ACRガイドライン1 およびフライシュナー協会ガイドライン2)の構造化されたアプローチを提供することができます。 このモデルは、ドキュメントの重要な情報を表示してデシジョン ツリーにフィードし、1 つ以上の候補の推奨事項を提案します。 |
品質対策 | このモデルは、医療処置の実行時に品質測定のパフォーマンスが満たされたかどうかを評価します。 品質測定のパフォーマンスは、ドキュメントから証拠を表示したり、ドキュメントからの証拠が不足したりすることによって説明されます。 |
リスク スコアリングと評価 | リスクスコアリングおよび評価システムは、臨床所見の評価と報告を標準化するために、医療画像および診断で使用されます。 このモデルは、放射線科医が放射線科ノートまたはレポートで指示する値を使用して、主要なスコア付けと評価のリスクを表面化します。 |
能力
システムの動作
Radiology Insight は、元の放射線医学臨床ドキュメントにいくつかの種類の推論/注釈を追加します。 ドキュメントは、1 つ以上の注釈をトリガーできます。 1 つのドキュメントで同じ注釈の複数のインスタンスを使用できます。
- AgeMismatch
- SexMismatch
- LateralityDiscrepancy
- CompleteOrderDiscrepancy
- LimitedOrderDiscrepancy
- 発見
- 重要結果
- FollowupRecommendation
- 放射線診断手順
- 通信
- 臨床ガイダンス
- スコアリングと評価
- 品質対策
推論を含む臨床放射線学ドキュメントの例:
スコープ内の推論の機能説明とその例
年齢の不一致
年齢の不一致は、患者の人口統計メタデータ内の利用可能な患者年齢情報とレポート テキストの比較に基づいて識別されます。 競合する年齢情報は、テキストにタグ付けされます。
性別の不一致
性不一致の識別は、患者の人口統計メタデータ内の患者の性情報を一方で比較し、一方では患者の参照、性別固有の所見、およびテキスト内の性別固有の身体部分を比較した結果に基づいています。 競合する性情報はテキストにタグ付けされます。
横方向の不一致
"左" (Lt、lft) と "右" (rt、rght) として定義される側性は、メタデータの処置順序の処置の説明にある解剖学的構造 (身体部位) と共に、レポート内で側性の不一致を作成するために使われます。 過去のコンテンツに不一致はありません。 処置の説明で使用できるのが側性のみで、解剖学的構造を使用できない場合は、テキスト内のすべての反対の側性にタグが付けられます。 たとえば、[プロシージャの説明] の [左ビュー] には、レポート テキスト内のすべての "右" の単語が一覧表示されます。
CompleteOrder の不一致
完全性の不一致は、順序付けられた処置が腹部、後腹膜、骨盤、または胸部の超音波検査である場合に発生します。 順序が完全でテキストが完全でない場合、またはその逆の場合、完全性の不一致が生じます。
LimitedOrder の不一致
完全性の不一致は、順序付けられた処置が腹部、後腹膜、骨盤、または胸部の超音波検査である場合に発生します。 順序が完全でテキストが完全でない場合、またはその逆の場合、完全性の不一致が生じます。
検索
発見は、医療記録に見つかった、臨床的に関連性のある概念に関する臨床情報のNLUベースのアセンブリです。 アプリケーションに依存しないものとして作成されます。
所見のインフェレンスは、さまざまなフィールドで構成され、すべての部品を含み、所見のインフェレンスの全体像を組み立てることができます。
所見を構成するフィールド: 臨床インジケーター、サイズに関する AnatomyLateralityInfo、鋭敏さ、重症度、原因、状態、複数チェック、RegionFeatures、タイミング
重大な結果
レポートで指定された潜在的な重要な結果を識別して強調表示します。 レポートで指定された潜在的な ACR アクション可能な結果を識別して強調表示します。 レポート テキスト内の重大な結果のみを識別します (メタ データでは識別されません)。用語は、医療エラーの防止のための集団連合に基づいています: http://www.macoalition.org/Initiatives/docs/CTRstarterSet.xls。
フォローアップ推奨
この推論は、スケジュールする必要がある潜在的な訪問を示します。 各推奨事項には、1 つのモダリティと 1 つの本文部分が含まれています。 さらに、時間、左右性、1つまたは複数の所見、および条件付き句が存在することを示す指標 (true または false) が含まれています。
Cfr 性の不一致の例
RadiologyProcedure
Radiology Insights は、手順の順序からモダリティ、身体部分、横方向、ビュー、コントラストなどの情報を抽出します。 順序付けられたプロシージャは LOINC/RSNA 放射線学プレイブックを使用して Loinc/RadLex 委員会によって開発され、維持されて使用される Loinc コードを使用して正規化されます: http://playbook.radlex.org/playbook/SearchRadlexAction。
通信
RI は、通常、コミュニケーションを示す動詞と名前(一般的な名と姓)、または医療従事者や看護師への参照を組み合わせた形で、テキスト内の言語をキャプチャします。 このような受信者が複数存在する可能性があります。 非医学スタッフ(秘書、事務員など)へのコミュニケーションは、この人物の適切な名前が記載されていない限り、コミュニケーションとしてタグ付けされません。 過去のコミュニケーション (履歴セクションなど) または今後の通信 ("通信予定" など) として識別された言語は、通信としてタグ付けされません。
Cfr SexMismatch の例
臨床ガイダンス
臨床指導はデシジョンツリーと見なされ、放射線科医が特定のイメージング研究とそのタイミングを選択するなど、将来の行動に最も適切な意思決定を行えるように、証拠ベースのガイドライン(ACRガイドライン1-4 およびフライシュナー社会ガイドライン5)の構造化されたアプローチを提供することができます。
このモデルは、ドキュメントから臨床発見情報を抽出して、デシジョン ツリーにフィードするために必要な重要な情報を取得します。 ツリー ノードが完了すると、1 つ以上の候補の推奨事項が提案される可能性があります。 複数の臨床発見の例は同じ臨床指導を引き起こすことができる。 このような場合、臨床所見は、存在する必要な重要な情報の量に応じて高から低にランク付けされます。
このモデルでは、レポート内の結果から識別されたガイドラインのガイダンス ツリー ロジックから派生した候補の推奨事項が提案されます。 これらの推奨事項は、モダリティ、解剖学、横性、期間の観点から標準化されています。 見つかったツリー ノードが複数の手順につながる場合、モデルは各手順に対して個別の候補の推奨事項 (CT、PET CT、または組織サンプリングの推奨事項など) を提供します。 モデルは、モデルによって候補の推奨事項が提案されない場合に備えて、臨床所見に関する不足情報も提供します。 放射線科医がこれらの不足している詳細を文書化することを選択した場合は、モデルによって追加の推奨事項が提供されます。
候補の推薦に加えて、ACRの臨床ガイドラインはまた特定の臨床状態の重大度か進行を示すスコアか段階を示唆できる。 例として、甲状腺イメージングレポートおよびデータシステム(TI-RADS)ガイドライン5 の必要なキー情報がそれぞれスコアに割り当てられ、合計スコアがカテゴリを決定します。 カテゴリに基づいて、候補の推奨事項を提案できます。
以下のサンプルの結果セクションで、次の手順を実行します。
"右上葉の 8 mm の結節、画像 #15 シリーズ 4。 6mmを測定した新しい後部右上葉結節、画像#28シリーズ4。 新しい 1.2 cm 肺結節, 右上葉, 画像 #33 シリーズ 4。"
放射線分析情報モデルは、ドキュメントに存在するこの情報ガイダンス値から抽出され、肺結節の臨床ガイドライン(Fleishner Society Guideline5)に基づいて候補の推奨事項を示します。 この場合、このモデルは、異なるモダリティを使用して同じ肺構造に対して異なる推奨事項を示唆する:コンピュータ化された軸断層法、陽電子放出断層法、およびイメージングガイド付き生検。
さらに、インプレッション セクションのサンプル ドキュメントは次のとおりです。
「既に右上葉に認められた小さな肺結節は消失したが、しかし、複数の新しい小結節が両方の肺全体に散在していることが確認されている」。
右上葉の観測値も、モデルによって現在のガイダンス値として表示されます。 ただし、モデルでは、見逃され、レポートに記載されていないガイダンス値も表示されます。 これらの値が文書化されている場合、モデルは肺結節の臨床ガイドラインに従って他の候補の推薦を提案することができる。 これにより、放射線科医は、候補の推奨事項を提案したり、オプションの一部として追加の推奨事項を含むようにドキュメントを強化したりできます。
このモデルは、所見セクション(青)の結果から、2つの推薦候補を提案する:ポシトロン放射断層法とイメージングガイド付き生検、両方の肺。 この結果に対して表示されるガイダンス値は、葉、R右上葉、サイズ、12 mm です。 [インプレッション] セクションの結果から Lobe のガイダンス値が返されますが、Size が見つからないため、不足しているガイダンス値として返されます。 推奨候補は提案されません。
ACR臨床ガイドライン表はモデルによってサポートされています
臨床ガイダンス | コード |
---|---|
付属器の質量 | SNAF: 445039006: 子宮付属器の質量 (発見) |
副腎結節 | SNAF: 237783006: 副腎の塊 (発見) |
肝性外傷 | SNAF: 39400004: 肝臓の損傷 (障害) |
肝病変 | SNAF:300331000:肝臓の病変(発見) |
肺がんのステージ | SNAF: 258319005: 肺の関与の段階 (腫瘍のステージング) |
膵臓損傷の採点 | SNAF: 61823004: 膵臓の損傷 (障害) |
腎病変 | SNAF:79131000119100:腎臓病変(発見) |
脾臓損傷の分類 | SNAF: 23589004: 脾臓の損傷 (障害) |
腎損傷の採点 | SNAF: 40095003: 腎臓の損傷 (障害) |
甲状腺結節 | SNAF: 237495005: 甲状腺結節 (疾患) |
腹部皮質動脈瘤 | SNAF: 233985008: 腹部皮質動脈瘤 (障害) |
妊娠の場所 | SNAF: 858901000000108: 場所不明の妊娠 (疾患) |
妊娠の生存性の初期 | SNAF: 289208006: 妊娠の生存可能性の発見 (発見) |
直腸癌のステージ | SNAF: 254310002: 腫瘍ノード転移 (TNM) 結腸と直腸腫瘍のステージ (腫瘍のステージ) |
妊娠の成立可能性 FOLLOW-UP | SNAF: 364327007: 妊娠の生存可能性 (観測可能エンティティ) |
付属器官嚢胞 | SNAF: 97171000119100: 子宮付属器の嚢胞 (障害) |
膵臓嚢胞 | SNAF: 31258000: 膵臓の嚢胞 (疾患) |
脳室上衣下出血 | SNAF: 276650005: 新生児脳室内出血 (障害) |
胆のうと胆管 | SNAF: 300346007: 胆嚢の病変 (発見) |
脳下垂体 | SNAF: 399244003: 下垂体の障害 (障害) |
O-RADS | SNAF: 289840004: 排卵の病変 (発見) |
肺結節 | RADLEX: RID50149: 肺結節 |
TI-RADS | RADLEX: RID50503: TI-RADS 評価 |
LUNG-RADS | RADLEX: RID50134: LUNG-RADS 評価 |
品質対策
品質測定、品質報告、継続的改善のためのフレームワークを提供することで、医療の質を向上するうえで重要な役割を果たします。 モデルでサポートされている品質メジャー7 を次の表に示します。 MIPS認定臨床データ登録 |アメリカ放射線医学大学
このモデルは、レポートに記載されている品質測定基準をキャプチャし、品質基準を満たすために必要なすべての基準が含まれているかどうかを確認することによって、ドキュメントが完成しているかどうかを判断します。
ドキュメントが必要な品質測定基準に準拠している場合、品質測定のパフォーマンスは "満たされています"。 ドキュメントが条件に準拠していない場合、パフォーマンスは "満たされていません" になります。 このモデルでは、ドキュメントに品質測定のパフォーマンスを満たす必要のない結果 (たとえば、患者がクロルヘキシジンにアレルギーがある、CVC 挿入の品質基準を満たす基準) が含まれている場合は、品質測定に "例外" というラベルが付けられます。
以下のサンプルでは、CVCまたは中央静脈カテーテルを患者に挿入する必要があります。 これは、血流感染症などの重篤な合併症を避けるために臨床設定で重要です. したがって、手順は、CVC挿入基準、従来の技術を使用した適切な手の衛生、および滅菌手袋、キャップ、マスク、滅菌ガウン、滅菌フルボディドレープの使用などの最大の滅菌バリアプラクティスに従う必要があります。 さらに、この手順には、クロルヘキシジンを使用した適切な皮膚調製と、超音波、滅菌ゲル、滅菌プローブカバーの使用を含む滅菌超音波技術の適用が必要である。 しかし、このサンプルでは、滅菌超音波技術の重要な成分である滅菌プローブカバーの使用に関する情報がないため、パフォーマンスは「満たされていません」。 その結果、ドキュメントは品質測定 CVC 感染防止に準拠していません。
条件が見つからない場合は、ドキュメントを更新して、文書化されていないが実行された条件をカバーしたり、実行されたプロシージャにこれらの重要な条件が含まれていない理由を理解するために振り返ったりすることもできます。
図品質測定: モデルは、品質測定 CVC の挿入に関して、ドキュメントがその品質基準に準拠していないことを報告し、コンプライアンスの種類をモデルの応答で "パフォーマンスが満たされていません" と分類します。 滅菌プローブカバーの使用に関する情報がありません。
品質指標表 – MIPS 実装
MIPS Nr | MIPS |
---|---|
76 | 中央静脈カテーテルの予防 - 関連する血流感染症。 |
145 | 蛍光透視を用いた手順で報告された露光線量指数または露光時間および画像数。 |
147 | 骨シンチグラフを受けているすべての患者に対する既存のイメージング研究との相関関係。 |
360 | 電離放射線への患者の曝露の最適化:潜在的な高用量放射線イメージング研究の数:コンピュータ断層撮影(CT)および心臓核医学研究。 |
364 | 妥当性:推奨ガイドラインに従って、偶発的に検出された肺結節のフォローアップCT画像。 |
405 | 偶発的な腹部病変に対する適切なフォローアップイメージング。 |
406 | 患者の付随甲状腺結節に対する適切なフォローアップイメージング。 |
436 | 用量低下技術の利用。 |
ACRad No | ACRad |
---|---|
36 | 胸部CTスキャンで偶然報告された冠動脈石灰化 |
37 | 肺エンボリズムに対するCT肺血管造影術(CTPA)の解釈 |
三十八 | 心室シャント患者に対する低用量頭蓋CTまたはMRI検査の使用 |
40 | 前立腺MRIにおける構造化レポートの使用 |
41 | オンコロジックFDG PETイメージングの定量基準の使用 |
42 | 肝細胞癌 (HCC) のリスク患者における肝結節 <10mmの監視画像 |
MSDN QCDR いいえ | MSN QCDR |
---|---|
MEDNAX55 | 急性脳梗塞の疑いのために行われた非コントラスト CT ヘッドに対する ASPECTS (Alberta Stroke Program Early CT Score) の使用 |
MSN13 | 冠動脈石灰化地域分布スコアリングを含む心臓血管リスク評価のための冠状カルシウムスコアリングのスクリーニング |
MSN15 | 甲状腺結節リスクを分析するための最終報告における甲状腺画像報告及びデータシステム(TI-RADS)の利用 |
QMM26 | 推奨事項付き腹部大動脈瘤スクリーニング報告 |
QMM17 | Ovarian-Adnexal Reporting and Data System (O-RADS) を使用した、子宮付属器損害に対する適切なフォローアップの推奨事項 |
QMM18 | 乳がんリスクスコアのマンモグラフィへの利用 |
QMM19 | 骨ペニア患者のDEXA/DXAと骨折リスク評価 |
スコアリングと評価
リスク スコアリングと評価システムは、医療画像および診断で使用され、調査結果の評価とレポートを標準化します。 これらのシステムは、イメージング研究を解釈し、疾患のリスクを評価し、臨床管理を導くための構造化されたアプローチを提供します。 実装されているリスク スコアリングおよび評価システム8 を次の表に示します。
モデルでは、放射線科医が放射線科ノートまたはレポートで指示する分類または値を使用して、リスク、スコアリング、評価が表示され、強調表示されます。
このモデルの下のサンプルでは、2 つの推論を識別しています。ASCVD (アテローム性循環器疾患) リスク (値 17.6%) とアガストン スコア (冠動脈のカルシウム量を定量化するために使用される測定値) と値 0。 10年間のASCVD(アテローム性心血管疾患)リスクスコアは、人が今後10年以内に心臓血管イベント(心臓発作やストロークなど)を経験する可能性の推定値です。 このスコアは、年齢、コレステロール値、血圧、喫煙状態、糖尿病などのさまざまなリスク要因に基づいて (モデルによってではなく) 計算されます。 この場合、リスク スコアが 17.6% は、その人のリスク要因に基づいて、次の 10 年間に心臓血管イベントを経験する可能性が 17.6% であることを意味します。
図リスク スコアリングと評価: このモデルでは、値が 17.6% のカテゴリ ASCVD リスクの 1 つと、値が 0 のカテゴリカルシウム スコアの 1 つである、2 つのスコアリングと評価インスタンス (青) が識別されます。
実装されているテーブル リスクまたは評価カテゴリ
リスクまたは評価カテゴリ | 値/分類 | 単位 |
---|---|---|
BIRADS | 0、1、2、3、4、4a、4b、4c、5、6 | |
C-RADS 結腸の結果 | C0、C1、C2、C3、C4 | |
C-RADS 結腸外の結果 | E0、E1、E2、E3、E4 | |
CAD-RADS | 0、1、2、3、4、4a、4b、5、N | |
LI-RADS | NC、1、2、3、4、5、M、TIV | |
US LI-RADS 視覚化スコア | A、B、C | |
Lung-RADS | 0、1、2、3、4a、4b、4x、S、C | |
NI-RADS | 0、1、2、2a、2b、3、4 | |
O-RADS | 0, 1, 2, 3, 4, 5 | |
PI-RADS | 0, 1, 2, 3, 4, 5 | |
TI-RADS | 0, 1, 2, 3, 4, 5 | |
Kellgren-Lawrence グレーディングスケール | 0, 1, 2, 3, 4 | |
トンニスの分類 | 1, 2, 3, 4 | |
カルシウム スコア | 数値 (通常は 1 ~ 1000) | |
ASPECTS (アルバータストロークプログラム早期CTスコア) | 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 | |
Z スコア | -4 から 4 | |
T スコア | -4 から 4 | |
生涯乳がんリスク | 数値 0 から 100 | % |
ASCVD リスク | 数値 0 から 100 | % |
変更された Gail モデル のリスク | 数値 0 から 100 | % |
Tyrer Cusick モデル リスク | 数値 0 から 100 | % |
10年間のCHDリスク | 数値 0 から 100 | % |
悪性度指数 (RMI) のリスク | 数値 | |
HNPCC 変異リスク | 数値 0 から 100 | % |
活用事例
医療機関や放射線チームは、放射線の運用とパフォーマンスに固有の傾向と結果を可視化し、品質に常に注意を払う必要があります。 放射線の分析情報モデルは、放射線科医のための放射線学ドキュメントから貴重な情報を抽出します。
これらの各ユース ケースの範囲は、常に放射線科医がディクテーションしている現在のドキュメントです。 画像分析や患者記録情報は関係ありません。 メタデータは、現在のレポートの管理コンテキストを提供し、患者の年齢、患者の性別、および注文された手順に限定されます。 (例:腹部のCT、脳のMRI,...)
Microsoft では、この機能を API として提供し、スコープ内の情報を識別または抽出できるようにするモデルを提供しています。 顧客は、モデルを独自またはサードパーティの放射線レポート ソフトウェアに組み込み、情報のユーザー インターフェイスを決定します。 お客様は、ISV または医療システムで、医療システム内で使用するために放射線レポート ソフトウェアを開発または変更することができます。
したがって、お客様による具体的なユース ケースと、放射線科医による情報の提示または使用方法は、説明と若干異なる場合がありますが、説明は API 機能の目的を示しています。
ユース ケース 1 – 不一致の識別: 放射線科医は、放射線科医が放射線科レポートに文書化した内容と、レポートのメタデータに存在していた情報との間で、モデルによって識別される可能性のある不一致が提供されます。 性別、年齢、身体部位の横方向の不一致を特定できます。 不一致は、ディクテーションされたテキストと指定されたメタデータの間の潜在的な不一致を識別します。 また、ディクテーションされたテキストまたは書き込みテキスト内の潜在的な不整合も特定します。 不整合は、性別、年齢、横性、および画像の種類に限定されます。 これは、放射線科医が報告中に潜在的な不整合を修正することを可能にすることだけです。 システムは、放射線科医が報告している画像を認識していません。 決してこのモデルはイメージの放射線科医の解釈の臨床判断を提供しない。 放射線科医は、患者の診断および治療およびその正しい文書化を担当する。
ユース ケース 2 – 臨床所見の提供: モデルは構造化されたデータとして抽出します 2 種類の臨床所見: 重大な発見と実用的な発見. 放射線科医によるレポートに明示的に文書化されている臨床所見のみがモデルによって抽出されます。 モデルによって生成された臨床所見は、レポート内の情報や画像から推測されることはありません。 これらは単に放射線科医がプロバイダーと通信するための潜在的なリマインダーとして機能します。 このモデルは、臨床所見をもとに「重要所見」と「重大所見」という2つのカテゴリーを生成します。これらのカテゴリーは、レポートで明示的に述べられた臨床所見に基づき、米国放射線医学会(ACR)によって策定された基準に従っています。 このモデルでは、放射線科医によって明示的に文書化されたすべての結果が常に抽出されます。 抽出された所見を使うと、明確な伝達と医療専門家によるタイムリーな対処が必要になる可能性のある臨床所見を、放射線科医に警告することができます。 お客様は、抽出された結果を利用して、ダウンストリームまたは関連するシステム (EHR や自動スケジュール関数など) を設定することもできます。
ユース ケース 3 – フォローアップの推奨事項を伝える: 放射線科医は、場合によってはフォローアップが推奨される結果を明らかにします。 文書化された推奨事項は、医療専門家(医師)へのコミュニケーションのためのモデルによって抽出され、正規化されます。 フォローアップの推奨事項は生成、推測、または提案されません。 このモデルは、放射線科医によって明示的に文書化されたフォローアップ推奨ステートメントを抽出するだけです。 フォローアップの推奨事項は、SNOMED にコーディングすることで正規化されます。
ユース ケース 4 – 測定値を報告します: 放射線科医は、測定値と臨床所見を文書化します. このモデルは、発見に関連する臨床的に関連する情報を抽出する。 このモデルは、レポートに明示的に記載されている放射線科医の測定値を抽出します。 このモデルは、放射線科医によって既に取得およびレビューされている測定値を検索しています。 関連するテキスト ベースのレコードからこれらの測定値を抽出し、それらを構成します。 抽出および構造化された測定データを使用して、時間の経過に伴う特定の患者の測定値の傾向を確認できます。 顧客は、モデルによって抽出された測定データに基づいて、一連の患者を検索できます。
ユース ケース 5 - 生産性と主要な品質メトリックに関するレポート: 放射線分析情報モデルで抽出された情報 (ユース ケース 1 から 5 で抽出された情報) を使用して、放射線科医チームのレポートを生成し、分析をサポートできます。 抽出された情報に基づいて、ダッシュボードと振り返り分析を使用すると、生産性と主要な品質メトリックに関する更新を提供して、改善作業をガイドし、エラーを最小限に抑え、レポートの品質と一貫性を向上させることができます。 RI モデルはダッシュボードを作成しませんが、推論ではなく抽出された情報を提供します。この情報は、ユーザーが調査や管理の目的で集計することができます。 このモデルはステートレスです。
ユース ケース 6 – 品質対策: 医療プログラムにおける払戻基準への準拠 シナリオ: 医療組織は、MACRA 法に基づいて確立されたメリットベースのインセンティブ支払いシステム (MIPS) など、進化する払い戻しプログラムに確実に準拠する必要があります。組織は、払い戻しインセンティブの資格を得るか、ペナルティを回避するために、特定のパフォーマンス基準を満たす必要があります。 解決策: 組織は、臨床データと管理データから適切な品質測定基準を集計します。 これらの基準の追跡とレポートを自動化することで、システムは払戻要件への準拠をサポートし、手動作業を減らし、Medicare への正確なレポートを確保します。 RIモデルはダッシュボードを作成せず、推測ではなく顧客が集計できる直接抽出された情報を提供します。 このモデルはステートレスです。
ユース ケース 7 – スコアリングと評価: 放射線分析情報を使用した人口健康管理 シナリオ:医療機関は、より多くのスクリーニングまたは予防サービスを必要とする個人または患者グループを特定することで、人口の健康管理を改善することを目指しています。 組織は、患者の結果を改善するために、放射線レポートから貴重な洞察を抽出したいと考えています。 解決策: スコアと値を集計して傾向を特定し、ベースラインを確立し、さらにスクリーニングや予防ケアの恩恵を受けることができる個人またはグループにフラグを設定します。 このシステムは、臨床医が患者集団を積極的に管理し、予防的ケアを改善しながら、将来の合併症の可能性を減らすのに役立ちます。
ユース ケース 8 – 放射線科医のための臨床ガイダンス シナリオ: 放射線科医は、レポートで結果を文書化する際に、特定の臨床ガイドラインを参照する必要が頻繁に発生します。 ただし、情報が見つからないか不完全な場合、これらのガイドラインとその推奨事項へのアクセスが遅れる可能性があり、レポートの精度に影響を与える可能性があります。 解決策:放射線分析情報は、適用可能な臨床ガイドラインとその候補の推奨事項に関連する放射線学レポートに文書化された調査結果を自動的に強調します。 重要な情報が見つからない場合は、臨床ガイドラインの推奨結果に影響を与える可能性があり、システムはこれらのギャップにフラグを設定します。 このプロアクティブなアプローチにより、放射線科医は必要なガイドライン情報にすぐにアクセスでき、レポートの精度と完全性が向上します。
他のユースケースを選択する際の考慮事項
Radiology Insights は、非構造化医療テキストから知識を抽出し、放射線学ドキュメント ワークフローをサポートするための貴重なツールです。 ただし、健康関連データの機密性の高い性質を考えると、使用事例を慎重に検討することが重要です。 いずれの場合も、人間はシステムから返される情報によって支援された意思決定を行う必要があり、いずれの場合も、ソース データを確認してエラーを修正する方法が必要です。 ユース ケースを選択する際の考慮事項を次に示します。
このサービスを医療デバイスとして使用するシナリオ、臨床サポートを提供するシナリオ、または診断、治療、軽減、治療、または人間の介入なしに病気やその他の状態の予防に使用する診断ツールとして使用するシナリオは避けてください。 資格のある医療専門家は、常にデューデリジェンスを行い、患者のケアの決定に影響を与える可能性のあるソース データを検証し、意思決定を行う必要があります。
人間の介入なしに医療サービスや医療保険を自動的に付与または拒否することに関連するシナリオは避けてください。 カバレッジ レベルに影響を与える決定は影響を受けるので、これらのシナリオではソース データを常に検証する必要があります。
患者の同意または適用法で許可されていない目的で個人の健康情報を使用するシナリオは避けてください。 健康情報には、プライバシーと同意に関する特別な保護があります。 使用するすべてのデータが、システム内のデータの使用方法に対して患者の同意を得ているか、または健康情報の使用に関連する適用法に準拠していることを確認します。
検出された推論を使用して、人間の介入なしに患者レコードを更新することを慎重に検討してください。 間違ったデータが他のシステムに反映されないように、エラーを報告、トレース、修正する方法が常にあることを確認します。 患者レコードの更新が、資格のある専門家によってレビューおよび承認されていることを確認します。
人間の介入なしに、患者の課金で検出された推論を使用することを慎重に検討してください。 プロバイダーと患者が、誤った課金を生成するデータを報告、トレース、および修正する方法を常に持っていることを確認します。
制限事項
RI モデルから実用的で正確な出力を得るには、入力放射線学ドキュメントの特定の特性が不可欠です。 この中で重要な役割を果たす項目の一部は次のとおりです。
- 言語: 現在、RI 機能は英語のテキストに対してのみ有効になっています。
- 不明な単語: 放射線学ドキュメントには、不明な省略形や単語、またはコンテキスト外の同名またはスペル ミスが含まれている場合があります。
- 入力メタデータ: RI は、ドキュメントまたはドキュメントのメタデータで入力情報を使用できる特定の種類の推論を想定しています。
- テンプレートと書式設定: RI は実際の代表的なドキュメント セットを使用して開発されていますが、特定のユース ケースやドキュメント テンプレートによって、RI ロジックが正確になるという問題が発生する可能性があります。 たとえば、入れ子になったテーブルや複雑な構造では、最適でない解析が発生する可能性があります。
- ボキャブラリと説明: RI は、実際のドキュメントで開発およびテストされています。 しかし、自然言語は豊富であり、特定の臨床事実の説明は、ロジックの出力に影響を与える可能性がある時間の経過と同時に変化する可能性があります。
システムのパフォーマンス
システムのパフォーマンスは、真陽性、真陰性、偽陽性、偽陰性の各インスタンスに基づいて統計を計算することによって評価されます。 そのためには、代表的なドキュメント セットを作成し、最終的に予想される結果に注釈を付ける必要があります。 RI の出力を目的の出力と比較して、精度番号を決定できます。
放射線分析情報が誤検知/偽陰性出力をトリガーする主な理由は次のとおりです。
- 必要なすべてのメタ情報が含まれていない入力ドキュメント
- 入力ドキュメントの書式と書式設定 (セクション見出し、句読点、...)
- 英語以外のテキスト (一部)
- 不明な単語 (省略形、スペル ミス、...)
- 複雑な書式設定の解析に関する問題 (入れ子になったテーブル、...)
放射線の分析情報の評価
評価方法
放射線学の分析情報ロジックは、実際の臨床放射線学ドキュメントの大規模なセットを使用して開発および評価されます。 人間の専門家によって注釈が付けられた 5000 以上のドキュメントのトレーニング セット。RI 推論をトリガーするロジックの実装と調整に使用されます。 このセットの一部は、米国の医療センターによって提供されるコーパスからランダムにサンプリングされ、主に成人患者に焦点を当てています。
使用されるセットは米国ベースの男性および女性の患者のほぼ等しい表現およびすべての年齢グループの十分な表現を提供する。 データにはその種類のメタデータが含まれていないため、トレーニング データの代表性 (地理的、人口統計的、民族的表現など) のそれ以上の分析は行われないことに注意してください。 使用されるトレーニング セットとその他の評価セットは、さまざまな種類の患者特性 (年齢、性別) に対してすべての種類の推論が存在することを確認するために構築されています。 ロジックの精度または回帰は、完全なロジック スコープをカバーする単体テストと機能テストを使用してテストされます。 RI モデルの一般化は、トレーニング セットの同じ特性を共有するその他のドキュメント セットを使って評価されます。
母集団全体の推論ごとに対象となる最小パフォーマンス レベルが評価され、追跡され、対象分野の専門家と共にレビューされます。 基になるすべてのコア NLP および NLU コンポーネントは、特定のテスト セットを使用して個別にチェックおよびレビューされます。
評価結果
使用される評価メトリックは、人間の専門家からの手動ゴールデン トゥルース注釈が存在する場合の精度、再現率、および f1 スコアリングです。 回帰テストは、不一致分析と人間の専門家のフィードバック サイクルを使用して行われます。
放射線学ドキュメントの見えないセットとトレーニング セットに対する評価は、Radiology Insights が、すべての放射線分析情報注釈に注釈が付けられたデータセット全体で強力で一貫したパフォーマンスを達成することを示しています。
合計 15,000 を超えるドキュメントのトレーニング セットには、包括的な注釈が含まれています。 彼らは、発見、重大な結果、コミュニケーション、不一致、推奨事項、スコア付けと評価、臨床ガイダンスなど、あらゆる分野の医療専門家によってキュレーションされました。 これらのセットは、多様なユース ケースをカバーすることで、モデルの機能の強固な基盤を提供します。
見えないセット (合計 6,000 を超えるドキュメント) は、一般化性の厳格なテストとして機能し、トレーニング中に検出されなかったデータに対してもモデルが実行されることを確認します。
要約すると、評価では、見た目と見えないセットの両方で強力で一貫したパフォーマンスが示されますが、エッジ ケースや未テストの条件を含む、より多くのシナリオの継続的な検証と調査は依然として重要であり、実際のアプリケーションで包括的なカバレッジと継続的な品質を確保するために継続的に行われます。
使用のための放射線分析情報の評価と統合
Radiology Insights をデプロイする準備ができたら、次のアクティビティが成功を収めるのに役立ちます。
何ができるかを理解する: RI の機能を完全に評価して、その機能と制限事項を理解します。 シナリオとコンテキストでそれがどのように実行されるかを理解します。
実際の多様なデータを使用してテストする: ユーザー、地域、デプロイ コンテキストの多様性を反映する実際の条件とデータを使用して、シナリオのパフォーマンスを RI でどのようにテストするかを理解します。 エンド ツー エンドのシナリオを反映しない小規模なデータセット、合成データ、テストは、運用環境のパフォーマンスを十分に表す可能性は低くなります。
プライバシーに対する個人の権利を尊重する:適法かつ正当な目的のために個人からのデータおよび情報のみを収集または使用する。 使用に同意した、または法的に許可されているデータと情報のみを使用してください。
法的レビュー: 特に機密性の高いアプリケーションやリスクの高いアプリケーションで使用する場合は、ソリューションの適切な法的レビューを取得します。 作業する必要がある制限事項と、使用前に軽減する必要があるリスクについて説明します。 このようなリスクを軽減し、発生する可能性のある問題を解決するのはお客様の責任です。
システム レビュー: ソフトウェアまたは顧客または組織のプロセスのために、AI を利用した製品または機能を既存のシステムに統合して責任を持って使用する予定の場合は、システムの各部分がどのように影響を受けるかを理解するために時間がかかります。 AI ソリューションが Microsoft の責任ある AI 原則とどのように整合しているかを検討します。
人の関与: 人が関与していることを維持し、人間の監視を含めることを調査対象の一貫したパターンとして検討します。 これは、AI を利用した製品または機能を継続的に人間が監視し、モデルの出力に基づいて決定を下す人間を保証することを意味します。 損害を防ぎ、AI モデルの実行方法を管理するには、人間がソリューションにリアルタイムで介入する方法を確保します。
セキュリティ: ソリューションが安全であり、コンテンツの整合性を維持し、不正アクセスを防ぐための適切な制御があることを確認します。
顧客フィードバック ループ: ユーザーと個人がデプロイ後にサービスの問題を報告するために使用できるフィードバック チャネルを提供します。 AI を利用した製品または機能をデプロイした後、継続的な監視と改善が必要になります。 計画を立て、改善のためのフィードバックと提案を実装する準備をします。
リファレンス
- アメリカ放射線医学大学 "ACR の適切性基準"。アメリカ放射線医学大学 2025 年 1 月 29 日。 https://www.acr.org/Clinical-Resources/Clinical-Tools-and-Reference/Appropriateness-Criteria
- アメリカ放射線医学大学 "インシデントの結果。"アメリカ放射線医学大学。Web。 2025 年 1 月 29 日。 https://www.acr.org/Clinical-Resources/Clinical-Tools-and-Reference/Incidental-Findings
- アメリカ放射線医学大学 "Reporting and Data Systems (RADS)。"アメリカ放射線医学大学。Web。 2025 年 1 月 29 日。 https://www.acr.org/Clinical-Resources/Clinical-Tools-and-Reference/Reporting-and-Data-Systems
- 米国外傷外科協会. 外傷評価尺度"米国外傷外科学会, n.d. Web. 2025 年 1 月 29 日。 https://www.aast.org/resources-detail/injury-scoring-scale
- Mac Mahon H、Naidich D、Goo J など。 CT画像から検出された付随肺結節の管理ガイドライン:Fleischner Society 2017から。 放射線学。 2017;284(1):228-43. doi:10.1148/radiol.2017161659 - Pubmed
- Tessler、Franklin N.、その他。 「ACR甲状腺イメージング、レポート、データシステム(TI-RADS):ACR TI-RADS 委員会のホワイト ペーパー」2017年アメリカ放射線学会雑誌.
- MIPS認定臨床データ登録 |アメリカ放射線医学大学
- リスク スコアリングと評価システム リソースへの参照
ある。 卵子腫瘍における悪性腫瘍指数のリスク |放射線医学リファレンス記事 |Radiopaedia.org
b。 BI-RADS、C-RADS、CAD-RADS、LI-RADS、Lung-RADS、NI-RADS、O-RADS、PI-RADS、TI-RADS: 報告およびデータシステム - PubMed