Azure Health Data Services 中的去識別化服務使醫療機構能以 多種語言 去識別化臨床資料,使所得資料在保持臨床相關性與分布性,同時符合以下條件:
- 1996年健康保險可攜性及責任法案(HIPAA)隱私法規
- 根據《一般資料保護條例》下的無連結化名原則
該服務運用最先進的機器學習模型,自動從臨床筆記、逐字稿、訊息或臨床試驗研究等非結構化文字中擷取、遮蔽或替代 27 個實體(包括 HIPAA 18 受保護健康資訊(PHI)識別碼。
如何從去識別化數據中獲益?
| 作為 | AHDS 去身分識別可讓您能夠 |
|---|---|
| 資料科學家 | 使用已取消識別的數據來定型健全的機器學習模型、建立對話代理程式,以及進行縱向研究。 |
| 資料分析師 | 監視趨勢、建置儀錶板及分析結果,而不會影響隱私權。 |
| 資料工程師 | 使用實際且無法識別的數據來建置及測試開發環境,以更安全的部署。 |
| 客服專員 | 總結支援性對話,擷取見解,同時維護患者機密性。 |
| 執行主管(C-Suite) | 降低數據暴露的風險、啟用安全的數據共享、負責任地推動 AI 採用,並確保法規合規性。 |
| 監管與合規官 | 確保資料處理符合 HIPAA 安全港及多語言及多地域的 GDPR 假名化標準。 |
為什麼此服務適合您的使用案例?
去識別化服務透過自動化三項操作來發揮資料的潛力:
- TAG 會在臨床教材中識別並標註 PHI,並指定實體類型(例如病患姓名、醫師姓名、年齡等)。
- REDACT 會將您的臨床文字中所識別的 PHI 以實體類型取代
- SURROGATE 會將您的臨床文字中所識別的 PHI 取代為真實的假名 (人名、組織名稱、醫院名稱),並隨機化基於數字的 PHI (日期和英數字元實體,如識別碼編號等)
Tip
替代療法,或稱合成替代,是保護PHI的最佳實務。 該服務可用合理的取代值來取代 PHI 元素,進而產生最能代表來源資料的資料。 替代可加強隱私保護,因為任何假陰性的 PHI 值都會隱藏在文件中。
一致替換以保持患者時間表
一致的代理結果可讓組織保留基礎數據集中發生的關聯性,這對研究、分析和機器學習至關重要。 透過在同一批次中提交資料,我們的服務可以實現跨實體的一致性取代,並保留事件之間的相對時間關係。
安全且有效率地對臨床資料進行去身分識別
去身分識別服務提供了許多優點,包括:
擴充 PHI 涵蓋範圍: 此服務擴充到18個 HIPAA識別碼之外,以提供更強大的隱私權保護,以及實體類型之間更精細的區別。 它區分醫生和病人,並涵蓋 服務取消識別的 27 個 PHI 實體。
PHI 合規:去識別化服務專為受保護健康資訊(PHI)設計。 該服務使用機器學習透過「TAG」作業來識別 PHI 實體,包括 HIPAA 的 18 個識別碼。 遮蔽和替代作業會以實體類型或替代項或假名的標記來取代這些已識別的 PHI 值。 該服務支援如 HIPAA 及 GDPR 原則等合規要求。
安全性:去識別化服務是一種無國狀態的服務。 客戶資料會保留在客戶的租用戶內。
角色型存取控制 (RBAC):Azure 角色型存取控制 (RBAC) 可讓您管理組織資料的處理、儲存和存取方式。 您可以根據您為環境所定義的角色來確定誰有權對資料集進行去身分識別。
輕鬆將 API 整合到您的工作流程
將 Azure 的取消識別服務整合到您的環境中是快速、靈活且安全的—從頭開始建置,以最少的努力支援健康與生命科學工作流程。
API-First 設計: 無論您需要即時去識別化處理,或是對 Azure Blob Storage 中資料進行非同步批次處理,我們的 REST API 和 SDK 都能提供簡便的整合點,以符合您的系統需求。
快速設定: 使用 Azure 入口網站、ARM 範本、Bicep 或 CLI 幾分鐘內部署服務。 您可以快速啟動並執行,而不需要複雜的設定。
安全存取: 啟用使用 Azure Private Link 的私人端點,以阻止資料流量進入公共網際網路。
完全受控識別支援: 使用受控識別來保護 Azure Blob 記憶體的無認證存取權。
合規準備:該服務在你的 Azure 租戶內運作,並遵守 HIPAA。
同步或非同步端點
去身分識別服務提供了兩種來與 REST API 或用戶端程式庫 (Azure SDK) 互動的方式。
- 直接提交原始非結構化文字來進行分析。 API 輸出會在您的應用程式中傳回。
- 從 Azure Blob 儲存體中將作業大量提交到非同步端點處理檔案 (在作業中一致地使用標記、遮蔽或替代)。
輸入需求和服務限制
去身分識別服務的設計目的是要接收非結構化文字。 若要對 FHIR® 服務中儲存的資料進行去身分識別,請參閱匯出已去身分識別的資料 (英文)。
以下服務限制是適用的:
- 要求不能超過 50 KB。
- 作業最多可以處理 10,000 個文件。
- 作業所處理的每個文件不能超過 2 MB。
Pricing
取消識別服務定價取決於我們的服務所取消識別的數據量。 不論您使用異步或同步端點,對於我們提供的任何三項作業,您將依每 MB 收費。
每個 MB 去識別的成本會顯示在 Azure 定價頁面的「轉換作業」表格中的「非結構化去識別」行中。
您也有每月 50 MB 的分配,可讓您免費試用產品。
Azure 定價計算機可協助您根據使用案例來預估成本。
當您選擇將文件儲存在 Azure Blob 儲存體中時,會根據 Azure 儲存體定價來向您收費。
負責任地使用 AI
AI 系統包含技術、使用它的人、受其影響的人,以及您部署它的環境。 閱讀去身分識別服務的透明度資訊,以了您系統中負責任的 AI 使用和部署。