共用方式為


機密 AI

在生成式 AI 取得進展之前,AI 就已經塑造了多個產業,例如金融、廣告、製造和醫療保健等。 生成式 AI 模型有可能對社會產生更大的影響。 Microsoft 一直處於定義負責任 AI 原則 (英文) 的最前沿,以作為負責任地使用 AI 技術的護欄。 機密運算和機密 AI 是在負責任 AI 工具箱中實現安全性和隱私權的重要工具。

什麼是機密 AI?

機密 AI 是一組以硬體為基礎的技術,可在整個 AI 生命週期 (包括資料和模型使用時) 為資料和模型提供可加密驗證的保護。 機密 AI 技術包括加速器,例如支援建立信任執行環境 (TEE) 的一般用途 CPU 和 GPU,以及啟用資料收集、前置處理、定型和部署 AI 模型的服務。 機密 AI 也提供工具來增加 AI 部署的信任、透明度和責任。

機密 AI 處理哪些案例?

機密 AI 可處理橫跨整個 AI 生命週期的多個案例。

  • 機密定型。 機密 AI 會在定型期間保護訓練資料、模型架構和模型權數,防止惡意管理員和測試人員等進階攻擊者的攻擊。 在模型定型資源密集和/或涉及敏感模型 IP 的情況下,即使定型資料是公開的,就保護權數而言也可能很重要。 使用機密定型,模型建立器可以確保模型權數和中繼資料,例如定型期間節點之間交換的檢查點和梯度更新,不會在 TEE 外部顯示。

  • 機密微調。 使用特定網域的私人資料來微調一般 AI 模型,以改善特定工作的精確度很常見。 例如,金融組織可以使用專屬的財務資料來微調現有的語言模型。 機密 AI 可用來在微調期間保護專屬資料和定型的模型。

  • 機密多方定型。 機密 AI 支援新類型的多方定型案例。 組織可以共同作業來定型模型,而不會彼此公開其模型或資料,並強制執行有關如何在參與者之間共享結果的原則。

  • 機密同盟學習。 同盟學習已建議做為集中式/分散式定型的替代方案,例如,由於資料落地需求或安全性考量,無法匯總定型資料的情況。 結合同盟學習時,機密運算可以提供更強大的安全性和隱私性。 例如,每個用戶端所產生的梯度更新都可以藉由將中央匯總工具裝載在 TEE 中,來保護模型建立器。 同樣地,模型開發人員可以藉由要求用戶端在 TEE 中執行其定型管道,來建立對定型模型的信任。 這可確保每個用戶端對模型的貢獻都是使用有效的預先認證程序產生,而不需要存取用戶端的資料。

  • 機密推斷。 典型的模型部署牽涉到數個參與者。 模型開發人員擔心保護其模型 IP 免受服務營運商和潛在的雲端服務提供者的危害。 與模型互動的用戶端,例如將可能包含敏感資料的提示傳送至生成式 AI 模型,則擔心隱私和潛在濫用。 機密推斷可以對模型 IP 進行可驗證的保護,同時保護來自模型開發人員、服務營運和雲端提供者的推斷要求和回應。 例如,機密 AI 可用於提供可驗證的辨識項,證明要求僅用於特定的推斷工作,並且回應透過在 TEE 內終止的安全連線傳回給要求的建立者。

機密 AI 的產業使用案例有哪些?

透過 Azure 機密運算,客戶和合作夥伴正在建立可解決許多使用案例的機密 AI 解決方案。

  1. 語音和臉部辨識。 語音和臉部辨識模型會在包含敏感資料的影音串流上運作。 在某些情況下,例如公共場所的監控,將同意作為滿足隱私要求的手段可能不切實際。 機密 AI 允許資料處理器即時定型模型並執行推斷,同時最大限度地降低資料外洩的風險。

  2. 洗錢/詐騙偵測。 機密 AI 允許多家銀行合併雲端中的資料集,以定型更精確的 AML 模型,而不會公開其客戶的個人資料。 使用組合資料集定型的模型,可以偵測一個使用者在多家銀行之間的資金流動,而銀行無需存取彼此的資料。 透過機密 AI,這些金融機構可以提高詐騙偵測率,並減少誤判。

  3. 輔助診斷和預測性醫療保健。 診斷和預測性醫療保健模型的開發需要存取高度敏感的醫療保健資料。 取得這類資料集的存取權既昂貴又耗時。 機密 AI 可以釋放此類資料集的價值,使 AI 模型能夠使用敏感資料進行定型,同時在整個生命週期中保護資料集和模型。

為何使用機密運算?

AI 模型的有效性取決於資料的品質和數量。 雖然使用公開資料集定型模型已經取得了許多進展,但要使模型能夠準確執行複雜的諮詢工作 (例如醫療診斷、財務風險評估或商務分析),需要在訓練和推斷過程中存取私人資料。

有許多隱私權保留技術可以保護私人資料,以保護正在使用的資料。 例如,可以在共用之前對資料進行清除和取消識別。 然而,單獨的取消識別已證明是脆弱的,並且在某些情況下會降低效用。 其他方法,例如完全同型加密 (FHE) 和安全多方計算 (MPC) 可能會限制表達能力或帶來顯著的效能額外負荷。

機密運算可以解除鎖定敏感資料集的存取權,同時以較低的額外負荷滿足安全性和合規性考量。 透過機密運算,資料提供者可以授權將其資料集用於特定工作 (透過證明驗證),例如定型或微調已同意的模型,同時保護資料。 機密訓練可以與差分隱私結合,透過推斷進一步減少定型資料的外洩。 模型建立器可以使用機密運算產生不可否認的資料和模型來源記錄,讓其模型更加透明。 用戶端可以使用遠端證明來驗證推斷服務僅根據宣告的資料使用原則使用推斷要求。

有哪些選項可開始使用?

ACC 平台產品有助於實現機密 AI

Azure 已經提供了最先進的產品來保護資料和 AI 工作負載。 您可以使用下列 Azure 機密運算平台產品,進一步增強工作負載的安全性狀態。

  • SNPTDX 上的機密 VM (有限預覽)。 以 CPU 為基礎的 AI 工作負載 (例如資料預先處理以及較小模型的定型和推斷) 可以使用以 SNP 和 TDX 為基礎的機密 VM 來保護使用中的機密程式碼和資料。

  • ACI 上的機密容器。 ACI 上的機密容器是在 Azure 上部署容器化工作負載的另一種方式。 除了雲端系統管理員的保護之外,機密容器還可以使用容器原則提供租用戶系統管理員和強式完整性屬性的保護。 這使得它們非常適合低信任的多方共同作業案例。 如需示範以未修改 NVIDIA Triton 推斷伺服器為基礎的機密推斷範例,請參閱此處

對於依賴 GPU 的 AI 工作負載,Microsoft 和 NVIDIA 正在合作將機密運算導入 NVIDIA GPU。 以 AMD SEV-SNP 和 A100 GPU 為基礎的 Azure 機密 GPU VM 目前處於有限預覽狀態。

支援機密 AI 的 ACC 合作夥伴解決方案

使用已在 Azure 機密運算平台上建置機密 AI 解決方案的合作夥伴。

  • Anjuna 提供了一個機密運算平台,使組織能夠在不公開敏感性資訊的情況下開發機器學習模型的各種使用案例。

  • Beekeeper AI 可透過為演算法擁有者和資料負責人的安全共同作業平台實現醫療保健 AI。 BeeKeeperAI 會在機密運算環境中對受保護資料的多重機構來源使用隱私權保留分析。 此解決方案支援端對端加密、安全運算記憶體保護區和 Intel 最新的 SGX 處理器,以保護資料和演算法 IP。

  • Fortanix 提供可啟用機密 AI 的機密運算平台,包括聯合多重組織共同作業以進行多方分析。

  • Mithril Security 提供工具來協助 SaaS 廠商在安全記憶體保護區內提供 AI 模型,並提供內部部署層級的安全性和控制項給資料擁有者。 資料擁有者可以使用自己的 SaaS AI 解決方案,同時維持符合規範並控制其資料。

  • Opaque 為共同作業分析和 AI 提供機密運算平臺,讓您能夠執行分析,同時進行資料端對端保護,並讓組織遵守法律和法規授權。