共用方式為


什麼是 Azure AI 語言個人標識資訊 (PII) 偵測?

Azure AI 語言個人標識資訊 (PII) 偵測是 Azure AI 語言所提供的功能。 PII 偵測服務是一種雲端式 API,利用機器學習和 AI 演算法來協助您開發具有進階自然語言理解的智慧型手機應用程式。 Azure AI 語言 PII 偵測會使用具名實體辨識 (NER) 來 識別和修訂 輸入數據中的敏感性資訊。 服務會將機密個人資料分類為預先定義的類別。 這些類別包括電話號碼、電子郵件地址和標識碼檔。 此分類有助於有效率地偵測和消除這類資訊。

最新消息

文字 PII 和交談 PII 偵測預覽 API (版本 2024-11-15-preview) 現在都支援使用標籤 (而不只是修訂字元) 來遮蔽偵測到的敏感性實體的選項。 客戶可以指定是否以遮蔽字元遮罩個人資料內容,例如名稱和電話號碼,也就是 "John Doe received a call from 424-878-9192",或使用修訂字元,也就是 "******** received a call from ************",或使用實體標籤遮罩,也就是 "[PERSON_1] received a call from [PHONENUMBER_1]"。 要了解如何為您的輸出指定編輯政策樣式的更多資訊,請參閱我們的使用指南

對話式 PII 偵測模型 (版本 2024-11-01-previewGA) 都會更新,以提供增強的 AI 品質和精確度。 數值識別碼實體類型現在也包含駕照和醫療保險受益人識別碼。

自 2024 年 6 月起,我們開始提供交談 PII 服務的正式發行支援 (僅限英文)。 客戶現在可以修訂文字記錄、聊天和其他以對話風格撰寫的文字 (即帶有「um」、「ah」的文字、多位發言者,以及為了讓表達更清晰而拼寫出的字詞),對 AI 品質、Azure SLA 支援和實際執行環境支援以及企業級安全性更有信心。

能力

目前,PII 支援適用於下列功能:

Azure AI 語言是雲端式服務,可套用自然語言處理 (NLP) 功能,以偵測文字型數據中個人資訊類別 (PII)。 本檔案包含下列類型:

  • 快速入門是引導您完成對服務提出要求的入門指示。
  • 操作指南包含以更具體或自訂的方式使用服務的指示。

一般流程

若要使用此功能,您要提交資料以進行分析,並在您的應用程式中處理 API 輸出。 分析會按原樣執行,對您資料所使用的模型不會新增自訂項目。

  1. 建立 Azure AI 語言資源,其會授與您 Azure AI 語言所提供功能的存取權。 接著會產生密碼 (稱為金鑰),以及您用來驗證 API 要求的端點 URL。

  2. 使用 REST API 或適用於 C#、JAVA、JavaScript 和 Python 的用戶端程式庫來建立要求。 您也可以使用批次要求傳送非同步呼叫,以便將多個功能的 API 要求合併成單一呼叫。

  3. 請傳送包含您文字資料的請求。 您的金鑰和端點會用於驗證。

  4. 將回應串流處理或儲存至本機。

文字 PII 的主要功能

Azure AI 語言提供具名實體辨識,以識別和分類文字內的資訊。 此功能會偵測 PII 類別,包括名稱、組織、地址、電話號碼、財務帳戶號碼或代碼,以及政府標識碼。 此 PII 的子集是受保護的健康資訊 (PHI)。 藉由在您的要求中指定 domain=phi,只會傳回 PHI 實體。

開始進行個人識別資訊(PII)偵測

若要使用 PII 偵測,您可以提交文字以進行分析,並在您的應用程式中處理 API 輸出。 分析是按原樣執行,對針對您的資料所使用的模型不會進行自訂。 有兩種使用 PII 偵測的方式:

開發選項 描述
Azure AI Foundry Azure AI Foundry 是一個網頁式平臺,可讓您在註冊時,搭配文字範例使用個人識別資訊偵測。 如需詳細資訊,請參閱 Azure AI Foundry 網站或Azure AI Foundry 檔
REST API 或用戶端程式庫 (Azure SDK) 使用 REST API 或以各種語言提供的用戶端程式庫,將 PII 偵測整合至您的應用程式。 如需詳細資訊,請參閱 PII 偵測快速入門

參考文件和程式碼範例

當您在應用程式中使用此功能時,請參閱下列 Azure AI 語言的參考文件和範例:

開發選項/語言 參考文件 範例
REST API REST API 文件 (英文)
C# C# 文件 C# 範例
爪哇島 Java 文件 Java 範例
JavaScript JavaScript 文件 JavaScript 範例
Python(程式語言) Python 文件 Python 範例

輸入需求和服務限制

  • 文字 PII 會對文字進行分析。 如需詳細資訊,請參閱操作指南中的資料和服務限制
  • PII 適用於各種書面語言。 如需詳細資訊,請參閱語言支援。 您可以指定來源文字撰寫所用的支持的語言。 如果您未指定語言,則擷取預設為英文。 API 可能會在回應中傳回位移,以支援不同的多語系和表情符號編碼

負責任的 AI

AI 系統不僅包含技術,也包含使用該技術的人員、受其影響的人員及所部署的環境。 閱讀 PII 的透明度資訊,了解系統中負責任的 AI 使用和部署。 如需詳細資訊,請參閱下列文章:

範例案例

  • 套用敏感度標籤 - 例如,根據 PII 服務的結果,公用敏感度標籤可能會套用至未偵測到 PII 實體的文件。 對於辨識出美國位址和電話號碼的文件,則可能會套用機密標籤。 高度機密標籤可能會用於辨識出銀行路由編號的文件。
  • 將某些種類的個人資訊從廣為流傳的文件中刪減:例如,如果第一線支援代表人員可以存取客戶連絡記錄,公司可以從客戶歷程記錄版本中刪減客戶姓名以外的個人資訊,以保障客戶的隱私權。
  • 修訂個人資訊以減少無意識偏見 - 例如,在公司的履歷審查過程中,他們可以封鎖名稱、地址和電話號碼,以協助減少無意識性別或其他偏見。
  • 取代機器學習來源資料中的個人資訊以減少不公平性 – 例如,如果您想要移除在定型機器學習模型時可能洩露性別的姓名,您可以使用此服務來識別它們,並利用模型定型的通用預留位置來予以取代。
  • 從客服中心謄寫內容中移除個人資訊 – 例如,如果您想要移除發生在客服中心案例中代理人員與客戶之間的姓名或其他 PII 資料。 您可以使用服務來識別和移除它們。
  • 資料科學的資料清理 - PII 可用來為資料科學家和工程師準備好資料,讓他們能夠使用這些資料來定型其機器學習模型。 刪減資料以確保客戶資料不會遭到公開。

下一步

有兩種方式可以開始使用實體連結功能:

  • Azure AI Foundry 是以 Web 為基礎的平臺,可讓您使用數個語言服務功能,而不需要撰寫程式代碼。
  • 參閱快速入門文章,以了解如何使用 REST API 和用戶端程式庫 SDK 對服務提出要求。