什麼是 Azure AI 語言中的語言偵測?
語言偵測是 Azure AI 語言所提供的其中一項功能,這是雲端中機器學習和 AI 演算法的集合,用於開發涉及書面語言的智慧型應用程式。 語言偵測能夠偵測其主要指令碼中超過 100 種語言。 此外,其也提供指令碼偵測,針對 Azure AI 語言服務所支援的選定語言數目,根據 ISO 15924 標準對於每種偵測到的語言偵測支援的指令碼。
此文件包含下列類型的文章:
語言偵測功能
語言偵測:根據 ISO 15924 標準,針對您提交的每份文件傳回一個主要語言,以及其 ISO 639-1 名稱、人類可讀取的名稱、信賴度分數、指令碼名稱和指令碼程式碼。
指令碼偵測:為了區分用於撰寫特定語言的多個指令碼,例如哈薩克語,語言偵測會根據 ISO 15924 標準傳回指令碼名稱和指令碼程式碼。
不明確內容的處理:若要協助根據輸入消除語言歧義,您可以指定 ISO 3166-1 alpha-2 國家/地區代碼。 例如,「communication」一詞對英文和法文都通用。 將文字起源指定為法國,可協助語言偵測模型確定正確的語言。
一般流程
若要使用此功能,您要提交資料以進行分析,並在您的應用程式中處理 API 輸出。 分析會按原樣執行,對您資料所使用的模型不會新增自訂項目。
建立 Azure AI 語言資源,其會授與您 Azure AI 語言所提供功能的存取權。 接著會產生密碼 (稱為金鑰),以及您用來驗證 API 要求的端點 URL。
使用 REST API 或適用於 C#、JAVA、JavaScript 和 Python 的用戶端程式庫來建立要求。 您也可以使用批次要求傳送非同步呼叫,以便將多個功能的 API 要求合併成單一呼叫。
傳送包含文字資料的要求。 您的金鑰和端點會用於驗證。
將回應串流處理或儲存至本機。
開始使用語言偵測
若要使用語言偵測,您可以提交原始非結構化文字以進行分析,並在您的應用程式中處理 API 輸出。 分析是按原樣執行,對針對您的資料所使用的模型不會進行額外的自訂。 使用語言偵測的方式有三種:
開發選項 | 描述 |
---|---|
Language Studio | Language Studio 是以 Web 為基礎的平台,可讓您在沒有 Azure 帳戶的情況下嘗試使用文字範例進行實體連結,以及在註冊時使用自己的資料。 如需詳細資訊,請參閱 Language Studio 網站或 Language Studio 快速入門。 |
REST API 或用戶端程式庫 (Azure SDK) | 使用 REST API 或以各種語言提供的用戶端程式庫,將語言偵測整合至您的應用程式。 如需詳細資訊,請參閱語言偵測快速入門。 |
Docker 容器 | 使用可用的 Docker 容器,在內部部署環境中部署此功能。 這些 Docker 容器可讓服務更加契合您的資料,以實現合規性、安全性或其他操作原因。 |
負責 AI
AI 系統不僅包含技術,也包含使用該技術的人員、受其影響的人員及部署的環境。 閱讀語言偵測的透明度資訊,了解系統中負責任的 AI 使用和部署。 如需詳細資訊,您也可以參閱下列文章:
下一步
有兩種方式可以使用實體連結功能:
- Language Studio 是以 Web 為基礎的平台,可讓您嘗試數個 Azure AI 語言服務功能,而無須撰寫程式碼。
- 參閱快速入門文章,以了解如何使用 REST API 和用戶端程式庫 SDK 對服務提出要求。