共用方式為


選擇 Azure AI 目標語言處理技術

Azure AI 服務可協助開發人員和組織透過開箱即用、預先建置和可自訂的 API 和模型,快速建立智慧、前沿、可立即投入市場且負責任的應用程式。

本文介紹 Azure AI 服務,這些服務提供有針對性的語言處理功能,例如自然語言處理 (NLP)、文字分析、語言理解、翻譯和文件資料擷取。 Azure AI 語言是 Azure AI 服務中最廣泛的類別之一。 您可以在工作負載中使用 API 來合併命名實體辨識、情緒分析、語言偵測和文字摘要等語言功能。

服務

以下服務為 Azure AI 服務提供針對性的語言處理功能:

  • Azure AI 語言可為文字分析提供自然語言處理。

    • 當需要使用結構化或非結構化文件來執行所述的各種語言相關工作時,請使用 Azure AI 語言服務。
    • 如果您需要透過聊天搜尋文件、檢查文件內容安全或翻譯文件,請勿使用語言服務。
  • Azure AI 翻譯工具是一項機器翻譯服務。 它可以執行即時文字翻譯、批次和單一檔案文件翻譯,以及自訂翻譯,讓您可以根據情境納入專業術語或行業特定語言。 它支援多種語言

    • 當您需要專門執行翻譯時,請使用翻譯工具服務。 雖然您可以使用其他通用基礎語言模型來執行翻譯,但使用翻譯工具來滿足其專門需求會更加可靠有效,並且透過使用有針對性的翻譯模型也會更具成本效益。
    • 如果您需要參與聊天、分析內容以了解情緒或進行內容審查,請勿使用翻譯工具服務。 對於情感分析,請改用語言服務。 對於內容審查,請使用內容安全服務。
  • Azure AI 文件智慧服務是一項可以將影像直接轉換為電子表格的服務。 您可以指定預期欄位,然後自動搜尋您提供的影像以擷取這些欄位,而無需人為介入。 該服務裝載許多預建模型,還允許您建立自己的自訂表單模型。

    • 當您確切地知道需要從掃描文件中提取哪些欄位以正確填寫電子表單時,請使用文件智慧服務。
    • 使用文件智慧服務來識別不同文件語料庫中的關鍵結構 (頁首、頁尾、分章符號等),以進一步以程式設計方式與文件互動,例如在檢索增強產生 (RAG) 實作中。
    • 請勿將文件智慧服務做為即時搜尋 API 使用。

Azure AI 語言

Azure AI 語言是一項雲端式服務,提供用於理解和分析文字的自然語言處理 (NLP) 功能。 使用此服務可協助您使用 Web 型 Language Studio、REST Api 和用戶端程式庫,來建置智慧型應用程式。

Capabilities

下表提供了 Azure AI 語言服務中可用的功能清單。

功能 描述
自訂問題解答 針對使用者的輸入尋找最合適的答案,通常用於建立對話式用戶端應用程式,例如社交媒體應用程式、聊天機器人和支援語音的桌面應用程式。
自訂文字分類 用於建立自訂 AI 模型,將非結構化文字文件分類為您定義的自訂類別。
交談語言理解 (CLU) 用於建立自訂自然語言理解模型來預測傳入話語的整體意圖並從中提取重要資訊。
實體連結 消除在非結構化文字中找到的實體 (單字或字詞) 的身分歧義並返回維基百科的連結。
語言偵測 偵測文件所使用的語言,並傳回各種語言、變體、方言和一些區域/文化語言的語言程式碼。
關鍵片語擷取 評估並返回非結構化文字中的主要概念,並將它們作為清單返回。
具名實體辨識 (NER) 在多個預定義類別組中對非結構化文字中的實體 (單字或字詞) 進行分類。 例如:人員、事件、地點、日期等等
協調流程工作流程 用於連接交談語言理解 (CLU)
個人身分識別 (II) 和健康 (HI) 資訊偵測 識別、分類和編輯非結構化文字文件對話記錄中的敏感資訊。 例如:電話號碼、電子郵件地址、身分證件等等
情感分析與意見挖掘 透過挖掘文字中有關積極或消極情緒的線索,幫助您了解人們對您的品牌或主題的看法,並將這些情感與文字的特定方面相關聯。
摘要 使用提取文字摘要來產生文件和對話轉錄的摘要。 這項功能會擷取可共同代表原始內容內最重要或相關資訊的句子。
健康文字分析 從醫生筆記、出院小結、臨床文件和電子健康記錄等非結構化文字中,提取並標記相關醫療資訊。 設計工作負載時,請評估此雲端裝載功能的處理位置和資料駐留,以確保其符合您的合規期望。 某些工作負載將醫療保健資料傳送到雲端裝載平台的能力可能會受到限制。 您可以使用此 API 作為 Docker 容器來裝載在雲端或內部部署端的您自己的運算中,這可能有助於解決涉及 PaaS 的合規性問題。 有關詳細資訊,請參閱「使用 Text Analytics for Health 容器

使用案例

下表提供了 Azure AI 語言服務的可能使用案例清單。

使用案例 可自訂*
預測使用者輸入的意圖,並從中提取資訊。 Yes
識別和/或編輯敏感訊息,例如 PII。
確定文字所使用的語言。
從臨床/醫療文件中提取醫療資訊,無需建立模型
使用根據您的資料訓練的模型,從臨床/醫療文件中提取醫療資訊。 Yes
無需建立自訂模型即可提取資訊類別。
使用特定資料的模型來提取資訊類別。 Yes
提取主要主題和重要字詞。
總結文件
透過情感分析對文字進行分類。 Yes
透過自訂類別對文字進行分類。 Yes
在推斷時將項目分類到提供的類別中。
將實體與知識庫文章連結。
理解問題和答案 (通用)。 Yes
建立一個能夠對使用者輸入做出回應的對話式應用程式。
透過交談語言理解和問題解答連接應用程式。 Yes

*如果某個功能是可自訂的,您可以使用我們的工具訓練 AI 模型來專門適應您的資料。 否則,已預先設定功能,這表示無法變更其使用的 AI 模型。 您只需傳送資料,並在您的應用程式中使用功能的輸出。

Azure AI 翻譯工具

Azure AI 翻譯工具是一項機器翻譯服務,屬於 Azure AI 服務系列。 翻譯工具為許多 Microsoft 產品和服務提供支援。

Capabilities

下表提供了「Azure AI 翻譯工具」服務中可用的功能清單。

功能 描述
文字翻譯 即時在支援的來源語言與目標語言之間執行文字翻譯。 建立動態字典,並了解如何使用翻譯工具 API 防止翻譯
文件翻譯 非同步批次翻譯:翻譯批次和複雜文件,同時保留原始文件的結構和格式。 批次翻譯流程需要具有來源和翻譯文件容器的 Azure Blob 儲存體帳戶。
同步單一文件翻譯:單獨翻譯單一文件文件或與術語表文件一起翻譯,同時保留原始文件的結構和格式。 檔案翻譯流程不需要 Azure Blob 儲存體帳戶。 最終回應包含已翻譯的文件,並會直接傳回給呼叫用戶端。
自訂翻譯工具 建置自訂模型,以翻譯網域和產業特定的語言、術語和樣式。 建立自訂翻譯的字典 (片語或句子)

使用案例

下表提供了「Azure AI 翻譯工具」服務的可能使用案例清單。

使用案例 文件集
翻譯行業特定文字。 AI 服務自訂翻譯工具
翻譯非特定行業的通用文字。 什麼是 Azure 文字翻譯

Azure AI 文件智慧服務

Azure AI 語言是一項雲端式服務,提供用於理解和分析文字的自然語言處理 (NLP) 功能。 使用此服務可協助您使用 Web 型 Language Studio、REST Api 和用戶端程式庫,來建置智慧型應用程式。

Capabilities

下表提供了「AI 文件智慧」服務中可用的一些功能的清單。

功能 描述
名片擷取 文件智慧名片模型將光學字元辨識 (OCR) 功能與深度學習模型相結合,以分析和提取名片影像中的資料。 API 會分析印刷名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼,並傳回結構化的 JSON 資料表示法。
合約模型擷取 文件智慧合約模型使用光學字元辨識 (OCR) 功能,可從一組選定的重要合約實體中分析和提取關鍵欄位和行項目。 合約的格式與品質有各種類型,包括手機擷取的影像、掃描文件以及數位 PDF。 API 會分析文件文字;擷取索引鍵資訊,例如合作對象、法律機關、合約識別碼和標題;並傳回結構化 JSON 資料表示。 模型目前僅支援英文文件格式。
信用卡擷取 文件智慧信用卡/金融卡模型使用光學字元辨識 (OCR) 功能,可分析和擷取信用卡和金融卡中的關鍵欄位。 信用卡和轉帳卡有各種不同的格式與品質,包括手機擷取的影像、掃描的文件與數位 PDF。 API 會分析文件文字;擷取關鍵資訊,例如卡號、發卡機關、和到期日;並傳回結構化 JSON 資料表示。 模型目前僅支援英文文件格式。
健保卡擷取 文件智慧健保卡模型將光學字元辨識 (OCR) 功能與深度學習模型相結合,可分析和擷取美國健保卡中的關鍵資訊。 健保卡是醫療保健處理的重要文件,可針對病患上線、財務涵蓋資訊、無現金付款和保險理賠處理進行數位分析。 健保卡模型會分析健保卡影像、擷取重要資訊,例如保險公司、成員、處方和群組編號,以及傳回結構化 JSON 表示法。 健保卡的格式與品質有各種類型,包括手機擷取的影像、掃描文件與數位 PDF。
美國稅務文件擷取 文件智慧合約模型使用光學字元辨識 (OCR) 功能,可從一組選定的稅務文件中分析和提取關鍵欄位和行項目。 稅務文件的格式與品質有各種類型,包括手機擷取的影像、掃描的文件以及數位 PDF。 API 會分析文件文字,擷取如客戶名稱、帳單地址、到期日和到期金額等重要資訊,並傳回結構化 JSON 資料表示。 此模型目前支援特定的英文稅務文件格式。
還有更多... Azure AI 文件智慧支援各種不同的模型,可讓您將智慧型文件處理新增至應用程式和流程中。 您可以使用預建的網域特定模型,或定型專為特定商務需求和使用案例量身打造的自訂模型。 文件智慧服務可與 REST API 或 Python、C#、Java 和 JavaScript 用戶端程式庫搭配使用。

要了解有關如何選擇適合您的情境的模型的更多資訊,請參閱「我應該選擇哪個模型?

下一步