分享方式:


編制索引期間額外處理技能 (Azure AI 搜尋服務)

本文會說明 Azure AI 搜尋服務中的技能,您可將之納入技能集來進行外部處理。

技能提供一種以特定方式轉換內容、不可部分完成的作業。 技能通常是一種辨識或擷取文字的作業,但也可以是一種重塑已建立擴充內容的公用程式技能。 一般而言,輸出是以文字為基礎,因此可用於全文檢索搜尋,或是用於向量搜尋的向量。

技能可分成不同類別:

  • 內建技能會將 API 呼叫包裝成 Azure AI 資源,其中輸入、輸出和處理步驟皆清楚明確。 針對會呼叫 Azure AI 資源的技能,將透過內部網路進行連線。 針對會呼叫 Azure OpenAI 的技能,您將提供連線資訊,以供搜尋服務用來連接到資源。 少數處理工作是不可計費的,但多數處理是可計費的。 內建技能是以 Microsoft 所提供的預先定型模型為基礎,這表示您無法使用自己的定型資料來將模型定型。

  • 自訂技能提供的自訂程式碼會在搜尋服務外部執行, 透過 URI 存取。 自訂程式碼通常會由 Azure 函數應用程式提供。 若要連結開放原始碼或第三方向量化模型,請使用自訂技能。

  • 公用程式由 Azure AI 搜尋服務內部提供,無外部資源相依性,也不用輸出連線。 多數公用程式皆為不可計費。

Azure AI 資源技能

連結 AI 服務資源時,呼叫 Azure AI 的技能將以隨用隨付費率計費。

OData 類型 描述 計量依據
Microsoft.Skills.Text.CustomEntityLookupSkill 從自訂的使用者定義字詞清單尋找文字。 Azure AI 搜尋服務 (定價)
Microsoft.Skills.Text.KeyPhraseExtractionSkill 這項技能使用預先定型的模型,根據字詞位置、語言規則、與其他字詞的鄰近程度,以及字詞在來源資料中是否尋常來偵測重要詞彙。 Azure AI 服務 (定價)
Microsoft.Skills.Text.LanguageDetectionSkill 這項技能使用預先定型的模型,偵測所使用的語言 (每個文件一個語言識別碼)。 當相同的文字區段內使用多種語言時,輸出是主要使用語言的 LCID。 Azure AI 服務 (定價)
Microsoft.Skills.Text.V3.EntityLinkingSkill 此技能使用預先定型的模型,為辨識實體產生維基百科中文章的連結。 Azure AI 服務 (定價)
Microsoft.Skills.Text.V3.EntityRecognitionSkill 此技能使用預先定型的模型,針對一組固定的分類建立實體:"Person""Location""Organization""Quantity""DateTime""URL""Email""PersonType""Event""Product""Skill""Address""Phone Number""IP Address" 欄位。 Azure AI 服務 (定價)
Microsoft.Skills.Text.PIIDetectionSkill 此技能使用預先定型的模型,從指定的文字中擷取出個人資訊。 技能也提供各種選項,為在文字中偵測到的個人資訊實體加上遮罩。 Azure AI 服務 (定價)
Microsoft.Skills.Text.V3.SentimentSkill 此技能使用預先定型的模型,根據服務依紀錄逐一在句子與文件層級上找到的最高信賴分數,來指派情緒標籤 (例如「負面」、「中性」和「正面」)。 Azure AI 服務 (定價)
Microsoft.Skills.Text.TranslationSkill 此技能使用預先定型的模型,將輸入文字翻譯成各種語言,以供正規化或當地語系化使用案例使用。 Azure AI 服務 (定價)
Microsoft.Skills.Vision.ImageAnalysisSkill 這項技能使用影像偵測演算法,以識別影像的內容並產生文字描述。 Azure AI 服務 (定價)
Microsoft.Skills.Vision.OcrSkill 光學字元辨識。 Azure AI 服務 (定價)
Microsoft.Skills.Vision.VectorizeSkill 多模式影像和文字向量化。 Azure AI 服務 (定價)

Azure OpenAI 技能

若技能會呼叫部署於 Azure OpenAI 上的模型,將以隨用隨付費率計費。

OData 類型 描述 計量依據
Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill 連線至部署於 Azure OpenAI 的內嵌模型,以進行整合向量化。 Azure OpenAI (定價)

公用程式技能

僅在 Azure AI 搜尋服務上執行的技能,大多會在擴充快取的節點上逐一查看,且為不可計費。

OData 類型 描述 計量依據
Microsoft.Skills.Util.ConditionalSkill 允許根據條件篩選、指派預設值,及合併資料。 不適用
Microsoft.Skills.Util.DocumentExtractionSkill 從擴充管道中的檔案擷取內容。 適用影像擷取的 Azure AI 搜尋服務 (定價)。
Microsoft.Skills.Text.MergeSkill 將一組欄位中的文字合併成單一欄位。 不適用
Microsoft.Skills.Util.ShaperSkill 將輸出對應到複雜類型 (多部分的資料類型,可用於全名、多行地址,或姓氏與個人識別碼的組合)。 不適用
Microsoft.Skills.Text.SplitSkill 將文字分成多個頁面,讓您能夠以遞增方式來擴充或增加內容。 不適用

自訂技能

自訂技能是由您設計、開發並部署至 Web 的一整套外部程式碼。 完成之後,您便可以從技能集呼叫模組來作為自訂技能。

類型 描述 計量依據
Microsoft.Skills.Custom.WebApiSkill 透過對自訂 Web API 進行 HTTP 呼叫,使 AI 擴充管線得以擴展 除非您的解決方案使用計量付費 Azure 服務,否則無
Microsoft.Skills.Custom.AmlSkill 透過 Azure Machine Learning 模型,使 AI 擴充管線得以擴展 除非您的解決方案使用計量付費 Azure 服務,否則無

如需建立自訂技能的指導,請參閱定義自訂介面範例:建立 AI 擴充自訂技能

另請參閱