使用技能來定義擴充管線

已完成

AI 擴充是指管線中的內嵌影像和自然語言處理,可從無法為全文檢索搜尋編製索引的內容中擷取文字和資訊。

您可以透過在技能中新增及合併技能來實現 AI 處理。 技能會定義擷取和擴充資料以使其可供搜尋的作業。 這些 AI 技能可以是內建技能 (例如文字翻譯或光學字元辨識 (OCR)),也可以是您提供的自訂技能。

內建技能

內建技能是以 Microsoft 所提供的預先定型模型為基礎,這表示您無法使用自己的定型資料來將模型定型。 呼叫 Azure AI API 的技能會與那些服務相依,並在您連結資源時,以 Azure AI 服務隨用隨付價格來計費。 其他技能會依 Azure AI 搜尋進行計量,或是免費提供的公用程式技能。

內建技能可分成下列幾類:

自然語言處理技能:使用這些技能,非結構化文字會對應為索引中的可搜尋和可篩選欄位。

這些範例包含:

  • 關鍵片語擷取:使用預先定型的模型,根據字詞位置、語言規則、與其他字詞的近似度以及字詞在來源資料中的異常程度,來偵測重要的片語。

  • 文字翻譯技能:使用預先定型的模型,將輸入文字翻譯成各種語言,做為正規化或當地語系化使用案例。

影像處理技能 :建立影像內容的文字標記法,使其可使用 Azure AI 搜尋的查詢功能進行搜尋。

這些範例包含:

  • 影像分析技能:使用影像偵測演算法來識別影像的內容,並產生文字描述。

  • 光學字元辨識技能:可讓您從影像 (例如街道標誌和產品的相片) 以及文件 (發票、帳單、財務報表、文章等等) 中擷取印刷或手寫文字。