Azure 認知搜尋的功能

Azure 認知搜尋提供全文檢索搜尋引擎、搜尋索引的持續儲存、索引編制期間使用的整合式 AI,以擷取更多文字和結構,以及 API 和工具。

下表依類別摘要說明功能。 如需認知搜尋與其他搜尋技術比較的詳細資訊,請參閱 比較搜尋選項

索引功能

類別 功能
資料來源 搜尋索引可以接受來自任何來源的文字,前提是它已提交為 JSON 檔。

索引子 是一項功能,可將支援資料來源的資料匯入自動化,以擷取主要資料存放區中可搜尋的內容。 索引子會為您處理 JSON 序列化,而且大部分都支援某種形式的變更和刪除偵測。 您可以連線到各種不同的資料來源,包括Azure SQL資料庫Azure Cosmos DBAzure Blob 儲存體
階層式和巢狀資料結構 複雜類型和 集合可讓您在搜尋索引中建立幾乎任何類型的 JSON 結構模型。 一對多和多對多基數可以透過集合、複雜類型和複雜類型的集合,以原生方式表示。
語言分析 分析器是在編製索引和搜尋作業期間用於文字處理的元件。 根據預設,您可以使用一般用途的標準 Lucene 分析器,或使用語言分析器、您設定的自訂分析器,或以您需要的格式產生權杖的另一個預先定義分析器覆寫預設值。

Lucene 或 Microsoft 的語言分析器 (英文) 可用來以智慧方式處理特定語言的語言學,包括動詞時態、性別、不規則複數名詞 (例如 ' mouse' 與 'mice')、拆解複合字、斷字 (針對沒有空格的語言) 等。

自訂語彙分析器 用於複雜的查詢形式,例如注音比對和正則運算式。

AI 擴充和知識採礦

類別 功能
在編制索引期間的 AI 處理 AI 擴充 是指索引子管線中的內嵌影像和自然語言處理,從無法為全文檢索搜尋編制索引的內容擷取文字和資訊。 AI 處理是藉由在技能集中新增和結合技能來達成,然後附加至索引子。 AI 可以是來自Microsoft的內建技能,例如文字翻譯或光學字元辨識 (OCR) ,或您提供的自訂技能
在非搜尋案例中儲存擴充的內容以供分析和取用 知識存放區 是擴充內容的持續性儲存體,適用于知識採礦和資料科學處理等非搜尋案例。 知識存放區是在技能集中定義,但在 Azure 儲存體中建立為物件或表格式資料列集。
快取擴充 增量擴充 (預覽) 是指可在技能集執行期間重複使用的快取擴充。 快取在包含 OCR 和影像分析的技能集中特別有價值,這很耗費處理成本。

查詢和使用者體驗

類別 功能
自由格式文字檢索 全文檢索搜尋是大部分以搜尋為基礎之應用程式的主要使用案例。 您可以使用 Azure 搜尋服務支援的語法制訂查詢。

簡單查詢語法可提供邏輯運算子、片語搜尋運算子、後置運算子、優先順序運算子。

完整 Lucene 查詢語法 包含簡單語法中的所有作業,具有模糊搜尋、鄰近搜尋、詞彙提升和正則運算式的延伸模組。
相關性 簡單評分是 Azure 認知搜尋的主要優點。 評分設定檔用於將相關性模型化為文件本身中的值函數。 例如,您可能想要新推出的產品或折扣的產品,出現在搜尋結果中較高的位置。 您也可以根據您所追蹤並個別儲存的客戶搜尋喜好設定,使用標記進行個人化計分來建置計分設定檔。

語意搜尋 (預覽) 是進階功能,可根據查詢的語意相關性來重新產生結果。 視您的內容和案例而定,其可大幅改善幾乎最少設定或投入的搜尋相關性。
地理空間搜尋 地理空間函式 會篩選並比對地理座標。 您可以在 距離上比對 ,或藉由包含在多邊形圖形中。
篩選與 Facet 透過單一查詢參數便可啟用多面向導覽 (英文)。 Azure 認知搜尋會傳回多面向導覽結構,可作為類別清單背後的程式碼,用於自我引導篩選 (例如,依價格範圍或品牌來篩選類別目錄項目)。

篩選 (英文) 可用於將多面向導覽納入應用程式的 UI、增強查詢編寫,以及根據使用者或開發人員指定的準則進行篩選。 請使用 OData 語法建立篩選。
使用者體驗 您可以在搜尋列中針對預先輸入的查詢啟用 自動完成

搜尋建議也會在搜尋列中排除部分的文字輸入,但結果是您索引中的實際文件,而不是查詢字詞。

與對等字詞相關聯的同義字,讓使用者不必提供替代字詞,就能以隱含方式擴充查詢範圍。

搜尋結果醒目提示會將文字格式套用至搜尋結果中的相符關鍵字。 您可以選擇哪些欄位傳回醒目提示的文字片段。

我們會透過索引結構描述針對多個欄位提供排序 (英文),然後使用單一搜尋參數在查詢階段進行切換。

透過 Azure 認知搜尋為您的搜尋結果提供的微調控制項,可輕鬆地對搜尋結果進行分頁和節流。

安全性功能

類別 功能
資料加密 Microsoft 管理的待用加密會內建到內部儲存層,而且無法回復。

您在 Azure 金鑰保存庫中建立和管理的客戶自控加密金鑰,可用來補充索引和同義字對應加密。 針對在 2020 年 8 月 1 日之後建立的服務,CMK 加密會延伸至暫存磁片上的資料,以便完整加密索引內容。
Endpoint Protection 輸入防火牆支援的 IP 規則 可讓您設定搜尋服務將接受要求的 IP 範圍。

使用 Azure Private Link 建立私人端點,以透過虛擬網路強制所有要求。
Azure 角色型存取控制 資料平面的 RBAC (預覽) 是指將角色指派給 Azure Active Directory 中的使用者和群組,以控制搜尋內容和作業的存取。
輸出安全性 (索引子) 透過私人端點的資料存取可讓索引子連線到透過Azure Private Link保護的 Azure 資源。

使用信任身分識別的資料存取 表示外部資料源的連接字串可以省略使用者名稱和密碼。 當索引子連線到資料來源時,如果搜尋服務先前註冊為受信任的服務,資源就會允許連線。

入口網站功能

類別 功能
用於原型設計和檢查的工具 [新增索引 ] 是入口網站中的索引設計工具,可用來建立包含屬性欄位和一些其他設定的基本架構。 儲存索引之後,您可以使用 SDK 或 REST API 來填入它,以提供資料。

匯入資料精靈 會建立索引、索引子、技能集和資料來源定義。 如果您的資料存在於 Azure 中,此精靈可以節省大量時間和精力,特別是針對概念證明調查和探索。

搜尋總管 可用來測試查詢和精簡評分設定檔。

建立示範應用程式 可用來產生可用來測試搜尋體驗的 HTML 頁面。

偵錯會話 是視覺化編輯器,可讓您以互動方式偵錯技能集。 它會顯示相依性、輸出和轉換。
監視和診斷 啟用監視功能,使其超越永遠可以在入口網站看到,且一目了然的計量。 每秒查詢的計量、延遲和節流會在入口網站頁面中擷取並報告,不需要額外的設定。

可程式性

類別 功能
REST 服務 REST API 適用于資料平面作業,包括與索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。

管理 REST API是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。
適用於 .NET 的 Azure SDK Azure.Search.Documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。

Microsoft。Azure.Management.Search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。
Azure SDK for Java com.azure.search.documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。

com.microsoft.azure.management.search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。
適用於 Python 的 Azure SDK azure-search-documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。

azure-mgmt-search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。
適用于 JavaScript/TypeScript 的 Azure SDK azure/search-documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。

azure/arm-search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。

另請參閱