Azure 認知搜尋的功能
Azure 認知搜尋提供全文檢索搜尋引擎、搜尋索引的持續儲存、索引編制期間使用的整合式 AI,以擷取更多文字和結構,以及 API 和工具。
下表依類別摘要說明功能。 如需認知搜尋與其他搜尋技術比較的詳細資訊,請參閱 比較搜尋選項。
索引功能
類別 | 功能 |
---|---|
資料來源 | 搜尋索引可以接受來自任何來源的文字,前提是它已提交為 JSON 檔。 索引子 是一項功能,可將支援資料來源的資料匯入自動化,以擷取主要資料存放區中可搜尋的內容。 索引子會為您處理 JSON 序列化,而且大部分都支援某種形式的變更和刪除偵測。 您可以連線到各種不同的資料來源,包括Azure SQL資料庫、Azure Cosmos DB或Azure Blob 儲存體。 |
階層式和巢狀資料結構 | 複雜類型和 集合可讓您在搜尋索引中建立幾乎任何類型的 JSON 結構模型。 一對多和多對多基數可以透過集合、複雜類型和複雜類型的集合,以原生方式表示。 |
語言分析 | 分析器是在編製索引和搜尋作業期間用於文字處理的元件。 根據預設,您可以使用一般用途的標準 Lucene 分析器,或使用語言分析器、您設定的自訂分析器,或以您需要的格式產生權杖的另一個預先定義分析器覆寫預設值。 Lucene 或 Microsoft 的語言分析器 (英文) 可用來以智慧方式處理特定語言的語言學,包括動詞時態、性別、不規則複數名詞 (例如 ' mouse' 與 'mice')、拆解複合字、斷字 (針對沒有空格的語言) 等。 自訂語彙分析器 用於複雜的查詢形式,例如注音比對和正則運算式。 |
AI 擴充和知識採礦
類別 | 功能 |
---|---|
在編制索引期間的 AI 處理 | AI 擴充 是指索引子管線中的內嵌影像和自然語言處理,從無法為全文檢索搜尋編制索引的內容擷取文字和資訊。 AI 處理是藉由在技能集中新增和結合技能來達成,然後附加至索引子。 AI 可以是來自Microsoft的內建技能,例如文字翻譯或光學字元辨識 (OCR) ,或您提供的自訂技能。 |
在非搜尋案例中儲存擴充的內容以供分析和取用 | 知識存放區 是擴充內容的持續性儲存體,適用于知識採礦和資料科學處理等非搜尋案例。 知識存放區是在技能集中定義,但在 Azure 儲存體中建立為物件或表格式資料列集。 |
快取擴充 | 增量擴充 (預覽) 是指可在技能集執行期間重複使用的快取擴充。 快取在包含 OCR 和影像分析的技能集中特別有價值,這很耗費處理成本。 |
查詢和使用者體驗
類別 | 功能 |
---|---|
自由格式文字檢索 | 全文檢索搜尋是大部分以搜尋為基礎之應用程式的主要使用案例。 您可以使用 Azure 搜尋服務支援的語法制訂查詢。 簡單查詢語法可提供邏輯運算子、片語搜尋運算子、後置運算子、優先順序運算子。 完整 Lucene 查詢語法 包含簡單語法中的所有作業,具有模糊搜尋、鄰近搜尋、詞彙提升和正則運算式的延伸模組。 |
相關性 | 簡單評分是 Azure 認知搜尋的主要優點。 評分設定檔用於將相關性模型化為文件本身中的值函數。 例如,您可能想要新推出的產品或折扣的產品,出現在搜尋結果中較高的位置。 您也可以根據您所追蹤並個別儲存的客戶搜尋喜好設定,使用標記進行個人化計分來建置計分設定檔。 語意搜尋 (預覽) 是進階功能,可根據查詢的語意相關性來重新產生結果。 視您的內容和案例而定,其可大幅改善幾乎最少設定或投入的搜尋相關性。 |
地理空間搜尋 | 地理空間函式 會篩選並比對地理座標。 您可以在 距離上比對 ,或藉由包含在多邊形圖形中。 |
篩選與 Facet | 透過單一查詢參數便可啟用多面向導覽 (英文)。 Azure 認知搜尋會傳回多面向導覽結構,可作為類別清單背後的程式碼,用於自我引導篩選 (例如,依價格範圍或品牌來篩選類別目錄項目)。 篩選 (英文) 可用於將多面向導覽納入應用程式的 UI、增強查詢編寫,以及根據使用者或開發人員指定的準則進行篩選。 請使用 OData 語法建立篩選。 |
使用者體驗 | 您可以在搜尋列中針對預先輸入的查詢啟用 自動完成。 搜尋建議也會在搜尋列中排除部分的文字輸入,但結果是您索引中的實際文件,而不是查詢字詞。 與對等字詞相關聯的同義字,讓使用者不必提供替代字詞,就能以隱含方式擴充查詢範圍。 搜尋結果醒目提示會將文字格式套用至搜尋結果中的相符關鍵字。 您可以選擇哪些欄位傳回醒目提示的文字片段。 我們會透過索引結構描述針對多個欄位提供排序 (英文),然後使用單一搜尋參數在查詢階段進行切換。 透過 Azure 認知搜尋為您的搜尋結果提供的微調控制項,可輕鬆地對搜尋結果進行分頁和節流。 |
安全性功能
類別 | 功能 |
---|---|
資料加密 | Microsoft 管理的待用加密會內建到內部儲存層,而且無法回復。 您在 Azure 金鑰保存庫中建立和管理的客戶自控加密金鑰,可用來補充索引和同義字對應加密。 針對在 2020 年 8 月 1 日之後建立的服務,CMK 加密會延伸至暫存磁片上的資料,以便完整加密索引內容。 |
Endpoint Protection | 輸入防火牆支援的 IP 規則 可讓您設定搜尋服務將接受要求的 IP 範圍。 使用 Azure Private Link 建立私人端點,以透過虛擬網路強制所有要求。 |
Azure 角色型存取控制 | 資料平面的 RBAC (預覽) 是指將角色指派給 Azure Active Directory 中的使用者和群組,以控制搜尋內容和作業的存取。 |
輸出安全性 (索引子) | 透過私人端點的資料存取可讓索引子連線到透過Azure Private Link保護的 Azure 資源。 使用信任身分識別的資料存取 表示外部資料源的連接字串可以省略使用者名稱和密碼。 當索引子連線到資料來源時,如果搜尋服務先前註冊為受信任的服務,資源就會允許連線。 |
入口網站功能
類別 | 功能 |
---|---|
用於原型設計和檢查的工具 | [新增索引 ] 是入口網站中的索引設計工具,可用來建立包含屬性欄位和一些其他設定的基本架構。 儲存索引之後,您可以使用 SDK 或 REST API 來填入它,以提供資料。 匯入資料精靈 會建立索引、索引子、技能集和資料來源定義。 如果您的資料存在於 Azure 中,此精靈可以節省大量時間和精力,特別是針對概念證明調查和探索。 搜尋總管 可用來測試查詢和精簡評分設定檔。 建立示範應用程式 可用來產生可用來測試搜尋體驗的 HTML 頁面。 偵錯會話 是視覺化編輯器,可讓您以互動方式偵錯技能集。 它會顯示相依性、輸出和轉換。 |
監視和診斷 | 啟用監視功能,使其超越永遠可以在入口網站看到,且一目了然的計量。 每秒查詢的計量、延遲和節流會在入口網站頁面中擷取並報告,不需要額外的設定。 |
可程式性
類別 | 功能 |
---|---|
REST | 服務 REST API 適用于資料平面作業,包括與索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 管理 REST API是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
適用於 .NET 的 Azure SDK | Azure.Search.Documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 Microsoft。Azure.Management.Search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for Java | com.azure.search.documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 com.microsoft.azure.management.search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
適用於 Python 的 Azure SDK | azure-search-documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 azure-mgmt-search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
適用于 JavaScript/TypeScript 的 Azure SDK | azure/search-documents 適用于資料平面作業,包括與編制索引、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 azure/arm-search是透過 Azure Resource Manager建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |