Azure AI 搜尋服務的功能
Azure AI 搜尋服務提供資訊擷取,並使用選擇性 AI 整合從文字和向量內容中擷取更多價值。
下表依類別來概述功能。 如需 Azure AI 搜尋服務與其他搜尋技術相比較的詳細資訊,請參閱比較搜尋選項。
所有 Azure 公用、私人和主權雲端都具備功能同位,但特定區域不支援某些功能。 如需詳細資訊,請參閱選擇區域。
注意
想使用預覽功能? 請參閱預覽功能清單。
編制索引功能
類別 | 功能 |
---|---|
資料來源 | 搜尋索引可以接受來自任何來源的文字,但須以 JSON 文件提交。 索引子功能可自動從支援的資料來源匯入資料,以擷取主要資料存放區中可搜尋的內容。 索引子為您處理 JSON 序列化,且大多支援某種形式的變更和刪除偵測。 您可以連線到各種資料來源,包括 OneLake、Azure SQL Database、Azure Cosmos DB 或 Azure Blob 儲存體。 |
階層式和巢狀資料結構 | 複雜類型和集合可讓您在搜尋索引內仿造幾乎任何類型的 JSON 結構。 一對多和多對多基數可以透過集合、複雜類型和複雜類型的集合,以原生方式表示。 |
語言分析 | 分析器是在編製索引和搜尋作業期間用於文字處理的元件。 您預設可以使用通用的標準 Lucene 分析器,也可以取代預設值,改用語言分析器、您設定的自訂分析器,或可產生您所需權杖格式的另一個預先定義的分析器。 Lucene 或 Microsoft 的語言分析器 (英文) 可用來以智慧方式處理特定語言的語言學,包括動詞時態、性別、不規則複數名詞 (例如 ' mouse' 與 'mice')、拆解複合字、斷字 (針對沒有空格的語言) 等。 自訂語彙分析器用於複雜查詢形式,例如語音比對和規則運算式。 |
向量和混合式搜尋
類別 | 功能 |
---|---|
向量索引編製 | 在搜尋索引內,新增向量欄位以支援向量搜尋案例。 向量欄位可以與相同搜尋文件中的非向量欄位共存。 |
向量查詢 | 制定單一和多個向量查詢。 |
向量搜尋演算法 | 使用階層式導覽小型世界 (HNSW) 或詳盡的 K 最近鄰項目 (KNN) 在搜尋索引中尋找類似的向量。 |
向量篩選條件 | 在查詢執行前後套用篩選條件,以在資訊擷取期間提高精確度。 |
混合式資訊擷取 | 在單一混合式查詢要求中搜尋概念和關鍵詞。 混合式搜尋會合併向量和文字搜尋,並選擇性進行語意排名和相關性微調,以獲得最佳結果。 |
整合式資料區塊化和向量化 | 透過文字分割技能進行原生資料區塊化。 透過向量化程式和內嵌技能 (例如 AzureOpenAIEmbeddingModel、Azure AI Vision 多模式,以及可用來連線到 Azure AI Studio 模型目錄中端點的 AML 技能) 進行原生向量化。 整合向量化 提供從來源檔案到查詢的端對端索引管線。 |
整合式向量壓縮和量化 | 使用內建純量和二進位量化來減少記憶體中和磁碟上的向量索引大小。 您也可以放棄儲存不需要的向量,或將窄資料類型指派給向量欄位,以降低儲存需求。 |
應用 AI 和知識採礦
類別 | 功能 |
---|---|
在編制索引期間的 AI 處理 | AI 擴充是指索引子管線中的內嵌影像和自然語言處理,可從無法為全文檢索搜尋編製索引的內容中擷取文字和資訊。 AI 處理的作法是新增技能並結合成技能集,然後附加至索引子。 AI 可以是來自 Microsoft 的內建技能,例如文字翻譯或光學字元辨識 (OCR),也可以是您提供的自訂技能。 |
在非搜尋案例中儲存擴充的內容以供分析和取用 | 知識存放區是豐富內容的永續性儲存體,主要用於非搜尋案例,例如知識採礦和資料科學處理。 知識存放區是在技能集之內定義,但在 Azure 儲存體中建立為物件或表格式資料列集。 |
快取擴充 | 擴充快取 (預覽) 是指可在技能集執行期間重複使用的快取擴充。 如果技能集包含 OCR 和影像分析 (處理很費力),快取特別實用。 |
全文檢索和其他查詢形式
類別 | 功能 |
---|---|
自由格式文字檢索 | 全文檢索搜尋是大部分以搜尋為基礎之應用程式的主要使用案例。 您可以使用 Azure 搜尋服務支援的語法制訂查詢。 簡單查詢語法可提供邏輯運算子、片語搜尋運算子、後置運算子、優先順序運算子。 完整 Lucene 查詢語法包含簡單語法的所有作業,還擴及模糊搜尋、鄰近搜尋、詞彙提升和規則運算式。 |
相關性 | 簡單評分是 Azure AI 搜尋服務的主要優點。 評分設定檔用於將相關性模型化為文件本身中的值函數。 例如,您可能想要新推出的產品或折扣的產品,出現在搜尋結果中較高的位置。 您也可以根據您所追蹤並個別儲存的客戶搜尋喜好設定,使用標記進行個人化計分來建置計分設定檔。 語意排名工具是進階功能,可根據查詢的語意相關性來重新排名結果。 視您的內容和案例而定,幾乎亳不費力或設定,就能大幅改善搜尋相關性。 |
地理空間搜尋 | 地理空間函式篩選和比對地理座標。 您可以比對距離或納入多邊形中。 |
篩選與 Facet | 透過單一查詢參數便可啟用多面向導覽 (英文)。 Azure AI 搜尋服務會傳回多面向導覽結構,可做為類別清單背後的程式碼,用於自我引導篩選 (例如,依價格範圍或品牌來篩選類別目錄項目)。 篩選 (英文) 可用於將多面向導覽納入應用程式的 UI、增強查詢編寫,以及根據使用者或開發人員指定的準則進行篩選。 請使用 OData 語法建立篩選。 |
使用者體驗 | 您可以在搜尋列中針對預先輸入的查詢啟用 自動完成。 搜尋建議也會在搜尋列中排除部分的文字輸入,但結果是您索引中的實際文件,而不是查詢字詞。 與對等字詞相關聯的同義字,讓使用者不必提供替代字詞,就能以隱含方式擴充查詢範圍。 搜尋結果醒目提示會將文字格式套用至搜尋結果中的相符關鍵字。 您可以選擇哪些欄位傳回醒目提示的文字片段。 我們會透過索引結構描述針對多個欄位提供排序 (英文),然後使用單一搜尋參數在查詢階段進行切換。 Azure AI 搜尋服務針對搜尋結果提供完善的控制項,讓您可輕鬆對搜尋結果進行分頁和節流。 |
安全性功能
類別 | 功能 |
---|---|
資料加密 | Microsoft 管理的待用加密會內建到內部儲存層,而且無法回復。 您在 Azure Key Vault 中建立和管理的客戶自控加密金鑰可用於索引和同義字對應的補充加密。 針對在 2020 年 8 月 1 日之後建立的服務,CMK 加密延伸至暫存磁碟上的資料,以落實索引內容的完整雙重加密。 |
端點保護 | 輸入防火牆的 IP 規則支援可讓您設定搜尋服務會接受要求的 IP 範圍。 使用 Azure Private Link 建立私人端點,以強制所有要求通過虛擬網路。 |
輸入存取 | 角色型存取控制會將角色指派給 Microsoft Entra ID 中的使用者和群組,以控制對搜尋內容和作業的存取。 如果您不想使用角色指派,也可以使用金鑰型驗證。 |
輸出安全性 (索引子) | 透過私人端點存取資料可讓索引子連線到透過 Azure Private Link 保護的 Azure 資源。 使用信任的身分識別存取資料表示外部資料源的連接字串可以省略使用者名稱和密碼。 當索引子連線到資料來源時,如果搜尋服務先前已註冊為信任的服務,則資源會允許連線。 |
入口網站功能
類別 | 功能 |
---|---|
用於原型設計和檢查的工具 | 新增索引是入口網站中的索引設計工具,可讓您建立由屬性化欄位和一些其他設定組成的基本結構描述。 儲存索引之後,您可以使用 SDK 或 REST API 提供資料,以填入索引。 匯入資料精靈建立索引、索引子、技能集和資料來源定義。 如果您的資料存在於 Azure 中,此精靈可以節省大量時間和精力,特別是在概念證明調查和探索方面。 匯入和向量化資料會建立包含資料區塊化和向量化的完整索引管線。 精靈會建立所有物件和組態設定。 搜尋總管用來測試查詢和精簡評分設定檔。 建立示範應用程式用來產生可用於測試搜尋體驗的 HTML 頁面。 偵錯工作階段是視覺化編輯器,可讓您以互動方式偵錯技能集。 此工具會顯示相依性、輸出和轉換。 |
監視和診斷 | 啟用監視功能,使其超越永遠可以在入口網站看到,且一目了然的計量。 不需要另外設定,就會擷取每秒查詢次數、延遲和節流的計量,並在入口網站頁面中報告。 |
可程式性
類別 | 功能 |
---|---|
REST | 服務 REST API 適用於資料平面作業,包括索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 管理 REST API 適用於透過 Azure Resource Manager 建立和佈建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for .NET | Azure.Search.Documents 適用於資料平面作業,包括索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 Microsoft.Azure.Management.Search 適用於透過 Azure Resource Manager 建立和佈建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for Java | com.azure.search.documents 適用於資料平面作業,包括索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 com.microsoft.azure.management.search 適用於透過 Azure Resource Manager 建立和佈建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for Python | azure-search-documents 適用於資料平面作業,包括索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 azure-mgmt-search 適用於透過 Azure Resource Manager 建立和佈建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for JavaScript/TypeScript | azure/search-documents 適用於資料平面作業,包括索引編制、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端程式庫來擷取系統資訊和統計資料。 azure/arm-search 適用於透過 Azure Resource Manager 建立和佈建服務。 您也可以使用此 API 來管理金鑰和容量。 |