Azure AI 搜尋的功能
Azure AI 搜尋提供資訊擷取,並使用選擇性的 AI 整合來擷取更多文字和結構內容。
下表摘要說明依類別分類的功能。 如需 Azure AI 搜尋與其他搜尋技術比較方式的詳細資訊,請參閱 比較搜尋選項 。
所有 Azure 公用、私人和主權雲端都有功能同位,但特定區域不支援某些功能。 如需詳細資訊,請參閱 依區域 的產品可用性。
注意
正在尋找預覽功能? 請參閱預覽功能清單 。
索引功能
類別 | 功能 |
---|---|
資料來源 | 搜尋索引可以接受來自任何來源的文字,前提是它以 JSON 檔的形式提交。 索引子 是一項功能,可將來自支援資料來源的資料匯入自動化,以擷取主要資料存放區中可搜尋的內容。 索引子會為您處理 JSON 序列化,且大部分都支援某種形式的變更和刪除偵測。 您可以連線到各種不同的 資料來源,包括 Azure SQL 資料庫 、 Azure Cosmos DB 或 Azure Blob 儲存體 。 |
階層式和巢狀資料結構 | 複雜類型和 集合可讓您在搜尋索引內建立幾乎任何類型的 JSON 結構模型。 一對多和多對多基數可以透過複雜類型的集合、複雜類型和集合,以原生方式表示。 |
語言分析 | 分析器是用於編制索引和搜尋作業期間文字處理的元件。 根據預設,您可以使用一般用途的標準 Lucene 分析器,或使用語言分析器、您設定的自訂分析器,或以您需要的格式產生權杖的另一個預先定義分析器來覆寫預設值。 Lucene 或 Microsoft 的語言分析器 可用來以智慧方式處理語言特定語言,包括動詞時態、性別、不規則的複數名詞(例如,'mouse' 與 'mouse')、文字去複合、斷詞(適用于不含空格的語言),等等。 自訂語彙分析器 用於複雜的查詢形式,例如語音比對和正則運算式。 |
向量和混合式搜尋
類別 | 功能 |
---|---|
向量索引編製 | 在搜尋索引內,新增 向量欄位 以支援 向量搜尋 案例。 向量欄位可以與相同搜尋檔中的非向量欄位共存。 |
向量查詢 | 制定單一和多個向量查詢 。 |
向量搜尋演算法 | 使用 階層式導覽小型世界 (HNSW) 或 詳盡的 K-Nearest Neighbors (KNN) 在搜尋索引中尋找類似的向量。 |
向量篩選 | 在查詢執行 前後套用篩選,以在資訊擷取期間提高精確度。 |
混合式資訊擷取 | 在單 一混合式查詢要求 中搜尋概念和關鍵字。 混合式搜尋 會合並向量和文字搜尋,並選擇性地進行語意排名和相關性微調,以獲得最佳結果。 |
整合式資料區塊化和向量化 (預覽) | 透過 文字分割技能 進行原生資料區塊化,以及透過 向量化工具和 AzureOpenAIEmbeddingModel 技能 進行原生向量化。 整合向量化 (預覽) 提供從來源檔案到查詢的端對端索引管線。 |
匯入和向量化資料 (預覽) | Azure 入口網站中建立包含資料區塊化和向量化的完整索引管線的新精靈 。 精靈會建立所有物件和組態設定。 |
AI 擴充和知識採礦
類別 | 功能 |
---|---|
索引編制期間的 AI 處理 | AI 擴充 是指索引子管線中的內嵌影像和自然語言處理,從無法為全文檢索搜尋編制索引的內容擷取文字和資訊。 AI 處理是藉由在技能集中新增和結合技能來達成,然後附加至索引子。 AI 可以是 Microsoft 的內建技能 ,例如文字翻譯或光學字元辨識(OCR),或 您提供的自訂技能 。 |
將擴充的內容儲存在非搜尋案例中進行分析和取用 | 知識存放區 是擴充內容的持續性儲存體,適用于知識採礦和資料科學處理等非搜尋案例。 知識存放區是在技能集中定義,但在Azure 儲存體中建立為物件或表格式資料列集。 |
快取擴充 | 累加擴充 (預覽) 是指可在技能集執行期間重複使用的快取擴充。 快取在包含 OCR 和影像分析的技能集中特別有價值,這些技能集需要處理成本高昂。 |
查詢和使用者體驗
類別 | 功能 |
---|---|
自由格式文字搜尋 | 全文檢索搜尋 是大部分以搜尋為基礎的應用程式的主要使用案例。 您可以使用支援的語法來制定查詢。 簡單查詢語法 提供邏輯運算子、片語搜尋運算子、尾碼運算子、優先順序運算子。 完整 Lucene 查詢語法 包含簡單語法中的所有作業,具有模糊搜尋、鄰近搜尋、詞彙提升和正則運算式的延伸模組。 |
相關性 | 簡單評分 是 Azure AI 搜尋的主要優點。 評分設定檔可用來將相關性模型化為檔本身值的功能。 例如,您可能想要在搜尋結果中顯示較新的產品或折扣產品。 您也可以根據您已分別追蹤和儲存的客戶搜尋喜好設定,使用標記來建置評分設定檔。 語意排名器 是進階功能,可根據查詢的語意相關性來重新產生結果。 視您的內容和案例而定,其可透過幾乎最少的組態或精力大幅改善搜尋相關性。 |
地理空間搜尋 | 地理空間函式 會篩選地理座標並比對。 您可以在 距離 上比對,或藉由包含在多邊形圖形中。 |
篩選和 Facet | 多面向導覽 可透過單一查詢參數來啟用。 Azure AI 搜尋會傳回多面向導覽結構,您可以用來做為類別清單背後的程式碼,以進行自我導向篩選(例如,依價格範圍或品牌篩選類別目錄專案)。 篩選 可用來將多面向導覽納入應用程式的 UI、增強查詢公式,並根據使用者或開發人員指定的準則進行篩選。 使用 OData 語法建立篩選。 |
使用者體驗 | 您可以針對搜尋列中的預先輸入查詢啟用自動完成 。 搜尋建議 也適用于搜尋列中的部分文字輸入,但結果是索引中的實際檔,而不是查詢字詞。 同義字會將隱含擴充查詢範圍的對等詞彙產生關聯,而不需要使用者提供替代字詞。 點擊醒目提示 會將文字格式套用至搜尋結果中的相符關鍵字。 您可以選擇哪些欄位傳回醒目提示的程式碼片段。 透過索引架構為多個欄位提供排序,然後使用單一搜尋參數在查詢時間切換。 使用 Azure AI 搜尋服務針對搜尋結果提供的微調控制項,即可直接分頁和節流搜尋結果。 |
安全性功能
類別 | 功能 |
---|---|
資料加密 | Microsoft 管理的待 用加密內建在內部儲存層中,且不可撤銷。 您在 Azure 金鑰保存庫 中建立和管理的客戶管理加密金鑰 可用於索引和同義字對應的補充加密。 對於在 2020 年 8 月 1 日之後建立的服務,CMK 加密會延伸至暫存磁片上的資料,以完整雙重加密已編制索引的內容。 |
端點保護 | 輸入防火牆支援的 IP 規則可讓您設定搜尋服務將接受要求的 IP 範圍。 使用 Azure Private Link 建立私人端點 ,以強制所有要求通過虛擬網路。 |
輸入存取 | Azure 角色型存取控制 會將角色指派給 Microsoft Entra 識別碼中的使用者和群組,以控制對搜尋內容和作業的存取。 如果您沒有 Azure 租使用者,您也可以使用 金鑰型驗證 。 |
輸出安全性 (索引子) | 透過私人端點 的資料存取可讓索引子連線到透過 Azure Private Link 保護的 Azure 資源。 使用受信任身 分識別的資料存取表示外部資料源連接字串可以省略使用者名稱和密碼。 當索引子連線到資料來源時,如果搜尋服務先前註冊為受信任的服務,資源就會允許連接。 |
入口網站功能
類別 | 功能 |
---|---|
原型設計和檢查的工具 | [新增索引 ] 是入口網站中的索引設計工具,可用來建立包含屬性欄位和一些其他設定的基本架構。 儲存索引之後,您可以使用 SDK 或 REST API 來填入它,以提供資料。 匯入資料精靈 會建立索引、索引子、技能集和資料來源定義。 如果您的數據存在於 Azure 中,此精靈可以節省大量時間和精力,特別是針對概念證明調查和探索。 搜尋總 管可用來測試查詢並精簡評分配置檔。 建立示範應用程式 可用來產生 HTML 頁面,可用來測試搜尋體驗。 偵錯 會話是可視化編輯器,可讓您以互動方式對技能集進行偵錯。 它會顯示相依性、輸出和轉換。 |
監視和診斷 | 讓監視功能 超越入口網站中一律可見的計量一目了然。 每秒查詢的計量、延遲和節流會在入口網站頁面中擷取和報告,而不需要額外的設定。 |
可程式性
類別 | 功能 |
---|---|
REST | 服務 REST API 適用於數據平面作業,包括與索引編製、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端連結庫來擷取系統資訊和統計數據。 管理 REST API 是透過 Azure Resource Manager 建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for .NET | Azure.Search.Documents 適用於數據平面作業,包括與索引編製、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端連結庫來擷取系統資訊和統計數據。 Microsoft.Azure.Management.Search 是透過 Azure Resource Manager 建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for Java | com.azure.search.documents 適用於數據平面作業,包括與索引編製、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端連結庫來擷取系統資訊和統計數據。 com.microsoft.azure.management.search 是透過 Azure Resource Manager 建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
Azure SDK for Python | azure-search-documents 適用於數據平面作業,包括與索引編製、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端連結庫來擷取系統資訊和統計數據。 azure-mgmt-search 是透過 Azure Resource Manager 建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |
適用於 JavaScript/TypeScript 的 Azure SDK | azure/search-documents 適用於數據平面作業,包括與索引編製、查詢和 AI 擴充相關的所有作業。 您也可以使用此用戶端連結庫來擷取系統資訊和統計數據。 azure/arm-search 是透過 Azure Resource Manager 建立和布建服務。 您也可以使用此 API 來管理金鑰和容量。 |