什麼是 Azure AI 搜尋服務?
Azure AI 搜尋服務(先前稱為「Azure 認知搜尋」)是一個企業就緒的搜尋和擷取系統,具有一套完整的進階搜尋技術,專為任何規模的高效能應用程式所建置。
Azure AI 搜尋是在 Azure 上建置以 RAG 為基礎的應用程式時的主要建議擷取系統,Azure OpenAI 服務與 Azure 機器學習 之間的原生 LLM 整合。
Azure AI 搜尋可用於傳統和 GenAI 案例。 常見的使用案例包括 知識庫 見解(目錄或文件搜尋)、資訊探索(數據探索)、擷取增強的產生(RAG)和自動化。
當您建立搜尋服務時,可以使用下列功能:
- 透過搜尋索引執行向量搜尋、全文檢索和混合式搜尋的搜尋引擎
- 進階索引編制具有整合式資料區塊化和向量化、語彙分析,以及用於內容擷取和轉換的選擇性應用 AI
- 豐富的查詢語法,適用於向量查詢、文字搜尋、混合式查詢、模糊搜尋、自動完成、地理搜尋等
- 使用語意排名、評分設定檔、量化向量查詢,以及控制執行階段查詢行為的參數,進行相關性和查詢效能微調
- Azure 調整性、安全性與觸達
- 資料層、機器學習層、Azure AI 服務和 Azure OpenAI 的 Azure 整合
在架構上,搜尋服務位於包含未編制索引資料的外部資料存放區,與將查詢要求傳送至搜尋索引並處理回應的用戶端應用程式之間。
在您的用戶端應用程式中,搜尋體驗是使用 Azure AI 搜尋服務所提供的 API 來定義,並可以包含相關性調整、語意排名、自動完成、同義字比對、模糊比對、模式比對、篩選和排序。
在整個 Azure 平台上,Azure AI 搜尋服務可與其他 Azure 服務整合,其形式為自動從 Azure 資料來源擷取資料的索引子,以及從Azure AI 服務納入可取用 AI 的技能集,例如影像和自然語言處理,或您在 Azure Machine Learning 中建立或在 Azure Functions 內包裝的自訂 AI。
搜尋服務內部
搜尋服務中的兩個主要工作負載是「編製索引」及「查詢」。
索引編製是將內容載入搜尋服務中,並使其可供搜尋的輸入程序。 系統會在內部將輸入文字處理成權杖並儲存在反向索引中,而輸入向量則儲存在向量索引中。 Azure AI 搜尋服務可編製索引的文件格式為 JSON。 您可以上傳已組合的 JSON 文件,或使用索引子來擷取資料並將其序列化為 JSON。
應用 AI 透過技能使用影像和語言模型擴充索引。 如果來源文件中有影像或大型非結構化文字,您可以附加執行 OCR、分析和描述影像、推斷結構、翻譯文字等技能。 輸出是可以序列化為 JSON 並內嵌到搜尋索引中的文字。
技能集也可以在索引編製期間執行資料區塊化和向量化。 附加至 Azure OpenAI 的技能、Azure AI Studio 中的模型目錄,或附加至任何外部區塊化和內嵌模型的自訂技能,可以在編製索引期間用來建立向量資料。 輸出是可內嵌到搜尋索引中的區塊向量內容。
一旦將可搜尋的內容填入索引,當您的用戶端應用程式將查詢要求傳送至搜尋服務並處理回應時,就會發生查詢。 所有查詢執行都會透過您所控制的搜尋索引。
語意排名是查詢執行的延伸模組。 它增加了次要排名,使用語言理解重新評估結果集,將語意最相關的結果上升至頂端。
整合向量化也是查詢執行的延伸。 如果您的搜尋索引中有向量欄位,您可以提交原始向量查詢或在查詢時向量化的文字。
為何要使用 Azure AI 搜尋服務?
Azure AI 搜尋服務適用於下列應用程式案例:
將其用於傳統的全文檢索搜尋和新一代向量相似度搜尋。 透過利用關鍵字和相似度搜尋優勢的資訊擷取,支援您的生成式 AI 應用程式。 使用這兩種形式來擷取最相關的結果。
將異質內容合併至由向量和文字所組成的使用者定義和填入的搜尋索引。 您可以維護可搜尋項目擁有權和控制權。
針對生成式 AI 和 RAG 應用程式,整合資料區塊化和向量化。
在文件層級應用細微的存取控制。
將索引編製和查詢工作負載卸載至專用搜尋服務。
輕鬆地實作搜尋相關功能:相關性調整、多面向導覽、篩選 (包括地理空間搜尋)、同義字對應和自動完成。
將大型的無差異文字或影像檔案,或是儲存在 Azure Blob 儲存體或 Azure Cosmos DB 的應用程式檔案,轉換為可搜尋的區塊。 這是在索引編製期間透過 AI 技能實現的,而這些技能從 Azure AI 增加了外部處理。
新增語言或自訂文字分析。 如果您有非英文的內容,Azure AI 搜尋服務可支援 Lucene 分析器和 Microsoft 的自然語言處理器。 您也可以設定分析器來完成原始內容的特殊處理,例如篩選出變音符號,或辨識並保留字串中的模式。
如需特定功能的詳細資訊,請參閱 Azure AI 搜尋服務的功能
如何開始使用
功能透過 Azure 入口網站、簡單的 REST API 或 Azure SDK (例如 Azure SDK for .NET) 公開。 Azure 入口網站支援服務管理和內容管理,以及搭配工具建立原型和查詢您的索引和技能集。
使用 Azure 入口網站
核心搜尋功能的端對端探索可透過四個步驟來達成:
決定層級和區域。 每個訂用帳戶只能有一項免費搜尋服務。 所有的快速入門都可在免費層中完成。 如需更多容量和功能,則需要計費層。
在 Azure 入口網站中建立搜尋服務。
開始使用匯入資料精靈。 選擇內建範例或支援的資料來源,在幾分鐘內建立、載入及查詢索引。
使用搜尋總管完成,使用入口網站用戶端查詢您剛才建立的搜尋索引。
使用 API
或者,您可以透過不可部分完成的步驟,建立、載入及查詢搜尋索引:
使用入口網站、REST API、.NET SDK 或另一個 SDK 來建立搜尋索引。 索引結構描述會決定可搜尋內容的結構。
使用「推送」模型從任何來源推送 JSON 文件以上傳內容;如果您的來源資料屬於受支援的類型,則使用「提取」模型 (索引子)。
使用快速鍵
或者,嘗試解決方案加速器:
與您的資料聊天解決方案加速器可協助您針對內容建立自訂 RAG 解決方案。
「交談知識採礦」解決方案加速器可協助您建立互動式解決方案,以從連絡中心後文字記錄擷取可採取動作的深入解析。
檔知識採礦加速器 可協助您處理和擷取非結構化多模式檔中的摘要、實體和元數據。
建置您自己的 Copilot 解決方案加速器,利用 Azure OpenAI 服務、Azure AI 搜尋服務和 Microsoft Fabric,來建立自訂 Copilot 解決方案。
一般 Copilot 可協助您建置自己的輔助程式,以識別相關文件、摘要非結構化資訊,以及使用您自己的數據產生 Word 檔範本。
Client Advisor 多合一自訂 Copilot 讓 Client Advisor 能夠跨結構化和非結構化資料運用生成式 AI 的強大功能。 協助我們的客戶將日常工作最佳化,並培養與更多用戶端更好的互動
Research Assistant 可協助建置您自己的 AI 助理,以識別相關文件、摘要說明及分類大量的非結構化資訊,並加快整體文件檢閱和內容產生。
提示
如需複雜或自訂解決方案的說明,請連絡在 Azure AI 搜尋服務技術方面擁有深厚專業知識的合作夥伴。
比較搜尋選項
客戶常會詢問 Azure AI 搜尋服務與其他搜尋相關解決方案有何差異。 下表摘要說明主要差異。
相較於 | 主要差異 |
---|---|
Microsoft Search | Microsoft 搜尋適用於需要在 SharePoint 中查詢內容之已通過 Microsoft 365 驗證的使用者。 Azure AI 搜尋服務會跨 Azure 和任何 JSON 資料集提取內容。 |
Bing | Bing API 會查詢 Bing.com 上的索引,以尋找相符字詞。 Azure AI 搜尋服務會針對您填入內容的索引進行搜尋。 您可以控制資料擷取和結構描述。 |
資料庫搜尋 | Azure SQL 具有全文搜索和向量搜尋。 Azure Cosmos DB 也有文字搜尋和向量搜尋。 當您需要相關性微調等功能或來自異質來源的內容時,Azure AI 搜尋服務成為極具吸引力的替代方案。 資源使用率是另一項轉折點。 索引編製和查詢需要大量計算作業。 從 DBMS 卸載搜尋,可保留用於交易處理的系統資源。 |
專用的搜尋解決方案 | 假設您已決定使用具有全面功能的專用搜尋,則最終的類別比較會在搜尋技術之間進行。 在雲端提供者中,對於主要依賴搜尋來擷取資訊和導覽內容的應用程式而言,Azure AI 搜尋服務在處理 Azure 上內容的向量、關鍵字和混合式工作負載時,功能最為強大。 |
主要優點包括︰
- 支援向量和非向量 (文字) 索引編製和查詢。 有了向量相似性搜尋,您可以尋找語意上與搜尋查詢相似的資訊,即使搜尋字詞並非完全相符也無妨。 使用混合式搜尋,獲得最佳的關鍵字和向量搜尋效果。
- 透過語意排名和評分設定檔進行排名和相關性微調。 查詢語法支援詞彙提升和欄位優先順序。
- 索引層的 Azure 資料整合 (編目程式)。
- Azure AI 整合適用於使內容文字和向量變成可搜尋的轉換。
- 適用於信任連線的 Microsoft Entra 安全性,以及適用於無網際網路情況下私人連線的 Azure Private Link。
- 完整的搜尋體驗:56 種語言的語言和自訂文字分析。 Facet、自動完成查詢和建議結果,以及同義字。
- Azure 調整性、可靠性與全域觸達。