共用方式為


什麼是 Azure AI 搜尋服務?

Azure AI 搜尋服務(先前稱為「Azure 認知搜尋」)可在傳統和產生的 AI 搜尋應用程式中,透過使用者擁有的內容,大規模提供安全的資訊擷取。

對於任何呈現文字和向量的應用程式而言,資訊擷取是基礎。 常見案例包括目錄或文件搜尋、數據探索,以及越來越多的聊天樣式應用程式,以透過專屬的地面數據。 當您建立搜尋服務時,可以使用下列功能:

在架構上,搜尋服務位於包含未編制索引資料的外部資料存放區,與將查詢要求傳送至搜尋索引並處理回應的用戶端應用程式之間。

Azure AI 搜尋服務架構

在您的用戶端應用程式中,搜尋體驗是使用 Azure AI 搜尋服務所提供的 API 來定義,並可以包含相關性調整、語意排名、自動完成、同義字比對、模糊比對、模式比對、篩選和排序。

在整個 Azure 平台上,Azure AI 搜尋服務可與其他 Azure 服務整合,其形式為自動從 Azure 資料來源擷取資料的索引子,以及從Azure AI 服務納入可取用 AI 的技能集,例如影像和自然語言處理,或您在 Azure Machine Learning 中建立或在 Azure Functions 內包裝的自訂 AI。

搜尋服務內部

搜尋服務中的兩個主要工作負載是「編製索引」及「查詢」

  • 索引編製是將內容載入搜尋服務中,並使其可供搜尋的輸入程序。 系統會在內部將輸入文字處理成權杖並儲存在反向索引中,而輸入向量則儲存在向量索引中。 Azure AI 搜尋服務可編製索引的文件格式為 JSON。 您可以上傳已組合的 JSON 文件,或使用索引子來擷取資料並將其序列化為 JSON。

    透過技能集套用 AI 會使用影像和語言模型擴充索引。 如果來源文件中有影像或大型非結構化文字,您可以附加執行 OCR、描述影像、推斷結構、翻譯文字等技能。 您也可以附加執行資料區塊化和向量化的技能。

  • 一旦將可搜尋的內容填入索引,當您的用戶端應用程式將查詢要求傳送至搜尋服務並處理回應時,就會發生查詢。 所有查詢執行都會透過您所控制的搜尋索引。

    語意排名是查詢執行的延伸模組。 它會新增次要排名,使用語言理解來重新評估結果集,將最語意上相關的結果提升到最上層。

Azure AI 搜尋服務適用於下列應用程式案例:

  • 將其用於傳統的全文檢索搜尋和新一代向量相似度搜尋。 使用利用關鍵詞和相似度搜尋的優勢,擷取資訊來備份您的產生 AI 應用程式。 使用這兩種形式來擷取最相關的結果。

  • 將異質內容合併至由向量和文字所組成的使用者定義和填入的搜尋索引。 您可以維護可搜尋項目擁有權和控制權。

  • 針對生成式 AI 和 RAG 應用程式,整合資料區塊化和向量化

  • 在文件層級應用細微的存取控制

  • 將索引編製和查詢工作負載卸載至專用搜尋服務。

  • 輕鬆地實作搜尋相關功能:相關性調整、多面向導覽、篩選 (包括地理空間搜尋)、同義字對應和自動完成。

  • 將大型的無差異文字或影像檔案,或是儲存在 Azure Blob 儲存體或 Azure Cosmos DB 的應用程式檔案,轉換為可搜尋的區塊。 這會在索引編製期間透過認知技能新增來自 Azure AI 的外部處理來達成。

  • 新增語言或自訂文字分析。 如果您有非英文的內容,Azure AI 搜尋服務可支援 Lucene 分析器和 Microsoft 的自然語言處理器。 您也可以設定分析器來完成原始內容的特殊處理,例如篩選出變音符號,或辨識並保留字串中的模式。

如需特定功能的詳細資訊,請參閱 Azure AI 搜尋服務的功能

如何開始使用

功能透過 Azure 入口網站、簡單的 REST API 或 Azure SDK (例如 Azure SDK for .NET) 公開。 Azure 入口網站支援服務管理和內容管理,以及搭配工具建立原型和查詢您的索引和技能集。

核心搜尋功能的端對端探索可透過四個步驟來達成:

  1. 決定層級和區域。 每個訂用帳戶只能有一項免費搜尋服務。 所有的快速入門都可在免費層中完成。 如需更多容量和功能,則需要計費層

  2. 在 Azure 入口網站中建立搜尋服務

  3. 開始使用匯入資料精靈。 選擇內建範例或支援的資料來源,在幾分鐘內建立、載入及查詢索引。

  4. 使用搜尋總管完成,使用入口網站用戶端查詢您剛才建立的搜尋索引。

或者,您可以透過不可部分完成的步驟,建立、載入及查詢搜尋索引:

  1. 使用入口網站、REST API.NET SDK 或另一個 SDK 來建立搜尋索引。 索引結構描述會決定可搜尋內容的結構。

  2. 使用「推送」模型從任何來源推送 JSON 文件以上傳內容;如果您的來源資料屬於受支援的類型,則使用「提取」模型 (索引子)

  3. 在入口網站、REST API.NET SDK 或另一個 SDK 中使用搜尋瀏覽器查詢索引

提示

如需複雜或自訂解決方案的說明,請連絡在 Azure AI 搜尋服務技術方面擁有深厚專業知識的合作夥伴

比較搜尋選項

客戶常會詢問 Azure AI 搜尋服務與其他搜尋相關解決方案有何差異。 下表摘要說明主要差異。

相較於 主要差異
Microsoft Search Microsoft 搜尋適用於需要在 SharePoint 中查詢內容之已通過 Microsoft 365 驗證的使用者。 Azure AI 搜尋服務會跨 Azure 和任何 JSON 資料集提取內容。
Bing Bing API 會查詢 Bing.com 上的索引,以尋找相符字詞。 Azure AI 搜尋服務會針對您填入內容的索引進行搜尋。 您可以控制資料擷取和結構描述。
資料庫搜尋 Azure SQL 具有 全文搜索向量搜尋。 Azure Cosmos DB 也有 文字搜尋向量搜尋。 當您需要相關性微調或異質來源的內容等功能時,Azure AI 搜尋會成為有吸引力的替代方案。 資源使用率是另一項轉折點。 索引編製和查詢需要大量計算作業。 從 DBMS 卸載搜尋,可保留用於交易處理的系統資源。
專用的搜尋解決方案 假設您已決定使用具有全面功能的專用搜尋,則最終的類別比較會在搜尋技術之間進行。 在雲端提供者中,對於主要依賴搜尋來擷取資訊和導覽內容的應用程式而言,Azure AI 搜尋服務在處理 Azure 上內容的向量、關鍵字和混合式工作負載時,功能最為強大。

主要優點包括︰

  • 支援向量和非向量 (text) 索引編製和查詢。 使用向量相似性搜尋,即使搜尋字詞不完全相符,您仍可找到語意上類似於搜尋查詢的資訊。 使用混合式搜尋,獲得最佳的關鍵字和向量搜尋效果。
  • 透過語意排名和評分配置檔進行排名和相關性微調。 查詢語法支援詞彙提升和欄位優先順序。
  • 索引層的 Azure 資料整合(編目程式)。
  • Azure AI 整合適用於使內容文字和向量變成可搜尋的轉換。
  • 適用於信任連線的 Microsoft Entra 安全性,以及適用於無網際網路情況下私人連線的 Azure Private Link。
  • 完整的搜尋體驗:56 種語言的語言和自訂文字分析。 Facet、自動完成查詢和建議結果,以及同義字。
  • Azure 調整性、可靠性與全域觸達。