共用方式為


Azure AI 搜尋服務有何新功能

Azure 認知搜尋現已改名為 Azure AI 搜尋服務。 了解 Azure AI 搜尋服務的功能、文件和範例的最新更新。

注意

預覽功能會在這裡公告,但我們也維護一份預覽功能清單,讓您可以在同一個位置找到這些功能。

2024 年 6 月

專案 類型 描述
Azure 入口網站 中的影像搜尋 功能 搜尋總管現在支援影像搜尋。 在具有向量化影像內容的向量索引中,您可以將影像放入搜尋總管中,以查詢相符專案。

2024 年 5 月

Item 類型 描述
每個階層更高的容量和更多向量配額 (相同帳單費率) 基礎結構 標準 2 (S2)、標準 3 (S3) 和標準 3 高密度 (S3 HD) 的分割區大小現在更大了,適用於 2024 年 4 月 3 日後建立的所有服務。 如果您現在建立新服務,您會取得較大分割區。 如果您在 4 月 3 日和 5 月 17 日之間建立新的服務,則自動獲得較大分割區。

儲存體最佳化階層 (L1 和 L2) 也有更多容量。 L1 和 L2 客戶必須建立新的服務以受益於更高的容量。 目前沒有就地升級。

現在有更多區域提供額外的容量:德國北部、德國中西部、南非北部、瑞士西部和 Azure Government(德克薩斯州、亞利桑那州和弗吉尼亞州)。
OneLake 整合 (預覽) 功能 OneLake 檔案和 OneLake 捷徑的新索引子。 如果使用 Microsoft Fabric 和 OneLake 存取 Amazon Web Services (AWS) 和 Google 資料來源的資料,請使用此索引子以將外部資料匯入至搜尋索引。 此索引子可透過 Azure 入口網站、2024-05-01-preview REST API (部分機器翻譯) 和 Azure SDK 搶鮮版 (Beta) 套件取得。
向量相關性
混合式查詢相關性
功能 四項增強功能可改善向量和混合式搜尋相關性。

首先,您現在可以設定向量搜尋結果的閾值,以排除低評分結果。

其次,查詢架構中的變更會在每個查詢類型的查詢管線結尾套用評分配置檔。 檔提升是常見的評分配置檔,現在可在向量和混合式查詢上如預期般運作。

第三,您可以在混合式查詢中設定 MaxTextRecallSizecountAndFacetMode ,以控制流入混合式排名模型的 BM25 排名搜尋結果數量。

第四,針對向量和混合式搜尋,您可以加權向量查詢,以提升或減少其在多重查詢要求中的重要性。
二進位向量支援 功能 Collection(Edm.Byte) 是新支援的資料類型。 此資料類型可允許與 Cohere v3 二進位內嵌模型與自訂二進位量化整合。 縮小資料類型可降低大型向量資料集的成本。 如需詳細資訊,請參閱向量搜尋的索引二進位資料
Azure AI 視覺多模式內嵌技能 (預覽) 技能 繫結至 Azure 視覺多模式內嵌 API 的新技能。 您可以在編制索引期間產生文字或影像的內嵌。 此技能可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。
Azure AI 視覺向量化工具 (預覽) 向量化工具 新的向量化工具使用多模式內嵌 API 連線至 Azure AI 視覺資源以在查詢時產生內嵌。 此向量化工具可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。
Azure AI Studio 模型目錄向量化工具 (預覽) 向量化工具 新的向量化工具會連線至從 Azure AI Studio 模型目錄部署的內嵌模型。 此向量化工具可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。

如何使用 Azure AI Studio 中的模型實作整合向量化
AzureOpenAIEmbedding 技能 (預覽) 支援 Azure OpenAI 上的更多模型 技能 現在支援文字內嵌-3-large 和 text-embedding-3-small,以及先前更新中的 text-embedding-ada-002。 新的 dimensionsmodelName 屬性可讓您在 Azure OpenAI 上指定各種內嵌模型。 先前,維度限制已修正為1,536個維度,僅適用於文字內嵌-ada-002。 更新的技能可透過 Azure 入口網站 和 2024-05-01-preview REST API 取得。
Azure 入口網站更新 入口網站 匯入和向量化數據精靈 現在支援 OneLake 索引器作為數據源。 針對內嵌,它也支援連線到 Azure AI 視覺多模式、Azure AI Studio 模型目錄,以及更多內嵌模型在 Azure OpenAI 上。

將欄位新增至索引時,您可以選擇 二進位資料類型

搜尋總管 現在預設為 2024-05-01-preview,並支援向量和混合式查詢的新預覽功能。
2024-05-01-preview API 搜尋 REST API 的新預覽版本提供新的技能與向量化工具、新的二進位資料類型、OneLake 檔案索引子,以及新的查詢參數,以取得更多相關結果。 如果已根據 2023-07-01-preview 撰寫現有程式碼且必須移轉至此版本,請參閱升級 REST API
Azure SDK Beta 套件 API 檢閱下列 Azure SDK 搶鮮版 (Beta) 套件的變更記錄以了解新的功能支援:適用於 Python 的 Azure SDK適用於 .NET 的 Azure SDK適用於 Java 的 Azure SDK
Python 程式代碼範例 範例 新的端對端範例示範 與 Cohere Embed v3 的整合、 與 Google 和 AWS 上的 OneLake 和雲端數據平臺整合,以及 與 Azure AI Vision 多模式 API 整合。

2024 年 4 月

Item 類型 描述
安全性更新解決資訊洩漏 API GET 回應不再傳回連接字串或金鑰。 適用於 GET Skillset、GET Index 和 GET Indexer。 此變更可協助保護與 AI 搜尋整合的 Azure 資產免於未經授權的存取。
基本和標準層的更多儲存體 基礎結構 基本層現在支援最多三個分割區和三個複本。 基本和標準 (S1、S2、S3) 層每個分割區都明顯增加,每個分割區的費率相同。 額外的容量受限於區域可用性,並適用於 2024 年 4 月 3 日後建立的新搜尋服務。 目前沒有就地升級,因此您必須建立新的搜尋服務以取得額外的記憶體。
更多向量配額 基礎結構 所選區域在 2024 年 4 月 3 日後所建立新服務的向量配額也會較高。
向量量化、縮小向量資料類型和新 stored 屬性 (預覽) 功能 這三個功能會共同新增向量壓縮及更智慧的儲存體選項。 首先,純量量化可減少記憶體和磁碟的向量索引大小。 其次,縮小資料類型可透過儲存較小的值以減少每個欄位的儲存體。 第三,您可以使用 stored 以選擇退出儲存僅用於搜尋結果的向量額外複本。 如果您不需要查詢回應中的向量,您可以將 stored 設定為 False 以節省空間。
2024-03-01-preview 搜尋 REST API API 新預覽版本的搜尋 REST API 提供新的資料類型、向量壓縮屬性和向量儲存體選項。
2024-03-01-preview 管理 REST API API 新預覽版本的管理 REST API 提供控制平面作業。
2023-07-01-preview 淘汰公告 API 2024 年 4 月 8 日已公告淘汰。 2024 年 7 月 8 日淘汰。 這是第一個支援向量搜尋的 REST API。 較新的 API 版本有不同的向量設定。 建議您盡快移轉至較新版本

2024 年 2 月

Item 類型 描述
新維度限制 功能 針對向量欄位,維度限制的上限已從 2048 提升至 3072

2023 公告

Month 類型 公告 \(英文\)
11 月 功能 向量搜尋,已正式推出。 現已解除先前對客戶自控金鑰 (CMK) 的限制。 預先篩選 (部分機器翻譯) 和詳盡的 K 最近鄰項目演算法 (部分機器翻譯) 現已正式推出。
11 月 功能 語意排名,已正式推出 (部分機器翻譯)
11 月 功能 整合向量化 (預覽) 在編製索引期間新增資料區塊化和文字到向量轉換,並在查詢期間新增文字到向量轉換。
11 月 功能 匯入和向量化資料精靈 (預覽) 自動化資料區塊和向量化。 其是以 2023-10-01-Preview (部分機器翻譯) REST API 為目標。
11 月 功能 索引投影 (預覽) 定義用於一對多索引模式的次要索引形狀,其中來自擴充管線的內容可將多個索引設為目標。
11 月 API 2023-11-01 搜尋 REST API 是穩定版本的搜尋 REST API,提供向量搜尋語意排名。 請參閱升級 REST API (部分機器翻譯),以取得正式發行功能的移轉步驟。
11 月 API 2023-11-01 管理 REST API 新增啟用或停用語意排名的 API。
11 月 技能 Azure OpenAI 內嵌技能 (概觀) 連線到 Azure OpenAI 資源上已部署的內嵌模型,以在技能執行期間產生內嵌。
11 月 技能 文字分割技能 (預覽) 已在 2023-10-01-Preview 中更新,以支援原生資料區塊化。
11 月 影片 向量搜尋和語意排名如何改善您的 GPT 提示說明混合式擷取如何為您提供最佳的基礎資料,以產生有用的 AI 回應,並實現使用概念和關鍵字進行搜尋。
11 月 範例 生成式 AI 應用程式中的角色型存取控制說明如何使用 Microsoft Entra ID 和 Microsoft Graph API,以針對索引中的區塊化內容推出細微的使用者權限。
10 月 範例 「使用您的資料聊天」解決方案加速器。 使用 Azure AI 搜尋服務作為擷取器的端對端 RAG 模式。 這提供索引編制、資料區塊化和協調流程。
10 月 功能 詳盡的 K 最近鄰項目 (KNN) 評分演算法,用於在向量空間中進行相似度搜尋。 僅適用於 2023-10-01-Preview REST API。
10 月 功能 向量搜尋中的預先篩選會在查詢執行之前評估篩選準則,減少需要搜尋的內容量。 僅適用於 2023-10-01-Preview REST API,其是透過查詢上的新 vectorFilterMode 屬性提供,並可根據您的需求設定為 preFilter (預設值) 或 postFilter
10 月 API 2023-10-01-Preview 搜尋 REST API,中斷性變更向量欄位向量查詢的定義。
8 月 功能 增強式語意排名 (部分機器翻譯)。 已升級的模型正在針對語意重新排名推出,且可用性會延伸到更多區域。 唯一語彙基元計數上限從 128 個倍增至 256 個。
7 月 範例 向量示範 (適用於 JavaScript 的 Azure SDK) (英文)。 使用 Node.js 和 @azure/search-documents 12.0.0-beta.2 程式庫來產生內嵌、建立及載入索引,以及執行數個向量查詢。
7 月 範例 向量示範 (適用於 .NET 的 Azure SDK) (英文)。 使用 Azure.Search.Documents 11.5.0-beta.3 程式庫來產生內嵌、建立及載入索引,以及執行數個向量查詢。 您也可以嘗試 Azure SDK 小組提供的這個範例 (英文)。
7 月 範例 向量示範 (適用於 Python 的 Azure SDK) 使用 azure.search.documents 的最新搶鮮版 (Beta) 版本來產生內嵌、建立及載入索引,以及執行數個向量查詢。 請瀏覽 azure-search-vector-samples/demo-python (英文) 存放庫以取得更多向量搜尋示範。
6 月 功能 向量搜尋公開預覽 (部分機器翻譯)。
6 月 功能 語意搜尋可用性現已在基本層上提供。
6 月 API 2023-07-01-Preview 搜尋 REST API。 支援向量搜尋。
五月 功能 Azure RBAC (角色型存取控制,已正式推出)
五月 API 2022-09-01 管理 REST API,支援設定搜尋以使用 Azure 角色。 Azure PowerShell 的 Az.Search 模組和 Azure CLI 的 Az search 模組已更新,以支援搜尋服務驗證選項。 您也可以使用 Terraform 提供者 (英文) 來設定驗證選項 (請參閱此 Terraform 快速入門 (部分機器翻譯) 來取得詳細資料)。
四月 範例 針對商務持續性和災害復原的 Azure AI 搜尋服務多區域部署 (英文)。 完整設定 Azure AI 搜尋服務之多區域解決方案的部署指令碼,其具備在端點失敗時同步處理內容和要求重新導向的選項。
三月 範例 搭配 Azure OpenAI 和 Azure AI 搜尋服務使用 ChatGPT + 企業資料 (GitHub) (英文)。 Python 程式碼和範本,可結合 Azure AI 搜尋服務與 OpenAI 中的大型語言模型。 如需背景,請參閱此技術社群部落格文章:透過 ChatGPT 徹底改變您的企業資料 (英文)。

重點︰

使用 Azure AI 搜尋服務來合併可搜尋內容並對其進行索引編製。

查詢索引以取得初始搜尋結果。

從那些結果組合提示,並傳送至 Azure OpenAI 中的 gpt-35-turbo (預覽) 模型。

傳回跨文件答案,並在客戶面向的應用程式中提供引文和透明度,讓使用者可以評估回應。

過往年度的公告

服務重新命名

此服務多年來具有多個名稱。 在此以反向的時間順序列出這些名稱:

  • Azure AI 搜尋服務 (2023 年 11 月) 已重新命名,以符合 Azure AI 服務和客戶預期。
  • Azure 認知搜尋 (2019 年 10 月) 已重新命名以反映其在服務作業中擴大了認知技能和 AI 處理的使用量 (但為選擇性)。
  • Azure 搜尋服務 (2015 年 3 月) 原始名稱。

服務更新

您可以在 Azure 網站中找到 Azure AI 搜尋服務的服務更新公告

功能重新命名

語意搜尋已於 2023 年 11 月重新命名為語意排名 (部分機器翻譯) 以更清楚地描述該功能,因為其能提供現有結果集的 L2 排名。