Azure AI 搜尋服務有何新功能
Azure 認知搜尋現已改名為 Azure AI 搜尋服務。 了解 Azure AI 搜尋服務的功能、文件和範例的最新更新。
注意
預覽功能會在這裡公告,但我們也維護一份預覽功能清單,讓您可以在同一個位置找到這些功能。
2024 年 10 月
Item | 類型 | 描述 |
---|---|---|
降低 AZURE OpenAI 上 MRL 定型文字內嵌模型的維度需求 | 功能 | Text-embedding-3-small 和 Text-embedding-3-large 是使用 Matryoshka 表示法學習 (MRL) 定型的。 這可讓您將內嵌向量截斷為較少的維度,並調整向量索引大小使用量與擷取質量之間的平衡。 2024-09-01-preview 中的新功能truncationDimension 可讓您存取文字內嵌模型中的 MRL 壓縮。 這隻能針對新的向量欄位進行設定。 |
解除封裝 @search.score 以在混合式搜尋結果中檢視子核心 |
功能 | 您可以藉由檢視最終合併和評分結果的個別查詢子核心,來調查倒數排名融合 (RRF) 排名結果。 新的 debug 屬性會解除包裝搜尋分數。 QueryResultDocumentSubscores 、 QueryResultDocumentRerankerInput 和 QueryResultDocumentSemanticField 提供額外的詳細數據。 這些定義可在 2024-09-01-preview 中使用。 |
將混合式搜尋中的篩選目標設為僅向量查詢 | 功能 | 混合式查詢的篩選條件牽涉到要求上的所有子查詢,不論類型為何。 您可以覆寫全域篩選條件,將篩選範圍限定為特定的子查詢。 使用 2024-09-01-preview 的混合式查詢可以使用新的filterOverride 參數。 |
文字分割技能 (令牌區塊化) | 應用 AI (技能) | 此技能具有可改善內嵌模型之數據區塊化的新參數。 新的 unit 參數可讓您指定令牌區塊化。 您現在可以依令牌長度進行區塊化,將長度設定為對內嵌模型有意義的值。 您也可以指定 Tokenizer 和任何不應該在數據區塊化期間分割的令牌。 新的unit 參數和查詢子核心定義可在 2024-09-01-preview 中找到。 |
2024-09-01-preview | API | 針對文字內嵌-3 模型中截斷維度的 REST API 預覽版本、混合式查詢的目標向量篩選、用於偵錯的 RRF 子核心詳細數據,以及文字分割技能的令牌區塊化。 |
客戶自控金鑰加密的入口網站支援 (CMK) | 功能 | 當您在 Azure 入口網站 中建立新的物件時,您現在可以指定 CMK 加密,然後選取 Azure 金鑰保存庫 來提供金鑰。 |
2024 年 8 月
Item | 類型 | 描述 |
---|---|---|
偵錯會話改善 | 功能 | 有兩個重要的改善項目。 首先,您現在可以對整合式向量化和資料區塊化工作負載進行偵錯。 其次,偵錯會話會重新設計,以更精簡地呈現技能和對應。 您可以在流程中選取物件,並在側邊面板中檢視或編輯其詳細數據。 上一個索引標籤版面配置會完全取代為頁面上上下文相關的資訊。 |
2024-07-01 | API | REST API 的穩定發行適用於正式推出的向量資料類型、向量壓縮,以及在索引編製和查詢期間整合向量化。 |
整合向量化 | 功能 | 宣佈正式推出。 在編製索引期間技能導向的資料區塊化和內嵌。 |
向量化工具 | 功能 | 宣佈正式推出。 查詢執行期間文字到向量的轉換。 Azure OpenAI 向量化工具和自訂 Web API 向量化工具已正式推出。 |
AzureOpenAIEmbedding 技能 | 功能 | 宣佈正式推出。 呼叫 Azure OpenAI 內嵌模型以在編製索引期間產生內嵌的技能類型。 |
索引投影 | 功能 | 宣佈正式推出。 定義次要索引形狀的技能集定義元件,支援一對多索引模式,其中來自擴充管線的內容可將多個索引設為目標。 |
二進位純量量化 | 功能 | 宣佈正式推出。 使用內建量化壓縮記憶體和磁碟的向量索引大小。 |
精簡資料類型 | 功能 | 宣佈正式推出。 假設傳入的資料就是該資料類型,請在向量欄位指派較小的資料類型。 |
匯入並向量化資料精靈 | Azure 入口網站 | 宣佈正式推出。 建立包含資料區塊化和向量化的完整索引編製管線精靈。 精靈會建立所有必要的物件和設定。 此版本會新增 Azure 儲存體中 Azure Data Lake 的精靈支援。 |
儲存的屬性 | 功能 | 宣佈正式推出。 布林值,可藉由不儲存可擷取的向量以降低向量索引的儲存量。 |
vectorQueries.Weight 屬性 | 功能 | 宣佈正式推出。 指定搜尋作業中每個向量查詢的相對權數。 |
2024 年 7 月
Item | 類型 | 描述 |
---|---|---|
以聊天方式處理您的資料 | 加速器 | 在 Azure 中執行的 RAG 模式解決方案加速器,使用 Azure AI 搜尋來擷取,和 Azure OpenAI 大型語言模型來建立交談搜尋體驗。 具有範例資料的程式碼可用於使用案例,例如財務顧問和合約檢閱和摘要。 |
交談知識採礦 | 加速器 | 以 Azure AI 搜尋、Azure 語音和 Azure OpenAI 服務為基礎的解決方案加速器,可讓客戶從連絡中心交談後擷取可採取動作的深入解析。 |
建置您自己的副手 | 加速器 | 建立您自己的自訂副手解決方案,讓 Client Advisor 能夠跨結構化和非結構化資料運用生成式 AI 的強大功能。 協助我們的客戶將日常工作最佳化,並培養與更多用戶端更好的互動。 |
2024 年 6 月
Item | 類型 | 描述 |
---|---|---|
Azure 入口網站中的影像搜尋 | 功能 | 搜尋總管現在支援影像搜尋。 您可以在具有向量化影像內容的向量索引中,將影像放入搜尋總管中,以查詢相符項目。 |
2024 年 5 月
Item | 類型 | 描述 |
---|---|---|
每個階層更高的容量和更多向量配額 (相同帳單費率) | 基礎結構 | 對於大部分區域而言,標準 2 (S2)、標準 3 (S3) 和標準 3 高密度 (S3 HD) 的分割區大小現在更大了,適用於 2024 年 4 月 3 日後建立的服務。 若要取得較大的分割區,請在提供較新基礎結構的區域中建立新的服務。 儲存體最佳化階層 (L1 和 L2) 也有更多容量。 L1 和 L2 客戶必須建立新的服務以受益於更高的容量。 目前沒有就地升級。 現在,更多區域有額外的容量可用:德國北部、德國中西部、南非北部、瑞士西部,以及 Azure Government (德州、亞利桑那州和維吉尼亞州)。 |
OneLake 整合 (預覽) | 功能 | OneLake 檔案和 OneLake 捷徑的新索引子。 如果使用 Microsoft Fabric 和 OneLake 存取 Amazon Web Services (AWS) 和 Google 資料來源的資料,請使用此索引子以將外部資料匯入至搜尋索引。 此索引子可透過 Azure 入口網站、2024-05-01-preview REST API (部分機器翻譯) 和 Azure SDK 搶鮮版 (Beta) 套件取得。 |
向量相關性 混合式查詢相關性 |
功能 | 四個增強功能可改善向量和混合式搜尋相關性。 首先,您現在可以設定向量搜尋結果的閾值,以排除低評分結果。 其次,查詢架構中的變更會在每個查詢類型的查詢管線結尾套用評分設定檔。 文件提升是常見的評分設定檔,現在可在向量和混合式查詢上如預期般運作。 第三,您可以在混合式查詢中設定 MaxTextRecallSize 和 countAndFacetMode ,以控制流入混合式排名模型的 BM25 排名搜尋結果數量。 第四,針對向量和混合式搜尋,您可以加權向量查詢,以提升或減少其在多重查詢要求中的重要性。 |
二進位向量支援 | 功能 | Collection(Edm.Byte) 是新支援的資料類型。 此資料類型可允許與 Cohere v3 二進位內嵌模型與自訂二進位量化整合。 縮小資料類型可降低大型向量資料集的成本。 如需詳細資訊,請參閱向量搜尋的索引二進位資料。 |
Azure AI 視覺多模式內嵌技能 (預覽) | 技能 | 繫結至 Azure 視覺多模式內嵌 API 的新技能。 您可以在編制索引期間產生文字或影像的內嵌。 此技能可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。 |
Azure AI 視覺向量化工具 (預覽) | 向量化工具 | 新的向量化工具使用多模式內嵌 API 連線至 Azure AI 視覺資源以在查詢時產生內嵌。 此向量化工具可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。 |
Azure AI Studio 模型目錄向量化工具 (預覽) | 向量化工具 | 新的向量化工具會連線至從 Azure AI Studio 模型目錄部署的內嵌模型。 此向量化工具可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。 如何使用 Azure AI Studio 中的模型實作整合向量化。 |
AzureOpenAIEmbedding 技能 (預覽) 支援 Azure OpenAI 上的更多模型 | 技能 | 現在支援 text-embedding-3-large 和 text-embedding-3-small,以及先前更新中的 text-embedding-ada-002。 新的 dimensions 和 modelName 屬性可讓您在 Azure OpenAI 上指定各種內嵌模型。 先前,維度限制已修正為 1,536 個維度,僅適用於 text-embedding-ada-002。 更新的技能可透過 Azure 入口網站和 2024-05-01-preview REST API 取得。 |
Azure 入口網站更新 | 入口網站 | 匯入和向量化資料精靈現在支援 OneLake 索引器做為資料來源。 針對內嵌,其也支援連線到 Azure AI 視覺多模式、Azure AI Studio 模型目錄,以及更多在 Azure OpenAI 上的內嵌模型。 將欄位新增至索引時,您可以選擇二進位資料類型。 搜尋總管現在預設為 2024-05-01-preview,並支援向量和混合式查詢的新預覽功能。 |
2024-05-01-preview | API | 搜尋 REST API 的新預覽版本提供新的技能與向量化工具、新的二進位資料類型、OneLake 檔案索引子,以及新的查詢參數,以取得更多相關結果。 如果已根據 2023-07-01-preview 撰寫現有程式碼且必須移轉至此版本,請參閱升級 REST API。 |
Azure SDK Beta 套件 | API | 檢閱下列 Azure SDK 搶鮮版 (Beta) 套件的變更記錄以了解新的功能支援:適用於 Python 的 Azure SDK、適用於 .NET 的 Azure SDK、適用於 Java 的 Azure SDK |
Python 程式碼範例 | 範例 | 新的端對端範例示範與 Cohere Embed v3 的整合、與 Google 和 AWS 上的 OneLake 和雲端資料平台整合,以及與 Azure AI 視覺多模式 API 整合。 |
2024 年 4 月
Item | 類型 | 描述 |
---|---|---|
安全性更新解決資訊洩漏 | API | GET 回應不再傳回連接字串或金鑰。 適用於 GET Skillset、GET Index 和 GET Indexer。 此變更可協助保護與 AI 搜尋整合的 Azure 資產免於未經授權的存取。 |
基本和標準層的更多儲存體 | 基礎結構 | 基本層現在支援最多三個分割區和三個複本。 基本和標準 (S1、S2、S3) 層每個分割區都明顯增加,每個分割區的費率相同。 額外的容量受限於區域可用性,並適用於 2024 年 4 月 3 日後建立的新搜尋服務。 目前沒有就地升級,因此您必須建立新的搜尋服務以取得額外的儲存體。 |
更多向量配額 | 基礎結構 | 所選區域在 2024 年 4 月 3 日後所建立新服務的向量配額也會較高。 |
向量量化、縮小向量資料類型和新 stored 屬性 (預覽) |
功能 | 這三個功能會共同新增向量壓縮及更智慧的儲存體選項。 首先,純量量化可減少記憶體和磁碟的向量索引大小。 其次,縮小資料類型可透過儲存較小的值以減少每個欄位的儲存體。 第三,您可以使用 stored 以選擇退出儲存僅用於搜尋結果的向量額外複本。 如果您不需要查詢回應中的向量,您可以將 stored 設定為 False 以節省空間。 |
2024-03-01-preview 搜尋 REST API | API | 新預覽版本的搜尋 REST API 提供新的資料類型、向量壓縮屬性和向量儲存體選項。 |
2024-03-01-preview 管理 REST API | API | 新預覽版本的管理 REST API 提供控制平面作業。 |
2023-07-01-preview 淘汰公告 | API | 2024 年 4 月 8 日已公告淘汰。 其在 2024 年 7 月 8 日會變成不支援。 這是第一個支援向量搜尋的 REST API。 較新的 API 版本有不同的向量設定。 您應該盡快移轉至較新版本。 |
2024 年 2 月
Item | 類型 | 描述 |
---|---|---|
新維度限制 | 功能 | 針對向量欄位,維度限制的上限已從 2048 提升至 3072 。 |
2023 公告
Month | 類型 | 公告 \(英文\) |
---|---|---|
11 月 | 功能 | 向量搜尋,已正式推出。 現已解除先前對客戶自控金鑰 (CMK) 的限制。 預先篩選 (部分機器翻譯) 和詳盡的 K 最近鄰項目演算法 (部分機器翻譯) 現已正式推出。 |
11 月 | 功能 | 語意排名工具,已正式推出 (部分機器翻譯) |
11 月 | 功能 | 整合向量化 (預覽) 在編製索引期間新增資料區塊化和文字到向量轉換,並在查詢期間新增文字到向量轉換。 |
11 月 | 功能 | 匯入和向量化資料精靈 (預覽) 自動化資料區塊和向量化。 其是以 2023-10-01-Preview (部分機器翻譯) REST API 為目標。 |
11 月 | 功能 | 索引投影 (預覽) 定義用於一對多索引模式的次要索引形狀,其中來自擴充管線的內容可將多個索引設為目標。 |
11 月 | API | 2023-11-01 搜尋 REST API 是穩定版本的搜尋 REST API,提供向量搜尋和語意排名。 請參閱升級 REST API (部分機器翻譯),以取得正式發行功能的移轉步驟。 |
11 月 | API | 2023-11-01 管理 REST API 新增啟用或停用語意排名工具的 API。 |
11 月 | 技能 | Azure OpenAI 內嵌技能 (概觀) 連線到 Azure OpenAI 資源上已部署的內嵌模型,以在技能執行期間產生內嵌。 |
11 月 | 技能 | 文字分割技能 (預覽) 已在 2023-10-01-Preview 中更新,以支援原生資料區塊化。 |
11 月 | 影片 | 向量搜尋和語意排名如何改善您的 GPT 提示說明混合式擷取如何為您提供最佳的基礎資料,以產生有用的 AI 回應,並實現使用概念和關鍵字進行搜尋。 |
11 月 | 範例 | 生成式 AI 應用程式中的角色型存取控制說明如何使用 Microsoft Entra ID 和 Microsoft Graph API,以針對索引中的區塊化內容推出細微的使用者權限。 |
10 月 | 範例 | 「使用您的資料聊天」解決方案加速器。 使用 Azure AI 搜尋服務作為擷取器的端對端 RAG 模式。 這提供索引編制、資料區塊化和協調流程。 |
10 月 | 功能 | 詳盡的 K 最近鄰項目 (KNN) 評分演算法,用於在向量空間中進行相似度搜尋。 僅適用於 2023-10-01-Preview REST API。 |
10 月 | 功能 | 向量搜尋中的預先篩選會在查詢執行之前評估篩選準則,減少需要搜尋的內容量。 僅適用於 2023-10-01-Preview REST API,其是透過查詢上的新 vectorFilterMode 屬性提供,並可根據您的需求設定為 preFilter (預設值) 或 postFilter 。 |
10 月 | API | 2023-10-01-Preview 搜尋 REST API,中斷性變更向量欄位和向量查詢的定義。 |
8 月 | 功能 | 增強式語意排名 (部分機器翻譯)。 已升級的模型正在針對語意重新排名推出,且可用性會延伸到更多區域。 唯一語彙基元計數上限從 128 個倍增至 256 個。 |
7 月 | 範例 | 向量示範 (適用於 JavaScript 的 Azure SDK) (英文)。 使用 Node.js 和 @azure/search-documents 12.0.0-beta.2 程式庫來產生內嵌、建立及載入索引,以及執行數個向量查詢。 |
7 月 | 範例 | 向量示範 (適用於 .NET 的 Azure SDK) (英文)。 使用 Azure.Search.Documents 11.5.0-beta.3 程式庫來產生內嵌、建立及載入索引,以及執行數個向量查詢。 您也可以嘗試 Azure SDK 小組提供的這個範例 (英文)。 |
7 月 | 範例 | 向量示範 (適用於 Python 的 Azure SDK) 使用 azure.search.documents 的最新搶鮮版 (Beta) 版本來產生內嵌、建立及載入索引,以及執行數個向量查詢。 請瀏覽 azure-search-vector-samples/demo-python (英文) 存放庫以取得更多向量搜尋示範。 |
6 月 | 功能 | 向量搜尋公開預覽 (部分機器翻譯)。 |
6 月 | 功能 | 語意搜尋可用性現已在基本層上提供。 |
6 月 | API | 2023-07-01-Preview 搜尋 REST API。 支援向量搜尋。 |
五月 | 功能 | Azure RBAC (角色型存取控制,已正式推出)。 |
五月 | API | 2022-09-01 管理 REST API,支援設定搜尋以使用 Azure 角色。 Azure PowerShell 的 Az.Search 模組和 Azure CLI 的 Az search 模組已更新,以支援搜尋服務驗證選項。 您也可以使用 Terraform 提供者 (英文) 來設定驗證選項 (請參閱此 Terraform 快速入門 (部分機器翻譯) 來取得詳細資料)。 |
四月 | 範例 | 針對商務持續性和災害復原的 Azure AI 搜尋服務多區域部署 (英文)。 完整設定 Azure AI 搜尋服務之多區域解決方案的部署指令碼,其具備在端點失敗時同步處理內容和要求重新導向的選項。 |
三月 | 範例 | 搭配 Azure OpenAI 和 Azure AI 搜尋服務使用 ChatGPT + 企業資料 (GitHub) (英文)。 Python 程式碼和範本,可結合 Azure AI 搜尋服務與 OpenAI 中的大型語言模型。 如需背景,請參閱此技術社群部落格文章:透過 ChatGPT 徹底改變您的企業資料 (英文)。 重點︰ 使用 Azure AI 搜尋服務來合併可搜尋內容並對其進行索引編製。 查詢索引以取得初始搜尋結果。 從那些結果組合提示,並傳送至 Azure OpenAI 中的 gpt-35-turbo (預覽) 模型。 傳回跨文件答案,並在客戶面向的應用程式中提供引文和透明度,讓使用者可以評估回應。 |
過往年度的公告
服務重新命名
此服務多年來具有多個名稱。 在此以反向的時間順序列出這些名稱:
- Azure AI 搜尋服務 (2023 年 11 月) 已重新命名,以符合 Azure AI 服務和客戶預期。
- Azure 認知搜尋 (2019 年 10 月) 已重新命名以反映其在服務作業中擴大了認知技能和 AI 處理的使用量 (但為選擇性)。
- Azure 搜尋服務 (2015 年 3 月) 原始名稱。
服務更新
您可以在 Azure 網站中找到 Azure AI 搜尋服務的服務更新公告。
功能重新命名
語意搜尋已於 2023 年 11 月重新命名為語意排名工具 (部分機器翻譯) 以更清楚地描述該功能,因為其能提供現有結果集的 L2 排名。