你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
了解 Azure AI 搜索的功能、文档和示例的最新更新。
注意
预览功能在此处公布,但我们还会维护预览功能列表,以便你可以在一个位置找到这些功能。
2025年5月
项 | 类型 | 描述 |
---|---|---|
代理检索(预览版) | 查询 | 创建由大型语言模型(LLM)和专有数据提供支持的对话搜索体验。 能动检索将复杂的用户查询分解为子查询,并行执行子查询,并从 Azure AI 搜索所索引的文档中提取基础数据。 输出适用于代理和自定义聊天解决方案。 此预览版中引入了新的 知识代理 对象。 其 响应有效负载 专为下游代理和聊天模型使用而设计,查询计划和参考数据完全透明。 若要开始在门户中使用,请参阅快速入门:代理检索。 |
多维函数支持(预览版) | 索引 | 为单个文档字段中的多个子向量编制索引。 现在可以在复杂集合的嵌套字段中使用矢量类型,从而有效地允许多个向量与单个文档相关联。 |
使用语义排名的评分配置文件(预览版) | 相关性 | 语义排名器会添加新字段, @search.rerankerBoostedScore 以帮助保持一致的相关性,并更好地控制搜索管道中的最终排名结果。 |
Azure 逻辑应用集成(预览版) | 索引 | 创建使用逻辑应用工作流检索内容的自动索引管道。 使用 Azure 门户中的 导入和矢量化数据向导 基于 Azure 逻辑应用集成生成索引管道。 |
文档级访问控制(预览版) | 安全性 | 将 Azure Data Lake Storage ADLS Gen2 中的 Blob 的文档级权限传递到索引中的可搜索文档。 现在,查询可以根据所选数据源的用户标识筛选结果。 |
多模式搜索(预览版) | 索引,查询 | 引入、理解和检索包含文本和图像的文档,使你能够执行各种形式组合的搜索,例如查询与文本以查找嵌入相关复杂图像中的信息。 请参阅 快速启动:搜索多模式内容 以获取门户向导支持,并查看 Azure AI 搜索多模式 RAG 演示 以获取代码优先方法。 |
GenAI 提示技能(预览版) | 技能 | 使用你提供的提示连接到大型语言模型 (LLM) 以获取信息的新技能。 使用此技能,可以使用 LLM 中的内容填充可搜索字段。 此技能的主要用例是 图像语言化,使用 LLM 描述图像并将说明发送到索引中的可搜索字段。 |
文档布局技能(预览版) | 技能 | 如果使用 2025-05-01-preview API 版本,则可以使用此技能的新参数。 新参数支持图像偏移元数据,从而改善图像搜索体验。 |
导入和矢量化数据向导增强功能 | 门户 | 此向导提供用于创建和填充矢量索引的两个路径: 检索扩充生成(RAG) 和 多模式 RAG。 逻辑应用集成通过 RAG 路径。 |
索引“说明”支持(预览版) | REST | 最新的预览 API 向索引添加说明。 请考虑模型上下文协议 (MCP) 服务器,该服务器必须在运行时选取正确的索引。 决策可以基于说明而不是仅基于索引名称。 说明必须是人可读的,并且字符数必须低于 4000 个字符。 |
2025-05-01-预览版 | REST | 新的数据平面预览 REST API 版本,提供对此版本中宣布的预览功能的编程访问。 |
2025 年 4 月
项 | 类型 | 描述 |
---|---|---|
RAG 时间旅程 | 演示代码 | 使用 Azure AI 搜索的检索扩充生成(RAG)工作流的代码和视频演示。 段包括基础知识、模式和用例、 大规模矢量索引以及使用代理评估结果并生成更好的答案的 代理搜索 。 |
2025 年 3 月
项 | 类型 | 描述 |
---|---|---|
服务升级(预览版) | 服务 | 将搜索服务升级到区域中更高的存储限制。 通过一次性升级,不再需要重新创建服务。 在 升级服务(2025-02-01-preview) 和 Azure 门户中可用。 |
定价层更改(预览版) | 服务 | 更改搜索服务的 定价层 。 这样可以灵活地缩放存储、增加请求吞吐量,并根据需要降低延迟。 在此预览版中,只能在基本层和标准层(S1、S2 和 S3)之间更改。 可在 更新服务(2025-02-01-preview) 和 Azure 门户中使用。 |
分面层次结构、聚合和分面筛选器(预览版) | 查询 | 新的分面查询参数支持嵌套分面。 对于数值可分面字段,可以对每个字段的值求和。 还可以在维度指定筛选器以添加包含或排除条件。 可在 搜索文档(2025-03-01-preview) 和 Azure 门户中使用。 |
使用全精度向量对二进制量化的向量查询重新进行评分(预览版) | 查询 | 对于包含二进制量化的向量索引,可以使用全精度向量查询重新评分查询结果。 查询引擎使用二进制嵌入的点积与矢量查询进行重新评分,从而提高搜索结果的质量。 设置 enableRescoring 和 discardOriginals 来使用此功能,并在请求中调用最新的预览 API 版本。 |
语义排名器预发行版模型(预览版) | 索引 | 如果某个模型恰好在你的区域中可用,请选择使用预发布语义排名器模型。 可在 “创建”或“更新索引”(2025-03-01-preview)中使用。 |
Search Service REST 2025-03-01-preview | REST | 用于数据平面操作的 REST API 公共预览版。 添加了对多向量嵌入、分层分面、分面聚合和分面筛选器的支持。 |
搜索管理 2025-02-01-preview | REST | 针对控制平面操作的 REST API 公开审查发布。 添加了对就地升级到更高容量分区、就地升级到更高层和 Azure 机密计算的支持。 |
2025 年 2 月
项 | 类型 | 描述 |
---|---|---|
对托管 HSM 的客户管理的密钥支持 | 安全性 | 使用 Azure Key Vault 或 Azure Key Vault 托管 HSM(硬件安全模块)存储客户管理的密钥,以额外加密敏感内容。 |
2024 年公告
月份 | 类型 | 公告 |
---|---|---|
12 月 | 模板 | RAG 与 Azure AI 搜索 + Python 聊天。 用于使用 Azure AI 搜索和 Python 生成 RAG 解决方案的 AI 应用程序模板。 |
11 月 | 安全性 | 网络安全边界。 将搜索服务加入网络安全外围,以控制对搜索服务的网络访问。 2024-06-01-preview 中的 Azure 门户和管理 REST API 可用于查看和协调网络安全外围配置。 |
11 月 | 安全性 | Azure AI 服务连接的共享专用链接支持。 现可在连接上使用共享的专用链接,以专用方式连接到 Azure AI 进行内置技能处理。 |
11 月 | 相关性 | 压缩矢量的重新计分选项。 可以设置选项,以使用原始矢量(而不是压缩矢量)重新评分。 适用于使用二进制和标量压缩的 HNSW 和详尽 KNN 矢量算法。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 矢量搜索 | 存储较少的向量实例。 在矢量压缩方案中,如果不需要全精度矢量进行重新评分,则可以省略其存储。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 相关性 | 在语义重排器中查询重写。 可以在语义查询上设置选项,将查询输入重写为经过修订或扩展的查询,以便从 L2 排序器生成更相关的结果。 搜索文档 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 相关性 | 新的语义排名器模型。 语义排序器在所有受支持的区域中与改进的模型一起运行。 API 或 Azure 门户体验没有变化。 |
11 月 | 应用型 AI(技能) | 文档布局技能。 用于分析文档结构的新技能,并提供结构感知(段落)分块。 此技能调用文档智能并使用文档智能布局模型。 在选定区域的创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 应用型 AI(技能) | Azure AI 技能处理的无密钥计费。 现在可以使用托管身份和角色来实现与 Azure AI 服务的无密钥连接,以处理内置技能。 此功能消除了在同一区域中同时提供搜索和 AI 服务的限制。 创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 索引器数据源 | Markdown 分析模式。 使用此分析模式,索引器可以从 Azure 存储和 OneLake 中的 Markdown 文件生成一对一或一对多的搜索文档。 创建或更新索引器 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。 |
11 月 | 应用程序接口 (API) | 2024-11-01-preview。 REST API 预览版,用于查询重写、文档布局技能、技能处理的无密钥计费、Markdown 分析模式和压缩矢量的重新计分选项。 |
11 月 | 功能 | 门户对结构化数据的支持。 “导入和矢量化数据”向导现支持 Azure SQL、Azure Cosmos DB 和 Azure 表存储。 |
10 月 | 功能 | 降低 MRL 训练的文本嵌入模型在 Azure OpenAI 上的维度要求。 Text-embedding-3-small 和 Text-embedding-3-large 是使用套娃表示学习 (MRL) 方法训练的。 这样你就可以将嵌入矢量截成更少的维度,并调整矢量索引大小使用和检索质量之间的平衡。 truncationDimension 中的新增 功能允许在文本嵌入模型中访问 MRL 压缩。 只能为新的矢量字段配置它。 |
10 月 | 功能 | 解压缩 @search.score 以查看混合搜索结果中的子分数。 可以通过查看最终的合并和评分结果中的各个查询子分数来调查倒数排名融合 (RRF) 排名结果。 新的 debug 属性会解压缩搜索分数。 QueryResultDocumentSubscores 、QueryResultDocumentRerankerInput 和 QueryResultDocumentSemanticField 提供额外的详细信息。 2024-09-01-preview 中提供了这些定义。 |
10 月 | 功能 | 将混合搜索中的目标筛选器限定为矢量查询。 混合查询的筛选器涉及请求的所有子查询,无论类型如何。 可以替代全局筛选器,以将筛选器范围限定为特定的子查询。 新的 filterOverride 参数可在使用 2024-09-01-preview 的混合查询中使用。 |
10 月 | 应用型 AI(技能) | 文本拆分技能(标记分块)。 此技能具有新的参数,可改善嵌入模型的数据分块。 新的 unit 参数可让你指定标记分块。 现在可以按标记长度分块,将长度设置为对嵌入模型有意义的值。 还可以指定 tokenizer 以及在数据分块期间不应拆分的任何标记。 新的 unit 参数和查询子分数定义可在 2024-09-01-preview 中找到。 |
10 月 | 应用程序接口 (API) | 2024-09-01-preview。 REST API 预览版,用于 text-embedding-3 模型中的截断维度、混合查询的目标矢量筛选、RRF 子分数详细信息(用于调试)以及文本拆分技能的标记分块。 |
10 月 | 功能 | 门户对客户管理的密钥加密 (CMK) 的支持。 在 Azure 门户中创建新对象时,现在可以指定 CMK 加密并选择一个 Azure Key Vault 来提供密钥。 |
8 月 | 功能 | 调试会话改进。 有两个重要改进。 首先,现在可以调试集成矢量化和数据分块工作负载。 其次,调试会话经过了重新设计,使技能和映射的呈现更简化。 可以选择流中的一个对象,在侧面板中查看或编辑其详细信息。 以前的选项卡布局已完全替换为页面上更多与上下文相关的信息。 |
8 月 | 应用程序接口 (API) | 2024-07-01. REST API 的稳定版本正式发布,用于通用可用的矢量数据类型、矢量压缩以及在索引和查询过程中集成矢量化。 |
8 月 | 功能 | 集成向量化,宣布正式发布。 在索引期间进行由技能驱动的数据分块和嵌入。 |
8 月 | 功能 | Vectorizers。 宣布正式发布。 在查询执行期间进行文本到矢量转换。 Azure OpenAI 矢量器和自定义 Web API 矢量器都已正式发布。 |
8 月 | 功能 | AzureOpenAIEmbedding 技能。 宣布正式发布。 一种技能类型,可在索引编制期间调用 Azure OpenAI 嵌入模型来生成嵌入项。 |
8 月 | 功能 | 索引投影。 宣布正式发布。 技能组定义的组件,用于定义辅助索引的形状,支持一对多索引模式,其中扩充管道中的内容可以面向多个索引。 |
8 月 | 功能 | 二进制和标量量化。 宣布正式发布。 使用内置量化压缩内存和磁盘上的矢量索引大小。 |
8 月 | 功能 | 窄数据类型。 宣布正式发布。 假设传入的数据是该数据类型,在矢量字段上分配较小的数据类型。 |
8 月 | 功能 | 导入和矢量化数据向导。 宣布正式发布。 可创建包括数据分块和矢量化的完整索引管道的向导。 该向导可创建所有必要的对象和配置。 此版本添加了对 Azure 存储中的 Azure Data Lake 的向导支持。 |
8 月 | 功能 | 存储属性。 宣布正式发布。 布尔值,通过不存储可检索矢量来减少矢量索引的存储。 |
8 月 | 功能 | vectorQueries.Weight 属性。 宣布正式发布。 在搜索操作中指定每个矢量查询的相对权重。 |
7 月 | 加速器 | 与数据聊天。 在 Azure 中运行的 RAG 模式的解决方案加速器,使用 Azure AI 搜索进行检索,并使用 Azure OpenAI 大型语言模型来创建对话式搜索体验。 带有示例数据的代码可用于财务顾问、合同审查和汇总等用例场景。 |
7 月 | 加速器 | 对话知识挖掘。 基于 Azure AI 搜索、Azure 语音和 Azure OpenAI 构建的解决方案加速器,使客户能够从联系后中心对话中提取可作的见解。 |
7 月 | 加速器 | 生成你自己的 Copilot。 创建自己的自定义 Copilot 解决方案,使客户顾问能够在结构化和非结构化数据中利用生成 AI 的强大功能。 帮助客户优化日常任务,与更多客户建立更好的互动。 |
6 月 | 功能 | Azure 门户中的图像搜索。 搜索资源管理器现在支持图像搜索。 在包含矢量化图像内容的向量索引中,可以将图像拖放到搜索资源管理器中以查询匹配项。 |
5 月 | 服务限制 | 每个层更高的容量和更多的矢量配额(相同的计费费率)。 对于 2024 年 4 月 3 日之后创建的服务,大多数区域中标准 2 (S2)、标准 3 (S3) 和标准 3 高密度 (S3 HD) 的分区大小现在更大了。 要获取更大的分区,请在提供较新的基础结构的区域中创建新服务。 存储优化层(L1 和 L2)也有了更多容量。 L1 和 L2 客户必须创建新的服务,才能受益于更高的容量。 目前未提供就地升级。 额外容量现已在更多区域提供:德国北部、德国中西部、南非北部、瑞士西部以及 Azure 政府(得克萨斯州、亚利桑那州和弗吉尼亚州)。 |
5 月 | 功能 | OneLake 集成(预览版)。 OneLake 文件和 OneLake 快捷方式的新索引器。 如果使用 Microsoft Fabric 和 OneLake 对 Amazon Web Services (AWS) 和 Google 数据源进行数据访问,请使用此索引器将外部数据导入到搜索索引中。 此索引器可通过 Azure 门户、2024-05-01-preview REST API 和 Azure SDK beta 包获取。 |
5 月 | 功能 | 矢量相关性 混合查询相关性。 四项增强功能可提高矢量和混合搜索相关性。 首先,现在可以对矢量搜索结果设置阈值,排除低评分结果。 其次,查询体系结构中的更改在每个查询类型的查询管道末尾应用计分概要文件。 文档提升是一个常见的计分概要文件,现在它可在矢量和混合查询中按预期工作。 第三,可以在混合查询中设置 MaxTextRecallSize 和 countAndFacetMode ,以控制流入混合排名模型的 BM25 排名搜索结果的数量。 第四,对于矢量和混合搜索,可以加权矢量查询,以便在多查询请求中提升或降低其重要性。 |
5 月 | 功能 | 二进制向量支持。 Collection(Edm.Byte) 是新的受支持的数据类型。 此数据类型将打开与 Cohere v3 二进制嵌入模型 和自定义二进制量化的集成。 缩小数据类型可降低大型矢量数据集的成本。 有关详细信息,请参阅编制二进制数据索引以进行矢量搜索。 |
5 月 | 技能 | Azure AI 视觉多模式嵌入技能(预览版)。 新能力集成于Azure AI Vision的多模态嵌入API。 可以在编制索引期间为文本或图像生成嵌入。 此技能可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 |
5 月 | 矢量化器 | Azure AI 视觉矢量化器(预览版)。 新的矢量化器使用 多模式嵌入 API 连接到 Azure AI 视觉资源,以在查询时生成嵌入。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 |
5 月 | 矢量化器 | Azure AI Foundry 模型目录矢量化器(预览版)。 新的矢量化器可连接到从 Azure AI Foundry 模型目录部署的嵌入模型。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。 如何使用 Azure AI Foundry 中的模型实现集成的矢量化。 |
5 月 | 技能 | AzureOpenAIEmbedding 技能(预览版)支持 Azure OpenAI 上的更多模型。 现在支持 text-embedding-3-large 和 text-embedding-3-small,以及上次更新中的 text-embedding-ada-002。 通过新的 dimensions 和 modelName 属性,可以在 Azure OpenAI 上指定各种嵌入模型。 以前,维度限制固定在 1,536 个维度,仅适用于 text-embedding-ada-002。 更新的技能可通过 Azure 门户和 2024-05-01-preview REST API 获取。 |
5 月 | 门户 | 导入和向量化数据向导现在支持将 OneLake 索引器作为数据源。 对于嵌入,它还支持连接到 Azure AI 视觉多模式、Azure AI Foundry 模型目录,以及 Azure OpenAI 上的其他嵌入模型。 将字段添加到索引时,可以选择二进制数据类型。 搜索资源管理器现在默认为 2024-05-01-preview,并支持向量和混合查询的新预览功能。 |
5 月 | 应用程序接口 (API) | 2024-05-01-preview。 搜索 REST API 的新预览版提供了新的技能和矢量化器、新的二进制数据类型、OneLake 文件索引器、用于获取更相关结果的新查询参数。 如果已有针对 2023-07-01-preview 编写的代码,并且需要迁移到此版本,请参阅升级 REST API。 |
5 月 | 应用程序接口 (API) | Azure SDK beta 包。 查看以下 Azure SDK beta 版包的更改日志,以获取新功能支持:适用于 Python 的 Azure SDK、适用于 .NET 的 Azure SDK、适用于 Java 的 Azure SDK |
5 月 | 示例 | Python 代码示例。 新的端到端示例演示了与 Cohere Embed v3 的集成、与 OneLake 以及 Google 和 AWS 上的云数据平台的集成以及与 Azure AI Vision 多模式 API 的集成。 |
4 月 | 应用程序接口 (API) | 解决信息泄露的安全更新。 GET 响应不再返回连接字符串或密钥。 适用于 GET 技能组、GET 索引和 GET 索引器。 此更改有助于保护与 AI 搜索集成的 Azure 资产免受未经授权的访问。 |
4 月 | 应用程序接口 (API) | 2024-03-01-preview 搜索 REST API |
4 月 | 应用程序接口 (API) | 2024-03-01-preview 管理 REST API |
4 月 | 应用程序接口 (API) | 2023-07-01-preview 弃用公告。 自 2024 年 7 月 8 日起,不再支持此版本。 较新的 API 版本具有不同的矢量配置。 请尽快迁移到较新版本。 |
4 月 | 服务限制 | 基本层和标准层 以相同的每分区计费费率为每个分区提供更多存储。 额外的容量受区域可用性影响,适用于 2024 年 4 月 3 日之后新建的搜索服务。 基本版现在最多支持三个分区和三个副本。 |
4 月 | 服务限制 | 在所选区域 2024 年 4 月 3 日之后创建的新服务上,矢量配额更高。 |
4 月 | 功能 | 矢量量化、窄向量数据类型和新stored 属性(预览版)。 这三个功能共同降低了存储和成本。 |
2 月 | 功能 | 矢量字段的新维度限制。 最大维度限制现在提升到3072 ,而之前为2048 。 |
上一年的公告
服务改造
多年来,此服务有多个名称。 此处为逆时序顺序排列这些名称:
- Azure AI 搜索(2023 年 11 月)已重命名,以符合 Azure AI 服务和客户预期。
- Azure 认知搜索(2019 年 10 月)已重命名,以反映认知技能和 AI 处理在服务操作中更广泛的用途(但仍为可选)。
- Azure 搜索(2015 年 3 月)原始名称。
服务更新
在 Azure 网站上可以找到 Azure AI 搜索的服务更新通告。
功能重命名
2023 年 11 月,语义搜索已更名为语义排序器,以更好地描述现有结果集 L2 排序的功能。