你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Azure AI 搜索中的集成矢量嵌入

集成矢量化是 Azure AI 搜索中索引和查询管道的扩展。它添加了以下功能：

索引器驱动索引编制期间的矢量编码
查询期间的矢量编码

数据分块不是硬性要求，但除非原始文档较小，否则需要分块以满足嵌入模型的令牌输入要求。

矢量转换是单向的：非向量到向量。例如，查询或结果没有向量到文本转换，例如将向量结果转换为人工可读字符串，这就是为什么索引包含向量字段和非函数字段的原因。

集成向量化可加快开发速度，并在数据引入和查询时间期间最大程度地减少维护任务，因为必须手动实现的作更少。

在索引编制期间使用集成矢量化

对于集成的数据分块和矢量转换，你依赖于以下组件：

索引器，从支持的数据源检索原始数据并驱动管道引擎。
用于接收分块和矢量化内容的搜索索引。
技能组，配置用于：
- 分块策略：文本拆分技能、文档布局技能、 Azure 内容理解技能或文档分析模式之一。
- 一种嵌入技能，用于生成矢量数组，可以是以下任何一种：
  - AzureOpenAIEmbedding 技能，附加到 Azure OpenAI 上的 text-embedding-ada-002、text-embedding-3-small、text-embedding-3-large。
  - 自定义技能，指向 Azure 或另一个站点上的另一个嵌入模型。
  - Azure 视觉多模式嵌入技能（预览版），指向适用于 Azure 视觉的多模式 API。
  - 指向 Microsoft Foundry 模型目录中特选模型的 AML 技能。

在查询中使用集成矢量化

在查询期间进行文本到矢量的转换时，需要依赖以下组件：

一个指定一个或多个矢量字段的查询。
在查询时转换为矢量的文本字符串。

矢量化器，在索引架构中定义，已分配到矢量字段，在查询时自动用来将文本查询转换为矢量。设置的矢量化器必须与用于对内容进行编码的嵌入模型匹配。

嵌入技能	矢量化器
AzureOpenAIEmbedding 技能	Azure OpenAI 矢量器
自定义技能	自定义 Web API 矢量器
Azure 视觉多模式嵌入技能（预览版）	Azure 视觉向量器
指向 Foundry 门户中的模型目录的 AML 技能	Microsoft Foundry 模型目录向量器

组件图

下图显示了集成矢量化的组件。

工作流是一个索引器管道。索引器从支持的数据源检索数据，并通过调用 Azure OpenAI 或 Foundry 工具或自定义代码进行文本到矢量转换或其他处理来启动数据扩充（或应用 AI）。

此图重点介绍集成矢量化，但你的解决方案并不局限于此列表。可以添加其他 AI 扩充技能、创建知识存储、添加语义排名、添加相关性优化和其他查询功能。

可用性和定价

集成矢量化在所有区域和层中都可用。但是，如果使用技能和向量器进行 AI 扩充，则区域要求可能适用。有关详细信息，请参阅将 Foundry 资源附加到技能集。

如果使用的是自定义技能和 Azure 托管机制（例如 Azure 函数应用、Azure Web 应用和 Azure Kubernetes），请查看“Azure 产品（按区域）”页来了解功能可用性。

数据分块（文本拆分技能）是免费的，可在所有区域中的所有 Foundry 工具上使用。

注意

在 2019 年 1 月 1 日之前创建的一些较旧搜索服务部署在不支持矢量工作负载的基础结构上。如果你在尝试将矢量字段添加到架构时收到错误，则原因是服务已过时。在这种情况下，必须创建新的搜索服务来试用矢量功能。

集成矢量化支持哪些方案？

将大型文档划分为区块，这对于矢量和非矢量方案很有用。对于矢量方案，块可帮助你满足嵌入模型的输入约束。对于非矢量方案，可以使用一个聊天式搜索应用，其中的 GPT 从编制了索引的区块中组合响应。可以使用矢量化区块或非矢量化区块进行聊天式搜索。
生成一个矢量存储，其中的所有字段都是矢量字段，只有文档 ID（搜索索引所需）是字符串字段。查询矢量存储以检索文档 ID，然后将文档的向量字段发送到另一个模型。
组合矢量和文本字段来执行提供或不提供语义排名的混合搜索。集成矢量化简化了矢量搜索支持的所有方案。

如何使用集成矢量化

对于仅限查询的矢量化：

将一个矢量化器添加到索引。它应该与用于在索引中生成矢量的嵌入模型相同。
将矢量器分配给矢量配置文件，然后将矢量配置文件分配给矢量字段。
构建矢量查询，用于指定要矢量化的文本字符串。

更常见的方案 - 在索引编制期间进行数据分块和矢量化：

与支持的数据源建立数据源连接，以进行基于索引器的索引编制。
创建一个技能集，用于调用文本拆分技能进行分块和 Azure OpenAI 嵌入或其他嵌入技能来向量化区块。
创建一个索引用于指定查询时间的矢量化器，并将其分配到矢量字段。
创建一个索引器以驱动从数据检索到技能组执行，再到索引编制的整个流程。我们建议按计划运行索引器，以选取已更改的文档或由于限制而遗漏的任何文档。

（可选）对于分块内容位于一个索引中但非分块内容位于另一个索引中的高级方案，请创建辅助索引。分块索引（或次要索引）对于 RAG 应用非常有用。

提示

在编写任何代码之前，请尝试在 Azure 门户中的“导入数据向导”浏览集成向量化。

与向量器和模型的安全连接

如果你的体系结构需要绕过 Internet 的专用连接，则可以创建一个共享专用链接连接，连接到技能在查询时建立索引和矢量化期间使用的嵌入模型。

共享专用链接仅适用于 Azure 到 Azure 连接。如果你要连接到 OpenAI 或其他外部模型，则必须通过公共 Internet 进行连接。

对于矢量化方案，可以使用：

openai_account，作为在 Azure OpenAI 资源上托管的嵌入模型。
sites，作为自定义技能或自定义矢量化器访问的嵌入模型。 sites 组 ID 适用于应用服务和 Azure 函数，可用于托管不是 Azure OpenAI 嵌入模型之一的嵌入模型。

优点

下面是集成矢量化的一些重要优势：

没有单独的数据分块和矢量化管道。代码更易于编写和维护。
自动进行端到端索引编制。当源（例如 Azure 存储、Azure SQL 或 Cosmos DB）中的数据发生更改时，索引器可以在整个管道中传递这些更新（从检索到文档破解，再到可选的 AI 扩充、数据分块、矢量化和索引编制）。
批处理和重试逻辑是内置的（不可配置的）。 Azure AI 搜索具有内部重试策略，用于限制因 Azure OpenAI 终结点嵌入模型的令牌配额达到最大值而出现的错误。我们建议对索引器设定计划（例如每 5 分钟），以便索引器可以处理 Azure OpenAI 终结点限制的任何调用，而不管重试策略如何。
将分块的内容投影到次要索引。次要索引的创建方式与创建任何搜索索引（包含字段和其他构造的架构）一样，但索引器会将它们与主要索引一起填充。在同一索引编制运行期间，每个源文档的内容都会流向主要和次要索引中的字段。

辅助索引旨在用于问答或聊天样式应用。辅助索引包含更具体的匹配项的精细信息，但父索引包含更多信息，并且通常可以生成更完整的答案。在辅助索引中找到匹配项后，查询会从主索引返回父文档。例如，假设将一个大型 PDF 文件用作源文档，则主索引可能包含基本信息（标题、日期、作者、描述），而辅助索引则包含可搜索的内容块。

限制

确保了解嵌入模型的 Azure OpenAI 配额和限制。 Azure AI 搜索具有重试策略，但如果配额耗尽，重试会失败。

Azure OpenAI 每分钟令牌数限制是按模型、按订阅计算的。如果对查询和索引编制工作负载使用嵌入模型，请记住这一点。在可能的情况下遵循最佳做法。为每个工作负载提供一个嵌入模型，并尝试将其部署在不同的订阅中。

请记住，在 Azure AI 搜索中，存在按层和按工作负载规定的服务限制。

后续步骤

反馈

此页面是否有帮助？

Last updated on 2026-01-23