你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

从 Azure 内容理解预览版迁移到正式版 (GA)

内容理解 GA API 引入了多个新功能,并更新了早期预览版 API 版本中启动的功能。 “新增功能”页面概述了 2025-11-01 内容理解 GA API 版本中的所有更改。 本文档重点介绍了使用其中一个预览 API 版本生成的分析器和应用程序所需的更改,以便迁移(2024-12-01 preview2025-05-01 preview

先决条件

  • 为内容理解资源设置默认模型部署。 默认设置将创建与用于内容理解请求的 Foundry 模型的连接。 选择下列方法之一:
    1. 转到 “内容理解设置”页
    2. 选择左上角的“+ 添加资源”按钮
    3. 选择要使用的 Foundry 资源,然后单击“下一步”,然后单击“保存”
      • 选中“如果没有可用的默认值,请确保为所需模型启用自动部署”。 确保资源已用所需的 GPT-4.1、GPT-4.1-mini 和 text-embedding-3-large 型模进行完整设置。 不同的预生成分析器需要不同的模型。
    通过执行这些步骤,可以在 Foundry 资源中设置内容理解模型和 Foundry 模型之间的连接。

更新分析器

若要更新现有分析器,建议的方法是遵循这三个步骤进行更新。

步骤 1 - 获取分析器定义

通过调用 GET /analyzers/{analyzer name}/ 获取分析器定义

如果使用 API 创建 2025-05-01-preview 分析器定义,则分析器定义可能如下所示。

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-documentSearch",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/},
}

步骤 2 - 对分析器进行更改以面向 GA API

为了使分析器可以与 GA API 一起工作,需要进行以下更改。

  1. 添加或更新 BaseAnalyzerID 属性以包含在分析器定义的顶层,并设置为四个受支持的值之一,即prebuilt-documentprebuilt-audioprebuilt-videoprebuilt-image 选择与计划使用此分析器处理的文件对应的文件。 Scenario预览版中的属性已弃用并替换为 baseAnalyzerId

  2. 添加一个模型对象,并指定了完成和嵌入模型。 此对象指定此分析器使用的默认生成模型。

例如,步骤 1 中的架构将更新为:

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    /*...*/
  },
  "fieldSchema": {/*...*/},
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

小窍门

若要与预览行为类似地最大化,请使用 GPT-4o 2024-08-06 生成式部署。 对于新分析器,GPT-4.1 是内容理解的建议模型。

步骤 3 - 创建新的分析器

可以使用更新的定义创建新的分析器。 使用更新后的定义调用 PUT /analyzers/{analyzer name}_updated/。 需要删除现有分析器以重复使用该名称。

要考虑的其他 API 更改

  1. 内容分类器和视频分段现在合并到内容分析器中。 若要对内容进行分段和分类,请使用 contentCategories 分析器的属性。 有关如何分类或分类和分析的指导,请参阅 生成 RPA 解决方案视频分段

  2. 置信度和接地现在是字段的可选属性。 默认字段定义不返回置信度和基础,若要添加置信度和基础,请将 estimateFieldSourceAndConfidence 设置为 true。 此行为与 2025-05-01-preview API 保持不变。

  3. 简化了请求以获取分析结果的特定组件。 使用 API 调用获取嵌入的图像或内容。

GET /analyzerResults/{operationId}/files/{path}

path可在此处包括:

  • contents/{contentIndex}/pages/{pageNumber} - DocumentContent.pages[*].pageNumber
  • contents/{contentIndex}/figures/{figureId} - DocumentContent.figures[*].id
  1. “分析”作现在仅支持按 URL 分析文件。 使用新的 analyzeBinary 操作,将文件作为 base64 编码字符串上传到请求正文中。 如果以前在代码中使用 analyze 操作内联上传文件,则需要更新代码以改用 analyzeBinary 操作。 详细了解 分析二进制操作

  2. Analyze 操作的 JSON 负载架构已更新,添加了包含要分析文件信息的输入数组。 每个输入元素都包含指向文件的 URL 指针。 详细了解 分析操作

注释

输入数组仅支持版本中的 2025-11-01 单个项。

下面是 PUT /analyzers/{analyzerName} 更新的架构示例


{
      "inputs":[
      {
        "url": "https://documentintelligence.ai.azure.com/documents/samples/read/read-healthcare.png" /*This is the file to be analyzed*/
      }
      ]
}
  1. 如果您使用上下文学习或标记数据,现在定义标记数据集的 API 负载已更新,以将标记的数据指定为knowledgeSources类型。 有关详细信息,请参阅 knowledgeSources ,详细了解如何定义分析器以使用标记的数据。

  2. 对于视频形式分析器,关键帧现在作为数组 keyFrames返回。 详细了解 分析器响应

新增功能

  1. 字段提取方法现在是可选的。 如果未设置,分析器将确定方法(提取或生成)。 最佳做法是不要将方法属性添加到分析器,并且仅当需要逐字提取值时设置要提取的方法。
  2. 添加了对在文档分析器中生成的方法集的字段的置信度分数和源基础的支持。
  3. 每个分析器将字段限制增加到 1,000 个字段。
  4. 分类/分段最多支持 200 个不同的文档类型。

已弃用的功能

  1. Pro 模式不是 GA API 的一部分。 此功能仍是实验性的。 因此,AnalysisMode 被弃用,而在 GA API 中,只有标准模式得到了支持。
  2. 人员目录和人脸 API 不属于 GA API。 这包括用于检测和识别视频中人脸的视频分析器功能。
  3. TrainingData 已被弃用并替换为 knowledgeSources

后续步骤