你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是文档智能工作室?

此内容适用于:选中标记v4.0(预览版) | 先前版本:蓝色复选标记v3.1 (GA)蓝色复选标记v3.0 (GA)

文档智能工作室是一种联机工具,用于直观地浏览、了解和训练文档智能服务的功能,并将其能集成到应用程序中。 工作室提供了一个用于试验不同文档智能模型的平台,并且能够以交互方式对返回的数据进行采样,而无需编写代码。 使用文档智能工作室可以:

  • 详细了解文档智能中的不同功能。
  • 使用文档智能资源测试示例文档的模型或上传自己的文档。
  • 试验不同的加载项和预览功能,以根据需要调整输出。
  • 训练自定义分类模型以对文档进行分类。
  • 训练自定义提取模型以从文档中提取字段。
  • 获取要集成到应用程序中的语言特定 SDKs 的示例代码。

工作室支持文档智能 v3.0 及更高版本的 API 版本,以便进行模型分析和自定义模型训练。 支持以前训练的带有标记数据的 v2.1 模型,但不支持 v2.1 模型训练。 有关从 v2.1 迁移到 v3.0 的详细信息,请参阅 REST API 迁移指南

开始使用

  1. 要使用文档智能工作室,需要以下资产:

    • Azure 订阅 - 免费创建订阅。

    • Azure AI 服务或文档智能资源。 获得 Azure 订阅后,在 Azure 门户中创建单服务多服务资源以获取密钥和终结点。 使用免费定价层 (F0) 试用该服务,稍后升级到用于生产的付费层。

授权策略

组织可以选择禁用本地身份验证,并对 Azure AI 文档智能资源和 Azure Blob 存储强制实施 Microsoft Entra(以前称为 Azure Active Directory)身份验证。

重要

在设置 Entra 身份验证时,请确保你具有认知服务用户角色,而不是认知服务参与者角色。 在 Azure 概念中,参与者角色只能执行操作来控制和管理资源本身,包括列出访问密钥。 能够访问文档智能服务的任何具有“参与者”角色的用户帐户都使用访问密钥调用。 但是,使用 Entra ID 设置访问权限时,将禁用密钥访问,并且帐户必须具有认知服务用户角色才能使用资源。

身份验证

导航到“文档智能工作室”。 如果是首次登录,将显示一个弹出窗口,提示你配置服务资源。 根据组织的策略,可以使用一个或两个选项:

  • Microsoft Entra 身份验证:按资源授予访问权限(建议)

    • 选择现有订阅。

    • 选择订阅中的现有资源组或创建新资源组。

    • 选择现有的文档智能或 Azure AI 服务资源。

      在文档智能工作室中配置服务资源表单的屏幕截图。

  • 本地身份验证:按 API 终结点和密钥授予访问权限

    • 从 Azure 门户检索终结点和密钥。

    • 转到资源的概述页,从左侧导航栏中选择“密钥和终结点”。

    • 在适当的字段中输入值。

      Azure 门户中的密钥和终结点页面的屏幕截图。

试用文档智能模型

  1. 完成资源配置后,可以试用文档智能工作室提供的不同模型。 在首页中选择任何文档智能模型以尝试使用无代码方法。

  2. 要测试任何文档分析或预生成模型,请选择模型并使用一个示例文档或上传自己的文档进行分析。 分析结果显示在“内容”-“结果”-“代码”窗口的右侧。

  3. 需要在文档中训练自定义模型。 有关自定义模型的概述,请参阅自定义模型概述

  4. 在文档智能工作室中验证方案之后,请使用 C#JavaJavaScriptPython 客户端库或 REST API 开始将文档智能模型合并到自己的应用程序中。

若要详细了解每种模型,请参阅概念页面

查看资源详细信息

要查看资源详细信息(如名称和定价层),请选择文档智能工作室主页右上角的“设置”图标,然后选择“资源”选项卡。如果有权访问其他资源,也可以切换资源。

工作室设置页面资源选项卡的屏幕截图。

使用文档智能,可以快速自动处理应用程序和工作流中的数据,轻松增强数据驱动的策略,并娴熟地扩充文档搜索功能。

后续步骤