你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

视觉 API 服务类型

项目
06/02/2023

适用于视觉的 Azure 认知服务是认知服务中最广泛的类别之一。即使你对机器学习的了解有限，也可以使用 API 将图像分析、人脸检测、空间分析和光学字符识别 (OCR) 等视觉功能整合到你的应用程序中。

服务

下面是一些广泛的视觉 API 类别：

计算机视觉提供高级算法，这些算法根据你感兴趣的视觉功能处理图像并返回信息。它提供以下四项服务：OCR、人脸服务、图像分析和空间分析。表单识别器是 OCR 的高级版本。
自定义视觉是一种图像识别服务，可用于构建、部署和改进你自己的图像标识符模型。
人脸服务提供检测、识别和分析图像中人脸的 AI 算法。

如何选择服务

以下流程图可帮助你为特定用例选择视觉服务：

常见用例

计算机视觉
- 描述图像。 分析图像、评估检测到的对象，并生成可人工读取的短语或句子来描述图像。
- 标记视觉特征。 应用基于数千个可识别对象的标记。
- 对图像进行分类。 根据图像内容对图像进行分类。
- 实现 OCR。 检测图像中的打印文本和手写文本。
- 检测图像类型。 例如，识别剪贴画图像或线条图。
- 检测配色方案。 识别图像中的主导前景色、背景色以及主导色和主题色。
- 生成缩略图。 创建小型图像版本。
- 审查内容。 检测包含成人内容或描绘血腥场面的图像。
- 检测特定于域的内容。 使用两种专用域模型：
  - 名人。 识别来自体育、娱乐和商业领域的数千位名人。
  - 地标。 识别著名地标，例如泰姬陵和自由女神像。
- 检测物体。 识别常见对象并返回范围框的坐标。
- 检测品牌。 从包含数千个全球知名产品徽标的现有数据库中识别徽标。
- 检测人脸。 检测和分析图像中的人脸。可以确定主体的年龄，并返回一个范围框来指定人脸的位置。计算机视觉服务的人脸分析功能是专业人脸服务的一部分。
自定义视觉
- 对图像进行分类。 根据一组称为特征的输入来预测类别或类。计算每个可能类的概率分数，并返回一个标签来指示对象最有可能属于的类。若要使用此模型，需要包含特征及其标签的数据。
- 检测物体。 获取图像中对象的坐标。若要使用此模型，需要包含特征及其标签的数据。
人脸服务
- 检测人脸。 识别包含人脸的图像区域，通常通过返回范围框坐标来形成以人脸为中心的矩形。
- 分析人脸。 返回信息，例如面部特征（鼻子、眼睛、眉毛、嘴唇等）。可以使用这些面部特征来训练机器学习模型，该模型可以推断人员的相关信息，例如感知到的年龄或情绪状态。
- 识别人脸。 训练机器学习模型，以从面部特征中识别已知个体。

作者

本文由 Microsoft 维护，它最初是由以下贡献者撰写的。

主要作者：

Ashish Chahuan | 高级云解决方案架构师
Kruti Mehta | Azure 高级 Fast-Track 工程师

其他参与者：

Mick Alberts | 技术文档撰写人
Brandon Cowen | 高级云解决方案架构师
Oscar Shimabukuro | 高级云解决方案架构师
Manjit Singh | 软件工程师
Christina Skarpathiotaki |高级云解决方案架构师
Nathan Widdup | Azure 高级 Fast-Track 工程师

若要查看非公开的 LinkedIn 个人资料，请登录到 LinkedIn。

通过

视觉 API 服务类型

服务

如何选择服务

常见用例

作者

后续步骤

反馈

反馈

其他资源

通过

视觉 API 服务类型

服务

如何选择服务

常见用例

作者

后续步骤

相关资源

反馈

反馈

其他资源