你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

视觉 API 服务类型

适用于视觉的 Azure 认知服务是认知服务中最广泛的类别之一。 即使你对机器学习的了解有限,也可以使用 API 将图像分析、人脸检测、空间分析和光学字符识别 (OCR) 等视觉功能整合到你的应用程序中。

服务

下面是一些广泛的视觉 API 类别:

  • 计算机视觉提供高级算法,这些算法根据你感兴趣的视觉功能处理图像并返回信息。 它提供以下四项服务:OCR、人脸服务、图像分析和空间分析。 表单识别器是 OCR 的高级版本。
  • 自定义视觉是一种图像识别服务,可用于构建、部署和改进你自己的图像标识符模型。
  • 人脸服务提供检测、识别和分析图像中人脸的 AI 算法。

如何选择服务

以下流程图可帮助你为特定用例选择视觉服务:

Diagram that shows how to choose a vision service.

常见用例

  • 计算机视觉

    • 描述图像。 分析图像、评估检测到的对象,并生成可人工读取的短语或句子来描述图像。
    • 标记视觉特征。 应用基于数千个可识别对象的标记。
    • 对图像进行分类。 根据图像内容对图像进行分类。
    • 实现 OCR。 检测图像中的打印文本和手写文本。
    • 检测图像类型。 例如,识别剪贴画图像或线条图。
    • 检测配色方案。 识别图像中的主导前景色、背景色以及主导色和主题色。
    • 生成缩略图。 创建小型图像版本。
    • 审查内容。 检测包含成人内容或描绘血腥场面的图像。
    • 检测特定于域的内容。 使用两种专用域模型:
      • 名人。 识别来自体育、娱乐和商业领域的数千位名人。
      • 地标。 识别著名地标,例如泰姬陵和自由女神像。
    • 检测物体。 识别常见对象并返回范围框的坐标。
    • 检测品牌。 从包含数千个全球知名产品徽标的现有数据库中识别徽标。
    • 检测人脸。 检测和分析图像中的人脸。 可以确定主体的年龄,并返回一个范围框来指定人脸的位置。 计算机视觉服务的人脸分析功能是专业人脸服务的一部分。
  • 自定义视觉

    • 对图像进行分类。 根据一组称为特征的输入来预测类别或。 计算每个可能类的概率分数,并返回一个标签来指示对象最有可能属于的类。 若要使用此模型,需要包含特征及其标签的数据。
    • 检测物体。 获取图像中对象的坐标。 若要使用此模型,需要包含特征及其标签的数据。
  • 人脸服务

    • 检测人脸。 识别包含人脸的图像区域,通常通过返回范围框坐标来形成以人脸为中心的矩形。
    • 分析人脸。 返回信息,例如面部特征(鼻子、眼睛、眉毛、嘴唇等)。 可以使用这些面部特征来训练机器学习模型,该模型可以推断人员的相关信息,例如感知到的年龄或情绪状态。
    • 识别人脸。 训练机器学习模型,以从面部特征中识别已知个体。

作者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

主要作者:

其他参与者:

若要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。

后续步骤