你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 视觉中的新增功能
了解 Azure AI 视觉中的新增功能。 查看此页以实时跟进新功能、增强功能、修补程序和文档更新。
2024 年 9 月
模型自定义和产品识别弃用
2025 年 1 月 10 日,Azure AI 视觉产品识别和模型自定义功能将会停用。 该日期之后,对这些服务的 API 调用会失败。
要确保模型顺利运行,请转换到现已正式发布的 Azure AI 自定义视觉。 自定义视觉可提供与这些即将停用的功能相似的功能。
2024 年 8 月
新的可检测人脸属性
在最新的 Detection 03 模型中可以使用眼镜、遮挡、模糊和曝光属性。 有关更多详细信息,请参阅指定人脸检测模型。
2024 年 5 月
新的人脸 SDK 1.0.0-beta.1(中断性变更)
1.0.0-beta.1 版本中的人脸 SDK 经过重新设计,可以更好地满足 Azure SDK 的指导方针和设计原则。 支持的语言包括 C#、Python、Java 和 JavaScript。 按照快速入门开始使用。
2024 年 2 月
多模式嵌入 GA:新的多语言模型
多模式嵌入 API 已更新,现已正式发布。 新的 2024-02-01
API 包括一个支持通过 102 种语言进行文本搜索的新模型。 初始的纯英文模型仍然可用,但不能与同一搜索索引中的新模型组合使用。 如果你使用纯英文模型对文本和图像进行了矢量化,则这些矢量将与多语言文本和图像矢量不兼容。
有关受支持语言的列表,请参阅语言支持页。
2024 年 1 月
新的图像分析 SDK 1.0.0-beta.1(中断性变更)
图像分析 SDK 在版本 1.0.0-beta.1 中重写,以便更好地与其他 Azure SDK 保持一致。 所有 API 都已更改。 有关如何使用新 SDK 的信息,请参阅更新后的快速入门、示例和操作指南。
主要更改:
- SDK 现在会调用正式版计算机视觉 REST API (2023-10-01),而不是预览版计算机视觉 REST API (2023-04-01-preview)。
- 添加了对 JavaScript 的支持。
- 不再支持 C++。
- SDK 不再支持使用自定义模型的图像分析和图像分段(背景移除),因为计算机视觉 REST API (2023-10-01) 尚不支持它们。 若要使用其中任一功能,请直接调用计算机视觉 REST API (2023-04-01-preview)(分别使用
Analyze
和Segment
操作)。
2023 年 11 月
分析图像 4.0 正式发布
图像分析 4.0 REST API 现已正式发布。 按照分析图像 4.0 快速入门开始使用。
图像分析的其他功能(如模型自定义、后台移除和多模式嵌入)仍处于公共预览状态。
用于活体检测的人脸客户端 SDK
人脸活体 SDK 支持在用户移动设备或边缘设备上进行活体检测。 它适用于 Android 的 Java/Kotlin 以及 iOS 的 Swift/Objective-C。
我们的活体检测服务符合 iBeta 的 1 级和 2 级 ISO/IEC 30107-3 合规性。
2023 年 9 月
弃用已过时的计算机视觉 API 版本
计算机视觉 API 版本 1.0、2.0、3.0 和 3.1 将于 2026 年 9 月 13 日停用。 在此日期之后,开发人员将无法对这些 API 发出 API 调用。 我们建议所有受影响的客户尽早在方便的时候,遵循此快速入门将其工作负载迁移到正式发布的计算机视觉 3.2 API。 此外,客户应考虑迁移到图像分析 4.0 API(预览版),该版本提供最新且卓异的图像分析功能。
如有任何问题,请访问我们的 Q&A。
2023 年 5 月
图像分析 4.0 产品识别(公共预览版)
借助产品识别 API,可以分析零售商店中货架的照片。 可以检测产品是否存在,并获取其边界框坐标。 将其与模型自定义结合使用,以训练模型来识别特定产品。 还可以将产品识别结果与商店的货架图文档进行比较。 产品识别。
2023 年 4 月
人脸受限访问令牌
独立软件供应商 (ISV) 可以通过颁发访问令牌来管理其客户的人脸 API 使用情况,这些令牌可授予对通常受限的人脸功能的访问权限。 这允许客户公司使用人脸 API,而无需经过正式的审批流程。 使用受限访问令牌。
2023 年 3 月
Azure AI 视觉图像分析 4.0 SDK 公共预览版
Florence 基础模型现已集成到 Azure AI 视觉中。 改进的视觉服务使开发人员能够跨各个行业创建市场就绪的、负责任的 Azure AI 视觉应用程序。 客户现在可以无缝数字化、分析数据并将其连接到自然语言交互,从图像和视频内容中解锁强大的见解以支持辅助功能、通过 SEO 推动获取、保护用户免受有害内容侵害、增强安全性并缩短事件响应时间。 有关详细信息,请参阅公布 Microsoft 的 Florence 基础模型。
图像分析 4.0 SDK(公共预览版)
图像分析 4.0 现在可通过 C#、C++ 和 Python 语言的客户端库 SDK 提供。 此次更新还包括 Florence 支持的图像文字描述,以及近似人类性能的密集文字描述。
图像分析 V4.0 描述文字生成和密集描述文字生成(公共预览版):
在 V4.0 中,“描述文字”取代了“描述”,它是经过改进的图像文字描述功能,具有丰富的细节和语义理解。 除了描述整个图像之外,“密集文字描述”还可以生成最多 10 个图像区域的单句说明,从而提供更多详细信息。 密集描述文字还将返回所描述图像区域的边界框坐标。 还有一个新的性别中立参数,允许客户选择是否为替换文本和 Seeing AI 应用程序启用概率性别推理。 自动提供丰富的描述文字、可访问的替换文字、SEO 优化和智能照片策展,以支持数字内容。 图形描述文字。
视频摘要和帧定位器(公共预览版):
以类似于思考和写作时的直观方式搜索视频内容并与之交互。 查找相关内容,无需额外的元数据。 仅在 Vision Studio 中可用。
图像分析 4.0 模型自定义(公共预览版)
现在,可以使用 Vision Studio 或 v4.0 REST API 创建和训练自己的自定义图像分类和物体检测模型。
多模式嵌入 API(公共预览版)
多模式嵌入 API 是图像分析 4.0 API 的一部分,支持对图像和文本查询进行矢量化。 这些 API 可用于将图像和文本转换为多维矢量空间中的坐标。 现在,你可以使用自然语言进行搜索,并使用矢量相似性搜索查找相关图像。
背景移除 API(公共预览版)
作为图像分析 4.0 API 的一部分,背景移除 API 可用于移除图像的背景。 此操作可以输出检测到的前景物体的图像(具有透明背景),也可以输出显示检测到的前景物体的不透明度的灰度 alpha 哑光图像。
弃用 Azure AI 视觉 3.0 & 3.1 预览版
Azure AI 视觉 3.0 和 3.1 的预览版计划于 2023 年 9 月 30 日停用。 超过此日期后,客户将无法再对这些 API 进行任何调用。 建议客户将其工作负载迁移到正式发布 (GA) 的 3.2 API。 从这些预览版本迁移到 3.2 API 时,请注意以下变化:
- 分析图像和读取 API 调用将采用可选的 model-version 参数,该参数可用于指定要使用的 AI 模型。 默认情况下,它们使用最新模型。
- 分析图像和读取 API 调用还会在成功的 API 响应中返回
model-version
字段。 此字段报告使用了哪个模型。 - Azure AI 视觉 3.2 API 使用不同的错误报告格式。 请参阅 API 参考文档详细了解如何调整任何错误处理代码。
2022 年 10 月
Azure AI 视觉图像分析 4.0(公共预览版)
图像分析 4.0 已以公共预览版发布。 新的 API 包括映像字幕、图像标记、物体检测、智能裁剪、人脸检测和读取 OCR 功能,所有这些均可在一个“分析图像”操作中使用。 在性能增强的同步 API 中对常规非文档图像进行了优化,可更轻松地在工作流中嵌入 OCR 支持的体验。
2022 年 9 月
停用 Azure AI 视觉 3.0/3.1 读取预览版
Azure AI 视觉 3.0 和 3.1 读取 API 的预览版计划于 2023 年 1 月 31 日停用。 建议客户参考操作指南和快速入门,以开始使用正式发布版 (GA) 的读取 API。 最新的 GA 版本具有以下优势:
- 2022 年正式发布的最新 OCR 模型
- OCR 语言覆盖范围显著增大,包括支持手写文本
- 改进了 OCR 质量
2022 年 6 月
Vision Studio 推出
Vision Studio 是可让你从 Azure AI 视觉探索、生成特征并将其集成到应用程序的 UI 工具。
Vision Studio 为你提供了一个平台,可用于试用多个服务功能,并以可视化的方式查看它们返回的内容。 使用 Studio,无需编写代码即可开始操作,然后在应用程序中使用可用的客户端库和 REST API。
用于人脸识别的负责任 AI
人脸透明度说明
- 透明度说明提供了相关指导,通过将融合有意义的人工评审来检测和解决错误识别或其他故障案例、向认为其结果不正确的人员提供支持以及识别和处理因操作条件变化而导致的准确度波动,从而帮助客户提高其系统的准确度和公平性。
停用敏感属性
- 我们已经停用了面部分析功能,这些功能旨在推断情绪状态和身份属性,如性别、年龄、微笑、面部毛发、头发和化妆。
- 面部检测功能(包括检测模糊、曝光、眼镜、头部姿势、特征点、噪音、阻挡物、面部轮廓)将仍然普遍可用,并且不需要应用程序。
Fairlearn 包和 Microsoft 的公平性仪表板
- 开源 Fairlearn 包和 Microsoft 的公平性仪表板旨在支持客户根据自己的数据衡量 Microsoft 面部验证算法的公平性,使他们能够在部署技术之前识别和解决可能影响不同人群的潜在公平性问题。
受限访问策略
- 在使人脸服务与更新的负责任 AI 标准保持一致时,已针对人脸 API 和 Azure AI 视觉实施新的受限访问策略。 现有客户有一年的时间可以根据他们提供的用例申请继续访问面部识别服务并获得批准。 请在此处详细了解人脸服务受限访问,在此处详细了解 Azure AI 视觉受限访问。
Azure AI Vision 3.2 预览版弃用
API 3.2 预览版已计划于 2022 年 12 月停用。 建议客户改用 API 正式版 (GA)。 从 3.2 预览版迁移时请注意以下更改:
- 分析图像和读取 API 调用现在采用可选的 model-version 参数,该参数可用于指定要使用的 AI 模型。 默认情况下,它们使用最新模型。
- 分析图像和读取 API 调用还会在成功的 API 响应中返回
model-version
字段。 此字段报告使用了哪个模型。 - 图像分析 API 现在使用不同的错误报告格式。 请参阅 API 参考文档详细了解如何调整任何错误处理代码。
2022 年 5 月
OCR(读取)API 模型已正式发布 (GA)
Azure AI 视觉的 OCR(读取)API 最新模型(具有 164 种支持的语言)现已正式发布为云服务和容器。
- OCR 支持的打印文本扩展到 164 种新语言(包括俄语、阿拉伯语、印地语以及使用西里尔文字母、阿拉伯字母和梵文字母的其他语言)。
- OCR 支持的手写文本扩展到 9 种语言,即英语、简体中文、法语、德语、意大利语、日语、韩语、葡萄牙语和西班牙语。
- 增强了对单个字符、手写日期、数量、名称、通常在收据和发票中找到的其他实体的支持。
- 改进了对数字 PDF 文档的处理。
- 输入文件大小限制提高 10 倍至 500 MB。
- 性能和延迟方面的改进。
- 可用作云服务和 Docker 容器。
请参阅 OCR 操作指南,了解如何使用 GA 模型。
2022 年 2 月
OCR(读取)API 公共预览版支持 164 种语言
Azure AI 视觉的 OCR(读取)API 使用其最新预览版将支持的语言扩展到 164 种:
- OCR 支持的打印文本扩展到 42 种新语言(包括阿拉伯语、印度语以及使用阿拉伯字母和梵文字母的其他语言)。
- 除了英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语外,OCR 支持的手写文本还扩展到日语和韩语。
- 增强功能包括更好支持提取手写日期、数量、名称和单个字符框。
- 常规性能和 AI 质量改进
请参阅 OCR 操作指南,了解如何使用新的预览功能。
Detection_01 和 Detection_03 中的新质量属性
- 为了帮助系统构建者和客户从人脸 API 获取高质量输出所需的高质量图像,我们引入了新的质量属性 QualityForRecognition,用于帮助确定图像是否具有足够高的质量来尝试进行人脸识别。 非正式评级值为低、中或高。 该新属性在使用检测模型
detection_01
或detection_03
以及识别模型recognition_03
或recognition_04
的任意组合时可用。 建议仅将“高”质量图像用于人员登记,“中等”以上质量的图像用于识别方案。 若要详细了解该新质量属性,请参阅人脸检测和属性,并了解如何将其与快速入门配合使用。
2021 年 9 月
OCR(读取)API 公共预览版支持 122 种语言
Azure AI 视觉的 OCR(读取)API 使用其最新预览版将支持的语言扩展到 122 种:
- OCR 支持,针对 49 种新语言(包括俄语、保加利亚语、其他西里尔语和其他拉丁语)的打印文本。
- OCR 支持,针对 6 种新语言(包括英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语)的手写文本。
- 增强功能,用于处理标识文档中的数字 PDF 和计算机可读区域 (MRZ) 文本。
- 常规性能和 AI 质量改进
请参阅 OCR 操作指南,了解如何使用新的预览功能。
2021 年 8 月
图像标记语言扩展
图像标记器的最新版本 (v3.2) 现支持 50 种语言的标记。 有关详细信息,请参阅语言支持页。
2021 年 7 月
面向 Detection_03 的新的 HeadPose 和特征点改进
- Detection_03 模型现已更新,可支持面部特征点。
- Detection_03 中的特征点功能更加精确,尤其是在对视线跟踪至关重要的眼球特征点方面。
2021 年 5 月
空间分析容器更新
已发布提供新功能集的空间分析容器新版本。 借助此 Docker 容器,可分析实时流视频,了解人们与他们在物理环境中的移动之间的空间关系。
现可配置空间分析操作来检测人面朝的方向。
- 可通过配置
enable_orientation
参数,为personcrossingline
和personcrossingpolygon
操作启用方向分类器。 默认情况下,此选项设置为 off。
- 可通过配置
空间分析操作现在还提供可检测人步行/奔跑速度的配置
- 可以通过打开
enable_speed
分类器(默认情况下为关闭状态)来检测personcrossingline
和personcrossingpolygon
操作的速度。 输出结果反映在speed
、avgSpeed
和minSpeed
输出中。
- 可以通过打开
2021 年 4 月
Azure AI 视觉 v3.2 GA
Azure AI 视觉 API v3.2 现已正式发布,进行了以下更新:
- 改善了图像标记模型:根据图像中显示的对象、操作和内容分析视觉对象内容并生成相关标记。 此模型通过标记图像 API 提供。 有关详细信息,请参阅图像分析操作指南和概述。
- 更新的内容审查模型:检测是否存在成人内容并提供标志来筛选包含成人、猥亵和血腥视觉内容的图像。 可通过分析 API 获取此模型。 有关详细信息,请参阅图像分析操作指南和概述。
- 用于 73 种语言的 OCR(读取),这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。
- OCR (读取) 还可作为本地部署的 Distroless 容器。
PersonDirectory 数据结构(预览版)
- 为执行人脸识别操作(如识别和查找相似对象),人脸 API 客户需要创建一份 Person 对象的分类列表。 新的 PersonDirectory 是一种数据结构,其中包含添加到目录的每个人员身份识别的唯一 ID、可选名称字符串和可选用户元数据字符串 。 目前,人脸 API 提供 LargePersonGroup 结构,该结构具有相似功能,但限制添加 100,0000 个身份识别。 PersonDirectory 结构最多可扩展到 750,00000 个标识。
- PersonDirectory 和之前的数据结构之间还存在一个重大差异,即在将人脸添加到 Person 对象后,便无需再执行任何定型调用,因为更新进程会自动发生。 有关更多详细信息,请参阅使用 PersonDirectory 结构。
2021 年 3 月
Azure AI 视觉 3.2 公共预览版更新
Azure AI 视觉 API v3.2 公共预览版已经更新。 该预览版包含所有 Azure AI 视觉功能以及已更新的读取 API 和分析 API。
2021 年 2 月
读取 API v3.2 公共预览版(带有对 73 种语言的 OCR 支持)
Azure AI 视觉读取 API v3.2 公共预览版(可用作云服务和 Docker 容器)包括以下更新:
- 用于 73 种语言的 OCR,这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。
- 文本行输出的自然读取顺序(仅限拉丁语言)
- 文本行的手写样式分类以及置信度分数(仅限拉丁语言)。
- 对于多页文档,仅提取所选页面的文本。
- 可为本地部署用作 Distroless 容器。
若要了解详细信息,请参阅读取 API 操作指南。
新的人脸 API 检测模型
- 新的“检测 03”模型是当前可用的最准确的检测模型。 如果你是新客户,建议使用此模型。 “检测 03”提高了图像(64x64 像素)中找到的较小人脸的召回率和精准率。 其他改进包括:全面降低了误报、改善了对转动的人脸方向的检测。 将 Detection 03 与新的 Recognition 04 模型相结合也会提高识别准确度。 有关更多详细信息,请参阅指定人脸检测模型。
新的可检测人脸属性
- 随最新的 Detection 03 模型提供了
faceMask
属性以及新增的属性"noseAndMouthCovered"
(用于检测是否按预期佩戴了面罩,覆盖了鼻子和嘴)。 若要使用最新的面罩检测功能,用户需要在 API 请求中指定检测模型:通过 detectionModel 参数将模型版本指定为detection_03
。 有关更多详细信息,请参阅指定人脸检测模型。
新的人脸 API 识别模型
- 新的“识别 04”模型是当前可用的最准确的识别模型。 如果你是新客户,建议使用此模型进行验证和识别。 它针对“识别 03”的准确度进行了改进,包括改进对佩戴面罩(外科口罩、N95 口罩、布口罩)的用户的识别。 我们建议不要注册戴面罩的用户的图像,因为这会降低识别质量。 现在,客户可以构建安全且无缝的用户体验,以便使用最新的“检测 03”模型来检测用户是否佩戴了面罩,然后使用最新的“识别 04”模型来识别他们。 有关更多详细信息,请参阅指定人脸识别模型。
2021 年 1 月
空间分析容器更新
已发布提供新功能集的空间分析容器新版本。 借助此 Docker 容器,可分析实时流视频,了解人们与他们在物理环境中的移动之间的空间关系。
- 现可配置空间分析操作来检测某人是否正戴着口罩等保护性面罩。
- 可通过配置
ENABLE_FACE_MASK_CLASSIFIER
参数,为personcount
、personcrossingline
和personcrossingpolygon
操作启用口罩分类器。 - 系统将以元数据的形式返回
face_mask
和face_noMask
属性,其中有在视频流中检测到的每个人的置信度分数
- 可通过配置
- personcrossingpolygon 操作已得到扩展,可计算一个人在某个区域中的停留时间。 可将该操作的区域配置中的
type
参数设置为zonedwelltime
,类型为 personZoneDwellTimeEvent 的新事件将包括durationMs
字段,该字段填充了该人员在该区域中停留的毫秒数。 - 中断性变更:已将 personZoneEvent 事件重命名为 personZoneEnterExitEvent。 此事件在某人进入或离开该区域时由 personcrossingpolygon 操作引发,并提供与所穿过区域的编号侧相关的方向信息。
- 可在所有操作中将视频 URL 作为“专用参数/已模糊处理”提供。 模糊处理现在是可选操作,仅当
KEY
和IV
作为环境变量提供时才有效。 - 默认情况下,对所有操作启用了校准。 设置
do_calibration: false
可禁用它。 - 已通过
enable_recalibration
参数增加对自动重新校准的支持(默认禁用),请参阅空间分析操作了解有关详细信息 - 照相机校准参数设置为
DETECTOR_NODE_CONFIG
。 有关详细信息,请参阅空间分析操作。
缓解延迟
- 人脸团队发布了一篇新文章,其中详细介绍了使用该服务时的可能的延迟原因和可能的缓解策略。 请参阅使用人脸服务时减少延迟。
2020 年 12 月
人脸 ID 存储的客户配置
- 尽管人脸服务不存储客户图像,但已提取的人脸特征将存储在服务器上。 人脸 ID 是人脸特征的标识符,并且将在人脸 - 识别、人脸 - 验证和人脸 - 查找相似中使用。 在进行原始检测调用之后的 24 小时,存储的人脸特征将过期并将会被删除。 客户现在可以决定这些人脸 ID 的缓存时间长度。 最大值仍为 24 小时,但现在可以设置最小值 60 秒。 缓存人脸 ID 的新时间范围是介于 60 秒和 24 小时之间的任何值。 有关详细信息,请参阅人脸 - 检测 API 参考(faceIdTimeToLive 参数)。
2020 年 11 月
示例人脸注册应用
- 该团队发布了一个示例人脸注册应用,用于演示通过高质量注册确立有意义的同意和创建高准确度人脸识别系统的最佳做法。 可在生成注册应用指南中和 GitHub 上找到开放源代码的示例,供开发人员部署或自定义。
2020 年 10 月
Azure AI 视觉 API v3.1 GA
正式发布的 Azure AI 视觉 API 已升级到 v3.1。
2020 年 9 月
空间分析容器预览版
空间分析容器现提供预览版。 利用 Azure AI 视觉的空间分析功能,你可以分析实时流视频,了解人们与他们在物理环境中的移动之间的空间关系。 空间分析是一种可以在本地使用的 Docker 容器。
读取 API v3.1 公共预览版添加了日语的 OCR
Azure AI 视觉读取 API v3.1 公共预览版添加了以下功能:
日语的 OCR
对于每个文本行,指示呈现效果是手写体还是打印样式,并随附置信度评分(仅限拉丁语言)。
对于多页文档,仅提取所选页面或页面范围的文本。
此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、日语、葡萄牙语、简体中文和西班牙语。
若要了解详细信息,请参阅读取 API 操作指南。
2020 年 8 月
客户管理的静态数据加密
- 人脸服务在将数据保存到云时会自动加密数据。 人脸服务加密可以保护数据,以便帮助组织履行在安全性与合规性方面做出的承诺。 默认情况下,订阅使用 Microsoft 托管的加密密钥。 还有一个新选项可供你通过你自己的密钥(称为客户管理的密钥 (CMK))管理订阅。 有关更多详细信息,请参阅客户管理的密钥。
2020 年 7 月
读取 API v3.1 公共预览版包含简体中文的 OCR
Azure AI 视觉读取 API v3.1 公共预览版添加了对简体中文的支持。
- 此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、葡萄牙语、简体中文和西班牙语。
若要了解详细信息,请参阅读取 API 操作指南。
2020 年 5 月
Azure AI 视觉 API v3.0 正式发布,并对读取 API 进行了更新:
- 支持英语、荷兰语、法语、德语、意大利语、葡萄牙语和西班牙语
- 准确度改进
- 每个已提取单词的置信度分数
- 新输出格式
若要了解详细信息,请参阅 OCR 概述。
2020 年 4 月
新的人脸 API 识别模型
- 新的“识别 03”模型是当前可用的最准确的模型。 如果你是新客户,建议使用此模型。 Recognition 03 在相似性比较和人员匹配比较方面提供了更高的准确性。 有关更多详细信息,请参阅指定人脸识别模型。
2020 年 3 月
- 现在,将对此服务的所有 HTTP 请求强制执行 TLS 1.2。 有关详细信息,请参阅 Azure AI 服务安全性。
2020 年 1 月
读取 API 3.0 公共预览版
现在,可以使用 Read API 3.0 版从图像中提取印刷体文本或手写文本。 与早期版本相比,3.0 版提供了:
- 准确度改进
- 新输出格式
- 每个已提取单词的置信度分数
- 使用语言参数同时支持西班牙语和英语
按照提取文本快速入门,开始使用 3.0 API。
2019 年 6 月
新的人脸 API 检测模型
- 新的“检测 02”模型功能提高了较小的、侧面的、遮蔽的和模糊的人脸的检测准确度。 通过人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup Person - 添加人脸和 LargePersonGroup Person - 添加人脸来使用它,只需在
detectionModel
参数中指定新的人脸检测模型名称detection_02
即可。 如何指定检测模型中提供了更多详细信息。
2019 年 4 月
提高了属性准确度
- 提高了
age
和headPose
属性的总体准确性。 此外还更新了headPose
属性,pitch
值现已启用。 使用这些属性的方法是在人脸 - 检测returnFaceAttributes
参数的returnFaceAttributes
参数中指定它们。
提高了处理速度
- 提高了人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup 人员 - 添加人脸操作的速度。
2019 年 3 月
新的人脸 API 识别模型
- “识别 02”模型的准确度已提高。 通过人脸 - 检测、FaceList - 创建、LargeFaceList - 创建、PersonGroup - 创建和 LargePersonGroup - 创建来使用它,只需在
recognitionModel
参数中指定新的人脸识别模型名称recognition_02
即可。 如何指定识别模型中提供了更多详细信息。
2019 年 1 月
人脸快照功能
- 此功能使服务可以支持跨订阅进行数据迁移:快照。
重要
人脸快照 API 已于 2023 年 6 月 30 停用。
2018 年 10 月
API 消息
- 在 PersonGroup - 获取训练状态、LargePersonGroup - 获取训练状态和 LargeFaceList - 获取训练状态中完善了对
status
、createdDateTime
、lastActionDateTime
和lastSuccessfulTrainingDateTime
的说明。
2018 年 5 月
提高了属性准确度
- 显着改进了
gender
属性,还改进了age
、glasses
、facialHair
、hair
、makeup
属性。 通过人脸 - 检测returnFaceAttributes
参数使用这些属性。
增加了文件大小限制
- 在以下部分中将输入图像文件大小限制从 4 MB 增加到了 6 MB:人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup人员 - 添加人脸。
2018 年 3 月
新的数据结构
- LargeFaceList 和 LargePersonGroup。 有关详细信息,请参阅如何缩放以处理更多注册用户。
- 将人脸 - 识别
maxNumOfCandidatesReturned
参数从 [1, 5] 增加到了 [1, 100],默认为 10。
2017 年 5 月
新的可检测人脸属性
- 在人脸 - 检测
returnFaceAttributes
参数中添加了hair
、makeup
、accessory
、occlusion
、blur
、exposure
和noise
属性。 - 在 PersonGroup 和人脸 - 识别中支持 10K 人员。
- 在带可选参数
start
和top
的 PersonGroup 人员 - 列表中支持分页。 - 支持在针对 PersonGroup 中的不同 FaceLists 和不同人员添加/删除人脸时的并发性。
2017 年 3 月
新的可检测人脸属性
- 在人脸 - 检测
returnFaceAttributes
参数中添加了emotion
属性。
已修复的问题
- 无法使用从人脸 - 检测返回的矩形重新将人脸检测为 FaceList - 添加人脸和 PersonGroup 人员 - 添加人脸中的
targetFace
。 - 设置了可检测的人脸大小,以确保它一定在 36x36 到 4096x4096 像素之间。
2016 年 11 月
新的订阅层
- 添加了人脸存储标准订阅以在使用 PersonGroup 人员 - 添加人脸或 FaceList - 添加人脸进行标识或相似性匹配时存储额外的持久性人脸。 存储的图像按每 1000 张人脸 0.5 美元收费,每天以此费率按比例计费。 免费层订阅的总人数仍限制为 1,000 人。
2016 年 10 月
API 消息
- 在 FaceList - 添加人脸和 PersonGroup 人员 - 添加人脸中将
targetFace
中多个人脸的错误消息从“There are more than one face in the image”更改为“There is more than one face in the image”。
2016 年 7 月
新增功能
- 支持在人脸 - 验证中进行人脸到人员对象身份验证。
- 添加了可选的
mode
参数,可以选择两种工作模式:人脸 - 查找相似中的matchPerson
和matchFace
,默认值为matchPerson
。 - 为用户添加了可选的
confidenceThreshold
参数,以设置一个人脸是否属于人脸 - 识别中的 Person 对象的阈值。 - 在 PersonGroup - 列表中添加了可选的
start
和top
参数,使用户能够指定要列出的起点和总 PersonGroup 数。
从 V0 进行的 V1.0 更改
- 将服务根终结点从
https://westus.api.cognitive.microsoft.com/face/v0/
更改为https://westus.api.cognitive.microsoft.com/face/v1.0/
。 更改已应用于:人脸 - 检测、人脸 - 识别、人脸 - 查找相似和人脸 - 组。 - 将最小可检测人脸大小更新为 36x36 像素。 将不会检测到小于 36x36 像素的人脸。
- 已弃用人脸 V0 中的 PersonGroup 和 Person 数据。 使用人脸 V1.0 服务无法访问这些数据。
- 于 2016 年 6 月 30 日弃用了人脸 API 的 V0 终结点。