你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

选择 Azure 认知服务技术

Azure 认知服务是一组基于云的 API,可在 AI 应用程序和数据流中使用。 该服务提供经过预先训练的模型,它们已就绪可在应用程序中使用,不需要你提供数据,也不需要你进行模型训练。 这些服务由 Microsoft AI 和研究团队开发,展示了最新的深度学习算法。 可通过 HTTP REST 接口使用它们。 此外,对于许多常见的应用程序开发框架,还可以使用 SDK。

主要优势:

  • 最大程度地降低了开发最先进人工智能服务所需的工作量。 使用预定义算法或基于预建库创建自定义算法。
  • 可以通过 HTTP REST 接口轻松集成到应用。
  • 各种技能水平的开发人员和数据科学家都可以轻松地将 AI 功能添加到应用中。

注意事项:

  • 这些服务只能通过 Web 使用。 通常需要 Internet 连接。 自定义视觉服务是一个例外,你可导出该服务经过训练的模型,用来在设备上和 IoT Edge 处进行预测。
  • 虽然支持相当多的自定义,但是,可用的服务未必满足所有预测分析要求。

Azure 认知服务类别

Azure 中提供了数十种认知服务。 下面是一个列表,按服务支持的功能区域进行分类:

服务 决策指南链接 说明
语言 选择语言服务 语言认知服务提供自然语言处理 (NLP) 功能,用于理解和分析文本。
语音 选择语音服务 语音认知服务提供语音转文本、文本转语音、语音翻译和说话人辨识等语音功能。
影像 选择视觉服务 视觉认知服务提供图像和视频识别功能。
决策服务

应用 AI 服务
选择决策 API 或应用 AI 服务 决策认知服务提供 NLP 功能用于生成建议,以便高效地做出明智的决策。
Azure OpenAI 服务 不可用 Azure OpenAI 服务提供对功能强大的 OpenAI 语言模型的 REST API 访问。

常见用例

下面是 Azure 认知服务的一些常见用例。

使用案例 Category
将能听清的语音转录为可读、可搜索的文本。 语音
将文本转换为逼真的语音,获得更自然的界面。 语音
将实时语音翻译集成到应用中。 语音
使用声音特征识别和验证说话人。 语音
确定常用术语和领域特定的术语。 语言
自动检测文本中的情绪和观点。 语言
将信息提炼成容易浏览的问题和答案。 语言
使应用能够通过自然语言与用户交互。 语言
翻译超过 100 种语言和方言。 语言
识别和分析图像和视频中的内容。 影像
自定义图像识别来适应你的业务需求。 影像
尽早确定潜在问题。 决策服务/异常检测器
检测潜在的冒犯性内容或不需要的内容。 决策服务/内容审查器
为每位用户创建丰富的个性化体验。 决策服务/个性化体验创建服务
将高级编码和语言模型应用于各种用例。 Azure OpenAI

关键选择条件

若要缩小选择范围,请先回答以下问题:

  • 你在处理的内容与口述语言相关,还是文本、图像或文档?

  • 你是否有用来训练模型的数据? 如果是,请考虑使用可用于通过你提供的数据训练其基础模型的自定义服务。 这样做可提高准确性和性能。

此流程图可帮助你为自己的用例选择最佳 API 服务。

Diagram that shows how to select a Cognitive Services API.

  • 如果你的用例需要语音转文本、文本转语音或语音转语音,请使用语音 API
  • 如果你的用例需要语言分析、文本评估或文本转文本,请使用语言 API
  • 如果需要分析图像、视频或文本,请使用视觉 API
  • 如果需要做出决策,请使用决策 API 或应用 AI 服务

部署服务

部署认知服务时,可以独立地部署服务,也可使用认知服务多服务资源。 多服务资源可部署决策、语言、语音、视觉和应用 AI 服务。

  • 如果不需要其他服务,或者想要按服务管理访问权限和计费,请部署单个服务。
  • 如果使用多个服务,并且想要同时管理所有服务的访问和计费,请部署多服务资源。

注意

这些 API 服务中的资源类别经常变化。 请务必在最新文档中查看新类别。

作者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

主要作者:

其他参与者:

若要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。

后续步骤