你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 服务 可帮助开发人员和组织使用现成且可自定义的 API 和模型快速创建智能、前沿、市场就绪和负责任的应用程序。
本文介绍了提供目标语言处理功能的 AI 服务,例如自然语言处理 (NLP)、文本分析、语言理解、翻译和文档数据提取。 Microsoft Azure AI 语言是 AI 服务中最广泛的类别之一。 您可以在工作负载中使用 API 来整合语言功能,例如命名实体识别 (NER)、情绪分析、语言检测和文本摘要。
服务
以下服务为 AI 服务提供有针对性的语言处理能力:
Language 提供用于文本分析的 NLP。
用 Language (当您需要处理结构化或非结构化文档以完成本文中描述的各种与语言相关的任务时)。
不要使用 语言(如果您需要使用聊天功能搜索文档、检查文档的内容安全或翻译文档)。
Microsoft Azure AI Translator 是一种机器翻译服务。 它可以执行 实时文本翻译、批量和单个文件 文档翻译以及 自定义翻译 ,您可以使用这些翻译为您的方案合并专业术语或行业特定语言。 Translator 支持多种语言。
用 当您需要专门执行翻译时,Translator 进行翻译。 您可以使用其他通用基础语言模型来执行翻译。 但是,由于其有针对性的翻译模型,将 Translator 用于其专业目的可能更有效且更具成本效益。
不要使用 如果您需要参与聊天、分析内容以表达情绪或审核内容,则为 Translator。 对于情绪分析,请改用 Language。 对于内容审核,请使用 Microsoft Azure AI Content Safety。
Azure AI 文档智能 是一项可将图像直接转换为电子表单的服务。 您可以指定预期的字段,然后搜索您提供的图像以捕获这些字段,而无需人工干预。 Document Intelligence 托管许多预构建模型,还允许您构建自己的自定义模型。
用 Document Intelligence,当您确切地知道需要从扫描的文档中提取哪些字段以适当地填写电子表格时。
用 Document Intelligence,用于识别各种文档集合中的关键结构,如页眉、页脚和分章符,以进一步以编程方式与文档交互,例如在检索增强生成 (RAG) 实施中。
不要使用 Document Intelligence 作为实时搜索 API。
Azure OpenAI 服务
Azure OpenAI 服务 提供对 OpenAI 强大语言模型的 REST API 访问。 这些模型包括 O3-Mini、O1、O1-Mini、GPT-4o、GPT-4o Mini、GPT-4 Turbo with Vision、GPT-4、GPT-3.5-Turbo 和 Embeddings 模型系列。 这些模型具有很强的适应性,这使您可以为内容生成、摘要、图像分析和语义搜索等任务定制它们。 它们还支持自然语言到代码的翻译,这使得它们适用于各种应用程序。
功能
下表提供了 Azure OpenAI 中可用的功能列表。
能力 | 说明 |
---|---|
文本生成和完成 | 根据提示生成类人文本,自动完成句子或段落,将长文档总结成简洁的摘要,并根据上下文回答问题。 |
聊天 | 构建聊天机器人和虚拟助手,在多轮对话中维护上下文,并根据用户交互个性化响应。 |
助手 | 创建类似 Copilot 的体验,在用户交互中保持一致的个性。 支持同时使用多个工具,例如代码实施和知识搜索。 |
嵌入 | 将文本转换为数字向量,其中相似的含义在向量空间中靠得很近。 此过程可在 Azure AI 搜索、Azure Cosmos DB、Azure SQL 数据库和 Azure Database for PostgreSQL 等服务中实现强大的相似性搜索。 |
内容筛选 | 筛选用户输入和 AI 输出,以查找仇恨、性内容、暴力和自残等类别的有害内容,并支持多种语言。 它还监控使用模式以帮助确保合规性。 |
LLM 定制 | 提供模型适应技术,包括用于快速调整的 prompt Engineering、用于整合外部信息的 RAG 以及用于训练模型以执行专业任务的微调。 您可以组合使用这些方法来优化特定使用案例的性能。 |
语言
语言 是一种基于云的服务,提供用于理解和分析文本的 NLP 功能。 使用此服务可通过使用基于 Web 的 Language Studio、REST API 和客户端库来帮助构建智能应用程序。
功能
下表提供了 Language 中可用的功能列表。
能力 | 说明 |
---|---|
自定义问题解答 | 为用户的输入找到最合适的答案。 它通常用于构建对话式客户端应用程序,例如社交媒体应用程序、聊天机器人和支持语音的桌面应用程序。 |
自定义文本分类 | 构建自定义 AI 模型,将非结构化文本文档分类为您定义的自定义类。 |
对话语言理解 (CLU) | 构建自定义自然语言理解模型,以预测传入消息的总体意图并从中提取重要信息。 |
实体链接 | 消除在非结构化文本中找到的单词或短语的标识的歧义,并返回指向 Wikipedia 的链接。 |
语言检测 | 检测文档的编写语言,并返回各种语言、变体、方言和某些区域或文化语言的语言代码。 |
关键短语提取 | 计算并返回非结构化文本中的主要概念,并将其作为列表返回。 |
净资产 | 跨多个预定义的 类别组(如人员、事件、地点和日期)对非结构化文本中的单词或短语进行分类。 |
业务流程工作流 | 用于连接 CLU。 |
个人身份信息 (PII) 和个人身份健康信息检测 | 识别、分类和编辑 非结构化文本文档 和 对话记录中的敏感信息,例如电话号码、电子邮件地址和身份证明形式。 有关更多信息,请参阅 支持的 PII 实体类别。 |
情绪分析和观点挖掘 | 通过分析文本中积极或消极情绪的迹象并将其链接到内容的特定方面,帮助您了解人们对您的品牌或主题的看法。 |
综述 | 使用抽取式文本摘要生成文档摘要和对话听录。 它会提取共同表示原始内容中最重要或相关信息的句子。 |
健康文本分析 | 从非结构化文本(如医生的备注、出院摘要、临床文档和电子健康状况记录)中提取和标记相关医疗信息。 在设计工作负载时,请评估此云托管功能的处理位置和数据驻留,以确保它符合您的合规性预期。 某些工作负荷的容量可能会受到限制,以便将医疗保健数据发送到云托管的平台。 您可以将此 API 用作 Docker 容器,以托管在云中或本地您自己的计算中。 此过程可能有助于解决包括平台即服务在内的合规性问题。 有关详细信息,请参阅 对运行状况容器使用文本分析。 |
用例
下表提供了 Language 的可能使用案例列表。
如果功能是可定制的,您可以使用我们的工具来训练 AI 模型,以适应您的特定数据。 否则,该功能是预配置的,这意味着其 AI 模型保持不变。 您需要提供数据并在应用程序中使用该功能的输出。
翻译员
Translator 是一种机器翻译服务,是 AI 服务的一部分。 翻译器为许多 Microsoft 产品和服务提供支持。
功能
下表提供了 Translator 中可用的功能列表。
能力 | 说明 |
---|---|
Azure 文本翻译 | 在支持的源语言和目标语言之间实时执行文本翻译。 创建 动态词典 并了解如何使用 Translator API 阻止翻译 。 |
文档翻译 |
异步批量翻译: 翻译批处理和复杂文件,同时保留原始文档的结构和格式。 批量翻译过程需要一个 Azure Blob 存储帐户,该帐户具有用于源文档和已翻译文档的容器。
同步单文件翻译: 单独翻译单个文档文件或与词汇表文件一起翻译,同时保留原始文档的结构和格式。 文件转换过程不需要 Blob 存储帐户。 最终响应包含翻译后的文档,会直接返回给调用客户端。 |
自定义翻译器 | 构建自定义模型以翻译特定于领域和行业的语言、术语和样式。 为自定义翻译创建字典(短语或句子)。 |
用例
下表提供了 Translator 的可能使用案例列表。
用例 | 文档 |
---|---|
翻译行业特定的文本。 | 自定义翻译器 |
翻译非特定于行业的通用文本。 | Azure 文本翻译 |
文档智能
语言 是一种基于云的服务,提供用于理解和分析文本的 NLP 功能。 使用此服务可通过使用基于 Web 的 Language Studio、REST API 和客户端库来帮助构建智能应用程序。
功能
下表提供了 Document Intelligence 中一些可用功能的列表。
能力 | 说明 |
---|---|
名片提取 | 文档智能名片模型将光学字符识别 (OCR) 功能与深度学习模型相结合,可从名片图像中分析和提取数据。 该 API 分析打印的名片,提取名字、姓氏、公司名称、电子邮件地址和电话号码等关键信息,然后返回结构化的 JSON 数据表示形式。 |
协定模型提取 | Document Intelligence 合同模型使用 OCR 功能从一组选定的重要合同实体中分析和提取关键字段和行项目。 合同可以采用各种格式和质量,包括手机捕获的图像、扫描的文档和数字 PDF。 该 API 分析文档文本,提取关键信息(如各方、管辖区、合同 ID 和所有权),然后返回结构化的 JSON 数据表示形式。 该模型目前支持英文文档格式。 |
信用卡提取 | Document Intelligence 信用卡/借记卡模型使用 OCR 功能来分析和提取信用卡和借记卡中的关键字段。 信用卡和借记卡可以以各种格式和质量显示,包括通过电话捕获的图像、扫描的文档和数字 PDF。 该 API 分析文档文本,提取关键信息(如卡号、发卡行和到期日期),然后返回结构化的 JSON 数据表示形式。 该模型目前支持英文文档格式。 |
医疗保险卡提取 | Document Intelligence 健康保险卡模型将 OCR 功能与深度学习模型相结合,以分析和提取美国健康保险卡中的关键信息。 医疗保险卡是护理处理的关键文档,可对患者登记、金融保险范围信息、无现金付款和保险索赔处理进行数字分析。 健康保险卡模型分析健康卡图像,提取保险公司、会员、处方和组号等关键信息,然后返回结构化的 JSON 表示形式。 健康保险卡可以以各种格式和质量显示,包括通过电话捕获的图像、扫描的文档和数字 PDF。 |
美国税务文档提取 | Document Intelligence 合同模型使用 OCR 功能从一组选定的税务文档中分析和提取关键字段和行项目。 税务文件可以有多种格式和质量,包括手机捕获的图像、扫描的文档和数字 PDF。 该 API 分析文档文本,提取关键信息,如客户名称、账单地址、到期日期和到期金额,然后返回结构化的 JSON 数据表示形式。 该模型目前支持英语的特定税务文件格式。 |
客户端库 | Document Intelligence 支持多种模型,使您能够将智能文档处理添加到您的应用程序和流中。 你可以使用预生成的特定于域的模型,或者训练根据特定业务需求和用例定制的自定义模型。 文档智能可与 REST API 或 Python、C#、Java 和 JavaScript 客户端库一起使用。 |
有关模型场景的更多信息,请参阅 我应该选择哪种模型?