使用技能组定义扩充管道

已完成

AI 扩充是指管道中的嵌入图像和自然语言处理,该管道从无法以其他方式编制索引的内容中提取文本和信息以实现全文搜索。

AI 处理是通过在技能集中添加和组合技能实现的。 技能组定义提取和扩充数据以使其可搜索的操作。 这些 AI 技能可以是内置技能,例如文本翻译或光学字符识别 (OCR) 或你提供的自定义技能。

内置技能

内置技能基于 Microsoft 的预先训练模型,这意味着你无法使用自己的训练数据来训练模型。 调用 Azure AI 服务 API 的技能依赖于这些服务,并在附加资源时按 Azure AI 服务即用即付价格计费。 其他技能是由 Azure AI 搜索计量的技能,或者是免费提供的实用工具技能。

内置技能分为以下这些类别:

自然语言处理技能:借助这些技能,非结构化文本在索引中映射为可搜索和可筛选的字段。

示例包括:

  • 关键短语提取使用预先训练的模型来根据字词位置、语言规则、与其他术语的接近程度以及源数据中的字词异常程度来检测重要短语。

  • 文本翻译技能使用预先训练的模型将输入文本翻译成多种语言,用于规范化或本地化用例。

图像处理技能:创建图像内容的文本表示形式,借助 Azure AI 搜索的查询功能使图像可搜索。

示例包括:

  • 图像分析技能:使用图像检测算法来标识图像的内容并生成文本说明。

  • 光学字符识别技能:让你可以从图像(如街道符号和产品的照片)和文档(发票、帐单、财务报表、文章等)中提取印刷体文本或手写文本。