标识搜索解决方案的元素

已完成

Infographic of indexing process.

典型的 Azure AI 搜索解决方案从一个包含要搜索的数据项目的数据源开始。 这可以是 Azure 存储中文件夹和文件的层次结构,也可以是数据库(如 Azure SQL 数据库或 Azure Cosmos DB)中的文件。 Azure AI 搜索支持的数据格式为 JSON。 无论数据源自何处,如果可将其作为 JSON 文档提供,那么搜索引擎就可对其编制索引。

如果数据驻留在受支持的数据源中,则可使用索引器自动执行数据引入,包括以本机格式对源数据进行 JSON 序列化。 索引器连接到数据源,对数据进行序列化,然后传递给搜索引擎以编制索引。 大多数索引器都支持更改检测,这使得数据刷新变得更简单。

除了自动执行数据引入外,索引器还支持 AI 扩充。 你可以附加应用一系列 AI 技能来扩充数据的技能集,使其更易于搜索。 一套基于 Azure AI 服务 API 的全面内置技能可有助于派生新字段 - 例如,通过识别文本中的实体、翻译文本、评估情绪或预测图像的适当标题。 (可选)还可以将扩充的内容发送到知识存储,该知识存储将 AI 扩充管道的输出存储在 Azure 存储中的表和 Blob 中,以便进行独立分析或下游处理。

无论你是编写用于将数据推送到索引的应用程序代码,还是使用可自动执行数据引入和添加 AI 扩充的索引器,包含内容的字段都被持久保存在索引中,客户端应用程序可以搜索这些字段。 字段用于搜索、筛选和排序,以生成一组结果,客户端应用程序可以显示或者以其他方式使用这些结果。