你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在门户中创建 Azure AI 搜索服务

Azure AI 搜索是企业的信息检索平台。 它支持传统搜索和对话式 AI 驱动的搜索,为专有内容提供“与数据聊天”体验。

创建服务最简单的方法是使用 Azure 门户,本文介绍了此方法。

还可使用 Azure PowerShellAzure CLI管理 REST APIAzure 资源管理器服务模板Bicep 文件Terraform

动画 GIF

开始之前

一些服务属性在服务生存期内是固定的。 在创建服务之前,请确定名称、区域和层。

  • 服务名称是 URL 终结点的一部分。 该名称必须具有唯一性,且必须符合命名规则。

  • 区域确定数据驻留和某些功能的可用性。 语义排序器和 Azure AI 集成具有区域要求。 确保所选区域支持所需的功能。

  • 服务层确定基础结构、服务限制和计费。 某些功能在较低层或专用层上不可用。

订阅(免费或付费)

在可计费 Azure 订阅上创建资源时,如果选择了计费层级(基本或更高),就会出现付费(或计费)搜索。

若要免费试用 Azure AI 搜索,请打开试用版订阅,然后通过选择“免费”层来创建搜索服务。 每个 Azure 订阅可以有一个免费的搜索服务。 免费搜索服务适用于非生产应用程序的产品的短期评估。 通常,你可以完成所有快速入门和大多数教程,具有语义排序器的除外(它需要计费服务)。 Microsoft 可能会删除长时间处于非活动状态的免费服务,以便为其他服务腾出空间。

或者,可以使用免费额度试用付费 Azure 服务。 使用此方法时,你可以在基础或更高版本创建搜索服务以获取更多容量。 除非显式更改设置并要求付费,否则不会对信用卡收取任何费用。 另一种方法是在 Visual Studio 订阅中激活 Azure 额度。 一份 Visual Studio 订阅每月提供可用来试用付费版 Azure 服务的信用额度。

查找 Azure AI 搜索产品/服务

  1. 登录 Azure 门户

  2. 选择左上角的“创建资源”

  3. 使用搜索栏找到“Azure AI 搜索”。

门户中的“创建资源”页的屏幕截图。

选择订阅

如果有多个订阅,请选择一个用于搜索服务。 如果你要实施客户管理的加密或使用依赖于托管服务标识的其他功能来执行外部数据访问,请为 Azure Key Vault 或使用托管标识的其他服务选择同一订阅。

设置资源组

资源组是用于保存 Azure 解决方案相关资源的容器。 它对于整合相同的解决方案资源、监视成本以及检查搜索服务的创建日期非常有用。

门户中的“创建资源组”页的屏幕截图。

随着时间的变化,你可以统一跟踪当前成本和预计成本,或者查看单个资源的费用。 以下屏幕截图显示了在将多个资源合并到一个组时,可以看到的成本信息的种类。

门户中“管理成本”页的屏幕截图。

提示

资源组可以简化清理,因为删除某个资源组会删除其中的所有内容。

为服务命名

在“实例详细信息”中的“URL”字段内提供服务名称。 该名称是终结点的一部分,API 调用针对此终结点发出:https://your-service-name.search.windows.net。 例如,如果希望终结点为 https://myservice.search.windows.net,则输入 myservice

服务名称要求:

  • 在 search.windows.net 命名空间中唯一
  • 长度为 2 到 60 个字符
  • 由小写字母、数字或短划线 (-) 组成
  • 前两个字符或最后一个字符不能为短划线
  • 不要在任何位置使用连续的短划线

提示

如果你有多个搜索服务,则在服务名称中包含区域(或位置)作为命名约定会有所帮助。 在决定如何组合或附加资源时,像 mysearchservice-westus 这样的名称可以免去查看属性页的步骤。

选择区域

重要

由于需求巨大,Azure AI 搜索目前不可用于某些区域的新实例。

如果使用多个 Azure 服务,通过将所有服务置于同一区域中,可最大程度降低或取消带宽费用。 同区域服务之间的数据流出不收取任何费用。

通常,请选择你附近的区域,除非以下事项适用:

  • 离你最近的区域已达到容量上限。 使用 Azure 门户进行资源设置的一个优点是,它仅提供可用的区域和层级。

  • 你希望使用集成式数据分块和矢量化或内置技能进行 AI 扩充。 集成操作具有区域要求。

  • 你希望将 Azure 存储用于基于索引器的索引编制,或者你需要存储不在索引中的应用程序数据。 调试会话状态、扩充缓存和知识存储是依赖于 Azure 存储的 Azure AI 搜索功能。 你为 Azure 存储选择的区域对网络安全有影响。 具体而言,如果要设置防火墙,则应将资源放置在单独的区域中。 有关详细信息,请参阅从 Azure AI 搜索到 Azure 存储的出站连接

用于选择区域的清单

  1. 附近的区域中是否提供了 Azure AI 搜索? 请参阅支持的区域的列表

  2. 你有考虑特定的层级吗? 检查每个层级的区域可用性

  3. 你是否具有业务连续性和灾难恢复 (BCDR) 要求? 在可用性区域区域对中创建两个或多个搜索服务。 例如,如果你在北美运营,则可以为每个搜索服务选择“美国东部”和“美国西部”或“美国中北部”和“美国中南部”。

  4. 是否需要 AI 扩充集成式数据分块和矢量化或者多模态图像搜索? Azure AI 搜索、Azure OpenAI 和 Azure AI 多服务必须存在于相同的区域中。

    • Azure OpenAI 区域开始,因为它具有最大的可变性。 Azure OpenAI 提供用于 RAG 和集成矢量化的嵌入模型和聊天模型。

    • 检查 Azure AI 搜索区域是否与你的 Azure OpenAI 区域匹配。 如果你使用的是 OCR、实体识别或其他由 Azure AI 支持的技能,则“AI 集成”列将指示 Azure AI 多服务是否与 Azure AI 搜索位于同一区域

    • 检查多模态嵌入区域以获取多模态 API 和图像搜索。 此 API 可通过 Azure AI 多服务帐户进行访问,但其可用区域比 Azure AI 多服务整体要少。

重叠最多的区域

目前,以下区域在所有三项服务(Azure AI Search、Azure OpenAI 和 Azure AI Vision 多模态)之间提供跨区域支持。 此列表并不是最终版本,除这里列出的区域之外,可能还有更多区域,具体取决于层级。 此外,区域状态可能会迅速变化,因此在安装之前,请务必确认区域选择。

  • 美洲:美国西部
  • 欧洲:法国中部、欧洲北部、瑞典中部

选择层

Azure AI 搜索以多个定价层提供:免费、基本、标准或存储优化。 每个层都有自己的容量和限制。 还有几种功能依赖于层。

查看层级描述,了解计算特征、功能可用性区域可用性

“基本”和“标准”是生产工作负载的最常用选项,但很多客户会从“免费”服务开始。 在计费层中,主要差别在于分区大小和速度,以及可创建对象的数目限制。

“选择定价层”页的屏幕截图。

2024 年 4 月 3 日之后创建的搜索服务在每个计费层级上都具有更大的分区和更高的矢量配额。

请记住,创建服务后无法更改定价层。 如果需要更高或更低的层,应重新创建该服务。

创建服务

提供所需的输入后,继续创建服务。

“查看并创建服务”页的屏幕截图。

服务在几分钟内即可部署。 可以通过 Azure 通知监视进度。 考虑将该服务固定到仪表板,以方便将来访问。

“监视并固定服务”页的屏幕截图。

配置身份验证

除非使用门户访问新服务,否则,以编程方式访问新服务需要提供 URL 终结点和已通过身份验证的连接。 你可以使用以下这些选项的一个或全部:

  1. 设置编程式连接时,你需要使用搜索服务终结点。 在“概览”页的右侧找到并复制 URL 终结点。

    包含 URL 终结点的服务“概述”页的屏幕截图。

  2. 若要设置身份验证选项,请使用“密钥”页。 为简单起见,大多数快速入门和教程都使用 API 密钥,但如果你要为生产工作负载设置服务,请考虑使用 Azure 角色。 可以从此页面复制密钥。

    包含身份验证选项的“密钥”页的屏幕截图。

基于门户的任务不需终结点和密钥。 门户已链接到具有管理员权限的 Azure AI 搜索资源。 有关门户演练,请从快速入门:在门户中创建 Azure AI 搜索索引开始。

扩展服务

预配某个搜索服务后,可以对其进行扩展以满足需求。 在计费层上,可以在两个维度上缩放服务:副本和分区。 对于免费服务,无法进行纵向扩展,并且不提供副本和分区配置。

“分区”允许服务存储和搜索更多文档

“副本”允许服务处理负载更高的搜索查询

添加资源会增加每月账单费用。 可以通过定价计算器来了解添加资源对账单明细的影响。 请记住,可以根据负载来调整资源。 例如,可以通过增加资源来创建完整的初始索引,在以后再将资源减少到与增量索引编制相适应的某个程度。

  1. 在 Azure 门户中转到“搜索服务”页。
  2. 在左侧导航窗格中,选择“设置”“缩放”。
  3. 使用滑块添加任一类型的资源。

“缩放”页的屏幕截图。

何时添加第二个服务

大多数客户只使用在层中预配的一个服务便足以满足预期负载。 一个服务可以托管多个索引(但受制于所选层的最大限制),各索引之间相互隔离。 在 Azure AI 搜索中,请求只能定向到一个索引,从而将从同一服务中的其他索引意外或有意检索数据的可能性降至最低。

尽管大多数客户只使用一个服务,但若有以下操作要求,则可能需要提供服务冗余:

  • 业务连续性和灾难恢复 (BCDR)。 如果发生中断,Azure AI 搜索不会提供即时故障转移。

  • 多租户体系结构有时会调用两个或更多服务。

  • 全局部署的应用程序可能需要在每个地理位置中使用搜索服务,以最大程度地减小延迟。

注意

在 Azure AI 搜索中,无法分离索引操作和查询操作;因此永远无需为分离的工作负载创建多个服务。 查询索引时,始终是在创建该索引时所在的服务中查询(不能在一个服务中创建索引,然后将其复制到另一个服务)。

无需为实现高可用性添加第二个服务。 在同一服务中使用两个或多个副本,便可实现查询的高可用性。 副本更新是连续的,这意味着当服务更新推出时,至少有一个副本能正常工作。有关运行时间的详细信息,请参阅服务级别协议

将多个服务添加到订阅

Azure AI 搜索限制了你可在订阅中最初创建的搜索服务数量。 如果用尽最大限额,可以请求更多配额。

必须对要请求配对的订阅具有所有者或参与者权限。 根据区域和数据中心容量,可以自动请求更多配额,将服务添加到订阅。 如果请求失败,应减少数量或提交支持工单。 如果配额大幅增加(例如超过 30 项额外服务),预计将会有一个月的周转时间。

  1. 登录到 Azure 门户,在仪表板中搜索“配额”,然后选择“配额”服务。

    结果中“配额”搜索词和“配额”服务的屏幕截图。

  2. 在配额的概述页面中,选择“搜索”。

    配额概述页面中搜索磁贴的屏幕截图。

  3. 设置筛选器,以便查看当前订阅中搜索服务的现有配额。 建议按使用情况进行筛选。

  4. 找到需要更多配额的区域和层级,然后选择“编辑”铅笔图标以开始请求。

    “我的配额”页的屏幕截图,其中有一个区域具有最大配额。

  5. 在“配额详细信息”中,指定订阅配额的位置、层级和新限制。 任何值都不能为空。 新限制必须大于当前限制。 如果区域容量有限,你的请求将不会自动获得批准。 在这种情况下,系统会代表你生成事件报告以供调查和解决。

  6. 提交请求。

  7. 在 Azure 门户中监视有关新限制的状态更新的通知。 大多数请求在 24 小时内获得批准。

后续步骤

预配服务后,可以继续在门户中创建第一个索引。

希望优化并节省云支出?