有关将 Azure AI 服务用于启动的常见问题。
查看 GitHub 上面向初学者 的 Generative AI 课程。 这是一个 18 课的指令集,介绍所有主要的 Azure OpenAI 功能,并演示如何使用它们生成应用程序。
使用 Azure AI Studio 测试各种 AI 功能,包括部署 Azure OpenAI 模型和应用 con帐篷模式ration 服务。
不同的 Azure OpenAI 模型仅限于不同的区域。 有关完整列表, 请参阅模型可用性表 。
除非使用流式处理功能,否则影响很小。 与区域差异相比,模型自己的响应的延迟对延迟的影响要大得多。
选择使用专用的 Azure OpenAI 服务器与即用即付计划也对性能产生了更大的影响。
请参阅 “管理 Azure OpenAI 服务配额 ”,了解配额限制的工作原理以及如何管理配额。
对于使用即用即付模型(最常见的)的客户,请参阅“ 管理 Azure OpenAI 服务配额 ”页。 有关使用专用 Azure OpenAI 服务器的客户,请参阅 相关指南的配额部分 。
请考虑 在高级体系结构中组合多个 Azure OpenAI 部署 ,以构建一个系统,以每分钟向更多用户提供更多令牌。
在明确定义的可预测吞吐量要求时,应考虑从即用即付切换到预配的吞吐量。 通常情况下,当应用程序已准备好用于生产或已部署在生产环境中,并且对预期流量有了解时,则会出现这种情况。 这使得用户可以准确预测所需的容量,并避免被意外收费。
为应用程序创建负载均衡器。
如果使用即用即付模型,请参阅负载均衡示例。 如果使用专用 Azure OpenAI 服务器,请参阅 PTU 指南 ,了解有关负载均衡的信息。
在 Azure AI Studio 中使用提示流 创建联机部署。 然后,通过在窗体编辑器或 JSON 编辑器中输入值来测试它。
使用 Azure OpenAI Studio 的监视功能。 它提供一个仪表板,用于跟踪随时间推移模型的性能指标。
请参阅人工智能和机器学习技术社区论坛。
若要了解详细信息,请参阅 适用于启动Microsoft。