有关初创企业使用 Azure AI 服务的常见问题。
入门指南
如何为我的初创公司开始使用 Azure OpenAI 服务 的最佳方式是什么?
查看 GitHub 上适合初学者的生成式 AI课程。 这是一个 18 课指令集,介绍所有主要的 Azure OpenAI 功能,并演示如何使用它们生成应用程序。
如何使用低/无代码方法快速测试Azure AI 功能?
使用 Azure AI Foundry 门户测试各种 AI 功能,包括 deploying Azure OpenAI 模型和应用内容审查服务。
区域可用性和数据驻留
OpenAI 服务在哪些Azure区域可用?
不同的Azure OpenAI 模型仅限于不同的区域。 有关完整列表,请参阅 型号可用性表 。
区域选择如何影响 Azure OpenAI 服务的延迟和性能?
除非您使用流媒体功能,否则影响很小。 模型自身响应的延迟对延迟的影响比区域差异大得多。
选择使用专用Azure OpenAI 服务器与即用即付计划也对 性能产生更大的影响。
速率限制和资源管理
如何确保应用程序能够缩放其Azure OpenAI 配额?
请参阅 Manage Azure OpenAI 服务 配额以了解配额限制的工作原理以及如何管理配额。
Azure OpenAI 服务的速率限制是什么?如何管理它们?
对于使用即用即付模型(最常见的)的客户,请参阅
如何在 Azure OpenAI 服务 中处理每分钟令牌限制?
请考虑在高级体系结构中组合多个 Azure OpenAI 部署,以构建一个系统,每分钟为更多用户交付更多令牌。
何时应使用专用Azure OpenAI 服务器(PTU),而不是即用即付模型?
当您具有明确定义且可预测的吞吐量要求时,应考虑从即用即付切换到预置吞吐量。 通常,当应用程序已准备好用于生产环境或已部署到生产环境中,并且了解预期的流量时,就会出现这种情况。 这样,用户就可以准确预测所需的容量并避免意外计费。
负载均衡和扩展性
如何管理高流量并确保我的 Azure OpenAI 应用程序保持响应?
为您的应用程序创建负载均衡器。
如果您使用的是即用即付模型,请参阅 负载均衡示例 。 如果使用专用的 Azure OpenAI 服务器,请参阅 PTU 指南,了解有关负载均衡的信息。
开发和测试
如何设置开发环境以测试Azure OpenAI应用程序?
监控和指标
如何跟踪和评估 AI 应用程序的使用指标?
有关跟踪风险和安全指标以及许多响应质量指标的信息,请参阅 评估和监控指标 指南。
可以使用哪些工具来监控 Azure OpenAI 终结点的性能?
使用 Azure OpenAI Studio 的 监视功能。 它提供了一个控制面板,用于跟踪模型随时间推移的性能指标。
生产实施和最佳实践
在Azure上部署生产 AI 应用程序的一些最佳做法有哪些?
有关部署聊天应用程序的最佳做法,请参阅 基线Microsoft Foundry 聊天参考体系结构 。
能否提供成功实现Azure OpenAI 服务的示例或案例研究?
请参阅 人工智能和机器学习 技术社区论坛。
相关内容
若要了解详细信息,请参阅 Microsoft for Startups。