使用 Azure AI 服務進行啟動的常見問題。
請查看 GitHub 上適用於初學者的 Generative AI 課程。 這是一個 18 課的指示集,引進了所有主要的 Azure OpenAI 功能,並示範如何使用它們來建置應用程式。
使用 Azure AI Studio 測試各種 AI 功能,包括部署 Azure OpenAI 模型,以及套用 con 帳篷模式 ration 服務。
不同的 Azure OpenAI 模型僅限於不同的區域。 如需完整清單, 請參閱模型可用性數據表 。
除非您使用串流功能,否則影響很小。 模型本身回應的延遲對延遲的影響比區域差異大得多。
選擇使用專用的 Azure OpenAI 伺服器與隨用隨付方案,也會對 效能產生較大影響。
請參閱 管理 Azure OpenAI 服務配額 ,以瞭解配額限制的運作方式,以及如何管理配額。
如需使用隨用隨付模型的客戶(最常見的),請參閱 管理 Azure OpenAI 服務配額 頁面。 如需使用專用 Azure OpenAI 伺服器的客戶,請參閱 相關指南的配額一節 。
請考慮 在進階架構中結合多個 Azure OpenAI 部署 ,以建置一個系統,每分鐘提供更多令牌給更多使用者。
當您已妥善定義、可預測的輸送量需求時,應考慮從隨用隨付切換至布建的輸送量。 一般而言,當應用程式已準備好進行生產環境或已部署在生產環境中,且了解預期的流量時,就會發生這種情況。 這可讓使用者準確地預測所需的容量,並避免非預期的計費。
為您的應用程式建立負載平衡器。
如果您使用隨用隨付模型,請參閱負載平衡範例。 如果您使用專用的 Azure OpenAI 伺服器,請參閱 PTU 指南 以取得負載平衡的相關信息。
在 Azure AI Studio 中使用提示流程 建立在線部署。 然後,在表單編輯器或 JSON 編輯器中輸入值來測試它。
使用 Azure OpenAI Studio 的監視功能。 它提供一個儀錶板,可追蹤一段時間的模型效能計量。
請參閱人工智慧和 機器學習 技術社群論壇。
若要深入瞭解,請參閱 啟動Microsoft。