適用於初創公司的 AI 常見問題

使用 Azure AI 服務進行啟動的常見問題。

開始使用

針對我的啟動開始使用 Azure OpenAI 服務的最佳方式為何?

請查看 GitHub 上適用於初學者的 Generative AI 課程。 這是一個 18 課的指示集,引進了所有主要的 Azure OpenAI 功能,並示範如何使用它們來建置應用程式。

如何使用低/無程序代碼方法快速測試 Azure AI 功能?

使用 Azure AI Studio 測試各種 AI 功能,包括部署 Azure OpenAI 模型,以及套用 con 帳篷模式 ration 服務

區域可用性和數據落地

OpenAI 服務可在哪一個 Azure 區域中使用?

不同的 Azure OpenAI 模型僅限於不同的區域。 如需完整清單, 請參閱模型可用性數據表

區域選擇如何影響 Azure OpenAI 服務的延遲和效能?

除非您使用串流功能,否則影響很小。 模型本身回應的延遲對延遲的影響比區域差異大得多。

選擇使用專用的 Azure OpenAI 伺服器與隨用隨付方案,也會對 效能產生較大影響。

速率限制和資源管理

如何確保我的應用程式可以調整其 Azure OpenAI 配額?

請參閱 管理 Azure OpenAI 服務配額 ,以瞭解配額限制的運作方式,以及如何管理配額。

Azure OpenAI 服務的速率限制為何,以及如何管理這些限制?

如需使用隨用隨付模型的客戶(最常見的),請參閱 管理 Azure OpenAI 服務配額 頁面。 如需使用專用 Azure OpenAI 伺服器的客戶,請參閱 相關指南的配額一節

如何? 處理 Azure OpenAI 服務中的每分鐘令牌限制?

請考慮 在進階架構中結合多個 Azure OpenAI 部署 ,以建置一個系統,每分鐘提供更多令牌給更多使用者。

何時應該使用專用的 Azure OpenAI 伺服器 (PTU), 而不是隨用隨付模型?

當您已妥善定義、可預測的輸送量需求時,應考慮從隨用隨付切換至布建的輸送量。 一般而言,當應用程式已準備好進行生產環境或已部署在生產環境中,且了解預期的流量時,就會發生這種情況。 這可讓使用者準確地預測所需的容量,並避免非預期的計費。

負載平衡和調整

如何? 管理高流量,並確保我的 Azure OpenAI 應用程式保持回應?

為您的應用程式建立負載平衡器。

如果您使用隨用隨付模型,請參閱負載平衡範例。 如果您使用專用的 Azure OpenAI 伺服器,請參閱 PTU 指南 以取得負載平衡的相關信息。

開發與測試

如何? 設定開發環境以測試 Azure OpenAI 應用程式?

在 Azure AI Studio 中使用提示流程 建立在線部署。 然後,在表單編輯器或 JSON 編輯器中輸入值來測試它。

監視和計量

如何追蹤和評估 AI 應用程式的使用計量?

我可以使用哪些工具來監視 Azure OpenAI 端點的效能?

使用 Azure OpenAI Studio 的監視功能。 它提供一個儀錶板,可追蹤一段時間的模型效能計量。

生產實作和最佳做法

在 Azure 上將 OpenAI 應用程式部署至生產環境有哪些最佳做法?

您可以提供成功實作 Azure OpenAI 服務的範例或案例研究嗎?

若要深入瞭解,請參閱 啟動Microsoft。