スタートアップ企業向けの Azure AI サービスの使用に関してよく寄せられる質問。
GitHub の初心者向けの Generative AI コースをご覧ください。 これは、Azure OpenAI の主要な機能をすべて紹介し、それらを使用してアプリケーションを構築する方法を示す 18 レッスンの命令セットです。
Azure AI Studio を使用して、Azure OpenAI モデルのデプロイ、適用される conテント モードration サービスなど、さまざまな AI 機能をテストします。
異なる Azure OpenAI モデルは、異なるリージョンに制限されます。 完全な一覧については、 モデルの可用性テーブル を参照してください。
ストリーミング機能を使用していない限り、影響は最小限です。 モデル独自の応答の待機時間は、リージョンの違いよりも待機時間に大きな影響を与えます。
専用の Azure OpenAI サーバーと従量課金制プランを使用する選択は、 パフォーマンスにも大きな影響を与えます。
クォータ制限のしくみと管理方法については、「 Azure OpenAI Service クォータの管理 」を参照してください。
従量課金制モデル (最も一般的) を使用しているお客様については、 Azure OpenAI Service クォータの管理 ページを参照してください。 専用の Azure OpenAI サーバーを使用しているお客様については、関連ガイドの「 quota」セクション を参照してください。
高度なアーキテクチャ 複数の Azure OpenAI デプロイを組み合わせて より多くのユーザーに 1 分あたりのより多くのトークンを提供するシステムを構築することを検討してください。
予測可能なスループット要件が明確に定義されている場合は、従量課金制からプロビジョニング済みスループットに切り替えることを検討する必要があります。 通常、これは、アプリケーションが運用環境に対応しているか、既に運用環境にデプロイされており、予想されるトラフィックを理解している場合です。 これにより、ユーザーは必要な容量を正確に予測し、予想外の課金を回避できます。
アプリケーションのロード バランサーを作成します。
従量課金制モデルを使用している場合は負荷分散のサンプルを参照してください。 専用の Azure OpenAI サーバーを使用している場合は、負荷分散の詳細については、 PTU ガイド を参照してください。
Azure AI Studio でプロンプト フロー を使用してオンライン デプロイを作成します。 次に、フォーム エディターまたは JSON エディターで値を入力してテストします。
Azure OpenAI Studio の 監視機能 を使用します。 これは、時間の経過に伴うモデルのパフォーマンス メトリックを追跡するダッシュボードを提供します。
標準チャット アプリケーションを展開するためのベスト プラクティスについてはazure OpenAI チャットリファレンス アーキテクチャを参照してください。
関連インテリジェンスと機械学習技術コミュニティ フォーラムを参照してください。
詳細については、「 Microsoft for Startups」を参照してください。