Azure AI Foundry プレイグラウンド

2025-06-13

Von Bedeutung

この記事で "(プレビュー)" と付記されている項目は、現在、パブリックプレビュー段階です。このプレビューはサービスレベルアグリーメントなしで提供されており、運用環境ではお勧めしません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳細については、「 Microsoft Azure プレビューの追加使用条件」を参照してください。

最新のモデルを使用して構築し、エージェントとアプリをビルドする際に、Azure AI Foundry プレイグラウンドは、1 行のコードを運用コードベースにコミットする前に、迅速なプロトタイプ作成、API 探索、および技術的検証用に設計された、オンデマンドのゼロセットアップ環境を提供します。

Azure AI Foundry プレイグラウンドエクスペリエンスのハイライト

Azure AI Foundry プレイグラウンドエクスペリエンスのハイライトには、次のようなものがあります。

AgentOps では、Agents プレイグラウンドでの評価とトレースがサポートされます。
チャットとエージェントのプレイグラウンド用の [VS Code で開く]。この機能を使用すると、多言語コードサンプル用にエンドポイントとキーを Azure AI Foundry から VS Code に自動的にインポートすることで、時間を節約できます。
gpt-image-1、Stable Diffusion 3.5 Large、Bria 2.3 Fast モデル用の Images Playground 2.0。
gpt-4o-audio、gpt-4o-transcribe、gpt-4o-mini-tts モデルのオーディオプレイグラウンド。
Azure OpenAIOra のビデオプレイグラウンド。

ヒント

プレイグラウンドのランディングページのスクリーンショットでは、ポータルの左側のウィンドウがカスタマイズされ、[プレイグラウンド] タブが表示されています。左側のウィンドウに他の項目を表示する方法の詳細については、「左側のウィンドウをカスタマイズする」を参照してください。

制作の前奏としての遊び場

最新の開発では、多くの場合、フレームワークへの完全なコミット、テストの記述、インフラストラクチャの起動の準備が整う前に、複数のシステム (API、サービス、SDK、データモデル) で作業する必要があります。ソフトウェアエコシステムの複雑さが増すにつれて、アイデアを検証するための安全で軽量な環境の必要性が重要になります。遊び場は、このニーズを満たすために建てられました。

Azure AI Foundry プレイグラウンドでは、必要なすべてのツールと機能がプレインストールされたすぐに使用できる環境が提供されるため、プロジェクトの設定、依存関係の管理、互換性の問題の解決が不要になります。プレイグラウンドは、API の動作を検証し、コードにすばやく移動し、実験のコストと出荷までの時間を削減し、統合を加速し、プロンプトを最適化することで、 開発者の速度を加速 させることができます。

プレイグラウンドでは、時間ではなく数秒で回答を提供し、大規模な構築にコミットする前にアイデアをテストして検証できるようにすることで、質問がある場合に すばやく明確 になります。たとえば、プレイグラウンドは次のような質問にすばやく答えるのに最適です。

必要な出力を取得するために必要な最小限のプロンプトは何ですか?
完全な統合を記述する前に、このロジックは機能しますか?
待機時間やトークンの使用は、構成によってどのように変化しますか?
エージェントに進化させる前に、最適な価格とパフォーマンスの比率を提供するモデルは何ですか?

VS Code 機能で開く

チャットプレイグラウンドとエージェントプレイグラウンドを使用すると、VS Code の Azure AI Foundry 拡張機能で使用できる [VS Code で開く] ボタンを使用して、VS Code で作業できます。

多言語のサンプルコードサンプルで使用できる "VS Code で開く" を使用すると、コードサンプル、API エンドポイント、およびキーを、 /azure 環境の VS Code ワークスペースに自動インポートできます。この機能により、Azure AI Foundry ポータルから VS Code IDE で簡単に作業できます。

チャットとエージェントのプレイグラウンドから "VS Code で開く" 機能を使用するには、次の手順に従います。

[ チャットプレイグラウンドを試す ] を選択して開きます。または、[エージェントの遊び場] カードで [ Let's go ]\(エージェントの遊び場に移動する\) を選択して、エージェントプレイグラウンドで次の手順を実行することもできます。
デプロイがまだない場合は、[ 新しいデプロイの作成 ] を選択し、 gpt-4o-miniなどのモデルをデプロイします。
デプロイメントボックスでデプロイメントが選択されていることを確認してください。
[ コードの表示] を選択して、コードサンプルを表示します。
[ VS Code で開く ] を選択して、ブラウザーウィンドウの新しいタブで VS Code を開きます。
コードサンプル、API エンドポイント、キーが Azure AI Foundry プレイグラウンドから既にインポートされている VS Code の /azure 環境にリダイレクトされます。
READ.ME ファイルを参照して、モデルを実行する手順を確認します。
run_model.pyでコードサンプルを表示します。
requirements.txt ファイル内の関連する依存関係を表示します。

エージェントのプレイグラウンド

エージェントプレイグラウンドを使用すると、コードを実行することなく、エージェントを探索、プロトタイプ作成、テストできます。このページから、新しいアイデアを簡単に反復して、実験できます。 Agents プレイグラウンドの使用を開始するには、「クイックスタート: 新しいエージェントを作成する」を参照してください。

チャットプレイグラウンド

チャットプレイグラウンドは、Azure OpenAI、DeepSeek、Meta の最新の推論モデルをテストする場所です。チャットプレイグラウンドの詳細については、「クイックスタート: Azure AI Foundry ポータルでチャットプレイグラウンドを使用する」を参照してください。

すべての推論モデルに対して、チャットプレイグラウンドには、モデルが出力を共有する前に応答を通じてどのように考えていたかを確認できる、考え方のチェーンの概要ドロップダウンが用意されています。

オーディオプレイグラウンド

オーディオプレイグラウンド (プレビュー) を使用すると、Azure OpenAI の最新のオーディオモデルでテキスト読み上げと文字起こしの機能を使用できます。

テキスト読み上げ機能を試すには、次の手順に従います。

[ オーディオプレイグラウンドを試す ] を選択して開きます。
デプロイがまだない場合は、[ 新しいデプロイの作成 ] を選択し、 gpt-4o-mini-ttsなどのモデルをデプロイします。
[デプロイ] ボックス内でデプロイメントが選択されていることを確認してください。
テキストプロンプトを入力します。
音声や応答の形式などのモデルパラメーターを調整します。
再生、巻き戻し、転送、速度の調整、音量を含む再生コントロールを含む音声出力を受信するには、[ 生成] を選択します。
オーディオファイルをローカルコンピューターにダウンロードします。

文字起こし機能を試すには、次の手順に従います。

デプロイがまだない場合は、[ 新しいデプロイの作成 ] を選択し、 gpt-4o-transcribeなどのモデルをデプロイします。
(省略可能)オーディオ入力をガイドするテキストメカニズムとしてフレーズリストを含めます。
1 つをアップロードするか、プロンプトバーからオーディオを記録して、オーディオファイルを入力します。
[ 文字起こしの生成] を選択して、オーディオ入力をモデルに送信し、テキスト形式と JSON 形式の両方で文字起こしされた出力を受け取ります。

ビデオプレイグラウンド

ビデオプレイグラウンド (プレビュー) は、生成ビデオワークフローを探索、調整、検証するための迅速な反復環境です。これは、精度、制御、速度を備えたアイデアからプロトタイプに移行する必要がある開発者向けに設計されています。遊び場では、プロンプト構造のテスト、モーションの忠実性の評価、フレーム間のモデルの整合性の評価、モデル間の出力の比較を行う低摩擦インターフェイスが提供されます。定型句や計算サイクルを無駄にすることなく、モデル間で出力を比較できます。また、最高製品責任者とエンジニアリングVPのための素晴らしいデモインターフェイスです。

すべてのモデルエンドポイントは、 Azure AI Content Safety と統合されます。その結果、有害で安全でない画像は、ビデオの遊び場に表示される前に除外されます。テキストプロンプトとビデオ生成にコンテンツモデレーションポリシーのフラグが設定されている場合は、警告通知が表示されます。

Azure OpenAIOra モデルでは、ビデオプレイグラウンドを使用できます。

ヒント

業界別にエンタープライズ対応のユースケースを変換する方法については、Azure OpenAIOra のビデオプレイグラウンドの 60 秒リールと DevBlog を参照してください。

ビデオプレイグラウンドを使用するには、次の手順に従います。

注意事項

生成されたビデオは、データのプライバシーのために 24 時間保持されます。リテンション期間を長くするために、ビデオをローカルコンピューターにダウンロードします。

[ ビデオプレイグラウンドを試す ] を選択して開きます。
デプロイがまだない場合は、ホームページの右上にある [ 今すぐデプロイ ] を選択し、 sora モデルをデプロイします。
ビデオプレイグラウンドのホームページでは、業界フィルターで並べ替えられた既存のプロンプトからヒントを得られます。ここから、ビデオをフルディスプレイで表示し、プロンプトをコピーしてそこからビルドすることができます。
プロンプトをコピーすると、プロンプトバーに貼り付けられます。特定のモデルの応答性と制約を深く理解するために、キーコントロール (縦横比や解像度など) を調整します。
コピーしたプロンプトに基づいてビデオを生成するには、[ 生成 ] を選択します。
[AI を使用して書き直す] を使用して、gpt-4o でテキストプロンプト構文を書き直します。
業界のシステムプロンプト機能でスタート画面をオンにし、業界を選択し、元のプロンプトに必要な変更を指定します。
[ 更新] を選択してプロンプトを更新し、[ 生成 ] を選択して新しいビデオを作成します。
[世代の履歴] タブに移動して、世代をグリッドまたはリストビューとして確認します。ビデオを選択したら、全画面表示モードで開き、完全に没入します。プロンプトの微調整やパラメーターの変更を通じて出力を視覚的に観察します。
全画面表示モードで、プロンプトを編集し、再生成のために送信します。
全画面表示モードで、またはビデオをポイントしたときに表示されるオプションボタンを使用するか、ローカルコンピューターにビデオをダウンロードし、ビデオ生成情報タグを表示するか、コードを表示するか、ビデオを削除します。
オプションメニューから [ コードの表示 ] を選択すると、Python、JavaScript、C#、JSON、Curl、Go など、複数の言語でビデオ生成のコンテキストサンプルコードが表示されます。
VS Code にコピーして、コードサンプルを運用環境に移植します。

ビデオプレイグラウンドで実験するときに検証する内容

実稼働ワークロードを計画するときにビデオプレイグラウンドを使用する場合は、次の属性を調べて検証できます。

プロンプトからモーションへの変換
- ビデオモデルは、論理的かつ一時的な意味を持つ方法でプロンプトを解釈しますか?
- モーションは、記述されたアクションまたはシーンと一貫性がありますか?
フレームの整合性
- 文字、オブジェクト、スタイルはフレーム間で一貫していますか?
- 視覚的なアーティファクト、ジッター、または不自然な遷移はありますか?
シーンコントロール
- シーンの構成、被写体の動作、カメラの角度をどの程度適切に制御できますか?
- シーンの切り替えやバックグラウンド環境をガイドできますか?
長さとタイミング
- さまざまなプロンプト構造がビデオの長さとペーシングにどのように影響しますか?
- ビデオの感じが速すぎるか、遅すぎるか、または短すぎますか?
マルチモーダル入力の統合
- 参照画像、ポーズデータ、またはオーディオ入力を指定するとどうなりますか?
- あるボイスオーバーにリップシンクを使用してビデオを生成できますか?
後処理のニーズ
- 編集ツールが必要となる前に、どのレベルの生の忠実性が期待できますか?
- 運用環境で使用する前に、ビデオをアップスケール、安定化、またはリタッチする必要がありますか?
待機時間とパフォーマンス
- さまざまなプロンプトの種類や解像度に対するビデオの生成にはどのくらいの時間がかかりますか?
- 5s と 15s クリップを生成する場合のコストパフォーマンスのトレードオフは何ですか?

画像プレイグラウンド

イメージの遊び場は、イメージ生成フローを構築する開発者に最適です。このプレイグラウンドは、モデル固有の API が画像を生成および編集できるように設計された、忠実度の高い実験用のフル機能の制御された環境です。

ヒント

業界別にエンタープライズ対応のユースケースを変換する方法については、gpt-image-1 の Images プレイグラウンドの 60 秒リールと DevBlog を参照してください。

イメージプレイグラウンドは、次のモデルで使用できます。

Azure OpenAI の gpt-image-1。
ステーブル・ディフュージョン 3.5 ラージ、ステーブル・イメージコア、ステビリティ AI のステーブル・イメージウルトラ。
Bria 2.3 Fast from Bria AI。

イメージプレイグラウンドを使用するには、次の手順に従います。

[ イメージのプレイグラウンドを試す ] を選択して開きます。
デプロイがまだない場合は、[ 新しいデプロイの作成 ] を選択し、 gpt-image-1などのモデルをデプロイします。
事前構築済みのテキストプロンプトから開始する: プロンプトバーに自動的に入力される事前構築済みのテキストプロンプトを開始するオプションを選択します。
モデルデプロイ後のモデル API 固有の生成コントロールを調べる: 特定のモデルの応答性と制約を深く理解するために、キーコントロール (バリアントの数、品質、強度など) を調整します。
グリッドビューでの並べて表示: プロンプトの微調整やパラメーターの変更を通じて出力を視覚的に観察します。
API ツールを使用した変換: gpt-image-1 では、テキスト変換によるインペイントを使用できます。インペイント選択で元のイメージの一部を変更します。テキストプロンプトを使用して変更を指定します。
多言語コードサンプルを使用した運用環境への移植: "コードの表示" で Python、Java、JavaScript、C# コードサンプルを使用します。イメージプレイグラウンドは、VS Code での開発作業のスタートパッドです。

画像プレイグラウンドで実験する際に検証すべきこと

イメージプレイグラウンドを使用すると、運用ワークロードを計画するときに次の内容を調べて検証できます。

プロンプトの有効性
- このプロンプトでは、エンタープライズユースケースに対してどのような種類のビジュアル出力が生成されますか?
- 自分の言語はどのくらい具体的または抽象的であり、それでも良い結果を得ることができますか?
- モデルは、"シュールレアリスト" や "サイバーパンク" などのスタイル参照を正確に理解していますか?
スタイルの一貫性
- 複数の画像で同じ文字、スタイル、またはテーマを維持するにはどうすればよいですか?
- ドリフトを最小限に抑えながら、同じベースプロンプトのバリエーションを反復処理できますか?
パラメーターのチューニング
- ガイダンススケール、シード、ステップなど、モデルパラメーターを変更した場合の影響は何ですか?
- 創造性とプロンプトの忠実性のバランスを取る方法
モデルの比較
- モデル間で結果がどのように異なるか (例えば、SDXL と DALL·E)?
- 現実的な顔と芸術的な構成に対して、どのモデルの方がパフォーマンスが良いですか?
コンポジションコントロール
- 境界ボックスや塗りつぶしマスクなどの空間制約を使用するとどうなりますか?
- モデルを特定のレイアウトまたはフォーカルポイントに導くことができますか?
入力バリエーション
- プロンプトの文言や構造のわずかな変更は、結果にどのように影響しますか?
- 対称性、特定のカメラ角度、または感情を求める最良の方法は何ですか?
Integration Readiness
- この画像は、製品の UI (縦横比、解像度、コンテンツの安全性) の制約を満たしていますか?
- 出力はブランドガイドラインや顧客の期待に準拠していますか?

次の方法で共有

Azure AI Foundry プレイグラウンド

Azure AI Foundry プレイグラウンド エクスペリエンスのハイライト