クイック スタート: Azure AI Studio プレイグラウンドでチャット モデルと会話する

Note

Azure AI Studio は、現在、パブリック プレビュー段階です。 このプレビューはサービス レベル アグリーメントなしで提供されており、運用環境ではお勧めしません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

Azure OpenAI Service と Azure AI 音声をペアリングしてより高度な対話を可能にして、アプリで会話できるようにします。

このクイックスタートでは、Azure OpenAI Service と Azure AI 音声を使用して次を行います。

  • 音声テキスト変換を介してアシスタントに話しかけます。
  • テキスト読み上げを介してアシスタントの応答を聞きます。

音声テキスト変換とテキスト読み上げ機能は、Azure AI Studio プレイグラウンドで、一緒にまたは個別に使用することができます。 プレイグラウンドを使用して、チャット モデルをデプロイする前にテストできます。

前提条件

Note

この機能は、既存の Azure OpenAI Service リソースと一緒に Azure AI ハブ リソースを作成した場合には使用できません。 Azure AI サービス プロバイダーを使用して AI ハブを作成する必要があります。 この機能は、すべてのお客様に段階的にロールアウトされています。 まだ表示されない場合は、後ほど確認してください。

  • Azure サブスクリプション。無料で作成できます

  • 目的の Azure サブスクリプション内の Azure OpenAI に付与されたアクセス権。

    現時点では、このサービスへのアクセスは申請によってのみ許可されます。 Azure OpenAI へのアクセスを申請するには、https://aka.ms/oai/access のフォームに入力してください。 問題がある場合は、このリポジトリで問題をオープンしてお問い合わせください。

  • チャット モデルがデプロイされた Azure AI ハブ リソース。 モデル デプロイの詳細については、リソース デプロイ ガイドを参照してください。

  • Azure AI Studio の Azure AI プロジェクト

プレイグラウンドを構成する

チャット セッションを開始する前に、音声テキスト変換とテキスト読み上げ機能を使用するようにプレイグラウンドを構成する必要があります。

  1. Azure AI Studio にサインインします。

  2. ご自分のプロジェクトに移動するか、Azure AI Studio で新しいプロジェクトを作成します。

  3. 上部のメニューから [ビルド] を選択し、折りたたみ可能な左側のメニューから [プレイグラウンド] を選択します。

  4. [モード] ドロップダウンから[チャット] が選択されていることを確認します。 [デプロイメント] ドロップダウンから、デプロイされたチャット モデルを選択します。

    モードとデプロイが強調表示されているチャット プレイグラウンドのスクリーンショット。

  5. [プレイグラウンド設定] ボタンを選択します。

    プレイグラウンドの設定にアクセスするためのオプションを含むチャット プレイグラウンドのスクリーンショット。

    Note

    マイクまたはスピーカー ボタンを選択するオプションも表示されます。 これらのボタンのいずれかを選択したが、音声テキスト変換またはテキスト読み上げをまだ有効にしていない場合は、[プレイグラウンド設定]で有効にするように求められます。

  6. [プレイグラウンド設定] ページで、スピーチ機能を使用すると追加コストが発生することを確認するボックスを選択します。 詳細については、「Azure AI Speech の価格」を参照してください。

  7. [音声テキスト変換を有効にする][テキスト読み上げを有効にする] を選択します。

    [プレイグラウンド設定] ページのスクリーンショット。

  8. 会話に使用する言語ロケールと音声を選択します。 使用可能な音声の一覧は、選択したロケールによって異なります。

    [プレイグラウンド設定] ページのスクリーンショット。日本語を話す音声が選択されています。

  9. 必要に応じて、サンプル テキストを入力し、[再生] を選択して音声を試すことができます。

  10. [保存] を選択します。

チャット セッションを開始する

このチャット セッションでは、音声テキスト変換とテキスト読み上げの両方を使用します。 音声テキスト変換機能を使用してアシスタントに話しかけ、テキスト読み上げ機能を使用してアシスタントの応答を聞きます。

  1. まだ行っていない場合は、「プレイグラウンドを構成する」セクションの手順を実行します。 このクイックスタートを完了するには、音声テキスト変換とテキスト読み上げ機能を有効にする必要があります。

  2. マイク ボタンを選択し、アシスタントに話しかけます。 たとえば、"Xbox を入手できる場所を知っていますか" と言うことができます。

    有効なマイク アイコンと [送信] ボタンが強調表示されているチャット セッションのスクリーンショット。

  3. 送信ボタン (右矢印) を選択して、アシスタントにメッセージを送信します。 アシスタントの応答がチャット セッション ウィンドウに表示されます。

    アシスタントの応答を含むチャット セッションのスクリーンショット。

    Note

    スピーカー ボタンがオンになっている場合は、アシスタントの応答が聞こえます。 スピーカー ボタンがオフの場合、アシスタントの応答は聞こえませんが、応答はチャット セッション ウィンドウに表示されます。

  4. システム プロンプトを変更して、アシスタントの応答形式またはスタイルを変更できます。

    たとえば、次のように入力します。

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    応答はチャット セッション ウィンドウに表示されます。 スピーカー ボタンがオンになっているため、さらに応答が聞こえます。

    システム プロンプトが編集されたチャット セッションのスクリーンショット。

サンプル コードの表示

[コードの表示] ボタンを選択すると、Azure OpenAI および音声サービスの構成を含むサンプル コードを表示およびコピーできます。 サンプル コードを使用して、アプリケーションで音声テキスト変換とテキスト読み上げを有効にすることができます。

プレイグラウンドでコードを表示するスクリーンショット。

ヒント

別の例については、音声間チャットのコード例に関する記事を参照してください。

リソースをクリーンアップする

不要な Azure コストが発生しないように、このクイックスタートで作成したリソースが不要になったら削除してください。 リソースを管理するために、Azure portal を使用できます。

次のステップ