次の方法で共有


クイック スタート: AI Studio チャット プレイグラウンドでチャット モデルと会話する

重要

この記事で説明する機能の一部は、プレビューでのみ使用できる場合があります。 このプレビューはサービス レベル アグリーメントなしで提供されており、運用環境ではお勧めしません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

Azure OpenAI Service と Azure AI 音声をペアリングしてより高度な対話を可能にして、アプリで会話できるようにします。

このクイックスタートでは、Azure OpenAI Service と Azure AI 音声を使用して次を行います。

  • 音声テキスト変換を介してアシスタントに話しかけます。
  • テキスト読み上げを介してアシスタントの応答を聞きます。

音声テキスト変換とテキスト読み上げ機能は、AI Studio チャット プレイグラウンドで、一緒にまたは個別に使用できます。 プレイグラウンドを使用して、チャット モデルをデプロイする前にテストできます。

前提条件

チャット プレイグラウンドを構成する

チャット セッションを開始する前に、音声テキスト変換とテキスト読み上げ機能を使用するようにチャット プレイグラウンドを構成する必要があります。

  1. Azure AI Studio にサインインします。

  2. ご自分のプロジェクトに移動するか、Azure AI Studio で新しいプロジェクトを作成します。

  3. 左側のウィンドウで [プレイグラウンド]>[チャット] を選択します。

  4. [デプロイメント] ドロップダウンから、デプロイされたチャット モデルを選択します。

    モードとデプロイが強調表示されているチャット プレイグラウンドのスクリーンショット。

  5. [プレイグラウンド設定] ボタンを選択します。

    プレイグラウンドの設定にアクセスするためのオプションを含むチャット プレイグラウンドのスクリーンショット。

    Note

    マイクまたはスピーカー ボタンを選択するオプションも表示されます。 これらのボタンのいずれかを選択しても、音声テキスト変換またはテキスト読み上げをまだ有効にしていない場合は、[プレイグラウンド設定]で有効にするように求められます。

  6. [プレイグラウンド設定] ページで、スピーチ機能を使用すると追加コストが発生することを確認するボックスを選択します。 詳細については、「Azure AI Speech の価格」を参照してください。

  7. [音声テキスト変換を有効にする][テキスト読み上げを有効にする] を選択します。

    [プレイグラウンド設定] ページのスクリーンショット。

  8. 会話に使用する言語ロケールと音声を選択します。 使用可能な音声の一覧は、選択したロケールによって異なります。

    [プレイグラウンド設定] ページのスクリーンショット。日本語を話す音声が選択されています。

  9. 必要に応じて、サンプル テキストを入力し、[再生] を選択して音声を試すことができます。

  10. [保存] を選択します。

チャット セッションを開始する

このチャット セッションでは、音声テキスト変換とテキスト読み上げの両方を使用します。 音声テキスト変換機能を使用してアシスタントに話しかけ、テキスト読み上げ機能を使用してアシスタントの応答を聞きます。

  1. まだ行っていない場合は、「プレイグラウンドを構成する」セクションの手順を実行します。 このクイックスタートを完了するには、音声テキスト変換とテキスト読み上げ機能を有効にする必要があります。

  2. マイク ボタンを選択し、アシスタントに話しかけます。 たとえば、"Xbox を入手できる場所を知っていますか" と言うことができます。

    有効なマイク アイコンと [送信] ボタンが強調表示されているチャット セッションのスクリーンショット。

  3. 送信ボタン (右矢印) を選択して、アシスタントにメッセージを送信します。 アシスタントの応答がチャット セッション ウィンドウに表示されます。

    アシスタントの応答を含むチャット セッションのスクリーンショット。

    Note

    スピーカー ボタンがオンになっている場合は、アシスタントの応答が聞こえます。 スピーカー ボタンがオフの場合、アシスタントの応答は聞こえませんが、応答はチャット セッション ウィンドウに表示されます。

  4. システム プロンプトを変更して、アシスタントの応答形式またはスタイルを変更できます。

    たとえば、次のように入力します。

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    応答はチャット セッション ウィンドウに表示されます。 スピーカー ボタンがオンになっているため、さらに応答が聞こえます。

    システム プロンプトが編集されたチャット セッションのスクリーンショット。

サンプル コードの表示

[コードの表示] ボタンを選択すると、Azure OpenAI および音声サービスの構成を含むサンプル コードを表示およびコピーできます。

プレイグラウンドでサンプル コードを表示するボタンのスクリーンショット。

サンプル コードを使用して、アプリケーションで音声テキスト変換とテキスト読み上げを有効にすることができます。

プレイグラウンドでコードを表示するスクリーンショット。

ヒント

別の例については、音声間チャットのコード例に関する記事を参照してください。

リソースをクリーンアップする

不要な Azure コストが発生しないように、このクイックスタートで作成したリソースが不要になったら削除してください。 リソースを管理するために、Azure portal を使用できます。

次のステップ