プロフェッショナル音声用のプロジェクトを作成する

データ、モデル、テスト、エンドポイントなどのカスタム ニューラル音声用のコンテンツは、Speech Studio のプロジェクトにまとめられています。 各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。 たとえば、米国の英語を使用するコール センターのチャット ボット用に、女性の音声のプロジェクトを作成できます。

ヒント

より高品質な音声を作成するためのプロフェッショナルなレコーディングに実際に投資する前に、カスタム ニューラル音声 (CNV) Lite を試して、CNV を体験してください。

少数のオーディオ ファイルと関連する文字起こしさえあれば、作業を開始できます。 カスタム ニューラル音声でお客様の言語リージョンがサポートされているかどうかをご確認ください。

カスタム ニューラル音声 Pro プロジェクトを作成する

カスタム ニューラル音声 Pro プロジェクトの作成は、次の手順に従って行います。

  1. Speech Studio にサインインします。

  2. 使用するサブスクリプションと Speech リソースを選択します。

    重要

    カスタム ニューラル音声トレーニングは、現在一部のリージョンでのみ使用できます。 サポートされているリージョンでトレーニングが完了した音声モデルは、必要に応じて別のリージョンの Speech リソースにコピーできます。 詳細については、リージョン テーブルの脚注を参照してください。

  3. [Custom Voice]>[プロジェクトの作成] の順に選択します。

  4. [カスタム ニューラル音声 Pro]>[次へ] を選択します。

  5. ウィザードの手順に従ってプロジェクトを作成します。

新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。 左側のパネルには、[ボイス タレントを設定する][トレーニング データの準備][モデルのトレーニング][モデルのデプロイ] などのメニュー項目が表示されています。

次のステップ

プロフェッショナル音声プロジェクトには、ボイス タレントの同意ステートメント、トレーニング データセット、音声モデル、エンドポイントが含まれています。

各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。 たとえば、米国の英語を使用するコール センターのチャット ボット用に、女性の音声のプロジェクトを作成できます。

プロジェクトの作成

プロフェッショナル音声プロジェクトを作成するには、Custom Voice API の Projects_Create 操作を使います。 次の手順に従って要求本文を作成します。

  • 必須の kind プロパティを ProfessionalVoice に設定します。 種類を後から変更することはできません。
  • 必要に応じて、description プロパティにプロジェクトの説明を設定します。 プロジェクトの説明は後で変更できます。

HTTP PUT 要求は、以下の Projects_Create の例に示したように URI を使用して行います。

  • YourResourceKey をSpeech リソース キーに置き換えます。
  • YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
  • ProjectId を任意のプロジェクト ID に置き換えます。 大文字と小文字が区別される ID は、Azure Cognitive Service for Speech リソース内で一意である必要があります。 ID はプロジェクトの URI で使われ、後で変更することはできません。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2023-12-01-preview"

次の形式で応答本文を受け取る必要があります。

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

プロジェクトの id は、後でボイス タレントの同意の追加およびトレーニング セットの作成のための API 要求で使います。

次のステップ