プロフェッショナル音声用のプロジェクトを作成する

少数のオーディオファイルと関連する文字起こしさえあれば、作業を開始できます。カスタム音声が言語と地域をサポートしているかどうかを確認します。

微調整を開始する

Azure AI Foundry ポータルでは、一部の Azure AI サービスモデルを微調整できます。たとえば、プロの音声モデルを微調整できます。

プロフェッショナルな音声モデルを微調整するには、次の手順に従います。

Azure AI Foundry ポータルで Azure AI Foundry プロジェクトに移動します。プロジェクトを作成する必要がある場合は、「Azure AI Foundry プロジェクトの作成」を参照してください。
左側のペインから [微調整] を選択します。
[AI サービスの微調整]>[+ 微調整] を選択します。
ウィザードで、[ カスタム音声 ] (プロフェッショナルな音声の微調整) を選択します。
[次へ] を選択します。
ウィザードの指示に従って、微調整ワークスペースを作成します。

微調整を続行する

Azure AI Speech のドキュメントに移動して、プロフェッショナルな音声モデルの微調整を続行する方法を学習します。

微調整されたモデルを表示する

微調整が完了したら、[ 微調整 ] ページからカスタム音声モデルとデプロイにアクセスできます。

Azure AI Foundry ポータルにサインインします。
左側のペインから [微調整] を選択します。
[AI サービスの微調整] を選択します。微調整タスクの状態と、作成されたモデルを表示できます。

次のステップ

プロジェクトにボイスタレントの同意を追加する

データ、モデル、テスト、エンドポイントなどのカスタム音声のコンテンツは、Speech Studio のプロジェクトに編成されます。各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。たとえば、米国の英語を使用するコールセンターのチャットボット用に、女性の音声のプロジェクトを作成できます。

少数のオーディオファイルと関連する文字起こしさえあれば、作業を開始できます。カスタム音声が言語と地域をサポートしているかどうかを確認します。

微調整を開始する

プロフェッショナルな音声モデルを微調整するには、次の手順に従います。

Speech Studio にサインインします。
使用するサブスクリプションと Speech リソースを選択します。

重要

カスタム音声トレーニングは現在、一部のリージョンでのみ利用できます。サポートされているリージョンでトレーニングが完了した音声モデルは、必要に応じて別のリージョンの Speech リソースにコピーできます。詳細については、リージョンテーブルの脚注を参照してください。
[Custom Voice]>[プロジェクトの作成] の順に選択します。
[カスタムニューラル音声 Pro]>[次へ] を選択します。
ウィザードの手順に従ってプロジェクトを作成します。

新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。左側のパネルには、[ボイスタレントの設定]、[トレーニングデータの準備]、[モデルのトレーニング]、[モデルのデプロイ] というメニュー項目が表示されます。

次のステップ

プロジェクトにボイスタレントの同意を追加する

プロフェッショナル音声プロジェクトには、ボイスタレントの同意ステートメント、トレーニングデータセット、音声モデル、エンドポイントが含まれています。

各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。たとえば、米国の英語を使用するコールセンターのチャットボット用に、女性の音声のプロジェクトを作成できます。

プロジェクトの作成

プロフェッショナル音声プロジェクトを作成するには、Custom Voice API の Projects_Create 操作を使います。次の手順に従って要求本文を作成します。

必須の kind プロパティを ProfessionalVoice に設定します。種類を後から変更することはできません。
必要に応じて、description プロパティにプロジェクトの説明を設定します。プロジェクトの説明は後で変更できます。

HTTP PUT 要求は、以下の Projects_Create の例に示したように URI を使用して行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
ProjectId を任意のプロジェクト ID に置き換えます。大文字と小文字が区別される ID は、Azure Cognitive Service for Speech リソース内で一意である必要があります。 ID はプロジェクトの URI で使われ、後で変更することはできません。

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"

次の形式で応答本文を受け取る必要があります。

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

プロジェクトの id は、後でボイスタレントの同意の追加およびトレーニングセットの作成のための API 要求で使います。

次のステップ

プロジェクトにボイスタレントの同意を追加する

次の方法で共有

微調整を開始する

微調整を続行する

微調整されたモデルを表示する

次のステップ

微調整を開始する

次のステップ

プロジェクトの作成

次のステップ

フィードバック

その他のリソース