少数のオーディオ ファイルと関連する文字起こしさえあれば、作業を開始できます。 カスタム音声が 言語 と 地域をサポートしているかどうかを確認します。
微調整を開始する
Azure AI Foundry ポータルでは、一部の Azure AI サービス モデルを微調整できます。 たとえば、プロの音声モデルを微調整できます。
プロフェッショナルな音声モデルを微調整するには、次の手順に従います。
Azure AI Foundry ポータルで Azure AI Foundry プロジェクトに移動します。 プロジェクトを作成する必要がある場合は、「Azure AI Foundry プロジェクトの作成」を参照してください。
左側のペインから [微調整] を選択します。
[AI サービスの微調整]>[+ 微調整] を選択します。
ウィザードで、[ カスタム音声 ] (プロフェッショナルな音声の微調整) を選択します。
[次へ] を選択します。
ウィザードの指示に従って、微調整ワークスペースを作成します。
微調整を続行する
Azure AI Speech のドキュメントに移動して、プロフェッショナルな音声モデルの微調整を続行する方法を学習します。
微調整されたモデルを表示する
微調整が完了したら、[ 微調整 ] ページからカスタム音声モデルとデプロイにアクセスできます。
Azure AI Foundry ポータルにサインインします。
左側のペインから [微調整] を選択します。
[AI サービスの微調整] を選択します。 微調整タスクの状態と、作成されたモデルを表示できます。
次のステップ
データ、モデル、テスト、エンドポイントなどの カスタム音声 のコンテンツは、Speech Studio のプロジェクトに編成されます。 各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。 たとえば、米国の英語を使用するコール センターのチャット ボット用に、女性の音声のプロジェクトを作成できます。
少数のオーディオ ファイルと関連する文字起こしさえあれば、作業を開始できます。 カスタム音声が 言語 と 地域をサポートしているかどうかを確認します。
微調整を開始する
プロフェッショナルな音声モデルを微調整するには、次の手順に従います。
Speech Studio にサインインします。
使用するサブスクリプションと Speech リソースを選択します。
重要
カスタム音声トレーニングは現在、一部のリージョンでのみ利用できます。 サポートされているリージョンでトレーニングが完了した音声モデルは、必要に応じて別のリージョンの Speech リソースにコピーできます。 詳細については、リージョン テーブルの脚注を参照してください。
[Custom Voice]>[プロジェクトの作成] の順に選択します。
[カスタム ニューラル音声 Pro]>[次へ] を選択します。
ウィザードの手順に従ってプロジェクトを作成します。
新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。 左側のパネルには、[ボイス タレントの設定]、[トレーニング データの準備]、[モデルのトレーニング]、[モデルのデプロイ] というメニュー項目が表示されます。
次のステップ
プロフェッショナル音声プロジェクトには、ボイス タレントの同意ステートメント、トレーニング データセット、音声モデル、エンドポイントが含まれています。
各プロジェクトは、国またはリージョンと言語、および作成したい音声の性別に固有です。 たとえば、米国の英語を使用するコール センターのチャット ボット用に、女性の音声のプロジェクトを作成できます。
プロジェクトの作成
プロフェッショナル音声プロジェクトを作成するには、Custom Voice API の Projects_Create 操作を使います。 次の手順に従って要求本文を作成します。
- 必須の
kind
プロパティをProfessionalVoice
に設定します。 種類を後から変更することはできません。 - 必要に応じて、
description
プロパティにプロジェクトの説明を設定します。 プロジェクトの説明は後で変更できます。
HTTP PUT 要求は、以下の Projects_Create の例に示したように URI を使用して行います。
-
YourResourceKey
をSpeech リソース キーに置き換えます。 -
YourResourceRegion
を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。 -
ProjectId
を任意のプロジェクト ID に置き換えます。 大文字と小文字が区別される ID は、Azure Cognitive Service for Speech リソース内で一意である必要があります。 ID はプロジェクトの URI で使われ、後で変更することはできません。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"
次の形式で応答本文を受け取る必要があります。
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
プロジェクトの id
は、後でボイス タレントの同意の追加およびトレーニング セットの作成のための API 要求で使います。