カスタム音声からカスタム ニューラル音声に移行する

重要

Standard レベルのニューラル以外のカスタム音声トレーニングは、2024 年 2 月 29 日をもって廃止されます。 2024 年 2 月 29 日より前は、音声リソースでニューラル以外のカスタム音声を使用できましたが、 音声リソースで使用できるカスタム音声はニューラルのみになりました。 ニューラル以外のカスタム音声を使用している場合は、カスタム ニューラル音声に移行する必要があります。

カスタム ニューラル音声を使用すると、より少ないデータで、より高品質の音声モデルを構築できます。 より現実的で自然で会話的な音声を開発できます。 顧客とエンド ユーザーは、責任ある方法での最新のテキスト読み上げテクノロジの利点が得られます。

カスタム音声 カスタム ニューラル音声
カスタム音声の標準的、つまり "伝統的" な方法では、話された言葉を、古典的なプログラミングや統計的な手法でリミックスやマッチングできるような音声の断片に分解します。 カスタム ニューラル音声では、古典的なプログラミングや統計的な手法を使用するのではなく、人間の自然な発話で音韻が組み合わせられる方法を "学習" したディープ ニューラル ネットワークを使用して、音声が合成されます。
カスタム音声1では、より人間に近い音声モデルを作成するために、大量の音声データが必要となります。 録音された台詞が少ない場合、標準のカスタム音声モデルは、より明らかにロボットのように聞こえる傾向があります。 カスタム ニューラル音声機能を使用すると、少量の録音のセットを利用して、複数の言語とスタイルで独自のブランド音声を作成できます。

1カスタム音声モデルの作成にあたり、サブスクリプションごとにインポートできるデータ ファイルの最大数は、Free サブスクリプション (F0) ユーザーの場合は .zip ファイル 10 個、Standard サブスクリプション (S0) ユーザーの場合は 500 個です。

必要な操作

カスタム ニューラル音声に移行するには、申し込みが承諾される必要があります。 カスタム ニューラル音声サービスへのアクセスは、Microsoft の資格基準に基づく、Microsoft の独自の判断によって決定されます。 当社の責任ある AI の原則および倫理規定に準拠して、カスタム ニューラル音声を使用することを約束していただく必要があります。

ヒント

Azure アカウントがない場合でも、Speech Studio で音声サンプルを聞いて、ビジネス ニーズに適した音声を確認できます。

  1. アクセスの制限に対するポリシーの詳細を確認した後、こちらから申し込みを行ってください。
  2. アプリケーションが承認されると、"ニューラル" トレーニング機能にアクセスできます。 アプリケーションで指定したのと同じ Azure サブスクリプションを使用して Speech Studio にサインインしていることを確認します。
  3. カスタム音声モデルをトレーニングしてデプロイする前に、音声タレント プロファイルを作成する必要があります。 プロファイルには、自分の音声データがカスタム ボイス モデルのトレーニングに使用されることに同意する旨をボイス タレントが録音したオーディオ ファイルが必要です。
  4. 新しいモデルを使用して新しいエンドポイントを作成した場合は、アプリ内のコードを更新します。

カスタム音声の詳細 (非推奨)

カスタム音声の詳細については、以降のセクションを参照してください。

言語のサポート

カスタム音声では、次の言語 (ロケール) がサポートされています。

Language Locale
中国語 (標準、簡体字) zh-CN
中国語 (標準、簡体字)、英語バイリンガル zh-CN バイリンガル
英語 (インド) en-IN
英語 (イギリス) en-GB
英語 (米国) en-US
フランス語 (フランス) fr-FR
ドイツ語 (ドイツ) de-DE
イタリア語 (イタリア) it-IT
ポルトガル語 (ブラジル) pt-BR
スペイン語 (メキシコ) es-MX

地域のサポート

カスタム音声フォントを作成した場合は、作成したエンドポイントを使用します。 また、このセクションに一覧表示されているエンドポイントを使用することもできます。{deploymentId} は音声モデル用のデプロイ ID に置き換えます。

リージョン エンドポイント
オーストラリア東部 https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
ブラジル南部 https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
カナダ中部 https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中部 https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東アジア https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国東部 https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国東部 2 https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
フランス中部 https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
インド中部 https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東日本 https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
西日本 https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
韓国中部 https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中北部 https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
北ヨーロッパ https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中南部 https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
東南アジア https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
英国南部 https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
西ヨーロッパ https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国中西部 https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国西部 https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
米国西部 2 https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}

次のステップ