Azure Text to speech (プレビュー)

リファレンス

Azure Text-to-speech を使用すると、140 の言語と方言にわたる 400 以上の音声で自然に話すアプリやサービスを構築できます。

このコネクタは、次の製品および地域で利用可能です:

Service	クラス	地域
Logic Apps	標準	以下を除くすべての Logic Apps 地域 : - Azure China の地域
Power Automate	Premium	以下を除くすべての Power Automate 地域 : - 21 Vianet が運用する中国のクラウド
Power Apps	プレミアム	以下を除くすべての Power Apps 地域 : - 21 Vianet が運用する中国のクラウド

お問い合わせ先
件名	読み上げサービス Power Platform チーム
[URL]	https://docs.microsoft.com/azure/cognitive-services/speech-service/support
メール	speechpowerplatform@microsoft.com

Connector Metadata
発行者	マイクロソフト
Web サイト	https://docs.microsoft.com/azure/cognitive-services/speech-service/
プライバシーポリシー	https://privacy.microsoft.com
カテゴリー	AI、Web サイト

音声サービスを使用すると、REST API を使用して、テキストを合成音声に変換し、地域でサポートされている音声のリストを取得できます。

前提条件

続行するには、次のものが必要です。

Azure サブスクリプション - 無料で作成します。
Azure ポータルで、音声リソースを作成します。
Speech リソースキーとリージョンを取得します。 Speech リソースがデプロイされたら、リソースに移動 を選択してキーを表示および管理します。 Cognitive Services リソースの詳細については、リソースのキーを取得するを参照してください。
Azure Text-to-speech でサポートされるロケールと音声の詳細については、こちらをご覧ください。

接続を作成する

このコネクタは、次の認証タイプをサポートしています:


API キー	ApiKey	すべての地域	共有可能
Microsoft Entra ID 統合	Microsoft Entra ID を使用してスピーチサービスにアクセスします。	すべての地域	共有不可
既定 [非推奨]	このオプションは、明示的な認証の種類を持たない古い接続専用に対してのみ使用され、下位互換性を保つためにのみ提供されます。	すべての地域	共有不可

API キー

認証 ID: keyBasedAuth

適用できるもの: すべての領域

ApiKey

これは共有可能な接続です。 Power App が他のユーザーと共有されている場合、接続も共有されます。詳細については、キャンバスアプリのコネクタの概要 - Power Apps | Microsoft Docs を参照してください

件名	タイプ	Description	Required
アカウントキー	securestring	読み上げサービスキー	True
Region	string	音声サービス地域 (例: eastus)	True

Microsoft Entra ID 統合

Auth ID: tokenBasedAuth

適用可能: すべての領域

Microsoft Entra ID を使用してスピーチサービスにアクセスします。

これは共有可能な接続ではありません。 Power App が別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

件名	タイプ	Description	Required
リソース ID	string	コグニティブサービスのリソース ID (例: /subscriptions//resourceGroups//providers/Microsoft.CognitiveServices/accounts/)	True
カスタムサブドメイン	string	カスタムサブドメインエンドポイント URL (例: contoso)	True

既定 [非推奨]

適用可能: すべての領域

このオプションは、明示的な認証の種類を持たない古い接続専用に対してのみ使用され、下位互換性を保つためにのみ提供されます。

件名	タイプ	Description	Required
アカウントキー	securestring	Neural Text-to-speech アカウントキー用 Azure Cognitive Services	True
Region	string	音声サービス地域 (例: eastus)	True

調整制限

名前	呼び出し	更新期間
接続ごとの API 呼び出し	100	60 秒

アクション

SSML を使用してテキスト読み上げを変換する	音声合成マークアップ言語 (SSML) を使用してテキストを音声に変換する
テキスト読み上げの変換	テキスト読み上げの変換をします。
音声のリストを取得する	特定の地域またはエンドポイントの音声の完全なリストを取得します。

SSML を使用してテキスト読み上げを変換する

操作 ID:: ConvertTextToSpeechWithSSML

音声合成マークアップ言語 (SSML) を使用してテキストを音声に変換する

パラメーター

名前	キー	必須	型	説明
SSML テキスト	ssmlText	True	string	SSML 形式のテキスト (例: 電源コネクタ)
出力音声形式	outputFormat		string	非ストリーミングのオーディオ形式。既定: riff-24khz-16bit-mono-pcm。

テキスト読み上げの変換

操作 ID:: ConvertTextToSpeech

テキスト読み上げの変換をします。

パラメーター

名前	キー	必須	型	説明
音声名	voiceName	True	string	テキスト読み上げ用に出力される音声名です。例: en-US-JennyNeural。
Locale	locale	True	string	含まれるデータのロケール。たとえば、en-US です。
合成テキスト	synthesizedText	True	string	音声に変換する必要がある合成テキストです。
出力音声形式	outputFormat		string	非ストリーミングのオーディオ形式。既定: riff-24khz-16bit-mono-pcm。
スタイル	style		string	表現的な話し方です。たとえば、陽気など。
話す速度	speakingRate		string	音声の速度です。例: -40.00%。

音声のリストを取得する

操作 ID:: GetVoicesList

特定の地域またはエンドポイントの音声の完全なリストを取得します。

戻り値

名前	パス	型	説明
		array of object
アイテム		object	配列

Microsoft Learn Challenge

次の方法で共有

Azure Text to speech (プレビュー)

前提条件

接続を作成する

API キー

Microsoft Entra ID 統合

既定 [非推奨]

調整制限

アクション

SSML を使用してテキスト読み上げを変換する

パラメーター

テキスト読み上げの変換

パラメーター

音声のリストを取得する

戻り値

その他のリソース