Azure Text to speech (プレビュー)

Azure Text-to-speech を使用すると、140 の言語と方言にわたる 400 以上の音声で自然に話すアプリやサービスを構築できます。

このコネクタは、次の製品および地域で利用可能です:

Service クラス 地域
Logic Apps 標準 以下を除くすべての Logic Apps 地域 :
     -   Azure China の地域
Power Automate Premium 以下を除くすべての Power Automate 地域 :
     -   21 Vianet が運用する中国のクラウド
Power Apps プレミアム 以下を除くすべての Power Apps 地域 :
     -   21 Vianet が運用する中国のクラウド
お問い合わせ先
件名 読み上げサービス Power Platform チーム
[URL] https://docs.microsoft.com/azure/cognitive-services/speech-service/support
メール speechpowerplatform@microsoft.com
Connector Metadata
発行者 マイクロソフト
Web サイト https://docs.microsoft.com/azure/cognitive-services/speech-service/
プライバシー ポリシー https://privacy.microsoft.com
カテゴリー AI、Web サイト

音声サービスを使用すると、REST API を使用して、テキストを合成音声に変換し、地域でサポートされている音声のリストを取得できます。

前提条件

続行するには、次のものが必要です。

接続を作成する

このコネクタは、次の認証タイプをサポートしています:

API キー ApiKey すべての地域 共有可能
Microsoft Entra ID 統合 Microsoft Entra ID を使用してスピーチ サービスにアクセスします。 すべての地域 共有不可
既定 [非推奨] このオプションは、明示的な認証の種類を持たない古い接続専用に対してのみ使用され、下位互換性を保つためにのみ提供されます。 すべての地域 共有不可

API キー

認証 ID: keyBasedAuth

適用できるもの: すべての領域

ApiKey

これは共有可能な接続です。 Power App が他のユーザーと共有されている場合、接続も共有されます。 詳細については、キャンバス アプリのコネクタの概要 - Power Apps | Microsoft Docs を参照してください

件名 タイプ Description Required
アカウント キー securestring 読み上げサービス キー True
Region string 音声サービス地域 (例: eastus) True

Microsoft Entra ID 統合

Auth ID: tokenBasedAuth

適用可能: すべての領域

Microsoft Entra ID を使用してスピーチ サービスにアクセスします。

これは共有可能な接続ではありません。 Power App が別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

件名 タイプ Description Required
リソース ID string コグニティブ サービスのリソース ID (例: /subscriptions//resourceGroups//providers/Microsoft.CognitiveServices/accounts/) True
カスタム サブドメイン string カスタム サブドメイン エンドポイント URL (例: contoso) True

既定 [非推奨]

適用可能: すべての領域

このオプションは、明示的な認証の種類を持たない古い接続専用に対してのみ使用され、下位互換性を保つためにのみ提供されます。

これは共有可能な接続ではありません。 Power App が別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

件名 タイプ Description Required
アカウント キー securestring Neural Text-to-speech アカウント キー用 Azure Cognitive Services True
Region string 音声サービス地域 (例: eastus) True

調整制限

名前 呼び出し 更新期間
接続ごとの API 呼び出し 100 60 秒

アクション

SSML を使用してテキスト読み上げを変換する

音声合成マークアップ言語 (SSML) を使用してテキストを音声に変換する

テキスト読み上げの変換

テキスト読み上げの変換をします。

音声のリストを取得する

特定の地域または エンドポイント の音声の完全なリストを取得します。

SSML を使用してテキスト読み上げを変換する

音声合成マークアップ言語 (SSML) を使用してテキストを音声に変換する

パラメーター

名前 キー 必須 説明
SSML テキスト
ssmlText True string

SSML 形式のテキスト (例: 電源コネクタ)

出力音声形式
outputFormat string

非ストリーミングのオーディオ形式。 既定: riff-24khz-16bit-mono-pcm。

テキスト読み上げの変換

テキスト読み上げの変換をします。

パラメーター

名前 キー 必須 説明
音声名
voiceName True string

テキスト読み上げ用に出力される音声名です。 例: en-US-JennyNeural。

Locale
locale True string

含まれるデータのロケール。 たとえば、en-US です。

合成テキスト
synthesizedText True string

音声に変換する必要がある合成テキストです。

出力音声形式
outputFormat string

非ストリーミングのオーディオ形式。 既定: riff-24khz-16bit-mono-pcm。

スタイル
style string

表現的な話し方です。 たとえば、陽気など。

話す速度
speakingRate string

音声の速度です。 例: -40.00%。

音声のリストを取得する

特定の地域または エンドポイント の音声の完全なリストを取得します。

戻り値

名前 パス 説明
array of object
アイテム
object

配列