在通話中播放音訊
透過 Azure 通訊服務通話自動化 SDK 提供的播放動作,可讓您向通話中的參與者播放音訊提示。 您可以透過應用程式的伺服器端實作來存取此動作。 您可以透過兩個方法其中一項,向通話參與者播放音訊;
- 為 Azure 通訊服務提供 WAV 格式預先錄製音訊檔案的存取權,Azure 通訊服務可透過支援驗證進行存取
- 透過與 Azure AI 服務整合,可轉換成語音輸出的一般文字。
您可以使用 Azure 通訊服務和 Azure AI 服務之間新宣佈的整合,使用 Azure 文字轉換語音來播放個人化回應。 您可以使用現成可用的類似真人發音的預建神經語音,或針對您的產品或品牌建立專屬的自訂神經語音。 如需支援語音、語言和地區設定的詳細資訊,請參閱語音服務的語言和語音支援。
注意
Azure 通訊服務目前支援兩種檔案格式:具有 ID3V2TAG 的 MP3 檔案和以 16KHz 錄製的 16 位元 PCM 單聲道語音格式的 WAV 檔案。 您可以使用語音合成搭配音訊內容建立工具來建立自己的音訊檔案。
預先建置神經文字轉換語音的語音
Microsoft 使用深度神經網路來克服傳統語音合成在口語重音及聲調上的限制。 韻律預測和語音合成會同時發生,如此可產生更流暢且自然發音的輸出。 您可以使用這些神經語音,讓與聊天機器人和語音助理的互動更加自然且吸引人。 有超過 100 個預先建置語音可供選擇。 深入了解 Azure 文字轉換語音的語音。
常見使用案例
播放動作可以以許多方式使用,以下是開發人員如何在應用程式中使用播放動作的一些範例。
宣告
當參與者加入或離開通話時,您的應用程式可以播放公告來通知其他使用者。
自助客戶
在具有 IVR 和虛擬助理的情節中,您可以使用應用程式或 Bot 對來電者播放音訊提示,此提示可以是功能表形式,以引導來電者進行互動。
等候音樂
播放動作也可以用來向來電者播放等候音樂。 此動作可以設定為循環執行,讓音樂持續播放,直到有專員協助來電者為止。
播放合規性訊息
在各種產業的合規性需求中,廠商應該會向來電者播放法律或合規性訊息,例如「為了改善品質,這通電話將會錄音」。
使用文字轉換語音在通話中播放音訊的範例結構
在通話中播放音訊的範例架構
已知的限制
- 文字轉換語音的文字提示最多支援 400 個字元,如果您的提示比這還長,我們建議針對文字轉換語音型播放動作使用 SSML。
- 針對超過語音服務配額限制的案例,您可以遵循此處所述的步驟來要求提高此限制。
後續步驟
- 請參閱我們的操作指南,以了解如何對使用者播放自訂語音提示。
- 了解通話自動化發佈的使用量和作業記錄。
- 了解收集客戶輸入。