在通話中播放音訊

透過 Azure 通訊服務呼叫自動化 SDK 提供的播放動作可讓您對通話中的參與者播放音訊提示。 您可以透過應用程式的伺服器端實作來存取此動作。 您可以播放音訊,以透過兩種方法之一呼叫參與者:

  • 提供 Azure 通訊服務 WAV 格式預先錄製音訊檔案的存取權,Azure 通訊服務 可透過驗證的支援存取
  • 透過與 Azure AI 服務整合,可轉換成語音輸出的一般文字。

您可以使用 Azure 通訊服務 與 Azure AI 服務之間新宣佈的整合,使用 Azure 文字到語音播放個人化回應。 您可以立即使用預先建置的類神經語音,或建立產品或品牌特有的自定義神經語音。 如需支援語音、語言和地區設定的詳細資訊,請參閱 語音服務的語言和語音支援。

注意

Azure 通訊服務 目前支援兩種檔格式:具有ID3V2TAG和 WAV 檔案的 MP3 檔案,格式為 16 位 PCM 單聲道音訊,以 16KHz 錄製。 您可以使用語音合成搭配音訊內容建立工具來建立自己的音訊檔案

預先建置的神經文字到語音轉換語音

Microsoft 使用深度神經網路來克服傳統語音合成在口語中壓力和語調的限制。 Prosody 預測和語音合成同時發生,產生更流暢和自然的音效輸出。 您可以使用這些神經語音,讓與聊天機器人和語音助理互動更自然且更具吸引力。 有超過 100 個預先建置的聲音可供選擇。 深入瞭解 Azure 文字到語音轉換語音

常見使用案例

遊戲動作可以透過許多方式使用,以下是開發人員想要在其應用程式中使用播放動作的一些範例。

宣告

當參與者加入或離開通話時,您的應用程式可能會想要播放某種公告,以通知其他使用者。

自助客戶

在具有 IVR 和虛擬助理的案例中,您可以使用應用程式或 Bot 對來電者播放音訊提示,此提示可以是功能表的形式,引導來電者進行互動。

保留音樂

播放動作也可以用來為來電者播放音樂。 此動作可以在迴圈中設定,讓音樂持續播放,直到代理程式可供協助呼叫者使用為止。

播放合規性訊息

作為各種產業合規性需求的一部分,廠商預期會對來電者播放法律或合規性訊息,例如,「此通話會記錄為品質用途」。

使用文字轉語音在通話中播放音訊的範例架構

顯示使用 AI 播放範例架構的圖表。

在通話中播放音訊的範例架構

動作流程的螢幕快照。

已知的限制

  • 文字到語音轉換文字提示最多支援 400 個字元,如果您的提示比這還長,我們建議針對文字到語音轉換的播放動作使用 SSML。
  • 針對超過語音服務配額限制的案例,您可以遵循此處所述的步驟來要求增加此限制。

後續步驟