收集使用者輸入

隨著 Azure 通訊服務呼叫自動化辨識動作的發行,開發人員現在可以增強其 IVR 或連絡中心應用程式,以辨識用戶輸入。 其中一個最常見的辨識案例是向使用者播放訊息,這會提示使用者提供回應,然後由應用程式辨識,一旦辨識應用程式,就會執行對應的動作。 呼叫端的輸入可以透過數種方式接收,包括 DTMF(使用者輸入透過通話裝置上的數位)、語音或 DTMF 和語音的組合。

使用語音轉換文字的語音辨識

Azure Communications 服務與 Azure AI 服務整合,可讓您透過辨識動作即時分析音訊,以將口語文字轉譯成文字。 現成的 Microsoft 會使用通用語言模型作為以 Microsoft 擁有的數據定型的基底模型,並反映常用的口語語言。 此模型會預先定型代表各種常見網域的方言和注音。 如需支援語言的詳細資訊,請參閱 語音服務的語言和語音支援。

Dtmf

雙音多頻率 (DTMF) 辨識是按下數位時,理解電話所產生的音調/音效程式。 接收端的設備會接聽特定音調,然後將它們轉換成命令。 這些命令通常會在 IVR 案例中瀏覽功能表時發出使用者意圖的訊號,或在某些情況下,可用來擷取使用者透過手機鍵盤提供的重要資訊。

DTMF 事件及其相關聯的音調

活動 語氣
0
1 一個
2 兩個
3
4
5
6 六個
7
8 八個
9
A A
B B
C C
D D
* 星號
#

常見使用案例

辨識動作可用於許多原因,以下是開發人員如何使用其應用程式中辨識動作的一些範例。

使用自助提示改善使用者旅程圖

  • 使用者可以控制通話 - 藉由啟用輸入辨識,您可以允許呼叫者瀏覽您的 IVR 功能表,並提供可用來解析其查詢的資訊。
  • 收集使用者資訊 - 藉由啟用輸入辨識,您的應用程式可以從來電者收集輸入。 這可以是帳戶號碼、信用卡資訊等資訊。
  • 轉譯來電者回應 - 使用語音辨識,您可以收集使用者輸入,並將音訊轉譯為文字,並加以分析以執行特定的商務動作。

中斷音訊提示

使用者可以從 IVR 功能表結束,並與人類代理程式 交談 - 透過 DTMF 中斷,您的應用程式可讓使用者中斷 IVR 功能表的流程,並能夠與人類代理程式聊天。

使用語音辨識在通話中收集使用者輸入的範例架構

顯示辨識 AI 動作範例架構的圖表。

在通話中收集使用者輸入的範例架構

辨識動作

已知的限制

  • 不支援頻內 DTMF,請改用 RFC 2833 DTMF。
  • 文字到語音轉換文字提示最多支援 400 個字元,如果您的提示比這還長,我們建議針對文字到語音轉換的播放動作使用 SSML。
  • 針對超過語音服務配額限制的案例,您可以遵循此處所述的步驟來要求增加此限制。

下一步