分享方式:


收集使用者輸入

隨著 Azure 通訊服務通話自動化辨識動作的發行,開發人員現在可以增強其 IVR 或連絡中心應用程式,以辨識使用者輸入。 其中一個最常見的辨識案例是向使用者播放訊息,提示使用者提供回應,然後由應用程式辨識,一經辨識,應用程式就會執行對應的動作。 可以透過數種方式接收來自呼叫者的輸入,包括 DTMF (透過通話裝置上數字的使用者輸入)、語音或 DTMF 和語音的組合。

使用語音轉換文字進行語音辨識

Azure 通訊服務與 Azure AI 服務整合,可讓您透過「辨識」動作即時分析音訊,以將說出口的話轉譯成文字。 開箱即用的 Microsoft 運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 此模型會預先定型,其中包含代表各種常見網域的方言和注音符號。 如需支援語言的詳細資訊,請參閱語音服務的語言和語音支援

DTMF

複頻式訊號 (DTMF) 辨識是指按下數字時,理解電話所產生的音調/音效的過程。 然後,接收端接聽特定音調的設備會將音效轉換為命令。 這些命令通常指出在 IVR 案例中瀏覽功能表時的使用者意圖,或在某些情況下,可用來擷取使用者必須透過手機按鍵提供的重要資訊。

DTMF 事件及其相關聯的音調

Event 語氣
0
1 一個
2 兩個
3
4
5
6 六個
7 Seven
8 八個
9
A A
B B
C C
D D
* 星號
# Pound

常見使用案例

使用辨識動作有諸多原因,以下是開發人員如何在其應用程式中使用辨識動作的幾個範例。

使用自助提示改善使用者旅程圖

  • 使用者可以控制通話 - 藉由啟用輸入辨識,您可以讓來電者瀏覽 IVR 功能表,並提供可用來解析其查詢的資訊。
  • 收集使用者資訊 - 藉由啟用輸入辨識,您的應用程式可以從來電者收集輸入。 這可以是帳戶號碼、信用卡資訊等資訊。
  • 轉譯呼叫者回應 - 使用語音辨識,您可以收集使用者輸入並將音訊轉譯為文字,並加以分析以執行特定的商務動作。

中斷音訊提示

使用者可以離開 IVR 功能表,並與專員說話 - 透過 DTMF 中斷,您的應用程式可讓使用者中斷 IVR 功能表的流程,並能夠與專員聊天。

在具有語音辨識的通話中收集使用者輸入的範例結構

顯示辨識 AI 動作範例架構的圖表。

在通話中收集使用者輸入的架構範例

辨識動作

已知的限制

  • 不支援頻內 DTMF,請改用 RFC 2833 DTMF。
  • 文字轉換語音的文字提示最多支援 400 個字元,如果您的提示超出此長度,建議對文字轉換語音型播放動作使用 SSML。
  • 針對超過語音服務配額限制的案例,您可以遵循此處所述的步驟來要求提高此限制。

下一步