收集使用者輸入
隨著 Azure 通訊服務通話自動化辨識動作的發行,開發人員現在可以增強其 IVR 或連絡中心應用程式,以辨識使用者輸入。 其中一個最常見的辨識案例是向使用者播放訊息,提示使用者提供回應,然後由應用程式辨識,一經辨識,應用程式就會執行對應的動作。 可以透過數種方式接收來自呼叫者的輸入,包括 DTMF (透過通話裝置上數字的使用者輸入)、語音或 DTMF 和語音的組合。
使用語音轉換文字進行語音辨識
Azure 通訊服務與 Azure AI 服務整合,可讓您透過「辨識」動作即時分析音訊,以將說出口的話轉譯成文字。 開箱即用的 Microsoft 運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 此模型會預先定型,其中包含代表各種常見網域的方言和注音符號。 如需支援語言的詳細資訊,請參閱語音服務的語言和語音支援。
DTMF
複頻式訊號 (DTMF) 辨識是指按下數字時,理解電話所產生的音調/音效的過程。 然後,接收端接聽特定音調的設備會將音效轉換為命令。 這些命令通常指出在 IVR 案例中瀏覽功能表時的使用者意圖,或在某些情況下,可用來擷取使用者必須透過手機按鍵提供的重要資訊。
DTMF 事件及其相關聯的音調
Event | 語氣 |
---|---|
0 | 零 |
1 | 一個 |
2 | 兩個 |
3 | 三 |
4 | 四 |
5 | 五 |
6 | 六個 |
7 | Seven |
8 | 八個 |
9 | 九 |
A | A |
B | B |
C | C |
D | D |
* | 星號 |
# | Pound |
常見使用案例
使用辨識動作有諸多原因,以下是開發人員如何在其應用程式中使用辨識動作的幾個範例。
使用自助提示改善使用者旅程圖
- 使用者可以控制通話 - 藉由啟用輸入辨識,您可以讓來電者瀏覽 IVR 功能表,並提供可用來解析其查詢的資訊。
- 收集使用者資訊 - 藉由啟用輸入辨識,您的應用程式可以從來電者收集輸入。 這可以是帳戶號碼、信用卡資訊等資訊。
- 轉譯呼叫者回應 - 使用語音辨識,您可以收集使用者輸入並將音訊轉譯為文字,並加以分析以執行特定的商務動作。
中斷音訊提示
使用者可以離開 IVR 功能表,並與專員說話 - 透過 DTMF 中斷,您的應用程式可讓使用者中斷 IVR 功能表的流程,並能夠與專員聊天。
在具有語音辨識的通話中收集使用者輸入的範例結構
在通話中收集使用者輸入的架構範例
已知的限制
- 不支援頻內 DTMF,請改用 RFC 2833 DTMF。
- 文字轉換語音的文字提示最多支援 400 個字元,如果您的提示超出此長度,建議對文字轉換語音型播放動作使用 SSML。
- 針對超過語音服務配額限制的案例,您可以遵循此處所述的步驟來要求提高此限制。