Share via


Microsoft Dynamics 365 サンプル紹介: 音声テキスト変換: 概要

みなさん、こんにちは。

今回は、音声をテキストに変換するサンプルを紹介します。

背景

顧客サービスにおいて顧客との活動内容を正確に記録することは重要です。例えば、コールセンターのエージェントは
顧客と会話した内容を正確に記録する必要があります。これにより、他の担当者が見たときに過去の経緯を把握でき、
顧客満足度に繋がります。しかし、記録するための 2 つの問題があります。

1. コスト増加

音声をテキストにするといったデジタル化を人の手で実施するための作業コストが大きくなります。
これにより、コールセンター全体のコストが増加する要因となります。

2. サービスレベルのばらつき

エージェントごとに入力する内容のレベルにばらつきが発生すると全体のサービスレベルを標準化しずらくなります。

サンプル概要

本サンプルは、エージェントの音声をマイクから拾い、テキストに変換して画面に自動設定します。
これにより、エージェントの入力コストを削減するとともにサービスレベルの標準化に貢献します。

image

詳細なセットアップ手順については、次回紹介します。

VoiceToText
https://github.com/takayakawano/VoiceToText

Bing Speech API

本サンプルは、Bing Speech API を利用しています。

Bing Speech API は、Microsoft が提供する Cognitive Service の 1 つで、オーディオをテキストに変換します。
この API は、マイクからのリアルタイムなオーディオ認識し、リアルタイム ストリーミングを利用できるため、
オーディオがサーバーに送信されると同時に結果も返されます。API を使えば、音声にトリガーされるスマート アプリを作成できます。

Bing Speech API:
https://azure.microsoft.com/ja-jp/services/cognitive-services/speech/

15 か国語 サポート

Bing Speech API は、日本語を含め 15 か国語をサポートしています。

https://docs.microsoft.com/ja-jp/azure/cognitive-services/speech/api-reference-rest/bingvoicerecognition#recognition-language

価格

価格は API を呼び出すトランザクション数で決まります。1000 トランザクションあたり 408 円です。 https://azure.microsoft.com/ja-jp/pricing/details/cognitive-services/speech-api/

まとめ

次回は、Dynamics 365 トライアル版にサンプルをセットアップしてみましょう。

– プレミアフィールドエンジニアリング 河野 高也

※本情報の内容(添付文書、リンク先などを含む)は、作成日時点でのものであり、予告なく変更される場合があります