フレーズリストを使用して認識精度を向上させる

フレーズリストは、認識機能を高めるために、事前に提供される、単語またはフレーズの一覧です。フレーズリストにフレーズを追加すると、その重要性が増加するため、認識される可能性が高くなります。

サポートされるフレーズリストロケールについては、Speech サービスの言語と音声のサポートに関する記事を参照してください。

フレーズの例を、以下に示します。

フレーズリストはシンプルで軽量です。

Speech Studio、Speech SDK、または Speech コマンドラインインターフェイス (CLI) でフレーズリストを使用できます。バッチ文字起こし API はフレーズリストをサポートしていません。

フレーズリストは、標準とカスタム音声の両方で使用できます。状況によっては、フレーズを含むカスタムモデルをトレーニングすることが、精度を高める最善の方法と考えられます。たとえば、以下の場合では Custom Speech を使用することになります。

Speech Studio でテストする

Speech Studio を使用して、フレーズリストの支援によってオーディオの認識を向上させる方法をテストできます。運用環境のアプリケーションにフレーズリストを実装するには、Speech SDK または Speech CLI を使用します。

たとえば、音声サービスに次の文を認識させたいとしましょう: "Hi Rehaan, I'm Jessie from Contoso bank."

フレーズが次のように誤認識される場合があります: "Hi everyone, I'm Jesse from can't do so bank."

上のシナリオでは、"Rehaan"、"Jessie"、"Contoso" をフレーズリストに追加する必要があるでしょう。これで、名前が正しく認識されるはずです。

次に、Speech Studio を使用して、フレーズリストで認識精度がどのように向上するかを確認します。

注意

Azure サブスクリプションと Speech リソースを選択し、リージョンの課金を確認することを求めるメッセージが表示される場合があります。

Speech Studio のリアルタイム音声テキスト変換に移動します。
音声認識をテストするには、オーディオファイルをアップロードするか、マイクでオーディオを録音します。たとえば、[マイクでオーディオを録音する] を選択してから、"Hi Rehaan, I'm Jessie from Contoso bank." と話します。 " と話してから、赤いボタンを選択して録音を停止します。
文字起こしの結果が [テスト結果] テキストボックスに表示されます。 "Rehaan"、"Jessie"、または "Contoso" が誤って認識された場合は、次の手順で語句をフレーズリストに追加できます。
[詳細オプションの表示] を選択し、[フレーズリスト] をオンにします。
フレーズリストのテキストボックスに「Contoso;Jessie;Rehaan」と入力します。複数のフレーズは、セミコロンで区切る必要があります。
マイクを使用して認識を再度テストします。それ以外の場合は、オーディオファイルの横の再試行の矢印を選択してオーディオを再度実行できます。 "Rehaan"、"Jessie"、または "Contoso" という用語を認識する必要があります。