はじめに

完了

あなたは、医学記録転写会社で開発者として働いているとします。 あなたの会社のクライアントは、ハンドヘルド デジタル ボイス レコーダーにメモを音声ファイルとして記録する医師たちのチームです。 彼らは、共有クラウド ドライブを通じてあなたの会社とファイルを共有しています。彼らのメモは、短い覚書と長い口述を組み合わせたものです。

あなたの会社は、文字起こし担当者を大人数維持する必要があるとともに、会社にとっては、これら 2 種類の音声ファイルを扱うことが興味深い課題にもなっています。

  • 会社の文字起こし担当者は、クライアントから渡された大量の短い覚書を処理するために膨大な時間を必要としており、会社のサービス レベル アグリーメント (SLA) で定められている期間内に文字起こしを納品するのが困難になっています。

  • 長い口述については、多くの場合、文字起こしが 1 回のセッションでは終わらないため、会社の文字起こし担当者は、前回のセッションでどこまで作業を行ったかを記憶しておくのに苦労しています。

あなたは、Microsoft の Azure AI サービスから、Azure AI 音声テキスト変換機能を利用したアプリケーションを作成するための API が開発者向けに提供されたことを耳にしました。また、上司からは、音声テキスト変換機能を使用して文字起こし作業の一部を軽くできるアプリケーションを作成し、それによって運営コストとサービス レベル アグリーメントの問題を軽減する方法について調査するように頼まれています。

このモジュールでは、Azure AI サービスを使用して、サンプル WAVE ファイルをテキストに変換する音声テキスト変換アプリケーションを作成する方法について学習します。

学習の目的

このモジュールでは、次のことを行います。

  • Azure AI サービス アカウントを作成します。
  • 1 つの発話を使用して音声をテキストに変換するコマンドライン アプリケーションを作成する。
  • 連続認識を使用して音声をテキストに変換するコマンドライン アプリケーションを作成します。

前提条件

  • 開発ツールに関する基本的な知識