TensorFlow を使用したオーディオ分類の概要

初級
データ サイエンティスト
開発者
Student
Azure
Azure Machine Learning

この学習モジュールでは、TensorFlow を使用してオーディオ分類を行う方法について学習します。 オーディオ分類モデルを作成するには、複数の方法があります。 波形を使用したり、wave ファイルのセクションにタグを付けたり、スペクトログラム画像で Computer Vision を使用したりすることもできます。 このチュートリアルでは、まず、アナログからデジタル表現までのオーディオ データを理解する方法を分解し、次に、スペクトログラム画像のコンピューター ビジョンを使用してモデルを構築します。 そうです、音声を画像表現に変換してから、Computer Vision を実行して、話された単語を分類することができます。

学習の目的

このモジュールでは、次のことを行います。

  • オーディオ データの基本について学習する
  • オーディオ データを視覚化および変換する方法について説明します
  • "yes" と "no" を認識できる二項分類音声モデルを構築する

前提条件

  • Python の基本的な知識
  • Jupyter Notebook の使用方法に関する基本的な知識
  • 機械学習についての基本的な理解

Azure を使ってみる

適切な Azure アカウントを選択します。 Azure は、従量課金制でご利用いただくことも、最大 30 日間無料でお試しいただくこともできます。 [サインアップ] 。