TensorFlow を使用したオーディオ分類の概要

モジュール
5 ユニット

初級

データサイエンティスト

開発者

Student

Azure

Azure Machine Learning

この学習モジュールでは、TensorFlow を使用してオーディオ分類を行う方法について学習します。オーディオ分類モデルを作成するには、複数の方法があります。波形を使用したり、wave ファイルのセクションにタグを付けたり、スペクトログラム画像で Computer Vision を使用したりすることもできます。このチュートリアルでは、まず、アナログからデジタル表現までのオーディオデータを理解する方法を分解し、次に、スペクトログラム画像のコンピュータービジョンを使用してモデルを構築します。そうです、音声を画像表現に変換してから、Computer Vision を実行して、話された単語を分類することができます。

学習の目的

このモジュールでは、次のことを行います。

オーディオデータの基本について学習する
オーディオデータを視覚化および変換する方法について説明します
"yes" と "no" を認識できる二項分類音声モデルを構築する

前提条件

Python の基本的な知識
Jupyter Notebook の使用方法に関する基本的な知識
機械学習についての基本的な理解

Azure を使ってみる

適切な Azure アカウントを選択します。 Azure は、従量課金制でご利用いただくことも、最大 30 日間無料でお試しいただくこともできます。 [サインアップ] 。

開始