まとめ
お疲れさまでした。オーディオ二項分類音声モデルが構築されました。
アナログ オーディオがデジタル サウンドに変わるしくみと、Wave ファイルのスペクトログラム画像を作成する方法についての理解が深くなりました。 PyTorch 音声コマンド データセットを使用し、yes
と no
までクラスを解析した後、オーディオ データ パターンを理解して視覚化する方法を確認しました。 そこから、スペクトログラムを取得し、画像を作成し、畳み込みニューラル ネットワークを使用してモデルを構築しました。
他のデータセットやサウンドを調べることで、また MFCC
トランスフォーマーを調べることで、この知識を拡張できます。 その後、モデルを構築できます。
次の他のモジュールも必ず確認してください。
ヒント
ハイパーリンクを開くには、右クリックして [新しいタブで開く] または [新しいウィンドウで開く] を選択します。 この方法でリソースを確認し、簡単にモジュールに戻ることができます。