まとめ

10 分

お疲れさまでした。オーディオ二項分類音声モデルが構築されました。

アナログオーディオがデジタルサウンドに変わるしくみと、Wave ファイルのスペクトログラム画像を作成する方法についての理解が深くなりました。 PyTorch 音声コマンドデータセットを使用し、yes と no までクラスを解析した後、オーディオデータパターンを理解して視覚化する方法を確認しました。そこから、スペクトログラムを取得し、画像を作成し、畳み込みニューラルネットワークを使用してモデルを構築しました。

他のデータセットやサウンドを調べることで、また MFCC トランスフォーマーを調べることで、この知識を拡張できます。その後、モデルを構築できます。

次の他のモジュールも必ず確認してください。

ヒント

ハイパーリンクを開くには、右クリックして [新しいタブで開く] または [新しいウィンドウで開く] を選択します。この方法でリソースを確認し、簡単にモジュールに戻ることができます。

続行

フィードバック