使用 TensorFlow 进行音频分类简介
此学习模块将介绍如何使用 TensorFlow 进行音频分类。 可通过多种方法生成音频分类模型。 可以使用波形文件的波形标记部分,甚至可以对光谱图图像使用计算机视觉。 在本教程中,将详细讲解如何理解音频数据(从模拟到数字表示形式),然后对声谱图使用计算机视觉生成模型。 没错,你可以将音频转换为图像表示形式,然后利用计算机视觉对所讲的话进行分类!
学习目标
通过学习本模块,你将能够:
- 了解音频数据的基础知识
- 了解如何可视化和转换音频数据
- 生成可识别“是”和“否”的二元分类语音模型
先决条件
- Python 基础知识
- 对如何使用 Jupyter Notebook 有基本的了解
- 对机器学习有基本的了解