使用 TensorFlow 进行音频分类简介

初级
数据科学家
开发人员
学生
Azure
机器学习

此学习模块将介绍如何使用 TensorFlow 进行音频分类。 可通过多种方法生成音频分类模型。 可以使用波形文件的波形标记部分,甚至可以对光谱图图像使用计算机视觉。 在本教程中,将详细讲解如何理解音频数据(从模拟到数字表示形式),然后对声谱图使用计算机视觉生成模型。 没错,你可以将音频转换为图像表示形式,然后利用计算机视觉对所讲的话进行分类!

学习目标

通过学习本模块,你将能够:

  • 了解音频数据的基础知识
  • 了解如何可视化和转换音频数据
  • 生成可识别“是”和“否”的二元分类语音模型

先决条件

  • Python 基础知识
  • 对如何使用 Jupyter Notebook 有基本的了解
  • 对机器学习有基本的了解