Introducción a la clasificación de audio con TensorFlow
En este módulo de Learn, aprenderemos a realizar la clasificación de audio con TensorFlow. Hay varias maneras de crear un modelo de clasificación de audio. Puede usar la forma de onda, etiquetar secciones de un archivo de ondas o incluso usar Computer Vision en la imagen del espectrograma. En este tutorial, primero se explica cómo comprender los datos de audio, desde representaciones análogas a digitales, y luego se crea el modelo mediante Computer Vision en las imágenes de espectrograma. De esta forma, puede convertir el audio en una representación de imagen y, a continuación, ejecutar Computer Vision para clasificar la palabra hablada.
Objetivos de aprendizaje
Objetivos de este módulo:
- Conceptos básicos de los datos de audio
- Visualizar y transformar datos de audio
- Crear un modelo de voz de clasificación binaria que pueda reconocer "sí" y "no"
Requisitos previos
- Conocimientos básicos de Python
- Conocimientos básicos sobre cómo usar cuadernos de Jupyter Notebook
- Conocimientos básicos del aprendizaje automático