Episodio

Ep 55 | Análisis de audio con Azure Automated ML

con Seth Juarez, Serge Retkowsky

Serge Retkowsky ha vuelto para demostrar cómo el procesamiento de audio puede consistir en extraer información de la señal de audio en imágenes de espectrogramas (tiempo frente a frecuencia frente a Db) que podemos usar para desarrollar un modelo de visión personalizado con Azure. También extraeremos algunos componentes de audio y usaremos un modelo de clasificación genérico con Azure ML y sus características de AutoML.

Capítulos

  • 00:00: Bienvenida a AI Show
  • 01:27: Introducción al análisis de audio con Azure Automated ML
  • 03:02: Transformación rápida de Fourier (FFT): señal de dominio temporal a la señal de dominio de frecuencia
  • 05:10: Espectograma de cómo varía el espectro de frecuencias con el tiempo
  • 07:50: Demostración - Clasificación de género musical
  • 13:15: Creación de un cromagrama
  • 14:05: Generación de espectogramas
  • 15:04: Clasificación de género musical con ML automatizado para imágenes
  • 16:34: Llamada al modelo de CV de AutoML
  • 22:42: Demostración 2
  • 25:29: Más información