Introduzione alla classificazione audio con TensorFlow

Principiante
Data scientist
Sviluppatore
Studente
Azure
Machine Learning

In questo modulo si apprenderà come eseguire la classificazione audio con TensorFlow. Esistono vari modi per creare un modello di classificazione audio. È possibile usare la forma d'onda, contrassegnare con tag le sezioni di un file d'onda o persino usare la visione artificiale nell'immagine dello spettrogramma. In questa esercitazione verrà prima descritto come comprendere i dati audio, dalle rappresentazioni analogiche a quelle digitali, quindi verrà compilato il modello usando la visione artificiale sulle immagini dello spettrogramma. Si può infatti trasformare l'audio in una rappresentazione di immagine e quindi usare la visione artificiale per classificare le parole pronunciate.

Obiettivi di apprendimento

Contenuto del modulo:

  • Nozioni di base sui dati audio
  • Informazioni su come visualizzare e trasformare i dati audio
  • Creare un modello di conversione voce/testo per la classificazione binaria in grado di riconoscere "sì" e "no"

Prerequisiti

  • Conoscenza di base di Python
  • Conoscenza di base della modalità di utilizzo di Jupyter Notebook
  • Informazioni di base sull'apprendimento automatico