Introduzione alla classificazione audio con TensorFlow
In questo modulo si apprenderà come eseguire la classificazione audio con TensorFlow. Esistono vari modi per creare un modello di classificazione audio. È possibile usare la forma d'onda, contrassegnare con tag le sezioni di un file d'onda o persino usare la visione artificiale nell'immagine dello spettrogramma. In questa esercitazione verrà prima descritto come comprendere i dati audio, dalle rappresentazioni analogiche a quelle digitali, quindi verrà compilato il modello usando la visione artificiale sulle immagini dello spettrogramma. Si può infatti trasformare l'audio in una rappresentazione di immagine e quindi usare la visione artificiale per classificare le parole pronunciate.
Obiettivi di apprendimento
Contenuto del modulo:
- Nozioni di base sui dati audio
- Informazioni su come visualizzare e trasformare i dati audio
- Creare un modello di conversione voce/testo per la classificazione binaria in grado di riconoscere "sì" e "no"
Prerequisiti
- Conoscenze base di Python
- Conoscenza di base della modalità di utilizzo di Jupyter Notebook
- Conoscenza di base di Machine Learning