Introduzione alla classificazione audio con TensorFlow

Modulo
5 Unità

Principiante

Data scientist

Sviluppatore

Studente

Azure

Azure Machine Learning

In questo modulo si apprenderà come eseguire la classificazione audio con TensorFlow. Esistono vari modi per creare un modello di classificazione audio. È possibile usare la forma d'onda, contrassegnare con tag le sezioni di un file d'onda o persino usare la visione artificiale nell'immagine dello spettrogramma. In questa esercitazione verrà prima descritto come comprendere i dati audio, dalle rappresentazioni analogiche a quelle digitali, quindi verrà compilato il modello usando la visione artificiale sulle immagini dello spettrogramma. Si può infatti trasformare l'audio in una rappresentazione di immagine e quindi usare la visione artificiale per classificare le parole pronunciate.

Obiettivi di apprendimento

Contenuto del modulo:

Nozioni di base sui dati audio
Informazioni su come visualizzare e trasformare i dati audio
Creare un modello di conversione voce/testo per la classificazione binaria in grado di riconoscere "sì" e "no"

Prerequisiti

Conoscenze base di Python
Conoscenza di base della modalità di utilizzo di Jupyter Notebook
Conoscenza di base di Machine Learning

Introduzione min
Informazioni sui dati audio min
Visualizzazione e trasformazione dei dati min
Creare il modello min
Riepilogo min