Présentation de la classification audio avec TensorFlow
Dans ce module d’apprentissage, nous allons apprendre à effectuer une classification audio avec TensorFlow. Il existe plusieurs façons de créer un modèle de classification audio. Vous pouvez utiliser la forme d’onde, les sections de balise d’un fichier audio, ou même utiliser la Vision par ordinateur sur l’image de spectrogramme. Dans ce tutoriel, nous allons d’abord décomposer comment comprendre les données audio, de l’analogique aux représentations numériques, puis nous allons créer le modèle à l’aide de la vision par ordinateur sur les images de spectrogramme. Exact, vous pouvez activer l’audio dans une représentation d’image, puis utiliser la vision par ordinateur pour classer le mot parlé !
Objectifs d’apprentissage
Dans ce module, vous allez :
- Découvrir les principes de base des données audio
- Découvrez comment visualiser et transformer des données audio
- Créer un modèle de reconnaissance vocale de classification binaire qui peut reconnaître « oui » et « non »
Prérequis
- Connaissance élémentaire de Python
- Connaissance élémentaire de l’utilisation des notebooks Jupyter
- Notions de base sur le Machine Learning
Prise en main d’Azure
Choisissez le compte Azure qui vous convient. Payez à l’utilisation ou essayez Azure gratuitement pendant jusqu’à 30 jours. S’inscrire.