Introdução à classificação de áudio com o TensorFlow
Neste módulo de aprendizagem, vamos aprender a fazer a classificação de áudio com o TensorFlow. Existem várias formas de criar um modelo de classificação de áudio. Pode utilizar o formato de onda, etiquetar secções de um ficheiro de onda ou até mesmo utilizar a imagem digitalizada na imagem do espectrograma. Neste tutorial, vamos começar por dividir como compreender os dados de áudio, desde representações analógicas a digitais e, em seguida, vamos criar o modelo com a imagem digitalizada nas imagens do espectrograma. Isso mesmo, pode transformar o áudio numa representação de imagem e, em seguida, fazer imagem digitalizada para classificar a palavra falada!
Objetivos de aprendizagem
Neste módulo, irá:
- Aprenda as noções básicas dos dados de áudio
- Saiba como visualizar e transformar dados de áudio
- Criar um modelo de voz de classificação binária que consiga reconhecer "sim" e "não"
Pré-requisitos
- Conhecimentos básicos do Python
- Conhecimentos básicos sobre como utilizar o Jupyter Notebooks
- Noções básicas sobre machine learning