Introdução à classificação de áudio com o TensorFlow
Neste módulo de aprendizagem, veremos como fazer a classificação de áudio com o TensorFlow. Há várias maneiras de criar um modelo de classificação de áudio. Você pode usar a forma de onda, marcar seções de um arquivo de onda ou até mesmo usar a visão computacional na imagem do espectrograma. Neste tutorial, primeiro vamos analisar como entender os dados de áudio, de representações analógicas a digitais e, em seguida, criaremos o modelo usando a pesquisa visual computacional nas imagens do espectrograma. Isso mesmo, você pode transformar o áudio em uma representação de imagem e, em seguida, fazer a visão computacional para classificar a palavra falada!
Objetivos de aprendizagem
Neste módulo, você vai:
- Aprender o básico sobre os dados de áudio
- Saiba como visualizar e transformar dados de áudio
- Criar um modelo de fala de classificação binária que possa reconhecer "sim" e "não"
Pré-requisitos
- Conhecimento básico em Python
- Conhecimento básico sobre como usar Jupyter Notebooks
- Noções básicas sobre machine learning