Introdução à classificação de áudio com PyTorch
Neste módulo do Learn, você vai aprender a fazer a classificação de áudio com o PyTorch. Você entenderá mais sobre os recursos de dados de áudio e como transformar os sinais de som em uma representação visual chamada espectrograma. Em seguida, você criará o modelo usando a pesquisa visual computacional nas imagens do espectrograma. Isso mesmo, você pode transformar um áudio em imagem e, em seguida, fazer a pesquisa visual computacional para classificar a palavra falada!
Objetivos de aprendizagem
Neste módulo, você vai:
- Saiba mais sobre os recursos básicos dos dados de áudio.
- Saiba como transformar sinais de som em um formato de imagem visual usando espectrogramas.
- Criar um modelo de classificação de fala que possa reconhecer sons ou palavras faladas usando CNNs (redes neurais convolucionais).
Pré-requisitos
- Conhecimento básico de Python.
- Conhecimento básico sobre como usar Jupyter Notebooks.
- Noções básicas de CNNs. O módulo "Introdução à Pesquisa Visual Computacional com PyTorch" neste roteiro de aprendizagem é um bom ponto de partida.