Introdução à classificação de áudio com PyTorch

Iniciante
Cientista de Dados
Desenvolvedor
Estudante
Azure

Neste módulo do Learn, você vai aprender a fazer a classificação de áudio com o PyTorch. Você entenderá mais sobre os recursos de dados de áudio e como transformar os sinais de som em uma representação visual chamada espectrograma. Em seguida, você criará o modelo usando a pesquisa visual computacional nas imagens do espectrograma. Isso mesmo, você pode transformar um áudio em imagem e, em seguida, fazer a pesquisa visual computacional para classificar a palavra falada!

Objetivos de aprendizagem

Neste módulo, você vai:

  • Saiba mais sobre os recursos básicos dos dados de áudio.
  • Saiba como transformar sinais de som em um formato de imagem visual usando espectrogramas.
  • Criar um modelo de classificação de fala que possa reconhecer sons ou palavras faladas usando CNNs (redes neurais convolucionais).

Pré-requisitos

  • Conhecimento básico de Python.
  • Conhecimento básico sobre como usar Jupyter Notebooks.
  • Noções básicas de CNNs. O módulo "Introdução à Pesquisa Visual Computacional com PyTorch" neste roteiro de aprendizagem é um bom ponto de partida.