Introdução à classificação de áudio com PyTorch

Módulo
5 Unidades

Iniciante

Cientista de Dados

Desenvolvedor

Estudante

Azure

Neste módulo do Learn, você vai aprender a fazer a classificação de áudio com o PyTorch. Você entenderá mais sobre os recursos de dados de áudio e como transformar os sinais de som em uma representação visual chamada espectrograma. Em seguida, você criará o modelo usando a pesquisa visual computacional nas imagens do espectrograma. Isso mesmo, você pode transformar um áudio em imagem e, em seguida, fazer a pesquisa visual computacional para classificar a palavra falada!

Objetivos de aprendizagem

Neste módulo, você vai:

Saiba mais sobre os recursos básicos dos dados de áudio.
Saiba como transformar sinais de som em um formato de imagem visual usando espectrogramas.
Criar um modelo de classificação de fala que possa reconhecer sons ou palavras faladas usando CNNs (redes neurais convolucionais).

Pré-requisitos

Conhecimento básico de Python.
Conhecimento básico sobre como usar Jupyter Notebooks.
Noções básicas de CNNs. O módulo "Introdução à Pesquisa Visual Computacional com PyTorch" neste roteiro de aprendizagem é um bom ponto de partida.

Introdução min
Entender os dados e conceitos de áudio min
Transformações e visualizações de áudio min
Criar o modelo de fala min
Resumo min