PyTorch를 사용한 오디오 분류 소개

모듈
5 단위

초급

데이터 과학자

개발자

학생

Azure

이 Learn 모듈에서는 PyTorch를 사용하여 오디오 분류를 수행하는 방법을 알아봅니다. 오디오 데이터 기능 및 사운드 신호를 분광이라는 시각적 표현으로 변환하는 방법에 대해 자세히 알아봅니다. 그런 다음, 스펙트로그램 이미지에서 컴퓨터 비전을 사용하여 모델을 빌드합니다. 맞습니다. 오디오를 이미지 형식으로 변환한 후 컴퓨터 비전을 사용하여 음성 단어를 분류할 수 있습니다.

학습 목표

이 모듈에서 학습할 내용은 다음과 같습니다.

오디오 데이터의 기본 기능을 알아봅니다.
스펙트로그램을 사용하여 소리 신호를 시각적 이미지 형식으로 변환하는 방법을 알아봅니다.
CNN(나선형 신경망)을 사용하여 소리나 음성 단어를 인식할 수 있는 음성 분류 모델을 구축합니다.

사전 요구 사항

기본 Python 지식
Jupyter Notebook 사용 방법에 대한 기본 지식
CNN에 대한 기본적인 이해입니다. 이 학습 경로의 “PyTorch를 사용한 Computer Vision 소개” 모듈을 시작하는 것이 좋습니다.