PyTorch를 사용한 오디오 분류 소개

초급
데이터 과학자
개발자
학생
Azure

이 Learn 모듈에서는 PyTorch를 사용하여 오디오 분류를 수행하는 방법을 알아봅니다. 오디오 데이터 기능 및 사운드 신호를 분광이라는 시각적 표현으로 변환하는 방법에 대해 자세히 알아봅니다. 그런 다음, 스펙트로그램 이미지에서 컴퓨터 비전을 사용하여 모델을 빌드합니다. 맞습니다. 오디오를 이미지 형식으로 변환한 후 컴퓨터 비전을 사용하여 음성 단어를 분류할 수 있습니다.

학습 목표

이 모듈에서 학습할 내용은 다음과 같습니다.

  • 오디오 데이터의 기본 기능을 알아봅니다.
  • 스펙트로그램을 사용하여 소리 신호를 시각적 이미지 형식으로 변환하는 방법을 알아봅니다.
  • CNN(나선형 신경망)을 사용하여 소리나 음성 단어를 인식할 수 있는 음성 분류 모델을 구축합니다.

사전 요구 사항

  • 기본 Python 지식
  • Jupyter Notebook 사용 방법에 대한 기본 지식
  • CNN에 대한 기본적인 이해입니다. 이 학습 경로의 “PyTorch를 사용한 Computer Vision 소개” 모듈을 시작하는 것이 좋습니다.