요약
오디오 이진 분류 음성 모델 빌드를 축하드립니다.
이제 아날로그 오디오가 디지털 사운드로 전환되는 방법과 웨이브 파일의 분광 이미지를 만드는 방법을 더 잘 이해할 수 있습니다. PyTorch 음성 명령 데이터 세트를 사용하고, 클래스를 yes
및 no
구문으로 분석한 다음 오디오 데이터 패턴을 이해하고 시각화하는 방법을 살펴보았습니다. 그리고 분광기를 이용해 이미지를 만들고 나선형 신경망을 이용해 모델을 빌드했습니다.
다른 데이터 세트와 소리를 살펴보고 MFCC
변환기를 확인하여 이 지식을 확장할 수 있습니다. 그런 다음 모델을 빌드할 수 있습니다.
다음 다른 모듈도 확인해야 합니다.
팁
하이퍼링크를 열려면 마우스 오른쪽 단추를 클릭하고 새 탭 또는 창에서 열기를 선택합니다. 이렇게 하면 리소스를 확인하고 모듈에 쉽게 돌아갈 수 있습니다.