Music Information Retreival 딥러닝 실습(1). 스펙트로그램 with TorchAudio


Music Information Retreival 딥러닝 실습(1). 스펙트로그램 with TorchAudio

공부의 출처 : 서강대학교 정다샘 교수님 Deep Learning For Music&Audio 위 코드는 기본적으로 pytorch의 torchaudio를 이용하여 스펙토그램을 만드는 방법에 대한 코드이다. 스펙토그램의 이론은 이전 글을 참고하면 된다. torchaudio.load() torchaudio를 통해 오디오를 불러온다. y는 오디오 샘플들을 텐서로 가져오며, sr은 Samle Rate이다. 참고로 len(오디오 샘플) / SR을 하면 오디오의 재생시간을 알 수 있다. (Why? : 샘플레이트는 1초당 읽는 샘플갯수를 의미하기 때문이다.) Tensor로 변환 후 나오는 오디오의 plot이다. plt.plot으로 간단하게 확인할 수 있다. 2. Spectrogram By torchaudio 토치오디오를 통해 스펙토그램으로 변환하는 방법은 functional 함수를 이용하는 것과, class를 이용하는 방법이 있다. functional 함수를 사용하면 default를 지정할 것이...


#MIR #MusicInformationRetrieval #torchaudio #스펙트로그램

원문링크 : Music Information Retreival 딥러닝 실습(1). 스펙트로그램 with TorchAudio