SpecAugment 리뷰


SpecAugment 리뷰

#SpecAugment SpecAugment 리뷰 :: Kaen의 일상생활 (tistory.com) 이번 논문은 음성 인식에서 널리 사용되고 있는 증강 기법인 SpecAugment [1]이다. 논문은 arxiv.org/abs/1904.08779에서 확인할 수 있다. Intro, related works 기존의 음성 인식을 위한 증강 기법은 아래와 같았다. 1) Noise Injection Numpy를 사용하여 데이터에 임의의 값을 추가하여 증강하는 기법 (잡음 추가) 2) Shifting time 임의의 ms로 오디오를 왼쪽 / 오른쪽으로 이동 n_ms를 사용하여 오디오를 왼쪽으로 이동하면 처음 n_ms초는 0(무음)으로 표시 n_ms를 사용하여 오디오를 오른쪽으로 이동하면 마지막 n_ms가 0(무음)으로 표시됨 3) Changing pitch 무작위로 pit..........



원문링크 : SpecAugment 리뷰