영상 또는 음성을 텍스트로, 텍스트를 음성으로 변환하는 방법들


영상 또는 음성을 텍스트로, 텍스트를 음성으로 변환하는 방법들

이번 포스팅에서는 여러 가지 진보된 AI 기반의 speech to text, text to speech 관련 기술들을 살펴보려고 합니다. 즉, 유튜브 등의 영상을 녹화한 다음 녹화된 영상에서 음성을 추출하고 추출한 음성을 텍스트 문장으로 바꾸는 과정과 크롬 브라우저에서 웹 서핑 도중 마우스로 드래그한 문장을 한국어 음성으로 출력하는 방법을 알아보려고 합니다. 아래의 설명들에서는 주로 제가 알고 있는 하나의 앱이나 방법등으로 진행하지만 표준 방법이 아니라 시도할 수 있는 여러 가지의 앱이나 방법들이 존재할 수 있습니다. 아마도 시간이 흐름에 따라 더욱더 정교하고 빠르며 좋은 방법들이 생겨날 것이라고 생각합니다. 1. 영상을 텍스트로(speech to text) 영상에서 직접 텍스트를 추출하는 기술은 아직까..


원문링크 : 영상 또는 음성을 텍스트로, 텍스트를 음성으로 변환하는 방법들