오픈AI의 GPT-3의 이해


오픈AI의 GPT-3의 이해

샌프란시스코에 본사를 둔 인공지능 연구소 오픈AI가 제작한 ‘대형언어모델(large language model)’ GPT-3는 딥러닝(deep learning)을 이용하는 알고리즘으로, 책이나 인터넷에 있는 수많은 텍스트를 학습하여 단어와 구절을 연결해 텍스트를 생성한다. 2020년에 처음 출시됐을 때 GTP-3가 인간의 글을 무서울 정도로 실제에 가깝게 모방하자 많은 이들은 드디어 진정한 기계지능(machine intelligence)으로 향하는 문이 열렸다고 생각했다. 마이크로소프트, 구글, 페이스북(현 메타)도 자체적인 대형언어모델을 발표했다. 그러나 GPT-3는 2021년 초까지 발표된 언어모델 중 가장 성능이 뛰어난 모델이었다. 또한 GPT-3는 팬픽션, 철학적 논쟁, 심지어 프로그래밍 코드까지 어떤 텍스트든 작성할 수 있을 것처럼 보인다. 2020년 여름에 사람들이 GPT-3를 테스트하기 시작하면서 소셜미디어에는 GPT-3의 다재다능한 능력을 보여주는 수많은 사례들이 쏟아...



원문링크 : 오픈AI의 GPT-3의 이해