[Short Paper Review] Are Emergent Abilities of Large Language Models a Mirage?

최근에 나온 논문을 읽어보고 간단히 정리했습니다. 노션에 정리한 것을 그대로 긁어왔는데, 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ LLM에서 갑자기 등장하는 파워풀한 능력, emergent ability는 실재하는 것이 아니다. 연구자들의 편협한 metric 선택이 불러온 결과. 배경 LLM이 지닌 엄청난 능력이 주목을 받게 된 것은 GPT-3와 같이 파격적인 모델 파라미터 구성으로 학습을 진행한 시점부터였다. 흥미로운 것은 모델의 사이즈가 작았을 때 눈 씻고 봐도 찾을 수 없었던 능력이, 모델의 사이즈를 키우면서 ‘갑작스럽게’ 등장한다는 점이었다. 대표적인 예로 in-context-learning(이를 학습으로 볼 수 있는지에 대한 의견도 분분하지만) 등을 들 수 있다. 현재까지..

원문링크 : [Short Paper Review] Are Emergent Abilities of Large Language Models a Mirage?

[Short Paper Review] Are Emergent Abilities of Large Language Models a Mirage?

등록된 다른 글

[Short Paper Review] LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model

<LK Lab, Evaluation> Knowledge Unlearning for Mitigating Privacy Risks in Language Models (2022.12)

[BOJ] 1991 : 트리 순회 [](Python)

Programming Assignments

Landmark / Object Detection

<LK Lab, Alignment> [ALMoST] Aligning Large Language Models through Synthetic Feedback (2023.10)

<Benchmark> Struc-Bench: Are Large Language Models Really Good at Generating Complex Structured Data?

[네이버 부스트캠프 AI Tech 4기] 수료 기념 후기 (+ for 부캠 지원자)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티