<LLM, Zero-shot> [T0] Multitask Prompted Training Enables Zero-Shot Task Generalization (2022.03)

관심있는 NLP 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ [BigScience] - 사전학습된 encoder-decoder 모델 T5를 explicit multi-task learning으로 fine-tuning한 모델, T0 - 다양한 태스크에 대한 zero-shot 성능 일반화 & prompt를 구성하는 word의 다양성 확보 (robustness) 배경 LLM이 새로운 태스크에 대해 뛰어난 zero-shot 성능을 보이는 것이 확인됨 그러나 학습 때 접하지 않았던 태스크에 대해 좋은 성능을 보이기 위해선 1) 충분히 큰 사이즈의 모델이 필요하고 2) prompt를 구성하는 단어에 영향을 받지 않게 만들어야 함 지금까지는 multitask ..

원문링크 : <LLM, Zero-shot> [T0] Multitask Prompted Training Enables Zero-Shot Task Generalization (2022.03)

<LLM, Zero-shot> [T0] Multitask Prompted Training Enables Zero-Shot Task Generalization (2022.03)

등록된 다른 글

[Short Paper Review] LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model

[BOJ] 1976 : 여행가자 [유니온파인드](Python)

Moving to multivariate

Variances and covariances

<Attention> [CALM] LLM Augmented LLMs: Expanding Capabilities through Composition (2024.01)

Logistic Regression as a Neural Network(2)

<LK Lab, Instruction> [Flipped Learning] Guess the Instructoin! Flipped Learning Makes Language Models Stronger Zero-Shot Learners (2023.06)

<Dataset, Instruction> AlpaGasus: Training A Better Alpaca with Fewer Data (2023.07)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티