[Continual Learning] Knowledge Distillation 기법 정리

Knowledge Distillation(지식 증류)란? Knowledge Distillation(이하 KD)는 Teacher Network에서 얻어낸 지식을 Student Network로 전달시켜 학습하는 기법이다. 처음 이 방법이 제안되었을 때에는 큰 모델에서 학습한 지식을 작은 모델로 전달함으로써 모바일 기기 등 연산능력이 강력하지 않은 하드웨어에서도 딥러닝 모델을 동작시키려는 목적이었다. 최근에는 지속적으로 들어오는 데이터 스트림을 학습하기 위한 Continual Learning 방법론 중 하나로 KD가 대두되고 있는데, 이전 시점의 모델이 학습한 지식(Hidden Knowledge)를 현재 시점 모델에게 주입하는 방식으로 모델에게 새로운 지식을 학습시킨다. 본 포스팅에서는 언어 모델의 Conti..

원문링크 : [Continual Learning] Knowledge Distillation 기법 정리

등록된 다른 글

[Continual Learning] Knowledge Distillation 기법 정리

등록된 다른 글

[논문 잘 읽는 법]How to Read a Paper

[NLP]Word Sense Induction(단어 의미 추론)

[워드 임베딩] Glove : Gloval Vectors for word Representation

[Continual Learning] Knowledge Distillation 기법 정리

[Hugging Face] PEFT에 대해 알아보자

[NLP] Lexical Simplification(어휘 단순화)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티