DeiT: Training data-efficient image transformers & distillation through attention

#DeiT Summary 1. 본 논문에서 제안하는 방법인 DeiT는 vision transformer (ViT)을 distillation으로 학습시킨 image classification 모델이다. DeiT의 main contribution은 ViT 모델을 학습시키는 방법에 있기 때문에, 모델의 구조적인 차별성은 거의 없다 (사실 전혀 없다고 봐도 무방한 것이 ViT에서 channel 숫자만 바꾸는 정도의 수정만을 가하였다). 2. DeiT는 Distillation 방법을 통해서 기존 ViT 모델의 한계를 극복할 수 있음을 주장한다. ViT의 문제점은 Transformer의 구조적인 한계로 인해 image 데이터를 학습할 때 CNN과는 달리 이미지 처리에 유리한 inductive bias (locality와 translation equivariance 와 같은 CNN 모델 고..........

원문링크 : DeiT: Training data-efficient image transformers & distillation through attention

등록된 다른 글

DeiT: Training data-efficient image transformers & distillation through attention

등록된 다른 글

인공지능을 위한 선형대수 - 실습1

ERP 재무회계모듈

명품 java programming 실습문제 2장 6번

BOJ 1874 스택 수열

Google 머신러닝(ML) - 로지스틱 회귀

우분투 usb 버전 확인하기

DCGAN / Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

101 Pandas Exercises for Data Analysis

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티