Deformable DETR Implementation Details 1

여기서는 D-DETR의 코드를 논문과 이어서 살펴봅니다 부분부분 컴포넌트들이 어떤 동작을 하고 어떤 결과를 유도하는지 확인하는 형태로 보면 좋을 것 같습니다. 혹시 유사한 작업을 진행했던 분이 있다면 토론할 수 있으면 좋겠습니다 :) 잘 못 이해하고 있는 부분이 있다면 가감없이 바로 댓글 달아주시면 감사하겠습니다. 총 D-DETR 트랜스포머 동작 이전의 준비 요소들 인코더 디코더 결과 출력 Loss 로 나누어서 살펴볼 것 같습니다. 준비요소들은 비교적 적습니다. 준비요소 샘플 이미지 타겟 라벨 정보 Boxes, labels, image_id, area, is_crowded, orig_size, size(현재) / 대부분이 coco를 사용하기에 필요한 정보 Image Backbone Feature(Resnet을 백본으로 사용해서 4개의 Layer에서 피쳐를 가져오는 d-detr에서 꼭 필요한 정보입니다.) D-Detr의 백본은 torchvision에서 가져오는 것이며 Resnet18 ...

#AI #코드구현 #인공지능 #딥러닝 #Transformer #Loss #Implemenation #endtoend #encoder #DETR #Detector #DeformableDetr #Deformable #DeepLearning #Decoder #DDETR코드 #DDETR #코드분석

원문링크 : Deformable DETR Implementation Details 1