Deformable DETR Implementation Details 2

여기서는 Encoder 부분에 해당하는 코드 구현을 살펴봅니다. Encoder는 대체로 픽셀간의 관계성을 찾아내고, 객체를 찾아내는 것을 중점으로 합니다. 훈련을 진행할수록 객체의 말단 부분과 같은 곳에 집중하게 됩니다. 1. Encoder의 reference points 첫번째로 Encoder를 시작하기에 앞서서 해당 모델은 Deformable입니다. 기존에 모든 이미지의 픽셀 관계를 학습하는 것이 아닌 모든 픽셀 중 특정 Ref_points를 뽑아 거기서 offsets의 범위를 다양하게 해서 객체를 찾아냅니다. 이를 통해서 모델 훈련속도를 굉장히 줄이고, 검출속도도 빨라졌기에 알아두는 것이 중요합니다. 아무튼 여기서는 Encoder 부분의 어떤 점을 기준으로 삼을 것인지를 정하는 부분을 살펴봅니다. 코드는 전부 공식 Github의 Deformable-DETR에서 가져옵니다. class DeformableTransformerEncoder(nn.Module): def __init__...

#AI #Implemenation #Loss #MultiScale #objectDetection #Transformer #Transformer를활용한Detection #딥러닝 #인공지능 #코드구현 #endtoend #encoder #DETR #Code #DDETR #DDETR코드 #Decoder #DeepLearning #Deformable #DeformableDetr #Detection #Detector #코드분석

원문링크 : Deformable DETR Implementation Details 2