(VGGNet) Very Deep Convolutional Networks for Large-Scale Image Recognition

해당 논문에서는 ConvNet의 깊이에 집중하여, 깊이를 깊게 하기 위해 모든 layer에 3x3, 1x1 크기의 filter만을 이용하여 비교적 단순한 구조를 가지는 VGGNet을 제시했습니다. VGGNet은 이 논문에서 끝나지 않고 다른 여러 모델들에 영감을 주었으며, 이 모델 자체도 여러 모델의 backbone으로서 이용되곤 합니다. 아쉽게도 같은 년도 GoogLeNet에 밀려 대회에선 2등을 차지했으나, GoogLeNet의 복잡한 구조 때문에 오히려 VGGNet이 더 범용적으로 쓰이는 것 같습니다. Architecture 논문에서는 위와 같이 여러 종류의 모델을 소개했습니다. input은 224 * 224의 RGB 이미지로, train set에서 평균 RGB값을 각 픽셀에 빼 주었다 합니다. 공통적으로 2x2 max pooling을 중간중간 이용했고, 활성화 함수는 ReLU를 사용합니다. Conv Layer 뒤에는 3개의 FC layer가 존재합니다. 또한 3x3, 1x1 f...

#classification #CNN #Isotropicallyrescale #VGG16 #VGG19 #VGGNet

원문링크 : (VGGNet) Very Deep Convolutional Networks for Large-Scale Image Recognition