1. 과적합 (Overfitting)


1. 과적합 (Overfitting)

과적합(=overfitting)이란 모델이 학습 데이터셋 안에서는 일정 수준 이상의 예측 정확도를 보이지만, 새로운 데이터에 적용하면 잘 맞지 않는 것을 말합니다. 위 그림을 보면 주어진 샘플을 구분하도록 정확하게 붉은선이 그어져 있습니다. 하지만 이 붉은선은 특정 경우에만 최적화되어 새로운 데이터가 적용되면 정확히 두 그룹으로 분류하지 못하게 됩니다. 반대로 학습이 부족하다면 녹색 선처럼 두 그룹을 제대로 못하기도 하지만, 이글에서는 과적합을 위주로 알아보도록 하겠습니다. ※언더피팅(=Underfitting) : 모델의 표현력이 부족해서 훈련 데이터도 제대로 예측하지 못하는 현상. 위 그래프에서 파란선은 훈련 데이터(=Trainning Set), 붉은선은 실제 데이터(=Validation Set)의 오류 정도를 뜻합니다. 처음에는 훈련 데이터와 실제 데이터 모두 에러가 작아지지만 일정 횟수 이상 반복할 경우, 훈련 데이터의 오류만 작아지고 검증 에러는 계속 커지게 되는 것을 볼 수...


#과적합 #딥러닝 #머신러닝 #언더피팅 #오버피팅 #인공지능 #일반화 #최적화

원문링크 : 1. 과적합 (Overfitting)