Cross Validation - 모델 교차 검증


Cross Validation - 모델 교차 검증

동일한 test 데이터를 이용해 모델의 성능을 검증하고 최적화하는 과정을 반복하면, 결국 이 모델은 test 데이터에 과적합(overfitting) 되어 실제 데이터의 예측 성능이 떨어지는 문제 발생 → 교차 검증 (cross validation)을 통해 평균적인 예측 성능 검증 가능 (훈련용과 검증용 데이터를 교차하여 지정하는 방법) K-Fold Cross Validataion - 전체 데이터셋을 N개의 fold로 나누어 매번 다른 fold 1개를 test data로, 나머지 n-1개를 train data로 분할해서 검증 반복 특정 데이터 셋에 대한 과적합을 방지하고 더욱 일반화된 모델 생성 가능하고 데이터 셋 규모가 적을 시 과소적합 방지가 가능 함 단, 반복 검증에 의한 학습 횟수의 증가로 모델 훈련 및 평가 소요 시간 증가 함 [ cross_val_score(estimator, X, y, scoring, CV) ] 교차검증 수행을 편리하게 해주는 함수 - estimator: ...


#estimator는

원문링크 : Cross Validation - 모델 교차 검증