[머신러닝] Cross Validation


[머신러닝] Cross Validation

#머신러닝 머신러닝에서는 일반화 성능을 향상시키는 것 즉 테스트 오류를 최소화하는 것이 주된 목표입니다. Cross validation은 validation set을 여러 개 뽑아 각각에 대한 validation error를 추출해 그것의 평균이 가장 작도록 하는 모델을 찾아나가는 것입니다. 용어 정리 1. Overfitting(과적합) : 학습 정확도는 상당히 높은 반면 실제 테스트시 정확도가 상당히 떨어지는 문제 학습을 위한 데이터는 한정적이기 때문에 학습 정확도가 100%가 되더라도 새롭게 주어지는 테스트 샘플에 대한 정확도는 제법 괴리가 있을 수 있다는 것. Decision tree에서 Depth 즉 트리의 길이를 최대한으로 하였을 때 학습 성능은 100%가 되지만 계산량이 늘어나는 문제와 과하게 학습 데이터에 최적화된다는 문제를 의미합니다. 2. IID assumption : Independent and Identically Distributed 의 약자로, 기본적으로 학습...


#머신러닝

원문링크 : [머신러닝] Cross Validation