K-fold cross validation


K-fold cross validation

K-fold cross validation은 교차 검증의 한 종류로, 데이터를 K 개로 나누어서 교차 검증을 진행한다. K 개로 나누어진 데이터에서 (K-1) 개는 모델의 학습에 활용되고, 나머지 1개는 검증에 활용된다. 검증 데이터 셋을 바꿔가며 K 번 반복하면 모든 데이터는 검증에 한 번은 활용될 수 있다. 최종 모델의 성능은 K 개의 서브 모델의 성능을 평균으로 결정된다. (1) 데이터 분할 : K의 값을 결정하여 데이터를 K 개로 나눔 (2) 모델 학습 : (K-1) 개 데이터로 모델 학습을 진행 (3) 모델 검증 : 학습에 활용되지 않은 1개의 데이터로 학습된 모델의 성능을 평가 (4) 반복 : 검증 데이터를 바꿔가며 (2)-(3)을 K 번 반복 (5) 최종 모델 평가 : K 개의 서브 모델의 성능을 평균 내어 최종 모델의 성능을 결정 최종 모델을 평가할 때 K 개의 서브 모델의 평균을 통해 모델의 성능을 평가하게 되므로 over-fitting 문제가 일부 완화될 수 있다....


#K #Kfold #교차검증 #기계학습

원문링크 : K-fold cross validation