[ 몽총이 파이썬 머신러닝 공부 - 06 ] 교차 검증


[ 몽총이 파이썬 머신러닝 공부 - 06 ] 교차 검증

6.1 교차검증 교차 검증은 데이터 편중을 막기 위해서 별도의 여러 세트로 구성된 학습 데이터 세트와 검증 데이터 세트에서 학습과 평가를 수행하는 것이다. 만약 학습데이터에만 과도하게 최적화되어, 예측을 다른 데이터로 수행할경우 예측 성능이 떨어질수 있다. 이러한 문제점을 해결하기 위해서 교차 검증을 이용한다. 6.1.1 K 폴드 교차 검증 K 폴드 교차 검증은 가장 보편적으로 사용되는 교차검증 기법이다. 먼저 K 개의 데이터 폴드 세트를 만들어서 K 번 만큼 각 폴드 세트에 학습과 검증 평가를 반복적으로 수행한다. 만약 K가 3이라고 가정했을때 이러한 식으로 교차검증을 수행한다. 붓꽃 데이터를 이용해 K폴드 교차 검증으로 평가를 했을 때 나온 결과를 보면 좀 더 쉽게 내용을 이해할 수 있다. 6.1.2 Stratified K 폴드 Stratified K 폴드는 불균형한 분포도를 가진 레이블 데이터 집합을 위한 K 폴드 방식이다. 불균형한 분포토를 가진 레이블이란 데이터 집합에 특정...


#교차검증 #파이썬머신러닝

원문링크 : [ 몽총이 파이썬 머신러닝 공부 - 06 ] 교차 검증