머신러닝 기초 14 - Ensemble Learning - RandomForest (랜덤포레스트) 실습


머신러닝 기초 14 - Ensemble Learning - RandomForest (랜덤포레스트) 실습

머신러닝 기초 14 - Ensemble Learning - RandomForest (랜덤포레스트) 실습RandomForest (랜덤포레스트)는 Bagging (배깅)의 단점을 보완한 Ensemble Learning 이라고 전 포스팅에서 다루었습니다.데이터를 복원추출하여 Tree모델을 여러개 만들면 같은 데이터가 겹치기 때문에 공분산이 증가한다고 하였습니다.이 문제를 해결하기 위해 변수까지 랜덤으로 뽑게되면, Tree모델이 더 독립적이어서 전체 분산이 줄어들게 되죠.RandomForest (랜덤포레스트) 실습 부분도 이전 Bagging에서의 실습과 다르지 않습니다.우선 데이터는 분류문제를 가지고 학습을 하고, 평가 지표로 accuracy를 사용합니다.Step 1 Kaggle의 Otto group Product Classif..........



원문링크 : 머신러닝 기초 14 - Ensemble Learning - RandomForest (랜덤포레스트) 실습