[5-2] 분류 분석을 위한 의사결정 트리와 앙상블 기법인 랜덤 포레스트 & xgboost : 부트스트랩?


[5-2] 분류 분석을 위한 의사결정 트리와 앙상블 기법인 랜덤 포레스트 & xgboost : 부트스트랩?

벚꽃이 많이 피는 시기가 지나가네요 ~ 내일 비 예보가 있던데.. 아쉬운 만큼 오늘 더 열심히 벚꽃을 보면서 다녀야겠습니다 : ) 이번 글에서는 두 번째 지도학습 방법인 분류 분석입니다. 첫 번째는 회귀 분석이었는데, 마지막에 다루었던 로지스틱 회귀는 분류 분석이라 봐도 무방합니다! 분류 분석은 데이터 셋을 특정 범주로 분류하는 방법으로 무게, 길이와 같은 데이터의 특성을 조건으로 지정(ex. 무게 3kg 이상 길이 10cm 이하)하여 데이터가 어느 범주(ex. 다람쥐, 물고기, 강아지)에 속하는지 예측하는 모델을 만듭니다. 따라서 어떤 변수를 어떤 조건으로 지정해야 분류 예측을 잘할지 적절한 모델을 구축하는게 중요하겠죠? 이러한 분류 분석은 보통 고객의 신용등급을 분류할 때에나 종양의 악성 혹은 양성 여부를 분류할 때 쓰이곤 합니다. 그렇다면 이제 분류 분석을 하는 방법에 대해 정리해보겠습니다. 분류 분석 in R 분류 분석의 종류는 크게 3가지로 구분할 수 있습니다. 의사결정 트...


#xgboost #랜덤포레스트 #배깅 #부스팅 #부트스트랩 #분류분석 #앙상블기법 #의사결정트리

원문링크 : [5-2] 분류 분석을 위한 의사결정 트리와 앙상블 기법인 랜덤 포레스트 & xgboost : 부트스트랩?