AI 머신러닝 결정나무 모형 CART 알고리즘, 지니지수 (GINI Index)


AI 머신러닝 결정나무 모형  CART 알고리즘, 지니지수 (GINI Index)

안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 이번에는 결정트리 (Decision Tree) 내용 중에 CART 에 대해서 알아보고자 합니다. [CART] : Classification And Regression Tree (분류와 예측에 사용) : 지니지수가 작아지는 방향으로 모든 예측 변수를 (Feature) 사용하여 트리를 만들어가는 방법 입니다. scikit-learn은 CART 알고리즘을 통해 이진 트리를 만듭니다. (이진트리는 자식 노드가 두 개) 지니지수는 불순도를 나타내는 인덱스로 지니지수가 작아지는 형태로 Tree가 만들어진다고 볼 수 있습니다. 즉, 지니지수를 가장 작게 하는 예측 변수를 중요하다고 보고 해당 변수를 이용하여 정확도가 가장 높은 Tree를 만들어 나갑니다. 즉, A 라는 예측 변수를 이용했을 때는 지니지수가 0.5 인데 B라는 예측 변수를 이용하니 0.1 이 된다면 B라는 예측 변수를 이용하여 Tr...


#AI #선형회귀식 #선형회귀직선 #설명변수 #예측값 #정답데이터 #종속변수 #지니지수 #지도학습알고리즘 #최소제곱법 #추정값 #프로젝트 #학습데이터 #선형회귀 #반응변수 #CART #DeepLearning #GINIINDEX #LinearRegression #MachineLearning #MSE #SSE #SSR #SST #독립변수 #딥러닝 #머신러닝 #회귀직선

원문링크 : AI 머신러닝 결정나무 모형 CART 알고리즘, 지니지수 (GINI Index)