주성분(PCA) 분석 - 차원 축소, 다중공선성 예방


주성분(PCA) 분석 - 차원 축소, 다중공선성 예방

Xtrain(타겟이 빠진 독립 변수들로만 구성되어 있는 데이터)을 가지고 체크 다중공선성 방지 가능 (주성분 분석을 통해 동일/유사한 값을 갖는 feature 제외 가능) 주성분으로 선정할 독립변수의 개수를 지정하는 PCA 함수의 n_components 파라미터는 사람이 지정하는 하이퍼 파라미터로 pca.explained_variance_ratio의 결과를 보고 n_components 수를 조정해 가야 한다 [ PCA(n_components = 10)에서 10의 수 조정] 예) 현재 변수가 총 10개인데 2개로 확 줄이는 것은 문제가 있을 가능성이 높음(물론 더 효과적일 수도 있음) 주성분(PCA) 분석을 통해 독립변수의 수를 조정한 결과가 예측 성능을 높이는데 효과적인지 여부는 주성분으로 선정된 독립 변수를 가지고 처음부터 다시 분석 절차에 따라 분석을 해보면 알 수 있음 신규로 나온 예측 결과 값(예: mean squared error)이 현재보다 작게 나오면 효과가 있다고 볼 ...


#explained_variance_ratio_ #n_components #PCA #Xtrain

원문링크 : 주성분(PCA) 분석 - 차원 축소, 다중공선성 예방