[ 몽총이 R 기초 공부 - 04 ] 주성분분석


[ 몽총이 R 기초 공부 - 04 ] 주성분분석

4.1 주성분 분석 ( PCA ) 주성분 분석 PCA는 가장 널리 사용되는 차원 축소 기법중 하나이다. 이때 계산은 주로 행렬의 고윳값 분해 또는 특이값 분해를 사용한다. 차원 축소란 만약 데이터가 10차원 같은 고차원의 데이터가 존재했을 경우 이것을 시각화 하여 분석하는 것에 어려움이 있기때문에 이 데이터의 차원을 축소시켜주는 것을 의미한다. 즉 PCA는 데이터들을 정사영시켜 차원을 낮추었을 때, 어떤 벡터에 정사영시켜야 데이터 구조가 제일 유지가 잘 되는지를 확인하는 것이다. PCA는 기존의 변수를 일차 결합하여 서로 선형 연관성이 없는 새로운 변수, 주성분(PC) 들을 만들어낸다. 첫 번째 주성분 PC1은 데이터의 분포를 가장 많이 보존하고, 두번째 주성분 PC2가 다음으로 가장 많은 분포를 보존한다. 이렇게 주성분들은 데이터의 분포를 보존하고, 이것은 만약 주성분들이 데이터의 90%를 보존하고 있다면, 나머지 10% 정도는 정보가 없어도 차원을 줄여 데이터를 확인할 수 있다는...


#R기초공부 #R주성분분석

원문링크 : [ 몽총이 R 기초 공부 - 04 ] 주성분분석