[필기] Dimensionality Reduction_머신러닝


[필기] Dimensionality Reduction_머신러닝

차원의 정의(Dimension) 공간 내 데이터의 위치를 나타내기 위해 필요한 축의 개수로 데이터가 n개의 설명 변수를 가진다고 가정하면 해당 데이터는 n차원의 좌표 상에서 표현 가능하다. 차원의 저주 변수가 늘어나면서 차원이 커지면서 발생시키는 문제 필요한 데이터 수의 지수 함수적 증가로 정보의 밀도 감소 공간을 설명하기 위한 데이터가 부족해서 과적합이나 성능이 감소할 수 있음 차원 축소 데이터를 잘 설명할 수 있는 변수의 개수(Latent Space)는 현재 변수의 개수(Observation Space)보다 작을 수 있기 때문에 데이터를 기반으로 잠재 공간을 파악하는 것 효과 차원의 저주 해결 연산량 감소 시각화 용이 방법 변수 선택(Feature Selection) 원본 데이터의 변수 중 불필요한 변수를 제거하는 방법 변수 추출(Feature Extraction) 원본 데이터의 변수들을 조합해 새로운 변수를 생성하는 방법 종류로 PCA, LDA, t-SNE가 있음 PCA Pri...


#PCA #tSNE #머신러닝 #차원축소 #파이썬

원문링크 : [필기] Dimensionality Reduction_머신러닝