[AI] 데이터 전처리 - 스케일링/Outlier/Discretize


[AI] 데이터 전처리 - 스케일링/Outlier/Discretize

안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 2편 입니다. [수치형 데이터 전처리 - 스케일링] 데이터가 가지고 있는 값의 범위를 데이터의 스케일이라 합니다. 대표적인 예로 키와 몸무게 처럼 단위가 다른 경우 모델의 학습이 정상적으로 이뤄지지 않습니다. 이러한 데이터 간의 범위 차이를 스케일링을 통해서 맞춰주는 작업을 합니다. 스케일링 작업 이후 모델 최적화 안정성과 수렴 속도를 향상 되며, 대표적인 방법으로는 아래와 같습니다. min-max scaler : 데이터의 값을 0 ~ 1 사이의 스케일로 변경 : 최대/최소 값이 각각 1, 0이 되도록 스케일링 : 이상치가 있다면 변환 된 값들이 매우 좁은 범위에 몰려 있을 수 있습니다. 결과 값 = (데이터 - 최소값) / (최대값 - 최소값) standard scaler : 평균0, 표준 편차가 1인 표준정규분포로 변경하여 스케일 변경 : 평균을 제거하고 데이터를 분...


#AI #전처리 #왕초보코딩 #왕초보AI #머신러닝쪼렙 #머신러닝 #딥러닝 #standardscaler #scaler #robustscaler #outlier #minmaxscaler #MachineLearning #discretize #discretization #DeepLearning #AI기초 #프로젝트

원문링크 : [AI] 데이터 전처리 - 스케일링/Outlier/Discretize