[파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드 모음 (3) - sklearn에서의 preprocessing


[파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드 모음 (3) - sklearn에서의 preprocessing

데이터를 분석하기 전에 전처리가 꼭 필요하다. 그 중 파이썬에서 전처리와 모델링을 할 수 있도록 도와주는 라이브러리가 있는데 preprocessing이다. 1. 여러 가지 스케일링 종류 (1) StardardScaler() : 기본 스케일링, 평균과 표준편차를 사용(0, 1) (2) MinMaxScaler() : 최댓값이 1, 최솟값이 0이 되도록 스케일링 (3) MaxAbsScaler() : 최대절댓값이 1, 최소절댓값이 0이 되도록 스케일링 (4) RobustSclaer() : 중앙값과 IQR 값 사용 (이상치에 덜 민감함) 2. 적용 코드(MinMaxScaler) from sklearn import preprocessing col = ['강간', '강도', '살인', '절도', '폭력'] x = crime_anal[col].values min_max_scaler = preprocessing.MinMaxScaler() # 최댓값이 1, 최솟값이 0이되도록 스케일링 x_scaled...


#데이터 #데이터분석 #코딩 #파이썬 #파이썬으로데이터주무르기 #프로그래밍

원문링크 : [파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드 모음 (3) - sklearn에서의 preprocessing