[빅데이터분석기사] 유형 2


[빅데이터분석기사] 유형 2

랜덤포레스트 회귀 함수 (randomforestregressor)는 범주형 변수를 처리할수 있다. 하지만 인코딩이 필요하다. import pandas as pd pd.get_dummies get_dummies : 원-핫 인코딩. 범주형 데이터를 처리하기 위해 주로 사용. 0 또는 1의 값으로 처리해줌 from sklearn.ensemble import RandomForestClassifier x_train = x_train0.copy() x_train = x_train.drop(columns = 'CustomerId') x_train = x_train.drop(columns = 'Surname') x_train['M'] = (x_train['Gender'] == ' male') | (x_train['Gender'] == 'Male') x_train['F'] = (x_train['Gender'] == 'female') | (x_train['Gender'] == 'Female') x_t...



원문링크 : [빅데이터분석기사] 유형 2