키자드에 등록된 hejin4의 네이버 블로그 포스트 목록

hejin4의 등록된 링크

hejin4로 등록된 네이버 블로그 포스트 수는 4건입니다.

덤파이썬 결측치 [내부링크]

#파이썬 #함수 #데이터전처리 #판다스 기본 라이브러리 임포트 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt 데이터 불러오기 df = pd.read_csv('') df = pd.read_excel('') dj = pd.read_json('') dx = pd.read_xml('') 데이터 탐색하기 df.head() df.tail() df.info() df.describe() df.index df.columns df.values 결측치 확인하기 df.isna().sum() df.isnull().sum() 특정 열의 값들의 건수/비율 확인하기 df['A'].value_counts() df['B'].value_counts(normalize=True) 특정 열 삭제 cols = ['A','B','C'] df = df.drop(cols, axis=1) or df.drop(co

DNN [내부링크]

#신경망 #DNN모델링 #파이썬 #다중분류 1) DNN 모델링 model = Sequential() model.add(Dense(64, activation='relu', input_shape=(x인풋값,))) #model1.add(Flatten()) # 없어도 됨.. model.add(Dropout(0.25)) #model1.add( BatchNormalization( )) #없어도 됨.. model.add(Dense(아웃풋, activation='sigmoid')) # 2진분류, 다중분류= softmax es = EarlyStopping( monitor='val_loss', patience=0, mode='min', verbose=1 ) ms = ModelCheckpoint( 'my_checkpoint.ckpt', # best_model.h5의 경우에는 monitor='val_loss', mode='min', verbose=1, # verbose=True 옵션과 동일 save_we

회귀, 모델선언 [내부링크]

#회귀 #딥러닝 2 ) 회귀 라이브러리 & 모델 선언 #한개만 사용하기 from sklearn.linear_model import LinearRegression model = LinearRegression( ) from sklearn.neighbors import KNeighborsRegressor moedel = KNeighborsRegressor(n_neighbors=) from sklearn.tree import DecisionTreeRegressor model = DecisionTreeRegressor() from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() from xgboost import XGBRegressor model = XGBRegressor( ) from lightgbm import LGBMRegressor model = LGBMRegressor() 2) 회귀 학습 mo

원핫인코딩 [내부링크]

#원핫인코딩e #그래프 #머신러닝 데이터 타입에 따른 컬럼명 obj = df.select_dtypes(include='object').columns obj_x = df.select_dtypes(exclude='object').columns 원핫엔코딩/라벨엔코딩 from sklearn.preprocessing import LabelEncoder L_en = LabelEncoder() df['C'] = L_en.fit_transform(df['C']) from sklearn.preprocessing import OneHotEncoder O_en = OneHotEncoder() df['D'] = O_en.fit_transform(df['D']) get_dummies cols = ['',''] df_dummy = pd.get_dummies(df, columns=cols) #drop_first=True옵션도 있음 그래프 #히스토그램 sns.histplot(x='', hue='',data=df