[파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측


[파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측

06. 사이킷런으로 수행하는 타이타닉 생존자 예측 (1) 데이터 전처리 [데이터 확인] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('titanic_train.csv') titanic_df.head(3) 타이타닉 데이터를 가져온 후 상위 3개의 그룹의 데이터를 확인합니다. [데이터 정보 확인] print('\n ### 학습 데이터 정보 ### \n') print(titanic_df.info()) 데이터 정보를 확인하면, 결측값이 얼마나 있는 지 확인할 수 있습니다. RangeIndex가 891개이므로 결측값이 없다면 Non-Null Count가 891이어야 합니다. 여기선 891이 아닌 Age, Cabin, Embarked 컬럼에는 결측값이 존재한다는 것을 알 수 있습니다. [결측값 확...


#sklearn #파이썬 #타이타닉생존자예측 #타이타닉 #알고리즘 #사이킷런 #머신러닝알고리즘 #머신러닝 #딥러닝 #데이터사이언티스트 #데이터분석 #판다스

원문링크 : [파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측