06. 사이킷런으로 수행하는 타이타닉 생존자 예측 (1) 데이터 전처리 [데이터 확인] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('titanic_train.csv') titanic_df.head(3) 타이타닉 데이터를 가져온 후 상위 3개의 그룹의 데이터를 확인합니다. [데이터 정보 확인] print('\n ### 학습 데이터 정보 ### \n') print(titanic_df.info()) 데이터 정보를 확인하면, 결측값이 얼마나 있는 지 확인할 수 있습니다. RangeIndex가 891개이므로 결측값이 없다면 Non-Null Count가 891이어야 합니다. 여기선 891이 아닌 Age, Cabin, Embarked 컬럼에는 결측값이 존재한다는 것을 알 수 있습니다. [결측값 확...
#sklearn
#파이썬
#타이타닉생존자예측
#타이타닉
#알고리즘
#사이킷런
#머신러닝알고리즘
#머신러닝
#딥러닝
#데이터사이언티스트
#데이터분석
#판다스
원문링크 : [파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측