[Pandas] 데이터 시각화


[Pandas] 데이터 시각화

데이터 시각화의 필요성 import seaborn as sns anscombe = sns.load_dataset("anscombe") print(anscombe) print(type(anscombe)) 데이터 시각화를 보여주는 전형적인 사례로 앤스콤 4분할 그래프가 있다. 데이터를 시각화하지 않고 수치만 확인할 때 발생할 수 있는 함정을 보여주기 위한 것이다. 위의 코드를 통해 아래에 'anscombe' 데이터를 출력했다. I, II, III, IV로 분류된 데이터는 각 그룹마다 평균, 분산과 같은 수칫값, 상관관계와 회귀선이 같다. 그래서 이러한 결과만으로 데이터 그룹 I, II, III, IV가 모두 같을 것이라는 '착각'을 할 수 있다. 하지만 시각화하면 데이터 그룹들이 서로 다른 데이터 패턴을 가지고 있다는 것을 금방 알 수 있다. 앤스콤 데이터 집합은 seaborn 라이브러리에 포함되어 있다. 앞서 Pandas에서 read_csv로 csv파일과 tsv 파일을 읽어왔다. se...


#1에서 #2에서 #데이터분석 #머신러닝 #주간일기챌린지 #코딩 #파이썬 #판다스

원문링크 : [Pandas] 데이터 시각화