[데이터시각화] 판다스(pandas)의 평행 좌표 그래프(parallel_coordinates)로 여러 변수 값 비교하기


[데이터시각화] 판다스(pandas)의 평행 좌표 그래프(parallel_coordinates)로 여러 변수 값 비교하기

판다스 라이브러리에도 몇 개의 시각화 함수가 있지만 별로 사용하진 않는다. 왜냐면 matplotlib, seaborn, plotly 등등 좋은 시각화 라이브러리가 많기 때문이다. 그러나 판다스에 제공하는 시각화 함수 중 평행 좌표 그래프는 꽤 유용하다. 평행 좌표 그래프(parallel_coordinates)는 일반적으로 특정 변수와 나머지 변수와의 값을 동시에 시각화하고 분석하는 데 사용한다. 유형이나 크기가 완전히 다른 변수들을 동시에 비교할 수 있는 것이다.(<-정규화 작업 필요) x축에 변수들이 나열되고 각 변수의 값을 나타내는 수치가 y축에 표현되는데 이들이 쭈욱 연결되는 평행선으로 표현된다. EDA 과정에서 활용하기 좋고, 머신러닝 등 모델링에 활용할 주요 변수를 선정할 때에도 참고할 수 있을 것이다. 긴 설명보다 예제를 통해서 알아보자 ㅠㅠ 오늘 준비할 라이브러리는 이렇게 많다! import numpy as np import pandas as pd import matpl...


#DataAnalysis #데이터시각화 #데이터정규화 #사이킷런 #와인퀄리티데이터 #최소최대정규화 #파이썬 #판다스 #평행좌표그래프 #데이터분석 #winequality #DataVisualization #matplotlib #Normalization #pandas #parallel_coordinates #python #sckitlearn #평행좌표시각화 #MinMaxScaler #데이터스케일링

원문링크 : [데이터시각화] 판다스(pandas)의 평행 좌표 그래프(parallel_coordinates)로 여러 변수 값 비교하기