[파이썬] 판다스(pandas) 팁48.crosstab으로 2개 변수 간의 빈도를 계산하고 heatmap으로 시각화까지


[파이썬] 판다스(pandas) 팁48.crosstab으로 2개 변수 간의 빈도를 계산하고 heatmap으로 시각화까지

2개 변수간의 빈도를 계산할 때에는 crosstab을 활용하는 것이 가장 간편하다. crosstab 활용 시 기본적으로 특정 집계 함수나 배열 값이 전달되지 않는 한 빈도 테이블을 반환한다. 오늘의 예제를 위하여 다음 라이브러리를 로드한다. import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 활용할 데이터는 씨본의 플래닛 데이터셋! 행성을 발견한 방법과 함께 그 개수, 궤도주기, 질량, 거리, 발견한 연도의 데이터가 포함되어 있다. df = sns.load_dataset('planets') df.head() out : 6개의 변수 중 행성을 발견한 방법과 발견한 연도 간의 빈도 수를 체크해보자. pd.crosstab(df['method'], df['year']) out : >> method 컬럼의 고유한 10개 값을 기준으로 연도별 빈도가 계산된 테이블이 반환되었다. 데이터프레임의 출력 너비 제한이 있다...


#crosstab #파이썬 #빈도테이블 #데이터프레임 #데이터분석 #seaborn #python #pivot_table #pandas #heatmap #DataFrame #DataAnalysis #판다스

원문링크 : [파이썬] 판다스(pandas) 팁48.crosstab으로 2개 변수 간의 빈도를 계산하고 heatmap으로 시각화까지