2개 변수간의 빈도를 계산할 때에는 crosstab을 활용하는 것이 가장 간편하다. crosstab 활용 시 기본적으로 특정 집계 함수나 배열 값이 전달되지 않는 한 빈도 테이블을 반환한다. 오늘의 예제를 위하여 다음 라이브러리를 로드한다. import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 활용할 데이터는 씨본의 플래닛 데이터셋! 행성을 발견한 방법과 함께 그 개수, 궤도주기, 질량, 거리, 발견한 연도의 데이터가 포함되어 있다. df = sns.load_dataset('planets') df.head() out : 6개의 변수 중 행성을 발견한 방법과 발견한 연도 간의 빈도 수를 체크해보자. pd.crosstab(df['method'], df['year']) out : >> method 컬럼의 고유한 10개 값을 기준으로 연도별 빈도가 계산된 테이블이 반환되었다. 데이터프레임의 출력 너비 제한이 있다...
#crosstab
#파이썬
#빈도테이블
#데이터프레임
#데이터분석
#seaborn
#python
#pivot_table
#pandas
#heatmap
#DataFrame
#DataAnalysis
#판다스
원문링크 : [파이썬] 판다스(pandas) 팁48.crosstab으로 2개 변수 간의 빈도를 계산하고 heatmap으로 시각화까지