Python 판다스 데이터 범주 만들기 pd.cut(), pd.qcut() 활용


Python 판다스 데이터 범주 만들기 pd.cut(), pd.qcut() 활용

pandas의 cut함수와 qcut함수는 데이터프레임의 수치형 데이터들을 구간으로 나눈 범주형 레이블을 생성해주는 함수입니다. 수치형으로 나열된 데이터들을 원하는 범주로 계층으로 분리하여 계층별 데이터 분석에 활용할 수 있으니, 데이터분석에서 알고 있으면 유용한 함수입니다. 먼저, 데이터 분석을 위해 kaggle에서 가장 기본적으로 사용하는 데이터프레임인 titanic 데이터프레임을 가져옵니다. pd.cut 데이터를 동일한 길이로 나눔 cut함수의 사용방법은 [데이터, 구간의 갯수, 레이블명]에 해당하는 인자값을 지정해주는 것입니다. labels를 지정하지 않으면 구간의 나눈 기준이 레이블 명으로 됩니다. 그래프를 통한 계층 구조 확인입니..........

Python 판다스 데이터 범주 만들기 pd.cut(), pd.qcut() 활용에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : Python 판다스 데이터 범주 만들기 pd.cut(), pd.qcut() 활용