파이썬 판다스 (pandas) 데이터프레임 연산 함수와 정렬 sort 및 순위 rank를 활용해 빅데이터 분석 마스터 하기


파이썬 판다스 (pandas) 데이터프레임 연산 함수와 정렬 sort 및 순위 rank를 활용해 빅데이터 분석 마스터 하기

데이터프레임(DataFame)의 연산은 NaN가 처리되는 과정을 먼저 알아야....... 데이터프레임에서 범용 연산 함수 파이썬 데이터에서 사용하는 범용 연산자를 데이터프레임에서도 그대로 사용할 수 있다. 하지만 데이터프레임의 경우 같은 index와 같은 column 명끼리만 연산을 하고, 한쪽에라도 데이터가 비어 있는 NaN이 있으면 계산이 불가능하기 때문에 아래 df3 처럼 NaN로 반환한다. df3에서 녹색 NaN은 두 데이터프래임 중 한 곳이라도 행(row)의 값이 없는 경우이고, 파란색 NaN은 컬럼(column) 값이 없는 경우이다. 그리고 빨간색 NaN은 두 데이터프레임 모두 데이터 값이 존재하지 않는 것을 의미하고 있다. 이럴경우 fill_value=0 이라는 인자를 사용하면 연산을 하기 전에 NaN 값을 0으로 대체하기 때문에 df4의 빨간색 숫자 처럼 가능해진다. 하지만 두 데이터프래임 모두 값이 없는 경우는 NaN의 반환한다. 이러한 규칙은 모든 연산에 적용된다....


#혼자공부하는 #파이썬설치 #파이썬알고리즘 #파이썬인강 #파이썬코딩 #파이썬프로그래밍 #파이썬함수 #판다스 #판다스공부 #파이썬데이터분석 #파이썬데이터 #파이썬기초 #파이썬강좌 #파이썬강의 #파이선 #pandas #판다스예제 #판다스기초 #판다스교육 #판다스강의 #결측값처리 #무료파이썬 #코랩 #colab

원문링크 : 파이썬 판다스 (pandas) 데이터프레임 연산 함수와 정렬 sort 및 순위 rank를 활용해 빅데이터 분석 마스터 하기