[파이썬] 판다스(pandas) 팁41. drop_duplicates로 중복된 행이 제거된 데이터프레임(DataFrame) 반환받기


[파이썬] 판다스(pandas) 팁41.  drop_duplicates로 중복된 행이 제거된 데이터프레임(DataFrame) 반환받기

drop_duplicates 함수는 중복된 행이 제거된 데이터프레임을 반환환다. 기존 오리지널 데이터에서 특정한 열 기준으로 중복된 행들을 제거한 후 데이터를 복사한다던가 그럴 때에 사용하면 될 듯 하다. 이 함수와 비슷해보이기도 하는 value_counts를 데이터프레임에 사용하는 경우에는 고유의 행 수를 포함하는 Series를 반환한다. 그런데 drop_duplicates 함수는 중복 행이 제거 된 데이터프레임을 반환한다는 것을 기억하자. 일단 오늘의 시험을 위한 적합한 데이터프레임을 하나 만들어준다. 패션 아이템에 관련한 데이터프레임으로 만들어주었다. df = pd.DataFrame({ '유형': ['점퍼', '점퍼', '팬..........



원문링크 : [파이썬] 판다스(pandas) 팁41. drop_duplicates로 중복된 행이 제거된 데이터프레임(DataFrame) 반환받기