[Pandas] 데이터프레임 중복 제거


[Pandas] 데이터프레임 중복 제거

먼저 데이터를 만든다. 중복을 확인하려면 duplicated()를 사용하면 된다 중복된 건 True로 뜨고 아닌 건 False로 뜬다. 처음에 위치한 건 False로 뜬다 모든 중복된 거에 대해서 True로 뜨지 않는다. 1번과 13번은 중복이지만 1번은 False 13번은 True이다. 중복을 제거하는 건 drop_duplicates()를 사용하면 된다. 왼쪽이 원래 데이터 오른쪽이 중복제거한 데이터이다. 중복인 것들은 삭제되고 다 유일한 데이터들만 남았다. 지금까지 중복을 제거한 건 한 행 자체가 다 똑같을 때를 말했다. 하지만 데이터들 중에서 꼭 다 같지 않고 몇 개만 같을 수도 있다. 예를 들어 6번 8번 데이터를 보면 전공과 성별이 같다. 이런 느낌이다. 먼저 이름이..........

[Pandas] 데이터프레임 중복 제거에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [Pandas] 데이터프레임 중복 제거