[파이썬] 변수 내 가장 빈도가 높은 값을 제외하고 나머지 값을 '기타'로 만들기


[파이썬] 변수 내 가장 빈도가 높은 값을 제외하고 나머지 값을 '기타'로 만들기

하나의 변수에 고유값은 적은 경우도 있지만, 굉장히 많은 경우도 있다. 적은 경우에는 별로 고민할 필요가 없지만 많은 경우에는 고민을 해야한다. 변수의 값이 늘어날수록 계산하는데 처리 속도가 느려지고, 모델에 잡음만 더해줄 수도 있기 때문에 되도록 적당한 처리를 해주어야 한다. 만약 다음과 데이터가 있다고 해보자. 넘파이 랜덤 정수 생성 모듈로 1부터 4까지의 20개 데이터를 생성한다. np.random.RandomState(520) number = pd.Series(np.random.randint(1, 5, [20])) number out : 방금 만든 데이터는 1, 2, 3, 4가 중복되어 구성되어 있다. 각 값별 개수를 세어보면 다음과 같다. print("빈도가 가장 높은 2개 숫자 :&..........



원문링크 : [파이썬] 변수 내 가장 빈도가 높은 값을 제외하고 나머지 값을 '기타'로 만들기