collections Counter 로 가장 많이 사용한 단어 찾기


collections Counter 로 가장 많이 사용한 단어 찾기

신문이나 책에서 가장 많이 사용된 단어를 찾고 싶을때 유용한 모듈이다.collections 의 Counter는 파이썬 모듈로 입력값으로 받은 값을 카운팅해서 dictionary 형태로 해당 단어와 단어가 사용된 횟수를 알려 준다. 리스트를 입력값으로 넣으면 리스트내의 값을 비교해주고 string으로 입력하면 한단어를 기준으로 파악해준다.아래 코드를 통해 쉽게 이해해 보자결과>>words = [word for word in re.sub(r'[^\w]', ' ', paragraph).split()]re.sub 은 정규식에서 \w(단어를 의미) 단어가 아닌 것은 한칸 띄운 공백으로 바꾸겠다는 의미이고 split()은 default로 공객을 기준으로 나눠주는 것이다. ...



원문링크 : collections Counter 로 가장 많이 사용한 단어 찾기