[python] textmining 글자빈도 세기


[python] textmining 글자빈도 세기

텍스트 파일에 있는 글자들의 빈도를 파악하기 위한 작업입니다. 아래의 순서데로 진행합니다. 1. 텍스트 파일 만들기 2. 파일 불러와서 한줄씩 읽기 3. 한단어(띄어쓰기 기준)으로 빈도 누적하기 4. 깔끔하게 보기. 높은빈도 단어들 확인하기 위해 sorting 하기 1.텍스트 파일만들기 메모장에다가 대통령연설문 두개 정도를 찾아서 긁어왔습니다. 코드파일이 있는 경로에 저장합니다. 파일이름: 20220516_president.txt 2. 파일 읽어서 한줄씩 읽기 word_counter = dict() #encoding error 발생시 매개변수 옵션 'UTF-8' 시도해보고 안되면 'UTF-16' with open('20220516_president.txt', 'r', encoding='UTF8') as f: for line in f: 간단합니다. 단어들과 빈도를 누적할 word_counter 라는 dict 타입을 만들어주고 파일을 불러와서 한줄씩 읽습니다. 3. 빈도 누적 word_...


#dictionary #python #빈도분석 #사전정렬 #텍스트파일읽기

원문링크 : [python] textmining 글자빈도 세기