[데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩


[데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩

우리가 파이썬에서 데이터를 읽어 올 때 에러가 나는 경우를 종종 볼 수 있습니다. 아래와 같이 판다스의 read_csv() 함수로 csv 파일을 읽어왔는데, 에러가 뜹니다. 에러의 제일 아래쪽을 보니, UnicodeDecodeError: 'utf-8' codec can't decode byte 0x85 in position 3375: invalid start byte 라는 메시지가 보이네요. 원인은 read_csv() 함수가 기본적으로 encoding이 utf-8로 세팅 되어 있는데, 파일이 utf-8로 읽을 수 없다는 내용입니다. 구글링을 해 보면 많은 분들이 'cp949' 로 바꿔보면 된다 라고 하십니다. 그래서 저도 한번 encoding을 'cp949'로 바꿔봤습니다. 그래도 여전히 유사한 에러가 나옵니다. UnicodeDecodeError: 'cp949' codec can't decode byte 0x80 in position 24483: illegal multibyte se...


#ANSI #데이터 #데이터읽기 #디코딩 #분석 #아스키 #오류 #인코딩 #코덱 #파이썬 #utf #unicodedecodeerror #read_csv #ascii #codec #cp949 #encode #error #euckr #notepad #pandas #python #판다스

원문링크 : [데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩