[데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩 error


[데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩 error

우리가 파이썬에서 데이터를 읽어 올 때 에러가 나는 경우를 종종 볼 수 있습니다. 아래와 같이 판다스의 read_csv() 함수로 csv 파일을 읽어왔는데, 에러가 뜹니다. 에러의 제일 아래쪽을 보니, UnicodeDecodeError: 'utf-8' codec can't decode byte 0x85 in position 3375: invalid start byte 라는 메시지가 보이네요. 원인은 read_csv() 함수가 기본적으로 encoding이 utf-8로 세팅 되어 있는데, 파일이 utf-8로 읽을 수 없다는 내용입니다. 구글링을 해 보면 많은 분들이 'cp949' 로 바꿔보면 된다 라고 하십니다. 그래서 저도 한번 encoding을 'cp949'로 바꿔봤습니다. 그래도 여전히 유사한 에러가 ..


원문링크 : [데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩 error