N사 뉴스 스크래핑 - 유지보수(411 에러)


N사 뉴스 스크래핑 - 유지보수(411 에러)

갑자기 스크랩이 안 되면서 HTTP 411 에러가 발생했다 스크랩은 잘 되다가도 어느날 실행해보면 4xx 에러가 자주 발생하는데, 이유는 보통 추가된 요청 데이터이다 무슨 말인지 싶겠지만 말 그대로 HTTP Request에 body부분 데이터가 추가된 것이다 우선 의심가는 부분에 중단점을 걸고 디버깅을 시도했다 HTTP 응답 코드 411 에러(1) 200(정상)을 받아야 했으나 411 응답을 받은 것을 알 수 있다 보통 4xx번대 에러는 Client단에서의 요청 에러이기 때문에 요청에 문제가 있는지부터 확인하면 된다 그럼 상태코드 411이 무엇인지 알 필요가 있다 그렇다면 어떻게 알 수 있냐? 에러에 관련해서 검색하면 되죠 다 나오는데. 위키피디아 참고. HTTP 상태 코드 간단히 말하면 콘텐츠 길이(Content-Length) 헤더없이 요청을 보냈으니 서버는 수락하지 않는다는 뜻이다 (처음엔 Request body에 데이터가 추가되었나 추측을 했지만 411 에러의 뜻과 같이 헤더 ...


#411 #상태코드 #셀레니움 #스크래핑 #스크랩 #스프링 #스프링부트 #에러 #웹드라이버 #자동 #자동화 #크론탭 #크롤 #크롤링 #배치 #리눅스 #boot #crawl #crontab #http #linux #scrap #scrapping #selenium #spring #systemctl #webdriver #검색 #뉴스 #키워드

원문링크 : N사 뉴스 스크래핑 - 유지보수(411 에러)