파이썬 웹 크롤링의 기초(2) - BeatifulSoup 이용하기


파이썬 웹 크롤링의 기초(2) - BeatifulSoup 이용하기

안녕하세요, 오늘은 개천절입니다. 개천절맞이 웹 크롤링의 기초 2번째 시간을 가져보려고 합니다. 우선 가장 기본적인 라이브러리를 설치 해 주어야겠죠. pip install beautifulsoup4 라이브러리 설치해주기 내가 파싱하고 싶은 페이지를 선택해 주어야겠죠. 저는 네이버 뉴스의 증권 부분을 한번 읽어 와 보겠습니다. 네이버의 경제뉴스에서 증권 부분 카테고리를 클릭합니다. 4만전자 초읽기가 보이시죠...미장으로 주식을 말아먹은 저로서는 정말...ㅠㅠㅠ안타깝습니다. 그럼 시작해 볼까요 2-1) 파싱할 부분의 URL을 작성해줍니다. 2-2) requests를 이용해 요청을 보내야겠죠 2-3) BeautifulSoup를 이용해 파싱을 시작합니다. requests.exceptions.ConnectionError: ('Connection aborted.', ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, ...


#news #파이썬 #파이선독학 #파이선 #크롤링 #카카오뷰 #증권 #서이추 #미장 #뉴스 #네이버 #국장 #헤드라인뉴스

원문링크 : 파이썬 웹 크롤링의 기초(2) - BeatifulSoup 이용하기