파이썬 (python) 코딩 웹 페이지 첨부 파일 일괄 다운로드 requests, BeautifulSoup, wget으로 빅데이터 분석 마스터 하기


파이썬 (python) 코딩 웹 페이지 첨부 파일 일괄 다운로드 requests, BeautifulSoup, wget으로 빅데이터 분석 마스터 하기

파이썬(python), 웹 페이지에 첨부되어 있는 수많은 파일을 한번에 모두 다운받자... 파이썬으로 웹 페이지에 저장된 파일을 일괄 다운로드하기 위해서 다음의 절차를 시행해보자. 1) 웹 페이지(html)에 HTTP 요청( requests.get 모듈 사용) 2) 파싱( BeautifulSoup 모듈 사용): html 태그 및 정보를 가져와 새롭게 구조화 3) 태그(Tag) 탐색하기 4) find_all, find, select로 첨부파일 링크 가져오기 5) 해당링크로 파일 다운 로드( wget 모듈 사용) 웹 페이지에서 첨부된 파일을 받아오는 원리는 웹 페이지 소스(html)에서 파일의 링크(http://....) 주소만 뽑아 그 링크에 접속하게 하는 것이다. 웹 페이지 접속 => 웹 페이지 읽어오기 => 링크주소만 뽑기 => 링크주소 접속(파일다운) 이번에 크롤링한 웹 페이지는 https://eiec.kdi.re.kr/policy/materialList.do 이고 첨부된 파일을...


#데이터크롤링 #코딩공부 #파이썬강좌 #파이썬교육 #파이썬기초 #파이썬예제 #파이썬웹크롤링

원문링크 : 파이썬 (python) 코딩 웹 페이지 첨부 파일 일괄 다운로드 requests, BeautifulSoup, wget으로 빅데이터 분석 마스터 하기