파이썬 크롤링 Python BeautifulSoup


파이썬 크롤링 Python BeautifulSoup

크롤링(crawling)이란? 웹 페이지 내용을 그대로 가져와 필요한 자료(데이터) 등을 수집하는 행위를 말한다. 예를 들어 네이버 쇼핑에서 특정 노트북 최저가를 알고 싶을 때 해당 페이지를 접속하지 않더라도 간단한 코드 작성만으로 알아올 수 있다. BeautifulSoup 파이썬에서 html 파싱(parsing)을 위해서는 BeautifulSopu, requests 등 라이브러리를 이용한다. 만일 설치가 안 되어 있으면 아래와 같은 메시지를 보게 될 것이다. ModuleNotFoundError: No module named parsing : 웹사이트 정보를 원하는 형태로 가공을 통해 추출하는 작업 이들 라이브러리들은 python 설치 시 기본 제공되지 않기 때문에 따로 설치해 줘야 한다. 작업표시줄 돋보기에 "cmd"로 검색 후 열기(실행) 한다. 2개의 패키지를 차례대로 설치한다. pip install beautifulsoup4 pip install requests pip lis...


#beautifulsoup #crawling #python #크롤링 #파이썬 #파이썬크롤링

원문링크 : 파이썬 크롤링 Python BeautifulSoup