[ BeautifulSoup 기본 ] 파이썬 python BeautifulSoup 활용해 웹 크롤링 스크랩핑으로 빅데이터 분석 마스터

파이썬(python), BeautifulSoup으로 html, xml 문서에서 필요한 정보를 빠르고 쉽게 가져오자... [ 웹 크롤링 BeautifulSoup의 기본적인 이해 ] BeautifulSoup의 개념 BetifulSoup은 파이썬(python)에서 html과 xml 파일에서 데이터나 자료를 뽑아오는 라이브러리로, BeautifulSoup을 이용해 HTML과 XML의 트리 구조를 탐색, 검색, 변경 가능하다. 이렇게 문서의 구조나 패턴, 순서를 추출해 탐색 가능하도록 가공하는 작업을 파싱(parsing)이라고 한다. 파싱 작업을 하는 도구가 파서(parser)이고, 파서(parser)는 HTML 문서 등에서 태그(tag) 등을 입력받은 구문을 해석할 수 있는 단위와 여러 부분으로 분할하는 역할을 한다. 요약하자면, BeutifulSoup은 파이썬에서 웹 문서를 탐색할 수 있도록 구조화시키는 파서(parser)의 역할을 한다고 할 수 있다. 그럼 BeatifulSoup을 이용...

#beautifulsoup #parsing #python #웹크롤링 #크롤링 #파싱 #파이썬

원문링크 : [ BeautifulSoup 기본 ] 파이썬 python BeautifulSoup 활용해 웹 크롤링 스크랩핑으로 빅데이터 분석 마스터