Jsoup 활용 자바 크롤링, 자바스크립트 화면 구성

처음 해본 크롤링! 이번 달에는 JSP, 스프링 과정을 마치고 조별 프로젝트를 진행했다. 내가 맡은 부분은 크롤링을 통해 웹사이트의 정보를 읽어 오는 것. 교육과정 상에서는 아직 배우지 않은 크롤링이었지만 구현해놓은 프로젝트를 참고하며 4~5일 정도 걸려 해결할 수 있었다. 꼭 맞는 사례가 없어 어려움이 많았기에... 이번에 성공한 Java 크롤링의 기본 과정을 소개하면... import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import com.google.gson.Gson; .... Document doc = Jsoup.connect("http://www.~크롤링 대상 웹사이트 주소").get(); Java에서 HTML을 파싱하기 위해 Jsoup 라이브러리를 이용했다. connect(웹주소).get() 메서드를 사용하면 크롤링하는 웹사이트의 HTML 문서를 통채로 가져온다....

#crawling #innerHTML #java크롤링 #jsoup

원문링크 : Jsoup 활용 자바 크롤링, 자바스크립트 화면 구성