처음 해본 크롤링! 이번 달에는 JSP, 스프링 과정을 마치고 조별 프로젝트를 진행했다. 내가 맡은 부분은 크롤링을 통해 웹사이트의 정보를 읽어 오는 것. 교육과정 상에서는 아직 배우지 않은 크롤링이었지만 구현해놓은 프로젝트를 참고하며 4~5일 정도 걸려 해결할 수 있었다. 꼭 맞는 사례가 없어 어려움이 많았기에... 이번에 성공한 Java 크롤링의 기본 과정을 소개하면... import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import com.google.gson.Gson; .... Document doc = Jsoup.connect("http://www.~크롤링 대상 웹사이트 주소").get(); Java에서 HTML을 파싱하기 위해 Jsoup 라이브러리를 이용했다. connect(웹주소).get() 메서드를 사용하면 크롤링하는 웹사이트의 HTML 문서를 통채로 가져온다....
#crawling
#innerHTML
#java크롤링
#jsoup
원문링크 : Jsoup 활용 자바 크롤링, 자바스크립트 화면 구성