N사 뉴스 스크래핑


N사 뉴스 스크래핑

N사의 뉴스를 스크랩하여 원하는 결과를 추출해봤다 개발환경과 사용언어는 다음과 같다. 개발환경 사용 언어 및 도구 통합개발환경 인텔리제이 프레임워크 스프링부트 언어 및 라이브러리 자바, ojdbc8, json, selenium, thymeleaf, js, jquery 등 DBMS X 주 기능 소개 및 로직 설명 1. 입력 키워드를 통해 결과를 추출(콤마를 구분으로 여러단어 검색도 가능, 현재 키워드 검색 기준은 제목으로 세팅함) 2. 카테고리를 전체 또는 각 분야별로 설정해서 특정 분야만 스크랩도 가능 3. 제목 클릭 시 해당하는 뉴스 본문으로 사이트 이동 4. 게시일자를 오름차순, 내림차순 정렬 5. 파일 다운로드 : 결과물을 확장자 html로 내려받는다 (그냥 body 긁어오는거라 별 거 없음) N사 뉴스 스크랩 결과 요즘 핫한 아이폰에 대해 추출해봤다 아이폰 관련해서 기사들을 최근 게시한 순으로 뽑아오는 걸 알 수 있다 출력결과는 순번, 날짜, 분야, 제목, 이미지, 본문요약 ...


#crawl #셀레니움 #스크래핑 #스크랩 #스프링 #웹드라이버 #자동화 #크론탭 #크롤 #크롤링 #로봇 #뉴스 #crontab #driver #N사 #robots #scrap #scrapping #selenium #spring #web #키워드

원문링크 : N사 뉴스 스크래핑