[Python] HTML 표를 csv로 저장하기


[Python] HTML 표를 csv로 저장하기

웹 스크래핑을 해도 되지만, pandas의 아주 간단한 기능으로 이 작업을 수행할 수 있다. 일단 pandas를 불러온다. import pandas as pd 읽고싶은 웹페이지 주소를 가져온다. pd.read_html("https://www.어쩌고저쩌고") 를 dfs로 저장한다. dfs = pd.read_html("https://www.어쩌고저쩌고") 한 페이지에 표가 여러개 있을 수 있다. pandas는 그걸 모두 읽어온다. 몇 개 가져왔나 보기 위해 len(dfs)를 해본다. 아래 예시의 경우엔 19개가 나왔다. 그럼 내가 원하는 표가 몇 번째인지 어떻게 알까? 대충 찍어본다. dfs[n].head() 로 데이터를 확인해본다. 내 경우엔 n=2였다. 이제 원하는 테이블만 csv 파일로 저장해보겠다. dfs[2].to_csv("원하는 이름.csv") 하면 기존 디렉토리로 저장이 된다. 기존 디렉토리를 바꾸고 싶다면? 다음 포스팅 참조 부탁 https://blog.naver.com/...


#csv #웹파일바꾸기 #웹을엑셀로저장 #웹을엑셀로 #데이터가져오기 #to_csv #read_html #python #pandas #html #웹파일읽기

원문링크 : [Python] HTML 표를 csv로 저장하기