기상 데이터 시간 정리 및 평균화 (기상 최종)


기상 데이터 시간 정리 및 평균화 (기상 최종)

48분할 기상 데이터 기상 정보를 스크래핑해서 저장된 csv 파일은 기상 포털의 데이터와 동일하게 30분 단위로 나눴기 때문에 48분할의 데이터로 저장되었습니다. 하지만 전력 데이터와 결합해서 사용하려면 시간 주기를 맞춰줘야하기 때문에 같은 시단위의 두 데이터(h시 20분, h시 50분)를 평균을 구해서 새로 저장하도록 하겠습니다. 변수 Temp_AVG에는 두 변수의 평균이 저장되서 각 시각별로 온도값이 저장됩니다. New_list에 저장할때는 정수가 아니라 실수인 데이터들도 있기 때문에(ex.5.5 ) float()를 통해 실수로 만들어주는 과정이 필요합니다. 시간 정보는 년-월-일의 형식으로 조합되서 'DateTime' 컬럼에 저장되고, 시각은 'Seq' 컬럼에 순번으로 표시됩니다. import csv import pandas as pd print('Start Working!!') month = {1:31, 2:28, 3:31, 4:30, 5:31, 6:30, 7:31, 8:31...


#csv #크롤링 #자동화 #스크래핑 #셀레니움 #빅데이터 #머신러닝 #딥러닝 #데이터전처리 #데이터 #날씨데이터 #기온 #기상데이터 #파이썬

원문링크 : 기상 데이터 시간 정리 및 평균화 (기상 최종)