(1) pd.Series(리스트,index = 리스트) index = ['person','who'] s = pd.Series(['Wes Mckinney', 'Creator of Pandas'], index = index) print(s) #person Wes Mckinney #who Creator of Pandas #dtype: object..
함수형으로 정의하기 위해 필요한 모듈 import tensorflow as tf from tensorflow.keras.layers import Dense,Input from tensorflow.keras.models import Model #함수형으로 모델 정의 layers 클래스에서 Dense..
Seqeuntial() 모델이 순차적인 구조로 진행할 떄 사용 방법 add()를 이용한 방법 리스트를 활용한 방법 다중 입력 및 출력이 존재하는 등의 복잡한 모델을 구성할 수 없음 [add를 이용한 방법] model = Sequential..
Two Way Anova (이원 분산 분석) 주효과) 귀무가설 : 집단간 평균이 같음 vs 대립가설 : 평균이 같지 않은 집단이 한 쌍 이상 존재 교호작용 효과) 귀무가설 : 요인 간 교호작용이 없음 vs 대립가설 : 요인간 교호..
paired t-test 귀무가설 : 두 집단 간 평균 차이가 없다. vs 대립가설 : 두 집단 간 평균 차이는 0이 아니다. 독립변수(요인) : 이진 범주형 / 종속변수(반응) : 연속형 from scipy import stats stat,p = stats.t..
one sample t-test 귀무가설 : 모평균 = popmean 대립가설 : 모평균 ≠ popmean stats.ttest_1samp(df['Sepal.Length'],popmean=4) stat,p = stats.ttest_1samp(df['Sepal.Length'],popmean=4) print(f't통계량 :..
.isna().sum() : 각 열의 결측치 개수 출력 dropna(inplace = True, how=) Nan 값을 가지고 있는 행을 삭제 실제 데이터를 삭제하지 않고 NaN 값을 가진 행을 제외한 값을 반환 inplace = True 메소드를 이용하거..
bike_data[["Gender","Distance"]] bike_data.loc[:,["Gender","Distance"]] 기본 열추출 방법 같은 열 이름이 있는 데이터 프레임에서 열 이름으로 데이터를 추출하면 해당 열 이름의 데이터를 모두 출력 마스킹..
#1 글을 작성하고 블로그를 관리해보세요. 한교리님의 회원 가입을 진심으로 축하합니다. 이 글은 비공개로 작성돼 있습니다. '편집'으로 내용을 바꾸시거나, 삭제 후 '새 글을 작성'하셔도 됩니다. 글 뿐만 아니..
저장 .to_picke(’파일이름.pickle’) 피클 형태로 저장 .to_csv(’파일이름.csv’) csv파일로 저장 .to_xlsx(’파일이름.xlsx’) 엑셀로 저장 import openpyxl 모듈을 불러와야 함 불러오기 import glob df_name_..
(1) pd.merge(데이터1, 데이터2, left_on=, right_on=, how= ) join 타입 ( how = ) inner(디폴트 값) left right outer on = : 양쪽에 동일한 key 값이 있을 경우 아닐경우 left_on 과 right_on 으로 조인 키 값..
.sort_values( ) : 데이터 정렬 dia_agg.sort_values(['cut','clarity'], ascending = [True,False]).head() .set_index() 특정 변수를 인덱스로 지정할 경우 사용하는 메서드 데이터 병합 또는 시계열 분해에서..
요약 변수 생성 (1) 더미 변수 생성 pd.get_dummies(data = , columns = [ ] , drop_first = ) columns = : 리스트형태로 전달 drop_frist = True : 첫 번째 더미변수는 생성하지 않음 False : 모든 더미 변수 생..