728x90
반응형
당뇨병 여부 판단
# EDA
# print(X_train.head())
# print(X_test.head())
# print(y_test.head()) # id, Outcome
# print(X_train.info())
# print(X_train.describe())
# print(y_train['Outcome'].value_counts()) # 0:403, 1:211
# 결측치 확인
# print(X_train.isnull().sum()) X
# print(X_test.isnull().sum()) X
# 필요없는 컬럼 제거
# print(X_train.shape, X_test.shape)
X_train = X_train.drop('id', axis = 1)
test_id = X_test.pop('id')
# print(X_train.shape, X_test.shape, y_train.shape)
# 모델 학습 및 예측
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state = 2023)
model.fit(X_train, y_train['Outcome'])
pred = model.predict(X_test)
# print(pred)
pd.DataFrame({
'idx' : test_id,
'Outcome' : pred
}).to_csv('0000.csv', index = False)
print(pd.read_csv('0000.csv'))
728x90
반응형
'자격증 공부 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(7) (0) | 2023.06.21 |
---|---|
빅데이터 분석기사 실기 예제 - 작업형 2유형(5) (0) | 2023.06.20 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(6) (0) | 2023.06.20 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(5) (0) | 2023.06.19 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(4) (0) | 2023.06.19 |
댓글