728x90
반응형
# 주어진 데이터 셋에서 age컬럼 상위 20개의 데이터를 구한 다음 # f1의 결측치를 중앙값으로 채운다. # 그리고 f4가 ISFJ와 f5가 20 이상인 # f1의 평균값을 출력하시오!
import pandas as pd
df = pd.read_csv('/kaggle/input/bigdatacertificationkr/basic1.csv')
df = df.sort_values('age', ascending=False)
# print(df.head())
df = df.iloc[:20]
# print(df.head(50))
df['f1'] = df['f1'].fillna(df['f1'].median())
# print(df.head())
cond = (df['f4'] == 'ISFJ') & (df['f5'] >= 20)
# print(df[cond])
print(df[cond]['f1'].mean())
# 정답 : 73.875
출처_퇴근후딴짓(캐글) : https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr
출처_퇴근후딴짓(유튜브) : https://www.youtube.com/@ai-study
728x90
반응형
'자격증 공부 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 분석기사 실기 통계함수 (0) | 2023.06.23 |
---|---|
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(15) (0) | 2023.06.22 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(13) (0) | 2023.06.22 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(12) (0) | 2023.06.22 |
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(11) (0) | 2023.06.22 |
댓글