본문 바로가기
자격증 공부/빅데이터분석기사

빅데이터 분석기사 실기 모의고사 - 작업형 1유형(1)

by 해모해모 2023. 6. 19.
728x90
반응형

데이터에서 IQR을 활용해 Fare컬럼의 이상치를 찾고, 이상치 데이터의 여성 수를 구하시오
# 라이브러리 및 데이터 불러오기
import pandas as pd
df = pd.read_csv('../input/titanic/train.csv')
# print(df.head())

# EDA
# print(df.isnull().sum())
df = df.dropna(axis=1) # 결측치 열 그냥 지워버림
# print(df.isnull().sum())

# IQR 구하기
Q3 = df['Fare'].quantile(.75)
Q1 = df['Fare'].quantile(.25)
# print(q3)
# print(q1)
IQR = Q3 - Q1
# print(IQR)

# 이상치 데이터 구하기
cond1 = df['Fare'] < (Q1 - (1.5 * IQR))
# print(cond1.sum()) # cond1 조건에 해당하는 데이터 개수가 0임
cond2 = df['Fare'] > (Q3 + (1.5 * IQR))
# print(cond2.sum())

# 이상치 데이터에서 여성 수 구하기, 출력하기 print()
cond3 = df['Sex'] == 'female'
# print(cond3.sum())

print((cond2&cond3).sum()) 

# 정답 : 70

출처_퇴근후딴짓(캐글) : https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

빅데이터 분석기사 실기 (Python, R tutorial code)

www.kaggle.com

출처_퇴근후딴짓(유튜브) : https://www.youtube.com/@ai-study

 

퇴근후딴짓

퇴근 후, 함께 재미있게 성장하는 딴짓 커뮤니티 비 전공, 다른 직무라도 Re-skilling이 필요한 시대입니다. 함께 AI, 머신러닝, 딥러닝을 재미있게 Study 시작해보아요 :) 새롭게 알게 된 것, 공부한

www.youtube.com

728x90
반응형

댓글