728x90
반응형
데이터에서 IQR을 활용해 Fare컬럼의 이상치를 찾고, 이상치 데이터의 여성 수를 구하시오
# 라이브러리 및 데이터 불러오기
import pandas as pd
df = pd.read_csv('../input/titanic/train.csv')
# print(df.head())
# EDA
# print(df.isnull().sum())
df = df.dropna(axis=1) # 결측치 열 그냥 지워버림
# print(df.isnull().sum())
# IQR 구하기
Q3 = df['Fare'].quantile(.75)
Q1 = df['Fare'].quantile(.25)
# print(q3)
# print(q1)
IQR = Q3 - Q1
# print(IQR)
# 이상치 데이터 구하기
cond1 = df['Fare'] < (Q1 - (1.5 * IQR))
# print(cond1.sum()) # cond1 조건에 해당하는 데이터 개수가 0임
cond2 = df['Fare'] > (Q3 + (1.5 * IQR))
# print(cond2.sum())
# 이상치 데이터에서 여성 수 구하기, 출력하기 print()
cond3 = df['Sex'] == 'female'
# print(cond3.sum())
print((cond2&cond3).sum())
# 정답 : 70
출처_퇴근후딴짓(캐글) : https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr
출처_퇴근후딴짓(유튜브) : https://www.youtube.com/@ai-study
728x90
반응형
'자격증 공부 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(3) (0) | 2023.06.19 |
---|---|
빅데이터 분석기사 실기 모의고사 - 작업형 1유형(2) (0) | 2023.06.19 |
빅데이터 분석기사 실기 예제 - 작업형 1유형(6) (0) | 2023.06.19 |
빅데이터 분석기사 실기 예제 - 작업형 2유형(3) (0) | 2023.06.18 |
빅데이터 분석기사 실기 예제 - 작업형 1유형(5) (0) | 2023.06.18 |
댓글