본문 바로가기
자격증 공부/빅데이터분석기사

빅데이터 분석기사 실기 모의고사 - 작업형 1유형(4)

by 해모해모 2023. 6. 19.
728x90
반응형

주어진 데이터 중 train.csv에서 'SalePrice'컬럼의 왜도와 첨도를 구한 값과, 'SalePrice'컬럼을 스케일링(log1p)로 변환한 이후 왜도와 첨도를 구해 모두 더한 다음 소수점 2째자리까지 출력하시오
# 라이브러리 및 데이터 불러오기
import pandas as pd
df = pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/train.csv')
print(df.head())

# 'SalePrice'컬럼 왜도와 첨도계산 
dfSkew = df['SalePrice'].skew() # 왜도(비대칭도)
dfKurt = df['SalePrice'].kurt() # 첨도(두꺼운꼬리)
print("왜도 : ", dfSkew)
print("첨도 : ", dfKurt)

# 'SalePrice'컬럼 로그변환
import numpy as np
df['SalePrice'] = np.log1p(df['SalePrice'])
print(df['SalePrice'])

# 'SalePrice'컬럼 왜도와 첨도계산 
dfSkewLog = df['SalePrice'].skew() # 왜도(비대칭도)
dfKurtLog = df['SalePrice'].kurt() # 첨도(두꺼운꼬리)
print("왜도 : ", dfSkewLog)
print("첨도 : ", dfKurtLog)

# 모두 더한 다음 출력
print(round(dfSkew + dfSkewLog + dfKurt + dfKurtLog,2))

# 정답 : 9.35

출처_퇴근후딴짓(캐글) : https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

빅데이터 분석기사 실기 (Python, R tutorial code)

www.kaggle.com

출처_퇴근후딴짓(유튜브) : https://www.youtube.com/@ai-study

 

퇴근후딴짓

퇴근 후, 함께 재미있게 성장하는 딴짓 커뮤니티 비 전공, 다른 직무라도 Re-skilling이 필요한 시대입니다. 함께 AI, 머신러닝, 딥러닝을 재미있게 Study 시작해보아요 :) 새롭게 알게 된 것, 공부한

www.youtube.com

728x90
반응형

댓글