본문 바로가기
728x90
반응형

랜덤포레스트3

빅데이터 분석기사 실기 2회 기출 # 작업형 1유형 # 1. 범죄율 컬럼인 Crim 항목의 상위에서 10번째 값으로 상위 10개의 값을 변환한 후, age가 80이상인 데이터를 추출하여 crim의 평균값 추출 # print(df.head()) df = df.sort_values('CRIM', ascending = False) # print(df['CRIM'].head(20)) # print(df['CRIM'].iloc[9]) # print(df['CRIM'].iloc[:10]) df['CRIM'].iloc[:10] = df['CRIM'].iloc[9] # print(df['CRIM'].head(20)) cond = df['AGE'] >= 80 df = df[cond] # print(df.head()) print(df['CRIM'].mea.. 2023. 6. 23.
빅데이터 분석기사 실기 3회 기출 # 작업형 1유형 # 1. 데이터 중 결측치가 있는 경우 해당 데이터의 행을 모두 제거하고, 첫번째 행부터 순서대로 70%까지의 데이터를 훈련 데이터로 추출한 데이터 세트를 구성한다. # 변수 중 'housing_median_age'의 Q1(제1사분위수) 값을 정수로 계산하시오. # print(df.shape) # print(df.isnull().sum()) # 결측치 제거 df = df.dropna() # print(df.isnull().sum()) # print(df.shape) # print(len(df)) # 첫번째 행부터 순서대로 70%까지의 데이터 추출 # print(len(df)) # print(len(df)*0.7) train = df.iloc[:int(len(df)*0.7)] # prin.. 2023. 6. 23.
빅데이터 분석기사 실기 4회 기출 # 작업형 1유형 list = [2, 3, 3.2, 5, 7.5, 10, 11.8, 12, 23, 25, 31.5, 34] import pandas as pd df = pd.DataFrame({ 'value' : list }) # print(df) # 1-1. 제1사분위수와 제3사분위수 구하기 q1 = df['value'].quantile(.25) q3 = df['value'].quantile(.75) # print(q1, q3) # 정답 : 제1사분위수 = 4.55, 제3사분위수 = 23.5 # 1-2. 제1사분위수와 제3사분위수 차이의 절대값 구하기 # print(abs(q1-q3)) # 정답 : 18.95 # 1-3. 그 값의 소수점을 버린 후 정수로 출력 result = abs(q1-q3) pri.. 2023. 6. 23.
728x90
반응형