본문 바로가기
자격증 공부/ADsP

ADsP 오답노트(4) - R 프로그래밍 기초

by 해모해모 2023. 8. 13.
728x90
반응형

1. 연속형 변수의 경우 4분위수, 최소값, 최대값, 중앙값, 평균 등을 출력하고 범주형 변수의 경우 각 범주에 대한 빈도수를 출력하여 데이터의 분포를 파악할 수 있게 하는 함수는? summary 함수

 

2. 다음 중 아래의 R코드를 수행한 결과에 대한 설명으로 옳은 것은?

> c(2,4,6,8) + c(1,3,5,7,9)

경고메시지와 함께 결과가 출력된다. → '두 객체의 길이가 서로 배수관계에 있지 않다'라는 경고메시지와 함께 결과도 출력됨

 

3. R의 데이터 구조와 저장형식에 관한 설명으로 가장 부적절한 것은?

- as.numeric 함수에 논리형 벡터를 입력하면 TRUE에 대응하는 원소는 1, FALSE에 대응하는 원소는 0인 숫자형 벡터로 변형된다.

- 숫자형 행렬에서 원소 중 하나를 문자형으로 변경하게 되면 해당 행렬의 모든 원소가 문자형으로 변경된다.

- 데이터 프레임은 각 열 별로 서로 다른 데이터 타입을 가질 수 있다.

- 행렬을 as.vector 함수에 입력하면 행 방향으로 1행부터 차례로 원소를 나열하는 벡터가 생성된다. → 행렬을 as.vector 함수에 입력하면 열방향으로 1열부터 차례로 원소를 나열하는 벡터가 생성된다.

 

4. R에서 제공하는 데이터 가공, 처리를 위한 패키지의 설명으로 가장 부적절한 것은?

- data.table 패키지는 데이터 프레임 처리함수인 ddply 함수를 제공한다. → data.table 패키지는 큰 데이터를 탐색, 연산, 병합하는데 아주 유용하다. ddply는 plyr 패키지에서 지원한다.

- reshape 패키지는 melt와 cast를 이용하여 데이터를 재구성할 수 있다.

- sqldf 패키지는 R에서 표준 SQL 명령을 실행하고 결과를 가져올 수 있다.

- plyr 패키지는 데이터의 분리, 결합 등 필수적인 데이터 처리 기능을 제공한다.

 

5. R 패키지에서 표준편차를 계산하기 위한 함수는?

sd(데이터프레임$변수), sqrt(var(데이터프레임$변수)), var(데이터프레임$변수)^(1/2)

 

6. 두 개의 데이터프레임을 하나로 결합할 때 사용하는 함수는? merge

 

7. R에서 새로운 패키지를 설치 및 사용하고자 할 때 명령어와 순서는?

install.packages("패키지명") → library(패키지명)

 

8. A와 B를 X라는 변수를 기준으로 합치려고 할 때, R 프로그래밍 하시오.

merge(A, B, by="X")

 

9. 데이터프레임에서 A 컬럼 값이 사과인 데이터만 조회하고자 할 때, R 프로그래밍 하시오.

subset(데이터프레임, A=="사과")

 

10. SQL을 활용하거나 SAS에서 PROC SQL로 작업하던 사용자들에게 R 프로그램에서 지원해주는 패키지는 무엇인가?

sqldf()

728x90
반응형

댓글