1. 다음 중 지식(Knowledge)에 대한 예시로 가장 적절한 것은?
- A사이트보다 B사이트가 다른 물건도 비싸게 팔 것이다.
- B사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다. 데이터(D)→정보(I)→지식(K)→지혜(W)
- A사이트는 10,000원에, B사이트는 15,000원에 USB를 팔고 있다.
- B사이트의 USB 판매가격이 A사이트보다 더 비싸다.
2. 다음 중 글로벌 기업의 빅데이터 활용사례로 그 연결이 부적절한 것은?
- 구글 : 실시간 자동 번역시스템을 통한 의사소통의 불편 해소
- 라쿠텐 : 이용자의 콘텐츠 기호를 파악하여 새로운 영화를 추천해주는 Cinematch 시스템 운영 → Cinematch는 넷플리스의 영화추천 알고리즘이다.
- 월마트 : 소셜 미디어를 통해 고객 소비 패턴을 분석하는 월마트랩(Wallmart Labs) 운영
- 자라 : 일일 판매량을 실시간 데이터 분석으로 상품 수요를 예측
3. 데이터웨어하우스는 기업 내의 의사결정지원 애플리케이션에 정보 기반을 제공하는 하나의 통합된 데이터 저장 공간을 말한다. 다음 중 웨어하우스의 고유한 특성이 아닌 것은? → 데이터의 주제 지향성, 데이터 통합, 데이터의 시계열성, 데이터의 비휘발성
- DW에서는 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요하다.
- DW의 데이터들은 전사적 차원에서 일괄된 형식으로 정의된다.
- DW에서 관리하는 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다.
- DW에서는 특정 주제에 따라 데이터들이 분류, 저장, 관리된다.
4. 다음 중 주요 데이터 분석 기술에 대한 설명으로 가장 부적절한 것은?
- OLAP : 다차원의 데이터를 대화식으로 분석하기 위한 기술
- Business Intelligence : 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
- Business Analytics : 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법
- Deep Learning : 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술 → 해당 기술은 "데이터 마이닝"에 관련된 내용이다.
5. [트레이딩, 공급, 수요예측]은 어떤 특정산업의 일차원적 분석 사례인가? 에너지
6. 다음 중 일반적으로 통용되고 있는 빅데이터의 정의와 거리가 가장 먼 것은?
- 빅데이터는 일반적인 DB S/W로 저장/관리/분석할 수 있는 범위를 초과하는 규모의 데이터다.
- 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집/발굴/분석을 지원하도록 고안된 차세대 기술 및 아키텍처이다.
- 빅데이터는 데이터의 양, 데이터 유형과 소스 측면의 다양성, 데이터 수집과 처리 측면에서 속도가 급격히 증가하면서 나타난 현상이다.
- 빅데이터는 기존의 작은 데이터 처리 분석으로는 얻을 수 없었던 통찰과 가치를 하둡을 기반으로 하는 대용량의 분산처리 기술을 통해 창출하는 새로운 방식이다. → 하둡은 빅데이터 플랫폼 환경구축을 위해 사용할 뿐이다.
7. 다음 중 빅데이터 현상이 출현하게 된 배경과 가장 거리가 먼 것은? → 필요한 기술 아키텍처 및 통계 도구들의 발전, 모발일 혁명 등의 관련기술의 발달
- 의료정보 등 공공데이터의 개방 가속화
- M2M, IoT와 같은 통신 기술의 발전
- 하둡 등 분산처리 기술의 발전
- 트위터, 페이스북 등 SNS의 급격한 확산
8. 다음 중 빅데이터가 만들어 내고 있는 변화와 가장 거리가 먼 것은?
- 가치가 있을 것이라고 예상되는 특정한 정보만 모아서 처리하는 것이 아니라 가능한 한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아내는 방식이 중요해진다.
- 데이터의 규모가 증가함에 따라 사소한 몇 개의 오류 데이터는 분석결과에 영향을 미치지 않기 때문에 데이터세트에 포함하여 분석해도 상관없는 경우가 많아진다.
- 데이터의 양이 증가하고 유형이 복잡해짐에 따라 수많은 데이터 중에서 분석에 필요한 데이터를 선정하기 위해 정교한 표본조사 기법의 중요성이 대두되고 있다. → 전수조사!
- 인과관계의 규명 없이 상관관계 분석 결과만으로도 인사이트를 얻고 이를 바탕으로 수익을 창출할 수 있는 기회가 점차 늘어나고 있다.
9. 상품, 서비스, 기술 등의 기반 위에 다른 이해관계자들이 보완적인 상품, 서비스, 기술을 제공하는 생태계 구축을 목표로 하는 비즈니스 모델은? 플랫폼형 비즈니스 모델
10. 다음 중 데이터의 가치 측정이 어려운 이유로 적절하지 않은 것은 무엇인가? → 데이터 활용방식 : 재사용/재조합/다목적용 개발, 새로운 가치 창출, 분석 기술 발전
- 데이터 재사용의 일반화로 특정 데이터를 언제 누가 사용했는지 알기 힘들기 때문이다.
- 빅데이터 전문 인력의 증가로 다양한 곳에서 빅데이터가 활용되고 있기 때문이다.
- 분석기술의 발전으로 과거에 분석이 불가능했던 데이터를 분석할 수 있게 되었기 때문이다.
- 빅데이터는 기존에 존재하지 않던 새로운 가치를 창출하기 때문이다.
11. 사생활 침해를 막기 위해 개인정보를 무작위 처리하는 등 데이터가 본래 목적 외에 가공되고 처리되는 것을 방지하는 기술은? 난수화
12. 다음 중 비즈니스 모델에서 빅데이터 분석 방법과 사례를 연결한 것으로 부적절한 것은?
- 맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많은가? : 연관규칙학습
- 택배차량을 어떻게 배치하는 것이 가장 비용 효율적인가? : 유형분석 → 유형분석은 문서를 분류하거나, 조직을 그룹으로 나눌 때 사용한다.
- 친분관계가 승진에 어떤 영향을 미치는가? : 소셜네트워크분석
- 고객의 만족도가 충성도에 어떤 영향을 미치는가? : 회귀분석
13. 다음 중 핀테크 분야에서 빅데이터 활용이 가장 핵심적인 분야는?
- 크라우드 펀딩(Crowd Funding)
- 신용평가(Credit Rating)
- 간편결제(Simple Payment)
- 블록체인(Block Chain)
14. 다음 중 딥러닝과 가장 관련 없는 분석기법은?
- CNN
- LSTM
- SVM → SVM은 분류분석 기법 중 하나이다.
- Autoencorder
15. 딥러닝을 활용하기 위한 다양한 오픈소스 중 관련이 없는 것은?
- Caffe
- Tensorflow
- Anaconda → Anaconda는 Python 프로그램의 "머신러닝" 기능을 강화해주는 S/W이다.
- Theano
16. 다음 중 데이터화(Datafication) 현상에 큰 영향을 미치는 기술로 적절한 것은?
- 사물인터넷(Internet of Things) → 사물에서 생성되는 데이터를 활용
- 인공지능(Artificial Intelligence)
- 가상현실(Virtual Reality)
- 3D 프린팅(3D-Printing)
17. 사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터베이스 관리 시스템은 무엇인가? 객체지향 DBMS
18. 데이터 사이언스에서 인문학적 사고는 반드시 필요한 요소이다. 다음 중 인문학 열풍을 가져오게 한 외부 환경 요소로 가장 부적절한 것은? → 컨버전스에서 디버전스로의 변화, 생산에서 서비스로의 변화, 생산에서 시장창조로의 변화
- 디버전스 동역학이 작용하는 복잡한 세계화
- 비즈니스 중심이 제품생산에서 체험경제를 기초로 한 서비스로 이동
- 경제의 논리가 생산에서 최근 패러다임인 시장 창조로 변화
- 빅데이터 분석 기법의 이해화 분석 방법론 확대
19. 정보는 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 것이며, 지식을 도출하기 위한 재료가 된다.
20. 기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합을 데이터 웨어하우스라고 한다.
21. 정량적 데이터는 지역별 매출액, 영업이익률, 판매량과 같이 수치로 명확하게 표현되는 데이터로, 그 양이 크게 증가하더라도 이를 DBMS에 저장, 검색, 분석하여 활용하기가 용이하다.
22. SCM은 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화시키기 위한 것으로, 자재 구매, 생산, 재고, 유통, 판매, 고객 데이터로 구성된다.
23.
- 페이스북은 2006년 F8 행사를 기점으로 자신들의 소셜 그래프 자산을 외부 개발자들에게 공개하고 서드파티 개발자들이 페이스북 위에서 작동하는 앱을 만들기 시작하면서 플랫폼 역할을 하기 시작했다.
- 하둡은 대규모 분산 병렬 처리의 업계 표준으로 맵리듀스 시스템과 분산 파일 시스템인 HDFS로 구성된 플랫폼 기술이며, 선형적인 성능과 용량 확장성, 고장 감내성을 가지고 있다. 아마존(Amazon)은 S3와 BC2 환경을 제공함으로써 플랫폼을(를) 위한 클라우드 서비스를 최초로 실현하였다.
24. 아래에서 설명하고 있는 빅데이터 활용 기본 테크닉은 무엇인가? 유전자 알고리즘
- 생명의 진화를 모방하여 최적해(Optimal Solution)를 구하는 알고리즘으로 존 홀랜드(John Holland)가 1975년에 개발하였다.
- '최대의 시청률을 얻으려면 어떤 시간대에 방송해야 하는가?'와 같은 문제를 해결할 때 사용된다.
- 어떤 미지의 함수 Y=f(x)를 최적화하는 해 x를 찾기 위해, 진화를 모방한(Simulated Evolution) 탐색 알고리즘이라고 말할 수 있다.
'자격증 공부 > ADsP' 카테고리의 다른 글
ADsP 오답노트(5) - 데이터 마트 (2) | 2023.08.13 |
---|---|
ADsP 오답노트(4) - R 프로그래밍 기초 (0) | 2023.08.13 |
ADsP 오답노트(3) - 데이터 분석 개요 (0) | 2023.08.13 |
ADsP 오답노트(2) - 데이터 분석 기획 (2) | 2023.08.09 |
ADsP(데이터분석 준전문가) 접수후기 (0) | 2023.08.07 |
댓글