본문 바로가기
자격증 공부/ADsP

ADsP 오답노트(3) - 데이터 분석 개요

by 해모해모 2023. 8. 13.
728x90
반응형

1. 데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 분석방식은 무엇인가?

탐색적 자료 분석(EDA)

 

2. 데이터마이닝의 모델링에 대한 설명이다. 설명이 가장 잘못된 것은?

- 데이터마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 한다.

- 모델링 방법은 여러가지가 있으므로 모델링 시 반드시 다양한 옵션을 줘서 모델링을 수행하여 최고의 성과를 도출해야 한다. → 반드시는 아니고, 충분한 시간이 있으면 시도해보고 일정 성과가 나오면 해석과 활용 단계로 진행

- 분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2 비율로 상황에 맞게 실시한다.

- 성능에 집착하면 분석 모델링의 주목적인 실무 적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단한다.

 

3. 모델링 성능을 평가함에 있어, 데이터마이닝에서 활용하는 평가 기준이 아닌 것은?

- 정확도(Accuracy)

- 리프트(Lift)

→ 데이터마이닝 지표 : 정확도, 정밀도, 디텍트 레이트, 리프트

→ 시뮬레이션 지표 : Throughput, Averagy Waiting Time, Averagy Queue Length, Time in System

- 디텍트 레이트(Detect Rate)

- Throunghput

728x90
반응형

댓글