728x90
반응형
1. 데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 분석방식은 무엇인가?
탐색적 자료 분석(EDA)
2. 데이터마이닝의 모델링에 대한 설명이다. 설명이 가장 잘못된 것은?
- 데이터마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 한다.
- 모델링 방법은 여러가지가 있으므로 모델링 시 반드시 다양한 옵션을 줘서 모델링을 수행하여 최고의 성과를 도출해야 한다. → 반드시는 아니고, 충분한 시간이 있으면 시도해보고 일정 성과가 나오면 해석과 활용 단계로 진행
- 분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2 비율로 상황에 맞게 실시한다.
- 성능에 집착하면 분석 모델링의 주목적인 실무 적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단한다.
3. 모델링 성능을 평가함에 있어, 데이터마이닝에서 활용하는 평가 기준이 아닌 것은?
- 정확도(Accuracy)
- 리프트(Lift)
→ 데이터마이닝 지표 : 정확도, 정밀도, 디텍트 레이트, 리프트
→ 시뮬레이션 지표 : Throughput, Averagy Waiting Time, Averagy Queue Length, Time in System
- 디텍트 레이트(Detect Rate)
- Throunghput
728x90
반응형
'자격증 공부 > ADsP' 카테고리의 다른 글
ADsP 오답노트(5) - 데이터 마트 (2) | 2023.08.13 |
---|---|
ADsP 오답노트(4) - R 프로그래밍 기초 (0) | 2023.08.13 |
ADsP 오답노트(2) - 데이터 분석 기획 (2) | 2023.08.09 |
ADsP 오답노트(1) - 데이터의 이해 (4) | 2023.08.07 |
ADsP(데이터분석 준전문가) 접수후기 (0) | 2023.08.07 |
댓글