본문 바로가기
자격증 공부/빅데이터분석기사

빅데이터분석기사 6회 실기 합격 후기 - 사전점수 발표

by 해모해모 2023. 7. 9.
728x90
반응형

안녕하세요, 해모해모입니다.

 

오늘은 희망고문으로 저를 2주 동안 괴롭혔던 빅데이터분석기사 6회 실기 결과를 가져왔습니다.

 

새로이 바뀐 작업형 3유형으로 수험생들을 처음으로 당황시켰고, 예시문제와 다른 3유형의 실제 출제 문제로 두번째 당황시켰던 아주 말도많고 탈도많던 시험이었던 것 같습니다.

 

시험시간 3시간을 꽉꽉 채우고도 빈 답변과 노가다 문제풀이로 인해 불합격을 당연하게 예상했었는데, 수험생들의 적극적인 이의제기로 "패키지 누락으로 인한 전원정답처리" 라는 답변과 함께 10점을 거저먹을 수 있었습니다.

 

그로 인해, 저에겐 당연한 불합격이 아닌 혹시?라는 마음을 품고 희망고문 당하는 2주가 되었지만요...

 

그래서 결과는? 두근두근,,,

 

합격했습니다..!

 

심지어 전원정답처리 10점을 제외하고도 합격권에 들어가는 점수라 회사에서 확인하자마자 소리를 질러서 여럿 놀래켰었네요..하하

 

일단 작업형 3유형을 제외한 나머지 유형의 Tip을 조금이나마 적어보자면,

 

작업형 1유형 - 어떤 유형의 문제가 출제될 줄 모르니 최대한 많은 문제를 풀어보시고, 문제를 푸는 데에 그치는 것이 아닌 문제에 썼던 코드(?)를 아는 게 중요한 것 같습니다. 저는 공부하면서 실수했던 게, "아 이 문제는 이렇게 푸는 문제구나"에서 그쳐서 그런지 새로운 문제를 만날 때마다 감이 안잡히고 풀이를 보면서 그렇구나 끄덕거리기만 했었습니다. 

 

심지어 1유형 2번에서는 분명 나는 답을 냈는데, 해당 결과만 출력하는 법을 몰라서 30분 정도를 잡아먹다가 넘어갔었지요... print를 하면 6 이 나와야 하는데 컬럼명, 인덱스 이런 부산물들도 같이 출력돼서 너무 답답했던 기억이 있습니다. 마지막에 뭔가 접신을 한 지 모르겠는데 이것저것 다 print 해보다가 6만 나오길래 감격했더랬죠... (그때 뭘 어떻게 써서 6만 출력했었는지 기억이 나질 않습니다...)

 

두번째로는 문제를 잘 읽어야 한다입니다. 저는 1번문제를 다 풀어놓고 마지막에 "분"으로 환산해야하는 걸 "초"로 환산해서 답을 제출했습니다. 심지어 이건 시험시간이 다 돼서 제출하고 나오는 그 문에서 생각이 났더랬죠. 1번문제는 손도 못대다가 시험시간 15분 정도 남았을때 갑자기  datetime 함수가 생각나서 급하게 풀었던 터라 정말 다행이라고 생각하고 있었는데 그런 실수를 하다니 속이 말이 아니었습니다. 문제를 일단 다 풀고 다시 한번 문제를 읽어서 결과를 어떻게 내느냐가 중요한 것 같습니다...

 

그리고 2번문제에서는 교사 1인당 맡은 학생수가 가장 많은 학교를 찾고, 맡은 학생 수를 답으로 제출하는거였는데 학교를 찾아서 답으로 제출하신 분들도 꽤 있었습니다. 저도 문제를 다시 읽지 않았으면 학교 이름을 답으로 프린트했을 것 같습니다. 빅데이터분석기사 시험이 유독 문제에서 말장난하는 경우가 있는 것 같습니다. 하지만 우리는 어렸을때부터 공교육을 받으며 치뤘던 시험들 중 언어영역 쪽에서 이런 말장난을 하는 경우가 허다했기 때문에 저는 그리 억울하지는 않았습니다만, 유독 이 자격증 시험이 그렇지 않나 싶습니다.

 

마지막으로 진짜 정 안되겠으면 노가다를 해라 입니다. 이건 빅데이터분석기사 실기시험에서 항상 논란이 되는 내용이긴 합니다. 이름 그대로 "기사"시험인데 어떻게 문제를 노가다로 풀 수 있냐 하는 얘기들입니다. 사실 그렇긴 해도, 이번 3번문제에서는 2003년부터 2022년까지 1월~12월 데이터가 다 있는 상태였습니다. 그 상태에서 노가다를 하는 방법을 아는 것도 힘들었습니다. 저는 컬럼을 추가해서 2003년 1월~2022년 12월까지 범죄 건수를 다 더한 데이터를 만들고, iloc를 이용해서 2003년~2022년의 연평균 건수를 더해서 변수에 다 담았었습니다. 정말 노가다라는건 손으로 하나하나 컬럼들 더해서 메모장에 적어놓고 또 그것들을 더하고 12로 나눠서 답을 도출하는 과정이 아닐까 싶습니다. iloc를 알아도 어떻게 구간을 나누는 지 모르면 사용할 수 없으니까요. 물론 이번 3번문제는 문제를 이해하는 것도 힘들었다고 하는데, 저는 사실 문제 이해보다는 이걸 어떻게 풀어야하나 하고 마지막으로 도전한게 노가다였습니다. 시험문제를 어떻게 받아들이냐는 사람마다 다르니까 사실 논란에 대해서 별 생각은 없었습니다.

 

작업형 2유형 - 작업형 2유형은 사실 할 말이 없습니다. 저는 정말 베이스라인만 제출했으니까요. 랜덤포레스트 하나만 알고 갔고, 분류인지 회귀인지 구별하는 방법은 시험장 들어가기 전에 검색해서 외웠습니다. 숫자는 회귀, 문자는 분류 이렇게 외워놨었고 0이나 1로 도출하는거면 또 분류..이렇게 외워갔습니다. 2유형 csv 예시를 보자마자 40_15 이런 식으로 되어있길래 문자로 생각하고 분류를 했더랬죠.

 

그리고 했던 작업은 별게 없습니다.

train, test 두 개만 나왔길래 타겟이 숨어있겠구나 해서 train.pop으로 target 변수를 만들어서 train, test, target 이렇게 데이터를 분리했습니다.

 

그리고 결측치는 없었고, object형은 라벨인코딩을 했습니다.

 

거기서 바로 랜덤포레스트 분류 모델링을 했고, 예측을 하고 제출을 했습니다.

 

저는 train_test_split도 하지 않았고 하이퍼파라미터 조정도 하지 않았습니다. 그냥 저 위가 끝이었습니다. 오히려 조정하다가 틀려지느니 기본만 해서 30점이라도 받자 하는 거였지요. 물론 10점 20점 받을 가능성도 있겠지만 랜덤포레스트 모델 자체가 예측을 잘 해주는 편이고, 빅데이터라는 이름에 걸맞게 예측을 할거면 많은 데이터로 해야지! 뭐 이런 패기였던 것 같습니다,,,,,,지금 생각하면 너무 웃긴것.... 아마 1유형에서 멘탈이 나가서 그랬던 것 같기도 하고요...

 

그리고 3유형은 저는 지금도 생각하고 싶지도 않고,,,너무 1유형에서 무너진 정신 2유형에서 조금 다잡다가 3유형에서 완전히 박살났기 때문에 ㅠㅠ.....하.... 이번에 합격하신 분들은 축하드리고 다음 시험 준비하시는 분들은 1, 2유형은 준비하던대로 꾸준히만 하시고 3유형을 좀 파셔야 할 것 같습니다 흑.... 아마 빅분기 강사진 분들도 이번시험에서 당황하셨겠죠,,,, 모든 수험생들 화이팅입니다. 이 글이 마지막 빅데이터분석기사 글이겠네요!

728x90
반응형

댓글