본문 바로가기
Certificates

[2021.04.17] 빅데이터 분석기사 1차 필기 후기 및 결과

by Rosmary 2021. 5. 1.
728x90
반응형

 

 

 

 

 

2021년 04월 17일. 대한민국에서 최초로 진행된 빅데이터 분석기사 2회 필기 시험을 치르게 되었다. 아! 2회 인데 왜 대한민국 최초냐고? 원래 1회가 2020년 12월에 진행될 예정이었는데, 마침 코로나가 미친듯이 창궐하던 시기라 시험 4일 전에 1차 시험을 치르지 않겠다는 공지가 내려왔다고 한다. 그래서 이번 시험이 2회임에도 불구하고 최초가 된 것이다. 

 

그래서인지 빅데이터 분석기사 필기 준비를 하면서 에러 사항이 너무나 많았다. 필자가 거의 2년 전에 국가 기사 자격증 시험(과목 변경 전의 정보처리기사다)을 치렀을 당시만 해도, 해당 기사 자격증의 기출 문제를 찾는 것이 어렵지 않아 이론적으로 완벽하게 정리되지 않아도 문제를 많이 풀어보는 것으로 자격증을 취득할 수 있었는데... 빅데이터 분석기사는 시중에 나와있는 참고서의 내용도 초심자가 이해하기에 깔끔하게 정리가 된 것도 아닌데다가(사실 이건 정보처리기사도 마찬가지긴 하다만) 기출문제는 아예 존재하지 않았기 때문에 공부를 어떻게 해야할지도 감이 전혀 오지 않았다.

 

필자의 경우, 보통 시험이 끝나면 치른 시험이 통과될 것이라는 확신을 매우 강하게 가지고 나왔던 기억이 많은데, 이번 시험은 준비 시간, 자료 등등 모든 것이 부족한 상태로 진행한 시험이라 솔직히 통과할 것이라는 확신이 이전만큼 들지 않는다. 아무래도 다음 회차에 다시 필기 준비를 해야 할 수도 있을 듯 해서, 그간의 과정을 기록해보고자 포스팅을 작성한다.

 

다른 자격증 시험이었다면, 어떻게 시험준비를 하는지 먼저 포스팅 한 뒤에 후기를 적지만, 이번 빅데이터 분석기사의 후기만큼은 예외다. 누차 강조하는 것이지만 준비 시간도 부족했고, 시험 문제 경향은 알 수 없어 예상 문제를 풀어도 통과할 수 있을지에 대한 확신도 없었기 때문이다. 그래서 이번 포스팅은 먼저 시험을 치르게 된 계기와 간략한 준비과정, 그리고 후기를 작성한 뒤, 어떻게 공부해야 할 지 나름 정리하는 것으로 포스팅을 마무리하려 한다.

 

 

 

1. 시험을 치르게 된 계기

 

필자는 IT 분야의 솔루션 엔지니어다. 필자가 대략 반년 전쯤부터, 필자가 하는 회사 업무에 관해서 - 불만은 아니고 - 커리어적으로 일어날 수 있는 문제에 대해 고민을 시작했다. 자세한 고민거리야 이 포스팅에 언급하기에는 주제에서 너무 많이 벗어난 것이니 논외로 치고(그럼에도 불구하고 고민거리를 간략히 요약하자면, "과연 몇 년 뒤도 관련 업무를 계속 할 수 있을지, 전문성을 갖추기에 문제가 없는지"이다), 이런 저런 걱정거리로 인해, 이제 업무 외적으로도 무언가를 준비를 하지 않으면 안되겠다는 생각이 들어, 새해가 시작되고 유망한 분야가 어디에 있을지 지속적으로 고민해왔다. 

 

마침 필자가 다루는 솔루션이 일종의 네트워크 데이터를 분석하는 제품인데, 필자가 솔루션의 기능을 이용하여 분석을 조금 더 수월하게 할 수 있도록 프로그래밍하는 작업을 최근에 자주 하고 있다. 이 업무를 하다보니, 수신하는 데이터가 동일한 내용을 담고 있더라도 데이터를 보내는 장치의 제조사에 따라 이 데이터 포맷이 제각각이라, 이 모양새를 단일화된 형태로 만들어주는 작업에 많은 시간이 들어가고 있었다.

 

"야... 이거 어차피 내용은 동일한건데, 저거 자동으로 분류해서 콤마 딜리미터로 나열 좀 해줬으면 좋겠다...그럼 작업하기 편할텐데"

 

이 생각을 가진 것이 올해 2월 말, 3월 초다. 여기에 생각이 다다르면서 이런 저런 자료를 찾다보니, 비정형화된 대량 데이터를 분석하는 빅데이터라는 용어를 많이 접하게 되었다. 빅데이터에 대해 하나 둘 자료를 찾다보니, 앞으로는 잘 가공된 데이터를 보유하고 있는 것 + 데이터를 통해 정확한 상황을 분석하고 그 결과를 활용할 수 있는 기술이 중요해지게 될 것이라는 느낌이 들었다.

 

"그래! 한 번 이 쪽으로 방향을 잡아보자. 근데, 이 분야를 공부하기에 적당한 자격증이 있을까?"

 

찾아보니, 마침 국가 자격증으로 빅데이터 분석기사가 4월에 치뤄진다는 정보가 나타난다. 천만다행으로, 시험 정보를 알게 된 그 다다음날이 시험 접수 종료일이었다. 고민하지 않고, 다음날 바로 시험 접수를 했다. 

 

...그리고 지옥문이 열렸다...

 

 

 

2. 계획은 있었으나, 모든것이 어그러진 준비과정

 

 

 

필자의 빅데이터 분석기사 시험 준비 과정을 하나의 짤로 요약하면 이렇지 않을까...? 아! 물론 시험이 타이슨이다.

 

 

 

필자는 3월 첫 째주에 얄구진 참고서 하나를 서점에서 구매하여, 최대 5주 내로 이 모든 과목을 끝내겠다는 계획을 세웠다. 한번도 시행된 적이 없는 시험이라, 어떤 참고서를 사더라도 추가로 자료를 찾아봐야하는 수고는 동일하게 진행해야 하기 때문일거라 생각해서 말이다.  시험 일주일 전부터는 예상문제를 풀면서 아리송한 개념을 잡는데 중점을 두려고 했다. 하지만...

 

시험을 준비한지 며칠 되지도 않아, 2월까지는 나름 한가하던 회사 업무가 급속히 바쁘게 돌아가기 시작한다. 원래 칼퇴하고 4시간 정도 자격증 준비를 하려 했던 계획이 야근이 생겨나면서 조금씩 밀리기 시작한다. 거기다, 빅데이터 분석기사라는 과목이, 통계 + IT + AI 등 생소한 과목들이 짬뽕되어 있다보니, 참고서의 내용으로는 이를 이해하는데 너무나 한계가 뚜렷하게 보인다. 글을 읽기는 하는데 이해가 안되어 구글링으로 추가적인 자료를 찾는 시간이 점차 증가한다.

 

그래도 꾸역꾸역 자는 시간이라도 줄여가며 진도를 맞춰보려 했지만... 자는 시간이 줄어들면서 피로가 쌓이고 점점 악순환의 사이클로 빠져든다(하루 평균 3~5시간 내외로 잤던 것 같다). 결국, 시험 이틀을 앞두고 전체도 아닌 3과목까지 단 1회독 하는 것으로 마무리되었다. 별 수 없이, 시험 하루 전인 금요일에 피로를 핑계로 연차를 하루 쓰고 열공모드로 돌입했다. 다행히 4과목은 앞선 3과목만큼 난이도가 있는 부분은 아니라, 나름 빠르게 1회독은 할 수 있었다만... 시험 문제가 어떻게 나올지도 모르고, 개념마저 완전히 정리된 것이 아니라 준비되지 않은 상태로 시험장에 들어가게 되었다.

 

 

3. 시험 당일 후기

 

마치 바퀴 터진 타이어로 목적지까지 가는 자동차처럼 시험 준비를 한 뒤, 4월 17일. 시험장에 입실하게 되었다. 시험장의 분위기는 다른 기사 자격증이나, 토익 시험장과 별반 다를 것 없는 분위기다. 일찍 도착한 응시자들은 각자의 참고서나 정리된 노트를 보며 시험 준비를 하고 있었다. 필자도 시험 준비가 완벽하게 된 것이 아닌 탓에, 조금 일찍 도착해서 시험 준비 및 다시 확인해야 하는 개념을 찾아 스캐닝했다.

 

시험 입실 시간이 지났음에도 필자가 있는 고사장 외의 타 고사장도 빈 자리가 상당히 많았다. 분명 응시자 목록에는 저 빈자리들도 응시자들로 가득 차 있어야 함에도 말이다. 첫 시험이라 은근히 결시자가 많다는 느낌이었다. 분명 지하철 타고 올때만 해도 지하철 안에서 자격증 책 보고 있던 사람이 적지 않았는데도 말이다.

 

시험 시작을 30분 앞두고, 모든 참고서와 소지품을 정리하라는 방송을 시작으로 시험 준비가 시작된다. 30분 동안 하는 일은 크게 없다. 신분증 확인하고, OMR 나눠주고 작성하고, 시험지 파본 확인하고 기다리는 것이 전부다. 시험 파본을 확인하면서 얼핏얼핏 문제를 봤는데, 개념적인 문제가 주를 이루고, 그 외에 계산 문제들이 간간히 보이는 듯 했다.

 

'어?? 이거 잘 하면 통과할 수는 있겠는데?' 라는 근거없는 자신감과 함께 시험이 시작되기를 기다린다.

 

그리고 시험 시작을 알리는 방송과 함께 시험지 첫 장을 넘겼다. 

 

 

[ 제 1과목 - 빅데이터 분석기획 ]

 

아마도 전체 4 과목 중 가장 정답을 많이 맞춘 과목이 아닌가 싶다. 시험 시간 두 시간 중, 제 1과목은 꼼꼼히 푼다고 풀었음에도 20분도 채 지나있지 않았다.

 

우선 필자가 IT 계열에서 분석관련 솔루션으로 업무를 진행하다보니, 이 과목에 대한 이해도가 그나마 수월하기도 했고(유일하게 계획대로 끝낸 과목이다), 대부분의 문제가 개념 위주였기 때문이다. 다행스럽게도 시중의 참고서에 나오는 대부분의 내용이 시험에 그대로 적용되어 나왔는데, 그 중 몇몇 문제는 정답을 고르기에 애매모호한 문제들도 있었다(필자가 공부를 제대로 못해서 그렇다).

 

시험 문제에서 가장 기억나는 문제 중 하나는 빅데이터 관련 개인정보보호 법률이었는데, "어떤 경우에 개인정보 소유자에게 개인정보의 사용 여부를 알려도 되지 않는지?"에 대한 문제가 있었다. 답으로 선택했던 번호의 지문은 정확히 기억나지 않는데, 그 답을 찍은 근거는, 정보통신망 촉진법에서 개인정보 사용 시 통보하지 않아도 되는 내용으로 "정보통신업무에 반드시 필요한 업무인 경우, 사후 통보가 가능하다"를 규정하고 있다는 것이다.

 

그 외에는 개념적인 부분이 많아서 사실 큰 어려움은 없었다. 분석 기획 중 모델 설계 방식 4가지 중 설명이 잘못 된 것을 고르라는 문제라던가, 빅데이터 분석 조직 구성 종류 및 잘못된 설명에 대해 고르라는 문제, 또는 개인정보보호 관련 K-익명성, L-다양성, T-근접성에 대한 개념 및 비식별화 방법 등등, 참고서만 잘 읽어보았다면 쉽게 풀 수 있는 문제가 대부분이었다.참고서에서 없던 내용이 몇몇 문제로 나온 것을 찍었지만 말이다.

 

확실히 정답을 특정하지 못한 문제가 4문제인데, 오차까지 감안하면 70~80 정도 획득할 수 있을 것이라 판단했다. 물론 이건 필자의 뇌피셜이다.

 

 

[ 제 2과목 - 빅데이터 탐색 ]

 

빅데이터 탐색 과목은 데이터 전처리, 탐색 및 통계 관련 문제가 나오는 과목이다. 처음 두 문제는 잘 풀어 나갔는데, 그 다음부터 연속으로 문제의 답을 고르기가 상당히 애매해진다(역시나 공부를 제대로 못해서 그렇다). 아리송한 상태에서 다음 장으로 문제를 넘기니 꽤나 긴 지문이 나오는데, 통계 관련 계산 문제가 연달아 나온다. 이야... 이거 계산도 어떻게 하는지 아리까리한데 큰일났네??

 

필자가 시험장 맨 뒷자리였는데, 대략 시험시작 40분쯤 되니 팬을 내려놓고 멍하니 있는 사람이 늘어난게 보인다. 역시.... 나만 어려운게 아니었어. 다시 시험 문제를 천천히 읽어보며 개념 문제는 최대한 정답이 아닌 것을 배제하고 나름 정리한 개념으로 답을 유추하기를 시도해본다. 

 

우도, 클래스 불균형, 차원의 저주 등등 필자가 시간이 없어서 대충 넘긴 개념(우도... 이건 구글링하려다가 도저히 시간이 안되어 넘어간 내용이다)과 처음 보는 용어(저런 내용이 있었나..? 라고 생각했는데 필자가 지금 확인해보니 클래스 불균형은 참고서에 버젓이 작성되어 있다...젠장.)로 인해 막힌 문제는 우선 Skip. 최대한 풀 수 있는 개념 문제를 먼저 푼다.

 

확률분포의 종류 중 성질이 다른 하나를 고르라는 문제(하나가 이산확률분포에 속하는 것으로 기억한다)와, 상자그림에서 알 수 없는 내용은 무엇인지에 대한 문제, 탐색적 데이터에 해당하지 않는 것은 무엇인지에 대한 문제가 그나마 개념적으로 쉽게 풀 수 있던 문제였다. 그럼에도 불구하고 정답을 특정하지 못한 문제가 너무 많다. 더 이상 시간을 지체하다가는 계산 문제 풀 시간이 안 날 듯 해서, 계산 문제로 넘어간다. 

 

계산 문제 중 특이하게도 필자가 베이즈 정리와 관련하여 구글링 중 찾았던 문제와 매우 유사한(정확히 일치하는지까지는 모르겠다) 문제가 나왔다.

 

"A, B, C 공장에서 동일한 부품을 각각 50%, 30%, 20% 생산하며, 각 공장의 부품 불량률은 각각 x, y, z%이다. 불량품을 하나 골랐을 때, 이 부품이 A 공장에서 생성되었을 확률은?"

 

배반 사건으로만 구성되어 있으므로 배이즈 정리로 풀 수 있는 문제로 알고 있는데, 그딴 공식 다 기억이 나지 않아 직접 필자가 맷돌을 굴려 답을 구했다(아마 그 계산 방식이 공식과 일치할텐데, 필자가 조금 더 풀어서 계산했을 것이다). 다행히도 딱 떨어지는 값이 나와서 정답으로 찍고 다음 문제로 넘어간다. 

 

정규분포 관련 문제도 나왔다. 필자가 현재 나름대로 가지고 있는 희미한 기억에 의하면, 표준 정규분포가 일부 표본의 평균 키와 표본 분산을 사용했을 때 신뢰구간 95% 이내에 들어오는 키의 범위가 어떻게 되는가에 대한 문제였고, t-분포를 이용한 문제는 일부 표본의 키 평균이 x cm 일때, 전체 평균이 y cm 보다 큰지 작은지를 판단하라는 문제였던 것으로 기억한다. 천만 다행히도 이 문제들도 계산 결과가 딱 떨어지는 값이 나와서 큰 문제없이 넘어갈 수 있었다. 안 그랬다면 필자는 뒷 과목 문제를 못 풀었을 것이다.

 

변동 계수 문제도 나왔다. 그나마 쉬운 계산 문제였는데, 키와 몸무게 평균, 분산이 주어지고, 키가 몸무게보다 변동의 폭이 큰지 아닌지를 고르면 되는 문제였다.  

 

나름 문제를 많이 푼다고 풀었는데, 정확히 정답을 특정하지 못한 문제가 8문제나 된다. 아 tq.... 다음 과목은 더 자신 없는데...라는 생각을 하는 순간, 시험장 퇴실이 가능한 시간이 되었고, 필자가 있던 고사실에는 필자 포함 6명만 남고 다 퇴실하는 진풍경이 벌어졌다(해당 고사실의 시험 응시 인원이 15명 내외는 되었다).

 

대략 50~60점 정도 획득하지 않았을까 싶다. 이것도 최대한 긍정적으로(정신승리하며..) 판단한 값이다.

 

 

 

[ 제 3과목 - 빅데이터 모델링 ]

 

제 2과목과 별반 다르지 않다. 나름 문제를 푼다고 풀었음에도 필자가 20대 이후로 치른 필기 시험 역사상 최초로 절반 이상 정답을 확신하지 못한 상황이 발생했다. 어쩌면 반타작이 어려운 점수가 나올 수도 있다는 계산까지...

 

 

 

 

 

 

앞의 두 과목과 동일하게 일부 개념 관련 문제가 참고서에 포함되어 있었기는 하다. 의사결정나무의 알고리즘 종류와 종류에 따라 사용하는 통계량이 무엇이 있는지(CART, CHAID, C4.5/5.0), 부트 스트래핑, 활성 함수 등에 대한 내용도 문제 일부로 출제되었다.

 

나름 계산이 필요한 문제는 베이즈 정리(제 2과목에 나왔던 것과 동일한 개념인데, 계산 결과가 더 이론적으로 나온다), 그리고 CNN(합성곱 신경망)에서 5X5 입력 데이터를 3X3 필터, stride 1로 처리할 때 결과 데이터의 크기가 어떻게 나오는지에 대한 문제가 있었다. CNN 문제도 공식이 있긴 하나, 그 공식이 정확히 암기된 내용이 아니라 그냥 냅다 그림 그리면서 풀었다(개념만 알면 어려운 문제는 아니다).

 

서포트 백터 머신과 회귀, 군집 분석에 대한 내용도 그래프 문제로 주어졌는데(회귀분석 문제는 그래프였는지 조금 헷갈린다)... 음... 다음에 필기 시험 다시 보게 되면 공부 열심히 해야겠다.

 

정답을 특정하지 못한 문제가 10문제다. 오차까지 감안하면 취득 가능한 점수가 40~50으로 판단되는데, 진짜 운이 나쁘면 과락에 걸려서 떨어질 수도 있겠다는 생각이 든다.

 

 

[ 제 4과목 - 빅데이터 결과 해석 ]

 

마지막 과목. 서두에 언급했듯이 단 8시간 공부하고 보는 과목이다. 아무래도 시각화와 관련된 내용이 많아 다른 과목보다는 쉽긴 했으나, 8시간 공부하고 들어간 탓에 개념 정리가 안되어 햇갈리는 문제가 상당했다(이건 필자가 공부를 '안'한게 맞다).

 

앞으로도 주요 단골로 나올 듯 한 문제는 오차행렬(혼동행렬)관련 내용인데, 정확도, 정밀도, 재현도, F1 Score, 특이도 등은 문제 내기가 워낙 좋은 유형이라 추후 시험에서도 꾸준히 나타나지 않을까 예상해본다. 필자도 이 부분을 되도록 많이 기억하려고 했으나, 앞선 두 과목에서 맨붕이 와서 기억하고 있던 내용이 정확한지 혼동이 오기도 했다. 처음에는 Type I과 Type II 에러의 위치를 바꿔서 계산하기도 하고...

 

개념 문제로는 교차 검증(K-Fold 관련)문제나 과대적합, 매개변수 최적화, 데이터 시각화와 관련된 문제가 나왔던 것으로 기억한다. 이는 필자가 참고한 참고서에도 기술된 내용이긴 하다.

 

그 외에는 대부분이 그래프나 그림이 주어지고 해당 내용에 대해 옳은, 옳지 않은 내용을 고른다던가, 특정 분석 상황에 대해 어떤 시각화 자료를 이용할 것인지 고르는 문제가 많이 나왔던 것으로 기억한다. 예를 들면, "학생들의 교복 제작을 위해 호수에 따른 수치를 지정하려고 하며, 학생들의 신체 측정 지표를 분석하여 이를 판단할 때 어떤 분석 방법을 사용해야 하는지?"에 대한 문제가 나왔다.

 

필자는 이 부분을 준비하면서 시각화 자료와 종류, 특성을 중점적으로 암기했는데, 천만 다행으로 해당 과목이 그래프나 그림부분으로 많이 나와 그나마 정답을 많이 선택할 수 있었던 듯 하다. 정답으로 특정하지 못한 문제가 8문제이며 대략 40~60점 정도 취득이 가능하지 않을까 예상하고 있다.

 

 

** 예상 획득 총점      : 200점 ~ 250점 (정답을 특정하지 못한 문제는 찍어서 맞출 수도 있겠지만 우선 제외했다)

** 예상 획득 평균점수: 50.0점 ~ 62.5점

-> 이것도 가설 검증해볼수 있을까? 평균이 60점을 넘을 것인지 신뢰도 99%로 계산하시오.

 

 

 

4. 빅데이터 분석기사... 어떻게 공부해야 할까?

 

(1) 가장 좋은 학습 방법이 무엇일까?

 

이건 확신할 수 있다. 시중의 참고서만 달달 외워서는 절대 안된다. 기출문제가 없는 현재 상황을 고려할 때, 이 자격증은 기본 개념을 중심으로 가지를 뻗어나가는 방식으로 학습하는 것이 가장 좋을 듯 하다. 참고서 하나에 들어가 있는 개념을 이해하려고 노력하되, 그 개념이 이해가 안되거나 파생되는 개념이 존재할 경우, 구글링을 해서라도 개념을 정확히 익히고 학습 범위를 늘려가는 것이 중요할 것이라는 말이다.

 

필자가 개념적인 부분에서 은근히 풀지 못한 문제가 많아서 그런 것일수도 있는데, 이렇게 구글링으로 생성한 가지의 깊이가 깊었다면 '결과가 조금 더 좋게 나오지 않았을까'라는 생각 때문이다. 왜냐하면 기출문제가 전무해서 참고서로는 모든 내용을 커버하기 힘들기도 하고, 거의 70~80%의 문제가 개념과 관련된 내용이 많기 때문이다. 물론 이것도 시험 차수가 지나면 조금씩 변화되긴 하겠지만.

 

개념적인 부분 외에도 계산적인 문제 역시 이 방식이 도움이 많이 된다. 계산 방식에 대해 원리를 조금 더 빠르게 습득할 수 있다고 해야할까? 필자의 실제 예시 하나를 들어보자. 

 

필자가 빅데이터 모델링 과목을 하면서 CNN(합성곱 신경망)이라는 개념을 접하게 되었다. 도대체 합성곱 신경망이 뭘까? 합성곱 신경망은 영상이나 음성 데이터 등 크기가 큰 데이터를 잘게 쪼개어 분석하는 방법이다(간략하게만 설명한다). 사용 용도는 CCTV화면에서 미세먼저 수치를 계산한다던가, 여러 피사체가 있는 사진 중 자동차만 정확히 구분한다던가 라는 등의 용도에 사용할 수 있다. 

 

여기서 더 나가면 데이터를 잘게 쪼개주는 Filter라는 용어를 접하게 된다. 이 필터를 이용해 합성곱 연산을 진행하여 데이터 크기를 줄인다. 그럼 합성곱 연산은 무엇이며 어떻게 하는가?

 

A 행렬 : (1 2, 3 4) -> 2 by 2 행렬이다.

B 행렬  :(3, 2, 4, 3) -> 2 by 2 행렬이다.

A 행렬과 B 행렬의 합성곱은 각 행렬의 동일한 위치에 존재하는 값을 곱한 합이다.

 

 

 

 

 

 

그럼, 합성곱을 사용해 입력 데이터의 크기를 줄이는 방법이 이해가 된다.

 

예를 들어, 3X3의 입력 데이터가 있고, 2X2 Filter가 있다면, 이들의 합성 곱 결과로 나타나는 행렬은 2X2의 크기를 가지게 된다. 4x4 입력 데이터를 사용하면 결과는 3X3크기의 행렬이 나타나게 되고 말이다.

 

 

 

 

 

 

위의 내용는 실제 필기 시험에 나왔던 문제 유형과 동일하다. 여기서 더 나가면 Stride와 Padding에 대한 개념 등도 추가된다(왜 사용하는지에 대해서도 알아놓으면 학습에 확실히 도움은 된다).

 

 

(2) 학습의 에러사항

 

현재의 대부분 기사 시험이 하나의 전공에 대한 지식을 검증하는 시험이 많은데 비해, 빅데이터 분석 기사는 여러 과목이 짬뽕되어 있는 형태다. 가장 기본적으로 분석에 필요한 통계가 있고, 이를 분석하기 위한 기획단계에서 모델 설계 방식이나 저장 매체 활용과 관련된 내용은 IT와 관련된 내용이 추가된다. 마지막으로 빅데이터 모델링과 관련된 기술은 IT와 별개인 AI 분야로 본다면, 3과목에 대한 내용을 한 번에 준비해야한다.

 

전공 하나도 버거운데 3과목을 동시에 진행해야 해야하며, 추가로 기출문제마저 없으니 학습해야하는 범위가 무한정 늘어날수 밖에 없는 구조다. 아마 시험 회차가 어느 정도 올라가면 기출문제를 참고하여 범위를 조절할 수 있긴 하겠지만...지금 당장은 최대한 정립할 수 있는 개념은 다 정립하는 것이 빅데이터 분석기사 필기시험을 통과하기 위한 가장 좋은 방법일 듯 하다.

 

방대한 학습 범위에 비해, 시중 참고서 서적 역시, 상세 내용을 다루는 책이 많지 않다. 가장 두꺼운 책은 필자가 3월 초에 직접 확인했을때 약 600 페이지 가량인 서적이 있긴 했는데, 아마 이 책 역시 학습 범위를 전부 커버하지는 못했을 듯 하다. 따라서 기출문제가 어느정도 유출되기 전까지는 구글의 검색 기능을 최대한 많이 활용하는것이 좋을 것이라 생각한다.

 

 

(3) 인터넷 후기 여론

 

-

글을 작성하는 도중에 필자와 동일한 시험을 치뤘던 사람들의 후기를 보다보니, 첫 시험이라 필자처럼 준비가 어려웠다는 글이 상당히 많았다. 또한 빅데이터 분석기사와 유사한 시험이라고 여겨지던 ADsP의 참고서로 진행했던 분들은, 완전히 다른 유형의 시험문제로 인해 죽을 쒔다는 내용도 볼 수 있었다. 아무래도 첫 시행 시험이다보니 어떤 참고서로 공부를 했다고 한들, 거의 다 비슷한 어려움을 가지고 있을 것이라 생각한다. 전반적으로 시험 문제를 받고 당황했다는 후기가 굉장히 많다.

 

-

데이터 분석 분야로 발을 담그고 있으신 듯한 분들도 후기를 올린 글을 볼 수 있었는데, 시험 문제의 방향성이 빅데이터 분석보다 통계쪽으로 많이 치우친 듯 하다는 의견도 종종 보이고(그래서 ADsP 참고서를 보셨던 분들이...), 개념적인 문제가 많이 나와서 실제 난이도가 그렇게 높지 않다는 글도 보인다.

 

-

필자는 시험문제에서 오타나 복수 정답을 고르라는 문항을 보지 못했는데, 해당 회차 시험에서 오타와 복수정답 관련 내용으로 말이 많다(필자는 시험 끝나고 바로 코드짜러 가야되었기에 이제야 이 내용을 알게되었다.). 국가고시임에도 검수가 제대로 되지 않았다거나, 복수정답 관련 내용은 시험자에게 공지를 해야하지 않냐는 불만도 보인다.

 

 

 

5. 마무리

 

시험일이 2주나 지났음에도 지금에서야 포스팅을 올리는 것은... 필자의 업무가 너무 바빠져서 그렇다. 최대한 빨리 올려야 그나마 남아있는 기억으로 글을 쓰는데, 필자가 주력으로 작성하는 포스팅도 못올리는 마당이다보니 지금에서라도 후기를 올리는 것이 다행이라는 생각이 들 뿐이다. 

 

필기 시험 결과는 정확히 다음주 금요일에 발표된다. 다른 자격증 시험 포스팅과 마찬가지로, 합불 관계없이 결과가 나오는대로 추가 포스팅을 진행할 예정이다. 아무래도 이번에는 떨어질 확률이 많이 높아서 포스팅하기에 조금 창피하긴 한데... 첫 시행 시험에 참여했다는 디스어드벤티지가 있으니 감안하고 포스팅하려고 한다.

 

필기가 운이 좋게 통과된다면 실기 준비를 해야하는데, 필자는 6월 말에 회사에서 보라는 자격증 시험이 있어서 바로 실기 시험을 준비하기는 어렵다. 아마 잘해야 다음 회차나 내년 첫 회차에 실기를 치르게 되지 않을까 생각한다. 아무래도 그때쯤이면 문제 유형도 조금 정형화되었을테니 조금 더 수월하기도 할 것 같고 말이다.

 

마지막으로... 가뜩이나 부족한 빅데이터 분석기사 필기 시험 정보로 인해 여기까지 오신 분들에게 이 포스팅이 도움이 되었을지 모르겠다. 사실 필자가 시험 직후에도 기억나는 문제가 많지 않은 탓에, 기출문제 관련해서 일부는 잘못된 정보가 포스팅되어 있을 가능성도 있고, 필자도 시험을 정신없이 치른데다 바쁜 와중에 글을 쓴 것이라 글 자체도 정제되지가 않은 부분이 많다. 시험 관련 정보를 얻기위해 방문하신 분들은 본 글을 참고 용도로만 확인해주시면 될 듯 하다.

 

 

 

 

< 2021년 05월 07일 추가 포스팅 >

 

 

비관적이었던 예상과 달리, 합격했다!!!!!!!!!!!!!!!!!!!!!!

 

 

 

 

 

 

 

 

원래 제 3과목은 반타작이 예상되었는데, 의외로 점수가 잘 나왔다. 다행스럽게도 40~50점 정도로 예상한 제 3, 4과목에서 점수가 잘 나와 통과가 되지 않았나 싶다.

 

 

 

 

Fin.

 

반응형

댓글