본문으로 바로가기

Publications

Diagnosis and Evaluation of Data Science Capabilities - Focusing on personal self-diagnosis model (Korean)
Diagnosis and Evaluation of Data Science Capabilities - Focusing on personal self-diagnosis model (Korean) 정성원 ․ 박혜선  2019-12-01 
google-plus

이제 빅데이터는 모든 산업의 모든 비즈니스 영역에 영향을 미치며 생산성 향상의 매우 중요한 요소가 되었다. 하지만 빅데이터를 도입하려는 기업과 기관은 전문인력의 부족을 호소하고 있다. 데이터를 분석하여 활용가능한 형태의 Insight로 가공하는 역할을 담당하는 데이터분석가와 데이터과학자의 부족은 심각한 수준에 이르고 있다. 특히 데이터과학자는 제4차산업혁명을 리드하는 핵심인력이라고 할 수 있는데, 부족한 데이터과학자를 양성하기 위하여 국내에서도 여러 대학에 관련 학위과정이 생겨나고 있다. 다양한 스킬과 역량을 갖추어야 하는 데이터과학자의 특성상 양적인 육성도 중요하지만 질적인 육성이 더 중요하다고 하겠다. 올바른 인력육성을 위해서는 무엇보다 역량의 효과적인 진단과 평가가 선행되어야 한다. 진단과 평가를 통해서 어떤 역량이 충분하고 어떤 역량이 부족한지 파악하면 개별 인력에 특화된 교육/육성 프로그램의 적용이 가능하여 더욱 효율적으로 인력양성을 할 수 있다.   

 

데이터 활용역량 측정모델을 개발하는 데는 큰 노력과 시간이 소요되므로 웹을 통해서 간편하게 데이터 활용역량을 자가진단하는 모델을 개발하는 것은 매우 큰 의미가 있다고 하겠다. 본 데이터 활용역량 개인 자가진단 모델의 개발과정을 설명하면, 먼저 국.내외 학술지, 간행물 및 기고문 조사를 통해 데이터 활용역량을 진단하는 298개 항목을 도출하였고 이를 전문가집단의 검토를 거쳐서 계층형구조의 36개 진단항목을 구성하였다. 최상위 역량은 IT역량, 분석역량, 도메인지식, 공통역량 등의 4가지 역량으로 구성하였는데,  IT역량은 데이터 수집 및 전처리를 거쳐 개발에 이르는 과정을 수행할 수 있는 역량으로 정의하였으며, 분석역량은 분석기법에 대한 이론 이해를 바탕으로 데이터를 분석하고 해석할 수 있는 역량이며, 도메인 지식은 데이터분석을 활용하는 산업에서 가치창출을 위해 요구되는 전문적 지식을 의미한다. 또한 공통역량은 문서작성 능력, 프리젠테이션 능력, 커뮤니케이션 능력, 기획/관리능력과 같은 공통적 자질을 의미한다. 개발된 데이터 활용역량 개인 자가진단  모델은 웹페이지를 통해 간편하게 응답하도록 하였다. 국내 데이터직무에 종사하는 직장인 및 프리랜서 353명을 대상으로 시범 적용한 결과, 개인차는 존재하지만, 전반적으로 공통역량은 다소 높은 점수분포를 이루는 데 반해서 IT역량, 분석역량 및 도메인지식은 상대적으로 다소 낮은 점수분포를 이루었다. 따라서 데이터과학자를 양성하는데 융합적인 역량 및 지식이 습득되도록 균형있는 인력양성 프로그램을 적용하는 것이 매우 중요함을 알 수 있었다. 개인별로 데이터 활용역량의 세부항목에 차이를 나타내므로 이를 고려하여 개별적 역량을 진단해주고 균형 있는 데이터 활용역량이 육성되도록 코치하여야 한다. 

 

글로벌선진국은 이미 데이터과학자의 가치를 인정하고 이들이 산업 전반에 걸쳐서 폭넓게 필요하다고 인식하고 있다. 미국은 2018년경에 데이터과학자가 약 14~19만 명 정도 부족하다고 보고하였으며, 일본은 2020년까지 약 4만 8천명의 데이터과학자가 더 필요하다고 예상하였다. 한국은 향후 5년내에 약 575명의 데이터과학자가 부족하다고 전망하였다. 국내 데이터과학자 육성은 이제 걸음마 단계이므로 정부차원에서 체계적이고 장기적인 인력양성 계획의 수립과 실행이 무엇보다 시급하다고 하겠다.