경북도는 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 추진하는 2021년도 인공지능 학습용 데이터 구축 지원사업에 `옛한글 문자인식(OCR) 데이터셋 구축사업`이 신규 대상사업으로 선정돼 국비 19억원을 확보했다.  이번 국비 확보는 지난 3월 12일부터 4월 16일까지 공고 기간 중 한국지능정보사회진흥원(NIA)에 접수된 84개 분야 사업을 대상으로 사업계획서, 프레젠테이션 발표, 질의응답 등의 평가 과정을 거쳐 지난 24일 최종 확정 됐다.  선정된 `옛한글 문자인식(OCR) 데이터셋 구축사업`은 올 연말까지 총 21억원(국비 19억원, 도비 2억원)을 투입하게 되며 경북 도내 1000만 이상의 옛한글 자료를 학습시켜 획, 크기, 형태가 모두 다른 옛한글을 식별해낼 수 있는 AI(인공지능)학습용 데이터를 구축하는 사업으로 경북의 새로운 문화콘텐츠 산업을 선도하고 청년 일자리를 창출하게 된다.  이번 사업은 경북도와 안동대학교를 거점으로 포스텍, 한국국학진흥원, ㈜인플랫 5개 기관이 컨소시엄을 구성해 옛한글 문자인식(OCR) 데이터셋을 구축하게 되며 기관별 역할에 따라 △경북도는 사업진행 전반을 관리하며 △안동대학교는 총괄 품질관리 및 검수, 다양한 옛 한글 이미지 분석을 △포스텍은 원천데이터 의미태깅 도구 개발과 딥러닝 기반 기술 개발을 담당하고 △국학진흥원은 옛한글 자료 수집과 제공을 △㈜인플랫은 옛한글 이미지와 텍스트 구축과 원시 데이터 정제도구를 개발하게 된다. 경북도는 `옛한글 문자인식(OCR) 데이터셋 구축사업`을 통해 계속해서 발굴되고 있는 전국 최대 한글 고서적 자료를 체계적으로 재정리하는 계기를 마련했다. 장영우 기자ycyw57@naver.com
주메뉴 바로가기 본문 바로가기