과기정통부 ‘독자 AI 파운데이션 모델 프로젝트’ 속도
고품질 학습 데이터 확보 ‘관건’
[이데일리 김현아 기자]대한민국의 AI 기술 주권 확보와 생태계 강화를 목표로 추진되는 ‘독자 AI 파운데이션 모델 개발 프로젝트’가 열기를 더하는 가운데, 비큐AI 등 주요 업체들이 ‘데이터 공급기관’으로 참여해 업계 이목이 집중되고 있다.
과학기술정보통신부는 21일 독자 AI 파운데이션 모델 개발 프로젝트 공모 접수를 마감했으며, 총 15개 팀이 제안서를 제출했다.
이번 프로젝트에는 네이버클라우드, LG AI연구원, SKT, KT, 카카오, 업스테이지, 루닛, 코난테크놀로지, 한국과학기술원 등 국내 AI 분야를 선도하는 주요 기업과 연구기관들이 대거 참여하며 한국형 AI 파운데이션 모델 개발에 대한 기대감을 높이고 있다.
과기정통부는 서류 검토, 서면·발표 평가, 사업비 심의 등의 절차를 거쳐 다음 달 최종 정예팀을 선정할 계획이다.
선정된 기업에는 AI 모델 개발에 필수적인 GPU, 학습 및 서비스용 데이터, 유수 인재 등 정부의 전폭적인 지원이 뒤따른다. 정부는 2027년까지 단계적인 평가를 통해 최종적으로 95% 이상의 성능을 확보한 1~2개의 모델을 국가대표 AI 모델로 선발한다는 목표를 세웠다.
[이데일리 문승용 기자]
고품질 뉴스 데이터 강점 ‘비큐AI’, AI 모델 성능 좌우
전문가들은 글로벌 시장에서 경쟁력을 갖춘 독자적인 AI 모델을 확보하기 위해 학습용 데이터의 저작권 이슈를 해소하고, 분야별 양질의 데이터를 안정적으로 공급하는 것이 무엇보다 중요하다고 분석한다.
과기정통부는 뉴스, 도서, 논문, 교과서 등을 주요 학습 데이터로 선정했는데, 특히 뉴스는 높은 언어 품질과 사실 기반의 다양한 정보를 제공하며 시의성이 높아 AI 모델 학습에 매우 가치가 높다는 평가다.
이러한 배경 속에서 비큐AI는 이번 프로젝트의 학습 및 서비스용 데이터 공급 부문에서 핵심적인 주목을 받고 있다. 비큐AI가 지원 명단에 포함된 것은 방대한 뉴스 데이터와 추론용 데이터, 다양한 분류 데이터 등 이미 정제 및 가공이 완료된 고품질 데이터를 보유하고 있기 때문이다. 이 데이터는 AI 모델 성능 확보 및 서비스 제공에 필수적인 요소로, 향후 국가대표 AI 모델의 발전에 크게 기여할 것으로 기대된다.
과기정통부는 데이터 공급기관들을 면밀히 검토해 최종 선정된 AI 파운데이션 모델 개발 기업이 필요로 하는 데이터를 매칭하는 후속 절차를 진행할 예정이다.
앞서 과기정통부는 독자 AI 파운데이션 모델 프로젝트에 학습 및 서비스용 데이터를 공급할 데이터 공급기관을 별도로 모집한 바 있다.
김현아 (chaos@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.