'믿:음'은 간단한 영역, GPT 개량 모델은 복잡한 영역 활용 전망
과기정통부 '독자 AI 파운데이션 모델 프로젝트' 참여 의사
KT 믿음 [KT 제공. 재판매 및 DB 금지]
(서울=연합뉴스) 조현영 기자 = 정부가 추진하는 소버린 인공지능(국가주권형 AI) 기조에 맞춰 KT가 자체 개발 AI 모델 '믿:음'에 역량을 투입하고 있다.
지난해 파트너십을 체결한 마이크로소프트(MS)와 개발 중인 GPT-4 한국 특화 모델과 함께 주권과 수익성 두 마리 토끼를 잡을 수 있을지 주목된다.
3일 KT는 취재진 대상 온라인 브리핑에서 자체 개발한 거대 언어모델(LLM) '믿:음 2.0'의 오픈소스를 인공지능(AI) 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 공개할 예정이라고 밝혔다.
기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방되는 플랫폼에 믿:음 2.0을 공개함으로써 대중화를 꾀하기 위함이다.
믿:음은 KT가 자체 개발한 한국적 독자 AI 모델이다.
한국적 AI는 한국의 사회적 맥락 같은 무형 요소와 한국어 고유의 언어적·문화적 특성을 학습시켜, 한국 상황에 가장 잘 맞게 개량된 AI를 의미한다.
지난 2023년 믿:음 1.0 버전을 출시한 이후 약 2년 만에 개량 모델을 공개한 배경에는 새 정부가 추진하는 소버린 AI 전략이 작용한 것으로 보인다.
KT 생성형 AI 랩장(CAIO) 신동훈 상무는 "기간 통신 사업자로서 생성형 AI 원천 기술을 반드시 확보해야 한다는 믿음으로 믿:음 모델을 고도화했다"며 "정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에 참여하려고 준비 중"이라고 말했다.
2.0 모델은 115억 파라미터 규모의 '믿:음 2.0 베이스(Base)', 23억 파라미터 규모 '믿:음 2.0 미니(Mini)' 2종으로 출시되며 한국어와 영어를 지원한다. 향후 고성능 '프로' 모델도 출시 예정이다.
베이스 모델은 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반 질의응답에서 강력한 성능을 보였다고 KT는 설명했다.
미니 모델은 베이스 모델에서 압축한 지식을 학습한 소형 모델이다.
KT는 국내 교육용 도서와 문학 작품 등 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다.
이 밖에 한국어의 구조와 언어학적 특성을 반영한 토크나이저(텍스트를 모델이 이해할 수 있는 작은 단위인 토큰으로 분리하는 도구)를 자체 개발하는 등 KT는 한국 사회 고유의 언어와 문화적 맥락을 정교하게 반영할 수 있도록 AI를 학습시켰다고 설명했다.
KT는 믿:음 2.0과 MS와 협력을 바탕으로 출시 예정인 GPT-4 한국 특화 모델을 바탕으로 기업의 AI 전환(AX)을 지원할 방침이다.
신 상무는 "믿음은 상대적으로 성능 면에서 (GPT 보다) 부족하지만 모든 작업에 GPT 같은 강력한 모델이 필요한 것은 아니"라면서 "고객 니즈와 목적에 따라 요약 등 간단한 영역에서는 믿:음을, 복잡한 영역에서는 GPT를 사용하는 방식으로 서비스를 준비 중이며 SI(시스템 통합) 사업으로 수익 창출이 가능할 것"이라고 말했다.
믿:음의 예상 활용 영역으로는 공공·금융을 꼽았다.
KT는 향후 교육이나 법률 영역까지 점차 사업 범위를 확장할 계획이다. 기업 소비자 간 거래(B2C) 서비스에 대해서도 내부 검토가 진행 중이다.
다만 GPT-4 한국 특화 모델의 출시 시점에 대해서는 특정하지 않았다.
신 상무는 "내부적으로 여러 테스트를 진행하면서 성능을 올리는 과정을 진행 중"이라고 설명했다.
이날 브리핑에서는 믿:음 2.0에 대한 성능 평가 결과도 공개됐다.
믿:음 2.0.은 타사 모델 대비 한국어 이해와 전문지식 분야에서는 성능 차이가 크지 않았지만, 사회·문화 측면에서는 A사(72.4점)보다 약 9점 높은 81.2점을 기록했다.
같은 날 오픈소스로 공개된 SK텔레콤의 한국어 특화 LLM A.X(에이닷 엑스) 4.0와 관련해서는 "에이닷 표준 모델은 720억 개(72B), 경량 모델은 70억 개(7B)의 매개변수를 가지고 있고 믿:음 미니는 11B로 에이닷이 7배 이상 더 큰 모델이라 직접 비교하는 것은 의미가 없다"면서 "다만 곧 출시될 믿:음 2.0 프로 모델이 그 수준을 상회하는 성능을 확보하고 있고 데이터 학습 측면에서 KT는 초기 단계부터, SK텔레콤은 외부 모델을 기반으로 했다는 점이 다르다"고 설명했다.
이날 KT는 국가에서 보유한 공공문서를 AI 학습에 적극적으로 활용할 수 있도록 규제를 풀어줄 것을 정부에 요청하기도 했다.
앞서 KT는 믿:음과 글로벌 기업들의 현존 최고 수준 모델(SOTA) 등을 두루 활용해 한국의 특수성을 반영한 AI 모델에 집중 투자한다고 밝힌 바 있다.
향후 사용자나 기업이 요구하는 다양한 요구사항에 대응하기 위해 외부 공개된 글로벌 기업의 퍼블릭 모델을 튜닝해서 제공하는 모델과 추론, 멀티모델도 순차적으로 공개할 예정이다.
오승필 KT 기술혁신부문장(CTO)은 "어떤 AI 모델 하나를 선택하면 다른 모델을 버리는 것이 아니라, 모든 AI 모델 라인업에 한국적 데이터를 넣어서 쓸수 있게 하는 것이 KT의 철학"이라고 밝혔다.
한편 KT는 국산 AI 생태계 구축을 위해 개발 과정에서 리벨리온 등 국내 신경망 처리장치(NPU) 기업과 협업했다.
hyun0@yna.co.kr
▶제보는 카톡 okjebo
Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.