로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
'얼짱' 유혜주, "둘째가 찾아왔어요" 깜짝 공개
N
[연예뉴스]
'30㎏ 감량' 홍윤화 "족발은 大자만 시킨다" 뚱보만 아는 꿀팁? 뭐길래
N
[연예뉴스]
'동상이몽2' 신기루, 김민경에게 "너는 뼈말라" 단호
N
[실시간뉴스]
프랑스·이탈리아, EU·남미공동시장 FTA 표결 연기 희망(종합)
N
[연예뉴스]
'같이 삽시다' 22일 종영…박원숙 "그동안 감사" 눈물
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[연예뉴스]수능문제 줬더니, 제미나이 92점 국내AI 20점대
온카뱅크관리자
조회:
11
2025-12-16 01:13:39
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="f4A1sqIkWQ"> <p contents-hash="9c6b1e5b4cc7cb3e3ab9165adc3703f3f363b3bdb6648f5a1fd3bd920ff9e4e0" dmcf-pid="48ctOBCEhP" dmcf-ptype="general">국내 기업들이 개발한 인공지능(AI) 모델들에 수학능력시험(수능) 문제 등을 풀게 한 결과 해외 AI에 비해 크게 낮은 점수를 받은 것으로 나타났다. 국내 AI 업계는 모델의 용도 차이에 따른 결과라는 입장이다. </p> <p contents-hash="dd7e08a13fef5be40ed24dd9f6d9c50d852e86432ee68a036354406ea6c07424" dmcf-pid="86kFIbhDT6" dmcf-ptype="general">15일 김종락 서강대 수학과 교수 연구팀은 ‘국가대표 AI’ 도전 모델 5개의 성능 평가 결과를 공개했다. 평가 대상은 네이버, NC AI, LG AI연구원, SKT, 업스테이지 등 과학기술정보통신부(과기정통부)의 독자 AI 파운데이션 모델 프로젝트에 참여하고 있는 5개 국내 기업의 AI 모델과 오픈AI, 구글, 딥시크 등 해외 AI 기업의 최신 모델 5개다. 연구팀은 수능 수학의 네 분야(공통과목, 확률과 통계, 미적분, 기하)에서 가장 난도가 높은 문제 5개씩 20문제, 국내 논술·인도 대학 입시 10문제씩, 일본 도쿄대 공과대학 대학원 입시 10문제 등 총 50개 문제를 선별해 AI에 풀게 했다. </p> <p contents-hash="159602f9d16d07f3c4613dcf770a564802215465f557c944f084ff5b7c276199" dmcf-pid="6PE3CKlwv8" dmcf-ptype="general">평가 결과 5개 해외 AI 모델은 전부 70% 이상 정답률을 기록했다. 특히 구글의 최신 모델 ‘제미나이 3 프로’는 50문항 중 46문제를 맞혀 92% 정답률을 보였다. 앤스로픽의 클로드가 84%, xAI의 그록이 82% 정답률로 뒤를 이었다. 반면에 국내 AI 기업의 모델들은 이들과 비교해 정답률이 확연히 떨어졌다. 업스테이지의 ‘솔라 프로 2’(58%)를 제외하고는 대부분 20%대 정답률을 보였다. 연구팀이 수학올림피아드, 대학 수학 개념을 재구성해 자체적으로 개발한 데이터셋인 ‘엔트로피 세트’ 문제에서도 해외 AI 모델들은 80점을 넘긴 반면, 국내 AI 모델은 7.1~53.3점을 기록했다. 김종락 교수 연구팀은 “국내 모델 수준이 해외 프런티어 모델에 비해 뒤처진다는 것을 알 수 있었다”고 평가했다. </p> <figure class="figure_frm origin_fig" contents-hash="f2495ee10dec6039968674d48d0de42c9f4ea244b2a1d80e606f3159b410b807" dmcf-pid="PCpnKE2uh4" dmcf-ptype="figure"> <p class="link_figure"><img alt="정근영 디자이너" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/16/joongang/20251216011339409asps.jpg" data-org-width="560" dmcf-mid="VFs7T4WITx" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/16/joongang/20251216011339409asps.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 정근영 디자이너 </figcaption> </figure> <p contents-hash="8a41da7e1ba599c303422388e6f8a3d24ce4b428e4a0fa0c7d290b224b179588" dmcf-pid="QhUL9DV7Sf" dmcf-ptype="general"> 업계에선 평가받은 국내 AI 개발사들이 업무용 AI 개발에 주력해온 만큼, 해당 모델들의 수학 문제 풀이 점수는 낮을 수밖에 없다는 입장이다. 한 응용 AI 스타트업 최고기술책임자(CTO)는 “국내 AI 개발사들 목적은 AI 에이전트 같은 산업용 AI를 개발하려는 것”이라며 “(수능 수학으로 평가할 때) 한국 LLM의 성적이 낮게 나올 수밖에 없다”고 말했다. 평가에 포함된 일부 모델이 사전 학습 방식(학습된 데이터를 기반으로 정답일 확률이 높은 답을 내놓는 방식) AI인 점도 한계다. 단계별로 검증을 거치는 추론 방식인 해외 모델들과 달리 사전학습 방식 AI는 수학·코딩 등 논리적 문제풀이에 상대적으로 약하다. </p> <p contents-hash="aca898f93493612b2161453c7fde0cd30ea52738720b07b16b59fd45f57cfbcc" dmcf-pid="xluo2wfzyV" dmcf-ptype="general">이 같은 평가 결과를 두고 세계 10위권 안에 드는 독자 AI 파운데이션 모델을 개발하려는 정부의 목표를 달성하기 위해선 보다 정교한 전략이 필요하다는 의견이 나온다. 배경훈 부총리 겸 과기정통부 장관은 15일 세종시에서 가진 기자간담회에서 관련 질문이 나오자 “독자 AI 파운데이션 모델을 개발하는 기업들은 그동안 사업적 목적에 맞게 AI 모델을 만들어왔고, 과학과 수학 등에 특화된 추론형 AI 모델 개발을 위한 데이터 학습이 부족했던 게 사실”이라며 “예를 들어 화학 분야의 분자 구조식을 AI가 인식할 수 있는 형태로 데이터를 변환하는 등 분야별 특화 데이터를 만들어 학습시킨다면 글로벌 톱10에 해당하는 경쟁력을 가질 수 있다”고 말했다. </p> <p contents-hash="3c0c17c5ca388b5c42085d2303fbd5383b7d8cbf7d6733e0e4a4e0f3b7e49773" dmcf-pid="y8ctOBCEh2" dmcf-ptype="general">수학 등 모든 학문을 잘하는 AI 개발은 현실적으로 어려운 만큼 서비스에 직접 쓰일 수 있는 경량화된 AI 개발에 집중해야 한다는 취지다. 네이버 관계자는 “큰 모델은 그만큼 답을 내는 데 시간이 오래 걸리거나 비용이 많이 드는 문제가 생기기 때문에 서비스에 적용하는 것을 목표로 모델을 만들고 있다”며 “동일 규모 모델에 비해 성능이 잘 나오게 만드는 기술을 먼저 확보하려고 하고 있다”고 했다. </p> <p contents-hash="34ec46a657910213b455465bfc2478dc604d92c156d3bac88f041acae9e797a1" dmcf-pid="W6kFIbhDy9" dmcf-ptype="general">김민정·오현우 기자</p> </section> </div> <p class="" data-translation="true">Copyright © 중앙일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기