로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
“신도들이 스스로 바쳤습니다만”...가스라이팅에 날린 재산, 돌려받는다
N
[실시간뉴스]
"정책 과정 투명 검증...공직자 특별한 헌신도 보상"
N
[스포츠뉴스]
파리 법원, "팀 PSG은 선수 음바페에 1000억원 지불해야"
N
[연예뉴스]
장영란, 20년간 업계서 무시당했다 “계단에서 혼자 울어..늘 C급 인생”(당일배송우리집)[종합]
N
[스포츠뉴스]
모델 원해성 NO KO NO WIN 간판 라운드걸
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]AI가 수능 문제 풀어보니…제미나이 92점, 韓모델 20점대
온카뱅크관리자
조회:
13
2025-12-16 08:27:32
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="K8SHZwfzzI"> <figure class="figure_frm origin_fig" contents-hash="4e4a23535a987204807dcfdd86802e8924e3316623f0e06da0745ad9ef36ba66" dmcf-pid="96vX5r4qUO" dmcf-ptype="figure"> <p class="link_figure"><img alt="기사와 직접적 관련 없는 참고사진. 게티이미지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/16/donga/20251216082113135zudx.jpg" data-org-width="1600" dmcf-mid="bqsvyjB3uC" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/16/donga/20251216082113135zudx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 기사와 직접적 관련 없는 참고사진. 게티이미지 </figcaption> </figure> <div contents-hash="e8af33c68c414880f1e0aa0496d2125c8e8615c8c7ffb8eff4c7ad59c88f3046" dmcf-pid="2PTZ1m8Bps" dmcf-ptype="general"> 국내 기업들이 개발한 인공지능(AI) 모델에 대학수학능력시험(수능) 문제를 풀게 한 결과, 오픈AI와 구글 등 해외의 AI 모델에 비해 크게 낮은 점수를 받은 것으로 나타났다. </div> <p contents-hash="ef49ac7a3fed208dec4ab70d33a41e71c513040bfe9b7a4b02b8dcb27fd600b4" dmcf-pid="VQy5ts6bFm" dmcf-ptype="general">김종락 서강대 수학과 교수 연구팀은 15일 정부가 추진하는 ‘국가대표 AI’ 프로젝트 참여사 5개 팀의 대규모언어모델(LLM)과 챗GPT 등 해외 5개 모델에게 수능 수학 20문제·논술 30문제를 풀게 했다고 밝혔다.</p> <p contents-hash="29d9c4c6271920be6ee4bb14950a9e90651e56e860c7e198cc8da3dbd1bc35a3" dmcf-pid="fRGF0Cx2Ur" dmcf-ptype="general">연구팀은 수능 수학의 △공통과목 △확률과 통계 △미적분 △기하 영역에서 가장 어려운 5문항씩 총 20문제, 서울 주요 대학 10곳의 논술 기출문제, 인도 대학 입시 10문제, 일본 도쿄대 공대 대학원 입시 10문제 등 총 50문제를 선정해 평가를 진행했다.</p> <p contents-hash="63e51f2f097778bf62b2080b5901b94af206e813e9235eb0c8bfa40548d1fe30" dmcf-pid="4eH3phMVpw" dmcf-ptype="general">한국 모델 중에는 앞서 정부가 ‘독자 AI 파운데이션 모델 프로젝트’ 정예팀으로 뽑은 △업스테이지 솔라 프로-2 △LG AI연구원 엑사원 4.0.1 △네이버 HCX-007 △SK텔레콤 A.X 4.0(72B) △엔씨소프트 라마 바르코 8B 인스트럭트 등을 대상으로 테스트를 진행했다. 정부는 해외 모델 종속을 막기 위해 자국 데이터·인프라·인력으로 독자 개발하는 소버린 AI(Sovereign AI) 확보에 힘쓰고 있다.</p> <p contents-hash="f66a21c6f837518aace6d775702d751ec1fa675f4909bab8d3978232157c1b3d" dmcf-pid="8dX0UlRfFD" dmcf-ptype="general">연구팀은 해외 모델의 경우 △오픈AI GPT-5.1 △구글 제미나이 3 프로 프리뷰 △앤트로픽 클로드 오푸스 4.5 △xAI 그록 4.1 패스트 △딥시크 V3.2 등을 선택해 테스트했다.</p> <p contents-hash="db4ebd8e1b55581ee8a07106d96faeb9ac3f57996863072fb6aebd8a2a3bce70" dmcf-pid="6JZpuSe4UE" dmcf-ptype="general">테스트 결과 제미나이는 92점, 클로드 오푸스 4.5는 84점을 받는 등 해외 모델의 점수는 76~92점으로 고르게 높았다. 한국 모델 가운데에는 솔라 프로-2가 58점으로 가장 높았고, 나머지는 20점대에 머물렀다. 경량모델인 라마 바르코 8B 인스트럭트는 2점이었다.</p> <p contents-hash="aeea7f1baff19b819fb4597f9e5eedf7df241caf90a51c1a34c8241b2a2113ea" dmcf-pid="Pi5U7vd8zk" dmcf-ptype="general">연구팀은 한국 모델들이 단순 추론으로는 대부분 문제를 풀지 못해 파이선(Python) 계산 툴을 활용할 수 있도록 설정했음에도 낮은 정답률을 보였다고 밝혔다.</p> <p contents-hash="7fd311073794607413d7d31a03f371b1308e6b40ca626a850788228e61f061ec" dmcf-pid="Qn1uzTJ63c" dmcf-ptype="general">연구진이 대학생 수준부터 교수급 연구 난도까지 세분화한 자체 문제 세트 ‘엔트로피매스’(EntropyMath) 100문제 중 10문항을 추가로 구성해 진행한 테스트에서도 격차가 컸다. 해외 모델은 82.8~90점을, 한국 모델은 7.1~53.3점 수준이었다.</p> <p contents-hash="7ce116e4ce31fa41238f53bd78b1a1034a735c9640ee40bc5a56ee08d1ada62b" dmcf-pid="xLt7qyiP7A" dmcf-ptype="general">문제 풀이를 3번 시도해 정답을 맞히면 통과로 조건을 완화했을 때도 해외 모델은 대부분 90점 이상을 받았다. 그록은 만점을 기록했다.</p> <p contents-hash="7e697a9a2c28640a0ec5f0bc76506482c5d4d4abee6ce50278517cad9ca13ab2" dmcf-pid="y1okDxZvuj" dmcf-ptype="general">같은 조건에서 솔라 프로-2는 70점, 엑사원은 60점, HCX-007은 40점, A.X 4.0은 30점, 라마 바르코는 20점을 받았다.</p> <p contents-hash="bfe4794bcb2083f6d31137b583ad40d87b99b36b973a2948541d0b0ceed47cb3" dmcf-pid="WtgEwM5TUN" dmcf-ptype="general">김 교수는 “최근 여러 곳에서 한국 AI 모델들의 수능·논술 성능 평가 문의가 있어 자체적으로 검증을 진행했다”며 “한국 AI가 해외 프런티어 모델과의 기술 격차를 좁히기 위해선 근본적인 모델 구조 개선과 데이터 품질 강화가 필요하다”고 설명했다.</p> <p contents-hash="ed55e81881d7bdc285b8c6ffe17b6ab635754935200f590c3b12cf42b2dca78e" dmcf-pid="YAu9VZNdza" dmcf-ptype="general">이어 “한국 5개 모델은 기존 공개 버전인 만큼 각 팀의 국가대표 AI 버전이 새로 공개되면 자체 개발 문제로 다시 성능을 테스트하겠다”고 전했다.</p> <p contents-hash="12418dbfef5d5065aa54946a93dcd686272b16390ff74313fbef2649c1a19ec4" dmcf-pid="Gc72f5jJUg" dmcf-ptype="general">이혜원 기자 hyewon@donga.com </p> </section> </div> <p class="" data-translation="true">Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기