로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
'백반기행' 홍천 명품 한우 정육식당
N
[IT뉴스]
머스크의 xAI, 그록 훈련 위해 '문예 엘리트' 채용…시간당 최대 18만원
N
[연예뉴스]
로제 이어 정해인도?…인종차별 논란 휩싸인 이 사진
N
[스포츠뉴스]
'밀라노 첫날' 바로 훈련 나서다…피곤함도 잊은 태극 전사들
N
[연예뉴스]
길용우 “제자 김윤우 ‘연인’으로 신인상 수상, 앞으로 많이 나올 거” (백반기행)
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]AI도 못 푸는 ‘초고난도 시험’ 등장…한국인도 같이 문제 냈다
온카뱅크관리자
조회:
15
2026-01-29 10:27:29
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="zyWnLgx2HR"> <figure class="figure_frm origin_fig" contents-hash="2a57ee2d13f782036330360e91fc1a8f147f156d0b902d212c329bacb908385a" dmcf-pid="qWYLoaMVZM" dmcf-ptype="figure"> <p class="link_figure"><img alt="'Humanity’s Last Exam', HLE. /intuitionlabs.ai" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/29/chosun/20260129102646377frmt.jpg" data-org-width="1344" dmcf-mid="uYvdJn6bZd" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/29/chosun/20260129102646377frmt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 'Humanity’s Last Exam', HLE. /intuitionlabs.ai </figcaption> </figure> <p contents-hash="4d3d8ed6bae323c275a7c0a01534e75a37ec8347fe216c9fff7f78251fab9068" dmcf-pid="BYGogNRf1x" dmcf-ptype="general">전 세계 학자들이 힘을 합쳐 인공지능(AI)의 성능을 비교하기 위해 만든 초고난도 시험 문제 ‘인류의 마지막 시험’(Humanity’s Last Exam·HLE)의 내용이 28일 국제 학술지 네이처에 공개됐다.</p> <p contents-hash="2668c641e1436fbf35c4310e265ba228126187acf426451fd43ecc34ed5db9a2" dmcf-pid="bGHgaje4HQ" dmcf-ptype="general">HLE는 전 세계 50개국 500여 기관 교수와 연구자, 약 1000여명의 전문가가 모여 다양한 분야에서 제출한 문제 2500문항으로 구성됐다.</p> <p contents-hash="8c71c579c54b48f28140ceb41afc839267c647a76795d47cb0888585123d29ac" dmcf-pid="KHXaNAd81P" dmcf-ptype="general">제출자 중엔 AI스타트업 에임인텔리전스의 박하언 최고기술책임자(CTO), 김대현 연세대 교수를 비롯, KAIST·한국기술교육대 등의 국내 연구자들도 포함됐다.</p> <p contents-hash="6c0f3b646512e9c3b131d4e7326a0eefec6eabc4b461de7a4748e72f0d3aa178" dmcf-pid="9XZNjcJ616" dmcf-ptype="general">HLE는 미국 비영리단체 AI안전센터(CAIS)와 스타트업 스케일AI가 지난해 1월 처음 공개한 프로젝트다. 이후 1년 정도 검증기간을 거쳐 이날 공식 논문으로 발표됐다. 최근 AI 성능이 빠르게 고도화되면서 기존 성능 평가 기준들이 더 이상 변별력을 갖기 어려워지자, 이를 보완할 새로운 벤치마크를 마련하기 위해 기획됐다.</p> <p contents-hash="ff20e2ae581515cafddb9c0b14dd6d4402d1b825e5b57c6b3260e17407d6d167" dmcf-pid="2Z5jAkiPt8" dmcf-ptype="general">◇인공지능도 못 푸는 초고난도 문제</p> <figure class="figure_frm origin_fig" contents-hash="8b5aa7a410e64296c14770ee429039b21172c1f94e079038f260584dcff2dc8a" dmcf-pid="V51AcEnQ54" dmcf-ptype="figure"> <p class="link_figure"><img alt="HLE에 포함된 로마 비문 번역 문제 /HLE" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/29/chosun/20260129102647692idgk.jpg" data-org-width="2065" dmcf-mid="730DwmaeXe" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/29/chosun/20260129102647692idgk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> HLE에 포함된 로마 비문 번역 문제 /HLE </figcaption> </figure> <p contents-hash="163e001860149c6a838e3962c3a354b629d1941001915064add8695665766943" dmcf-pid="fsOPQM9UHf" dmcf-ptype="general">HLE 시험 문항은 수학부터 인문학까지 100여 개 세부 분야를 망라한다. 글과 그림을 함께 해석해야 풀 수 있는 문제도 포함돼 있다.</p> <p contents-hash="700aff29a073629e9166385ff1ed13a850d458e1e2514f6dbb47276770683ac6" dmcf-pid="4OIQxR2uGV" dmcf-ptype="general">수학 문제가 전체 41%로 가장 많다. 로마 시대 묘비에 새겨진 비문을 해석하거나, 벌새 뼈 구조를 묻는 등 인간 전문가 수준의 지식을 요구하는 문제도 다수 출제됐다.</p> <p contents-hash="ecb56c23515f897aaf2058daa292e400d11c412580bd3771fae3400c2b62e6e9" dmcf-pid="8ICxMeV712" dmcf-ptype="general">출제자들은 문제를 낼 당시에 나왔던 최고 성능의 AI도 풀지 못한 문제만을 선별해 최종 문항으로 남겼다고 한다.</p> <p contents-hash="9232488ef24c7479f992c9aca71b10ce6e648ed1cc088ba769a798e88a40970f" dmcf-pid="6ChMRdfzH9" dmcf-ptype="general">◇제미나이도 챗GPT도 ’40점 미만'</p> <p contents-hash="8a5b9c71051b7d745289832295a99290d7b79dc6b092c20c965295083ea1a53d" dmcf-pid="PhlReJ4qXK" dmcf-ptype="general">실제로 이 문제들을 최신 AI에게 풀게 했을 때, AI들은 모두 40점에도 못 미치는 점수를 기록했다.</p> <p contents-hash="428d2ffd4b4d32e71c0fc9040290a9ee2ccab2006a77a4f0e86cf47ffba09686" dmcf-pid="QlSedi8B5b" dmcf-ptype="general">CAIS에 따르면, 구글 ‘제미나이 3 프로’는 정확도 38.3점으로 가장 높은 점수를 기록했다. 오픈AI의 GPT-5.2는 29.9점, 오푸스 4.5는 25.8점, 딥시크 3.2는 21.8점에 그쳤다.</p> <p contents-hash="eec4c0135c8c28079d59f0bc940173ec8db3360953b253a1842b0099047b3709" dmcf-pid="xSvdJn6bZB" dmcf-ptype="general">국내 AI 모델들의 성적은 더 낮다. 텍스트 문항만을 대상으로 한 평가에서 LG AI연구원의 ‘엑사원’은 13.6점, 업스테이지의 ‘솔라 오픈’은 10.5점, SK텔레콤의 ‘A.XK1′은 7.6점을 받았다.</p> <p contents-hash="ea923e045035acd229b089563e60024f8cf2dee48db45034612483c63e388155" dmcf-pid="y6PHX5SrGq" dmcf-ptype="general">다만 출제자들은 HLE의 의미를 과도하게 해석하는 데는 선을 그었다. HLE에서 높은 점수를 기록해도 이는 학술 문제에 대한 전문 지식과 추론 능력이 높아졌음을 의미할 뿐, 인간처럼 새로운 연구를 주도하거나 범용 인공지능(AGI)까지 도달했다는 것은 아니란 얘기다. 출제자들은 “HLE가 인류의 마지막 벤치마크일 거라고는 생각하지 않고, 정말 범용적인 AGI를 시험하는 벤치마크는 없다고 생각한다”고도 했다.</p> <p contents-hash="5585a5b6dd32c2af9840bc656c6ffa546c04ea4f684019d64958c968dee35638" dmcf-pid="WPQXZ1vm1z" dmcf-ptype="general">※참고 <span>A benchmark of expert-level academic questions to assess AI capabilities | Nature</span></p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기