로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
서하얀, ♥임창정 위해 넥타이까지 코디 "새벽부터 미리 세팅 중"
N
[IT뉴스]
그라비티 김진환 "라그나로크 페스타, 전 세계 이용자 화합의 장…IP 접점 확대 주력"
N
[연예뉴스]
투컷 "BTS 뷔, 라이벌이라고 했다가…해외 팬에 욕설 들었다" ('놀면 뭐하니?)
N
[연예뉴스]
허성태 “어제도 LG전자 옛 동료 만나” 대기업 출신 맞네‥러시아어 술술 감탄(놀뭐)
N
[연예뉴스]
김승현, 5년째 캐스팅 없다더니…행사 MC로 전직 "결혼식 사회 전문"
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]KAIST 석·박사 15명, 챗GPT와 딥시크로 수능 미적분 풀어보니…
온카뱅크관리자
조회:
82
2025-02-26 17:27:34
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">테라랩, 지난 주 양사 AI경쟁력 비밀 분석 세미나…벤치마크에선 서로 강점 달라</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="yV5o6X1m7h"> <p contents-hash="36191dc6da2d969c1769858b279d536667ea4b7f617cbe94db6a054706570587" dmcf-pid="WqWe9TYc0C" dmcf-ptype="general">(지디넷코리아=박희범 기자)<span>올해 수능 수학 30번 문항을 챗GPT와 딥시크에게 물었다. 30번은 미적분 문제다. 전국 수험생들의 14%만이 맞췄다. 과연 어느 생성형 인공지능(AI)이 올바른 답을 제시했을까.</span></p> <p contents-hash="c6cf2f1dda9c8309780f41a42a3d411caaf2f9d838ad6e2cb619f6c37da63c12" dmcf-pid="YBYd2yGkpI" dmcf-ptype="general">KAIST 테라랩(지도교수 김정호)이 지난 주 챗GPT와 딥시크의 성능과 활용성, 경쟁력의 비밀을 공개하는 세미나를 개최했다. 이 세미나에는 테라랩 소속 석·박사과정생 15명이 참여했다.</p> <p contents-hash="56e2e8ea399f54f74c48d119e4b3aacd04cb23217b5df26f50e7dfd5d26816e5" dmcf-pid="GbGJVWHE7O" dmcf-ptype="general">이날 서은지 연구생(전기및전자공학과 석사과정)이 딥시크를 활용해 테스트한 결과를 공개해 눈길을 끌었다.</p> <figure class="figure_frm origin_fig" contents-hash="40c2f685f4ff5e68a58506bf73c01404aebb28a97ef720e1ff9c736299058737" dmcf-pid="HKHifYXD3s" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171704169peit.jpg" data-org-width="640" dmcf-mid="2a3rL7BWuH" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171704169peit.jpg" width="658"></p> </figure> <figure class="figure_frm origin_fig" contents-hash="e39b55d2ff7000f59374b29546ea3386c085f0000f050236afee8c0558a4e879" dmcf-pid="X9Xn4GZw3m" dmcf-ptype="figure"> <p class="link_figure"><img alt="GPT-o1과 딥시크-R1 성능 비교 결과표." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171705452ykzm.jpg" data-org-width="638" dmcf-mid="6KoqZAEQ0T" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171705452ykzm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> GPT-o1과 딥시크-R1 성능 비교 결과표. </figcaption> </figure> <p contents-hash="03a97ea7ab74c481a83ad8f1b5f7289bed2c99671ec9e847a6878acbc3af0764" dmcf-pid="Z2ZL8H5r3r" dmcf-ptype="general">이 시험에서 서 연구생은 리즈닝(추론가능 LLM) 모델로 챗GPT-o1과 딥시크-R1(1.5B)을 썼다. 이 결과 GPT-o1은 7분 40초만에 정답 17을 제시했다. 반면 R1은 정답 도출에 실패했다.</p> <p contents-hash="d6236e255549121812c27f5e9969ae651ebd5b618a023c11855d8f316ea78baa" dmcf-pid="5V5o6X1mpw" dmcf-ptype="general">서 연구생은 이외에도 수리1, 추리2, 코딩1문제를 각각 테스트한 결과도 공개했다.</p> <p contents-hash="8cd541d1add9964fc7e37d6caf2d830be3dab4c8eee297a680422c11f51da553" dmcf-pid="1f1gPZts3D" dmcf-ptype="general">이 결과에 따르면 단순 수리 문제는 양쪽 AI 모두 맞췄다. 이어 진행한 숫자 야구 게임에서는 GPT-o1의 경우 18분간 10번의 시도로 정답을 냈고, R1은 55분간 15번을 시도했으나 갈피를 잡지 못했다.</p> <p contents-hash="7313f2bb91cd6034f74a6ae7088d9c47cc13e2c46f05a4a2edee6370273951ca" dmcf-pid="t4taQ5FO3E" dmcf-ptype="general">삼성이 시행하는 직무적성검사(GSAT)도 테스트했다. 3단 논법에서 전제1과 결론을 제시한 뒤 전제2를 묻는 질문이다.</p> <p contents-hash="83cc5b7fdc56abc25f5735ef986127f6e6f760d12c84c48f4409921bf10f6c75" dmcf-pid="F4taQ5FO7k" dmcf-ptype="general">이 질문에 GPT-o1은 25초만에 정답을 도출했다. 반면 R1은 1분 동안 리즈닝까지 했지만, 답을 맞히지 못했다.</p> <p contents-hash="c722dce21affa8cbd6a5b2cb24b5a65e089b2abcabc84b333ccab0f87b939d65" dmcf-pid="38FNx13IFc" dmcf-ptype="general">그러나 코딩의 2가지 오류 탐지에서는 GPT-o1이 46초간 한 개의 오류만 해결한 반면, R1은 몇 초 동안 2가지를 모두 해결했다.</p> <figure class="figure_frm origin_fig" contents-hash="ec891cdd589f0180bc7104d2611feb11ac6d8e14aa98bc2c7e973fb90a945564" dmcf-pid="063jMt0CFA" dmcf-ptype="figure"> <p class="link_figure"><img alt="KAIST 테라랩이 최근 오픈AI와 딥시크의 AI 경쟁력을 분석했다.(그래픽=KAIST 테라랩)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171706734hsfv.jpg" data-org-width="640" dmcf-mid="PSczXjkP0v" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171706734hsfv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KAIST 테라랩이 최근 오픈AI와 딥시크의 AI 경쟁력을 분석했다.(그래픽=KAIST 테라랩) </figcaption> </figure> <p contents-hash="118fe75d2f6b9e30b02abded9624115719dd314b3d76cd04a3586b312be6af1f" dmcf-pid="pP0ARFphuj" dmcf-ptype="general">서 연구생은 "GPT-o1이 고난도 수리나 추론해결이 정확한 반면 R1은 코딩 오류 탐지가 정확했다"며 "제품 출시 2개월 된 R1이 이 같은 성능을 보인다는 측면에서 대단하다"고 평가했다.</p> <p contents-hash="304adedca2ef41d1e40acecebe551782c0c95ba64310850e708de370ce22f4d6" dmcf-pid="UQpce3UlpN" dmcf-ptype="general"><strong>언어와 수학에선 R1, 프로그래밍에선 오픈AI-o1이 강력</strong></p> <p contents-hash="20b01c86222b6d94818bbf31f7489fd008878029bd8eb525415410159ddd7918" dmcf-pid="uxUkd0uSpa" dmcf-ptype="general">이어 김지훈 연구생(전기및전자공학과 박사과정)은 AI 벤치마크별 성능 비교 자료를 공개해 관심을 끌었다.</p> <p contents-hash="f53d2fe57ab22e86eefdc3a0aaa8ad30a3aaa9c3c12ee418dd45bb4a5a3a2eb7" dmcf-pid="7MuEJp7vzg" dmcf-ptype="general">미국고교수학경시대회(AIME2024) 문제로는 R1이 79.8점, 오픈AI-o1은 79.2점으로 R1이 미세하게 앞섰다. MATH-500(고급수학문제)이나 소프트웨어 엔지니어링 벤치마크(SWE-벤치)에서도 0.3~0.9점 가량 R1이 좋은 점수를 받았다.</p> <p contents-hash="34c5c03e90c8430602392afdff3f2955f2cc5647ae69352899c3c8c2b900c565" dmcf-pid="zR7DiUzTzo" dmcf-ptype="general">그러나 검색없이 해결하는 대학원 수준 문제(GPQA)에서는 오픈AI-o1가 75.7점으로, 71.5점을 받은 R1보다 4.2점이 높게 나왔다.</p> <p contents-hash="ee1bb844eafa31858670053deb8992c767aa6c2ce5f3831967bdf5cde6e4d505" dmcf-pid="qezwnuqyFL" dmcf-ptype="general">또 영어나 수학, 중국어 등의 문제에서는 R1이, 프로그래밍 최적화에서는 오픈AI-o1이 강력했다.</p> <p contents-hash="af4008b552631638435e2436e3df7613eed5ab1cb9237a11e8471262c82ab41d" dmcf-pid="BdqrL7BWpn" dmcf-ptype="general">최성욱 연구생(전기및전자공학과 박사과정)은 딥시크의 기업 전반을 공개하며 "딥시크는 연구자와 엔지니어 150명과 데이터 자동화 연구팀 31명만으로 개발했고, 오픈AI는 1천200명의 인력이 투입됐다"고 설명했다.</p> <p contents-hash="7f34fdc68a90c2090b6830d7f09f9d5d503533d2ca0dd28aa9d0c15d0ff69a2b" dmcf-pid="bJBmozbYui" dmcf-ptype="general">최 연구생은 또 딥시크 서비스 차단 이슈를 거론하며 "우리나라를 포함해 미국, 일본, 호주, 이탈리아, 대만이 접속을 차단하거나 사용금지, 앱 다운로드 금지 등으로 규제 중"이라고 덧붙였다.</p> <p contents-hash="6ea9cd5c673f036b3c4426c7b061537d25f399bed4d910f0ca38600c1cebe69b" dmcf-pid="KTjuGaA8pJ" dmcf-ptype="general"><strong>LLM이 기초..."우리나라 GPU 10만장정도 보유 희망"</strong></p> <p contents-hash="76843a5693307bac6a43a661ad3819a2d39853410f5f47101ee03aea4696d6f0" dmcf-pid="9yA7HNc60d" dmcf-ptype="general">김근우 연구생(전기및전자공학과 박사과정)은 딥시크 R1-제로의 학습 방법론(GRPO)으로 주목 받았다.</p> <p contents-hash="f6be50c24a00a6a1f51c0816fbc0faa0eb67fc38cb55b9ef4d8b1ec0b0076c44" dmcf-pid="2WczXjkPFe" dmcf-ptype="general">김 연수생은 이 방법론에서 R1-제로의 특징을 가치평가 모델과 보상인공지능 모델을 사용하지 않는 경량화된 강화학습으로 분석했다.</p> <p contents-hash="c5a30330fbc48c401a48d7108708ff6a32bf2aafdd15f0f3d764eaf715d82406" dmcf-pid="VYkqZAEQUR" dmcf-ptype="general">이외에 이들은 △딥시크-V3의 기본 아키텍처 △R1-제로에서의 강화학습 △오픈소스 생태계 △기업소개 및 기술적 배경 등을 주제로 자료를 공개했다.</p> <figure class="figure_frm origin_fig" contents-hash="5b20742c48d8128dee3e933d8b47c72cfb7ce1ae05020d676d5acae0be221c33" dmcf-pid="fGEB5cDxFM" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171708060aohe.jpg" data-org-width="638" dmcf-mid="QxHifYXD7S" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171708060aohe.jpg" width="658"></p> </figure> <figure class="figure_frm origin_fig" contents-hash="70ed8660f9dcc07129db7f038b182c5890a3105081b069068cf892fa98ca4483" dmcf-pid="4HDb1kwM3x" dmcf-ptype="figure"> <p class="link_figure"><img alt="KAIST 테라랩 연구생들이 지난 해 야구장을 찾아 한화 경기를 관람했다.(사진=KAIST 테라랩 홈페이지)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171709380ydhm.jpg" data-org-width="638" dmcf-mid="xLvxBlTN0l" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/26/ZDNetKorea/20250226171709380ydhm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KAIST 테라랩 연구생들이 지난 해 야구장을 찾아 한화 경기를 관람했다.(사진=KAIST 테라랩 홈페이지) </figcaption> </figure> <p contents-hash="e2bbc399d803bfe8845b01a6446c76c343c96e135339b094fc2733527e6764a3" dmcf-pid="8XwKtErRFQ" dmcf-ptype="general">김정호 교수는 "딥시크 R1 등장이 경쟁 체제 문제를 넘어, 결국 전의 전쟁으로 발전하고 있다"며 "지금은 거대언어모델(LLM)에 머물지 않고 미디어 LLM, 멀티모달 에이전트, AI로봇, 피지컬 AI를 넘어 범용인공지능(AGI), 초인공지능(ASI) 시대로 가는 시작점"이라고 말했다.</p> <p contents-hash="d0d3132ebe255b80f23e9d02afcbff4bdda9f07aabcc6a7659c34c69d8a5d8a9" dmcf-pid="6Zr9FDmeuP" dmcf-ptype="general">김 교수는 또 "이 가운데 LLM이 기초"라며 "정부도 K-LLM 개발하겠다고 한다. 우리나라 GPU 보유숫자가 10만장까지 갔으면 좋겠다"라고 덧붙였다.</p> <p contents-hash="c3bc1eda7cf30455178971d606a4647a4519b887644ebc8867c697df31adc65a" dmcf-pid="P5m23wsdF6" dmcf-ptype="general">김 교수는 "딥시크가 주목받는 이유로 저비용, 자체 개발, 챗GPT 동급성능, 1년만에 개발 등을 꼽을수 있다"며 "딥시크 AI에는 학습코드와 학습 데이터가 공개되지 않는 등 비밀이 많이 숨어 있는 것 같다"고 평가했다.</p> <p contents-hash="564972b580dd476619f521b8762dec5b6c571f94fb09a9b85a9a6cdd5b6b40c2" dmcf-pid="Q1sV0rOJz8" dmcf-ptype="general">박희범 기자(hbpark@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기