로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
“반도체·조선 빼면 먹고 살게 없다”…한국, 1%대 저성장 고착화되나
N
[실시간뉴스]
국힘 재선모임서 "공천룰 민심 반영해야" 쓴소리…초선 대표에 박상웅(종합)
N
[실시간뉴스]
시드니 총격범, IS 추종해 증오 키워…범행 직전 필리핀행(종합)
N
[연예뉴스]
영국 최악의 폭군이 민주주의 시초가 된 까닭
N
[IT뉴스]
저커버그 뚝심 통한 ‘스레드’ 韓 이용자 수 600만 눈앞
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]“성능개선 됐다더니 환각률 무려 48%”… 챗GPT 새모델 어쩌나
온카뱅크관리자
조회:
112
2025-04-20 16:17:28
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="GVpCFDOJoz"> <figure class="figure_frm origin_fig" contents-hash="6cb327ce4b859c4d6eed5b79a234005087f1c209163ca8f2f0e699d977ef43ba" dmcf-pid="HfUh3wIiA7" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI의 챗GPT 로고./연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/20/chosunbiz/20250420161224292rnak.jpg" data-org-width="3000" dmcf-mid="Yig9nubYgq" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/20/chosunbiz/20250420161224292rnak.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI의 챗GPT 로고./연합뉴스 </figcaption> </figure> <p contents-hash="45a5d1817b5a554f8b3d457f8f3ed16a13b44da5df704101f5225f19478a1663" dmcf-pid="X4ul0rCnou" dmcf-ptype="general">오픈AI가 최근 공개한 추론형 인공지능(AI) 모델 ‘o3’와 ‘o4 미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 오히려 더 심해졌다는 평가가 나왔다. 환각은 생성형 AI가 실제 존재하지 않는 정보를 사실처럼 만들어내는 현상을 말한다.</p> <p contents-hash="54ec1f579f88b9116d61e0890076b58a29bad10b62aaf82770c58bda1fdec176" dmcf-pid="Z87SpmhLkU" dmcf-ptype="general">20일 정보기술(IT) 전문매체 테크크런치에 따르면 오픈AI의 사내 벤치마크인 ‘퍼슨(Person) QA’ 평가 결과를 인용해, o3 모델이 33%의 질문에 대해 환각을 일으켰다고 보도했다. 이는 o1(16%)과 o3 미니(14.8%)보다 두 배 이상 높은 수치다. 더 심각한 것은 o4 미니다. 이 모델은 무려 48%의 환각률을 기록하며 GPT-4o를 포함한 기존 모델들보다도 더 불안정한 모습을 보였다.</p> <p contents-hash="8ec5ff3ad3509760bc8647c3df5676b5785cbeb696e24131bc6ce86df023caf7" dmcf-pid="56zvUslogp" dmcf-ptype="general">오픈AI는 지난 16일 이들 모델을 “이미지를 사고 과정에 통합할 수 있는 최초의 모델”이라고 소개하며 출시했다. 단순히 이미지를 인식하는 것을 넘어, 시각 정보 자체를 추론 과정에 활용할 수 있다는 설명이다. 실제로 o3와 o4 미니는 사용자가 올린 화이트보드 그림, 도표, 그래프 등을 분석하고, 흐릿하거나 회전된 이미지도 처리할 수 있는 능력을 갖췄다.</p> <p contents-hash="34070b0f70d88160722fe8ba3a902ec628b32af25adeb357d372892a0a32112c" dmcf-pid="1PqTuOSga0" dmcf-ptype="general">성능 측면에서도 코딩 관련 벤치마크인 SWE 테스트에서 o3는 69.1%, o4 미니는 68.1%를 기록해, 이전 모델인 o3 미니(49.3%)는 물론, 경쟁 모델인 클로드 3.7 소넷(62.3%)보다도 높은 수치를 보였다. 하지만 이러한 기술적 진보에도 불구하고, 환각률은 오히려 이전보다 증가했다. 그동안 새로운 모델이 출시될 때마다 환각 문제는 점진적으로 개선됐다는 점에서 이번 결과는 이례적이라는 지적이 나온다.</p> <p contents-hash="213a9575f57698804b11cb638285965042078b0fbd131b8dba76033feeb42821" dmcf-pid="tQBy7Ivao3" dmcf-ptype="general">오픈AI는 이 현상의 원인에 대해 아직 명확한 설명을 내놓지 못하고 있다. 기술 보고서에서는 “모델이 이전보다 더 많은 사용자 요청에 응답하게 되면서, 정확한 결과 뿐 아니라 잘못된 결과를 내는 것도 함께 증가한 것으로 보인다”고 분석했다. 이어 환각 증가의 정확한 원인을 규명하기 위해 “더 많은 연구가 필요하다”고 밝혔다.</p> <p contents-hash="c0eb5ef0802b859c2af052f035f99f03666d2ecb90b11828710ddf519703846c" dmcf-pid="FxbWzCTNNF" dmcf-ptype="general">AI 업계는 이번 사례가 추론형 모델에 대한 신뢰성에 의문을 제기할 수 있다고 본다. 특히 법률, 회계, 세무 등 고정확도가 요구되는 산업군에서는 환각 문제가 해결되지 않을 경우, 추론형 AI 도입 자체가 어려워질 수 있다는 우려가 나온다.</p> <p contents-hash="bfcf0f27f2fb3ef870605ab623c939a2227f0e2492306067b7457f3863a45870" dmcf-pid="3wLbJpqygt" dmcf-ptype="general">오픈AI는 “모든 문제 영역에서 환각을 완전히 제거하는 것은 지속적인 연구 과제”라며 “정확성과 신뢰성을 높이기 위한 노력을 이어가고 있다”고 밝혔다.</p> <p contents-hash="596c3e41b532b57a72a8b349ea88e2e7731e989db4a85faf56a714c3e9be1c73" dmcf-pid="0roKiUBWA1" dmcf-ptype="general">- Copyright ⓒ 조선비즈 & Chosun.com -</p> </section> </div> <p class="" data-translation="true">Copyright © 조선비즈. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기