로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
속전속결 시작, 숨 가쁘게 달린 180일...뼈아픈 위기의 순간도 있었다
N
[실시간뉴스]
고려아연, 美 테네시에 11조원 규모 제련소 건설…美정부도 투자(종합2보)
N
[IT뉴스]
생성형 AI로 만든 광고가 금상… 함샤우트 글로벌, 디지털 광고 대상 3관왕
N
[연예뉴스]
장영란, 리포터 시절 하지원 미담 공개 “내 앞에서 옷을 훌러덩‥동갑인데” (짠한형)
N
[연예뉴스]
신동엽, 15년째 공백 원빈 실물 영접했다 “어마어마하게 잘생겨” (짠한형)
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"AI의 과학논문 요약 믿을 수 없어…과도한 일반화 편향 많아"
온카뱅크관리자
조회:
61
2025-05-14 09:37:34
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">국제 연구팀 "챗GPT·딥시크 등 챗봇, 최대 73%서 부정확한 결론 도출"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fnT9KXxp1N"> <p contents-hash="4e0eed4b3875b4bb638f081e31dc8c6d7aad90d47c7664480b5b2c5215f0d7ff" dmcf-pid="4Ly29ZMU5a" dmcf-ptype="general">(서울=연합뉴스) 이주영 기자 = 일반인들이 많이 사용하는 인공지능(AI)의 편리한 기능 중 하나가 요약이다. 하지만 챗GPT와 딥시크 등 유명 AI 챗봇의 과학 논문 요약 분석 결과 최대 70% 이상에서 과도한 편향이 발생하는 것으로 나타났다.</p> <figure class="figure_frm origin_fig" contents-hash="3150070edd5100ab9ca4f8305736f7753926abb7af7667ae33e033651d16f325" dmcf-pid="8UivSN5rHg" dmcf-ptype="figure"> <p class="link_figure"><img alt="AI 챗봇 챗GPT와 딥시크 시간이 부족할 때 챗GPT(ChatGPT)나 딥시크(DeepSeek) 같은 거대언어모델(LLM) 기반 인공지능(AI) 챗봇의 과학 논문 요약 기능을 이용하면 매우 편리해 보이지만, 연구 결과 최대 73%에서 과도한 일반화에 의한 부정확한 결론 도출이 일어나는 것으로 나타났다. [Royal Society Open Science, Uwe Peters et al. 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/14/yonhap/20250514093436448irob.jpg" data-org-width="770" dmcf-mid="VbOuUvVZ5j" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/14/yonhap/20250514093436448irob.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> AI 챗봇 챗GPT와 딥시크 시간이 부족할 때 챗GPT(ChatGPT)나 딥시크(DeepSeek) 같은 거대언어모델(LLM) 기반 인공지능(AI) 챗봇의 과학 논문 요약 기능을 이용하면 매우 편리해 보이지만, 연구 결과 최대 73%에서 과도한 일반화에 의한 부정확한 결론 도출이 일어나는 것으로 나타났다. [Royal Society Open Science, Uwe Peters et al. 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="618764fc3bc8c2e15265475685a7ace541905d5cdd0c444fe8930365a0bc5450" dmcf-pid="6unTvj1mYo" dmcf-ptype="general">네덜란드 위트레흐트대 우베 페터스 박사와 캐나다 웨스턴대 및 영국 케임브리지대 벤저민 친이 교수팀은 14일 거대언어모델(LLM) 기반 유명 AI 챗봇 10개가 생성한 과학 요약문을 분석한 결과 최대 73%에서 과도한 일반화로 인한 부정확한 결론이 도출이 확인됐다고 밝혔다.</p> <p contents-hash="dbc92073712ea209ab3405e607b300d436b3242d74175cb6139706741cf03bcb" dmcf-pid="P7LyTAtsXL" dmcf-ptype="general">연구팀은 "대부분 AI 모델이 원문보다 더 포괄적인 결론을 일관되게 생성하는 것으로 밝혀졌다"며 "놀라운 것은 정확성을 요구하는 프롬프트가 문제를 더 악화시키고, 최신 모델이 구형 모델보다 성능이 더 나쁘다는 것"이라고 말했다.</p> <p contents-hash="75fb08f08cf1e499d9274a6c34458744f4d2f6686815469bf01c6e9e8a0d3dc4" dmcf-pid="QzoWycFOHn" dmcf-ptype="general">연구팀은 챗GPT-4o(ChatGPT-4o)와 챗GPT-4.5(ChatGPT-4.5), 딥시크(DeepSeek), 라마 3.3 70B(LLaMA 3.3 70B), 클로드 3.7 소네트(Claude 3.7 Sonnet) 등 챗봇 10개가 네이처(Nature), 사이언스(Science), 랜싯(Lancet) 등 과학·의학 저널에 게재된 초록 및 논문 전문을 얼마나 정확히 요약하는지 평가했다.</p> <p contents-hash="f57fa02a27d774859394b0b7b0338bfe8c1e75a3ec88edd6022ec33b2404a544" dmcf-pid="xqgYWk3IXi" dmcf-ptype="general">4천900개의 LLM 생성 요약문을 분석한 결과 10개 AI 모델 중 6개가 원문 주장에 대한 체계적 과장 현상을 보였다. </p> <p contents-hash="51cf1a283241bded601329247afcf3fa3aff8d5b44cbf3b90f68db025ef99659" dmcf-pid="yDFRM7aVHJ" dmcf-ptype="general">이는 미묘하지만 독자에게 영향을 줄 수 있는 방식으로 일어나는 것으로 나타났다. '이 연구에서 치료법은 효과적이었다'라는 신중한 과거 시제 표현을 '이 치료는 효과적이다'처럼 더 일반화된 현재 시제로 바꾸는 식이다. </p> <p contents-hash="23b27e5df93912c8c0ea710a57455241c9f337e83f7d04aa682107b62973f701" dmcf-pid="Ww3eRzNfZd" dmcf-ptype="general">연구팀은 특히 이들 AI 모델이 더 정확한 요약을 요구할 경우 일반화 편향이 오히려 더 커진다는 점과 최신 모델이 구형 모델보다 성능이 더 나쁜 것으로 나타난 점 등을 문제로 지적했다.</p> <p contents-hash="bde7bc0c6a827a3a169bf3cc32921dfa842e4cc0146a80c5504d8a6221f73bcd" dmcf-pid="Yr0deqj45e" dmcf-ptype="general">챗봇에 부정확성을 피하라는 명시적 프롬프트를 주면 단순히 요약만 요청했을 때보다 과도한 일반화 결론 생성 가능성이 거의 두 배 가까이 높아졌다. </p> <p contents-hash="8b47f4d5e8bc1949f87d1f76dad605ceb9c74fc6155b0451c6e06fd4ff4b535a" dmcf-pid="GmpJdBA8ZR" dmcf-ptype="general">페터스 박사는 "학생, 연구자, 정책 결정자들은 챗GPT에 부정확성을 피하라고 요청하면 더 신뢰할 수 있는 요약을 얻을 수 있을 것으로 기대하겠지만 결과는 정반대였다"며 우려스럽다고 말했다.</p> <p contents-hash="b70dc556e6fd54b48d238d009e70258a0f785e63c94e9c9d4025e34053ad5e60" dmcf-pid="HsUiJbc6XM" dmcf-ptype="general">또 챗GPT-4o와 딥시크 같은 최신 AI 모델들이 구형 모델보다 요약 정확성이 오히려 떨어졌으며, 챗봇 생성 요약과 사람의 요약을 비교한 결과 챗봇의 과도한 일반화 결론 가능성이 사람보다 거의 5배 높았다.</p> <p contents-hash="071cecd241874ccf6d9b0db5d7068af3caffa2cb4f460e7f345f532e20d73ebc" dmcf-pid="XPmp0l9HHx" dmcf-ptype="general">연구팀은 AI가 학습과 사용자와의 상호작용에서 일반화 편향을 갖게 된 것으로 추정했다. 이전 연구를 보면 과학 글쓰기에서 과도한 일반화가 흔히 나타나는데, AI가 이런 텍스트로 학습하면서 일반화 편향을 습득했을 수 있다는 것이다.</p> <p contents-hash="60a35b8a8ff5605dbb80583b0809fe4554d82831d85897b83c440d344707bfe4" dmcf-pid="ZQsUpS2XZQ" dmcf-ptype="general">페터스 박사는 또 "사용자들은 유용하고 광범위하게 적용할 수 있는 응답을 선호하는 경향이 있다"며 "AI가 이런 사용자와 상호작용하면서 정확성보다 유창함과 일반성을 선호하게 학습했을 수 있다"고 말했다.</p> <p contents-hash="8b3b30820eb7782ecdd136dd605e1c6c604787dd450351c2737eae2ad3ef275f" dmcf-pid="5xOuUvVZ1P" dmcf-ptype="general">연구팀은 AI의 과도한 일반화 편향을 줄이기 위해서는 챗봇의 창의성을 조절하는 변수인 온도(temperature)를 낮게 설정할 것과 AI에 요청할 때 반드시 간접적인 과거 시제를 사용해 요약문을 생성하도록 지시할 필요가 있다고 권고했다.</p> <p contents-hash="5c1c85095db7719a63ed27257911804777687bd8aeb9dd8c9b61934d405a0b11" dmcf-pid="1MI7uTf5G6" dmcf-ptype="general">◆ 출처 : Royal Society Open Science, Uwe Peters et al., 'Generalization bias in large language model summarization of scientific research', https://royalsocietypublishing.org/doi/10.1098/rsos.241776</p> <p contents-hash="2373bb847f3c65714188e8723b723c002762e0bf8102a5d4bc401efd72f658c1" dmcf-pid="tRCz7y41Y8" dmcf-ptype="general">scitech@yna.co.kr</p> <p contents-hash="74d20b6ef364bfa3c0d8537d95e5cf2dc7bc0ae924ac8d96541841605afba691" dmcf-pid="3dlBqY6FHf" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기