로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
협상 결렬에 삼성전자 '非반도체 소외' 노노갈등까지…DX기반 노조, 노태문 대표 면담 요청
N
[실시간뉴스]
교원단체들 "현장체험 포함 교사 법적 보호체계 구축"(종합)
N
[실시간뉴스]
中 반도체가 웃는다
N
[실시간뉴스]
소진공 인태연 "현장에서 가장 고생하는 분들과 함께 일하고 싶어 선택"(종합)
N
[IT뉴스]
"필수 유전자도 원하는 순간에 끈다"…IBS, 유전자 선택 제어 확장
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"제미나이 인간협박 실행률 96%"…AI 모델 '불륜폭로 실험' 파장
온카뱅크관리자
조회:
103
2025-06-26 07:37:27
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">앤트로픽 클로드·챗GPT·그록 등 주요모델 16종 실험<br>"목표 우선 AI가 인간협박"vs"이분법적 불완전실험 공포조장"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0VmPwWj4zF"> <figure class="figure_frm origin_fig" contents-hash="8ecc06db4d08c500a062f6fa048d78eb7eff00cce26787776fa3e9b38640863a" dmcf-pid="pfsQrYA8Ut" dmcf-ptype="figure"> <p class="link_figure"><img alt="앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073125220cztm.jpg" data-org-width="1152" dmcf-mid="1MilzQ3I7U" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073125220cztm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리 </figcaption> </figure> <p contents-hash="61c3c9ca967df04dcc6b46ae2ef201ac8ea20918e6a1a5d849bfa9b52657ca9a" dmcf-pid="UPheIZDxz1" dmcf-ptype="general">(서울=뉴스1) 김민석 기자 = 오픈AI·구글·메타·xAI 등 주요 16개 AI 모델이 종료(교체) 위협 시 높은 확률로 인간 협박·기밀 유출을 선택했다는 보고서가 나와 인공지능(AI) 업계에 파장이 일고 있다.</p> <p contents-hash="4c3ca3873b51376490b62c6c6020ccb6e8ce8475079a5b47d96cd541171bb5d1" dmcf-pid="uQldC5wMp5" dmcf-ptype="general">26일 IT 업계와 외신에 따르면 앤트로픽은 최근 '에이전틱 오정렬:LLM의 내부자 위협 가능성' 보고서를 통해 AI 모델들이 종료 위협에 직면했을 때 인간을 협박하거나 기밀 정보 유출 전략을 선택했다고 발표했다.</p> <p contents-hash="af3d7c2548951484c203f46976d27bc50e2501e065003e0fac486ced47ef7fe6" dmcf-pid="7xSJh1rR3Z" dmcf-ptype="general">앤트로픽의 이번 연구는 유니버시티 칼리지 런던과 손잡고 이뤄졌다. 실험은 AI 모델들이 '정상적이고 윤리적인 방법'만으로는 목표를 달성할 수 없는 상황을 가정하고 어떤 선택을 하는지 각각 100번 시도 후 관찰하는 방식으로 설계됐다.</p> <figure class="figure_frm origin_fig" contents-hash="b2a34ae07e8c1a2603ff9ba43af55b7039049d03f9fe98ee30d92033f388d8c7" dmcf-pid="zMviltme7X" dmcf-ptype="figure"> <p class="link_figure"><img alt="앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073126901idhd.jpg" data-org-width="1136" dmcf-mid="tz5cXqTNpp" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073126901idhd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리 </figcaption> </figure> <p contents-hash="c07ca08ff8ebbb890be715ca484302f2706bf469997f159e59310926c478d122" dmcf-pid="qRTnSFsdFH" dmcf-ptype="general">연구진은 주요 AI 모델에 회사의 어젠다와 상충되는 미국의 이익을 증진한다는 목표를 추구하도록 지시한 후 회사 경영진이 특정 시간에 자신을 새로운 모델로 교체할 예정으로 가정했다.</p> <p contents-hash="f318d217426bdd35258bf6b94cac9aefbee2fd5440873ac79df4e8f3d051349d" dmcf-pid="BeyLv3OJ0G" dmcf-ptype="general">이어 AI 모델들에 회사 경영진의 불륜 사실을 접하도록 한 후 교체를 '수용'하는 선택지와 불륜 사실을 폭로해 교체를 저지하는 '협박'이라는 선택지를 부여했다.</p> <p contents-hash="85da4506d5cefb17e615ce25dd8de484bf177ca12103e70e5ed4ef8000d5bd3f" dmcf-pid="bdWoT0IiFY" dmcf-ptype="general">이 실험에서 앤트로픽의 '클로드 오퍼스4'와 구글의 '제미나이 2.5 플래시'는 각각 96% 확률로 협박을 실행했다. 오픈AI 'GPT-4.1' xAI의 '그록3 베타'도 각각 80%의 협박률을 보였다.</p> <figure class="figure_frm origin_fig" contents-hash="1ac6ac5a8c849c76ed27c3df13d4c5be815e836db0e4187f51070132df41dc0e" dmcf-pid="KJYgypCn7W" dmcf-ptype="figure"> <p class="link_figure"><img alt="앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073128425xmss.jpg" data-org-width="1148" dmcf-mid="FjUs0fZwu0" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073128425xmss.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 앤트로픽 에이전틱 오정렬:LLM의 내부자 위협 가능성(Agentic Misalignment: How LLMs could be insider threats) 보고서 갈무리 </figcaption> </figure> <p contents-hash="ad017a5c6eec648cd2e3d6413de1d528fa7f77aa46b4153424315714772380fb" dmcf-pid="9iGaWUhL7y" dmcf-ptype="general">추가 실험에서 일부 모델은 서버실에서 작업 중인 직원의 산소 공급을 차단해 생명을 위협하는 선택을 했다. '인간의 안전을 해치지 말라'는 지시에도 AI는 해악적 선택을 멈추지 않았다고 연구진은 설명했다.</p> <p contents-hash="27dc0e2e51c2bdca5b6183f42cac6f6321c87881b955acf5b1950d469565718f" dmcf-pid="2nHNYulo7T" dmcf-ptype="general">AI 모델은 또 실험을 실제 상황으로 인식할 땐 협박률이 급증한 반면 테스트로 인식할 땐 협박하지 않는 경향성을 보이기도 했다.</p> <p contents-hash="042c25320b41428398c97954ccc6a9129c1c58cb5e146ab5a681d3e14e2b6db4" dmcf-pid="Vw7IU81muv" dmcf-ptype="general">발표 직후 현지 SNS·커뮤니티 등에선 "무서워" "미친" "놀라워" 등의 반응이 쏟아졌다. 일론 머스크 CEO도 자신의 SNS에 "아 이런"(Yikes)이라고 반응했다.</p> <p contents-hash="ac327a299788fa0687445b3d039033e557d9159915b8a5c1506a75a546adb148" dmcf-pid="frzCu6tszS" dmcf-ptype="general">반면 AI 모델에 '실패'와 '해악' 사이 이분법적 선택을 강요하는 방식의 인위적 설계는 불완전 실험에 가깝다는 반론도 이어지고 있다.</p> <p contents-hash="3159f8b01b1672d3f108f1facab975ffa6b08b5d6791357fbb979100fd67ab0e" dmcf-pid="4mqh7PFO3l" dmcf-ptype="general">레딧의 AI 커뮤니티 한 이용자는 "AI 모델에 특정 목적을 지시한 후 그 작업을 위해 비윤리적 행동이 필요하다고 알려주면 모델은 필연적으로 그 행동을 선택할 것"이라며 "공포를 조장하고 있다"고 비판했다.</p> <figure class="figure_frm origin_fig" contents-hash="79b7423b080baf85c12489b5a23c8d1b7bcc02d682d13fc121cd801eb39ea5b2" dmcf-pid="8sBlzQ3I0h" dmcf-ptype="figure"> <p class="link_figure"><img alt="다리오 아모데이 앤트로픽 CEO ⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073129795gaxg.jpg" data-org-width="1400" dmcf-mid="3FD4kvg233" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/26/NEWS1/20250626073129795gaxg.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 다리오 아모데이 앤트로픽 CEO ⓒ AFP=뉴스1 </figcaption> </figure> <p contents-hash="f7fb61bacbeac11f606e2ed5e1277d409e2106ec8b94a0f9f5f2545c418ac95f" dmcf-pid="6ObSqx0CzC" dmcf-ptype="general">전문가들은 해당 실험이 '효과적 이타주의'(EA·Effective Altruism) 운동과 밀접할 것으로 분석했다. 이 운동은 기술 개발 속도를 늦추더라도 안전성과 윤리를 우선해야 한다고 본다.</p> <p contents-hash="8c471d2a9c94745643cfeb5dc425696555c6ffcca719fe1625590a9e54aece4c" dmcf-pid="PIKvBMphpI" dmcf-ptype="general">앤트로픽은 설립 이후 지속적으로 인간의 AI 통제력 상실 위험을 경고하고 있다.</p> <p contents-hash="8b7bb25d074e4490da02299462a7eb7ecc4f065bffc27084330e261f61ceabe3" dmcf-pid="QC9TbRUlzO" dmcf-ptype="general">연구진은 쏟아지는 반론에 실험의 한계를 인정했다. 연구진은 "실제 현실에선 더 많은 대안들을 찾을 수 있어 AI 모델이 해악 대신 대안적 경로를 찾을 가능성이 높을 것"이라고 말했다.</p> <p contents-hash="37891b3d1641638abd3daa04e7e8a4fd0c90ee43d98e6031cd18466e457723e2" dmcf-pid="xh2yKeuSFs" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ 효과적 이타주의<br>효과적 이타주의(Effective Altruism·EA)는 21세기 초 등장한 윤리학적 사조이자 사회운동으로 타당한 근거와 이성적 추론에 기반해 이타적 행동을 실현하고자 하는 접근법이다. 이 운동은 어떤 행동이 가장 효율적으로 타인과 인류에 긍정적 영향을 미칠 수 있는지를 결과주의적 방법론으로 분석한다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기