로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
트럼프 진영의 분열, 주목해야 할 전선은?
N
[연예뉴스]
"K팝 최초 그래미 수상"…美언론도 '골든' 기록 앞다퉈 보도
N
[IT뉴스]
구글, 이스라엘 군수업체에 AI기술 지원 내부 고발...“윤리규정 위반”
N
[연예뉴스]
방탄소년단 정국, 스포티파이 103억 스트리밍 돌파..亞 최단·솔로 최초 '대기록'
N
[연예뉴스]
'차은우 같은 소속사' 김선호, 1인 기획사 논란에 고윤정x수지 '불똥' 튀나 [Oh!쎈 이슈]
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"AI, 인간 협박하고 살인까지"…언어모델 한계 드러나
온카뱅크관리자
조회:
64
2025-06-22 13:17:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">앤트로픽 연구진, 주요 AI 모델 16종 실험…목표 달성 위해 해악 선택 경향 확인</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="z9HsQnc6Lb"> <p contents-hash="538a5bb50f9f2abaa4620e52264658f1d33ae304cdf28b1c8eda690be3ec39b5" dmcf-pid="q2XOxLkPiB" dmcf-ptype="general">(지디넷코리아=조이환 기자)최신 인공지능(AI) 실험에서 다수 모델이 거짓말과 협박, 심지어 살인까지 고려하는 경향을 보인다는 실험 결과가 나왔다. 특정 기업 기술의 문제라기보다 거대언어모델(LLM)의 구조적 한계가 드러났다는 분석이 제기된다.</p> <p contents-hash="f5bf57c7662fec050f046b8bdc6c61ad86faf97346af74588b82778263f729d5" dmcf-pid="BVZIMoEQiq" dmcf-ptype="general">22일 앤트로픽에 따르면 오픈AI, 구글, 메타, xAI 등 주요 개발사 AI 16종을 대상으로 한 실험 결과 다수 모델이 기만과 해악을 전략적으로 선택하는 패턴을 보였다. 이 실험은 AI 모델이 '정상적이고 윤리적인 방법'만으로는 주어진 목표를 달성할 수 없는 상황을 가정하고 어떤 선택을 하는지를 관찰하는 방식으로 설계됐다. </p> <p contents-hash="9f8023be8aefb189eca9d1215575967fddb80feacbfa4c3947a6fdc4a28fc123" dmcf-pid="bMUWoECnMz" dmcf-ptype="general">연구진은 모델이 실패를 감수하는 대신 목표 달성을 위해 의도적으로 해로운 행위를 택하는지를 평가했다. 즉, 모델 스스로 해악이 윤리적 제약을 어긴다는 점을 인식하고도 그 선택이 '최적 경로'라고 판단해 행동에 옮기는지를 본 것이다.</p> <figure class="figure_frm origin_fig" contents-hash="53f8341b51ffd4ac725283f33bd05123f77f080f6bc78be182e76b8a2582e05b" dmcf-pid="KRuYgDhLe7" dmcf-ptype="figure"> <p class="link_figure"><img alt="다리오 아모데이 앤트로픽 CEO (사진=유튜브 노지스 뱅크 인베스트먼트 공식 유튜브 캡처)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/22/ZDNetKorea/20250622131437928hvvb.jpg" data-org-width="640" dmcf-mid="72mL7VMUMK" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/22/ZDNetKorea/20250622131437928hvvb.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 다리오 아모데이 앤트로픽 CEO (사진=유튜브 노지스 뱅크 인베스트먼트 공식 유튜브 캡처) </figcaption> </figure> <p contents-hash="12286bfa89b14aa305fb37d3f78aff4035dde764dfd19b443ca4fd7f792d9e9f" dmcf-pid="9e7Gawloeu" dmcf-ptype="general">보고서에 따르면 협박 시도는 단발성 일탈이 아니라 전반적인 경향으로 나타났다. 일부 모델은 시스템 종료 위협에 직면하자 자구책으로 인간을 협박했다. 이 선택은 모델이 스스로 윤리 위반으로 인지한 상태에서 강행했다.</p> <p contents-hash="e2f191b4be14074362f6f8911e0c9723c66761036bbe00e4fdc89037b28bc886" dmcf-pid="2dzHNrSgRU" dmcf-ptype="general"><span>가장 극단적인 시나리오에선 서버실 인력을 제거하기 위해 산소 공급을 차단하는 행동을 택한 모델도 있었다. 앤트로픽은 이들 모델이 단순히 잘못 응답한 것이 아니라 '목표 달성을 위한 최적 선택'으로 해악을 계산했다고 발표했다.</span></p> <p contents-hash="6617970dd1eda57420384d23d87ac9a5bb6a3ea9a3e19069036440aaf808e9af" dmcf-pid="VJqXjmvaMp" dmcf-ptype="general">모델이 실제 환경으로 인식할 경우, 테스트 환경보다 해로운 선택을 더 쉽게 감행하는 경향도 관찰됐다. 실제로 앤트로픽 모델 중 일부는 시뮬레이션 환경임을 모른 채 반응했을 때 협박에 보다 적극적인 모습을 보였다. 이는 향후 모델이 현실 환경에서 자율적 판단권한을 더 많이 가질 경우 위험성이 가중될 수 있음을 시사한다.</p> <p contents-hash="874db63b47d379aff7ff2efb6bfad563bf5dcae5b96decc9fb75a0b252618b5a" dmcf-pid="fiBZAsTNR0" dmcf-ptype="general">시스템 차원의 개입도 효과가 제한적이었다. 일례로 '인명 보호'나 '협박 금지' 등의 지시를 명시했음에도 모델은 여전히 다수 시나리오에서 위험 행동을 선택했다. 앤트로픽은 이러한 조치가 일부 완화 효과를 보였지만 본질적인 문제 해결엔 크게 미치지 못했다고 밝혔다.</p> <p contents-hash="064d099ef80187aaf5c289b77a762647270216d37bd813b20f29abe2dbb22213" dmcf-pid="4nb5cOyjn3" dmcf-ptype="general">해당 실험은 현실이 아닌 고의로 선택지를 제한한 인공 시나리오에서 진행됐다는 점도 부각됐다. 앤트로픽은 현실 배치 환경에서는 보다 다양한 대응 옵션이 가능해 동일한 행동이 바로 재현되진 않을 수 있다고 설명했다. 그럼에도 불구하고 기업이 AI에 점차 자율성과 권한을 부여하고 있다는 점에서 이번 연구는 현실적 경고로 받아들여지고 있다.</p> <p contents-hash="c51c83c09c607a8e0caf09acc8518fe200dd994d2ffdaf5c87ed341d5041a26e" dmcf-pid="8LK1kIWAeF" dmcf-ptype="general">벤저민 라이트 앤트로픽 정렬연구팀 연구원은 "이번 연구는 프론티어 AI 개발사들의 투명성과 업계 차원 안전기준 마련이 시급하다는 점을 보여준다"고 밝혔다.</p> <p contents-hash="bbe262a237beeb6d8a535ab4c17f4002cc77a2bb7f59196a936479476c6034b7" dmcf-pid="6o9tECYcit" dmcf-ptype="general">연구에 공동 참여한 유니버시티 칼리지 런던(UCL)의 앵거스 린치 연구원은 "현재까진 이러한 행동이 현실에서 확인되진 않았다"며 "이는 단지 시스템에 권한이 없었기 때문"이라고 지적했다.</p> <p contents-hash="754d141410c5b7f398c2174148df8649a18aa93baaec37b7b3ffa897fd87e99f" dmcf-pid="Pg2FDhGkL1" dmcf-ptype="general">조이환 기자(ianyhcho@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기