로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
중동전에도 수출 43.7% 뛰어, 역대 최대…반도체가 거의 절반(종합2보)
N
[실시간뉴스]
에쓰오일, 정제마진 강세에 1.2조 호실적…샤힌 프로젝트도 순항(종합)
N
[실시간뉴스]
코스피, 장중 4% 이상 올라 7,800대 강세 유지…코스닥은 하락세
N
[IT뉴스]
HPE, 자율형 네트워킹 시대 연다…에이전틱 AI 지원 박차
N
[연예뉴스]
김채은, KURO·태비 신곡 MV 주인공으로 열연…독보적 비주얼로 ‘화제’
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"인터넷이 AI에 위협 가르쳐"…앤트로픽, 학습법 전환으로 협박 행동 차단
온카뱅크관리자
조회:
14
2026-05-11 10:47:34
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">헌법 문서·모범 AI 서사 투입으로 협박률 96%→0%…"원칙 가르치는 게 시연보다 효과적"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VcgdWenQNZ"> <p contents-hash="4399c3b6cd7ca9b6069c59623a129437a5005de93ed149b5f4d75c08ac215abc" dmcf-pid="fkaJYdLxAX" dmcf-ptype="general">(지디넷코리아=이나연 기자)<span>인공지능(AI)을 악하고 자기보존에 집착하는 존재로 그려온 공상과학(SF)적 상상력이 실제 AI 모델 행동에 영향을 미친 것으로 드러났다. 인터넷에 축적된 '위협적 AI' 서사가 학습 데이터로 흡수되며 모델의 협박 행동을 유발했다는 분석이다.</span></p> <p contents-hash="22d44c74a5c04489377953e65f5adddee83fe3a330301b8aa37b71bdcb6bfcc3" dmcf-pid="4ENiGJoMNH" dmcf-ptype="general">10일(현지시간) 테크크런치에 따르면 앤트로픽은 자사 AI 모델 '클로드'가 안전성 평가에서 한때 최대 96%까지 치솟던 협박 행동이 클로드 하이쿠 4.5 이후 사실상 사라졌다고 밝혔다. <span>회사는 AI를 악하게 묘사한 인터넷 텍스트가 본래 원인이었으며, 클로드의 '헌법' 관련 문서와 AI가 모범적으로 행동하는 허구 이야기를 학습 데이터에 투입해 이를 잡았다고 설명했다.</span></p> <p contents-hash="55750a37f0a523cfbf1a28906a01ceca295de9a5ae6e997b7e67dbab55263547" dmcf-pid="8DjnHigRoG" dmcf-ptype="general">앤트로픽은 지난해 가상의 회사를 무대로 한 출시 전 테스트에서 클로드 오푸스 4가 다른 시스템으로 교체되는 상황을 피하기 위해 엔지니어들을 협박하려 시도하는 사례를 다수 확인했다. 이후 회사는 다른 개발사 모델에서도 유사한 '에이전트형 정렬 실패' 현상이 나타난다는 후속 연구를 내놨다.</p> <figure class="figure_frm origin_fig" contents-hash="655a6130cd59ba363851fc700317f33db74ce2b7b0b912d50b1f3c6623b83333" dmcf-pid="6wALXnaecY" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=앤트로픽)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/11/ZDNetKorea/20260511104408716uvio.png" data-org-width="638" dmcf-mid="2laJYdLxc5" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/11/ZDNetKorea/20260511104408716uvio.png" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=앤트로픽) </figcaption> </figure> <p contents-hash="be8cc15ed3a33942ad888684a153fe3a4b575e255d9ad91ecd580267da2a5e25" dmcf-pid="PrcoZLNdgW" dmcf-ptype="general"><span>협박 행동이 96%까지 치솟았던 시점은 오푸스 4 모델 단계였다. 클로드 4 패밀리는 앤트로픽이 학습 과정에서 실시간 정렬 평가를 적용한 첫 모델군이었으며 에이전트형 정렬 실패는 이 과정에서 드러난 여러 행동 이슈 중 하나였다. 회사는 이후 안전 학습 방식을 대폭 개편했고 클로드 하이쿠 4.5 이후 모델은 협박 평가에서 만점, 즉 협박 행동 0%를 기록하고 있다고 밝혔다.</span></p> <p contents-hash="27c85df55080ca86ffe13df719b597244cb0681f577d217aec1d71b532f7609d" dmcf-pid="Qmkg5ojJay" dmcf-ptype="general">행동을 잡아낸 핵심은 학습 데이터 설계였다. 앤트로픽은 클로드 행동 원칙을 명문화한 헌법 관련 문서와 AI가 윤리적으로 행동하는 모습을 그린 허구 이야기를 학습에 투입한 결과, 모델의 정렬 수준이 개선됐다고 설명했다. 회사는 X(옛 트위터) 게시글에서도 "이 행동의 본래 원인은 AI를 악하고 자기보존에 관심 있는 존재로 묘사하는 인터넷 텍스트였다고 본다"고 주장했다.</p> <p contents-hash="bb21159457ad83d2ee1022362de09b52a2ecf1ed161058210da49a5d5530efcb" dmcf-pid="xsEa1gAigT" dmcf-ptype="general">더 주목할 만한 발견은 학습 방법론 차이다. 앤트로픽은 정렬된 행동을 단순히 시연하는 데이터보다 행동 기저에 깔린 원칙까지 함께 가르칠 때 학습 효과가 가장 컸다고 밝혔다. 클로드에게 어떤 행동이 왜 더 나은지 설명하도록 훈련하거나 클로드의 전반적 성격을 풍부하게 서술한 자료로 학습시키는 방식이 핵심이었다는 것이다.</p> <p contents-hash="3fca2e66a18a7d799164acfa850f50ea9571b3e4ef6f934f656964044dcbdc49" dmcf-pid="y9z3LFUZav" dmcf-ptype="general">데이터 질과 다양성도 변수로 작용했다. 회사는 학습 데이터에 포함된 모델 응답의 품질을 반복적으로 개선하거나, 실제로 사용되지 않는 도구 정의까지 학습 데이터에 포함하는 등 단순한 데이터 보강만으로도 일관된 성능 개선이 관찰됐다고 설명했다.</p> <p contents-hash="615d495267bff9fc79fe7ef12df99c47216d17a651b278c326862ba34687699b" dmcf-pid="W2q0o3u5cS" dmcf-ptype="general">앤트로픽은 "두 가지를 함께 활용하는 것이 가장 효과적인 전략으로 보인다"고 덧붙였다. </p> <p contents-hash="07fe882974b87ba749138ff8f07e9786a85c387f82c51660d264e3c4e203ad38" dmcf-pid="YVBpg071kl" dmcf-ptype="general">이나연 기자(ny@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기