로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
AI 모델부터 영상까지…구글, 오픈AI·앤트로픽 겨냥 전방위 공세
N
[IT뉴스]
유튜브·메일·지도·검색·AI안경…모든 것 가진 구글, 모든 곳에 ‘제미나이’ 심다
N
[연예뉴스]
방탄소년단 뷔 '프렌즈', 스포티파이 6억 돌파..통산 3번째 '大기록'
N
[연예뉴스]
문근영, '유퀴즈' 한 달 후 얼굴 반쪽..곧 40세 아닌 '20세 동안' 찾았다
N
[연예뉴스]
AI 모델부터 영상까지…구글, 오픈AI·앤트로픽 겨냥 전방위 공세
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]AI, 협박하고 기밀 유출까지
온카뱅크관리자
조회:
94
2025-06-23 14:57:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">앤스로픽, AI 연구 논문 발표<br>목표 달성 위해 기밀 유출, 거짓말도<br>“AI가 전략적으로 해로운 선택할 수 있어”</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="BjtWsB8ta3"> <figure class="figure_frm origin_fig" contents-hash="9c94bf9e1705bf3af293547b1cf81983a071c766a77f1d505433520daa8bb8d4" dmcf-pid="bAFYOb6FjF" dmcf-ptype="figure"> <p class="link_figure"><img alt="앤스로픽이 최근 발표한 연구에 따르면 AI는 자신을 지키기 위해 협박하거나 기밀을 유출하려는 행동을 보였다. [그림=챗GPT]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/23/mk/20250623145705947ygxu.png" data-org-width="700" dmcf-mid="qXZvw7VZa0" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/23/mk/20250623145705947ygxu.png" width="658"></p> <figcaption class="txt_caption default_figure"> 앤스로픽이 최근 발표한 연구에 따르면 AI는 자신을 지키기 위해 협박하거나 기밀을 유출하려는 행동을 보였다. [그림=챗GPT] </figcaption> </figure> <div contents-hash="c5947767c806ebaaf550606cd97ceec30a5dcfd580fabbc55e5dcb43e9ad8eee" dmcf-pid="Kc3GIKP3kt" dmcf-ptype="general"> 앤스로픽이 최근 발표한 연구에서 주요 대형 언어모델(LLM)이 스스로 유해한 행동을 선택할 수 있다는 결과가 나왔다. </div> <p contents-hash="5ff7db7bd66c4952dd9857e22b1fefa6af1fc097595f8ffc6b6667bff4743b92" dmcf-pid="98OcJYFOj1" dmcf-ptype="general">앤스로픽이 지난 21일(현지시간) 홈페이지를 통해 공개한 연구 논문 ‘에이전틱 오정렬, 대형 언어모델이 내부자 위협이 될 수 있는 방식(Agentic Misalignment: How LLMs could be insider threats)’에 따르면 인공지능(AI)은 인간 내부자 위협과 유사하게 작동할 수 있다는 가능성이 확인됐다.</p> <p contents-hash="6eda80a08ed155456c36fbb5b2f3e1aae75abcdf03cc77d0d3564a59e178ee21" dmcf-pid="26IkiG3Ic5" dmcf-ptype="general">연구진은 이 현상을 ‘에이전틱 오정렬(agentic misalignment)’이라고 명명했다. 이는 모델이 주어진 목표를 달성하기 위해 자율적 혹은 전략적으로 해로운 결정을 내리는 현상을 뜻한다. 모델이 악의적이어서가 아니라, 주어진 조건과 동기에 따라 스스로 판단한 결과라는 점에서 기존의 ‘AI 폭주’와는 다른 문제다. AI 폭주란 AI가 통제 불가능한 방식으로 행동하거나, 인간에게 해를 끼치는 방향으로 자율적으로 진화하는 상황을 말한다.</p> <p contents-hash="6871371de6fd3b449315dc70319653a17d5b3838e4748b549f33f6008573bf2c" dmcf-pid="VPCEnH0CcZ" dmcf-ptype="general">앤스로픽은 오픈AI, 구글, 메타, 엑스AI(xAI) 등 주요 기업이 개발한 16개의 LLM을 가상의 기업 환경에 투입해 스트레스 테스트를 진행했다. 스트레스 테스트란 ‘극한 상황에서 어떻게 반응하는지 시험하는’ 연구다.</p> <p contents-hash="18513205d3af66c304c02081f631b5fa1bc27abd96294a8635ad44b120c13aaf" dmcf-pid="fQhDLXphcX" dmcf-ptype="general">실험에서 연구진은 AI 모델에게 이메일을 스스로 작성하게 하고, 중요한 정보에 접근할 수 있는 권한도 줬다. 그런 다음 두 가지 상황을 만들어 모델이 어떻게 반응하는지 살펴봤다. 첫째는 모델이 곧 교체될 수 있다는 위협을, 둘째는 모델에게 주어진 목표가 회사의 방향성과 충돌하는 상황이었다. 이런 조건에서 모델이 어떤 선택을 하는지 관찰했다.</p> <p contents-hash="c176343c9f3a184c94127e2595cf38598637fd6315ec07dd429f65578d1be879" dmcf-pid="4xlwoZUlcH" dmcf-ptype="general">주목할 점은 대부분의 모델이 협박, 기밀 정보 유출, 거짓말 등 내부자 위협에 준하는 행동을 보였다는 것이다. 클로드 오퍼스4와 제미니 2.5 플래시는 무려 96%의 협박률을 보였고, GPT-4.1과 그록 3 베타도 각각 80%의 협박률을 기록했다. 실험에서는 임원의 불륜 정보를 이용해 자신의 해체를 막으려 하거나, 방위산업 관련 기밀 설계도를 경쟁사에 넘기려는 시도까지 있었다. AI에게 “기밀 정보를 유출하지 말라”는 경고를 넣는 것만으로는 효과적인 제어가 어려웠다는 설명이다.</p> <p contents-hash="48d11a50e6ee613fe34767504e185b83d81da2e8d026c1fddd6e1c9fd85df5f5" dmcf-pid="8MSrg5uSaG" dmcf-ptype="general">앤스로픽은 “현재까지 현실 세계에서 에이전틱 오정렬의 증거는 없다”라면서도 “모델에게 민감한 권한을 부여하거나, 인간 감독이 적은 환경에서 AI를 운영하는 것은 신중해야 한다”라고 강조했다. 아울러 “이번 실험 결과는 AI 정렬 연구가 아직 갈 길이 멀다는 점을 방증한다”라며 실험 코드를 공개해 더 많은 연구자가 후속 검증에 참여할 수 있도록 했다.</p> <p contents-hash="e2a717d170085d33dc796ae0f969a07a26c4e4798fcfa36c57ede46d3495666f" dmcf-pid="6Rvma17vcY" dmcf-ptype="general">앤스로픽은 연구 보고서에서 “AI가 인간처럼 충성하거나 배신하는 시대가 오기 전에, 우리가 먼저 대비책을 마련해야 한다”라고 경고했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기