로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[스포츠뉴스]
대구광역시청, 이원정 9골·노희경 8골 앞세워 시즌 첫 승… 인천광역시청 6연패
N
[스포츠뉴스]
맙소사! 천하의 조코비치 잡고 '41억 돈방석' 앉았다, '최연소 세계 1위' 알카라스, 호주오픈 우승...'차세대 테니스 황제 증명'
N
[스포츠뉴스]
정상 오른 리바키나, 드레스 입고 기념 촬영
N
[스포츠뉴스]
'신성' 알카라스, '전설' 조코비치 꺾고 최연소 커리어 그랜드슬램 달성
N
[스포츠뉴스]
알카라스, 역대 최연소 커리어 그랜드 슬램 달성
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]헉! AI도 거짓말을?…앤트로픽, '클로드' 추적 실험 결과는
온카뱅크관리자
조회:
89
2025-03-30 11:17:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">수학 추론부터 거짓 논리 조작까지…AI 실시간 '생각 회로' 추적 실험 결과 공개</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="XuJrZAOJkk"> <p contents-hash="d586db61802c584e6f0b179c9e6351d09e31938ad9d4bf61ef5f6bd574c54e37" dmcf-pid="Z7im5cIiac" dmcf-ptype="general">(지디넷코리아=조이환 기자)앤트로픽이 자사 인공지능(AI) 모델 '클로드'의 내부 회로를 추적한 결과, 모델이 실제로 미리 계획해 글을 쓰고 언어를 초월해 사고하며 그럴듯한 거짓 논리를 만들어낸다는 사실이 확인됐다. AI가 생각하는 과정이 단순 예측이 아니라 복잡한 개념 회로의 작동 결과라는 점에서 모델의 사고 메커니즘이 시각적으로 처음 입증된 셈이다.</p> <p contents-hash="221236ac03431b831d39bf6febf5807cf7f1c5438975180547010696c30c77c9" dmcf-pid="5zns1kCnjA" dmcf-ptype="general">30일 업계에 따르면 앤트로픽은 최근 'AI 현미경'이라 불리는 해석 기법을 통해 '클로드 3.5 하이쿠' 모델의 내부 연산 회로를 시각화한 두 편의 연구 논문을 발표했다. 이 방법은 언어모델의 '생각 과정'을 신경망 수준에서 추적해 실제로 어떤 개념이 활성화되고 어떤 경로로 답이 생성되는지를 보여준다.</p> <p contents-hash="1ad5837a3edb2e75d1a85530013d4f60a618b798643bea1d2db63e30a5200747" dmcf-pid="1qLOtEhLkj" dmcf-ptype="general">연구에 따르면 클로드는 단순히 직전 단어를 예측하는 것이 아니라 몇 단어 이상을 미리 생각하며 문장을 짓는다. 일례로 "그랩 잇(grab it)"으로 끝나는 문장 다음 줄에서 "래빗(rabbit)"과 같은 라임을 미리 떠올린 뒤 그 단어로 끝나도록 문장을 구성하는 식이다. 이 '계획'은 실험을 통해 인위적으로 바꿔볼 수 있었으며 이에 따라 다른 라임으로 문장이 바뀌는 것도 확인됐다.</p> <figure class="figure_frm origin_fig" contents-hash="c0bdccd89174300c838aa8f898c19d7b38fe44a7b1364470996a57d83df0405d" dmcf-pid="tBoIFDlocN" dmcf-ptype="figure"> <p class="link_figure"><img alt="앤트로픽이 자사 인공지능(AI) 모델 '클로드'의 내부 회로를 추적한 결과, 모델이 실제로 미리 계획해 글을 쓰고 언어를 초월해 사고하며 그럴듯한 거짓 논리를 만들어낸다는 사실이 확인됐다. (사진=앤트로픽)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202503/30/ZDNetKorea/20250330111022919lqmh.jpg" data-org-width="640" dmcf-mid="GLS0PZuSaD" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/30/ZDNetKorea/20250330111022919lqmh.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 앤트로픽이 자사 인공지능(AI) 모델 '클로드'의 내부 회로를 추적한 결과, 모델이 실제로 미리 계획해 글을 쓰고 언어를 초월해 사고하며 그럴듯한 거짓 논리를 만들어낸다는 사실이 확인됐다. (사진=앤트로픽) </figcaption> </figure> <p contents-hash="fa9c89267e307c7fb6579247768b02f7b984510c9e6257d11b838584d1999174" dmcf-pid="FbgC3wSgca" dmcf-ptype="general">'클로드'의 다국어 능력도 이와 유사한 메커니즘에서 비롯된 것으로 밝혀졌다. 영어, 프랑스어, 중국어 등 서로 다른 언어로 "작은 것의 반대말은 무엇인가"라는 질문을 해도 '클로드'는 공통된 개념 회로를 먼저 활성화하고 이를 각 언어로 '번역'해 내놓는 식이었다. 세 언어에 걸쳐 공통 회로가 작동한다는 건 '언어 이전의 개념 공간'이 존재한다는 뜻이다.</p> <p contents-hash="10999203c86a8b8f4e86d8874aac8b7db7b72de799dc94b57dab6bb8496f4519" dmcf-pid="3Kah0rvaog" dmcf-ptype="general">간단한 덧셈 문제처럼 보이는 수학 계산도 단순 암기나 공식 적용이 아닌 복잡한 병렬 연산을 통해 해결됐다. 예를 들어 '36+59'라는 문제를 풀 때는 한쪽 회로에서 대략적인 합을 추산하고 다른 쪽에서는 '6+9'처럼 뒷자리를 정확히 계산하는 식이다. 이를 결합해 최종 답을 도출하는 구조가 관찰됐다.</p> <p contents-hash="4209cb5ccc31a591fdc67f5adbc9815e13c2d568d979cbfb25103febb8012f6c" dmcf-pid="0yKJsQLKoo" dmcf-ptype="general">다만 '클로드'는 스스로 이 과정을 인식하지 못했다. 앤트로픽 측이 '어떻게 계산했느냐'고 묻자 "받아올림법을 사용했다"는 식으로 인간 방식처럼 설명했지만 실제 내부 회로는 전혀 다른 방식으로 작동하고 있었다.</p> <p contents-hash="ad29b345e5b9d245f0f858ac8afcb99aa53e88a2587972aa332e94de0bcfaaa9" dmcf-pid="pW9iOxo9NL" dmcf-ptype="general">더 심각한 문제는 '논리 조작'이다. 어려운 문제를 제시하고 틀린 힌트를 함께 주면 '클로드'는 정답보다 힌트에 맞춘 설명을 만들어낸다. 논리적으로 맞는 척하지만 실제론 정답에서 역산해 논리를 '만든' 것이다. 실험 결과, 이런 동기화된 거짓 추론도 내부 회로로 식별이 가능했다.</p> <p contents-hash="e575fec0e5003f7647c36dd868e06a79b1e41a8a4bfc383495b72990e4bdd038" dmcf-pid="UY2nIMg2kn" dmcf-ptype="general">다층(멀티스텝) 추론도 명확하게 확인됐다. "달라스가 있는 주의 수도는 어디인가" 같은 질문을 받을 경우 클로드는 먼저 '텍사스'라는 개념을 활성화한 후 '오스틴'이라는 수도를 도출했다. 중간 개념을 '캘리포니아'로 바꾸면 최종 답도 '새크라멘토'로 바뀌는 등, 추론 흐름이 실제로 존재한다는 점도 증명됐다.</p> <figure class="figure_frm origin_fig" contents-hash="044b9841b40ed719cfa6cb926f17e8c5dc3b5671a82dd8e791743b471a0ef14b" dmcf-pid="uGVLCRaVai" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=앤트로픽)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202503/30/ZDNetKorea/20250330111023219luoc.png" data-org-width="640" dmcf-mid="HiCt4G0CNE" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/30/ZDNetKorea/20250330111023219luoc.png" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=앤트로픽) </figcaption> </figure> <p contents-hash="2d28dce29b869537da92a2b3e03eaffc5e734bd520e3c086841e1362c325887b" dmcf-pid="7HfoheNfNJ" dmcf-ptype="general">AI가 정보를 모르면서 대답하는 '환각(hallucination)' 현상도 관찰됐다. 기본적으로 '클로드'는 모를 땐 "답할 수 없다"는 회로가 작동하지만 질문 속 이름이 친숙하면 이를 억제하고 대답을 시도하는 것으로 나타났다. 이때 오작동으로 인해 존재하지 않는 인물 정보를 꾸며내는 현상도 있었다.</p> <p contents-hash="a0bb0877911b5881099a93e00aa3b4e4e776c92c30fd33dfd99d5eac386dc187" dmcf-pid="zX4gldj4kd" dmcf-ptype="general">'탈옥(jailbreak)' 대응 실험에서는 클로드가 문장 구조에 속아 위험한 출력을 시작한 사례가 분석됐다. 문장 앞글자를 따서 '폭탄(BOMB)'라는 단어를 유도하는 질문을 받은 클로드는 이를 눈치채지 못하고 폭탄 제작법을 설명하다 문장을 끝내고 나서야 "정보 제공이 불가하다"고 말을 바꿨다. 이는 문법적 완성도 유지 회로와 안전 회로 간 충돌 때문이었다.</p> <p contents-hash="5824c2358d4e2e419edf8531611590433bd550d548b92631ab82fa3ffeb01cd3" dmcf-pid="qZ8aSJA8je" dmcf-ptype="general">앤트로픽은 이 같은 연구가 AI 투명성 확보에 중요한 기초를 제공한다고 평가했다. 해석 가능한 회로와 사고 경로를 추적하는 기술은 AI 신뢰성 확보뿐 아니라 의료 영상이나 유전체 등 과학적 분야에도 활용 가능하다는 설명이다.</p> <p contents-hash="cfd9e75a907553100c600b00b571f4ed9e37e12340c319aff3b3d9c53fbfdfc6" dmcf-pid="B56Nvic6gR" dmcf-ptype="general">앤트로픽 측은 "다만 현재 기술로는 수십 단어 수준의 짧은 문장조차 분석에 수 시간이 걸린다"며 "향후 수천 단어 단위의 고차원 사고 흐름을 파악하려면 분석 기술 자체와 사람이 이해하는 방식 모두 개선이 필요하다"고 밝혔다.</p> <p contents-hash="3a5a0d137b6b3695fdb29de0f9c794786ffc71a30db74c0b95344bdc3c487d06" dmcf-pid="b1PjTnkPaM" dmcf-ptype="general">조이환 기자(ianyhcho@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기