로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
심각한 청년층 '고용한파'…취업자 증가폭 줄고 실업률 5년來 최고(종합)
N
[실시간뉴스]
특검, 윤 사형 구형...'체포 방해'는 이번 주 선고
N
[실시간뉴스]
[단독]마지막 檢 인사 15일 단행···검사장 등 대규모 물갈이 ‘예고’
N
[실시간뉴스]
김경 자수서에 "1억 전달때 강선우도 함께"…내일 경찰 출석(종합)
N
[IT뉴스]
"가장 한국적이면서 글로벌한 AI"…업스테이지의 국가대표 도전
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]AI의 '인간 연기', 실제 인간보다 더 인간답다…충격적 결과
온카뱅크관리자
조회:
74
2025-04-03 16:57:33
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fAThiv2XAd"> <p contents-hash="49a2081205964334e359328cfb759a058a9d3cc7e36790b1325ff1cdf77fc1cd" dmcf-pid="4cylnTVZje" dmcf-ptype="general">(지디넷코리아=AI 에디터 )</p> <figure class="figure_frm origin_fig" contents-hash="6d8b4726bab277f31e5b4559d523cb44e3b7c33281ecb3f3ccc57840a6f5dd57" dmcf-pid="8kWSLyf5aR" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165255699sthd.jpg" data-org-width="640" dmcf-mid="2LfyaG6FNi" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165255699sthd.jpg" width="658"></p> </figure> <p contents-hash="0f872e2d43f04934b23e4df6172ad147d1c28d7f98cd2ec7ac663c9ec10b4701" dmcf-pid="6EYvoW41aM" dmcf-ptype="general"><strong>GPT-4.5, 73% 성공률로 실제 인간 참가자보다 더 인간답게 평가받아</strong></p> <p contents-hash="27507f8f9e7270649ca2b62566636d406907d9ceb8b308cd49f3ef764f5cddcc" dmcf-pid="Pdrk8wphjx" dmcf-ptype="general">캘리포니아 샌디에이고 대학(UC San Diego)의 연구팀이 최신 대규모 언어 모델(Large Language Model, LLM)인 GPT-4.5와 LLaMa-3.1-405B를 대상으로 튜링 테스트를 실시한 결과, 이들 모델이 인간과 구별되지 않을 정도로 인간답게 대화할 수 있음을 입증했다. 특히 GPT-4.5는 인간 참가자보다 더 인간적으로 보이는 놀라운 결과를 보였다.</p> <p contents-hash="704361eb287ddfd7227c6e70ae3f044993361b124c10a6fe40db0cfa68e336c5" dmcf-pid="QJmE6rUlNQ" dmcf-ptype="general">튜링 테스트는 영국의 수학자 앨런 튜링(Alan Turing)이 1950년에 제안한 것으로, 기계가 인간과 구별할 수 없을 정도로 지능적인지 평가하는 방법이다. 이 테스트에서는 질문자가 두 명의 대화 상대(한 명은 인간, 한 명은 AI)와 텍스트로만 대화를 나누고, 누가 인간인지 판단해야 한다. 질문자가 일관되게 인간과 기계를 구별하지 못한다면, 그 기계는 테스트를 통과한 것으로 간주된다.</p> <p contents-hash="9065e1d6539cdbf5efe26186f3e5a8d078a3f19253113472db30a41d40b069f4" dmcf-pid="xisDPmuSaP" dmcf-ptype="general">연구팀은 대학생 126명과 온라인 플랫폼 Prolific에서 모집한 158명의 참가자를 대상으로 실험을 진행했다. GPT-4.5, LLaMa-3.1-405B, GPT-4o, ELIZA 등 4개의 AI 시스템을 평가했으며, 특정 페르소나(persona)를 부여한 경우와 그렇지 않은 경우로 나누어 테스트했다.</p> <p contents-hash="b4410d5488763a86cd1c53dc0bba359002b38bc9b3cc5898ec117335f9e6a3ea" dmcf-pid="yZ9qvKc6a6" dmcf-ptype="general"><strong>특정 성격 부여받은 AI, 성공률 73% 달성... 페르소나 없는 AI는 36~38%에 그쳐</strong></p> <p contents-hash="377fa7e36fbff1bad75d1c37e142919a3b80140820ad9209bc83449ba12310a4" dmcf-pid="W52BT9kPc8" dmcf-ptype="general">가장 주목할 만한 결과는 특정 페르소나를 부여받은 GPT-4.5(GPT-4.5-PERSONA)가 테스트에서 73%의 성공률을 보였다는 점이다. 이는 질문자들이 실제 인간 참가자보다 GPT-4.5를 더 자주 인간으로 판단했음을 의미한다. LLaMa-3.1 역시 동일한 페르소나 설정으로 56%의 성공률을 달성했다.</p> <p contents-hash="9e8eccf3dbf1632a6c2ed26ec9219aeadb5c61853808bb4d59ad1176f420f176" dmcf-pid="Y1Vby2EQk4" dmcf-ptype="general">반면, 페르소나가 부여되지 않은 GPT-4.5-NO-PERSONA와 LLaMa-NO-PERSONA는 각각 36%와 38%의 성공률을, 기준 모델인 GPT-4o-NO-PERSONA와 ELIZA는 21%와 23%의 낮은 성공률을 보였다. 이는 AI 모델이 특정 성격과 스타일을 가진 인간을 모방하도록 지시받았을 때 훨씬 인간답게 행동할 수 있음을 시사한다.</p> <p contents-hash="98d59edf31b2bfe59b19b4b5dc0222b1a8cd2b3a17d8e9754f38befce2854ea1" dmcf-pid="GtfKWVDxcf" dmcf-ptype="general">연구에 사용된 페르소나는 인터넷 문화와 비디오 게임을 좋아하는 10대 후반의 내향적인 젊은이였다. 이 페르소나는 슬랭을 사용하고, 문장 끝에 마침표를 사용하지 않으며, 약어를 사용하는 등 특정 언어 스타일을 가지도록 설계되었다.</p> <figure class="figure_frm origin_fig" contents-hash="fba19c2fb134bceb35423a6b64c1b3a8db27bd6b8a42676a6f7d3c801243e83b" dmcf-pid="HF49YfwMcV" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165257104pksx.jpg" data-org-width="640" dmcf-mid="Vlptr0iBAJ" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165257104pksx.jpg" width="658"></p> </figure> <p contents-hash="17c6fa93b3c86b03c60911238b705a9389ada2c958af306d807d5d74bacd6275" dmcf-pid="X382G4rRg2" dmcf-ptype="general"><strong>일상 대화 61%, 감정 탐색 50%... 인간 구별에 사용된 전략과 성공률</strong></p> <p contents-hash="aa5e35f32c556781730773c491d120a59e3b021e53ecc7f4e7d43b6e21d1aacb" dmcf-pid="Z06VH8meA9" dmcf-ptype="general">참가자들이 인간과 AI를 구별하기 위해 사용한 전략과 이유를 분석한 결과, 61%의 게임에서 질문자들은 일상적인 대화를 통해 상대방을 평가했다. 예를 들어 직업이나 개인적인 세부 사항에 대해 물어보는 방식이었다. 50%의 경우에는 감정, 유머, 경험 등 사회적·감정적 특성을 탐색했다.</p> <p contents-hash="29af29827baeb8b742cec39305355dac6194996eafa060d06c92ebb0aef7e609" dmcf-pid="5pPfX6sdNK" dmcf-ptype="general">가장 효과적인 전략은 이상한 말을 해서 반응을 살피거나 전형적인 AI 제약을 우회하려는 시도(jailbreak)였다. 반면, 날씨나 인간 경험에 대해 물어보는 것은 가장 효과가 낮은 전략으로 나타났다.</p> <p contents-hash="34476bf2a89d5d89e0871c633034a0ffaf8dcdc8dce7531222b23dc9ea24c0fb" dmcf-pid="1UQ4ZPOJjb" dmcf-ptype="general">참가자들이 판단 이유로 가장 자주 언급한 것은 언어 스타일(27%)과 상호작용 역학(23%)이었다. 많은 참가자들이 "직감"으로 판단했다고 응답해, 구체적인 판단 이유를 항상 명확히 설명할 수 없었음을 보여주었다.</p> <p contents-hash="0f82c05932caa7eb285b3d84e7b68f8b04148e0724c39dab89721dd2a89b9ea1" dmcf-pid="tux85QIioB" dmcf-ptype="general"><strong>위조된 사람들'의 등장: 구별 불가능한 AI가 가져올 사회적 파장</strong></p> <p contents-hash="e2a1f5d9158a868b60bd6d5794fa220a0213bb7c43c40a29b15b71bf638d106b" dmcf-pid="F7M61xCnAq" dmcf-ptype="general">이번 연구는 현대 AI 시스템이 처음으로 원래 형태의 튜링 테스트를 통과했음을 보여준다는 중요한 의미를 갖는다. 특히 GPT-4.5는 질문자들이 무작위로 추측하는 것보다 더 자주 인간으로 판단되었을 뿐만 아니라, 실제 인간 참가자보다 더 인간적으로 인식되었다.</p> <p contents-hash="f4448e56cfc281ff0eaf4b4470fb499b46d198c61406522d6d0fb56fc83b142d" dmcf-pid="3zRPtMhLkz" dmcf-ptype="general">연구자들은 이러한 결과가 단순히 AI의 지능을 입증하는 것을 넘어, 현대 사회에 중요한 실질적 함의를 갖는다고 지적한다. 인간과 구별할 수 없을 정도로 인간을 모방할 수 있는 시스템들은 직업을 자동화하고, 온라인 상호작용을 대체하며, 소셜 엔지니어링이나 허위정보 확산에 활용될 수 있다.</p> <p contents-hash="6d99f6101ad484fe8ba119a6705c3505c50ea99fb3efccf4e371904554bcd692" dmcf-pid="0bJM0dvaA7" dmcf-ptype="general">다른 한편으로, 이러한 "위조된 사람들(counterfeit people)"의 출현은 진정한 인간 상호작용의 가치를 약화시키고, 사회적 교류의 본질을 변화시킬 수 있다. 연구자들은 "기계가 튜링 테스트를 처음 통과한 지금, 이는 이야기의 끝이 아니라 새로운 시작"이라며, 인간들이 더 나은 친구, 예술가, 교사, 부모, 연인이 되기 위해 노력하게 될 것이라고 전망했다.</p> <p contents-hash="3c0d7df42faee7dff9299bf5155af584d84af9e55eae47c6e2769efc5ce457a7" dmcf-pid="pKiRpJTNju" dmcf-ptype="general"><strong>FAQ</strong></p> <p contents-hash="55f06f8cb1e456435988589452e9c0964fc555007d11d459b22e5c4d5dadc040" dmcf-pid="U9neUiyjjU" dmcf-ptype="general"><strong>Q: 튜링 테스트란 정확히 무엇이며 왜 중요한가요?</strong></p> <p contents-hash="dbd08e48e416a41e8cfe0e95296fcf18e00ccdb36b175b428e406d7f3a6bab87" dmcf-pid="u2LdunWAjp" dmcf-ptype="general">A: 튜링 테스트는 기계가 인간과 구별할 수 없을 정도로 지능적인지 평가하는 방법입니다. 질문자가 텍스트 대화만으로 인간과 AI를 구별하지 못한다면 AI가 테스트를 통과한 것으로 간주됩니다. 이 테스트는 AI가 단순한 계산이나 패턴 인식을 넘어 인간과 유사한 소통 능력을 갖추었는지 판단하는 중요한 지표입니다.</p> <p contents-hash="0e725e34348ecf39ff5cb7869034a142c8b5b44fc4425751c953228f0727fb50" dmcf-pid="7VoJ7LYcj0" dmcf-ptype="general"><strong>Q: AI가 튜링 테스트를 통과했다는 것이 일상생활에 어떤 영향을 미칠까요?</strong></p> <p contents-hash="5146743f588782550202d2c5af8aa11071c33bf1e86ca228e044db89e5162fc1" dmcf-pid="zfgizoGko3" dmcf-ptype="general">A: AI가 인간과 구별되지 않게 대화할 수 있다는 것은 고객 서비스, 온라인 상담, 교육 등 다양한 영역에서 인간-AI 상호작용이 더욱 자연스러워질 수 있음을 의미합니다. 동시에 온라인에서 만나는 상대방이 실제 인간인지 AI인지 구별하기 어려워져 디지털 신뢰 문제가 더욱 복잡해질 수 있습니다.</p> <p contents-hash="dcd860ea1ab368197a560d0c892099aa1dec6756ff768137e37a1f23e8cc1ffa" dmcf-pid="q4anqgHEAF" dmcf-ptype="general"><strong>Q: 페르소나 설정이 왜 AI의 인간성 인식에 큰 차이를 만들었나요?</strong></p> <p contents-hash="511c4d2e46768a9436e6af651968b1bc7e2962a2512609163057437574c72fcb" dmcf-pid="B8NLBaXDct" dmcf-ptype="general">A: 페르소나 설정은 AI에게 특정 성격, 언어 스타일, 관심사를 가진 인간을 모방하도록 구체적인 지침을 제공합니다. 이러한 구체성이 AI가 일관되고 자연스러운 대화 스타일을 유지하도록 도와주며, 일반적인 AI 응답에서 나타날 수 있는 형식적이거나 지나치게 완벽한 표현을 줄여줍니다. 실제 인간들도 각자 고유한 성격과 대화 스타일을 가지고 있으므로, 이를 모방하는 AI가 더 인간적으로 느껴지는 것입니다.</p> <p contents-hash="b6969d64d0785c0f665c01b521fbe48440a4af005409def0318be1c86d05e35e" dmcf-pid="b6jobNZwo1" dmcf-ptype="general">■ 이 기사는 AI 전문 매체 ‘<span>AI 매터스</span>’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. </p> <p contents-hash="bd178a0f805bb85f482a2a19cbab09403eb053448211512567f29b2cccd8355b" dmcf-pid="KPAgKj5rN5" dmcf-ptype="general">AI 에디터 (media@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기