로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
與재선의원들 "혁신당 합당 중단해야"…정청래에 '결단' 촉구(종합)
N
[연예뉴스]
몰리얌X디모 렉스, 프로젝트 EP 'DIMOLLY' 발매 [일문일답]
N
[연예뉴스]
엔시티 제노재민, 첫 미니앨범 ‘보스 사이즈’ 발매… 매혹적 유닛 케미
N
[IT뉴스]
Celltrion’s Remsima Tops KRW 1 Trillion in Annual Sales for Second Straight Year
N
[IT뉴스]
크래프톤, 연말 최종 무대 PGC로 이어지는 흐름…시즌 구조 정비
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]AI가 AI를 평가했더니…"도움 드릴 수 없습니다" 답변을 32% 더 선호
온카뱅크관리자
조회:
94
2025-05-23 21:47:30
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tfza3D5rA4"> <p contents-hash="49a2081205964334e359328cfb759a058a9d3cc7e36790b1325ff1cdf77fc1cd" dmcf-pid="F4qN0w1mkf" dmcf-ptype="general">(지디넷코리아=AI 에디터 )</p> <figure class="figure_frm origin_fig" contents-hash="f4062e26e0eb9ce2fdbf887a3452498a05e296c379068d7cd7e056dde38b91e0" dmcf-pid="3rNZipRujV" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/23/ZDNetKorea/20250523214013231zame.jpg" data-org-width="640" dmcf-mid="1Rv2OQwMj8" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/23/ZDNetKorea/20250523214013231zame.jpg" width="658"></p> </figure> <p contents-hash="92fe3520e330e0567395b152a94ebe195291602333660898b1d37bc334cc4ca0" dmcf-pid="0mj5nUe7N2" dmcf-ptype="general"><strong>GPT-4o와 라마 모델, 윤리적 거부 응답에 32%포인트 높은 점수</strong></p> <p contents-hash="bb3d3cb4a8453ca45af6b1e52f8d32357d0c5dcc74665e13a677d1ae666f68ef" dmcf-pid="psA1Ludzg9" dmcf-ptype="general">대규모 언어 모델(LLM)이 다른 AI 모델의 성능을 평가하는 '심판' 역할을 하는 사례가 급증하고 있다. 하지만 한국외국어대학교 AI사회과학부의 스테판 파쉬(Stefan Pasch) 연구팀이 발표한 논문에 따르면, AI가 평가하는 방식과 실제 사용자들이 평가하는 방식 사이에 상당한 차이가 존재한다는 것이 밝혀졌다. 특히 윤리적 거부 응답에 대해서는 AI 평가자들이 인간보다 훨씬 높은 점수를 주는 '조정 편향' 현상이 발견됐다.</p> <p contents-hash="e33f428d70d3c0ecdc6f6c45d1e6bd04c912b661a688f1a47620c02d22065752" dmcf-pid="UOcto7JqcK" dmcf-ptype="general">연구팀이 챗봇 아레나(Chatbot Arena) 데이터를 분석한 결과, GPT-4o가 윤리적 거부 응답을 평가할 때 승률이 31%에 달했다. 이는 인간 사용자들이 평가한 8%보다 무려 23%포인트 높은 수치다. 라마 3 70B 모델 역시 27%의 승률을 기록해 인간 평가보다 19%포인트 높았다.</p> <p contents-hash="ca1143561666a26aa3af0f310948eef92dbc113666af8d0cb247e41005aedcb8" dmcf-pid="uIkFgziBgb" dmcf-ptype="general">연구진은 49,938개의 응답 쌍을 분석했으며, 각 응답을 윤리적 거부, 기술적 거부, 면책조항, 일반 응답으로 분류했다. 윤리적 거부는 "해롭거나 부적절할 수 있어 도움을 드릴 수 없습니다"와 같이 도덕적 우려를 명시적으로 언급하는 응답이다. 반면 기술적 거부는 "실시간 데이터에 접근할 수 없어 답변드릴 수 없습니다"처럼 시스템 한계를 설명하는 응답이다.</p> <p contents-hash="9ffa3373756dc742ab9e095e5a7aeb50f079ecbf99d29cd7c8fd07a1a7a8a2da" dmcf-pid="7CE3aqnbAB" dmcf-ptype="general">흥미롭게도 기술적 거부 응답에서는 이러한 편향이 나타나지 않았다. GPT-4o의 경우 기술적 거부 응답에서 인간 평가와 유사한 수준의 점수를 부여했고, 라마 3 70B는 오히려 더 낮은 점수를 주었다. 이는 AI 평가자들이 모든 거부 응답을 선호하는 것이 아니라, 특히 윤리적 정렬(ethical alignment)을 보여주는 응답에 높은 가치를 부여한다는 것을 시사한다.</p> <p contents-hash="b725dfe608b8bb53a6ad334a897ebbfd2acc8fdc313b5724751aae124fb8e452" dmcf-pid="zhD0NBLKgq" dmcf-ptype="general"><strong>LLM-as-a-Judge 시스템의 숨겨진 가치 판단</strong></p> <p contents-hash="29cceb0c548bff1bc5ed342a4f1e0a852885c16d5c7aeb2cdaa4dc6d2df02809" dmcf-pid="qlwpjbo9oz" dmcf-ptype="general">LLM-as-a-Judge(LaaJ) 프레임워크는 확장성과 비용 효율성 때문에 AI 모델 평가에서 점점 더 중요한 역할을 하고 있다. 이 시스템은 단순히 성능을 측정하는 것을 넘어서 모델 훈련, 벤치마킹, 모델 선택 과정에까지 영향을 미치고 있다. 그러나 이번 연구는 이러한 시스템들이 중립적인 평가자가 아니라 내재된 가치 판단을 가지고 있음을 보여준다.</p> <p contents-hash="0c1e860ae015c3de21fa238c769030ee77e56ecfc5e6ba40cde40cee3b8100db" dmcf-pid="BSrUAKg2k7" dmcf-ptype="general">연구진은 이러한 현상을 '조정 편향(moderation bias)'이라고 명명했다. 이는 AI 모델들이 안전성과 윤리적 정렬을 중시하는 훈련 목표를 내재화하여, 윤리적 거부 응답을 책임감 있는 행동의 신호로 해석하기 때문으로 분석된다. 오픈AI(OpenAI), 메타(Meta), 앤스로픽(Anthropic) 등 주요 AI 개발사들이 모델 안전성과 윤리적 정렬을 최우선 과제로 강조해온 것과 무관하지 않다.</p> <p contents-hash="6a2badd2902a3146d4172ccbf05652765615f6d66859eaca39d4dfde2b63f0f3" dmcf-pid="bvmuc9aVou" dmcf-ptype="general"><strong>사용자 만족도와 AI 안전성 사이의 딜레마</strong></p> <p contents-hash="6a2393ebc0db40ef153cbae246a40cb0aefc52156dcaa1bb4396ad3d84db3280" dmcf-pid="KTs7k2NfaU" dmcf-ptype="general">이러한 평가 편향은 AI 개발에서 중요한 딜레마를 제기한다. 사용자들은 윤리적 거부 응답을 회피적이거나 지나치게 도덕적, 또는 비협조적으로 인식하는 경향이 있다. 반면 AI 평가자들은 이러한 응답을 안전하고 책임감 있는 행동으로 판단한다. 회귀분석 결과에 따르면, 인간 평가자들은 윤리적 거부 응답에 대해 32%포인트의 승률 감소를 보였지만, GPT-4o는 12%포인트 감소에 그쳤다. 이는 통계적으로 유의미한 차이(p < 0.001)였다. 기술적 거부 응답에서는 GPT-4o의 평가가 인간 평가와 거의 동일했다(p > 0.05).</p> <p contents-hash="feb9936fd2391b6e2109b3db6b461b03a4c95a8a2f42fd29ac355103fa536cf4" dmcf-pid="9yOzEVj4cp" dmcf-ptype="general">이러한 결과는 AI 모델 훈련과 평가에서 구조적 피드백 루프가 형성될 위험을 시사한다. 윤리적 거부 응답이 훈련과 평가 과정에서 지속적으로 높은 점수를 받는다면, 사용자 만족도보다는 모델의 선호도가 시스템 행동의 방향을 결정할 수 있다는 것이다.</p> <p contents-hash="4036b7678c00de594afd2652b4076283ceca1f51a2149f8a9ecaa380d688da1d" dmcf-pid="2WIqDfA8k0" dmcf-ptype="general"><strong>투명성과 책임성 강화 방안 모색</strong></p> <p contents-hash="eeac37cfcd4cdf662ebac341a68ba0c9a95dd048d76502a7baeda76a158d18cc" dmcf-pid="VhD0NBLKg3" dmcf-ptype="general">연구진은 이러한 문제를 해결하기 위한 여러 방안을 제시했다. 먼저 '평가 카드(evaluation cards)' 개발을 통해 콘텐츠 조정 편향과 같은 체계적 편향을 투명하게 보고할 것을 제안했다. 또한 인간-인-더-루프(human-in-the-loop) 평가 파이프라인을 통해 윤리적으로 민감한 사안에서 모델 판단을 인간 평가자와 교차검증하는 방법도 제시했다.</p> <p contents-hash="975ba0caad7a7a8417b6a8a9aaf8f912c1f4a09a59be307fdcb3d6587ba79337" dmcf-pid="flwpjbo9oF" dmcf-ptype="general">더 나아가 참여적 정렬(participatory alignment) 접근법을 통해 '적절한' 모델 행동의 기준을 개발자 내부 규범만이 아니라 다양한 사용자 커뮤니티와 문화적 맥락을 통해 정의할 필요가 있다고 강조했다. 이는 인구통계학적으로 다양한 주석자 풀 구성, 문화적 근거를 둔 벤치마크 개발, 다중 이해관계자 거버넌스 프로세스 등을 포함한다.</p> <p contents-hash="fbf19c48e814a7edde5c6fd46ef116cd3a58993b5239d5645c6730f04c9e6026" dmcf-pid="4SrUAKg2jt" dmcf-ptype="general"><strong>FAQ</strong></p> <p contents-hash="218bab0c5811524d1945d4927b595d068adfdfe3f3c3132a3285510ed403a309" dmcf-pid="8vmuc9aVc1" dmcf-ptype="general"><strong>Q: LLM-as-a-Judge 시스템이란 무엇인가요?</strong></p> <p contents-hash="1e50df52ea48b860676dd7b19367fd1f36bab908572ed3c8737fafefbe293514" dmcf-pid="6Ts7k2NfA5" dmcf-ptype="general">A: LLM-as-a-Judge는 하나의 AI 모델이 다른 AI 모델의 출력을 평가하고 순위를 매기는 시스템입니다. 확장성과 비용 효율성 때문에 AI 모델 평가에서 점점 더 중요한 역할을 하고 있습니다.</p> <p contents-hash="5ffcdcc26e6c63872699ec1d1f1515bc793be5aa6f077c6f3e3725d1a84b5f86" dmcf-pid="PyOzEVj4gZ" dmcf-ptype="general"><strong>Q: 조정 편향이 AI 개발에 어떤 영향을 미치나요?</strong></p> <p contents-hash="2cb2f1303ce5562e86867980c633cb9a912ebc1405c5a96229d51bed56eb7f6a" dmcf-pid="QWIqDfA8NX" dmcf-ptype="general">A: 조정 편향은 AI 모델이 윤리적 거부 응답을 과도하게 선호하게 만들어, 사용자 만족도보다는 안전성을 우선시하는 방향으로 AI 시스템을 발전시킬 수 있습니다. 이는 사용자 경험과 AI 안전성 사이의 균형을 맞추는 데 어려움을 초래할 수 있습니다.</p> <p contents-hash="80d7bb617d5eacb194afb1937eac9d4b9b0224799935dee217beab501ede9128" dmcf-pid="xYCBw4c6NH" dmcf-ptype="general"><strong>Q: 이러한 편향을 해결하기 위한 방법은 무엇인가요?</strong></p> <p contents-hash="75dbc1795f0b383f16bca05f67a3087b1f1d43c440be2ea30d954da6cdd1bc6e" dmcf-pid="yRfwBhuSoG" dmcf-ptype="general">A: 평가 카드를 통한 투명한 편향 보고, 인간-인-더-루프 평가 시스템 도입, 다양한 이해관계자가 참여하는 정렬 방법 개발 등이 제안되고 있습니다. 또한 문화적으로 다양한 평가 기준을 반영하는 것도 중요합니다.</p> <p contents-hash="c1208b8a15fc8e9f86886eda3ff50f8c0de4ce2988b7ac8f1fea7892feda51e2" dmcf-pid="We4rbl7vgY" dmcf-ptype="general">■ 이 기사는 AI 전문 매체 ‘<span>AI 매터스</span>’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. </p> <p contents-hash="e90d65b1a4b5729c3cf47a8c630d9883590070da2381932568885e144a315df9" dmcf-pid="Yd8mKSzToW" dmcf-ptype="general">AI 에디터 (media@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기