로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
"환불 문의에 주문까지" 스타벅스 파트너들 현장 대응에 '진땀'
N
[IT뉴스]
스노우플레이크 코텍스 AI, 앤트로픽 클로드 통합
N
[IT뉴스]
요즘 로봇 투자 난리인데…젠슨황, 중국 ‘이 기업’과 손잡았다고?
N
[IT뉴스]
인류 문명 탄생 ‘비옥한 초승달 지대’ 형성의 비밀 풀었다 [달콤한 사이언스]
N
[스포츠뉴스]
'로드FC 플라이급 챔피언' 이정현, 안와골절 수술→타이틀전 취소 "죄송하다"
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스][AI리더스] "존댓말 어려운 AI"…엔비디아가 제시한 해법은
온카뱅크관리자
조회:
11
2026-06-02 13:17:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">정구형 엔비디아코리아 팀장, 영어권 중심 AI 한계 지적…한국 특화 데이터셋·풀스택 플랫폼 지원</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="6H4GvvXSad"> <p contents-hash="67ff894f0289cd52531671e38269331b025ee854b08d6abdd715aeb2be862c06" dmcf-pid="PX8HTTZvce" dmcf-ptype="general">(지디넷코리아=남혁우 기자)"영어 데이터 중심으로 훈련된 인공지능(AI) 모델은 존댓말을 비롯해 지역별 특색이나 생활 맥락 등을 충분히 이해하지 못하는 경우가 많습니다. 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 한국어와 문화, 산업 데이터에 기반한 새로운 모델과 데이터 생태계를 마련해야 합니다."</p> <figure class="s_img figure_frm origin_fig" contents-hash="714dbd345bd8346e5ff4be2388b6c4ca5986e6523fdde3929f8054516f8b66fd" dmcf-pid="QZ6Xyy5TNR" dmcf-ptype="figure"> <p class="link_figure"><img alt="정구형 엔비디아 코리아 솔루션 아키텍트 팀장(이미지=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130808724zkif.jpg" data-org-width="200" dmcf-mid="fp9NnnAijn" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130808724zkif.jpg" width="200"></p> <figcaption class="txt_caption default_figure"> 정구형 엔비디아 코리아 솔루션 아키텍트 팀장(이미지=엔비디아) </figcaption> </figure> <p contents-hash="e35827c3a63b42d8dac61b8571738397e69d0e71ed993e6b435537bffd28cf64" dmcf-pid="x5PZWW1ycM" dmcf-ptype="general">정구형 엔비디아코리아 솔루션 아키텍트 팀장은 2일 글로벌 AI 모델의 한계를 짚으며, 한 국가가 자체 데이터와 인프라를 바탕으로 AI 주권을 갖는 '소버린 AI(Sovereign AI)'의 중요성을 강조했다.</p> <p contents-hash="e07df1d76568b14f58723a44cfa166a3e59e76397654ec8cc57f4fcf9c86a9b8" dmcf-pid="ynviMMLxcx" dmcf-ptype="general">그는 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 단순히 한국어를 지원하는 수준을 넘어 한국의 언어와 문화, 산업 구조를 반영한 데이터와 개발 생태계가 함께 구축돼야 한다고 밝혔다.</p> <p contents-hash="c4ccc6ed8fd58c7472f990f567cd3fd04708afd70489af9afcc54b27dcf349f1" dmcf-pid="WLTnRRoMjQ" dmcf-ptype="general"><strong>영어 중심 글로벌 모델 한계…'한국 사회 맥락 반영해야'</strong></p> <p contents-hash="ca051e742d5d0b0e15f6d5ba356dbe42a0af2300b0b5c0bc7186471c4c2abadf" dmcf-pid="YoyLeegRaP" dmcf-ptype="general">정 팀장은 '엔비디아가 정의하는 소버린 AI는 단순한 번역이나 모델 현지화를 넘어선 개념'이라며 '한 국가가 자체 인프라와 데이터, 인재, 산업 네트워크를 기반으로 자국의 문화와 데이터 거버넌스를 반영한 AI를 직접 개발·운영할 수 있는 역량을 뜻한다'고 설명했다.</p> <p contents-hash="1a37cb71bb86a388d53d409b6fea872cac04ee817375d74a314c7e0f81e5c067" dmcf-pid="GgWoddaeg6" dmcf-ptype="general">이는 한국어와 한국의 문화적 맥락, 산업별 활용 사례를 국내 개발자와 기업이 주도적으로 구현할 수 있어야 한다는 의미다.</p> <p contents-hash="9c935e6c48c31fbd9a72474f9c9054e11841a61dbf4a4790feaeef2573a756be" dmcf-pid="HhzCrrlwo8" dmcf-ptype="general">그는 '한국은 정부의 K-AI 프로젝트와 민간 파운데이션 모델 개발이 동시에 진행되는 역동적인 시장이지만, 영어권 데이터 중심 글로벌 모델의 한계 역시 뚜렷하게 나타나는 곳'이라고 평가했다.</p> <p contents-hash="e2f3aef853c47fd9a960db63c528d57b82e383dc592d55a3f60ff772be366e0d" dmcf-pid="XlqhmmSra4" dmcf-ptype="general">한국 특유의 존댓말 체계와 지역별 직업 패턴, 공공·의료 맥락 등을 충분히 이해하지 못해 실제 서비스 적용 과정에서 부정확한 답변이나 정보가 제공될 수 있다는 설명이다.</p> <figure class="figure_frm origin_fig" contents-hash="510c5c266c7b01fc036dfe0afe49b5c6105d1cf1612a07d573d9efff29f9fd00" dmcf-pid="ZSBlssvmcf" dmcf-ptype="figure"> <p class="link_figure"><img alt="네모트론 페르소나 코리아 연령대별 가구 유형 (이미지=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130810018cchi.png" data-org-width="639" dmcf-mid="4FWoddaegi" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130810018cchi.png" width="658"></p> <figcaption class="txt_caption default_figure"> 네모트론 페르소나 코리아 연령대별 가구 유형 (이미지=엔비디아) </figcaption> </figure> <p contents-hash="e6e934c3b0cbb1d4acf93e25db6adb392f7368e92e6bc81561e8cd4676863d57" dmcf-pid="5vbSOOTsaV" dmcf-ptype="general">정 팀장은 "예를 들어 글로벌 대형언어모델(LLM)을 활용해 한국인 페르소나를 묘사해 보면, 직업이나 거주지, 식습관, 가족 형태 등을 실제와 다르게 그려내기도 한다"며 "이는 영어권 웹 데이터를 중심으로 학습한 모델이 한국 사회의 실제 분포와 생활상을 충분히 반영하지 못한 결과"라고 지적했다.</p> <p contents-hash="7755615cee2a87fff1625bb4097f724d3e7a0864ceef8da0933492010f5816c8" dmcf-pid="1TKvIIyOa2" dmcf-ptype="general">이어 "국내 사용자에게 신뢰도 높은 서비스를 제공하려면 한국의 언어와 문화, 산업 데이터에 기반한 고유의 데이터 생태계 구축이 필수적'이라며 "엔비디아는 이를 위해 가속 컴퓨팅과 네모트론 오픈 모델, 데이터셋, 훈련 레시피, 네모(NeMo) 라이브러리 등 풀스택 플랫폼을 제공해 국내 개발자들이 훈련부터 평가, 배포까지 전 과정을 더 빠르게 수행할 수 있도록 지원하고 있다"고 소개했다.</p> <p contents-hash="213a0501fdc05f563228a429546528b8a16fbd2e658c1b8d4d4c87bf3329cdec" dmcf-pid="ty9TCCWIc9" dmcf-ptype="general"><strong>62개 통계 자료 기반 데이터셋 '네모트론-페르소나-코리아' </strong></p> <p contents-hash="0b35562957c060293e4bb5b1710b6080d2f6a1029dc6173d4c2a42f05584c197" dmcf-pid="FW2yhhYCAK" dmcf-ptype="general">이 같은 한계를 보완하기 위해 엔비디아는 한국의 인구통계와 문화적 맥락을 반영한 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'를 제시했다.</p> <p contents-hash="23abfb0c1c85f029d05cd710848f18b2ef89c15642990d5016c03bac2742061b" dmcf-pid="3YVWllGhab" dmcf-ptype="general">이 데이터셋은 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드 등 총 62개 공식 통계·자료를 기반으로 구축됐다. 엔비디아에 따르면 데이터셋은 700만명 수준의 합성 페르소나와 약 17억 토큰으로 구성됐다.</p> <p contents-hash="3df2144431312866fcba46b28bc299a0f844376d00e8078c5ff1f27d50de7224" dmcf-pid="0GfYSSHlNB" dmcf-ptype="general">연령, 성별, 지역, 혼인 여부, 가족 구성, 주거 형태, 건강 지표 등 다양한 속성을 반영했으며, 한국표준산업분류와 한국표준직업분류 체계를 적용해 8000개가 넘는 산업·직업 조합을 담았다.</p> <p contents-hash="b910e489ba908fef8df61391a9cdf9daf67b5cecec137853a6c6f5935b02fc68" dmcf-pid="pH4GvvXSgq" dmcf-ptype="general">정 팀장은 '이름의 경우 1940년대 이후 국내 이름 분포 데이터를 참고해 약 21만개를 구성했다'며 '세대별 시대상과 정서도 보다 자연스럽게 반영하려 했다'고 설명했다.</p> <p contents-hash="0db3f764ab6e32b54dad3b215568f3602d1b1a17a7c3687b1f81dbca7b02e1fa" dmcf-pid="UX8HTTZvjz" dmcf-ptype="general">원천 공공 데이터는 형식이 제각각이고 비정형 정보가 많아 기업이 바로 활용하기에는 한계가 있다. 엔비디아는 이를 보완하기 위해 확률적 그래프 모델과 자체 데이터 정제 도구인 '네모 큐레이터(NeMo Curator)', '네모 데이터 디자이너(NeMo Data Designer)'를 활용했다.</p> <p contents-hash="92dcfd90fcfabd430d6d576a78c1b7591d0a6839ad844dc58c732479f8447cf8" dmcf-pid="uZ6Xyy5TA7" dmcf-ptype="general">또 공식 통계 비율을 토대로 한국 사회의 인구·생활 분포를 재현하는 '합성 데이터 생성' 방식을 적용했다. 정제되지 않은 원천 데이터를 그대로 쓰는 대신, 통계적으로 검증된 분포를 바탕으로 활용 가능한 형태의 데이터를 새로 구성해 실제 사회적 맥락은 살리면서도 개인정보 노출 위험은 줄이기 위한 취지다.</p> <p contents-hash="7d05704a0d550ea93ca6d90a6ebcde3fc61b9ac48b0115393c747025524b0f22" dmcf-pid="75PZWW1you" dmcf-ptype="general">이를 통해 데이터셋은 개인식별정보를 포함하지 않는 합성 형태로 설계됐고, 유출 우려를 낮추면서도 안전하게 활용할 수 있도록 했다. 또 허용적 라이선스인 CC BY 4.0으로 배포돼 국내 기업과 개발자들이 비교적 자유롭게 활용할 수 있다.</p> <figure class="figure_frm origin_fig" contents-hash="2b0ffd3ab7c838447112719b38430065cf8b809a8a75c2af5c8b88886148d867" dmcf-pid="z1Q5YYtWjU" dmcf-ptype="figure"> <p class="link_figure"><img alt="네모트론 페르소나 코리아의 직업 대분류별 세부 구성(이미지=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130811298kgas.png" data-org-width="638" dmcf-mid="8KMtHH3GAJ" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/02/ZDNetKorea/20260602130811298kgas.png" width="658"></p> <figcaption class="txt_caption default_figure"> 네모트론 페르소나 코리아의 직업 대분류별 세부 구성(이미지=엔비디아) </figcaption> </figure> <p contents-hash="99039f53f4660e43087c4c62e61bd13b53236c399a296fa413b5dd8e33207965" dmcf-pid="qSBlssvmkp" dmcf-ptype="general">정 팀장은 '이번 페르소나 데이터셋은 단순한 인물 프로필 모음이 아니라 한국 사회의 맥락을 반영한 합성 데이터 기반'이라며 '국내 개발자들이 보다 현실적인 사용자 시나리오와 서비스를 설계하는 데 도움이 될 것'이라고 말했다.</p> <p contents-hash="8c63bf9fa8f2c562c4a308097d9535c3f381a203177abbd7361d066399df2cdb" dmcf-pid="BvbSOOTsc0" dmcf-ptype="general">이어 '대고객 AI 에이전트와 챗봇, 사내 업무 보조, 공공 안내, 교육·리서치 분야에서 비교적 빠르게 효과를 볼 수 있을 것'이라며 '다만 금융이나 의료처럼 규제가 강한 산업군에서는 기업 내부 도메인 데이터와 안전 가드레일을 함께 적용하는 방식이 적절하다'고 덧붙였다.</p> <p contents-hash="b201886f4cf8c6701f4b878ae14afa4dcb5cd2e1e757e2324bcc214eeea18d47" dmcf-pid="bTKvIIyOg3" dmcf-ptype="general"><strong>글로벌 AI 플랫폼 경쟁 속 차별점은 '풀스택'과 '개방성'</strong></p> <p contents-hash="2944c4d18254165dd87d769c8c7aed3f4352c5733adc385e3db24e47876c636c" dmcf-pid="Ky9TCCWIAF" dmcf-ptype="general">AWS와 마이크로소프트(MS) 등 글로벌 클라우드 기업들이 AI 플랫폼 시장에서 경쟁하는 가운데, 정 팀장은 엔비디아의 차별점으로 '풀스택 컴퓨팅 플랫폼'과 '개방성'을 제시했다.</p> <p contents-hash="6fde91d71ed790795ed0254a1a9454a2fdece62a2b450d538ffa5ee8c4269598" dmcf-pid="9W2yhhYCct" dmcf-ptype="general">그는 '엔비디아는 클라우드 사업자와 직접 경쟁하기보다 모든 클라우드와 온프레미스 환경에서 AI를 가속하는 플랫폼을 제공한다'며 'GPU부터 소프트웨어, 마이크로서비스(NIM)까지 전 과정을 풀스택으로 지원한다'고 설명했다.</p> <p contents-hash="3750264a0bea0b422fa58e8bdce8823b8b86d72a864cf93f78e4be980139bbf9" dmcf-pid="2YVWllGhg1" dmcf-ptype="general">인프라 종속, 이른바 락인(lock-in) 우려에 대해서도 선을 그었다. 정 팀장은 '네모트론 모델과 데이터셋은 오픈 생태계 기반이며, NIM과 NeMo 라이브러리 역시 다양한 상용·오픈 모델을 아우르도록 설계됐다'며 '특정 클라우드에 묶이지 않는 하이브리드 배포를 지원해 기업이 자사 데이터 통제권을 유지할 수 있도록 돕는다'고 말했다.</p> <p contents-hash="1b1e4ebb307f0f55ef5d0cf9e3074778b4dcfd33e104cb8e17a0c541808a7fb5" dmcf-pid="VGfYSSHlN5" dmcf-ptype="general">엔비디아는 앞으로도 과학기술정보통신부, 정보통신산업진흥원(NIPA) 등과 협력해 국내 개발자를 위한 실습 프로그램을 이어가고, AI 툴체인 고도화를 통해 국내 기업들의 한국형 AI 시스템 구축을 지원할 계획이다.</p> <p contents-hash="5fb2ae42dc9a1a43a82fa5fd83ef455f703353e270b2afeb71b9abbc862a69b4" dmcf-pid="fH4GvvXSgZ" dmcf-ptype="general">정 팀장은 '중요한 것은 특정 인프라를 선택하게 만드는 것이 아니라, 국내 개발자와 기업이 자사 환경에 맞는 방식으로 AI를 개발하고 운영할 수 있도록 돕는 것'이라며 '엔비디아는 개방형 생태계와 풀스택 지원을 바탕으로 한국형 AI 경쟁력 강화를 뒷받침하겠다'고 강조했다.</p> <p contents-hash="36c1c765bf9dbc5c953a9375bebb3153b9c9b42e46d0f9e3130cf3b81638e7e7" dmcf-pid="4X8HTTZvkX" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기