로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'홍콩 ELS 과징금' 금감원·은행권 공방 계속…"오늘 결론 못내"(종합)
N
[실시간뉴스]
1480원 근처 못 벗어난 환율…정부 대책 총동원에도 ‘수급 처방 한계’
N
[실시간뉴스]
통일교의 ‘정교일치 실험장’ 추적
N
[IT뉴스]
"게임 대신 OTT 본다"…게임 이용률 전년 대비 10%포인트 감소
N
[IT뉴스]
생기원, 연구자 참여 '현장 주도형 안전관리 모델' 도입
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]한국인이 만든 '음성AI 모델' 빅테크 넘었다
온카뱅크관리자
조회:
62
2025-05-05 17:27:28
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">실리콘밸리 흔든 K딥보이스<br>서울대·KAIST 학생 둘이 만든<br>나리랩스의 TTS 모델 'Dia'<br>기쁨·분노 등 감정선 정밀 구현<br>"MS·구글·바이트댄스보다 우수<br>또 하나의 충격적인 AI 모먼트"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0AyabVLKhf"> <p contents-hash="8db3fd3f43912d338416177dbd7783b411ddd67f03bbfa05a39f502809fea7cf" dmcf-pid="pcWNKfo9hV" dmcf-ptype="general">“두 명이 개발한 인공지능(AI) 모델이 마이크로소프트(MS), 바이트댄스, 엔비디아, 구글을 제쳤다.”(클레망 델랑그 허깅페이스 최고경영자)</p> <p contents-hash="879d2a70fc2ae741b4922961536d0626d6dc49f84d22952a21e019d8126af954" dmcf-pid="UkYj94g2T2" dmcf-ptype="general">한국인이 개발한 음성 합성(TTS) 모델이 미국 빅테크를 뛰어넘었다고 평가받으며 글로벌 AI업계에 화제를 낳고 있다. TTS는 텍스트를 음성으로 변환하는 기술이다. 빠르게 커지는 음성 AI 시장에서 한국이 기회를 잡을 수 있을 것이란 기대 섞인 전망이 나온다.</p> <figure class="figure_frm origin_fig" contents-hash="2be99a68142e20dc2e0050db7466505c8b55b70b71af6ac400d2994bd03e00db" dmcf-pid="uEGA28aVW9" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/05/ked/20250505172503636hjqp.jpg" data-org-width="1036" dmcf-mid="3hjVYZKGS4" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/05/ked/20250505172503636hjqp.jpg" width="658"></p> </figure> <p contents-hash="0063fc1476890a722eb0342d9bd07012a01c9e715bcb2d49d5c0990f45439cf7" dmcf-pid="7DHcV6NfhK" dmcf-ptype="general"><strong><span> ◇관심받는 ‘K딥보이스’</span></strong></p> <p contents-hash="4b993cac5f5ee4d94fbeaa58353bf02e50566f47faf1aab21bf3b1c329e4e917" dmcf-pid="zrZE4QA8hb" dmcf-ptype="general">5일 AI업계에 따르면 나리랩스의 TTS 모델 ‘Dia’는 오픈소스 플랫폼 허깅페이스 다운로드 10만 건을 돌파했다. 공개 2주 만에 거둔 성과다. 나리랩스는 서울대에 재학 중인 김도엽 대표, KAIST의 성재용 대표가 공동 창업한 기업이다. 텍스트를 입력하면 AI가 자연스럽게 감정을 넣어 음성으로 변환하고 비언어적 표현(웃음, 기침 등)까지 완성도 높게 구현한다. 김 대표는 링크트인에서 “현재 상용화된 대표 TTS 서비스인 일레븐랩스와 구글 노트북LM보다 더 높은 성능을 구현했다”고 설명했다.</p> <p contents-hash="96c3814ae9ce10f7d00c3b6b15fff45a4fce2c100829cec643c80bba1ae31fdd" dmcf-pid="qm5D8xc6CB" dmcf-ptype="general">나리랩스는 자체 웹페이지를 통해 일레븐랩스와 Dia의 성능 비교 결과를 공개했다. 응급 상황 또는 분노, 슬픔 등 감정이 나타나는 시나리오에서 Dia는 감정선을 살리면서 균형 있는 리듬과 억양을 유지했다. 이에 비해 경쟁 모델은 문장 간 억양이 고르지 않거나 비언어 표현을 제대로 구현하지 못했다. Dia의 성능을 확인한 이선 몰릭 와튼스쿨 교수는 “또 하나의 충격적인 AI 모멘트”라며 “Dia는 내가 본 것 중 가장 표현력이 풍부한 AI 음성을 구현해냈다”고 평가했다. 실리콘밸리 벤처캐피털리스트인 디디 다스도 “Dia 모델은 완벽한 감정을 표현해낼 수 있다”고 극찬했다.</p> <p contents-hash="02cc7329da5c84c3d7a662d2fc578fbbf762081424bdd2976542b6c88251be36" dmcf-pid="Bs1w6MkPSq" dmcf-ptype="general">그동안 AI는 자연스러운 음성 대화를 구현하는 데 한계가 있었다. 대화 특유의 맥락과 감정 변화, 숨 쉬는 타이밍 같은 디테일이 부족해 인공적인 느낌을 지울 수 없었다. 이 문제를 해결하자고 의기투합한 두 공동대표는 아무런 투자금 없이 석 달 만에 Dia를 개발했다. 구글이 지원한 인프라를 활용했다. 김 대표는 “시중에 나온 거의 모든 TTS API(응용프로그램인터페이스)를 시험해봤지만 진짜 사람처럼 들리는 음성은 없었다”며 “Dia는 텍스트 명령어(프롬프트)만으로도 자연스러운 대화 음성을 생성할 수 있다”고 강조했다.</p> <p contents-hash="f5ab1c30381f4601af391f81216df502bb6900ff12b31c3ccb94274a012a4c92" dmcf-pid="bOtrPREQTz" dmcf-ptype="general"><strong><span> ◇“음성 AI 시장 커질 것”</span></strong></p> <p contents-hash="07a85dfd0275eb524c07e40d0452759efaa54e3220b9db58ff3be1e075d7a3b9" dmcf-pid="KIFmQeDxC7" dmcf-ptype="general">나리랩스의 시도가 주목받은 건 적은 인력과 비용으로도 인상적인 성과를 냈기 때문이다. 나리랩스는 Dia를 누구나 사용할 수 있는 오픈소스로 공개했다. 기업이 상업적 목적으로 이 모델을 활용할 수 있다는 의미다.</p> <p contents-hash="95bab2550686f5979536e20fa2336a0861b0d9461948e9cc6309bec6c275ace0" dmcf-pid="9C3sxdwMlu" dmcf-ptype="general">빠르게 발전하는 음성 AI 시장에 새로운 전환점이 될 것이란 전망도 나온다. 지금까진 생성형 AI가 텍스트 중심으로 발전했지만 앞으론 AI의 음성 출력 기능이 더 중요해질 것이란 얘기다. 마켓리서치비즈에 따르면 글로벌 음성합성 시장은 2032년 111억달러(약 15조원)로 불어날 것으로 예상된다. 최근 카카오의 자체 개발 멀티모달(이미지, 소리 등 여러 형태의 정보) AI 모델인 ‘카나나-o’가 글로벌 빅테크와 비슷한 성능을 보여 관심을 끌었다.</p> <p contents-hash="e72a5ddbd7e1d15831263209047ad3b1bd5f01ba7d60346a736b007267672fd9" dmcf-pid="2h0OMJrRWU" dmcf-ptype="general">카나나-o는 음성인식, 음성합성 분야에서 오픈AI의 GPT-4o, 제미나이-1.5 프로 대비 영어와 한국어에서 모두 소폭 우위를 보였다. 감정 인식 능력에서는 주요 모델을 큰 격차로 앞섰다. 테크업계 관계자는 “음성 AI 기술은 미래에 꼭 필요한 기술이지만 보이스피싱 등에 악용될 가능성도 있어 법적, 윤리적 기준이 필요하다”고 말했다.</p> <p contents-hash="8808c3f08a3adf1b7572413d1faec3ec8fa282fdf56ca051bff3c5bff5f13c23" dmcf-pid="VlpIRimeCp" dmcf-ptype="general">고은이 기자 koko@hankyung.com</p> </section> </div> <p class="" data-translation="true">Copyright © 한국경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기