로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'조작기소 특검법' 대전충남서 국힘 '공세' vs 민주 '무대응'(종합)
N
[실시간뉴스]
'김용범 왜곡보도 못 참아'‥"음해성 가짜뉴스" 직격
N
[실시간뉴스]
미중 정상회담 D-1…증권가, '반도체 논의' 국내증시 영향 촉각(종합)
N
[IT뉴스]
AI가 무너뜨린 보안 경제학…“이제 ‘진짜 방어 AI’ 투입할 때”
N
[IT뉴스]
中 의존 희토류 공급망 ‘자립화’ 시동…분리·정제·재활용으로 ‘승부수’
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]엔비디아가 찜한 '분리 추론'…이미 준비된 한국 기업 있었다 [AI브리핑]
온카뱅크관리자
조회:
40
2026-03-23 06:17:31
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">GTC 2026서 ‘분리 추론’ 전면 부상…GPU 단일 구조 탈피 신호<br>모레, GPU·NPU 통합 ‘이종 추론’ 구현…성능·비용 동시 개선 주목</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="BKWCzbJ6ep"> <p contents-hash="bb8afccef0e6711929f8e1c391fba2d678f290997c079c33cffb67390de69636" dmcf-pid="b9YhqKiPJ0" dmcf-ptype="general">[아이뉴스24 윤소진 기자] 엔비디아가 GTC 2026에서 '분리 추론'을 차세대 AI 인프라의 핵심 키워드로 내세운 가운데, 국내 AI 스타트업 모레가 이미 상용 수준의 이종 분리 추론 기술을 확보한 기업으로 주목받고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="796f9cbc6c5e8ad3d96a7cc913e675c2fdc67a51dee8b79eeb03e3d22d3fc33d" dmcf-pid="K2GlB9nQJ3" dmcf-ptype="figure"> <p class="link_figure"><img alt="조강원 모레 대표. [사진=곽영래 기자]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/23/inews24/20260323061127221sluu.jpg" data-org-width="580" dmcf-mid="qjPxOh3GdU" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/23/inews24/20260323061127221sluu.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 조강원 모레 대표. [사진=곽영래 기자] </figcaption> </figure> <p contents-hash="655ad6ca10d8bb0edfdea5b94ab1826d5a9edb98aeec242046c35c034365f301" dmcf-pid="9VHSb2LxdF" dmcf-ptype="general">분리 추론은 AI가 답을 생성하는 과정을 두 단계로 나눠 처리하는 방식이다. 질문 전체를 이해하는 단계와 답변을 한 단어씩 만들어내는 단계는 요구되는 연산 특성이 다르다. 이를 하나의 칩에 몰아 처리하는 대신 각 단계에 적합한 칩이 나눠 맡도록 해 속도와 비용을 동시에 개선하는 구조다.</p> <p contents-hash="f23a9d08991f286d7f8358b3a9cc187d4b39edeb52ad47799b3223245038a267" dmcf-pid="2fXvKVoMit" dmcf-ptype="general">젠슨 황 엔비디아 CEO는 GTC 2026 기조연설에서 "처리량과 저지연은 본질적으로 서로 상충한다"며 이 딜레마를 해소하기 위한 방법으로 분리 추론 아키텍처를 전면에 내세웠다.</p> <p contents-hash="93ccc2dd96707f63839f8ce1327612b4fa00ca0b601767980c5401ec68d600cd" dmcf-pid="VzSmp7MVJ1" dmcf-ptype="general">엔비디아의 차세대 AI 플랫폼 ‘베라 루빈’은 입력 처리 단계는 고성능 루빈 GPU가, 토큰 생성 단계는 초고속 메모리를 갖춘 그록 LPU가 맡는 구조다. 엔비디아는 이를 통해 동일 전력 대비 토큰 처리 성능을 최대 35배까지 높일 수 있다고 밝혔다. 업계에서는 이번 발표를 두고 ‘단일 GPU가 모든 것을 처리한다’는 기존 전략에서 벗어난 전환점으로 평가했다.</p> <h3 contents-hash="31052d06b6d5c433465a1294303604283f524a901495bef6422e72668013dbfa" dmcf-pid="fqvsUzRfL5" dmcf-ptype="h3">AI 스타트업 모레, GPU·NPU 통합에 자동 최적화까지</h3> <p contents-hash="c6058b9b6faa5e6db32a6167ca874b6b4d394b9022b519c97f91422ec738286e" dmcf-pid="4BTOuqe4LZ" dmcf-ptype="general">이처럼 엔비디아가 분리 추론에 승부수를 띄운 가운데 국내 AI 스타트업 모레가 엔비디아보다 앞서 이종 가속기 기반 분리 추론 기술을 개발해 주목받고 있다.</p> <p contents-hash="45e119a3659f8d2176fd144f1a254257be5ac81dd61c0d950110364c1b7f7a20" dmcf-pid="8byI7Bd8nX" dmcf-ptype="general">모레의 'MoAI 추론 프레임워크'는 엔비디아·AMD·텐스토렌트 등 서로 다른 제조사의 GPU와 NPU를 하나의 시스템처럼 묶어 운용하는 구조를 갖추고 있다. 서로 다른 가속기는 드라이버와 메모리 구조가 달라 통합이 쉽지 않지만, 이를 단일 추론 파이프라인으로 연결한 것이 핵심이다.</p> <p contents-hash="06a83e0bc211612ac45e7599b7ac36ffca8ae16a6d8b64d6b3c30df62002d0dd" dmcf-pid="6KWCzbJ6dH" dmcf-ptype="general">엔비디아가 자사 GPU 생태계 내 분리 추론에 집중하는 것과 달리, 모레는 제조사가 다른 칩까지 포함해 최적의 조합을 자동으로 구성하는 ‘벤더 중립형’ 접근을 취한다.</p> <p contents-hash="330e0f7b05f67658f8cd89209e74d0b1509769f3cbfd54f3a0989bf7b88a81cb" dmcf-pid="P9YhqKiPMG" dmcf-ptype="general">자동화도 차별점이다. 사용자가 원하는 응답 속도 목표만 설정하면, 시스템이 실시간 부하를 분석해 어떤 칩에 어떤 역할을 맡길지 스스로 결정하고 조정한다. 기존처럼 가속기별로 엔지니어가 직접 설정을 조정해야 하는 방식과 대비된다.</p> <p contents-hash="bc79e607701fbad295a65054d6ce32682d0413edb79408152191c0c44c92b105" dmcf-pid="Q2GlB9nQJY" dmcf-ptype="general">성능과 비용 측면에서도 효과가 확인됐다. 모레에 따르면 AMD MI300X 기반 분리 추론 환경에서 토큰당 비용 지표는 평균 109%, 최대 147%의 경제성 개선 효과를 보였다. 또한 5개 노드 환경에서 분리 추론을 적용할 경우 응답 속도는 평균 1.35배, 처리량은 평균 1.2배 향상됐으며, 특정 고부하 구간에서는 지연 시간이 최대 50배 이상 줄어든 것으로 나타났다.</p> <p contents-hash="6483a3ff6bf1fcb4dfcd2022cab68e87887d3bf6e4bfd05cdfcff1e7cd93fb50" dmcf-pid="xVHSb2LxiW" dmcf-ptype="general">조강원 모레 대표는 "엔비디아의 GTC 2026 발표는 이종 분리 추론이 AI 인프라의 미래임을 전 세계에 확인시켰다"며 "모레는 이미 H100과 MI300X를 동시에 활용하는 이종 분리 추론 기술을 실제 환경에서 검증했으며, 엔비디아뿐 아니라 AMD 등 GPU와 텐스토렌트·국산 AI 반도체 등 NPU를 아우르는 더 넓은 생태계를 지원함으로써 특정 벤더에 종속되지 않는 AI 인프라 선택지를 제공할 것"이라고 말했다.</p> <address contents-hash="556e7a9bd580824253d5fb6526832b47fe128b0ade4207d9e5c5cc28d033adf1" dmcf-pid="yId6rO1yny" dmcf-ptype="general">/윤소진 기자<a href="mailto:sojin@inews24.com" target="_blank">(sojin@inews24.com)</a> </address> </section> </div> <p class="" data-translation="true">Copyright © 아이뉴스24. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기