로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
국힘, 서울시장 후보 경선에 '한국시리즈 방식' 적용 않기로(종합)
N
[실시간뉴스]
[단독] “한국 파병 시 적대행위로 간주”…이란, 군사대응 가능성도 시사
N
[IT뉴스]
AMD, AI 가속기에 삼성 HBM4 탑재…네이버와 AI 인프라 협력 확대
N
[IT뉴스]
“엔비디아 이어 AMD도 뚫었다”…삼성전자, HBM4 우선 공급
N
[IT뉴스]
메모리 이어 '전력반도체' 가격도 줄줄이 인상…생산 비용 동반 상승
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]엔비디아가 연 ‘분리형 추론’ 시대…韓 AI 인프라, 조합 경쟁으로 간다
온카뱅크관리자
조회:
13
2026-03-18 15:37:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">엔비디아·AMD·텐스토렌트 묶는 이종 추론 부상<br>모레는 MoAI로 통합 추론<br>네이버는 AMD와 협력<br>래블업은 운영 소프트웨어 부각</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="59QpY4aeIb"> <p contents-hash="a409e6574242eacab65d4b562a4bcb93eb21a114ef9bd5a1deb69f45fc540aa0" dmcf-pid="12xUG8NdEB" dmcf-ptype="general"> [이데일리 김현아 윤정훈 기자] 엔비디아가 GTC 2026에서 ‘분리형 추론(Disaggregated Inference)’을 차세대 AI 인프라 전략으로 전면에 내세우면서 국내 인공지능(AI) 업계도 빠르게 재편되고 있다. </p> <p contents-hash="cff25b88597ec14c4d5b126e2364b2028dc17698657ffc39f5d5cd1b372c3b80" dmcf-pid="tVMuH6jJrq" dmcf-ptype="general">단일 GPU가 추론 전 과정을 처리하던 기존 구조에서 벗어나, 입력 처리와 토큰 생성을 서로 다른 가속기에 나눠 맡기는 방식이 새 표준으로 떠오르고 있어서다. AI 인프라의 승부처도 칩 하나의 성능보다 여러 칩을 어떻게 조합하고 얼마나 효율적으로 운용하느냐로 옮겨가는 분위기다.</p> <p contents-hash="48214999d604e530f5f2b7cac1978c7427d4498bd1a985130c778e438d365bee" dmcf-pid="FfR7XPAisz" dmcf-ptype="general">이 변화의 중심에는 국내 AI 인프라 소프트웨어 기업 모레(Moreh)가 있다. 모레는 최근 엔비디아, AMD, 텐스토렌트 등 이종 GPU·NPU를 단일 클러스터에서 함께 구동하는 추론 프레임워크 ‘모아 추론 프레임 워크(MoAI Inference Framework)’를 공개했다. 특정 반도체를 더 많이 확보하는 것보다, 서로 다른 가속기를 역할별로 배치하고 이를 자동으로 최적화해 추론 속도와 비용 효율을 함께 끌어올리겠다는 전략이다.</p> <figure class="figure_frm origin_fig" contents-hash="22d84558a58abc3b4fb2c410703aa18fbe3633e277ae317b6f1ddca66537a635" dmcf-pid="34ezZQcnm7" dmcf-ptype="figure"> <p class="link_figure"><img alt="지난해 12월 AI 인프라 솔루션 기업 모레(MOREH, 대표 조강원)는 글로벌 반도체 기업 AMD와 함께 최신 기술 트렌드를 공유하고 AMD 생태계 협업 촉진을 위한 'AI 개발자 밋업'을 개최했다. 사진=모레" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/18/Edaily/20260318153102330wzdu.jpg" data-org-width="670" dmcf-mid="XVsJfDGhD9" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/18/Edaily/20260318153102330wzdu.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 지난해 12월 AI 인프라 솔루션 기업 모레(MOREH, 대표 조강원)는 글로벌 반도체 기업 AMD와 함께 최신 기술 트렌드를 공유하고 AMD 생태계 협업 촉진을 위한 'AI 개발자 밋업'을 개최했다. 사진=모레 </figcaption> </figure> <div contents-hash="69bc59a89adb1013242e4444fa6ec818d73d26efc0cce54738f3c231d85cf627" dmcf-pid="08dq5xkLDu" dmcf-ptype="general"> <strong>단일 GPU 시대 저문다…왜 분리형 추론인가</strong> </div> <p contents-hash="a21eb3de26076c344307814d51aa356dae3f1849282bd9f1ab4e34792607162b" dmcf-pid="p6JB1MEosU" dmcf-ptype="general">분리형 추론은 대규모 입력을 한꺼번에 처리하는 프리필(Prefill)과 토큰을 순차적으로 생성하는 디코드(Decode)를 분리해 각각에 적합한 칩을 배치하는 구조다. 긴 문맥 처리와 AI 에이전트 수요가 늘수록 처리량과 저지연을 동시에 잡아야 하는데, 단일 GPU만으로는 비용과 효율의 한계가 커질 수밖에 없다는 문제의식이 배경에 깔려 있다.</p> <p contents-hash="29c04c5f7dc995ca4c899d2951f1539da5f7505185e91c2b07d5fd68f3d478cf" dmcf-pid="UoExbjvmDp" dmcf-ptype="general">그래픽처리장치(GPU)는 대규모 입력 처리에, 신경망처리장치(NPU)나 언어처리장치(LPU) 계열 칩은 저지연 토큰 생성에 강점을 살려 역할을 나눠 맡는 편이 더 현실적이라는 계산이다. 학습보다 추론 비용이 AI 서비스 확산의 병목으로 떠오르는 상황에서 업계가 분리형 추론을 차세대 인프라 전략으로 보는 이유도 여기에 있다.</p> <p contents-hash="033f5742272c1189eecfc8b7f767592e4d94e9669712ed1e9b05e65aff3813b3" dmcf-pid="ugDMKATss0" dmcf-ptype="general"><strong>모레, MoAI로 이종 가속기 통합 전면에</strong></p> <p contents-hash="8e9199225c08b7a929aaa81b2faedcaf263dd1c5c71a195d0471aad7792138be" dmcf-pid="7awR9cyOm3" dmcf-ptype="general">모레는 여기서 한발 더 나아가 서로 다른 벤더의 가속기를 하나의 추론 파이프라인으로 묶는 데 초점을 맞췄다. 회사 측에 따르면 MoAI Inference Framework는 엔비디아 GPU뿐 아니라 AMD GPU, 텐스토렌트 칩까지 지원하며 데이터센터 단위에서 최적 조합을 찾도록 설계됐다.</p> <p contents-hash="0e8b98dcd9798ef81224692146b579a5fbc4a0eed4ebd1672b8ced861d0a6912" dmcf-pid="zNre2kWIwF" dmcf-ptype="general">특히 강점으로 내세우는 것은 자동화다. 목표 응답속도만 설정하면 시스템이 요청 부하와 입출력 패턴을 분석해 어떤 가속기를 얼마나 투입할지, 어떤 경로로 라우팅할지를 스스로 조정하는 방식이다. 더 비싼 칩을 추가로 들이는 것보다 기존 인프라를 얼마나 영리하게 섞어 쓰느냐가 경쟁력을 좌우한다는 논리다.</p> <p contents-hash="a354bceffbc9f9c5a215a588bed039fa60b9155de1814d2bc9e8b157621899c8" dmcf-pid="qjmdVEYCIt" dmcf-ptype="general">모레는 내부 테스트에서 일부 성능 개선 효과도 확인했다고 밝혔다. AMD MI300X 기반 환경에서 자사 최적화 소프트웨어가 성능 개선을 보였고, 엔비디아와 AMD를 섞은 구성은 속도 측면에서, AMD 동기종 구성은 비용 효율 측면에서 각각 장점이 나타났다는 설명이다. 다만 이는 회사가 제시한 초기 내부 결과인 만큼 향후 외부 검증이 더 필요하다.</p> <p contents-hash="4d32405b7841c794e1fe7f5e99ae8d8f2f9ccd1269526ece48d025e2f4c86724" dmcf-pid="BAsJfDGhI1" dmcf-ptype="general"><strong>“칩 성능보다 조합 능력”…추론 경쟁력의 이동</strong></p> <p contents-hash="bbc24c9fbf37331f4eb5e17146248015faa45aea6fd5f40ef6c1471854facbdc" dmcf-pid="bcOi4wHlO5" dmcf-ptype="general">시장이 모레에 주목하는 이유는 단순한 수치보다 방향성에 있다. 이제 AI 인프라 경쟁은 “더 비싼 단일 칩” 확보전이 아니라 “여러 칩을 어떻게 묶고 제어하느냐”로 이동하고 있다는 점이다. 추론 비용이 서비스 확산의 핵심 제약으로 떠오른 상황에서, 이종 가속기를 효율적으로 통합하는 기술은 비용과 성능을 동시에 좌우하는 변수로 부상하고 있다.</p> <p contents-hash="43a4ea3f3241417f6bf64c2de97a52845091661db4b1afcadd6138a188962cc7" dmcf-pid="KkIn8rXSmZ" dmcf-ptype="general">모레는 이런 역량을 정부의 독자 AI 파운데이션 모델 사업과도 연결하고 있다. 자회사 모티프테크놀로지스를 통해 모델 개발과 인프라 최적화를 함께 추진하며, 국가 AI 모델을 한국형 인프라에서 효율적으로 구동하는 기반을 겨냥하고 있다.</p> <p contents-hash="44f735322f7bc49ea3af171b7c51dd493fc44854ae01b8bf2343c7f8ef990913" dmcf-pid="9awR9cyOEX" dmcf-ptype="general">조강원 모레 대표는 “엔비디아의 GTC 2026 발표는 이종 분리형 추론이 AI 인프라의 미래임을 보여줬다”며 “모아 추론 프레임워크를 통해 엔비디아·AMD·텐스토렌트를 아우르는 더 넓은 생태계를 지원하고, 특정 벤더에 종속되지 않는 AI 인프라 선택지를 제공할 것”이라고 말했다. 이어 “독자 AI 파운데이션 모델 사업을 통해 국가대표 AI 모델의 추론 효율을 극대화하는 인프라를 제공하겠다”고 강조했다.</p> <figure class="figure_frm origin_fig" contents-hash="d49d861b88fca5a34a1a45f4386262d4b7aa2b37cb4682bbd7d03c5c944bc3d5" dmcf-pid="2Nre2kWImH" dmcf-ptype="figure"> <p class="link_figure"><img alt="네이버와 AMD가 18일, 네이버 제2사옥 1784에서 양사 주요 경영진이 참석한 가운데 AI 생태계 확장 및 차세대 인프라 협력을 위한 양해각서(MOU)를 체결했다. 왼쪽부터 최수연 네이버 대표와 리사 수 AMD CEO다. 사진=네이버" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/18/Edaily/20260318153103594uzvl.jpg" data-org-width="670" dmcf-mid="ZK8FT2LxDK" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/18/Edaily/20260318153103594uzvl.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 네이버와 AMD가 18일, 네이버 제2사옥 1784에서 양사 주요 경영진이 참석한 가운데 AI 생태계 확장 및 차세대 인프라 협력을 위한 양해각서(MOU)를 체결했다. 왼쪽부터 최수연 네이버 대표와 리사 수 AMD CEO다. 사진=네이버 </figcaption> </figure> <div contents-hash="6a2c512bec89fc407e05586bb44a72044b401ea55bdca4704f32cafd50dcc246" dmcf-pid="VjmdVEYCDG" dmcf-ptype="general"> <strong>네이버는 다변화, 래블업은 운영 소프트웨어</strong> </div> <p contents-hash="26faa1908ee3860aa017ecf6c3e4e8ffd39328607f13358811210147e3884e37" dmcf-pid="fAsJfDGhDY" dmcf-ptype="general">국내 다른 기업들도 비슷한 흐름에 올라타고 있다. 네이버는 AMD와 AI 생태계 확장 및 차세대 인프라 협력을 위한 양해각서(MOU)를 맺고, 하이퍼클로바X에 최적화된 고성능 GPU 연산 환경 구축에 나섰다. 업계에서는 네이버가 국내 LPU 스타트업인 하이퍼엑셀과의 추론용 칩 협력에 더해 AMD와도 손잡으면서 특정 벤더 의존을 줄이는 다변화 전략에 속도를 내고 있다고 본다. 18일 네이버 1784를 찾은 리사 수 AMD 최고경영자(CEO)가 각 세종 데이터센터에 AMD AI 칩을 공급할 계획 여부에 대해 “오늘 네이버와 많은 논의를 할 것(We will discuss more today)”이라고 밝힌 것도 이런 흐름에 힘을 실었다.</p> <p contents-hash="e1e00d297751876edf25120d2c4bbac69a1db1f6275fd57809defb80761aca05" dmcf-pid="4cOi4wHlrW" dmcf-ptype="general">래블업은 또 다른 축이다. 이 회사는 대규모 GPU 자원을 통합 관리하는 ‘인프라 운영체계(OS)’급 소프트웨어를 앞세워 존재감을 키우고 있다. 분리형 추론이 칩 조합의 문제라면, 래블업은 그 위에서 GPU 자원과 데이터, 저장소를 끊김 없이 배치하고 운영하는 관리 소프트웨어의 중요성을 부각하고 있다.</p> <p contents-hash="2753071f75e72754639d00285aea75bfa8f67bbcdb785038280b423fd504e00e" dmcf-pid="8kIn8rXSOy" dmcf-ptype="general"><strong>AI 인프라 승부처, 이제는 운영 능력</strong></p> <p contents-hash="0b3965ed9b063ed714e952e6c63de7a1da0238b64094b7169beaedb562c11e4b" dmcf-pid="6ECL6mZvmT" dmcf-ptype="general">GTC 2026이 던진 메시지는 분명하다. AI 인프라 경쟁의 무게중심이 더 이상 GPU 단일 스펙에만 있지 않다는 점이다. 엔비디아가 분리형 추론을 공식화한 지금, 국내에서는 모레가 MoAI Inference Framework를 앞세워 이종 가속기 통합과 자동화 소프트웨어 경쟁에서 가장 선명한 존재감을 드러내고 있다.</p> <p contents-hash="0fc498cee1bf3b59ba158e74a61f09a09e86da0c7359cbc7da3b321d13aaa60d" dmcf-pid="PDhoPs5TDv" dmcf-ptype="general">여기에 네이버의 인프라 다변화, 래블업의 운영 소프트웨어 전략까지 더해지면서 국내 AI 인프라 경쟁도 새 국면에 들어섰다. 이제 승부는 칩을 얼마나 많이 사느냐가 아니라, 어떤 칩을 어떻게 엮어 비용과 성능을 함께 최적화하느냐다. AI 인프라의 주도권도 결국 그 운영 능력에서 갈릴 가능성이 커지고 있다.</p> <p contents-hash="5fc84a585c507207261098c3f4942665e710ce9f0ff3ea050a5a32c43ccc40aa" dmcf-pid="QwlgQO1yIS" dmcf-ptype="general">김현아 (chaos@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기