로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
AI 영향력 주시하는 Fed…월러 "AI 고용 우려 과장" VS 쿡 "AI로 수요 측면 통화정책 어려울 것"(종합)
N
[실시간뉴스]
재판소원과 ABS - 정파적 의제가 된 사법개혁의 비극 [취재파일]
N
[실시간뉴스]
충주맨 ‘집단 따돌림’ 국민신문고 민원…충주시 감사 결과 “없었다”
N
[IT뉴스]
AI 3강 위한 액션플랜 본격 가동...2030 피지컬AI 세계 1위 목표
N
[IT뉴스]
"이공계 신규 박사 임금, 대학이 갈랐다"…전공·연구성과보다 '학위 대학' 영향 커
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"AWS·애저·구글·OCI 통합"…엔비디아 '다이나모' AI 추론 확장
온카뱅크관리자
조회:
48
2025-11-17 09:27:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">블랙웰·쿠버네티스 통합…멀티 노드 추론 가속<br>프로덕션급 분산 서빙 통해 전문가혼합 모델 효율 높여</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="bEVYtd4qZd"> <figure class="figure_frm origin_fig" contents-hash="b085612069bc63768afdea4051f4095e9c65b899f8b62d0130a68e9f4f6413f4" dmcf-pid="KDfGFJ8BYe" dmcf-ptype="figure"> <p class="link_figure"><img alt="엔비디아·AWS·구글·마이크로소프트·OCI 협력 다이나모 기반 AI 추론 가속(엔비디아 제공)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/17/NEWS1/20251117092518971oyks.jpg" data-org-width="1280" dmcf-mid="BsR3qjd8YJ" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/17/NEWS1/20251117092518971oyks.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 엔비디아·AWS·구글·마이크로소프트·OCI 협력 다이나모 기반 AI 추론 가속(엔비디아 제공) </figcaption> </figure> <p contents-hash="f4323d762f7f66aecc474a67ebce31ccbf2f79e35e781fb43ce2e98f265788f0" dmcf-pid="9o7CW8qFXR" dmcf-ptype="general">(서울=뉴스1) 김민석 기자 = 엔비디아가 인공지능(AI) 추론 성능을 높이기 위해 글로벌 빅테크 클라우드 기업들과 손잡고 '다이나모'(Dynamo) 기반 멀티 노드(서버) 추론 가속을 본격화한다고 17일 밝혔다.</p> <p contents-hash="c443417ba2b07a857861d1afc32772069ebade70e441bd06d2f2cf5a0a980272" dmcf-pid="2gzhY6B3ZM" dmcf-ptype="general">엔비디아는 △아마존웹서비스(AWS) △구글 클라우드 △마이크로소프트 애저 △오라클 클라우드 인프라스트럭처(OCI) 등과 협력으로 엔터프라이즈급 AI 추론 환경 전반의 확장성을 높일 계획이다.</p> <p contents-hash="94d8ad53d627ffbc55828dc5a07f894e75e3516204a0c205c8038b01c1a39fc1" dmcf-pid="VaqlGPb0Zx" dmcf-ptype="general">엔비디아 관계자는 "다이나모를 통해 블랙웰(Blackwell) 기반 시스템 전반에 대규모 AI 추론 및 전문가 혼합(MoE) 모델 등 복잡한 워크로드 성능을 효율적으로 지원할 수 있다"며 "쿠버네티스(Kubernetes) 관리형 서비스와 통합해 기업들이 클라우드 전반에서 멀티 노드 추론을 손쉽게 확장할 수 있도록 했다"고 말했다.</p> <p contents-hash="49c589e7c12cc9f3428e6b8dd778e5adbd8f3173a57bda5cf7a6812fede4498a" dmcf-pid="fNBSHQKpXQ" dmcf-ptype="general">AWS는 엔비디아 다이나모와 자사 쿠버네티스 서비스(EKS)를 통합해 생성형 AI 추론을 가속한다.</p> <p contents-hash="0a03c79e76f5ca32d7751f301f77b92a2e951345def4ab3f8a57459233686cbf" dmcf-pid="4jbvXx9U5P" dmcf-ptype="general">구글 클라우드는 다이나모 레시피로 자사 AI 하이퍼컴퓨터에서 대형 언어모델(LLM) 추론을 최적화한다.</p> <p contents-hash="42a7d09c31d5f6816ebd927214c0f3269144392e2a7bb7d8ddc94ea574c3e908" dmcf-pid="8AKTZM2uZ6" dmcf-ptype="general">애저는 ND GB200-v6 GPU와 다이나모를 연동해 멀티 노드 추론을 지원한다. OCI는 슈퍼클러스터 환경에서 대규모 LLM 추론을 구현할 수 있게 됐다.</p> <p contents-hash="613379def257fa0670fbc598f6022d6a008f874c7ee187660595d4b1823020ef" dmcf-pid="6c9y5RV7G8" dmcf-ptype="general">젠슨 황 엔비디아 CEO는 미국 워싱턴D.C.에서 열린 GTC 콘퍼런스에서 "블랙웰은 기존 호퍼(Hopper) 대비 10배 높은 성능과 수익을 제공한다"며 "강력한 추론 컴퓨팅이 클라우드 생태계 전반으로 확산될 것"이라고 했다.</p> <p contents-hash="6c1bf53f350801f6406247875a5c5b50ce689611978e423c13846e96c39eb8d4" dmcf-pid="Pk2W1efzX4" dmcf-ptype="general">엔비디아 다이나모는 프리필(prefill)과 디코드(decode) 과정이 분리된 분산형 서빙(disaggregated serving)을 지원해 기존 통합형 추론 방식 구조의 리소스 경합 및 병목 현상을 해결한다. 모델 지시문 해석·응답 생성을 각기 최적화된 GPU로 분산 실행해 처리 속도를 높이고 리소스 효율을 극대화하는 방식이다.</p> <p contents-hash="f88cab72eda5330d97de65c4138899b86393239eece5c3889d8650cf483bc432" dmcf-pid="QEVYtd4qXf" dmcf-ptype="general">엔비디아는 쿠버네티스 기반 추론 관리 효율을 높이는 API '그로브'(Grove)도 공개했다. 그로브는 노드 할당·통신 경로 배치 등 복잡한 조율 과정을 자동 처리해 AI 서비스 운영을 단순화한다.</p> <p contents-hash="58bfdbf0039149247b7e6cc72c3230bd5f64b042017cbba14e34c33625f00753" dmcf-pid="xDfGFJ8BXV" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ 엔비디아 다이나모<br>엔비디아 다이나모(NVIDIA Dynamo)는 오픈소스 분산 추론 프레임워크로 대규모 생성형 AI·추론 모델을 효율적으로 운영할 수 있도록 설계된 기술이다. 다이나모는 여러 개의 GPU가 연결된 대형 클러스터 환경에서 AI 추론의 각 단계를 분리해 병렬로 처리하고 GPU 자원을 동적으로 할당함으로써 전체 처리량을 극대화하고 응답 지연을 최소화한다.<br><br>■ 전문가 혼합(MoE)<br>전문가 혼합(Mixture-of-Experts)은 인공지능 모델의 효율성과 확장성을 극대화하기 위해 설계된 혁신적인 아키텍처다. 이 기법은 입력 데이터에 따라 특화된 하위 모델(전문가)을 선택적으로 활성화해 연산 비용을 절감하면서도 대규모 모델의 장점을 유지한다.<br><br>■ 쿠버네티스<br>쿠버네티스(Kubernetes)는 컨테이너화된 애플리케이션을 자동으로 배포·관리·확장하는 오픈소스 플랫폼이다. 대규모 클라우드·데이터센터 환경에서 앱을 여러 서버(노드)에 걸쳐 효율적으로 운영할 수 있도록 지원한다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기