로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
'미스트롯4' 참가자 라인업…마스터 체제 개편
N
[실시간뉴스]
'기업형 종교' 통일교...끊임없는 '정교 유착' 논란
N
[연예뉴스]
유재석 배후설 선 긋기…이이경 측 “하차통보 당일 응원했다”
N
[스포츠뉴스]
쇼킹! UFC 챔피언 아내 폭행 혐의→무기한 결장 확정...토푸리아, "금전적 요구로 협박받고 있어" 법정 싸움 결단
N
[연예뉴스]
'현역가왕 시즌 3' 출연자 공개
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발
온카뱅크관리자
조회:
75
2025-05-12 15:37:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">플래시 어텐션·쿠다 그래프 최적화…로컬 LLM 사용성·처리량 대폭 강화</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1jkhyTUlof"> <p contents-hash="b6f71df8e3266616ca2fafc763496e36e61399d9bfaf3886c6afb9ac088a7870" dmcf-pid="tB9MiJrRNV" dmcf-ptype="general">(지디넷코리아=조이환 기자)엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다.</p> <p contents-hash="8df70ef0e4195cd5f6ad887aa650db16746482646d893c88ecc24d4ee99f1c94" dmcf-pid="Fb2Rnimeg2" dmcf-ptype="general">엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다.</p> <p contents-hash="e740a1f810bde4eb7206dbca5a6da141662624550adbdb868df43975b7255643" dmcf-pid="3KVeLnsdg9" dmcf-ptype="general">'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다.</p> <figure class="figure_frm origin_fig" contents-hash="b83d9e14cef3994e9128f73bfea6245f87cf6c8717ef1e78a086002b950ccbb7" dmcf-pid="09fdoLOJAK" dmcf-ptype="figure"> <p class="link_figure"><img alt="엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" data-org-width="638" dmcf-mid="5KtBV2nbA4" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아) </figcaption> </figure> <p contents-hash="fdd64005cbb0e4baa80316571ae5cb2d2f8d00e5ec9e6d8230b3cafe2ed7f95b" dmcf-pid="p24JgoIiob" dmcf-ptype="general">새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다.</p> <p contents-hash="077cebcae37938087398c4dfcbf8595e939c6b55b5c164dd99ce438801f93d2f" dmcf-pid="UV8iagCngB" dmcf-ptype="general">시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다.</p> <p contents-hash="40001c0d5973d0399e04f0fa8deb902edf26e58c9920ba9a80db4aaf5090835b" dmcf-pid="uf6nNahLAq" dmcf-ptype="general">이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다.</p> <p contents-hash="a37c74325d720d1db512c6b777367c848c4e4f7735781bff2c7bc5d714817ed3" dmcf-pid="7H5z9KJqNz" dmcf-ptype="general">성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다.</p> <p contents-hash="b0645fcd7e2d1618ea8dbf7fa62e0dffdf2fcc5184e7cddf619f222c15942a87" dmcf-pid="zX1q29iBA7" dmcf-ptype="general">RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다.</p> <p contents-hash="44c63bc9fa0e9ca5f642476d5357cfdf4e80b0deccd79fe21e42c7babee0f721" dmcf-pid="qZtBV2nbAu" dmcf-ptype="general">'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다.</p> <p contents-hash="eaee85d4c7ecb73954598af36721fc8025d47fa90fb60b8428cb536b541156ff" dmcf-pid="B5FbfVLKjU" dmcf-ptype="general">엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.</p> <p contents-hash="754d141410c5b7f398c2174148df8649a18aa93baaec37b7b3ffa897fd87e99f" dmcf-pid="b13K4fo9Np" dmcf-ptype="general">조이환 기자(ianyhcho@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기