로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
코스피, 중동 긴장 재고조 속 하락…숨고르기 장세(종합)
N
[실시간뉴스]
李대통령과 정책 보폭 맞춘 한성숙 장관…20년 만에 女총리 나오나(종합)
N
[IT뉴스]
젠슨 황 "수조 달러 기회"…엔비디아, 개방형 휴머노이드 로봇 발표
N
[IT뉴스]
국회로 돌아온 '방통위 투톱'…과방위·법사위 배치 촉각
N
[IT뉴스]
kt cloud, 공공 클라우드에 리벨리온 NPU 도입…첫 인증 획득
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]노타, 이기종 컴퓨팅 기반 LLM 최적화 성공… "AI PC 효율 극대화"
온카뱅크관리자
조회:
14
2026-06-04 08:47:34
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">GPU·NPU 분산 배치하는 '분리형 추론' 기술 구현<br>단일 GPU 대비 전력 32% 절감… 컴퓨텍스 2026 흐름과 맞닿아</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xSbqjpb0mw"> <p contents-hash="e34a332d700477909871d06a4b9d7b642c3256ef83cd93524127d4e43294b2dd" dmcf-pid="y6rDpjrNsD" dmcf-ptype="general"> [이데일리 윤정훈 기자]AI 경량화·최적화 전문 기업 노타가 AI PC 환경에서 GPU(그래픽처리장치)와 NPU(신경망처리장치)를 동시 활용하는 ‘이기종 컴퓨팅(Heterogeneous Computing)’ 기반의 LLM(거대언어모델) 추론 최적화 기술을 구현했다고 4일 밝혔다.</p> <p contents-hash="f7bf8c4853dbd447d456b1c140aa5dbfec834e8788be5a716489d139581428d9" dmcf-pid="WPmwUAmjrE" dmcf-ptype="general">최근 AI PC 성능 경쟁이 단순히 칩 개별 사양을 넘어 GPU, NPU 등 시스템 전체를 아우르는 하드웨어 효율화로 이동하는 가운데, 국내 스타트업이 의미 있는 기술적 돌파구를 마련했다는 평가다.</p> <figure class="figure_frm origin_fig" contents-hash="ad558f8553e414b331e5d783cf399eedaa735a24a25a5290bcde3589f8303c14" dmcf-pid="YQsrucsAmk" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=노타)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/04/Edaily/20260604084357730mdjp.jpg" data-org-width="800" dmcf-mid="Qc5Xxy5Twr" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/04/Edaily/20260604084357730mdjp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=노타) </figcaption> </figure> <div contents-hash="13b60865806d244f789cf099f9225e8169210ff2f290c92d7888c963615ef286" dmcf-pid="GKjaZijJwc" dmcf-ptype="general"> <strong>입력은 GPU, 생성은 NPU… ‘분리형 추론’으로 효율 32%↑</strong> </div> <p contents-hash="65723980f9b3f685770f11c322cf7affe969499bcc824bc35a1096c1966c7519" dmcf-pid="H9AN5nAisA" dmcf-ptype="general">이기종 컴퓨팅은 서로 다른 특성을 가진 프로세서를 유기적으로 결합해 연산 효율을 극대화하는 방식이다. 하나의 프로세서에 전적으로 의존하는 대신, CPU·GPU·NPU가 각자 가장 잘 지연 없이 처리할 수 있는 역할을 나눠 맡도록 설계하는 것이 골자다.</p> <p contents-hash="60a8378878660d210878b4bbc08f84b1521debf052707e22a204930076f4f993" dmcf-pid="X2cj1LcnOj" dmcf-ptype="general">노타는 인텔의 최신 인공지능 칩 ‘루나 레이크(Lunar Lake)’ 기반 AI PC에서 LLM 실행 과정을 △입력 처리와 △답변 생성 등 두 단계로 분리해 분석했다. 이후 각 단계의 특성에 맞춰 연산 장치를 최적 배치하는 ‘분리형 추론(Disaggregated Inference)’ 방식을 적용했다. 연산량이 일시에 몰리는 입력 처리는 GPU에, 지속적인 연산이 필요한 답변 생성은 NPU에 할당하는 방식이다.</p> <p contents-hash="f4ad1321ce15c4dce7e1cc66c3aa30dc2276c9a4c7243a15da96cc7df6d43329" dmcf-pid="ZVkAtokLmN" dmcf-ptype="general">성능 평가 결과는 압도적이다. 노타의 분리형 추론 방식을 적용했을 때, 단일 GPU 실행 방식 대비 토큰당 에너지 소비는 약 32% 줄었고, 생성 처리량(Throughput)은 약 12% 향상됐다. 초기 구동 속도를 좌우하는 첫 응답 지연 시간 역시 단일 NPU 실행 방식과 비교해 약 89% 단축됐다.</p> <p contents-hash="cedc46619f571859d828b7792b7e9b295bb52ca9bd496ceafb74106c4556359a" dmcf-pid="5fEcFgEosa" dmcf-ptype="general"><strong>빅테크 분리형 추론 도입 속도...온디바이스 AI 실행효율 높여갈 것</strong></p> <p contents-hash="79c69cc6fc6067cda325979e6ec370cb3efbe875dc1be828994c3ff2064e6709" dmcf-pid="14Dk3aDgwg" dmcf-ptype="general">이번 성과는 단순한 하드웨어 병렬 연결이 아니라, AI 모델의 작업 특성을 세부적으로 분석해 최적의 포지셔닝을 찾아냈다는 점에서 주목받는다. 한정된 전력과 자원 안에서 구동해야 하는 ‘온디바이스(On-Device) AI’ 환경에서 사용자 경험(UX)을 결정짓는 핵심 키(Key)가 될 수 있기 때문이다.</p> <p contents-hash="7c6345127937dec5da6611e3d12080710fccdba0d40bb46e92ec0baec092140f" dmcf-pid="t8wE0Nwaso" dmcf-ptype="general">실제 글로벌 AI 산업의 지형도 이기종 컴퓨팅과 분리형 추론 중심으로 빠르게 재편되고 있다. 최근 대만에서 개막한 글로벌 IT 박람회 ‘컴퓨텍스(COMPUTEX) 2026’에서도 인텔, 엔비디아 등 글로벌 반도체 공룡들이 CPU·GPU·NPU를 결합한 AI PC 칩셋을 전면에 내세웠다. 데이터센터 영역에서도 엔비디아와 아마존웹서비스(AWS) 등이 AI 연산을 단계별로 나누는 분리형 추론 도입에 속도를 내고 있다.</p> <p contents-hash="a767efa6e7b44e573d8a4aa986068f34ab8f7975099de9a5eedd2d3feb46ddbd" dmcf-pid="F6rDpjrNIL" dmcf-ptype="general">노타는 이번 기술 구현을 통해 모델 경량화 단계를 넘어, 하드웨어 활용을 극대화하는 ‘풀스택 최적화’ 역량을 입증하게 됐다.</p> <p contents-hash="39d3ac938fe1cc1a8688047d59d3128e29b1168cca4ab824a5f8e6572d87bad6" dmcf-pid="3PmwUAmjwn" dmcf-ptype="general">채명수 노타 대표는 “AI PC 시대에는 AI 모델을 기기 안에 올리는 것만으로는 충분하지 않으며 GPU, NPU 등 다양한 연산 장치를 모델 특성에 맞게 조합하는 최적화 역량이 실제 AI 경험을 좌우한다”며, “노타는 모델 경량화, 런타임 최적화, 하드웨어 최적화 기술을 결합해 AI PC 시대의 온디바이스 AI 실행 효율을 높여 나가겠다”고 말했다.</p> <p contents-hash="8a8e0931a9f61b1b9a21ea63ebb08e50dd80989552b9618a8af127939c3fdfb8" dmcf-pid="03eMl8e4mi" dmcf-ptype="general">윤정훈 (yunright@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기