로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
김범석, 쿠팡 사태 첫 사과…"대응미흡·소통부족"
N
[실시간뉴스]
'1200픽셀 장벽' 넘어야 산다? AI가 던진 숙제 [스터디+]
N
[IT뉴스]
美 빅테크 5곳이 세계 R&D 15% 차지...자본 앞세워 독점력 강화
N
[연예뉴스]
'프로보노' 정경호, 믿고 싶지 않은 제보가 사실로…서서히 모습 드러내는 진실[오늘TV]
N
[스포츠뉴스]
세계배드민턴연맹 "15점제 도입은 안세영 견제 아냐"...내년 4월 총회서 최종 결정
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[실시간뉴스]개인 PC·스마트폰 GPU로 AI 서비스 비용 67% 낮춘다
온카뱅크관리자
조회:
6
2025-12-28 12:28:01
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="9oZPjkNdeB"> <figure class="figure_frm origin_fig" contents-hash="7bf7ad0691ff762eb61208148ae4a12c436a9f6910dec908c7f471949bfdf8bf" dmcf-pid="2g5QAEjJeq" dmcf-ptype="figure"> <p class="link_figure"><img alt="스펙엣지 개념도. 데이터센터 GPU와 엣지 GPU가 역할을 나눠 LLM 추론 인프라를 함께 구성한다. AI가 생성 이미지, KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/dongascience/20251228121010324xkwk.png" data-org-width="680" dmcf-mid="BkfEWHyOJ9" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/dongascience/20251228121010324xkwk.png" width="658"></p> <figcaption class="txt_caption default_figure"> 스펙엣지 개념도. 데이터센터 GPU와 엣지 GPU가 역할을 나눠 LLM 추론 인프라를 함께 구성한다. AI가 생성 이미지, KAIST 제공 </figcaption> </figure> <p contents-hash="cc674b5f0027e003b3c6273813188632b0af2c562aa0656ff361e60b6cfc9b52" dmcf-pid="Va1xcDAiiz" dmcf-ptype="general">챗GPT 같은 대규모 언어모델(LLM) 기반 AI 서비스를 이용하려면 고가의 데이터센터 GPU가 필수다. 국내 연구팀이 개인용 PC나 스마트폰에 탑재된 저렴한 GPU를 활용해 AI 서비스 비용을 약 67% 절감할 수 있는 기술을 개발했다.</p> <p contents-hash="d4c83307d9421d5c30f99456f2754a43161c5b2734de1eae6ec032d7f842099d" dmcf-pid="fNtMkwcnJ7" dmcf-ptype="general"> KAIST는 한동수 전기및전자공학부 교수팀이 데이터센터 밖에 널리 보급된 개인 소비자가 쓰는 수준의 GPU를 활용해 LLM 인프라 비용을 크게 낮출 수 있는 새로운 기술 '스펙엣지(SpecEdge)'를 개발했다고 28일 밝혔다. 연구 결과는 12월초 미국 샌디에이고에서 열린 인공지능 분야 최고 권위 국제학회인 ‘신경정보처리시스템학회(NeurIPS)’에서 스포트라이트(상위 3.2% 우수 논문)로 선정돼 발표됐다.</p> <p contents-hash="fd6b0af624e8e843e3e7efc9551ae2e0da66ac3f520ede5777c50e38c82f2777" dmcf-pid="4jFRErkLeu" dmcf-ptype="general"> 스펙엣지는 데이터센터 GPU와 개인 PC나 소형 서버 등에 탑재된 '엣지 GPU'가 역할을 나눠 LLM 추론 인프라를 함께 구성하는 방식이다. 기존 데이터센터 GPU만 사용하는 방식에 비해 토큰당 비용을 약 67.6% 절감했다.</p> <figure class="figure_frm origin_fig" contents-hash="9edcf0111b33bba5fe66fabfbe0ccc37026ded8326db86a27b5c0c58b60745ff" dmcf-pid="8A3eDmEoLU" dmcf-ptype="figure"> <p class="link_figure"><img alt="기존 추론 방식과 스펙엣지 비교. 기존 방식은 대규모 언어모델이 토큰을 하나씩 생성하지만 스펙엣지는 엣지 기기의 소형 모델이 초안을 먼저 생성하고 서버의 대형 모델이 검증·수정한다. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/dongascience/20251228121011622teak.jpg" data-org-width="680" dmcf-mid="bfdl3UFYeK" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/dongascience/20251228121011622teak.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 기존 추론 방식과 스펙엣지 비교. 기존 방식은 대규모 언어모델이 토큰을 하나씩 생성하지만 스펙엣지는 엣지 기기의 소형 모델이 초안을 먼저 생성하고 서버의 대형 모델이 검증·수정한다. KAIST 제공 </figcaption> </figure> <p contents-hash="4b1d8082146d0e640c0599e5e3011a53211b2c212cd97e77f4c6080914c8f26e" dmcf-pid="6c0dwsDgMp" dmcf-ptype="general">연구팀은 '추측적 디코딩(Speculative Decoding)' 방법을 활용했다. 엣지 GPU에 배치된 소형 언어모델이 확률이 높은 토큰 시퀀스를 빠르게 생성하면 데이터센터의 대규모 언어모델이 일괄 검증하는 방식이다. 엣지 GPU는 서버의 응답을 기다리지 않고 계속 단어를 만들어 LLM 추론 속도와 인프라 효율을 동시에 높였다.</p> <p contents-hash="431bf7d2404cb88893eac8151179b62ebc5b3ba501dfe5550ceb23b2a9152bae" dmcf-pid="PkpJrOwad0" dmcf-ptype="general"> 데이터센터 GPU에서만 추측적 디코딩을 수행하는 방식과 비교해 비용 효율성은 1.91배, 서버 처리량은 2.22배 향상됐다. 일반적인 인터넷 속도에서도 문제없이 작동해, 별도의 특수한 네트워크 환경 없이도 실제 서비스에 바로 적용할 수 있다.</p> <p contents-hash="4e0ecadac11023f5ff2b69c00bdedad25cda48d65276f92667c17f11b0ff7f88" dmcf-pid="QEUimIrNe3" dmcf-ptype="general"> 서버는 여러 엣지 GPU의 검증 요청을 효율적으로 처리하도록 설계됐다. GPU 유휴 시간 없이 더 많은 요청을 동시에 처리할 수 있어 데이터센터 자원을 보다 효율적으로 활용할 수 있는 LLM 서빙 인프라 구조를 구현했다.</p> <p contents-hash="022efdee2ddd641ac2bf5d854fbbd216beba28bb6692b14977f1ba868499af8d" dmcf-pid="xDunsCmjnF" dmcf-ptype="general"> 한동수 교수는 "데이터센터를 넘어 사용자의 주변에 있는 엣지 자원까지 LLM 인프라로 활용하는 것이 목표"라며 "AI 서비스 제공 비용을 낮추고 누구나 고품질 AI를 활용할 수 있는 환경을 만들고자 한다"고 말했다.</p> <p contents-hash="cddda8fc99ff14c71ccb416b9f278889ce8967f9fdaaad4f291d234994a22480" dmcf-pid="yT8wGZYCnt" dmcf-ptype="general"><참고자료><br> - neurips.cc/virtual/2025/loc/san-diego/poster/119940</p> <figure class="figure_frm origin_fig" contents-hash="4a4423e48974790421b73778ec140a8c0e54b648fe552a920411ae04308cd94c" dmcf-pid="Wy6rH5GhR1" dmcf-ptype="figure"> <p class="link_figure"><img alt="KAIST 전기및전자공학부 박진우 박사(왼쪽부터), 조승근 석사과정생, 한동수 교수. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/dongascience/20251228121012925cdlb.jpg" data-org-width="680" dmcf-mid="K6CzMdx2Lb" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/dongascience/20251228121012925cdlb.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KAIST 전기및전자공학부 박진우 박사(왼쪽부터), 조승근 석사과정생, 한동수 교수. KAIST 제공 </figcaption> </figure> <p contents-hash="7818167df45314be2546f749ae0baebb021c1fce119f392b94e9e6588c8fc5b1" dmcf-pid="YWPmX1HlM5" dmcf-ptype="general">[조가현 기자 gahyun@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기