로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
거래소, 12시간 거래 속도 낸다…노사 합의점 도출(종합)
N
[IT뉴스]
갤럭시 S26 울트라 모델 윤곽…더 얇고 프라이버시 강화
N
[IT뉴스]
김정호 KAIST 교수 "차세대 AI 메모리 HBF, 10년 후 HBM 시장 넘을 것"
N
[IT뉴스]
게임 스타트업 투자 늘었지만…‘자금 쏠림’에 메말라가는 생태계
N
[IT뉴스]
"롤러코스터 장세, 정신 차려야" 커뮤니티글 작성자 누군지 봤더니…'반전'
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]HBM 다음 카드는 'HBF'…김정호 카이스트 교수 "AI 병목은 메모리, GPU 옆에 '계층' 다시 짜야"
온카뱅크관리자
조회:
3
2026-02-03 14:27:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[반도체레이다]</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="buWEJxjJCJ"> <figure class="figure_frm origin_fig" contents-hash="31a1de33cdf163fc5f736535cf88d73f79b2d7ce408aa117bf7ffa5f9f749051" dmcf-pid="K7YDiMAiWd" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202602/03/552796-pzfp7fF/20260203141816375njge.jpg" data-org-width="640" dmcf-mid="qKERK7PKhn" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202602/03/552796-pzfp7fF/20260203141816375njge.jpg" width="658"></p> </figure> <p contents-hash="83daf2241cbf72d392faf2a5e7e468fbc12a5edfe66f8464e97b645a8abff32a" dmcf-pid="90vAR6gRTe" dmcf-ptype="general">[디지털데일리 배태용기자] <strong>"GPU(그래픽처리장치)의 혁신은 거의 끝나갑니다. 앞으로의 성능 향상은 메모리에서 올 겁니다."</strong></p> <p contents-hash="39e15e0863cae2733c395e3388adb7769e2eddf509fcdfb87db6840e7e17e799" dmcf-pid="2pTcePaeSR" dmcf-ptype="general">김정호 카이스트(KAIST) 전기 및 전자공학부 교수는 3일 서울 프레스센터에서 열린 'HBF 연구 소개 및 기술개발 전략 설명회'에서 인공지능(AI) 컴퓨팅의 다음 병목으로 '메모리 계층(하이어라키)'을 콕 집었다. 그래픽처리장치(GPU) 성능만 끌어올리는 방식이 한계에 다다르는 만큼 GPU 주변 메모리 구조를 근본적으로 바꾸지 않으면 추론 서비스의 속도와 비용이 함께 막힌다는 주장이다.</p> <p contents-hash="a562774f0d7e56a68ae115884596c096c7d5647e45b715dc90b2b82aad0fc204" dmcf-pid="VUykdQNdvM" dmcf-ptype="general">김 교수의 문제의식은 간단하다. AI가 '트랜스포머' 기반으로 진화하면서 입력(프리필) 과정에서 만들어지는 '키-밸류(KV) 캐시'가 폭증했고 멀티모달·로봇 등으로 데이터량은 더 커지고 있다. 그는 "멀티모달로 갈수록 데이터가 천 배 늘어난다"며 "지금보다 100배에서 1000배 정도 메모리가 더 필요해진다"고 말했다. 추론 과정에서 단어·프레임을 뽑아내는 생성 속도는 결국 메모리 대역폭과 용량이 좌우하는데 여기서 GPU만 비싸게 키워서는 체감 성능이 따라오지 않는다는 의미다.</p> <p contents-hash="e2ec1ff6fbf90ed616e94a6e8d56254ea59e13637b9462e0daa0317746cd8d0b" dmcf-pid="fuWEJxjJlx" dmcf-ptype="general">핵심은 'HBM의 물리적 한계'다. 김 교수는 "HBM은 쌓아봐야 200GB 수준"이라며 모델과 KV 캐시가 커질수록 여러 장비로 나눠 읽어야 하는 시간이 늘고 사용자 불만(지연 비용)이 커진다고 봤다. 그래서 내놓은 해법이 HBM 바깥에 'HBF'를 두는 새로운 계층 구조다. 개념도는 GPU를 중심으로 HBM과 HBF를 함께 배치해 작업 특성에 따라 메모리를 나눠 쓰는 방식을 제시했다. 그는 "속도를 결정하는 게 HBM이면 용량을 결정하는 게 HBF"라고 정리했다.</p> <figure class="figure_frm origin_fig" contents-hash="059923530aba6d2cbe00dbef7a16b6b3d50983fca7de3206f37af9380a354b3f" dmcf-pid="47YDiMAiWQ" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202602/03/552796-pzfp7fF/20260203141817753riup.jpg" data-org-width="640" dmcf-mid="Bc80yh1yWi" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202602/03/552796-pzfp7fF/20260203141817753riup.jpg" width="658"></p> </figure> <p contents-hash="728c11919b8d977213b89c436b122515239a46ea4dc352a0709fee8dbd1000bb" dmcf-pid="8zGwnRcnlP" dmcf-ptype="general">김 교수 측은 1개의 HBM 묶음이 24GB(스택당 1.5GB) 수준인 반면 1개의 HBF는 512GB(스택당 32GB)까지 커질 수 있다고 제시했다. 8개 HBF 구성만으로도 총 4TB까지 용량을 늘리는 시나리오다. 여기에 'HBF 소켓(SSD)'을 붙이는 형태까지 확장하면 48~96TB급 저장계층을 추가하는 구조도 포함됐다. 그는 최근 업계에서 거론되는 '컨텍스트 메모리' 흐름을 언급하며, 추론에서 필요한 맥락 데이터를 빠르게 '오프로딩'하는 길목에 HBF를 끼워 넣어 병목을 줄이겠다는 구상도 내놨다.</p> <p contents-hash="4643e57cd1ec7ca1d4f5d383c0e43eb883fa08efb1d6be9eb339ad670b47fa52" dmcf-pid="6qHrLekLh6" dmcf-ptype="general">김 교수는 장기적으로는 메모리의 역할이 '부품'에서 '아키텍처의 주도권'으로 이동한다고 봤다. 지금까지는 중앙처리장치(CPU) 옆에 메모리가 붙어 있고 필요할 때 GPU를 달아 가속하는 구조였지만 AI 시대에는 GPU가 데이터와 메모리의 중심이 돼야 한다는 논리다. 그는 "이 전체를 GPU에 바로 붙이면 10~20년 뒤 AI 컴퓨터를 한국이 주도할 수 있다"고 했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기