로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
동국대 국제정보보호대학원 후기 신입생 모집... AI LLM 기반 전공 신설
N
[스포츠뉴스]
장성우, 평창오대산천장사대회 우승…2년 만에 백두장사
N
[연예뉴스]
최태성vs설민석 강연 배틀 중 방송 사고→녹화 중단‥설민석 눈물 사태(사기꾼들)[오늘TV]
N
[연예뉴스]
김신영 CP 다시 나선다... ‘걸스플래닛2’ 지원자 수 역대급
N
[연예뉴스]
안성재, 와인 바꿔치기→유튜브 중단 그 후 "어지럽게 돌아가는 세상.." 심경 [RE:스타]
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]보고 있나 삼전닉스? 메모리 덜 쓰는 기술 내놓는 빅테크
온카뱅크관리자
조회:
12
2026-05-14 17:57:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">구글·엔비디아·딥시크<br>"칩 확보 매달리지 않겠다"<br>치솟는 메모리 가격에 대응<br>메모리 효율화 기술에 '올인'<br>압축하고 필요 없으면 잘라내<br>메모리 사용 10분의 1로 줄여</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="HkthBPRflD"> <p contents-hash="d09fba5a56108fd6ccf2340bd1170b91e7c6a623de8cc121103c3e00585c5871" dmcf-pid="XsuWfdLxlE" dmcf-ptype="general">“메모리 반도체를 모으는 전략은 더 이상 유효하지 않다. 대신 중앙처리장치(CPU)와 그래픽처리장치(GPU)의 효율을 높여야 한다.”</p> <p contents-hash="12924a2be75df288530a47b81ad3e4e06b8d937db0e9ccb9dd3917a58f207750" dmcf-pid="ZO7Y4JoMCk" dmcf-ptype="general">인공지능(AI) 데이터기업 웨카의 리란 즈비벨 최고경영자(CEO)는 13일(현지시간) 포브스 기고에서 이렇게 적었다. 메모리 칩 공급난이 길어질 것으로 예상되자 테크기업이 소프트웨어 기술을 통해 생존 전략을 본격적으로 찾아 나선 신호로 해석된다. 빅테크는 메모리 효율을 높이는 소프트웨어 기술을 하나둘 내놓고 있다. 지금의 메모리 수요를 기반으로 낙관이 넘쳐나는 삼성전자와 SK하이닉스도 긴장해야 한다는 지적이 나오는 배경이다.</p> <p contents-hash="3005ba403b11fd48940e09da4c039787eb13833a0e8915da31318f2607d57c31" dmcf-pid="5IzG8igRWc" dmcf-ptype="general"><strong><span> ◇구글과 딥시크가 선도</span></strong></p> <figure class="figure_frm origin_fig" contents-hash="4c58e5af69a0ec3108cb36b09dada605bb4656a92edd7d5253597379728638e1" dmcf-pid="1CqH6naeCA" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/14/ked/20260514175355470dnie.jpg" data-org-width="1036" dmcf-mid="GBNPsWXSWw" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/14/ked/20260514175355470dnie.jpg" width="658"></p> </figure> <p contents-hash="d7ab1175332e6c27fa9ba14e08c0c77f10f697c79addba77e59c36aa6c2aa4d1" dmcf-pid="thBXPLNdyj" dmcf-ptype="general"><br>14일 디인포메이션에 따르면 데이터센터 GPU 활용률을 측정하는 지표인 모델플롭스활용률(MFU)은 40%밖에 안 된다. 최적화에 성공해도 55% 수준에 그친다. 데이터센터의 GPU 절반은 논다는 의미다. GPU의 빠른 연산 속도를 고대역폭메모리(HBM)가 따라가지 못해 생기는 현상이다.</p> <p contents-hash="9cf0d0e9996c1c117ee80cb85cf6a129574387293c9482dbc0da9424cb525e32" dmcf-pid="FlbZQojJSN" dmcf-ptype="general">메모리에서 최대 병목 지점은 KV캐시다. KV캐시는 AI 모델이 텍스트를 읽을 때 문맥을 담아두는 HBM 내부의 임시 저장 공간이다. KV캐시 용량이 커질수록 더 많은 HBM이 필요해진다. 구글이 KV캐시 메모리를 6분의 1로 압축하는 ‘터보퀀트’ 기술을 지난 3월 내놓자 삼성전자와 SK하이닉스 주가가 일시적으로 떨어진 이유다.</p> <p contents-hash="0a3e5192cb2c0f0fe0c8988a8634684d2757531249e6e88375e1414471763aad" dmcf-pid="3SK5xgAiCa" dmcf-ptype="general">중국 AI 기업 딥시크도 구글처럼 천정부지로 치솟는 메모리 가격 극복에 나섰다. 지난달 24일 AI 모델 V4를 출시했다. V4는 ‘하이브리드 어텐션’ 기술이 적용돼 전작 V3.2 대비 KV캐시 사용량이 10분의 1로 줄었다.</p> <p contents-hash="ce2fd356090be084c620e490bc0cf9217511066e73ecd60ca7311b3d294ecaac" dmcf-pid="0v91Macnlg" dmcf-ptype="general">어텐션은 AI 모델이 보는 단어와 단어 간 관계를 의미한다. V4는 한 종류의 어텐션을 활용하는 기존 AI 모델과 달리 ‘압축희소어텐션’(CSA)과 ‘고강도압축어텐션’(HCA) 두 종류를 섞어 쓴다. CSA는 텍스트를 ‘꼼꼼하게 읽는 눈’에 비유할 수 있다. 4개의 토큰(AI 연산 기본 단위)을 하나로 묶어 압축한 뒤 이 중 핵심적인 의미를 지닌 토큰을 추출한다. 이를 통해 KV캐시를 4분의 1로 줄인다. HCA는 ‘훑어보는 눈’이다. 128개 토큰을 하나로 묶는다. HCA는 중요한 토큰을 골라내지 않아 정보의 밀도는 떨어지지만 전체 대화 문맥을 모델이 이해하도록 해 대화 흐름을 유지한다. V4는 정보를 가공하는 61개 층에 두 어텐션을 배분했다. 0~1층은 HCA가, 2~60층은 CSA와 HCA가 오가며 작동한다.</p> <p contents-hash="b7f1093d076932565c90ae9d3943ca6233a3a42201815743c49534abe28ee730" dmcf-pid="pT2tRNkLCo" dmcf-ptype="general"><strong><span> ◇엔비디아·화웨이도 나서</span></strong></p> <p contents-hash="86af119c3b71d6be46a971a025224d4112721e52d04ff6db3bfdfa9ba9611b76" dmcf-pid="UyVFejEovL" dmcf-ptype="general">엔비디아는 지난달 6일 미국 매사추세츠공대(MIT), 중국 저장대와 함께 발표한 ‘트라이어텐션’ 기술로 메모리 효율화의 실마리를 찾았다. 이를 통해 KV캐시 사용량을 9.3%로 줄이거나 속도에 초점을 맞추면 연산을 2.5배 빠르게 할 수 있다는 설명이다.</p> <p contents-hash="4d2069594256818a3332faae05f7d3afa11f86d38653c1aee1223b1436d93f84" dmcf-pid="uWf3dADgWn" dmcf-ptype="general">터보퀀트가 KV캐시를 압축해 메모리 사용량을 줄인다면 트라이어텐션은 KV캐시에 담긴 정보 중 중요한 것을 선별하는 기술이다. 터보퀀트가 이미지를 흐릿하게 저장해 용량을 줄이는 압축 기술이라면 트라이어텐션은 이미지에서 불필요한 부분을 잘라내는 방식이다. 기존 KV캐시 압축 기술은 오래된 데이터를 불러오기 어렵다는 한계가 있었는데, 트라이어텐션은 이 문제를 크게 개선했다.</p> <p contents-hash="1d17e4f93828c93a3fd4d4ea43b72d23ff5ce85df2ddd04b9680fbdf1ae333ae" dmcf-pid="7Y40Jcwali" dmcf-ptype="general">화웨이는 통합컴퓨트메모리(UCM) 기술로 HBM 의존도를 낮췄다. 기존 GPU 연산에서 HBM이 직접 참여하고 일반 D램이 보조적 역할을 한다면 UCM은 HBM과 D램을 하나의 메모리로 쓴다. 미국이 2024년 12월 반도체의 대중(對中) 수출을 금지하자 한국산 HBM을 못 구해 내놓은 방안이었는데, 이제 치솟는 메모리 가격의 대응책이 되고 있다.</p> <p contents-hash="7d5892a7a3c9511530d6830c3f47c0ce7d4d543647385c1f1627184720a28650" dmcf-pid="zG8pikrNCJ" dmcf-ptype="general">실리콘밸리=김인엽 특파원 inside@hankyung.com</p> </section> </div> <p class="" data-translation="true">Copyright © 한국경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기