로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
‘찬란한 너의 계절에’ 이성경, 채종협 정체 알았다
N
[연예뉴스]
유연석, 살인 용의자로 긴급 체포..시청률 최고 10.3% (‘신이랑 법률사무소’)
N
[연예뉴스]
"전복된 차량에서 기어나와" 타이거 우즈, 약물·음주 혐의 체포 구금[해외이슈]
N
[연예뉴스]
유연석, 살인 혐의로 긴급체포에 시청률 1위…10.3%('신이랑 법률사무소')
N
[연예뉴스]
비투비 육성재 "내 드라마 출연료 'N분의 1', 게임하는 멤버 보며 '현타' 와.." [전현무계획3]
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"AI 답변 비용 최대 6배 낮춘다?"…구글 '터보퀀트' 뭐길래 [터보퀀트 쇼크 ①]
온카뱅크관리자
조회:
13
2026-03-28 06:07:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">KV 캐시 저비트 압축 기술 공개…메모리 점유율 1/6로 줄여 비용 혁신<br>GPU 한 대당 처리량 최대 8배 증가 기대, API 가격 인하 경쟁 촉발 가능성<br>실서비스 검증 여부 주목…확인될 경우 AI 인프라 투자·경쟁 구도 재편</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="FQtmeQ1yo2"> <figure class="figure_frm origin_fig" contents-hash="3ce8a35788ae080b20cc0be37de79c71aa2e2c6f373b41ce0b2978ee69c87ac9" dmcf-pid="3xFsdxtWo9" dmcf-ptype="figure"> <p class="link_figure"><img alt="[뉴욕=AP/뉴시스] 사진은 미국 뉴욕에 있는 구글 본사. 2023.11.30 *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/28/newsis/20260328060138956euez.jpg" data-org-width="719" dmcf-mid="ZyLkPfGhg8" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/28/newsis/20260328060138956euez.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [뉴욕=AP/뉴시스] 사진은 미국 뉴욕에 있는 구글 본사. 2023.11.30 *재판매 및 DB 금지 </figcaption> </figure> <p contents-hash="958ba9527c1a7fa9a11f032c65025c3bdc58d1adb2d5b1c0a6f9251161c8e0d1" dmcf-pid="0M3OJMFYcK" dmcf-ptype="general"><br> [서울=뉴시스]윤정민 기자 = <strong>"(터보퀀트는) 구글판 딥시크와 같은 기술이다. 속도, 메모리 사용량, 전력 소비량 등 활용도 측면에서 AI 추론을 최적화할 수 있는 여지가 훨씬 많다."</strong><br> (매튜 프린스 클라우드플레어 최고경영자, 지난 25일 엑스 공식 계정)구글이 메모리 사용량을 최대 6분의 1 수준으로 줄이면서도 성능을 유지하는 기술을 공개해 화제다. 삼성전자, SK하이닉스, 마이크론 등 국내외 메모리 반도체 기업 주가까지 흔들면서 '구글판 딥시크'로 평가 받는 이 기술이 무엇인지 관심이 쏠리고 있다.</p> <p contents-hash="77babaffe7cf5b1bbc135bce25c64b172edb42fec8f3e9638e0aca236380a193" dmcf-pid="pBvg2BSrNb" dmcf-ptype="general">27일 업계에 따르면 구글 리서치는 최근 자사 공식 블로그에 거대언어모델(LLM) 메모리 사용 효율을 높이는 기술 '터보퀀트'를 소개했다.<br> </p> <figure class="figure_frm origin_fig" contents-hash="0b695d6fc9fb81e63558b0ddf5425d8940f752696c850c6f8b8929295a0f3b16" dmcf-pid="UbTaVbvmaB" dmcf-ptype="figure"> <p class="link_figure"><img alt="[서울=뉴시스] 27일 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) 618tue@newsis.com" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/28/newsis/20260328060139127myau.jpg" data-org-width="500" dmcf-mid="58AsdxtWA4" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/28/newsis/20260328060139127myau.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [서울=뉴시스] 27일 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) 618tue@newsis.com </figcaption> </figure> <p contents-hash="03164b34f380b3f4fc556fa1f688810946f5a03b689f2c331eb73777ce0e7fc0" dmcf-pid="uKyNfKTsgq" dmcf-ptype="general"><br> 이 기술은 인공지능(AI)이 이전 대화나 문맥 정보를 저장하는 '키-값(KV) 캐시'를 저비트로 압축한다. 메모리 사용량을 최대 6분의 1 수준으로 줄이면서도 같은 성능을 유지할 수 있다.</p> <p contents-hash="3371fc31000d5753466204fa59f052a2a0ccacd67a27043e4e8309b1588f1bf7" dmcf-pid="79Wj49yONz" dmcf-ptype="general">KV 캐시는 AI가 긴 문맥을 이해하고 답변을 생성하는 데 필수적인 요소다. 다만 문맥 길이가 길어질수록 메모리 사용량이 급격히 증가해 비용과 속도 측면에서 한계로 지적돼 왔다.</p> <p contents-hash="ebc0e05bd2f1cf0a1c54ddf9cd6eb3f89bf04d981ad8317d6a88374d78105ffd" dmcf-pid="z2YA82WIN7" dmcf-ptype="general">이에 그동안 AI 성능 경쟁은 더 많은 그래픽처리장치(GPU)와 연산 능력을 확보하는 방향으로 전개돼 왔다. 하지만 터보퀀트는 이러한 문제를 해결한다.</p> <p contents-hash="743c6a9580911b9fa046a9793c7c1f0077cfe42e0a82bfe7fc5c09786f9cbb1a" dmcf-pid="qVGc6VYCgu" dmcf-ptype="general">터보퀀트 연구에 참여한 한인수 한국과학기술원(카이스트) 전기·전자공학부 교수는 "AI 모델의 성능이 커질수록 메모리 사용량이 급격히 증가하는 것이 가장 큰 한계로 지적돼 왔다"며 "이번 연구는 이러한 병목을 효과적으로 줄이면서도 정확도를 유지할 수 있는 새로운 방향을 제시했다"고 밝혔다.</p> <h3 contents-hash="79d0069aef011699f793da804058cbb09deb401433cd97d0982524463e96f09a" dmcf-pid="BfHkPfGhcU" dmcf-ptype="h3"><strong>"같은 GPU로 더 많은 성능 구현"…AI 답변 비용 낮춘 구글</strong></h3> <h3 contents-hash="54510be82cf73a51660ca2fc362560078872e4e3230e53dc1790fa8bc2018f41" dmcf-pid="b4XEQ4Hlgp" dmcf-ptype="h3"><strong><strong>구글, 내달 글로벌 AI 학회서 발표…"실서비스 검증이 관건"</strong></strong></h3> <figure class="figure_frm origin_fig" contents-hash="cfb9379d8af1c90a88ccb918e0cff141fa97678c98af92378cc37afa78cc6d19" dmcf-pid="K8ZDx8XSg0" dmcf-ptype="figure"> <p class="link_figure"><img alt="[서울=뉴시스] 27일 업계에 따르면 구글 리서치는 최근 자사 공식 블로그에 거대언어모델(LLM) 메모리 사용 효율을 높이는 기술 '터보퀀트'를 소개했다. 사진은 '터보퀀트' 관련 이미지. 2026.03.27. (사진=구글 리서치 블로그) *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/28/newsis/20260328060139385xxhp.jpg" data-org-width="720" dmcf-mid="1rJj49yOaf" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/28/newsis/20260328060139385xxhp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [서울=뉴시스] 27일 업계에 따르면 구글 리서치는 최근 자사 공식 블로그에 거대언어모델(LLM) 메모리 사용 효율을 높이는 기술 '터보퀀트'를 소개했다. 사진은 '터보퀀트' 관련 이미지. 2026.03.27. (사진=구글 리서치 블로그) *재판매 및 DB 금지 </figcaption> </figure> <div contents-hash="de9d7bf5fbdab4987d050b49693a962e724c6baa1bbcc1c1c89d24ac92fac428" dmcf-pid="965wM6Zvg3" dmcf-ptype="general"> <strong><br> 메모리 사용량이 줄어들면 같은 GPU로 더 많은 요청을 처리할 수 있다. 이는 곧 AI가 답변을 생성할 때 드는 단위 비용 감소로 이어진다. 같은 인프라로 더 많은 서비스를 제공할 수 있어 AI API나 클라우드 서비스 요금 인하 경쟁을 촉발할 수 있다.<br><br> 클라우드 업계 한 관계자는 "AI 서비스 기업 입장에서는 비용이 낮아지면 더 많은 기능과 서비스를 시도할 수 있다"며 "결국 이용자는 더 저렴한 가격에 더 긴 문맥과 고도화된 AI 서비스를 사용할 수 있게 될 것"이라고 말했다.<br><br> 구글이 이 기술을 개발한 이유는 급증하는 AI 수요에 비해 데이터센터 인프라 부담이 빠르게 커지고 있기 때문이다. 생성형 AI 확산 이후 빅테크는 GPU와 메모리 확보에 막대한 자금을 투입해 왔다. 실제 서비스 단계에서의 추론 비용이 급증하면서 단순한 하드웨어 확장만으로는 수익성 확보가 어려워졌다.<br><br> 이에 빅테크와 학계는 모델을 줄이거나 KV 캐시를 압축하는 등 효율을 높여 비용을 낮추는 연구를 강화하고 있다.<br><br> 유회준 카이스트 전기·전자공학부 교수는 "모델 경량화는 이미 다양한 방식으로 연구되고 있는 흐름 중 하나"라며 "뉴럴 네트워크(신경망) 자체를 줄이는 방법, KV 캐시를 줄이는 방법, 웨이트 매트릭스(가중치 행렬)를 줄이는 등 여러 가지 방법이 있다"고 말했다.<br><br> 아마존웹서비스(AWS)도 지난해 12월 '리인벤트(re:Invent)'에서 자체 AI 반도체 '트레이니엄', '인퍼렌시아'를 앞세워 비용 효율적인 AI 인프라 전략을 강조했다. 트레이니엄3 울트라서버는 이전 세대 대비 최대 4.4배 높은 연산 성능과 4배 수준의 에너지 효율을 제공한다고 설명했다.<br><br> 또 메모리 부담이 줄어들면 AI 활용 범위도 넓어질 수 있다. 스마트폰·노트북 등 기기 내부에서 구현되는 '온디바이스 AII'와 다중 작업을 수행하는 AI 에이전트 서비스가 확대될 수 있다.<br><br> 권석준 성균관대 반도체융합공학과·화학공학부 교수는 "추론 비용이 낮아지면 지금까지 비용 때문에 시도하지 못했던 긴 프롬프트 처리나 여러 프롬프트를 동시에 돌리는 작업 등이 가능해질 것"이라며 "효율이 높아질수록 AI 활용량이 오히려 더 늘어나는 '메모리판 제본스의 역설'이 나타날 수 있다"고 말했다.<br><br> </strong> </div> <figure class="figure_frm origin_fig" contents-hash="7120bf9b31831357862749f20a941491eb3d46177d1de2ef64159a761323df00" dmcf-pid="2P1rRP5TkF" dmcf-ptype="figure"> <p class="link_figure"><img alt="[그래픽=뉴시스] 재판매 및 DB금지. hokma@newsis.com" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/28/newsis/20260328060139549hjdx.jpg" data-org-width="700" dmcf-mid="tLQ3IrPKgV" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/28/newsis/20260328060139549hjdx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [그래픽=뉴시스] 재판매 및 DB금지. hokma@newsis.com </figcaption> </figure> <div contents-hash="ef5970f2b6697aaabc879dcfd0412c757490d28726d5609e459736a4a44890bc" dmcf-pid="VQtmeQ1yct" dmcf-ptype="general"> <br> 터보퀀트와 같은 기술이 확산될 경우 데이터센터 전략에도 변화가 나타날 전망이다. 기존에는 GPU와 HBM을 대규모로 확보하는 방식이었다면 앞으로는 효율 최적화가 더 중요한 경쟁 요소로 떠오를 수 있다. </div> <p contents-hash="54a38dfb1ff2aeccd5ad93edf647ca03f07e803c3a0cfa18e3ff0150e497c47f" dmcf-pid="fxFsdxtWk1" dmcf-ptype="general">업계 관계자는 "효율 개선 기술이 본격 적용되면 데이터센터 투자 방식 자체가 바뀔 수 있다"며 "하드웨어 중심에서 소프트웨어 기반 최적화 경쟁이 강화될 것"이라고 말했다.</p> <p contents-hash="a685a03ca672c3b884bf57c972c272e227bc7a2d9321395fe16c5595f4338699" dmcf-pid="4epCne0Ha5" dmcf-ptype="general">다만 터보퀀트는 아직 연구 단계 기술로 실제 상용화까지는 추가 검증이 필요하다. 구글은 다음 달 머신러닝·딥러닝 학회 'ICLR 2026'에서 관련 연구를 발표할 예정이다.</p> <p contents-hash="9a76ae8eea3f198517d69083a51c4bd4ef942d1f1e8b9f494c4988c6cbf6a176" dmcf-pid="8dUhLdpXNZ" dmcf-ptype="general">학계에서는 특정 모델과 환경에서 측정된 결과인 만큼 실제 서비스 환경에서도 동일한 효과가 재현되는지 확인이 필요하다는 신중론이 나온다.</p> <p contents-hash="7604d1ed929b9719f3e115ce45d54d75db478cca304d7196aee4b4c1e9d07b42" dmcf-pid="6JuloJUZaX" dmcf-ptype="general">유 교수는 "이번 기술도 특정 환경에서의 결과인 만큼 실제 서비스 환경에서 동일한 효과가 나는지 검증이 필요하다"며 "메모리를 줄이려는 시도는 계속 이어지겠지만 활용이 늘어나면서 시장은 더 커질 가능성이 있다"고 말했다.</p> <p contents-hash="0055bf6eaee339b25a87e2b53d62bc4331c9b3c86c71b672dfd5fb0d026000b4" dmcf-pid="Pi7Sgiu5cH" dmcf-ptype="general">업계에서는 향후 6개월 내 기술 한계와 효과가 보다 명확히 드러날 것으로 보고 있다. 한 관계자는 "이 기술이 실제 서비스 환경에서도 효과를 입증한다면 AI 인프라 경제성에 큰 변곡점이 될 수 있다”며 "이 기술이 정말 현실에서 기술우위를 가지고 확대된다면 수많은 스타트업의 숨통을 트이게 될 것"이라고 평가했다.</p> <p contents-hash="af2ea72ea1aaab89170cb6390de2ccdfebeb6b2fcb119954a46dc4d5d3463b4c" dmcf-pid="Qnzvan71jG" dmcf-ptype="general"><a href="https://www.newsis.com/?ref=chul" target="_blank">☞공감언론 뉴시스</a> alpaca@newsis.com </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴시스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기