로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
中, 베이징-평양 직항 6년 만에 재개…주북대사도 '환영'(종합2보)
N
[실시간뉴스]
김 총리 "반려동물 가족 입장에서 정책 개선"…요양시설 동반입소 검토(종합)
N
[IT뉴스]
“이건 진짜 너무 심했다” 역대급 터지더니 ‘돌변’…넷플릭스, 3000원 인상
N
[연예뉴스]
사유리, 무례한 女연예인 폭로…"신동엽이 대신 화내줘" 미담 (짠한형)
N
[연예뉴스]
“‘냉부해’ 결혼 주인공은 나” 박은영, 예고편 속 그 셰프였다
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]5년 후 AI 추론 비용 90% 뚝 떨어지는데…기업 청구서는 늘어난다?
온카뱅크관리자
조회:
10
2026-03-30 18:07:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">"AI 다이어트 성공"…가트너, 2030년 AI 추론 비용 90% 급락<br>AI 에이전트 확산하면 사용량 폭증…"총비용은 증가"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xqgvjrPKoZ"> <figure class="figure_frm origin_fig" contents-hash="383d68abe7a725f1d5843ba0624e9c403d7b09da434abf33662948af0aa81664" dmcf-pid="yDFPpbvmaX" dmcf-ptype="figure"> <p class="link_figure"><img alt="[서울=뉴시스] (사진=유토이미지) *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/30/newsis/20260330180431451huva.jpg" data-org-width="720" dmcf-mid="PGBn9P5TA1" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/30/newsis/20260330180431451huva.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [서울=뉴시스] (사진=유토이미지) *재판매 및 DB 금지 </figcaption> </figure> <p contents-hash="9d063f5e148b8e98b8638337b46f524a2aed70b4d33f48882a628a59f4138e4c" dmcf-pid="Ww3QUKTsaH" dmcf-ptype="general">[서울=뉴시스]이주영 기자 = 오는 2030년이면 인공지능(AI) 운영 비용이 지금보다 90% 이상 저렴해질 것이라는 전망이 나왔다. 최근 구글이 인공지능(AI) 추론 비용을 획기적으로 낮출 ‘터보퀀트’를 발표하는 등 비용 혁신 기술이 잇따라 개발되고 있기 때문이다. </p> <p contents-hash="01fa0caa788b650d7425093ca7f3c84c48fb2d0ea06e23b52de6acb9d8d35f13" dmcf-pid="Yr0xu9yOAG" dmcf-ptype="general">30일 글로벌 시장조사기관 가트너는 2030년까지 1조 개의 파라미터(매개변수)를 가진 거대 모델의 추론 비용이 2025년 대비 90% 이상 하락할 것으로 내다봤다. </p> <p contents-hash="a8a0cb93bb0352e0c721189cd92c4add4d28bcd5e9b916bce556a3bb7c10a0bc" dmcf-pid="GmpM72WIoY" dmcf-ptype="general">이는 2022년 초기 모델과 비교하면 비용 효율성이 최대 100배나 개선되는 수준으로, 생성형 AI 모델이 데이터를 처리할 때 사용하는 기본 단위인 '토큰' 가격이 빠르게 낮아지고 있기 때문이다</p> <p contents-hash="e95e4d287daf15d38e05b4f4fed94b0cb1ba18a5b1513594f3dfe877592acb1e" dmcf-pid="HsURzVYCkW" dmcf-ptype="general">반도체 성능 개선, 모델 설계 혁신, 인프라 효율화, 그리고 기기 자체에서 AI를 구동하는 엣지 디바이스의 확산 등이 복합적으로 작용한 결과라고 가트너측은 설명했다.</p> <p contents-hash="fb8689b814bad3b3129597dd4714fa9dd276ce05efe43c077557d79e7d3e5b12" dmcf-pid="XOueqfGhNy" dmcf-ptype="general">실제 토큰 가격 하락은 이미 현실화되고 있다. 최근 구글 리서치는 AI 모델의 추론 과정에서 발생하는 메모리 병목 현상을 해결하는 압축 알고리즘 '터보퀀트'를 발표했다. AI가 대화 맥락을 기억하는 데 필요한 용량을 기존 대비 6분의 1로 압축하는 기술이다. <br> </p> <figure class="figure_frm origin_fig" contents-hash="0bfcc3ce4e86bb7125695350cebd814b0f0e480c3d0c7cbbe753ab3e2c145770" dmcf-pid="ZI7dB4HlAT" dmcf-ptype="figure"> <p class="link_figure"><img alt="[서울=뉴시스] 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 27일 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/30/newsis/20260330180431638jrzw.jpg" data-org-width="500" dmcf-mid="QHnhgE4qg5" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/30/newsis/20260330180431638jrzw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [서울=뉴시스] 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 27일 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) *재판매 및 DB 금지 </figcaption> </figure> <h3 contents-hash="7c30dc131255b28f89ff57fb9df5c7a5be9163665e6c8e84cfe4f69d2b04d922" dmcf-pid="5xO3hYaeov" dmcf-ptype="h3">"성능 좋아지니 더 쓴다"… AI 에이전트가 부른 '비용의 역설'</h3> <div contents-hash="1b4049b9bdf0f55d522320f096fe4d59146a21f42d0bafa12ab756d18b2a9a84" dmcf-pid="1MI0lGNdgS" dmcf-ptype="general"> <strong> 문제는 기업이 써야 할 '토큰'의 양도 폭발적으로 늘어난다는 점입니다. <br><br> 가트너는 AI 토큰 가격이 하락하더라도 기업이 지출해야 하는 전체 AI 비용은 줄지 않을 것이라고 진단했다. AI 성능이 발전될수록 더 많은 토큰을 사용하는 구조이기 때문이다. <br><br> 최근 확산 중인 AI 에이전트는 하나의 작업을 완료하기 위해 수십 번의 추론 과정을 반복한다. 이에 따라 기존 챗봇 대비 작업당 최소 5배에서 최대 30배까지 많은 토큰을 사용한다.<br><br> AI가 단순 질의응답을 넘어 복합 업무를 수행하는 방향으로 진화하면 이를 사용하는 사람들이 많아지면서 연산 수요는 증가한다. 기술 혁신으로 토큰 단가가 10분의 1로 낮아져도, AI 에이전트가 복합 업무를 수행하며 사용량이 30배 늘어나면 전체 비용은 3배 증가한다.<br><br> 윌 소머 가트너 애널리스트는 "토큰 단가가 낮아지는 것을 고급 AI의 대중화로 오해해서는 안 된다"며 "기초적인 AI는 공짜에 가까워지겠지만, 고난도 추론을 위한 자원은 여전히 희귀하고 비쌀 것"이라고 밝혔다. 이어 "이에 대한 고민없인 향후 에이전트 기반 AI 확장 단계에서 한계에 직면하게 될 것"이라고 경고했다. <br><br> 가트너는 앞으로 기업의 AI 경쟁력이 단순히 '좋은 모델을 쓰는 것'이 아니라, 여러 모델을 얼마나 효율적으로 섞어서 운영하느냐(오케스트레이션)에 달려 있다고 분석했다.<br><br> 반복적이고 빈도가 높은 업무는 덩치 큰 모델 대신 소형 모델(sLLM)이나 특정 분야 특화 모델로 처리해 비용을 낮추고, 비용이 비싼 최첨단 프런티어급 모델은 복잡하고 부가가치가 높은 전략적 의사 결정에만 선택적으로 투입해야 한다는 설명이다.<br><br><br><a href="https://www.newsis.com/?ref=chul" target="_blank">☞공감언론 뉴시스</a> zoo@newsis.com </strong> </div> </section> </div> <p class="" data-translation="true">Copyright © 뉴시스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기