【드래곤 스포츠】 보증업체놀이터추천홍보 : 프로그램제작판매제작의뢰 : 스포츠분석 : 무료스포츠중계tv : 섹시bj움짤 : 뉴스 : 안구정화

로그인

글쓰기

[IT뉴스]5년 후 AI 추론 비용 90% 뚝 떨어지는데…기업 청구서는 늘어난다?

온카뱅크관리자

2026-03-30 18:07:32

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">"AI 다이어트 성공"…가트너, 2030년 AI 추론 비용 90% 급락<br>AI 에이전트 확산하면 사용량 폭증…"총비용은 증가"</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="xqgvjrPKoZ">
          <figure class="figure_frm origin_fig" contents-hash="383d68abe7a725f1d5843ba0624e9c403d7b09da434abf33662948af0aa81664" dmcf-pid="yDFPpbvmaX" dmcf-ptype="figure">
           <p class="link_figure"><img alt="[서울=뉴시스] (사진=유토이미지) *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/30/newsis/20260330180431451huva.jpg" data-org-width="720" dmcf-mid="PGBn9P5TA1" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/30/newsis/20260330180431451huva.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            [서울=뉴시스] (사진=유토이미지) *재판매 및 DB 금지
           </figcaption>
          </figure>
          <p contents-hash="9d063f5e148b8e98b8638337b46f524a2aed70b4d33f48882a628a59f4138e4c" dmcf-pid="Ww3QUKTsaH" dmcf-ptype="general">[서울=뉴시스]이주영 기자 = 오는 2030년이면 인공지능(AI) 운영 비용이 지금보다 90% 이상 저렴해질 것이라는 전망이 나왔다. 최근 구글이 인공지능(AI) 추론 비용을 획기적으로 낮출 ‘터보퀀트’를 발표하는 등 비용 혁신 기술이 잇따라 개발되고 있기 때문이다. </p>
          <p contents-hash="01fa0caa788b650d7425093ca7f3c84c48fb2d0ea06e23b52de6acb9d8d35f13" dmcf-pid="Yr0xu9yOAG" dmcf-ptype="general">30일 글로벌 시장조사기관 가트너는 2030년까지 1조 개의 파라미터(매개변수)를 가진 거대 모델의 추론 비용이 2025년 대비 90% 이상 하락할 것으로 내다봤다. </p>
          <p contents-hash="a8a0cb93bb0352e0c721189cd92c4add4d28bcd5e9b916bce556a3bb7c10a0bc" dmcf-pid="GmpM72WIoY" dmcf-ptype="general">이는 2022년 초기 모델과 비교하면 비용 효율성이 최대 100배나 개선되는 수준으로, 생성형 AI 모델이 데이터를 처리할 때 사용하는 기본 단위인 '토큰' 가격이 빠르게 낮아지고 있기 때문이다</p>
          <p contents-hash="e95e4d287daf15d38e05b4f4fed94b0cb1ba18a5b1513594f3dfe877592acb1e" dmcf-pid="HsURzVYCkW" dmcf-ptype="general">반도체 성능 개선, 모델 설계 혁신, 인프라 효율화, 그리고 기기 자체에서 AI를 구동하는 엣지 디바이스의 확산 등이 복합적으로 작용한 결과라고 가트너측은 설명했다.</p>
          <p contents-hash="fb8689b814bad3b3129597dd4714fa9dd276ce05efe43c077557d79e7d3e5b12" dmcf-pid="XOueqfGhNy" dmcf-ptype="general">실제 토큰 가격 하락은 이미 현실화되고 있다. 최근 구글 리서치는 AI 모델의 추론 과정에서 발생하는 메모리 병목 현상을 해결하는 압축 알고리즘 '터보퀀트'를 발표했다. AI가 대화 맥락을 기억하는 데 필요한 용량을 기존 대비 6분의 1로 압축하는 기술이다. <br> </p>
          <figure class="figure_frm origin_fig" contents-hash="0bfcc3ce4e86bb7125695350cebd814b0f0e480c3d0c7cbbe753ab3e2c145770" dmcf-pid="ZI7dB4HlAT" dmcf-ptype="figure">
           <p class="link_figure"><img alt="[서울=뉴시스] 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 27일 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) *재판매 및 DB 금지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/30/newsis/20260330180431638jrzw.jpg" data-org-width="500" dmcf-mid="QHnhgE4qg5" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/30/newsis/20260330180431638jrzw.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            [서울=뉴시스] 구글 리서치가 AI(인공지능) 구동에 필요한 메모리 사용량을 최대 6분의 1로 줄이는 압축 기술 ‘터보퀀트(TurboQuant)’를 27일 공개했다. AI 답변 생성 과정인 ‘추론(Inference)’ 단계에서 ‘KV 캐시’를 최대 6배 압축해 효율을 높이는 것이 핵심이다. (그래픽=전진우 기자) *재판매 및 DB 금지
           </figcaption>
          </figure>
          <h3 contents-hash="7c30dc131255b28f89ff57fb9df5c7a5be9163665e6c8e84cfe4f69d2b04d922" dmcf-pid="5xO3hYaeov" dmcf-ptype="h3">"성능 좋아지니 더 쓴다"… AI 에이전트가 부른 '비용의 역설'</h3>
          <div contents-hash="1b4049b9bdf0f55d522320f096fe4d59146a21f42d0bafa12ab756d18b2a9a84" dmcf-pid="1MI0lGNdgS" dmcf-ptype="general">
           <strong> 문제는 기업이 써야 할 '토큰'의 양도 폭발적으로 늘어난다는 점입니다. <br><br> 가트너는 AI 토큰 가격이 하락하더라도 기업이 지출해야 하는 전체 AI 비용은 줄지 않을 것이라고 진단했다. AI 성능이 발전될수록 더 많은 토큰을 사용하는 구조이기 때문이다. <br><br> 최근 확산 중인 AI 에이전트는 하나의 작업을 완료하기 위해 수십 번의 추론 과정을 반복한다. 이에 따라 기존 챗봇 대비 작업당 최소 5배에서 최대 30배까지 많은 토큰을 사용한다.<br><br> AI가 단순 질의응답을 넘어 복합 업무를 수행하는 방향으로 진화하면 이를 사용하는 사람들이 많아지면서 연산 수요는 증가한다. 기술 혁신으로 토큰 단가가 10분의 1로 낮아져도, AI 에이전트가 복합 업무를 수행하며 사용량이 30배 늘어나면 전체 비용은 3배 증가한다.<br><br> 윌 소머 가트너 애널리스트는 "토큰 단가가 낮아지는 것을 고급 AI의 대중화로 오해해서는 안 된다"며 "기초적인 AI는 공짜에 가까워지겠지만, 고난도 추론을 위한 자원은 여전히 희귀하고 비쌀 것"이라고 밝혔다. 이어 "이에 대한 고민없인 향후 에이전트 기반 AI 확장 단계에서 한계에 직면하게 될 것"이라고 경고했다. <br><br> 가트너는 앞으로 기업의 AI 경쟁력이 단순히 '좋은 모델을 쓰는 것'이 아니라, 여러 모델을 얼마나 효율적으로 섞어서 운영하느냐(오케스트레이션)에 달려 있다고 분석했다.<br><br> 반복적이고 빈도가 높은 업무는 덩치 큰 모델 대신 소형 모델(sLLM)이나 특정 분야 특화 모델로 처리해 비용을 낮추고, 비용이 비싼 최첨단 프런티어급 모델은 복잡하고 부가가치가 높은 전략적 의사 결정에만 선택적으로 투입해야 한다는 설명이다.<br><br><br><a href="https://www.newsis.com/?ref=chul" target="_blank">☞공감언론 뉴시스</a> zoo@newsis.com </strong>
          </div>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 뉴시스. 무단전재 및 재배포 금지.</p>

댓글 총 0개

이번주 포인트랭킹

매주 일요일 밤 0시에 랭킹을 초기화합니다.

14,000상품권
23,000상품권
32,000상품권

업체홍보/구인 더보기

지식/노하우 더보기

판매의뢰 더보기

포토 더보기