【드래곤 스포츠】 보증업체놀이터추천홍보 : 프로그램제작판매제작의뢰 : 스포츠분석 : 무료스포츠중계tv : 섹시bj움짤 : 뉴스 : 안구정화

로그인

글쓰기

[IT뉴스]진화 경로 상실 이재명표 AI 추락하나···젠슨 황 피지컬 GPU 질주

온카뱅크관리자

2026-06-03 15:17:33

<div id="layerTranslateNotice" style="display:none;"></div> AGENT = LLM + HARNESS 시대 이제 인공지능이 하드웨어 OS인데 K-메모리 신화 빠져 진짜 기억 잃고 韓 토큰 낭비하는 저지능 덫에 빠져 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="9RAvmzV7GT">
 <figure class="figure_frm origin_fig" contents-hash="f77d0d1f0d38f1125cdad146db81417bcc79c9a582e97fd9d32bf70a91a981e6" data-idxno="459156" data-type="photo" dmcf-pid="2ecTsqfztv" dmcf-ptype="figure">
 <img alt="6월 2일 대만 타이베이 난강전시장에서 열린 컴퓨텍스 2026 SK그룹 전시관에서 최태원 SK그룹 회장이 부스를 둘러보며 관계자들과 대화를 나누고 있다. 최 회장은 이날 HBM4와 차세대 AI 메모리, 데이터센터 인프라 기술이 전시된 SK 부스를 방문해 현장 설명을 들었으며, 전시장에는 국내외 취재진과 업계 관계자들이 몰려 높은 관심을 보였다. / 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151630650kgbz.png" data-org-width="1280" dmcf-mid="7JY5T4RfHX" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151630650kgbz.png" width="658">
 <figcaption class="txt_caption default_figure">
 6월 2일 대만 타이베이 난강전시장에서 열린 컴퓨텍스 2026 SK그룹 전시관에서 최태원 SK그룹 회장이 부스를 둘러보며 관계자들과 대화를 나누고 있다. 최 회장은 이날 HBM4와 차세대 AI 메모리, 데이터센터 인프라 기술이 전시된 SK 부스를 방문해 현장 설명을 들었으며, 전시장에는 국내외 취재진과 업계 관계자들이 몰려 높은 관심을 보였다. / 이상헌 기자
 </figcaption>
 </figure>
 이재명 정부가 구상하는 이른바 'K-엔비디아' 구상이 위기를 맞았다. 데이터센터 추론 시장에서는 GPU가 학습과 추론, 시뮬레이션, 로봇 제어를 하나의 플랫폼으로 통합하는 방향으로 재정의되고 있기 때문이다.
 피지컬 AI 시대에 필요한 것은 단순 추론 가속기가 아니라 물리 세계를 모델링하고 학습하며 제어하는 인프라다. 데이터센터용 NPU의 입지는 갈수록 좁아지고 있으며 주 무대 역시 GPU와 경쟁하는 서버가 아니라 스마트폰과 PC, 차량 같은 온디바이스 영역으로 이동하고 있다.
 2일 대만 타이베이 난강전시장 M홀에 마련된 SK하이닉스 부스를 찾은 젠슨 황 엔비디아 최고경영자(CEO)는 HBM4 모형에 적힌 xPU 표기 위에 직접 취소선을 긋고 "GPU!"라고 적었다. CPU·GPU·NPU·DPU를 뭉뚱그려 부르는 xPU라는 중립 표현을 삭제하고 GPU만 남긴 것이다.
 이 장면은 베라 CPU와 블루필드 DPU까지 앞세우는 엔비디아의 확장 전략 속에서도 최종 권력은 GPU에 있다는 점을 노골적으로 보여준다. 젠슨 황은 xPU라는 포괄어를 인정하지 않았다. GPU가 주연이고 나머지는 GPU를 먹이고 연결하고 보조하는 계층이라는 메시지를 펜 한 줄로 남긴 셈이다.
 같은 컴퓨텍스 현장에서 또 다른 축의 변화도 동시에 진행됐다. 젠슨 황이 데이터센터와 피지컬 AI의 주어를 GPU로 못 박았다면 크리스티아노 아몬 퀄컴 최고경영자(CEO)는 온디바이스 영역에서 AI가 운영체제(OS) 계층으로 올라서는 구조 변화를 제시했다.
 인공지능(AI)은 하드웨어 한쪽에서 셋방 살이하던 애플리케이션이었다. 챗GPT와 클로드, 코파일럿 역시 본질적으로는 앱이었다. 구조적으로도 세션이 종료되면 대부분의 상태 정보와 문맥이 사라지는 단기 기억 중심 구조라 사용자의 경험 자체를 장기간 축적하는 데는 한계가 있었다.
 <div contents-hash="cd76c3b3bae6d2b9ae51afbaf67c38f5f4048da89f77d09cf1ed56e32d68c06e" dmcf-pid="QmYztJNdXs" dmcf-ptype="general">
 하지만 이제 AI의 진화 방향은 더 큰 모델 경쟁에서 더 오래 기억하는 구조 경쟁으로 이동하고 있다. 기억과 맥락, 경험을 지속적으로 보존하고 재사용하는 에이전트 메모리 구조가 새로운 컴퓨팅 인프라로 부상했다. API로 연결될 줄만 알았던 에이전트가 스마트폰과 PC, 웨어러블, 자동차를 아우르는 디지털 경험의 중심으로 올라서는 것이다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="e663c949202afc71e0cec8a48869df91017dbbf112dd6a64f480f11be18e609d" data-idxno="459154" data-type="photo" dmcf-pid="xsGqFijJtm" dmcf-ptype="figure">
 <img alt="6월 1일 대만 타이베이 컴퓨텍스 2026 키노트에서 크리스티아노 아몬 퀄컴 최고경영자(CEO)가 자사 플랫폼의 전력 확장 범위를 설명하고 있다. 화면 상단에는 2mW부터 200kW까지 이어지는 전력 스펙트럼이 표시돼 있으며, 스마트워치와 XR 기기, 스마트폰, PC, 산업장비, 자율주행차, 휴머노이드 로봇, 데이터센터 서버에 이르기까지 하나의 아키텍처로 연결하겠다는 퀄컴의 전략이 담겨 있다. 아몬은 AI 에이전트 시대에는 특정 기기 하나가 아니라 개인 기기와 차량, 로봇, 엣지 장비, 클라우드가 하나의 연속된 컴퓨팅 환경으로 동작하게 될 것이라며 온디바이스 AI와 저전력 컴퓨팅의 중요성을 강조했다. / 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151632113tbpo.png" data-org-width="1280" dmcf-mid="zcqQ9DCEGH" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151632113tbpo.png" width="658">
 <figcaption class="txt_caption default_figure">
 6월 1일 대만 타이베이 컴퓨텍스 2026 키노트에서 크리스티아노 아몬 퀄컴 최고경영자(CEO)가 자사 플랫폼의 전력 확장 범위를 설명하고 있다. 화면 상단에는 2mW부터 200kW까지 이어지는 전력 스펙트럼이 표시돼 있으며, 스마트워치와 XR 기기, 스마트폰, PC, 산업장비, 자율주행차, 휴머노이드 로봇, 데이터센터 서버에 이르기까지 하나의 아키텍처로 연결하겠다는 퀄컴의 전략이 담겨 있다. 아몬은 AI 에이전트 시대에는 특정 기기 하나가 아니라 개인 기기와 차량, 로봇, 엣지 장비, 클라우드가 하나의 연속된 컴퓨팅 환경으로 동작하게 될 것이라며 온디바이스 AI와 저전력 컴퓨팅의 중요성을 강조했다. / 이상헌 기자
 </figcaption>
 </figure>
 아몬은 발표 초반부에서 스마트폰 중심 시대의 전환점을 예고했다. 그는 "오늘날 디지털 생활의 중심에는 스마트폰이 있다(The phone is at the center of your digital life)"면서도 "이제는 다르다(But now this is different)"며 강조했다. AI가 모바일 운영체제의 중심축이 된다는 선언이다.
 특히 그는 에이전트의 핵심 특징으로 상시 동작, 컨텍스트 유지, 다중 작업 조율을 제시했다. 그는 "에이전트는 항상 동작하며(operate all the time) 컨텍스트를 유지하고(carry contexts forward) 여러 작업을 조율한다(orchestrate multiple tasks)"고 말했다. 현재 AI 서비스가 사용자의 질문에만 반응하는 수동형 구조라면 앞으로의 에이전트는 지속적으로 기억을 유지하면서 사용자의 업무와 일정, 데이터를 관리하는 피드백 루프 구조라는 설명이다.
 아몬은 이날 컨텍스트 유지 능력 지표인 개인 그래프(Personal Graph) 개념을 꺼내 들었다. 이는 단순한 대화 이력 저장이 아니라 이전 작업의 맥락과 도구 실행 결과를 보존해 다음 작업으로 연결하는 구조로, 온디바이스 AI에서 비로소 현실성을 갖는다.
 <div contents-hash="422da0c31861b77b77c35506b88e1d4a91e54fe83e61db88a90470ca5f33b5c2" dmcf-pid="Gfimjt71tE" dmcf-ptype="general">
 데이터센터가 아닌 온디바이스에 사용자의 일정과 위치, 문서, 앱 사용 이력, 센서 데이터가 이미 스마트폰 내부에 축적돼 있기 때문이다. 클라우드가 매번 질의와 응답을 오가는 구조라면 온디바이스 에이전트는 SSD에서 사용자 상태를 직접 읽고 갱신한다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="5dbb77b84a135641cc396cc99d9b4753afdab2d3d6d1f09540f962abfb30c8b2" data-idxno="459155" data-type="photo" dmcf-pid="H4nsAFztXk" dmcf-ptype="figure">
 <img alt="6월 1일 대만 타이베이 난강전시관 타이넥스(TaiNEX) 2관에서 열린 컴퓨텍스 2026 퀄컴 키노트 현장 / 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151633399twuj.jpg" data-org-width="1280" dmcf-mid="qxAhDUKpGG" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151633399twuj.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 6월 1일 대만 타이베이 난강전시관 타이넥스(TaiNEX) 2관에서 열린 컴퓨텍스 2026 퀄컴 키노트 현장 / 이상헌 기자
 </figcaption>
 </figure>
 세입자던 AI의 '집주인 선언' 지능은 어떻게 OS가 되는가
 결국 장기 기억은 거대한 데이터센터보다 사용자의 손 안에 있는 기기에서 먼저 운영체제 기능으로 자리 잡을 가능성이 크다는 얘기다. 더 큰 모델을 만드는 경쟁보다 기억을 유지하고 경험을 재사용하는 구조가 중요해지고 있다는 것이다. 에이전트가 사용자의 과거 행동과 작업 이력을 축적할수록 반복적인 작업을 줄이고 더 높은 수준의 자동화를 구현할 수 있기 때문이다.
 하드웨어에 대한 발언도 의미심장했다. 아몬은 "오늘날의 기기는 이러한 경험을 위해 설계되지 않았다(Today's devices were not designed for those experiences)"고 말했다. 에이전트가 사용자의 개입 없이 계획을 세우고 작업을 조율하며 결과를 검증하려면 결국 새로운 종류의 운영체제와 새로운 종류의 하드웨어가 필요하다는 결론으로 이어진다.
 이어 그는 "에이전트는 운영체제를 바꾸고 애플리케이션도 바꾸게 될 것"이라고 말했다. 과거 구조가 '하드웨어 → OS → 애플리케이션 → AI'였다면 앞으로는 '하드웨어 → 에이전트 OS → 애플리케이션' 구조로 이동할 수 있다는 의미다. 여기서 온디바이스 NPU가 결정적인 역할을 한다.
 키노트 후반부에서는 CPU의 역할도 재조명했다. 아몬은 "강력하면서도 전력 효율적인 도구가 필요하다"고 강조했다. 최근 AI 산업이 GPU와 NPU 중심으로 재편되고 있지만 실제 에이전트 환경에서는 여러 작업을 연결하고 우선순위를 결정하는 오케스트레이션 계층이 중요해진다. 이런 역할을 CPU가 담당할 것이라는 젠슨 황과 공통된 견해다.
 젠슨 황과 크리스티아노 아몬의 구상은 이재명 정부의 'K-엔비디아' 프로젝트가 첫 단추부터 틀렸음을 시사하는 대목이다. 수십조가 투입되는 리벨리온과 퓨리오사AI의 데이터센터용 NPU는 GPU를 대체할 칩이 아니다. 피지컬 AI 플랫폼—AGENT = LLM + HARNESS—을 밀어붙이는 데이터센터 전장에서는 GPU가 주연이다.
 지능을 확률분포로만 보던 단계에서는 AI가 결국 다음 토큰을 고르는 기계로 보인다. 그러나 로짓과 실리콘 구조로 내려가면 확률은 출력 현상일 뿐이고, 실제 지능은 하드웨어가 만든 상태공간 위에서 발생하는 전이(State Transition)에 가깝다. 즉 지능은 "말을 그럴듯하게 뽑는 능력"이 아니라 특정 하드웨어가 전력과 메모리, 대역폭을 통해 상태를 유지하고 다음 상태로 이동시키는 능력이다.
 여기에 젠슨 황이 들고 나온 하네스(Harness) 개념이 붙는다. "AGENT = LLM + HARNESS"라는 선언에서 LLM은 추론 엔진에 불과하고, 하네스는 컨텍스트와 메모리, 도구 호출, 관찰, 행동, 체크포인트를 묶는 운영 계층이다. 결국 하네스는 확률적 토큰 생성기를 행동하는 에이전트로 바꾸는 상태 유지 장치다.
 이 구조를 적용하면 GPU와 HBM, 오픈셸(OpenShell), 하네스, 에이전트는 따로 노는 부품이 아니다. GPU는 병렬 상태공간을 계산하고 HBM은 그 흐름을 먹이며 오픈셸은 실행 환경을 만들고 하네스는 기억과 행동 루프를 고정한다. 여기서 지능은 모델 내부 확률이 아니라 하드웨어 위에 고정된 상태와 그 상태를 다음 행동으로 넘기는 결착력에서 나온다.
 <div contents-hash="be37f5303041beb33fb989aeafa32a7c12fb08baafd63ecfd8e7d6c32facbc2b" dmcf-pid="U32nQhYCZi" dmcf-ptype="general">
 따라서 "하드웨어가 곧 지능"이라는 명제는 더 정확히는 "하드웨어가 유지하는 상태 전이가 지능"이라는 쪽으로 정리된다. 확률론적 AI는 다음 토큰을 보지만 결정론적 즉각성의 AI는 다음 행동을 본다. 젠슨 황의 하네스는 이 간극을 메워준다. 토큰 생성기였던 AI를 하드웨어·기억·행동이 결합한 피지컬 에이전트로 묶어내는 접합부가 바로 하네스다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="fbab11e2aa68b457ce4cf148294a795b991327cb2d260783bb3edd6fe1a5956c" data-idxno="459157" data-type="photo" dmcf-pid="u0VLxlGhYJ" dmcf-ptype="figure">
 <img alt="6월 2일 대만 타이베이 컴퓨텍스 2026 SK하이닉스 부스에 전시된 HBM4 모형. 젠슨 황 엔비디아 최고경영자(CEO)는 이날 모형 하단에 적혀 있던 'xPU' 표기 위에 직접 취소선을 긋고 그 위에 &quot;GPU!&quot;라고 적었다. CPU·GPU·NPU·DPU를 포괄하는 중립적 용어인 xPU 대신 GPU를 강조한 것으로, 엔비디아가 AI 데이터센터와 피지컬 AI 시대의 핵심 연산 주체를 여전히 GPU로 규정하고 있음을 보여준 장면이다. 모형 옆에는 젠슨 황의 서명과 함께 &quot;June 2, 2026&quot; 날짜가 남겨져 있다. / SK그룹" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151634664equc.jpg" data-org-width="1280" dmcf-mid="BEkSr72uHY" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151634664equc.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 6월 2일 대만 타이베이 컴퓨텍스 2026 SK하이닉스 부스에 전시된 HBM4 모형. 젠슨 황 엔비디아 최고경영자(CEO)는 이날 모형 하단에 적혀 있던 'xPU' 표기 위에 직접 취소선을 긋고 그 위에 "GPU!"라고 적었다. CPU·GPU·NPU·DPU를 포괄하는 중립적 용어인 xPU 대신 GPU를 강조한 것으로, 엔비디아가 AI 데이터센터와 피지컬 AI 시대의 핵심 연산 주체를 여전히 GPU로 규정하고 있음을 보여준 장면이다. 모형 옆에는 젠슨 황의 서명과 함께 "June 2, 2026" 날짜가 남겨져 있다. / SK그룹
 </figcaption>
 </figure>
 GPU로 피지컬 밀어붙이겠단 젠슨 황 하네스 시대는 온디바이스가 주인공 이재명은 무지능 고철에 수십조 퍼줘
 반면 국내에도 온디바이스 NPU 분야에서는 경쟁력을 인정받는 기업들이 존재한다. 대표적으로 딥엑스(DEEPX)는 스마트 카메라와 로봇, 산업용 기기, 차량용 시스템 등 엣지 환경에서 저전력 추론을 수행하는 NPU 시장을 공략하고 있다. 삼성전자 역시 엑시노스 신경망처리 장치를 스마트폰에만 머물게 하지 않고 TV와 가전, 로봇까지 확장하고 있다. GPU가 두뇌라면 NPU는 감각과 반응을 담당하는 신경절에 가까운 셈이다.
 퀄컴이 이번 컴퓨텍스에서 강조한 상시 동작형 에이전트와 개인 그래프(Personal Graph), 온디바이스 추론 구조 역시 이러한 저전력 NPU의 활용 무대와 맞닿아 있다. 이는 삼성전자와 구글이 추진 중인 온디바이스 AI 전략에도 힘을 실어주는 대목이다. 삼성전자는 갤럭시 AI를 중심으로 기기 내부 연산 비중을 확대하고 있으며, 구글 역시 제미나이 나노(Gemini Nano)를 스마트폰과 PC에 탑재하며 로컬 AI 생태계 구축에 나서고 있다.
 또한 행사 내내 전력(Power) 비용을 강조했다. 아몬은 "사용자가 휴대전화를 하루 종일 사용하는 것도 어려운데 에이전트가 상시 동작하면 어떻게 되겠는가"라고 반문했다. AI 시대의 경쟁력이 단순한 연산 성능이 아니라 제한된 전력 안에서 얼마나 오랫동안 기억과 추론, 계획을 수행할 수 있는지에 달려 있다는 의미다. API 연결을 반복 호출해 토큰 비용 급증을 감당하기보다 내부에서 기억과 추론을 처리하는 구조가 유리하기 때문이다.
 반도체 공급망의 이 같은 흐름은 미국의 애플에도 부담으로 작용할 수 있다. 애플은 그동안 A시리즈 칩의 높은 단일 스레드 성능과 소프트웨어 최적화를 앞세워 모바일 시장을 주도해왔지만 상시 동작형 에이전트 시대에는 이야기가 달라질 수 있다는 분석이 나온다. 에이전트 운영체제는 단순한 순간 추론보다 사용자 상태를 장기간 유지하고 반복적으로 참조하는 메모리 중심 구조를 요구하기 때문이다.
 <div contents-hash="9317247ba1f04bf85e2c2ac65c270d4bc97796724f7f51266fd23fc7031576e6" dmcf-pid="KqQAiYtWHQ" dmcf-ptype="general">
 애플 A시리즈의 강점은 높은 단일 스레드 성능과 강력한 캐시 메모리 계층에 있다. 클라우드형 AI에서는 이런 결정론적 즉각성이 압도적인 장점으로 작동한다. 그러나 온디바이스 에이전트 운영체제는 순간 계산보다 장기간 유지되는 사용자 상태(State)와 컨텍스트 관리가 더 중요하다. 일정과 위치, 문서, 앱 사용 이력, 센서 데이터가 계속 누적되는 구조에서는 캐시보다 LPDDR 용량과 저장형 메모리, NPU·CPU·GPU 협업 구조가 더 중요해진다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="2fab92a1713ccf3a921a2fc4a5ed2a18f6bf71002a87296fab4fea1926fd70c8" data-idxno="459159" data-type="photo" dmcf-pid="9bMkLH3G5P" dmcf-ptype="figure">
 <img alt="엔비디아의 Isaac GR00T 기반 의료 협업 로봇으로, NVIDIA Jetson AGX Thor와 Isaac Sim 디지털 트윈 환경이 함께 사용된다. 로봇 팔엔 비전-언어-행동(Vision-Language-Action·VLA) 모델을 탑재해 수술실 상황을 인식하고 음성 명령과 작업 맥락을 이해하도록 설계된 구조다. 데이터센터 GPU 철학을 로봇 끝단까지 밀어붙이겠다는 젠슨 황의 의지가 보인다. / 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151636019bzxl.jpg" data-org-width="1080" dmcf-mid="b4QAiYtWYW" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151636019bzxl.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 엔비디아의 Isaac GR00T 기반 의료 협업 로봇으로, NVIDIA Jetson AGX Thor와 Isaac Sim 디지털 트윈 환경이 함께 사용된다. 로봇 팔엔 비전-언어-행동(Vision-Language-Action·VLA) 모델을 탑재해 수술실 상황을 인식하고 음성 명령과 작업 맥락을 이해하도록 설계된 구조다. 데이터센터 GPU 철학을 로봇 끝단까지 밀어붙이겠다는 젠슨 황의 의지가 보인다. / 이상헌 기자
 </figcaption>
 </figure>
 클라우드와 로컬 동일 잣대 구분 X D램 신화가 가린 경험 기반 기억 저장 메모리는 스마트폰에 넣어라 삼성-구글 안드로이드 연합엔 기회
 문제는 한국의 'K-메모리' 신화가 이 변화를 거꾸로 읽게 만든다는 점이다. 온디바이스 에이전트에서 중요한 메모리는 데이터센터 HBM을 무한히 더 쌓는다는 뜻이 아니라 사용자 상태를 기기 안에 오래 보존하고 빠르게 다시 불러오는 구조다. 클라우드 AI의 대역폭 병목과 온디바이스 AI의 장기 상태 저장은 다른 문제다. 이를 구분하지 못하면 애플 인텔리전스의 한계와 삼성·퀄컴·구글 진영의 기회를 모두 데이터센터 메모리 수요 폭증론으로 오독하게 된다.
 아몬이 예고한 진화 방향을 데이터센터용 AI 칩까지 확장 해석하는 것은 무리라는 얘기다. 온디바이스 에이전트에서 말하는 장기 기억은 사용자의 일정과 위치, 문서, 앱 사용 이력, 센서 데이터를 기기 내부에서 지속적으로 읽고 갱신하는 운영체제적 상태 저장인 반면 데이터센터 AI 칩의 메모리는 성격이 다르다.
 그럼에도 국내 AI 정책 담론은 여전히 GPU 숫자와 데이터센터 규모, 국가 LLM 구축에 집중돼 있다. 오는 11월 공개 예정인 배경훈 과학기술정보통신부 장관의 '모두의 AI' 역시 결국 또 하나의 거대 클라우드 서비스에 머무를 경우 구조적 한계를 피하기 어렵다. 사용자의 상태(State)를 기억하지 못하는 AI는 아무리 규모가 커져도 매번 처음부터 다시 질문을 받아야 하는 세금(토큰) 낭비 기계에 불과하기 때문이다.
 더구나 한국 정부가 추종해온 앤스로픽의 클로드 코드 기반 헤르메스(Hermes), 오픈클로(OpenClaw) 같은 에이전트 프레임워크들은 토큰 낭비 구조로 인해 도태할 위험이 크다. AI 산업의 중심축이 LLM에서 AGENT = LLM + HARNESS로 이동하는 상황에서 클라우드 챗봇 하나를 추가 구축하는 방식은 시대 변화와 거꾸로 가는 접근일 수밖에 없다.
 삼성전자에 대박을 안겨준 D램은 실행 중인 토큰 흐름과 중간 상태를 임시로 붙잡는 작업 공간이고 SK하이닉스로 대표되는 HBM은 모델 추론 과정의 고대역폭 흐름을 유지하는 장치이며 낸드 기반 SSD는 전기적 연산이 시작되기 전 파라미터와 데이터를 안치해두는 저장소다. 이를 모두 기억의 확장으로 해석해 "AI가 진화할수록 메모리 수요가 무한히 폭증한다"는 주장은 소버린 AI를 더욱 망가뜨리는 기술적 무지를 드러낸다.
 <div contents-hash="e5af0964e94848420246e690442f115a96d7dde6cd6661867059d117cde1950a" dmcf-pid="P8LOc3qFH9" dmcf-ptype="general">
 젠슨 황이 최태원 회장이 보는 자리에서 SK 웨이퍼에 제발 더 만들어줘(Please Make More)란 메시지를 남긴 것도 같은 맥락이다. 메모리가 AI의 장기 기억으로 진화했다는 뜻이 아니라 GPU 플랫폼이 더 많은 대역폭을 요구할 만큼 물리 세계로 확장되고 있다는 신호다. 이재명식 데이터센터 NPU 육성론이 놓친 것도 바로 이 지점이다. 글로벌 시장은 이미 GPU 중심 피지컬 AI 플랫폼 경쟁으로 이동했는데 정책은 여전히 국산 추론칩을 데이터센터에 꽂으면 K-엔비디아가 된다는 낡은 그림에 머물러 있다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="81b9ff647e51d40041f2e0a6e706d7179386ae3ec2843d6bc0659a289ec431d6" data-idxno="459158" data-type="photo" dmcf-pid="Q6oIk0B3HK" dmcf-ptype="figure">
 <img alt="퍼스널 그래프(Personal Graph) 개념도. AI 경쟁의 중심이 단순 추론 성능에서 장기 기억과 상태(State) 관리 구조로 이동하고 있음을 보여준다. 클라우드 LLM의 단기 세션 구조와 온디바이스 에이전트의 장기 상태 저장 구조를 비교했으며, LPDDR·SSD 기반 개인 그래프가 기억·맥락·행동을 연결하는 차세대 에이전트 운영체제(OS)의 핵심 계층으로 부상하고 있다. / GPT-5.5" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151637509rocj.png" data-org-width="864" dmcf-mid="K37x2whDYy" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/03/552814-8XPEppr/20260603151637509rocj.png" width="658">
 <figcaption class="txt_caption default_figure">
 퍼스널 그래프(Personal Graph) 개념도. AI 경쟁의 중심이 단순 추론 성능에서 장기 기억과 상태(State) 관리 구조로 이동하고 있음을 보여준다. 클라우드 LLM의 단기 세션 구조와 온디바이스 에이전트의 장기 상태 저장 구조를 비교했으며, LPDDR·SSD 기반 개인 그래프가 기억·맥락·행동을 연결하는 차세대 에이전트 운영체제(OS)의 핵심 계층으로 부상하고 있다. / GPT-5.5
 </figcaption>
 </figure>
 ☞퍼스널 그래프(Personal Graph) = 기억·맥락·행동을 하나의 상태(State) 공간으로 통합해 관리하는 장기 기억 계층이다. 일정과 위치, 문서, 대화, 앱 사용 이력, 센서 데이터처럼 흩어진 정보를 단순 저장하는 것이 아니라 서로 연결된 상태로 유지한다. 기존 인공지능이 질문을 받으면 답변을 생성하고 잊어버리는 세션 중심 구조였다면 퍼스널 그래프는 사용자의 과거와 현재를 지속적으로 이어붙이는 운영체제 수준의 기억 구조에 가깝다.
 핵심은 데이터 저장이 아니라 상태 전이(State Transition)다. 사용자가 무엇을 했는지 기록하는 데서 끝나는 것이 아니라 현재 상태를 이해하고 다음 상태를 예측하는 데 목적이 있다. 회의 일정과 이동 경로, 작성 중인 문서와 이전 대화 내용이 하나의 상태 공간 안에서 연결되면서 AI는 단순한 검색기가 아니라 상황을 이해하는 에이전트로 변한다. 기억은 데이터가 아니라 행동을 위한 연료가 된다.
 이 구조는 클라우드 기반 LLM과 온디바이스 에이전트를 구분하는 핵심 기준이기도 하다. HBM과 DRAM이 중심인 데이터센터 AI는 대규모 연산과 추론에는 강하지만 세션이 종료되면 상태를 유지하지 못한다. 반면 LPDDR과 SSD를 활용하는 온디바이스 에이전트는 사용자의 상태를 장기간 보존하며 지속적으로 갱신할 수 있다. 퍼스널 그래프가 현실성을 갖는 이유도 사용자의 일정과 위치, 문서, 센서 데이터가 이미 기기 내부에 존재하기 때문이다.
 결국 퍼스널 그래프는 인간의 경험을 상태(State)로 압축하고 기억하며 학습하는 지능 진화 엔진이다. 토큰을 생성하는 AI에서 상태를 유지하는 AI로, 다시 행동을 결정하는 AI로 이동하는 과정의 중심에 위치한다. AI가 운영체제(OS) 계층으로 올라서는 시대에 퍼스널 그래프는 기억과 맥락, 행동을 연결하는 핵심 인프라가 되며 인간과 AI가 함께 진화하는 접점으로 기능하게 된다.
 여성경제신문 이상헌 기자 liberty@seoulmedia.co.kr
 *여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.
 </section> 
 </div>

댓글 총 0개

이번주 포인트랭킹

매주 일요일 밤 0시에 랭킹을 초기화합니다.

14,000상품권
23,000상품권
32,000상품권

업체홍보/구인 더보기

지식/노하우 더보기

판매의뢰 더보기

포토 더보기