로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'5·18 정신 수록' 39년 만의 개헌‥국힘 불참으로 끝내 '불성립'
N
[실시간뉴스]
검찰, 방시혁 구속영장 또 반려…"경찰, 보완수사 이행 안했다"(종합)
N
[실시간뉴스]
러 전승절 앞두고 긴장 고조…"푸틴 경호 추가 조치"(종합)
N
[실시간뉴스]
국회, AI데이터센터법 등 117건 처리…개헌안은 투표 불성립(종합2보)
N
[실시간뉴스]
'안전권·참사 피해자 권리 명시' 생명안전기본법, 국회 통과(종합)
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스][현장] 디에스앤지 "AI인프라, 구매하는 게 아니라 설계하는 것"
온카뱅크관리자
조회:
2
2026-05-07 19:07:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">최효진 CTO 7일 열린 '2026 AI엑스포'서 '풀스택 AI인프라 설계' 주제 발표</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0TWKsBaec1"> <p contents-hash="e4271dff363e0c6f5247efc06e76c00258e9db6f6c0e3b93c1dd22cf3f6be66b" dmcf-pid="pyY9ObNdo5" dmcf-ptype="general">(지디넷코리아=방은주 기자)"2024년 미국에서 발표한 보고서에 따르면 GPU 가동률이 70% 미만인 곳이 75%에 달했습니다. 또 미국 마이크로소프트(MS) 연구소(리서치)가 역시 2024년 공개한 자료에 따르면 실제 현장의 GPU 사용률은 10~40%에 그쳤습니다. 클리어ML도 보고서에서 GPU 수동할당과 사용 전략이 없다고 말한 곳이 44%였다고 지적했습니다."</p> <p contents-hash="44734a562349a68538573a8d1efcccb5e2c1d2142bdc290f2f2a4289649a2eef" dmcf-pid="UnovQlB3AZ" dmcf-ptype="general"><strong>디에스앤지(DS&G) 최효진 CTO</strong>는 7일 서울 코엑스에서 열린 '2026 AI엑스포'에서 연사로 나와 "우리는 왜 비싼 GPU를 사고도 손해를 볼까요?"라는 질문을 던지며 이 같이 밝혔다. AI바람에 편승해 비싼 GPU를 수억, 수십억 구매했지만 그만큼의 ROI(투자대비수익)를 못거둔다는 것이다. 그는 이날 '<strong>풀스택 AI인프라 설계'</strong>를 주제로 AI인프라를 형성하는 GPU와 네트워크, 스토리지, MLOps, 스케쥴러, KV 캐쉬 등에 대해 설명했다.</p> <p contents-hash="cda292b7a8c76ed528e29d0d7c5706a35b0d91b1707a051d151524390d0af569" dmcf-pid="uLgTxSb0jX" dmcf-ptype="general">최 CTO는 GPU 비용 효율화는 설계단계부터 중요하다면서 "GPU를 잘 쓰고 있는지 모니터링을 해보면, 어떤 팀에서 잠깐 쓰고 있다 다음 날 보면 놀고 있고, 이런 것들이 주위에서 많이 있다"고 안타까워 했다.</p> <p contents-hash="eb5cee2432da312a559bebd7903c86fbfcd0aa2277ec7443cacaf2a1bcaf4ecc" dmcf-pid="7oayMvKpcH" dmcf-ptype="general">현재의 문제점도 지적했다. 먼저, 하드웨어의 경우 워크로드를 모르는 상태에서 가장 중요한 결정을 내린다면서 순서가 잘못됐다고 짚었다. 즉, 현재는 예산확정->HW구매->클러스터 구축->모델 개발->운용의 단계를 거치는데 이는 잘못된 것이며, 가장 먼저 워크로로드 프로파일링을 하고 이어 역산설계(HW+SW 동시)->ROI KPI 설정->구축->측정 및 최적화 순으로 칩 구매를 진행해야 한다는 것이다.</p> <p contents-hash="4db745519fee10187ea539d1bb5032a2c17c2ab6710255a048f58f27319ab04d" dmcf-pid="zgNWRT9UaG" dmcf-ptype="general">그러면서 3가지 문제점으로 ▲레이어간 미스매치 ▲SW최적화 후순위화 ▲ROI KPI 부재를 들었다. 칩은 B200인데 스토리지가 느린 경우가 레이어간 미스매치다. 이 경우, 카드 성능을 끝까지 끝까지 쓰지 못한다. 또 SW 최적화가 후순위로 밀리면 HW 고정후 MLOps를 얹을때 재설계 부담과 비용이 증가하는데, 이는 한국의 전형적인 예라고 꼬집었다. ROI KPI가 부재하면 측정 기준이 없어 최적화 목표 설정이 불가능하다.</p> <p contents-hash="3fa3f162d025822114537dbb765cacbbce669710cb24d99ab82171b069d2ece7" dmcf-pid="qajYey2uAY" dmcf-ptype="general">최 CTO는 GPU 구매시 설계단계를 경시하는 걸 가리켜 "굉장히 중요한 결정을, 아무것도 결정되지 않은 상태에서 중요한 결정을 내린다"고 지적했다.</p> <figure class="figure_frm origin_fig" contents-hash="3d83f61ed1a053295533d4fca73afe5fc332b7d77422b9991dcb84d25e893248" dmcf-pid="BNAGdWV7AW" dmcf-ptype="figure"> <p class="link_figure"><img alt="최효진 디에스앤지 CTO가 7일 서울 코엑스에서 열린 '2026 AI엑스포'에서 '풀스택 AI인프라 설계'를 주제로 발표하고 있다." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/07/ZDNetKorea/20260507190355207qlml.jpg" data-org-width="640" dmcf-mid="3RJC4Ou5jt" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/07/ZDNetKorea/20260507190355207qlml.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 최효진 디에스앤지 CTO가 7일 서울 코엑스에서 열린 '2026 AI엑스포'에서 '풀스택 AI인프라 설계'를 주제로 발표하고 있다. </figcaption> </figure> <p contents-hash="122a533aeea266c0df8511d2afc00409200f1b3c523db1e026f7ae851d6eeb09" dmcf-pid="bjcHJYfzNy" dmcf-ptype="general">이어 "AI 인프라에서는 GPU 레이어가 가장 중요하다. 목적에 맞는 선택이 첫번째 ROI 변수"라면서 "문제의 본질은 GPU 선택이 아니라 '정적 배포=고정 할당'이다. 이것이 ROI를 죽인다"고 목소리를 높였다.</p> <p contents-hash="901dd99e06696b8fa493446daf07c7ed3f7a90757fc88a0af563a34768041201" dmcf-pid="KAkXiG4qgT" dmcf-ptype="general">H100 SXM 풀클러스터를 팀별 고정할당하는 정적 배포를 실패 사례로 꼽았다. 이는 GPU 가동률이 30~40%밖에 안되며, 인프라 지출의 60~70%를 낭비한다면서 "GPU 선택의 문제가 아니라 운용 설계 실패"라고 언급했다. 반대로 성공사례는 동일 H100에 MIG 파티셔닝을 적용하는 동적 운용을 들었다. 이는 칩 1장을 최대 7인스턴스로 동저 분할한 것으로, 학습과 추론 ASR/TTS 워크로드 혼합 운영형태다.</p> <p contents-hash="5f002c05a034b8b9141a720218405881ca83a0ec2e11a147d3a471f54ed3b6e9" dmcf-pid="9cEZnH8Bkv" dmcf-ptype="general">바람직한 네트워크 레이어도 설명했다. 표준은 2 타이어 레일-옵티마이즈드(Rail-Optimized)이며, 관건은 스파인(Spine) 오버서브스크립션(Oversubscription)이라면서 "1대1 논블로킹(Non-blocking)은 세계적인 빅테크나 한국 대기업만 쓸 수 있다. 스토리지 패브릭(Fabric)도 1대1이 아니라 4대3 오버서브스크립션이면 충분하다, 이는 엔비디아도 권하는 것"이라고 들려줬다.</p> <p contents-hash="dae5309122905d27448230ff2b44f759f5b38e6ebaedd5583e23003022655bf6" dmcf-pid="2kD5LX6bAS" dmcf-ptype="general">스토리지 레이어에 대해서는 "계층화가 없으면 반드시 병목이 발생한다"면서 스토리지 계층 구조의 세 종류(Hot, Warm, Cold)를 소개했다. ROI 설계 원칙에 따른 AI인프라 스토리지는 스타빙(Starving) GPU 방지를 위해 분리 설계가 필수고, GPU디렉트 스토리지 지원 여부를 확인해야 하며, 워크로드별 I/O 패턴을 먼저 파악해야 한다고 전했다.</p> <p contents-hash="536eda6f895f90241cbaa8be6fddc82f2975d2e2bea4bf9a6202db922e35e50a" dmcf-pid="VEw1oZPKol" dmcf-ptype="general">GPU 스케쥴러에 대해서는 "Run;ai가 가동률을 2배로 만드는 원리"라면서 강 스케쥴링(Gang Scheduling), 다이나믹 프랙션, 빈(Bin) 패키징을 설명했다. 강 스케쥴링은 분산학습 GPU 묶음으로 단위 보장 할당과 일부 할당 대기 문제를 해결해준다. 다이나믹 GPU 프랙션은 GPI 1개를 여러 잡(job)이 메모리 격리 상태로 시분할 공유해주며,빈 패키징은 메모리 단편화 최소화와 유휴 GPU 공간을 적극 재활용하게 해준다.</p> <p contents-hash="86597de0bd39c9b6de65a7e003b97689c8f54457989f55e08f7e75455e97c73f" dmcf-pid="fDrtg5Q9kh" dmcf-ptype="general">최 CTO는 "다시 말하지만, 안타까운게 하드웨어 인프라를 구축하는 데 급해 소프트웨어를 마지막에 생각하는 경향이 있다"면서 "쿠버네티스 같은 것들을 설계 단계부터 고려해야 한다"고 역설했다. 또 KV 캐시 최적화를 이야기하며 "CXL로 GPU 메모리 한계를 돌파했다"면서 "AI인프라는 구매하는게 아니라 설계하는 것이다. HW는 결과물이고, 워크로드 프로파일이 출발점"이라고 강조했다.</p> <p contents-hash="72dbeee698ecabeddb928103d6b50e2e8f8ea039e7238a69a31b8f701f9f967c" dmcf-pid="4wmFa1x2oC" dmcf-ptype="general">방은주 기자(ejbang@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기