로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
블아 "영화와 용하형 모두 접신하고 왔습니다"
N
[연예뉴스]
지드래곤, 라이브 논란 씻어낸 속사포 랩…82만 동원 월드투어 '피날레' [김수영의 스테이지&]
N
[연예뉴스]
'53세 미혼' 김민종, 2년 안에 결혼 기대…"원샷하는 女배우에 심쿵"('미우새')
N
[연예뉴스]
‘라이브 논란’에도 5만6100명 운집…지드래곤 ‘파워’ 증명한 피날레 [쿡리뷰]
N
[연예뉴스]
'미우새' 점술가, 탁재훈·서장훈에 "결혼 찬스 한 번 더 있어"
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]오픈AI·네이버 피소…“AI 학습 데이터 확보·저작권 해결 시급”
온카뱅크관리자
조회:
62
2025-02-24 16:07:31
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="G6PceSyjZ4"> <p contents-hash="360e8314187ccd1188b7bdbb445b19760cf8cee3d7199ffef99b71a33d8e7d8f" dmcf-pid="HPQkdvWA5f" dmcf-ptype="general">정부가 그래픽처리장치(GPU) 등 인공지능(AI) 인프라 논의를 지속하는 가운데 양질의 학습용 데이터 확보에도 관심을 기울여야 한다는 지적이 제기된다.</p> <p contents-hash="f01939459579ee3a141d3f6099c57916f75241b76f38ccd96455dbd7bb210cd0" dmcf-pid="XQxEJTYcHV" dmcf-ptype="general">해외에서는 오픈AI, 국내에서는 네이버가 데이터 학습 관련 송사에 휘말린 상황에서 충분한 학습용 데이터셋 확보나 저작권 관련 명확한 제도나 기준 없이는 AI 기업 부담과 불필요한 논란이 지속될 것이라는 우려 목소리가 크다.<br></p> <figure class="figure_frm origin_fig" contents-hash="76bbc693e97218033511c8803dda2868c6eb39817c30d2cc90b0781e135120b2" dmcf-pid="ZxMDiyGkX2" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/24/etimesi/20250224160140022beah.jpg" data-org-width="700" dmcf-mid="YnJsgH5rY8" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/24/etimesi/20250224160140022beah.jpg" width="658"></p> </figure> <p contents-hash="17f8ae26e7bcb88c5ad04e65d03b737915a49381abfc9d55d02bbd13f3da2752" dmcf-pid="5MRwnWHEX9" dmcf-ptype="general">24일 AI업계·학계에 따르면 스타트업 등 AI 기업을 중심으로 고품질 데이터 확보에 대한 부담과 우려가 큰 상황이다.</p> <p contents-hash="daa8220749c892489e3955b5af510c7c2bca23dc749977896164a289c8f5e066" dmcf-pid="1pUxBjkP5K" dmcf-ptype="general">국내 AI 기업은 웹사이트 크롤링(방대한 데이터 추출)·스크래핑(특정 정보 추출) 등으로 학습용 데이터를 확보하거나 아르바이트 구인을 통해 글과 사진·영상 등 단편적으로 학습용 데이터를 수집하고 있다.</p> <p contents-hash="67fcc430fbadb496465912c08f0ebab8d3f9c1e91d09140742ba5798ff954c67" dmcf-pid="tUuMbAEQHb" dmcf-ptype="general">그러나 이같은 방법으로 양질 데이터를 확보하는 데에는 한계가 있다. GPU 수만장 확보를 통해 AI 개발·고도화와 서비스에 필요한 기반을 만들어도 데이터 없이는 거대언어모델(LLM) 등 AI 성능 강화가 어려운 상황을 고려해야 한다는 지적이 나온다.</p> <p contents-hash="d97b54997354a3e19589a2abbe0a4d285f590453ec52865de4ad07b06b011665" dmcf-pid="Fu7RKcDx5B" dmcf-ptype="general">챗GPT와 같은 생성형 AI 서비스를 제공하기 위해서는 AI 모델·LLM 학습이 선행돼야 하고 이를 위한 양질의 충분한 학습용 데이터가 요구된다. 오픈AI의 과거 모델인 GPT-3 학습에만 파라미터(AI 작동에 영향을 미치는 외부 데이터) 1750억개가 투입됐다.</p> <p contents-hash="cf0fa6b211b4fb9d7edbe20915f888dc6cee4b30bad6db1d252a71b63e485d52" dmcf-pid="37ze9kwMXq" dmcf-ptype="general">업계는 공공데이터 개방·학습용 데이터 시장 조성 등 충분한 AI 학습용 데이터셋 확보를 위한 제도적 지원이 필요하다고 보고 있다.</p> <p contents-hash="122588fd0f223f52e6cff097a16f10b6072951d9d8747f84fcb69494941ac90b" dmcf-pid="0zqd2ErRtz" dmcf-ptype="general">이와 함께 저작권 해결도 요구한다. 저작권법상 저작권 침해가 면제되는 '공정이용' 대상에 AI 학습용 데이터를 포함하는 방안 등 제도화가 필요하다는 의견이다.</p> <p contents-hash="ab118241a533efb21ac70ad3d80002c41a5a49478d788a18931c0d64b64a00fe" dmcf-pid="pqBJVDmeZ7" dmcf-ptype="general">복수의 AI업계 관계자는 “AI 학습을 위해 데이터를 사용하고 사후에 저작권을 검토할 수 없기 때문에 제한적으로 활용하는 게 기업의 현실”이라며 “그럼에도 관련 제도나 기준이 명확하지 않아 소송 당할 위험이 상존하는 상황을 고려, 정부가 관련 법·제도를 정비하고 양질의 데이터 확보를 지원해야 한다”고 말했다.</p> <p contents-hash="19c20fc9b4e450d001393d9f3969f8150e633aeabca528410e5679b039e9f600" dmcf-pid="UBbifwsd1u" dmcf-ptype="general">딥시크의 깜짝 성공 역시 파라미터(약 6710억개 규모) 등 충분한 데이터가 있었기에 가능했다고 평가된다. 한 대규모 다중과제 언어이해 평가(MMLU)에서 딥시크 'R1'이 90.9점을 받았는데 업스테이지 '솔라 프로'가 약 220억개의 파라미터로 81.4점을 기록, 국내 AI 기업도 충분한 학습용 데이터가 확보되면 글로벌 톱티어 경쟁이 가능할 것으로 예상된다.</p> <p contents-hash="c2013137f42c11f52de2d68e72db04a42b1e4c02bae85f20c96298ca718f1eb9" dmcf-pid="ubKn4rOJXU" dmcf-ptype="general">이에 저작권 공정이용 외에도 충분한 AI 학습용 데이터 확보를 위한 '슈퍼 데이터셋'을 만들 수 있는 특수 목적의 데이터 신탁 제도나 데이터 협동조합 형태를 인정해주는 것과 같은 법·제도를 검토해야 한다는 게 전문가 조언이다.</p> <p contents-hash="0e013272b14aaaa6936ae5aac2f2987dc8e65bc5ce95ca53d9d7b184df4a6049" dmcf-pid="76PceSyjZp" dmcf-ptype="general">차경진 한양대 교수(비즈니스인포메틱스학과장)는 “우리나라에서 AI 경쟁력을 높이기 위한 데이터 확충 전략이나 국가 차원의 데이터 연합 모델 등에 대한 논의가 상대적으로 부족한 실정”이라며 “기업이 AI 학습에 데이터를 적극 활용함과 동시에 개인정보와 저작권을 보호할 수 있는 안전장치를 함께 제시할 수 있도록 제도 개선이 이뤄져야 한다”고 강조했다.</p> <p contents-hash="a3b2ce30394703b5c0fcbf954608cc2c2cbbe008565ca11b48493868bbeb119e" dmcf-pid="zPQkdvWAH0" dmcf-ptype="general">박종진 기자 truth@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기