한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

정부, AI 학습용 데이터 100종 발굴 추진...과기정통부·NIA, 공공기관 보유 데이터 전수조사 실시

thumbnail.webp
정부가 공공기관 보유 AI 학습용 데이터 100종을 발굴해 통합 제공
[한국정보기술신문] 정부가 공공기관이 보유한 AI 학습용 데이터를 체계적으로 발굴하고 제공하기 위한 전수조사에 착수했다. 과학기술정보통신부는 한국지능정보사회진흥원과 함께 'AI 학습용 데이터 센서스' 프로젝트를 추진 중이라고 10일 밝혔다.

100종 데이터 발굴 목표

과기정통부는 이번 조사를 통해 AI 학습 활용 가능성이 높은 데이터 100종을 발굴할 계획이다. 이는 60억원 규모의 'AI 학습용데이터 통합제공체계' 운영의 일환으로 추진된다.
현재 운영 중인 'AI허브'에는 903종의 데이터가 개방돼 있다. 정부는 이를 개편해 공공과 민간 데이터를 통합 집적하는 플랫폼으로 확대할 방침이다.
김경만 과기정통부 인공지능정책실장은 "AI 성능의 핵심은 활용 가능한 풍부한 데이터"라며 "공공부문의 데이터 자산을 체계적으로 발굴하겠다"고 말했다.

분산 관리의 한계 극복

이번 조사가 필요한 이유는 현재 공공기관의 AI 학습용 데이터가 기관별로 분산 관리되고 있기 때문이다. 이로 인해 전체 현황 파악이 어렵고 AI 기업들의 활용도 제한적인 상황이다.
조사는 AI기본법 제15조를 법적 근거로 진행된다. 조사 항목으로는 데이터 유형과 구조, 구축 목적, 제공 범위 등이 포함된다. AI 학습용 데이터뿐만 아니라 가공 가능한 데이터도 조사 범위에 들어간다.

체계적 제공 방안 마련

선정된 100종의 데이터는 품질 보완과 비식별조치를 거친 후 제공될 예정이다. 온라인 공개가 어려운 경우에는 '데이터 안심구역'을 통해 제공하는 방안이 검토되고 있다.
데이터 안심구역은 민감한 정보가 포함된 데이터를 안전한 환경에서 연구·분석할 수 있도록 하는 시설이다. 이를 통해 개인정보보호와 데이터 활용의 균형을 맞출 수 있을 것으로 기대된다.

AI 생태계 활성화 기대

정부의 이번 조치는 AI 산업 생태계 활성화에 중요한 역할을 할 것으로 전망된다. 양질의 학습 데이터 부족은 국내 AI 기업들이 글로벌 경쟁력을 확보하는 데 주요 걸림돌로 작용해왔다.
특히 공공데이터의 특성상 다양한 분야의 대용량 데이터를 포함하고 있어, 민간에서 구하기 어려운 희귀 데이터에 대한 접근성이 크게 개선될 것으로 보인다.
정부는 이번 프로젝트를 통해 국내 AI 기업들의 데이터 접근성을 높이고, 궁극적으로 국가 AI 경쟁력 강화에 기여할 것으로 기대하고 있다.
한국정보기술신문 유관기관분과 한재현 기자 news@kitpa.org

함께 읽으면 좋은 기사

한국인공지능올림피아드 'KOAI 2026' 국가대표 선발전 진출자 14명 확정...서울과학고 최다 4명, 고2·고3이 다수...6월 13일 온라인 필기시험 거쳐 15일 발표, 전국 7개 시·도 9개 학교서 진출

한국인공지능올림피아드 'KOAI 2026' 국가대표 선발전 진출자 14명 확정...서울과학고 최다 4명, 고2·고3이 다수...6월 13일 온라인 필기시험 거쳐 15일 발표, 전국 7개 시·도 9개 학교서 진출

교육 · 인공지능 2
삼성전자, 파리 '비바테크 2026'서 '커넥티드 케어' 건강관리 비전 공개...삼성 헬스 중심으로 기기·서비스 하나로 잇는다...6월 17~20일 전시, 갤럭시·가전·TV에 의료진 연결까지 아우른 '더 건강한 내일' 제시

삼성전자, 파리 '비바테크 2026'서 '커넥티드 케어' 건강관리 비전 공개...삼성 헬스 중심으로 기기·서비스 하나로 잇는다...6월 17~20일 전시, 갤럭시·가전·TV에 의료진 연결까지 아우른 '더 건강한 내일' 제시

정보기술 · 인공지능 4
SK하이닉스, HPE 디스커버 2026서 'AI 메모리 풀 라인업' 펼쳤다...HPE와 파트너십 재확인...HBM4부터 CMM-DDR5·eSSD·서버 D램까지 총망라하며 '풀 스택 AI 메모리 크리에이터' 입증

SK하이닉스, HPE 디스커버 2026서 'AI 메모리 풀 라인업' 펼쳤다...HPE와 파트너십 재확인...HBM4부터 CMM-DDR5·eSSD·서버 D램까지 총망라하며 '풀 스택 AI 메모리 크리에이터' 입증

반도체 · 인공지능 5
구글, AI 바다생물이 붓 되는 추상화 도구 '스플래시 캔버스' 공개...'블롭 오페라' 만든 데이비드 리 신작, 제미나이·처프로 말 거는 다섯 생물이 그림 평까지...물감처럼 번지는 유체 효과에 실시간 소리, 웹브라우저서 바로 체험

구글, AI 바다생물이 붓 되는 추상화 도구 '스플래시 캔버스' 공개...'블롭 오페라' 만든 데이비드 리 신작, 제미나이·처프로 말 거는 다섯 생물이 그림 평까지...물감처럼 번지는 유체 효과에 실시간 소리, 웹브라우저서 바로 체험

인공지능 · 실감형콘텐츠 3
미국 FERC, AI 데이터센터 전력망 연결 가속한다...대규모 전력 수요 '계통 연계' 절차 대폭 손질...6대 권역 전력망 운영기관에 직권 명령, 증설 비용은 수요자가 더 부담하고 유연 부하 입증 땐 심사 60일로 단축

미국 FERC, AI 데이터센터 전력망 연결 가속한다...대규모 전력 수요 '계통 연계' 절차 대폭 손질...6대 권역 전력망 운영기관에 직권 명령, 증설 비용은 수요자가 더 부담하고 유연 부하 입증 땐 심사 60일로 단축

클라우드 · 인공지능 4
삼성전자, 세계 최초 '42nm 3D 적층 트랜지스터' 구현...수평의 한계 수직으로 돌파...2026 VLSI Symposium 베스트 페이퍼 선정, 같은 면적에 트랜지스터 2배 담아 전력효율 2배·성능 100% 향상 기대

삼성전자, 세계 최초 '42nm 3D 적층 트랜지스터' 구현...수평의 한계 수직으로 돌파...2026 VLSI Symposium 베스트 페이퍼 선정, 같은 면적에 트랜지스터 2배 담아 전력효율 2배·성능 100% 향상 기대

반도체 5
애플, 브라질서 앱 외부 결제·대체 마켓 허용...CADE 합의 따라 iOS 26.5부터 단계 시행

애플, 브라질서 앱 외부 결제·대체 마켓 허용...CADE 합의 따라 iOS 26.5부터 단계 시행

정보기술 · 정보보안 4
노암 샤지어, 구글 떠나 오픈AI로...'트랜스포머' 창시자급 AI 석학의 전격 이적...제미나이 공동 리더가 2년도 안 돼 다시 구글 떠나, 오픈AI서 AI 설계 연구 이끌 듯

노암 샤지어, 구글 떠나 오픈AI로...'트랜스포머' 창시자급 AI 석학의 전격 이적...제미나이 공동 리더가 2년도 안 돼 다시 구글 떠나, 오픈AI서 AI 설계 연구 이끌 듯

인공지능 4
삼성전자, 세계 최초 'HBM4E 12단' 샘플 출하...차세대 AI 메모리 시장 주도권 굳힌다...핀당 16Gbps·단일 스택 3.6TB 대역폭에 48GB 고용량 구현, 2월 HBM4 양산 출하 이어 수개월 만에 차세대 제품 공급 개시

삼성전자, 세계 최초 'HBM4E 12단' 샘플 출하...차세대 AI 메모리 시장 주도권 굳힌다...핀당 16Gbps·단일 스택 3.6TB 대역폭에 48GB 고용량 구현, 2월 HBM4 양산 출하 이어 수개월 만에 차세대 제품 공급 개시

반도체 4
구글, 세계 첫 'AI 예술 미술관' 데이터랜드 LA에 연다...데이터가 물감 되는 2300㎡ 몰입 공간, 구글 클라우드가 실시간 구동...6월 20일 개관, 관람객 감정 읽어 영상·소리·향 바꾸고 신진 작가 4명엔 레지던시 지원

구글, 세계 첫 'AI 예술 미술관' 데이터랜드 LA에 연다...데이터가 물감 되는 2300㎡ 몰입 공간, 구글 클라우드가 실시간 구동...6월 20일 개관, 관람객 감정 읽어 영상·소리·향 바꾸고 신진 작가 4명엔 레지던시 지원

인공지능 · 실감형콘텐츠 4
과기정통부, '피지컬 AI 얼라이언스 2기' 출범...정책 논의 넘어 '실행형 협력체계'로 전환

과기정통부, '피지컬 AI 얼라이언스 2기' 출범...정책 논의 넘어 '실행형 협력체계'로 전환

인공지능 · 유관기관 4
SK하이닉스, 신입 채용서 학력 제한 전면 폐지...17일 수시채용부터 실력·성장 가능성 중심 선발...최태원 회장 'AI 인재상' 따라 설계 등 주요 직무 세 자릿수 대규모 채용

SK하이닉스, 신입 채용서 학력 제한 전면 폐지...17일 수시채용부터 실력·성장 가능성 중심 선발...최태원 회장 'AI 인재상' 따라 설계 등 주요 직무 세 자릿수 대규모 채용

반도체 3