한국정보기술진흥원
한국정보기술신문
thumbnail

방송통신 · 유관기관 ·

방송영상 AI 학습용 데이터 구축 컨소시엄 선정, MBC, KBS 등 주요 방송사 포함 4개 컨소시엄 선정…총 21,000시간 데이터 구축

발행일
읽는 시간2분 28초

과기정통부, 총 193억원 규모 지원 결정

[한국정보기술신문] 과학기술정보통신부(장관 배경훈)와 한국전파진흥협회(회장 홍범식)가 '방송영상 인공지능(AI) 학습용 데이터 구축' 사업 지원대상으로 MBC·KBS 등 주요 방송사가 참여하는 총 4개 컨소시엄을 선정했다고 밝혔다. 이번 사업은 2025년 1차 추경으로 반영되어 신규 추진되는 것으로, 컨소시엄 당 48억3000만원씩 총 193억원을 지원한다.

선정된 컨소시엄은 문화방송(MBC) 컨소시엄, 엠비씨충북 컨소시엄(지역MBC 총 15개사), 케이티이엔에이(KT ENA) 컨소시엄, 한국방송공사(KBS) 컨소시엄이다. 총 12개 컨소시엄이 지원하여 3:1의 경쟁률을 보였으며, AI·데이터 전문가로 구성된 심사위원회 평가를 통해 최종 선정됐다.

총 21,000시간의 고품질 AI 학습용 데이터 구축

선정된 4개 컨소시엄은 저작권 이슈가 해소된 국내 방송영상 원본 총 42,000시간을 활용하여 총 21,000시간의 고품질 방송영상 AI 학습용 데이터를 구축한다. 과기정통부는 각 컨소시엄이 고품질 데이터를 구축하도록 데이터 품질검증 전문기관을 통해 품질기준 설정, 단계별 품질 관리·컨설팅, 품질기준 달성 검증 등 데이터 품질을 전주기 관리·검증한다.

이번 사업은 영상 등을 생성하는 AI 모델 개발 지원을 위해 방송영상을 활용한 고품질 AI 학습용 데이터를 구축하는 사업으로, 방송사업자(주관기관)와 AI·데이터 기업·기관 등(참여기관)으로 구성된 컨소시엄이 수행한다.

컨소시엄별 특화 데이터 구축 계획

MBC 컨소시엄은 버추얼 스튜디오 등 다양한 방송콘텐츠 제작 환경에서 사용될 고정밀·고품질의 배경영상을 생성하는 AI의 학습용 데이터를 구축한다. 보도, 시사·교양, 예능, 드라마 등 10,000시간의 원본 영상을 활용하여 3,633시간의 영상데이터, 49.2만건의 이미지데이터 등 총 5,000시간 분량의 AI 학습용 데이터를 구축할 예정이다.

엠비씨충북 컨소시엄은 우리나라 각 지역의 고유한 문화와 생활양식 등을 반영한 이미지 및 영상을 생성하는 AI의 학습용 데이터를 구축한다. 지역MBC 15개사가 참여하여 각 지역의 다양한 자연·풍경, 생활·문화, 역사·사회 등과 관련된 12,000시간의 원본 영상을 활용해 총 5,940시간 분량의 AI 학습용 데이터를 구축한다.

KT ENA 컨소시엄은 감정이 표현되는 우리나라 인물, 우리나라 배경, 예능 자막 등을 생성하는 AI의 학습용 데이터를 구축한다. 예능, 시사·교양, 다큐 등 10,000시간의 원본 영상을 활용하여 총 5,000시간 분량의 AI 학습용 데이터를 구축할 계획이다.

KBS 컨소시엄은 촬영구도 및 편집 자동화, 사극 및 시대극에서 활용되는 소품을 3D로 생성하는 등 방송콘텐츠 제작에 필요한 AI의 학습용 데이터를 구축한다. 보도, 예능, 다큐, 스포츠 등 10,000시간의 원본 영상을 활용하여 4,500시간의 영상데이터, 1,500건의 3D데이터, 20만건의 이미지데이터 등 총 5,067시간 분량의 AI 학습용 데이터를 구축한다.

데이터 활용 방안과 산업 확산 계획

구축된 데이터는 AI 모델 개발 등에 다양하게 활용될 예정이다. 각 컨소시엄은 데이터를 활용하여 방송제작 현장에 필요한 특화 AI 개발 및 적용을 지속 추진한다. 또한 구축된 데이터는 '독자 AI 파운데이션 모델' 프로젝트에 선정된 정예팀 요청 시 제공되고, AI 허브 내 안심존 등에 연구·교육용 AI 개발을 위해 약 10~35% 이상 개방될 예정이다.

방송영상 AI 학습용 데이터의 활용도를 높이기 위해 협의체도 운영된다. 선정된 컨소시엄, AI·데이터 전문가, 데이터 수요기업 등이 참여하여 데이터 구축 현황을 공유하고 거래기준 및 체계 등을 논의할 예정이다.

과기정통부 배경훈 장관은 "데이터는 GPU와 함께 AI 모델 개발의 핵심 연료로 그 중요성이 커지고 있으며, 우리나라 인물, 사회, 역사, 자연 등이 풍부하게 담겨 있는 고품질 방송영상은 독자 AI 모델을 위한 최적의 데이터"라고 강조했다.

배 장관은 "이번 과제를 통해 방송영상이 AI 데이터로 적극 활용되어 방송사가 AI 기술을 다양하게 접목해 제작 효율성을 높임과 동시에 고품질 서비스를 제공하는 기반이 마련되기를 기대한다"고 밝혔다.

이번 사업은 저작권 이슈가 해소된 국내 방송영상 원본을 AI·데이터 기업, 기관 등과 협력해 고품질 방송영상 AI 학습용 데이터로 구축·검증하는 사업으로, 한국형 AI 모델 개발과 방송·미디어 분야의 AI 전환을 가속화하는 데 중요한 역할을 할 것으로 기대된다.

한국정보기술신문 유관기관분과 김류빈 기자 news@kitpa.org