한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

네덜란드, 자국이 통제하는 '주권 언어모델' GPT-NL 만든다...저작권·개인정보 걸러낸 데이터로 '책임 있는 AI' 지향

네덜란드가 자국이 통제하는 언어모델 GPT-NL 개발에 나섰다.
[한국정보기술신문] 네덜란드가 챗GPT 같은 외국산 인공지능(AI)에 기대지 않고 자국이 직접 통제하는 언어모델 'GPT-NL'을 만들고 있다. 네덜란드 응용과학연구기구(TNO)는 정보통신 분야 협력기관 수르프(SURF), 네덜란드 법과학연구소(NFI)와 함께 네덜란드어와 네덜란드 사회 환경에 맞춘 독자적인 언어모델과 그 생태계를 구축하는 사업을 진행 중이라고 밝혔다. TNO는 이 사업이 네덜란드와 유럽의 디지털 자율성을 높이고, 책임 있는 AI 활용의 토대를 마련하는 것을 목표로 한다고 설명했다.
언어모델이란 사람이 쓰는 말과 글을 학습해 문장을 이해하고 만들어 내는 AI를 말한다. 챗GPT처럼 글을 쓰고 질문에 답하는 서비스의 바탕에 깔린 기술로, 최근 업무와 교육, 공공 서비스 전반에 빠르게 스며들고 있다. TNO는 이런 기술이 혁신과 생산성에 큰 가능성을 보여 주는 동시에, 누가 모델의 작동 방식을 정하는지, 어떤 데이터를 쓰는지, 개인정보와 저작권 같은 공공의 가치를 어떻게 지킬지를 둘러싼 근본적인 물음을 던진다고 지적했다.
adrien-olichon-QRtym77B6xk-unsplash.jpg
Unsplash 제공

130억원 투입한 공공 사업...'디지털 주권'이 핵심

GPT-NL은 네덜란드 경제기후정책부를 대신해 네덜란드 기업청(RVO)이 자금을 댄 공공 사업이다. 사업에 배정된 예산은 모두 1350만 유로, 우리 돈으로 약 200억원 규모다. TNO는 이 같은 공적 투자가 독립적이고 신뢰할 수 있으며 미래에도 지속 가능한 네덜란드어 언어모델의 중요성을 보여 준다고 밝혔다. 사업 주체들은 GPT-NL이 강력한 AI와 공공의 가치가 함께 갈 수 있음을 보여 주는 사례라고 강조했다.
디지털 주권이란 한 나라나 지역이 자신들이 쓰는 디지털 기술과 데이터를 스스로 통제할 수 있는 능력을 뜻한다. 현재 널리 쓰이는 대형 언어모델 상당수가 미국의 거대 기술기업이 만든 것이어서, 모델이 어떻게 작동하고 어떤 데이터를 학습했는지를 이용국이 알기 어렵다는 문제가 꾸준히 제기돼 왔다. 외부 사업자에 대한 의존이 깊어지면 개인정보 보호나 표현의 자유 같은 사회적 가치를 자국 기준에 맞춰 지키기 어려워질 수 있다는 우려도 있다. GPT-NL은 이런 문제의식 위에서 출발한 사업으로, TNO는 신뢰할 수 있고 투명하며 호혜적이고 주권적인 모델을 만든다는 네 가지 가치를 내걸었다.
TNO가 내세우는 GPT-NL의 가장 큰 특징은 '주권(소버린)'이다. 주권형 모델이란 모델 자체와 학습 데이터, 그리고 개발 과정의 선택을 외부에 의존하지 않고 스스로 통제하는 모델을 가리킨다. GPT-NL은 네덜란드와 유럽 안에서 개발돼, 비유럽권 사업자에 대한 의존을 피하고 자국의 법과 가치, 사회적 목표에 맞춘 AI 생태계에 투자한다는 것이 TNO의 설명이다.

처음부터 다시 학습...저작권·개인정보 걸러낸 데이터만

GPT-NL은 기존에 공개된 다른 AI 모델을 가져다 손보는 방식이 아니라, 처음부터(from scratch) 새로 학습한다. TNO는 이렇게 해야 출처가 불분명한 데이터나 저작권 위험, 개인정보가 기존 모델에서 그대로 딸려 들어오는 일을 막을 수 있다고 설명했다. 학습에 쓰이는 데이터에도 엄격한 기준을 적용한다. 지식재산권을 보호하고, 학습 전에 개인정보를 지우거나 익명 처리하며, 기밀 정보와 유해한 내용을 빼고, 같은 자료가 중복되지 않도록 거른다는 것이다.
투명성도 강조했다. TNO는 데이터 수집과 학습 과정에서 내린 선택, 그리고 편향이나 윤리 문제 같은 위험에 어떻게 대응했는지를 문서로 공개하겠다고 밝혔다. 모델을 움직이는 소스 코드는 누구나 들여다볼 수 있도록 공개(오픈소스)하고, 데이터셋에 대한 상세한 정보도 함께 공유한다. 다만 모델의 핵심 설정값에 해당하는 '모델 가중치'는 통제된 사용 허가(라이선스) 아래 제공한다. 누가 모델을 쓰는지 파악하고, 데이터 사용 거부 요청 등에 따른 변경 사항을 이용자에게 알리기 위해서다.

데이터 제공자에 수익 일부 환원...'콘텐츠 위원회'도 운영

GPT-NL은 데이터를 둘러싼 권리 문제도 정면으로 다룬다. TNO는 깨끗하고 합법적인 데이터 공급망을 갖추는 것을 원칙으로 삼고, 데이터 제공자와 긴밀히 협력하며 이들을 모델 개발 과정에 참여시킨다고 밝혔다. 이를 위해 데이터 제공자와 권리 보유자가 GPT-NL의 향방에 의견을 낼 수 있는 '콘텐츠 위원회(Content Board)'를 운영한다. 또 모델에서 나오는 수익의 일부를 창작자에게 돌려주는 구조를 둬, 가치를 일방적으로 가져가는 대신 함께 나누는 방식을 지향한다고 설명했다.
AI 개발에 드는 막대한 전력과 자원 문제에도 신경을 쓰고 있다. TNO는 과학적 연구를 바탕으로 모델의 크기와 학습 과정을 최적화해 에너지와 물 사용을 줄이는 데 주의를 기울이고 있다고 밝혔다. AI 모델을 학습시키려면 많은 연산이 필요하고, 이 과정에서 대량의 전력과 냉각용 물이 쓰이는데 이를 효율적으로 관리하겠다는 것이다.
현재 사업은 진행 중인 단계로, TNO는 제품 책임자와 연구개발 책임자가 사업 현황과 다음 단계를 정리한 경과 보고서를 공개했다고 밝혔다. 다만 이번 내용은 사업을 이끄는 기관들이 직접 내놓은 설명인 만큼, 모델의 성능이나 실제 효과에 대한 외부의 독립적 검증은 앞으로의 과제로 남아 있다. 자국어와 공공 가치를 앞세운 유럽발 주권형 AI 시도가 거대 기술기업이 주도해 온 언어모델 시장에서 어떤 자리를 잡을지 주목된다.
한국정보기술신문 인공지능분과 박연호 기자 news@kitpa.org

함께 읽으면 좋은 기사

구글·유튜브, 여름방학 자녀 화면 사용 도구 3가지 제시...안드로이드 보호자 제어 전 기기 확대·AI 학습 도구로 온·오프라인 균형 제안

구글·유튜브, 여름방학 자녀 화면 사용 도구 3가지 제시...안드로이드 보호자 제어 전 기기 확대·AI 학습 도구로 온·오프라인 균형 제안

교육 4
지식재산처, 상표·디자인 등록증에 '대한민국(Republic of Korea)' 새긴다...17일부터 시행, 해외 진출 기업 권리 입증 쉬워져

지식재산처, 상표·디자인 등록증에 '대한민국(Republic of Korea)' 새긴다...17일부터 시행, 해외 진출 기업 권리 입증 쉬워져

유관기관 · 정보기술 · 지식재산 3
애플, '나의 이메일 가리기'·'애플로 로그인' 주소 'private.icloud.com'으로 통합...올여름 이후 신규 발급분부터 적용·기존 주소는 그대로 유지

애플, '나의 이메일 가리기'·'애플로 로그인' 주소 'private.icloud.com'으로 통합...올여름 이후 신규 발급분부터 적용·기존 주소는 그대로 유지

정보보안 3
단국대부속소프트웨어고, 2027학년도 SW역량우수자전형 포트폴리오 11월 23·24일 받는다...작품 1점 소스코드·2분 영상에 SW 수상·자격증 함께 제출, 27일 합격자 발표

단국대부속소프트웨어고, 2027학년도 SW역량우수자전형 포트폴리오 11월 23·24일 받는다...작품 1점 소스코드·2분 영상에 SW 수상·자격증 함께 제출, 27일 합격자 발표

교육 · 정보기술 2
구글, 안드로이드 17 정식 출시…멀티태스킹·게임·보안 기능 대폭 강화...픽셀부터 우선 배포, 연내 다른 안드로이드 기기로 확대

구글, 안드로이드 17 정식 출시…멀티태스킹·게임·보안 기능 대폭 강화...픽셀부터 우선 배포, 연내 다른 안드로이드 기기로 확대

정보기술 3
한국디지털미디어고, 제22회 전국 중학생 IT 올림피아드 개최...6월 30일까지 참가 접수

한국디지털미디어고, 제22회 전국 중학생 IT 올림피아드 개최...6월 30일까지 참가 접수

교육 · 정보기술 · 정보보안 2
메타, 'AI 올인'에 흔들리는 엔지니어링 조직...핵심 개발자 데이터 라벨링에 강제 차출·키보드 추적·역대급 보안 사고까지

메타, 'AI 올인'에 흔들리는 엔지니어링 조직...핵심 개발자 데이터 라벨링에 강제 차출·키보드 추적·역대급 보안 사고까지

인공지능 5
국가교육위·서울시교육청, 18일 'AI 시대 우리 교육의 방향' 토론회 연다...국민참여위원·학생·학부모·교원 등 150여 명 참여, '진정한 배움·학교 교육·직업 잇는 교육체제' 3대 주제 논의

국가교육위·서울시교육청, 18일 'AI 시대 우리 교육의 방향' 토론회 연다...국민참여위원·학생·학부모·교원 등 150여 명 참여, '진정한 배움·학교 교육·직업 잇는 교육체제' 3대 주제 논의

교육 · 인공지능 2
구글, 스마트워치 운영체제 '웨어 OS 7' 배포 시작...픽셀 워치에 실시간 정보 표시·연결 기기 제어 기능 추가, 연내 AI '제미나이' 탑재...배터리 최대 10% 개선

구글, 스마트워치 운영체제 '웨어 OS 7' 배포 시작...픽셀 워치에 실시간 정보 표시·연결 기기 제어 기능 추가, 연내 AI '제미나이' 탑재...배터리 최대 10% 개선

정보기술 · 정보통신 3
컬(curl) 없는 컨테이너에서 HTTP 요청, 배시 '/dev/tcp'로 해결...추가 설치 없이 셸만으로 가능

컬(curl) 없는 컨테이너에서 HTTP 요청, 배시 '/dev/tcp'로 해결...추가 설치 없이 셸만으로 가능

정보기술 3
네덜란드, 자국이 통제하는 '주권 언어모델' GPT-NL 만든다...저작권·개인정보 걸러낸 데이터로 '책임 있는 AI' 지향

네덜란드, 자국이 통제하는 '주권 언어모델' GPT-NL 만든다...저작권·개인정보 걸러낸 데이터로 '책임 있는 AI' 지향

인공지능 3
구글, '6월 픽셀 드롭' 공개...제미나이 기능 대폭 확대·앱 띄우기 '버블' 추가, 안드로이드 17과 함께 16일부터 순차 배포

구글, '6월 픽셀 드롭' 공개...제미나이 기능 대폭 확대·앱 띄우기 '버블' 추가, 안드로이드 17과 함께 16일부터 순차 배포

정보기술 · 인공지능 4