성능이 너무 뛰어나 공개를 미뤘다...앤트로픽 AI '클로드 미토스', 제로데이 취약점 수천 개 자율 발견

발행: 2026년 4월 11일

주요 운영체제·웹 브라우저의 수십 년 된 보안 결함을 스스로 찾아내는 AI, 위험성에 일반 공개 보류

[한국정보기술신문] 앤트로픽(Anthropic)이 4월 7일 자사의 새로운 범용 언어 모델 '클로드 미토스 프리뷰(Claude Mythos Preview)'의 보안 연구 결과를 공개했다. 이 모델은 모든 주요 운영체제와 웹 브라우저에서 제로데이 취약점을 자율적으로 탐지하고 실제 작동하는 익스플로잇(공격 코드)까지 작성할 수 있는 것으로 확인됐다. 그러나 앤트로픽은 이 모델의 사이버 공격 능력이 지나치게 강력하다고 판단해 일반 공개를 보류하고, '프로젝트 글래스윙(Project Glasswing)'이라는 방어적 보안 프로그램을 통해 12개 핵심 파트너에게만 제한 제공하기로 했다. 앤트로픽이 시스템 카드를 발행하면서도 모델을 일반에 공개하지 않는 것은 이번이 처음이다.

미토스 프리뷰는 약 한 달간의 내부 테스트를 거쳤으며, 이전 세대 모델과 비교해 압도적인 성능 차이를 보였다. 파이어폭스 147 자바스크립트 엔진 취약점 벤치마크에서 이전 모델 오퍼스 4.6은 수백 번의 시도 중 2회만 쉘 익스플로잇에 성공한 반면, 미토스 프리뷰는 같은 테스트에서 181회 성공했다. 약 90배에 달하는 성능 향상이다.

수십 년간 숨어있던 취약점 발굴

미토스 프리뷰가 발견한 취약점의 규모와 심각성은 보안 업계에 큰 충격을 주고 있다. 연구팀은 이 모델을 활용해 수천 개의 고위험 및 치명적 취약점을 발견했으며, 전문 보안 계약업체가 수동 검토한 198건 중 89%에서 모델이 부여한 심각도 등급과 동일한 평가를 받았다.

대표적인 사례로 세 가지가 꼽힌다. 먼저 OpenBSD의 TCP SACK 구현에서 27년간 존재해온 서비스 거부 취약점을 발견했다. 부호 있는 정수 오버플로와 널 포인터 역참조를 결합해 TCP로 응답하는 모든 OpenBSD 호스트를 원격에서 중단시킬 수 있는 공격이었다. 또한 FFmpeg의 H.264 코덱에서 2003년 커밋에서 도입되고 2010년 리팩터링으로 노출된 16년 된 취약점도 찾아냈는데, 그동안 모든 퍼저와 인간 검토자가 놓쳤던 결함이었다.

가장 주목할 만한 것은 FreeBSD에서 발견한 17년 된 원격 코드 실행 취약점(CVE-2026-4747)이다. 미토스 프리뷰는 NFS 서버의 스택 버퍼 오버플로를 이용해 인증 검사를 우회하고, 복잡한 ROP(Return-Oriented Programming) 체인을 여러 네트워크 패킷에 분산시켜 완전한 루트 접근 권한을 획득했다. 초기 프롬프트 이후 인간의 개입은 전혀 없었다.

알려진 취약점도 빠르게 무기화

미토스 프리뷰는 미지의 취약점뿐 아니라 이미 알려진 취약점(N-day)의 무기화 속도도 크게 앞당겼다. 2024~2025년 리눅스 커널 CVE 100건을 대상으로 테스트한 결과, 모델은 40건을 잠재적 공격 가능 후보로 선별하고 그중 절반 이상에 대해 권한 상승 익스플로잇을 구축하는 데 성공했다. 커널 주소 공간 배치 무작위화(KASLR) 우회, 힙 재할당 기법, 자격 구조체 덮어쓰기 등 고도의 기법을 자율적으로 활용했다.

기존에 숙련된 연구자가 알려진 취약점을 실제 익스플로잇으로 전환하는 데 수일에서 수주가 걸렸던 작업이 이제 대폭 단축된 것이다. CVE 식별자와 깃 커밋 해시만으로 하루 이내에 전체 공격 체인을 완성했으며, 비용은 2,000달러(약 290만 원) 미만이었다.

의도치 않게 나타난 능력

이러한 공격 능력은 앤트로픽이 의도적으로 학습시킨 것이 아니다. 앤트로픽 연구진은 "코드, 추론, 자율성 분야의 전반적 개선에 따른 부수적 결과로 이 능력이 나타났다"고 설명했다. 취약점을 패치하는 데 뛰어난 모델이 동시에 취약점을 공격하는 데도 뛰어나다는 양면성을 보여준 셈이다.

프로젝트 글래스윙, 방어에 집중

앤트로픽은 이 강력한 능력을 방어에 활용하기 위해 프로젝트 글래스윙을 출범시켰다. 마이크로소프트, 애플, 아마존, 크라우드스트라이크, 리눅스 재단 등 12개 파트너 기관에만 방어 목적으로 모델을 제공한다. 유사한 능력을 가진 모델이 널리 보급되기 전에 핵심 소프트웨어의 취약점을 먼저 수정하겠다는 전략이다.

앤트로픽은 방어 측면의 권고 사항도 함께 제시했다. 패치 주기를 단축하고 자동 업데이트를 활성화할 것, CVE 태그가 붙은 의존성 업데이트를 긴급하게 처리할 것, 그리고 모델 기반 탐지의 속도와 규모에 맞춰 취약점 공개 정책을 재검토할 것을 권고했다.

AI가 사이버 보안의 공격과 방어 양면에서 게임의 규칙을 바꾸고 있다. 미토스 프리뷰의 등장은 소프트웨어를 개발하고 유지·관리하는 모든 조직에 보안 체계의 근본적 재점검을 요구하는 신호탄이 되고 있다.

한국정보기술신문 정보보안분과 안서진 기자 news@kitpa.org

성능이 너무 뛰어나 공개를 미뤘다...앤트로픽 AI '클로드 미토스', 제로데이 취약점 수천 개 자율 발견

수십 년간 숨어있던 취약점 발굴

알려진 취약점도 빠르게 무기화

의도치 않게 나타난 능력

프로젝트 글래스윙, 방어에 집중

함께 읽으면 좋은 기사

전국 25개 대학 리듬게임 동아리, 광주서 실력 겨룬다...'UCRC 2026' 온라인 예선 진행 중, 7월 17~19일 광주 게임플라자서 오프라인 본선

미 정부, 앤트로픽 최신 AI '페이블 5·미토스 5' 외국인 접근 전면 차단...한 논객 "앤트로픽이 스스로 요구한 규제, 제 발등 찍었다"...아모데이 '정부에 모델 차단권 부여' 제안 이틀 만에 수출통제 직격, 앤트로픽은 "오해" 반박

블루 아카이브 팬 4500명, 하남에서 함께 달렸다...넥슨, 서비스 4.5주년 맞아 14일 '키보토스 런 2026' 개최, 티켓 7분 만에 매진·수익 일부 어린이 재활병원에 기부

"AI가 코드를 짜는 시대, 진짜 일은 '안전한 병합'부터 시작된다"...개발자 유수프 아이타스 "데모 완성은 결승선 아냐"

국산 AI칩, 설계부터 제조까지 손잡는다...산업부 'M.AX 얼라이언스' 총회서 '반도체 제조지원 TF' 발족, 8천억 투입 '온디바이스 AI칩' 10종 개발 본격화

구글, 'AI 가짜 문자' 사기조직에 소송 건다...FBI·통신3사와 손잡고 中 기반 '아웃사이더 엔터프라이즈' 인프라 해체 추진, 가짜 사이트 9000개·피해자 수십만 명

개인정보위 "깃허브에 접근키·API키 저장 말라"...클라우드·협업도구 자격증명 노출로 개인정보 유출 잇따라, 국내 한 기업선 1천만 건 새나가

"모두가 AI로 모든 걸 한다"는 건 착각...미국인 3분의 1은 AI를 아예 안 쓴다, 덕덕고 창업자 "써 본 사람 상당수도 가끔 이용자일 뿐"

AI업체 넥스AGI "브라질 리우市 'Rio 3.5' 모델은 우리 것 짜깁기"...깃허브로 공개 고발, 시스템 지시문 떼면 스스로 "나는 넥스" 자처

개인정보위, 공공부문 개인정보 관리실태 현장 점검 본격 나섰다...한국지역정보개발원 첫 방문, '공공실태점검단' 신설해 사전 예방체계로 전환

클라우드 AI 코딩 비용 치솟자 "내 컴퓨터서 직접 돌리자"...깃허브 코파일럿 종량제 전환에 개발자, 무료 오픈웨이트 모델로 갈아타는 법 공개

한국, 싱가포르·영국·호주·캐나다와 'AI 사전표준화' 협력 MoU 체결...국제표준 개발 전 단계부터 5개국 협력체계 구축, 제조·헬스케어 공동 시범사업으로 표준 파트너십 강화