정보기술 · 인공지능

성능이 너무 뛰어나 공개를 미뤘다...앤트로픽 AI '클로드 미토스', 제로데이 취약점 수천 개 자율 발견

2026년 4월 11일

3

thumbnail.webp
주요 운영체제·웹 브라우저의 수십 년 된 보안 결함을 스스로 찾아내는 AI, 위험성에 일반 공개 보류
[한국정보기술신문] 앤트로픽(Anthropic)이 4월 7일 자사의 새로운 범용 언어 모델 '클로드 미토스 프리뷰(Claude Mythos Preview)'의 보안 연구 결과를 공개했다. 이 모델은 모든 주요 운영체제와 웹 브라우저에서 제로데이 취약점을 자율적으로 탐지하고 실제 작동하는 익스플로잇(공격 코드)까지 작성할 수 있는 것으로 확인됐다. 그러나 앤트로픽은 이 모델의 사이버 공격 능력이 지나치게 강력하다고 판단해 일반 공개를 보류하고, '프로젝트 글래스윙(Project Glasswing)'이라는 방어적 보안 프로그램을 통해 12개 핵심 파트너에게만 제한 제공하기로 했다. 앤트로픽이 시스템 카드를 발행하면서도 모델을 일반에 공개하지 않는 것은 이번이 처음이다.
미토스 프리뷰는 약 한 달간의 내부 테스트를 거쳤으며, 이전 세대 모델과 비교해 압도적인 성능 차이를 보였다. 파이어폭스 147 자바스크립트 엔진 취약점 벤치마크에서 이전 모델 오퍼스 4.6은 수백 번의 시도 중 2회만 쉘 익스플로잇에 성공한 반면, 미토스 프리뷰는 같은 테스트에서 181회 성공했다. 약 90배에 달하는 성능 향상이다.

수십 년간 숨어있던 취약점 발굴

미토스 프리뷰가 발견한 취약점의 규모와 심각성은 보안 업계에 큰 충격을 주고 있다. 연구팀은 이 모델을 활용해 수천 개의 고위험 및 치명적 취약점을 발견했으며, 전문 보안 계약업체가 수동 검토한 198건 중 89%에서 모델이 부여한 심각도 등급과 동일한 평가를 받았다.
대표적인 사례로 세 가지가 꼽힌다. 먼저 OpenBSD의 TCP SACK 구현에서 27년간 존재해온 서비스 거부 취약점을 발견했다. 부호 있는 정수 오버플로와 널 포인터 역참조를 결합해 TCP로 응답하는 모든 OpenBSD 호스트를 원격에서 중단시킬 수 있는 공격이었다. 또한 FFmpeg의 H.264 코덱에서 2003년 커밋에서 도입되고 2010년 리팩터링으로 노출된 16년 된 취약점도 찾아냈는데, 그동안 모든 퍼저와 인간 검토자가 놓쳤던 결함이었다.
가장 주목할 만한 것은 FreeBSD에서 발견한 17년 된 원격 코드 실행 취약점(CVE-2026-4747)이다. 미토스 프리뷰는 NFS 서버의 스택 버퍼 오버플로를 이용해 인증 검사를 우회하고, 복잡한 ROP(Return-Oriented Programming) 체인을 여러 네트워크 패킷에 분산시켜 완전한 루트 접근 권한을 획득했다. 초기 프롬프트 이후 인간의 개입은 전혀 없었다.

알려진 취약점도 빠르게 무기화

미토스 프리뷰는 미지의 취약점뿐 아니라 이미 알려진 취약점(N-day)의 무기화 속도도 크게 앞당겼다. 2024~2025년 리눅스 커널 CVE 100건을 대상으로 테스트한 결과, 모델은 40건을 잠재적 공격 가능 후보로 선별하고 그중 절반 이상에 대해 권한 상승 익스플로잇을 구축하는 데 성공했다. 커널 주소 공간 배치 무작위화(KASLR) 우회, 힙 재할당 기법, 자격 구조체 덮어쓰기 등 고도의 기법을 자율적으로 활용했다.
기존에 숙련된 연구자가 알려진 취약점을 실제 익스플로잇으로 전환하는 데 수일에서 수주가 걸렸던 작업이 이제 대폭 단축된 것이다. CVE 식별자와 깃 커밋 해시만으로 하루 이내에 전체 공격 체인을 완성했으며, 비용은 2,000달러(약 290만 원) 미만이었다.

의도치 않게 나타난 능력

이러한 공격 능력은 앤트로픽이 의도적으로 학습시킨 것이 아니다. 앤트로픽 연구진은 "코드, 추론, 자율성 분야의 전반적 개선에 따른 부수적 결과로 이 능력이 나타났다"고 설명했다. 취약점을 패치하는 데 뛰어난 모델이 동시에 취약점을 공격하는 데도 뛰어나다는 양면성을 보여준 셈이다.

프로젝트 글래스윙, 방어에 집중

앤트로픽은 이 강력한 능력을 방어에 활용하기 위해 프로젝트 글래스윙을 출범시켰다. 마이크로소프트, 애플, 아마존, 크라우드스트라이크, 리눅스 재단 등 12개 파트너 기관에만 방어 목적으로 모델을 제공한다. 유사한 능력을 가진 모델이 널리 보급되기 전에 핵심 소프트웨어의 취약점을 먼저 수정하겠다는 전략이다.
앤트로픽은 방어 측면의 권고 사항도 함께 제시했다. 패치 주기를 단축하고 자동 업데이트를 활성화할 것, CVE 태그가 붙은 의존성 업데이트를 긴급하게 처리할 것, 그리고 모델 기반 탐지의 속도와 규모에 맞춰 취약점 공개 정책을 재검토할 것을 권고했다.
AI가 사이버 보안의 공격과 방어 양면에서 게임의 규칙을 바꾸고 있다. 미토스 프리뷰의 등장은 소프트웨어를 개발하고 유지·관리하는 모든 조직에 보안 체계의 근본적 재점검을 요구하는 신호탄이 되고 있다.
한국정보기술신문 정보보안분과 안서진 기자 news@kitpa.org