앤트로픽, 미토스급 모델에 30일 데이터 보관·검토 도입...6월 9일 시행, 오용 패턴 탐지 위한 안전 조치

발행: 2026년 6월 11일

앤트로픽이 미토스급 AI 모델의 입력·출력을 30일간 보관·검토한다.

[한국정보기술신문] 인공지능 기업 앤트로픽이 새로운 미토스급(Mythos-class) 모델을 대상으로 입력 프롬프트와 생성 결과물을 30일간 보관하고 검토하는 정책을 도입했다. 이 정책은 2026년 6월 9일부터 시행됐다.

앤트로픽은 해당 조치가 미토스급 모델을 책임감 있게 배포하기 위한 안전 작업의 일환이라고 밝혔다. 회사는 이 모델들이 제공되는 모든 플랫폼에서 프롬프트와 출력물을 신뢰·안전(trust and safety) 목적으로 30일간 보관한다고 설명했다. 이 정책은 미토스급 모델과, 이와 유사한 역량을 지녀 회사가 '적용 대상 모델(covered models)'로 지정한 향후 모델에 적용된다. 그 외 모델은 기존 약관이 그대로 유지된다.

일반 이용자는 영향 없어...ZDR 조직이 대상

이번 변경은 모든 이용자에게 적용되는 것은 아니다. 클로드 무료·프로·맥스 등 소비자 플랜은 웹·데스크톱·모바일 앱을 포함해 영향을 받지 않는다. 이들 환경에서는 이미 안전 목적의 입출력 보관이 이뤄지고 있기 때문이다.

이번 정책의 실제 적용 대상은 제로 데이터 보존(ZDR) 방식으로 워크스페이스를 운영해 온 조직이다. 구체적으로는 클로드 콘솔에서 ZDR을 설정한 워크스페이스, 클로드 엔터프라이즈에서 ZDR로 클로드 코드를 사용하는 경우, 그리고 아마존 베드록·구글 클라우드 에이전트 플랫폼·마이크로소프트 파운드리를 통해 ZDR로 클로드에 접근하는 조직이 해당된다.

"여러 요청에 걸쳐 드러나는 오용 패턴 탐지 위해"

앤트로픽은 정책 도입 배경으로 모델 역량의 급격한 향상을 들었다. 회사는 클로드 미토스 5가 모델 역량의 상당한 증가를 의미하며, 그 일부는 선의와 악의 양쪽 목적으로 모두 사용될 수 있다고 밝혔다. 클로드 페이블 5는 미토스 5와 동일한 기반 모델을 공유하지만, 특히 사이버·바이오 영역에서 추가적인 안전장치를 갖췄다고 회사는 덧붙였다.

회사는 일부 공격이 여러 요청에 걸쳐서만 드러난다는 점을 강조했다. 수백 개의 변형 프롬프트를 보내 그중 하나가 통하기를 노리는 '베스트 오브 N(Best-of-N)' 탈옥 시도가 대표적이다. 국가 후원 스파이 활동이나 데이터 갈취 캠페인 같은 대규모 오용 역시 여러 요청을 한꺼번에 살펴볼 때 비로소 포착된다는 설명이다. 앤트로픽은 이러한 위협을 탐지하려면 프롬프트와 출력물을 한 건씩이 아니라 함께 분석할 수 있도록 일시적으로 보관할 필요가 있다고 밝혔다.

접근 권한 제한·자동 삭제 등 보호 장치 마련

데이터 보관에 따른 우려를 의식한 듯 앤트로픽은 여러 보호 장치도 함께 제시했다. 회사에 따르면 직원은 심각한 피해가 우려돼 플래그된 경우나 고객의 서면 요청이 있는 경우를 제외하고는 이용자의 대화에 접근할 수 없다. 검토는 승인된 소수의 검토자만 수행할 수 있으며, 내보내기·복사·다운로드가 차단된 전용 도구를 통해서만 이뤄진다.

모든 접근 기록은 검토자가 임의로 삭제하거나 수정할 수 없는 변조 방지 로그에 남는다. 보관된 데이터는 30일이 지나면 자동으로 삭제되며, 안전 조사의 일부이거나 법적으로 보관이 요구되는 드문 경우만 예외로 둔다. 자격을 갖춘 조직은 고객 관리형 암호화 키와 접근 투명성 감사 로그를 추가로 적용할 수 있다.

앤트로픽은 또 기술적·조직적 조치를 담은 정보보안 프로그램을 문서화해 운영하고 있다고 밝혔다. 이 프로그램은 알려진 위협과 예상되는 위협에 대응하도록 설계됐으며 정기적으로 점검을 받는다고 회사는 설명했다.

대상 조직, 모델별 보관 설정 필요

ZDR을 사용하지 않는 대다수 조직은 별도로 설정할 사항이 없다. 다만 현재 데이터 보관 없이 클로드를 사용하는 조직이 지정 모델을 이용하려면 보관 설정을 새로 구성해야 한다. 클로드 API를 앤트로픽에서 직접 사용하는 경우 개발자 콘솔의 개인정보 관리 메뉴에서 해당 워크스페이스의 보관 기능을 켜면 되며, 다른 ZDR 워크스페이스는 기존 설정을 유지한다.

아마존 베드록이나 구글 클라우드를 통해 접근하는 경우 보관된 데이터는 각 클라우드 환경에 그대로 머무른다. 클로드 코드는 운영되는 워크스페이스의 정책을 따르며, 엔터프라이즈 환경에서는 관리 콘솔을 통해 최고 소유자가 보관 설정을 직접 변경할 수 있도록 관련 기능이 제공된다. 한편 엔터프라이즈용 클로드 챗과 코워크는 이미 표준 보관 방식으로 운영되고 있어 별도 조치 없이 신규 모델을 이용할 수 있다.

앤트로픽은 보관 데이터의 위협 모델과 관련 개인정보 보호 통제에 대한 자세한 내용을 자사 트러스트 센터의 기술 백서에서 확인할 수 있다고 안내했다.

한국정보기술신문 정보보안분과 안서진 기자 news@kitpa.org

앤트로픽, 미토스급 모델에 30일 데이터 보관·검토 도입...6월 9일 시행, 오용 패턴 탐지 위한 안전 조치

일반 이용자는 영향 없어...ZDR 조직이 대상

"여러 요청에 걸쳐 드러나는 오용 패턴 탐지 위해"

접근 권한 제한·자동 삭제 등 보호 장치 마련

대상 조직, 모델별 보관 설정 필요

함께 읽으면 좋은 기사

[백준 서비스 종료 ⑫] 데이원컴퍼니, 같은 날 'BOJ 부활'과 '개인정보 유출' 동시에...코딩 테스트 명소 백준 온라인 저지 되살리며 보안 사고로 신뢰 시험대

유니티 게임 끊김의 주범은 '가비지 컬렉션'...힙 할당 줄여야 프레임 멈춤 막는다

넥슨, '크레이지 아케이드' 8월 13일 서비스 종료...25년 만에 막 내려, 환불 신청은 9월 16일까지

구글, 텍스트 4배 빠르게 짓는 실험 모델 '디퓨전젬마' 공개...토큰 하나씩 잇는 대신 256개 한꺼번에 생성, 26B MoE 구조로 소비자용 GPU서 구동

앤트로픽, 미토스급 모델에 30일 데이터 보관·검토 도입...6월 9일 시행, 오용 패턴 탐지 위한 안전 조치

구글, 학생·학부모 기말시험 대비 위한 'AI 학습 도구 5가지' 소개...자료 한데 모아 학습 가이드·맞춤 퀴즈 만들고 유튜브엔 사용시간 제한·자녀 보호 기능까지

기후에너지환경부, 전기차 공공충전 봄철 주말 할인 실적 공개...17일간 7만9천여 건 충전·7천5백만 원 환원, 낮 시간대 이용 9.2% 늘어

설치 없이 브라우저로 돌리는 오픈소스 지리정보시스템 'GeoLibre' 공개...PC·웹·모바일서 같은 화면으로 위성·드론 지도 다루고 공간 SQL·파이썬 연동까지

구글, 크롬 AI 비서 '제미나이' 신흥 시장으로 확대...중남미·아프리카·중동 등 데스크톱·iOS 이용자에 적용, 이미지 변환·맞춤형 답변 기능도 추가

일부 참여자만 '적대적 훈련'해도 AI 방어력 오른다...공주대·조선대 연구팀, 연합학습 강건성 실험 결과 공개

컴퓨터 비전 라이브러리 'OpenCV 5' 정식 출시...DNN 엔진 새로 짜 ONNX 80% 넘기고 LLM·VLM까지 직접 구동

신경망을 반도체 회로로 직접 새긴다...FPGA에 'KAN' 올려 나노초급 추론·실시간 학습 구현...연구진 "기존 KAN-FPGA보다 2700배 빨라"