한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 ·

앤트로픽, 최신 AI 모델 '클로드 소넷 4.6' 공개...코딩·컴퓨터 사용 능력 대폭 향상

발행일
읽는 시간2분 42초

무료 플랜 포함 전 구독자에 기본 제공, 100만 토큰 컨텍스트 창 베타 지원

앤트로픽이 2월 17일 소넷 4.6을 출시하며 이전 모델 대비 전 분야 성능 향상을 발표했다.

[한국정보기술신문] 인공지능 연구 기업 앤트로픽(Anthropic)이 2026년 2월 17일, 최신 AI 모델 '클로드 소넷 4.6'을 공식 출시했다. 이번 모델은 코딩, 컴퓨터 사용, 장문 맥락 추론, 에이전트 계획 수립, 지식 작업, 디자인 등 전 분야에서 역대 소넷 모델 중 가장 높은 성능을 기록했다. 무료 플랜을 포함한 모든 클로드 구독 플랜에서 기본 모델로 제공되며, API 가격은 기존 소넷 4.5와 동일하게 입력 100만 토큰당 3달러, 출력 100만 토큰당 15달러로 유지된다.

오퍼스급 성능을 소넷 가격에

소넷 4.6의 가장 주목할 만한 특징은 이전까지 오퍼스 클래스 모델을 필요로 했던 고성능 작업을 소넷 수준의 비용으로 처리할 수 있게 됐다는 점이다. 앤트로픽에 따르면 실제 업무 관련 작업 벤치마크인 GDPVal에서 소넷 4.6은 2025년 11월 출시된 오퍼스 4.5에 근접한 성능을 보여줬다.

클로드 코드 플랫폼 사용자 평가에서는 소넷 4.6이 소넷 4.5보다 약 70%의 경우에서 선호됐으며, 심지어 오퍼스 4.5보다도 59%의 경우에서 더 높은 선호도를 기록했다. 사용자들은 소넷 4.6이 코드 수정 전 맥락을 더 효과적으로 파악하고, 중복 로직을 줄이며, 다단계 작업에서 더 일관된 수행 능력을 보인다고 평가했다.

컴퓨터 사용 능력의 비약적 발전

앤트로픽은 2024년 10월 범용 컴퓨터 사용 AI 모델을 최초로 선보인 바 있다. 당시에는 실험적 수준이었으나, 소넷 4.6에서는 AI 컴퓨터 사용의 표준 벤치마크인 OSWorld 기준으로 역대 소넷 모델 중 최고 점수를 달성했다.

OSWorld는 크롬, 리브레오피스, 비주얼 스튜디오 코드 등 실제 소프트웨어가 작동하는 가상 컴퓨터 환경에서 수백 가지 작업을 수행하는 능력을 평가한다. 현재 초기 사용자들은 복잡한 스프레드시트 조작이나 다단계 웹 양식 작성 등에서 사람에 준하는 수준의 수행 능력을 경험하고 있다고 앤트로픽은 밝혔다.

또한 컴퓨터 사용 시 발생할 수 있는 프롬프트 인젝션 공격에 대한 방어력도 크게 향상됐다. 앤트로픽 안전성 평가 결과, 소넷 4.6은 전임 모델인 소넷 4.5 대비 프롬프트 인젝션 저항성이 크게 개선되었으며, 오퍼스 4.6과 유사한 수준의 방어 능력을 갖춘 것으로 나타났다.

100만 토큰 컨텍스트와 에이전트 역량 강화

소넷 4.6은 베타 기능으로 100만 토큰 컨텍스트 창을 지원한다. 이는 전체 코드베이스, 방대한 계약서, 수십 편의 연구 논문을 하나의 요청으로 처리할 수 있는 규모다. 앤트로픽은 단순히 컨텍스트를 보유하는 데 그치지 않고, 소넷 4.6이 긴 맥락 전반에 걸쳐 효과적인 추론을 수행한다고 강조했다.

가상 비즈니스 시뮬레이션 평가인 Vending-Bench Arena에서 소넷 4.6은 독자적인 전략을 구사했는데, 초반 10개월간 경쟁 모델보다 설비 확충에 집중적으로 투자한 뒤 막판에 수익성 극대화로 전략을 전환해 경쟁에서 우위를 점했다.

주요 기업들의 호평

소넷 4.6은 출시 전 주요 기업들의 평가에서도 높은 점수를 받았다. 리플릿의 대표 미켈레 카타스타는 "소넷 4.6의 성능 대비 비용 비율은 놀라울 정도이며, 가장 복잡한 에이전트 작업도 처리해낸다"고 밝혔다. 깃허브의 제품 부사장 조 바인더는 "대규모 코드베이스 탐색이 필요한 복잡한 코드 수정에서 탁월한 성능을 보이며, 에이전트 코딩에서 강력한 해결 성공률을 기록하고 있다"고 언급했다.

데이터브릭스는 엔터프라이즈 문서 벤치마크인 OfficeQA에서 소넷 4.6이 오퍼스 4.6과 동등한 성능을 보였다고 평가했으며, Box는 자사 테스트에서 소넷 4.5 대비 복잡한 추론 질의응답 성능이 15%포인트 향상됐다고 밝혔다.

제품 업데이트 및 이용 방법

API를 통해 개발자들은 모델을 즉시 사용할 수 있다. 클로드 개발자 플랫폼에서는 적응형 사고와 확장 사고 기능, 그리고 대화가 한도에 근접할 때 오래된 맥락을 자동 요약하는 컨텍스트 압축 기능이 베타로 지원된다. 무료 플랜도 소넷 4.6으로 업그레이드되며, 파일 생성, 커넥터, 스킬, 압축 기능이 기본 제공된다.

앤트로픽은 안전성 평가에 관해서도 "소넷 4.6은 최근 다른 클로드 모델들과 동등하거나 더 안전하다"고 밝히며, "폭넓은 친사회적 특성과 강력한 안전 행동을 보이며 심각한 정렬 문제의 징후는 없다"는 안전 연구팀의 결론을 공개했다.

한국정보기술신문 인공지능분과 김주호 기자 news@kitpa.org