한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 ·

앤트로픽, AI 코딩 능력 대폭 강화한 '클로드 오퍼스 4.5' 출시...가격은 3분의 1로 인하

발행일
읽는 시간3분 47초

코딩과 에이전트 작업에서 경쟁사 모델 능가, 토큰 효율성과 가격 경쟁력 확보

[한국정보기술신문] 인공지능 기업 앤트로픽(Anthropic)이 11월 24일, 차세대 대규모 언어모델 '클로드 오퍼스 4.5(Claude Opus 4.5)'를 공식 출시했다. 회사는 이 모델을 코딩, 에이전트 작업, 컴퓨터 사용 분야에서 세계 최고 수준이라고 설명했다.

이번 출시는 앤트로픽이 지난 두 달간 진행한 세 번째 주요 모델 출시다. 회사는 지난 9월 클로드 소넷 4.5를, 10월에는 클로드 하이쿠 4.5를 각각 공개했으며, 가장 최근 오퍼스 모델인 오퍼스 4.1은 8월에 출시된 바 있다. 오퍼스 4.5는 이들 모델을 모두 능가하는 성능을 보이면서도 가격 경쟁력을 크게 높였다는 평가를 받고 있다.

소프트웨어 코딩 벤치마크에서 업계 최고 수준 기록

image.png
앤트로픽 제공

클로드 오퍼스 4.5는 실제 소프트웨어 코딩 능력을 측정하는 SWE-bench Verified 테스트에서 80.9%의 성적을 기록하며 업계 최고 수준의 결과를 달성했다. 이는 최근 출시된 구글의 제미니 3 프로(Gemini 3 Pro)와 오픈AI의 GPT-5.1을 능가하는 수치다.

컴퓨터 사용 능력을 측정하는 OSWorld 테스트에서는 66.3%의 점수를 얻어 앤트로픽의 이전 모델들 중 가장 우수한 컴퓨터 사용 모델로 자리매김했다. 회사 측은 오퍼스 4.5가 복잡한 다중 시스템 버그를 스스로 파악하고 수정할 수 있으며, 장기적인 목표 지향 행동에서 뛰어난 성능을 보인다고 설명했다.

특히 장기 코딩 작업에서 오퍼스 4.5는 높은 테스트 통과율을 보이면서도 토큰 사용량을 최대 65%까지 줄여 개발자들에게 품질 저하 없이 실질적인 비용 절감을 제공한다. 앤트로픽의 내부 테스트에서 이 모델은 회사가 성능 엔지니어 채용 시 사용하는 어려운 과제에서 인간 지원자보다 높은 점수를 기록했다.

가격 3분의 1로 인하, 접근성 대폭 개선

오퍼스 4.5의 가격은 입력 토큰 백만 개당 5달러, 출력 토큰 백만 개당 25달러로 책정됐다. 이는 이전 오퍼스 모델의 15달러/75달러 대비 3분의 1 수준이다. 프롬프트 캐싱을 활용하면 최대 90%, 배치 처리 시에는 50%의 추가 비용 절감이 가능하다.

이는 여전히 소넷 4.5의 3달러/15달러, 하이쿠 4.5의 1달러/5달러에 비해서는 높은 가격이지만, GPT-5.1 패밀리(1.25달러/10달러)나 제미니 3 프로(2달러/12달러, 20만 토큰 이상 시 4달러/18달러)와 비교하면 여전히 프리미엄 가격대에 위치한다. 하지만 이전 오퍼스 모델이 비용 부담으로 제한적으로만 사용됐던 것과 달리, 이제는 더 많은 사용자와 기업이 오퍼스급 성능을 일상적으로 활용할 수 있게 됐다.

엔터프라이즈 작업과 생산성 향상에 초점

image.png
앤트로픽 제공

앤트로픽은 오퍼스 4.5가 전문 소프트웨어 개발자, 금융 분석가, 컨설턴트, 회계사 같은 지식 근로자들에게 이상적이라고 밝혔다. 모델은 스프레드시트, 프레젠테이션, 문서 작성에서 일관성과 전문성, 도메인 인식 능력을 갖췄다.

실제 사용자 피드백에 따르면, 오퍼스 4.5는 복잡한 다중 코드베이스 리팩토링을 수행하고, 세 개의 조율된 에이전트에 걸친 작업을 처리할 수 있었다. 또한 모호한 요구사항을 해석하고 절충안을 스스로 판단하는 능력이 향상되어, 세밀한 지시 없이도 복잡한 작업을 처리할 수 있다.

깃허브의 한 고객은 "오퍼스 4.5는 고품질 코드를 제공하고 깃허브 코파일럿을 활용한 대규모 에이전트 워크플로우를 구동하는 데 탁월하다"며 "초기 테스트 결과 내부 코딩 벤치마크를 능가하면서 토큰 사용량을 절반으로 줄였고, 특히 코드 마이그레이션과 리팩토링 작업에 매우 적합하다"고 평가했다.

플랫폼 기능 확장과 새로운 도구 제공

오퍼스 4.5 출시와 함께 앤트로픽은 여러 플랫폼 업데이트를 발표했다. 클로드 코드(Claude Code)가 처음으로 데스크톱 앱에 추가됐으며, 개발자들은 장기 실행 코딩 작업을 백그라운드에서 오퍼스에게 독립적으로 할당할 수 있게 됐다.

클로드 앱 사용자들은 이제 긴 대화에서 제한에 자주 부딪히지 않게 된다. 앤트로픽은 대화의 초반부를 자동으로 요약하여 제한에 도달하지 않고 대화를 계속할 수 있는 공간을 확보하는 기능을 추가했다. 또한 이전 어시스턴트 턴의 사고 블록이 기본적으로 모델 컨텍스트에 보존되도록 개선했다.

클로드 포 크롬(Claude for Chrome) 확장 프로그램이 모든 맥스(Max) 구독자에게 개방됐으며, 클로드가 브라우저 탭 전반에서 작업을 수행할 수 있게 됐다. 클로드 포 엑셀(Claude for Excel)은 스프레드시트를 이해하고 편집할 수 있는 기능으로 모든 맥스, 팀, 엔터프라이즈 사용자에게 일반 제공되기 시작했다.

주요 클라우드 플랫폼에서 즉시 사용 가능

image.png
앤트로픽 제공
image.png
앤트로픽 제공

클로드 오퍼스 4.5는 앤트로픽의 앱과 API를 통해, 그리고 아마존 베드락(Amazon Bedrock), 구글 클라우드의 버텍스 AI(Vertex AI), 마이크로소프트 파운드리(Microsoft Foundry) 등 주요 클라우드 플랫폼 모두에서 즉시 사용할 수 있다. 개발자는 클로드 API를 통해 'claude-opus-4-5-20251101' 모델 문자열을 사용하면 된다.

모델은 20만 토큰의 컨텍스트 윈도우와 6만 4천 토큰의 출력 제한을 지원하며, 신뢰할 수 있는 지식 컷오프 날짜는 2025년 3월이다. API 사용자는 응답에 투입하는 전반적인 노력을 조정하여 성능과 지연 시간, 비용의 균형을 맞출 수 있는 세밀한 제어 기능을 사용할 수 있다.

앤트로픽은 또한 오퍼스 4.5와 함께 프롬프트 인젝션 공격에 대한 강건성을 크게 개선했다고 밝혔다. 프롬프트 인젝션은 모델을 속여 유해한 행동을 하도록 만드는 기만적인 지시를 몰래 주입하는 공격 기법이다.

업계 경쟁 심화 속 차별화 전략

image.png
앤트로픽 제공

오퍼스 4.5 출시는 AI 모델 시장의 치열한 경쟁을 보여준다. 11월 한 달 동안에만 오픈AI의 GPT-5.1 및 GPT-5.1-Codex-Max, 구글의 제미니 3가 연이어 출시됐으며, 각 기업은 코딩 능력에서 우위를 점하기 위해 경쟁하고 있다.

앤트로픽 측은 기존 중급 모델인 소넷 4.5가 구형 오퍼스 4.1을 능가하는 흥미로운 상황에 있었지만, 오퍼스 4.5로 3단계 모델 체계의 균형을 회복했다고 설명했다. 회사 관계자는 "이번 출시의 흥미로운 점은 모든 사람이 오퍼스로 전환해야 한다는 것이 아니라, 새로운 가능성의 단계를 열어준다는 것"이라고 강조했다.

오퍼스 4.5는 프로(Pro), 맥스(Max), 팀(Team), 엔터프라이즈(Enterprise) 구독 사용자에게 제공되며, 이전 모델로는 해결할 수 없었던 사용 사례와 성능이 가장 중요한 전문 소프트웨어 엔지니어링, 복잡한 에이전트 워크플로우, 고위험 엔터프라이즈 작업을 위해 설계된 프리미엄 모델로 자리매김했다.

한국정보기술신문 인공지능분과 김성현 기자 news@kitpa.org

한국정보기술신문