인공지능 ·
오픈AI, 소프트웨어 개발 특화 AI 모델 'GPT-5.2-Codex' 공개...사이버보안 능력 대폭 강화
장시간 자율 코딩 가능한 AI 에이전트, SWE-Bench Pro 56.4% 달성
[한국정보기술신문] 오픈AI가 소프트웨어 엔지니어링과 사이버보안에 최적화된 차세대 AI 모델 GPT-5.2-Codex를 12월 19일 공개했다. 이 모델은 복잡한 개발 작업을 장시간 자율적으로 수행할 수 있는 에이전트형 AI로, 전문 개발자 수준의 코딩 능력을 갖춘 것으로 평가받고 있다.
GPT-5.2-Codex는 실제 소프트웨어 엔지니어링 작업 환경을 평가하는 SWE-Bench Pro 벤치마크에서 56.4%의 정확도를 기록했다. 이는 이전 모델인 GPT-5.2의 55.6%, GPT-5.1의 50.8%를 넘어서는 성능이다. 또한 실시간 터미널 환경에서 AI 에이전트의 행동을 측정하는 Terminal-Bench 2.0에서는 64.0%를 달성하며 GPT-5.2의 62.2%를 상회했다.
오픈AI는 이번 모델이 GPT-5.2의 전문 지식 작업 강점과 GPT-5.1-Codex-Max의 최첨단 에이전트 코딩 능력을 결합했다고 설명했다. 특히 대규모 리팩토링, 코드 마이그레이션, 새로운 기능 구축과 같은 복잡한 작업을 완수할 수 있으며, 계획이 변경되거나 시도가 실패하더라도 작업을 놓치지 않고 지속적으로 반복할 수 있다고 강조했다.
컨텍스트 압축으로 24시간 연속 작업 가능
GPT-5.2-Codex의 핵심 기술적 진전은 컨텍스트 압축 기능이다. 이 기능을 통해 모델은 다단계 프로세스를 실행하면서도 작업 상태를 잃지 않으며, 최대 24시간 이상의 연속 코딩 세션을 유지할 수 있다. 테스트 과정에서 GPT-5.2-Codex는 7시간 이상 독립적으로 작업하며 구현을 반복하고 테스트 실패를 수정한 사례도 확인됐다.
작업 복잡도에 따라 추론 시간을 동적으로 조정하는 기능도 탑재됐다. 간단하고 명확한 요청이나 대화 중에는 빠르게 반응하고, 대규모 리팩토링과 같은 복잡한 작업에는 더 오랜 시간을 할애한다. 오픈AI 직원 트래픽 분석 결과, 사용자 요청의 하위 10%에 대해 GPT-5.2-Codex는 GPT-5 대비 93.7% 적은 토큰을 사용하는 것으로 나타났다.
사이버보안 역량 강화와 안전장치 마련
GPT-5.2-Codex는 사이버보안 분야에서 눈에 띄는 성능 향상을 보였다. 여러 단계의 보안 작업이 포함된 전문 CTF 챌린지에서 이전 모델들을 능가하는 성적을 거뒀다. 오픈AI는 핵심 사이버보안 평가에서 GPT-5-Codex부터 큰 성능 도약이 시작됐고, GPT-5.1-Codex-Max와 GPT-5.2-Codex에서 추가적인 향상이 이뤄졌다고 밝혔다.
실제 사례로, 한 보안 연구자가 GPT-5.1-Codex-Max를 사용해 리액트 서버 컴포넌트의 알려진 취약점을 분석하던 중 여러 건의 새로운 보안 취약점을 발견했다. CVE-2025-55182를 조사하는 과정에서 반복적 프롬프팅과 퍼징 기법을 통해 CVE-2025-55183, CVE-2025-55184, CVE-2025-67779를 추가로 발견하고 책임감 있게 공개했다.
다만 오픈AI는 강화된 능력이 오용될 위험성도 인정했다. 안전 자문 그룹은 GPT-5.2-Codex가 아직 준비 프레임워크 기준 높은 수준의 사이버 능력에 도달하지는 않았지만, 향후 능력 성장을 염두에 두고 배포 접근 방식을 설계하고 있다고 밝혔다. 이에 따라 오픈AI는 검증된 보안 전문가를 위한 초대 전용 신뢰 액세스 시범 프로그램을 시작했다.
Windows 환경 지원 및 시각 능력 개선
GPT-5.2-Codex는 Windows 네이티브 개발 환경에서의 성능도 크게 개선됐다. 리눅스 중심 모델들이 역사적으로 어려움을 겪었던 마이크로소프트 운영 체제 탐색에서 향상된 신뢰성을 제공한다.
또한 강화된 시각 기능을 통해 스크린샷, 기술 다이어그램, 차트, 사용자 인터페이스 목업을 더 정확하게 해석할 수 있게 됐다. 이는 개발 세션 중 공유되는 시각 자료를 실제 작동하는 코드로 전환하는 데 도움을 준다.
가격 40% 인상, API 접근은 점진적 확대
GPT-5.2-Codex는 현재 모든 유료 ChatGPT 사용자에게 Codex CLI와 IDE 확장을 통해 제공되고 있다. API 액세스는 향후 몇 주 내에 안전하게 활성화될 예정이다.
API 가격은 입력 토큰 100만 개당 1.75달러, 출력 토큰 100만 개당 14달러로 책정됐다. 이는 한 달 전 출시된 이전 모델의 입력 토큰 가격 1.25달러 대비 40% 인상된 수준이다. 오픈AI는 컨텍스트 압축으로 인한 효율성 향상이 기업 고객에게 높은 단가를 상쇄할 것으로 보고 있다.
한편 오픈AI는 병렬적으로 방어적 사이버보안 작업에 집중하는 검증된 전문가와 조직을 대상으로 향후 기능과 더 허용적인 모델에 대한 초대 전용 신뢰 액세스를 시범 운영하고 있다. 회사는 이러한 배포 접근 방식이 접근성과 안전성의 균형을 맞출 것이라고 밝혔다.
한국정보기술신문 인공지능분과 권지현 기자 news@kitpa.org