인공지능 ·
OpenAI, 실시간 코딩 모델 'GPT-5.3-Codex-Spark' 출시...초당 1000 토큰 생성
ChatGPT Pro 사용자 대상 연구 프리뷰로 제공, 세레브라스 칩 기반 초저지연 실현
[한국정보기술신문] 오픈AI가 실시간 코딩을 위해 설계된 첫 번째 AI 모델인 GPT-5.3-Codex-Spark를 공개했다. 이번 모델은 초당 1000개 이상의 토큰을 생성하며 실시간 협업이 가능한 수준의 응답 속도를 제공한다는 것이 특징이다.
GPT-5.3-Codex-Spark는 이달 초 출시된 GPT-5.3-Codex의 경량화 버전으로, ChatGPT Pro 사용자를 대상으로 연구 프리뷰 형태로 제공된다. 오픈AI는 Codex 앱, CLI(명령줄 인터페이스), VS Code 확장 프로그램의 최신 버전을 통해 이 모델을 사용할 수 있다고 밝혔다.
세레브라스 칩으로 구동되는 초저지연 실현
이번 모델의 핵심은 오픈AI가 1월에 발표한 100억 달러 규모의 세레브라스 파트너십의 첫 번째 성과물이라는 점이다. GPT-5.3-Codex-Spark는 세레브라스의 Wafer Scale Engine 3 칩에서 구동되며, 이를 통해 극도로 낮은 지연시간을 달성했다.
오픈AI는 모델 속도뿐만 아니라 전체 요청-응답 파이프라인의 지연시간을 줄이기 위해 인프라 전반에 걸친 개선을 단행했다. 그 결과 클라이언트-서버 왕복 오버헤드를 80% 감소시켰고, 토큰당 오버헤드는 30%, 첫 번째 토큰까지의 시간은 50% 단축했다. 지속적인 웹소켓 연결이 Codex-Spark에 기본적으로 활성화되어 있으며, 곧 모든 모델에 적용될 예정이다.
벤치마크에서 강력한 성능 입증
소프트웨어 엔지니어링 능력을 평가하는 SWE-Bench Pro와 Terminal-Bench 2.0 벤치마크에서 GPT-5.3-Codex-Spark는 강력한 성능을 보여줬다. 특히 GPT-5.3-Codex와 비교해 작업을 완료하는 데 걸리는 시간이 크게 단축됐으며, Terminal-Bench 2.0에서는 77.3%의 정확도를 기록해 GPT-5.2-Codex의 64%를 크게 상회했다.
오픈AI는 Codex-Spark가 정밀한 편집, 계획 수정, 코드베이스에 대한 상황별 질문 응답에 탁월하다고 설명했다. 새로운 레이아웃 시각화, 스타일링 개선, 인터페이스 변경 테스트 등을 빠르게 수행할 수 있는 것이 강점이다.
이중 모드 Codex 시스템의 첫 단계
오픈AI의 산업용 컴퓨팅 책임자인 사친 카티(Sachin Katti)는 "세레브라스는 훌륭한 엔지니어링 파트너였으며, 플랫폼 기능으로서 빠른 추론을 추가하게 되어 기쁘다"며 "웨이퍼 규모 컴퓨팅을 프로덕션에 도입함으로써 지연시간에 민감한 작업을 위해 Codex의 응답성을 유지할 수 있는 새로운 방법을 얻었다"고 밝혔다.
세레브라스의 공동 창업자이자 CTO인 션 리(Sean Lie)는 "GPT-5.3-Codex-Spark에서 가장 흥미로운 점은 오픈AI 및 개발자 커뮤니티와 협력하여 빠른 추론이 가능하게 하는 것, 즉 새로운 상호작용 패턴과 사용 사례, 근본적으로 다른 모델 경험을 발견하는 것"이라고 말했다.
오픈AI는 Codex-Spark를 실시간 협업과 장기 실행 작업을 결합한 이중 모드 Codex 시스템을 향한 첫 번째 단계로 설명했다. 향후 더 큰 모델, 더 긴 컨텍스트 윈도우, 멀티모달 입력 지원 등으로 기능을 확장할 계획이다.
현재 기능 및 제한사항
출시 시점에서 Codex-Spark는 128k 컨텍스트 윈도우와 텍스트 전용 입력을 지원한다. 연구 프리뷰 기간 동안 Codex-Spark는 자체 사용률 제한을 가지며, 사용량은 표준 사용률 제한에 포함되지 않는다. 다만 수요가 높을 경우 접근이 제한되거나 일시적으로 대기열에 배치될 수 있다.
오픈AI는 GPU가 여전히 광범위한 학습 및 추론 파이프라인에서 중심적인 역할을 한다고 강조하면서도, 세레브라스 하드웨어가 극도로 낮은 지연시간을 요구하는 워크플로우에 더 적합하다고 설명했다. 두 시스템은 단일 워크로드 내에서 결합되어 속도와 효율성의 균형을 맞출 수도 있다.
모델은 오픈AI의 메인라인 모델과 동일한 안전 교육을 포함하고 있으며, 사이버 보안 및 생물학 분야에서 고위험 능력에 대한 임계값을 충족하지 않는 것으로 평가됐다.
한국정보기술신문 인공지능분과 이준 기자 news@kitpa.org