오픈AI, 차세대 모델 'GPT-5.6 솔' 프리뷰 공개...코딩·과학·보안 끌어올렸다...플래그십 솔·균형형 테라·경량 루나 3종 선보이며 역대 최강 안전장치 적용, 미국 정부와 조율해 신뢰 파트너에 우선 제공

오픈AI가 차세대 모델 'GPT-5.6 솔'을 제한 프리뷰로 공개했다.
[한국정보기술신문] 오픈AI(OpenAI)가 차세대 인공지능(AI) 모델 시리즈 'GPT-5.6'의 제한 프리뷰(미리보기)를 현지시간 6월 26일 시작했다고 자사 블로그를 통해 밝혔다. 회사는 이번 시리즈가 코딩과 과학, 사이버보안 등에서 성능을 크게 끌어올린 한편, 지금까지 가운데 가장 강력한 안전장치를 함께 적용했다고 설명했다. 프리뷰는 정식 출시에 앞서 일부 사용자에게 미리 제공해 성능과 안전성을 점검하는 단계를 말한다.
GPT-5.6 시리즈는 세 가지 모델로 이뤄진다. 가장 성능이 높은 대표 모델 '솔(Sol)', 일상적인 업무에 두루 쓰도록 성능과 비용의 균형을 맞춘 '테라(Terra)', 빠르고 저렴한 '루나(Luna)'다. 회사에 따르면 테라는 앞선 모델인 GPT-5.5와 견줄 만한 성능을 절반 가격에 제공하며, 루나는 가장 낮은 비용으로 쓸 만한 성능을 낸다.
숫자는 세대, 이름은 등급...새 작명 체계 도입
오픈AI는 GPT-5.6과 함께 새로운 작명 방식을 들여왔다. 앞에 붙는 숫자는 모델의 '세대'를 나타내고, 솔·테라·루나라는 이름은 성능·속도·비용에 따른 '등급'을 가리킨다. 등급은 세대와 별개로 각자의 속도에 맞춰 발전할 수 있다. 회사는 이 체계를 통해 사용자와 개발자가 지능과 속도, 비용 사이에서 더 분명하게 모델을 고를 수 있게 된다고 설명했다.
기능 면에서는 두 가지가 새로 들어갔다. 모델이 더 오래 깊이 생각하도록 하는 'max(맥스)' 추론 단계와, 하나의 AI가 처리하던 일을 여러 보조 AI(서브에이전트)로 나눠 복잡한 작업을 빠르게 끝내는 'ultra(울트라)' 방식이다. 서브에이전트는 큰 일을 잘게 쪼개 나눠 맡는 하위 AI를 뜻한다.
코딩·생물학·보안에서 성능 향상
오픈AI는 솔이 자사 모델 가운데 가장 강력하다며, 코딩과 생물학, 사이버보안 분야의 평가 결과 일부를 공개했다. 명령줄 작업의 계획·반복·도구 활용 능력을 재는 시험 '터미널-벤치 2.1'에서 솔은 새로운 최고 성능을 기록했다. 명령줄은 그림 대신 문자 명령으로 컴퓨터를 다루는 방식을 말한다. 또 유전체학 등 장시간 분석 능력을 평가하는 '진벤치(GeneBench) v1'에서는 GPT-5.5보다 적은 양의 처리 단위(토큰)를 쓰면서도 더 나은 결과를 냈다고 밝혔다. 토큰은 AI가 글을 잘게 나눠 처리하는 기본 단위로, 적게 쓸수록 비용과 시간이 줄어든다.
사이버보안 분야에서는 솔이 자사 역대 가장 뛰어난 모델이라고 회사는 강조했다. 보안 시험 '익스플로잇벤치(ExploitBench)'에서 솔은 비교 대상 모델과 대등한 성능을 약 3분의 1의 토큰만으로 냈고, 미국 버클리 캘리포니아대 연구진이 만든 '익스플로잇짐(ExploitGym)' 시험에서도 추론을 늘릴수록 세 모델 모두 사이버 역량이 뚜렷이 향상됐다고 밝혔다. 익스플로잇은 소프트웨어의 허점을 파고들어 공격하는 기법이나 그 도구를 가리킨다.
"공격보다 방어에 유용"...위험 임계선은 넘지 않아
오픈AI는 솔이 끝에서 끝까지(엔드 투 엔드) 공격을 스스로 수행하는 것보다, 사람이 취약점을 찾아내고 고치도록 돕는 데 더 능하다고 설명했다. 회사는 이 역량이 시스템의 약점을 찾고 보완하는 방어자에게 닿아 도움이 되도록 하는 것이 우선이라고 밝혔다.
회사는 솔이 자사 '준비성 프레임워크(Preparedness Framework)'에서 정한 '사이버 크리티컬(중대 위험)' 임계선을 넘지 않았다고 밝혔다. 준비성 프레임워크는 AI가 위험한 수준에 이르렀는지를 판단하는 자체 기준이다. 웹 브라우저 크로뮴(Chromium)과 파이어폭스(Firefox)를 대상으로 한 평가에서 솔은 버그와 공격에 쓰일 수 있는 기본 요소들은 찾아냈지만, 시험 조건에서 완전히 작동하는 공격 전체를 스스로 만들어 내지는 못했다는 것이다. 다만 회사는 시험 기준이 모델이 쓰일 모든 경우를 담아내지는 못한다며, 이런 불확실성과 큰 폭의 성능 향상 때문에 더 강한 안전장치와 단계적 공개를 함께 적용한다고 덧붙였다.
여러 겹으로 쌓은 안전장치
오픈AI는 하나의 안전장치만으로는 작정하고 덤비는 오남용을 막기 어렵다며, 여러 겹의 보호 장치를 두고 실제 공격 상황을 가정해 점검했다고 밝혔다. 우선 모델 자체가 금지된 사이버 공격 지원 요청을, 의도를 숨기거나 우회하려는 시도까지 포함해 거부하도록 학습됐다. 여기에 사이버·생물학 분야의 오남용을 실시간으로 가려내는 분류기가 더해져, 위험이 의심되면 생성을 잠시 멈추고 더 큰 추론 모델이 대화 맥락을 검토한다. 부적절하다고 판단되면 그 답변은 사용자에게 전달되기 전에 차단된다.
이상 징후가 발견되면 한 대화를 넘어 계정 단위로 폭넓게 살펴보는 검토도 이뤄진다. 회사는 이를 통해 지속적인 악의적 행위와, 비슷한 기술 개념이 등장하더라도 맥락이 다른 정당한 보안 연구를 구분할 수 있다고 설명했다. 다만 프리뷰 기간에는 정당한 작업까지 차단되거나 검토 때문에 응답이 늦어지는 경우가 생길 수 있으며, 이런 불편을 줄이는 것이 이번 프리뷰의 목적 가운데 하나라고 밝혔다.
AI로 AI 안전 점검...자동 레드티밍에 70만 GPU시간
오픈AI는 공격자가 수법을 바꿔도 안전장치가 버티도록, 자사 모델을 동원해 약점을 찾는 '자동 레드티밍'에 70만 A100 환산 GPU 시간 이상을 투입했다고 밝혔다. 레드티밍은 일부러 공격자 입장이 되어 시스템의 허점을 찾아내는 점검 방식을 말한다. 회사는 특정 상황에서만 통하는 공격이 아니라 여러 상황에 두루 먹히는 '범용 탈옥'을 집중적으로 찾았다고 설명했다. 탈옥(제일브레이크)은 AI의 안전장치를 우회해 금지된 답을 끌어내는 시도를 가리킨다. 이와 함께 외부 전문가가 참여하는 사람 주도 레드티밍도 병행했으며, 새로 발견된 탈옥은 빠르게 재현·평가해 보완한 뒤 이후 점검 항목에 추가한다고 밝혔다.
미국 정부와 조율...신뢰 파트너에 우선 제공
오픈AI는 폭넓은 접근을 지향한다며 세 모델을 몇 주 안에 일반에 공개할 계획이라고 밝혔다. 다만 이번에는 미국 정부와의 협의에 따라, 정부에 명단이 공유된 소수의 신뢰할 수 있는 파트너에게 먼저 제공하는 제한 프리뷰로 시작한다고 설명했다. 회사는 정식 출시에 앞서 정부에 모델의 역량과 계획을 미리 알렸다고 덧붙였다.
오픈AI는 이런 정부 접근 절차가 장기적인 기본 방식이 되어서는 안 된다는 입장도 분명히 했다. 이 절차가 그 도구를 필요로 하는 사용자와 개발자, 기업, 사이버 방어자, 해외 협력자에게서 최선의 도구를 멀어지게 한다는 것이다. 회사는 그럼에도 이번 조치가 몇 주 안에 더 넓은 공개로 가는 가장 확실한 길이라고 보고 단기적으로 택한 것이며, 미국 행정부와 사이버 관련 행정명령의 틀과 향후 모델 출시에 반복 적용할 절차를 함께 마련하고 있다고 밝혔다.
API·코덱스 우선...가격과 공급 일정
프리뷰 기간 GPT-5.6 모델은 우선 응용프로그램 인터페이스(API)와 코딩 도구 '코덱스(Codex)'를 통해 일부 파트너에게 제공된다. API는 한 프로그램이 다른 프로그램의 기능을 가져다 쓰도록 정해 둔 약속을 말한다. 이후 챗GPT와 코덱스, API에서 더 폭넓게 쓸 수 있게 할 계획이다.
가격은 100만 토큰을 기준으로 솔이 입력 5달러·출력 30달러, 테라가 입력 2.5달러·출력 15달러, 루나가 입력 1달러·출력 6달러로 책정됐다. 회사는 자주 쓰는 입력을 저장해 두는 '프롬프트 캐싱'도 더 예측 가능하게 바꿔, 저장한 내용을 다시 읽을 때는 90% 할인을 적용한다고 밝혔다. 아울러 7월에는 솔을 반도체 기업 세레브라스(Cerebras) 환경에서 초당 최대 750토큰 속도로 선보일 예정이라고 덧붙였다.
다만 이번 발표는 오픈AI가 자사 블로그를 통해 직접 알린 내용으로, 성능 수치는 회사가 자체 평가한 값이어서 제3자의 독립적인 검증을 거치지는 않았다. 회사도 전체 평가 결과는 모델을 일반에 공개할 때 더 자세히 내놓겠다고 밝힌 만큼, 실제 현장에서의 성능과 안전장치의 효과는 사용 사례가 쌓이면서 가려질 전망이다.
한국정보기술신문 인공지능분과 성연주 기자 news@kitpa.org











