한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 · 클라우드 ·

OpenAI, 5년 만에 오픈소스 AI 모델 'GPT OSS' 공개, 120억·20억 파라미터 2종 출시…무료 다운로드 및 상업적 이용 허용

발행일
읽는 시간2분 22초

OpenAI가 5년 만에 선보인 오픈소스 AI 모델 GPT OSS의 기술적 혁신을 보여주는 개념도

OpenAI가 5년 만에 오픈소스 AI 모델 'gpt-oss-120b'와 'gpt-oss-20b'를 출시했다고 발표했다. 이번 출시는 2019년 GPT-2 이후 OpenAI의 첫 번째 오픈 언어 모델로, 회사의 오픈소스 커뮤니티 복귀를 의미한다.

두 가지 모델의 차별화된 성능

image.png
OpenAI 제공

gpt-oss-120b는 117억 개의 총 파라미터를 보유하고 있으며, 토큰당 51억 개의 파라미터만 활성화되는 혼합 전문가(MoE) 구조를 채택했다. 이 모델은 단일 엔비디아 H100 GPU에서 실행 가능하며, OpenAI의 유료 모델인 o4-mini와 비교할 만한 성능을 보인다.

더 작은 모델인 gpt-oss-20b는 21억 개의 총 파라미터를 가지고 있으며, 토큰당 36억 개의 파라미터를 활성화한다. 이 모델은 16GB 메모리만으로도 실행 가능하여 일반 소비자용 하드웨어나 엣지 디바이스에서의 사용에 최적화되어 있다.

성능 벤치마크에서 경쟁 모델 압도

chart.png
OpenAI 제공

경쟁 코딩 테스트인 Codeforces에서 gpt-oss-120b와 gpt-oss-20b는 각각 2622점과 2516점을 기록하며 DeepSeek의 R1 모델을 능가했다. Humanity's Last Exam(HLE) 테스트에서도 gpt-oss-120b는 19%, gpt-oss-20b는 17.3%의 점수를 얻어 주요 오픈 모델들을 뛰어넘었다.

chart (1).png
OpenAI 제공

수학 경시대회(AIME 2024 & 2025), 일반 문제 해결(MMLU, HLE), 에이전트 평가(TauBench), 건강 관련 평가(HealthBench) 등 다양한 벤치마크에서 우수한 성과를 보였다.

완전한 상업적 자유 보장

두 모델 모두 Apache 2.0 라이선스 하에 배포되어 개발자들이 제한 없이 실험, 커스터마이징, 상업적 배포가 가능하다. 이는 중국 경쟁업체들과 마찬가지로 어떤 소비자, 개발자, 기업이든 모델을 무료로 다운로드하고 자신의 필요에 맞게 파인튜닝할 수 있음을 의미한다.

주요 클라우드 업체들의 즉시 지원

아마존 웹 서비스(AWS)는 Amazon Bedrock과 Amazon SageMaker AI를 통해 gpt-oss 모델을 제공한다고 발표했다. 마이크로소프트도 새로운 Azure AI Foundry Local 플랫폼을 통해 Windows PC에서 직접 gpt-oss 모델을 실행할 수 있도록 지원한다.

허깅 페이스(Hugging Face)를 비롯해 Azure, AWS, Databricks, Cloudflare, Vercel, Together AI, OpenRouter 등 주요 배포 플랫폼에서 사전 구축된 지원을 제공한다.

하드웨어 파트너십 확대

엔비디아, AMD, Cerebras 등 주요 하드웨어 파트너들이 gpt-oss 모델을 지원한다. 엔비디아 CEO 젠슨 황은 "OpenAI가 엔비디아 AI로 무엇을 구축할 수 있는지 세계에 보여줬고, 이제 오픈소스 소프트웨어의 혁신을 앞당기고 있다"고 평가했다.

강화된 안전성 평가 시스템

image.png
HuggingFace 캡처

OpenAI는 gpt-oss 모델에 대해 광범위한 안전 훈련과 평가를 실시했으며, 특히 gpt-oss-120b에 대해서는 적대적 파인튜닝 버전을 테스트했다. OpenAI의 안전 자문 그룹(SAG)은 강력한 파인튜닝을 통해서도 생물학적·화학적 위험이나 사이버 위험 분야에서 높은 능력 수준에 도달하지 않았다고 결론내렸다.

OpenAI는 Kaggle에서 50만 달러 규모의 레드팀 챌린지를 개최하여 연구자와 개발자들이 gpt-oss의 한계를 탐구하고 새로운 오남용 경로를 식별하도록 초청했다.

환각 현상의 한계

그러나 gpt-oss 모델들은 OpenAI의 최신 추론 모델들보다 상당히 높은 환각률을 보였다. PersonQA 벤치마크에서 gpt-oss-120b와 gpt-oss-20b는 각각 49%와 53%의 질문에 대해 환각을 보인 반면, o1 모델은 16%, o4-mini 모델은 36%였다.

이번 출시는 DeepSeek, 알리바바의 Qwen, 문샷 AI 등 중국 AI 연구소들이 세계에서 가장 유능하고 인기 있는 오픈 모델들을 개발하면서 증가하는 압력에 대한 OpenAI의 대응으로 해석된다. OpenAI CEO 샘 알트만은 이전에 오픈소스 기술에 대해 "역사의 잘못된 편"에 있었다고 인정한 바 있다.

이 모델들은 고급 추론 능력으로 인해 AI 에이전트 활용 사례에 특히 적합하며, 기업들의 비즈니스 수행 방식을 변화시킬 것으로 예상된다. AI 스웨덴, 오렌지, 스노우플레이크 등 초기 채택 기업들은 이미 지역화된 파인튜닝부터 보안 온프레미스 사용 사례에 이르기까지 다양한 배포를 탐구하고 있다.

한국정보기술신문 블록체인분과 김유빈 기자 news@kitpa.org