엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

책상 위에서 1조 파라미터 AI 모델 돌리는 슈퍼컴퓨터가 윈도우에 온다

[한국정보기술신문] 엔비디아가 윈도우 환경에서 최대 1조 파라미터 규모의 첨단 인공지능(AI) 모델을 로컬에서 구동할 수 있는 데스크사이드 AI 슈퍼컴퓨터 'DGX 스테이션 포 윈도우(DGX Station for Windows)'를 공개했다. 엔비디아는 지난달 31일 대만에서 열린 'GTC 타이베이'에서 이 제품을 발표했으며, 올해 4분기 출시를 예고했다. 데스크사이드란 데이터센터가 아니라 사무실 책상 옆에 두고 쓰는 형태를 뜻한다.

엔비디아는 이 제품을 "AI 에이전트를 개발하고 구동하기 위한, 세계에서 가장 강력한 데스크사이드 AI 슈퍼컴퓨터"라고 소개했다. AI 에이전트는 사용자의 지시를 받아 스스로 추론하고 작업을 수행하는 소프트웨어를 말한다.

윈도우와 데이터센터급 AI의 간극을 메운다

그동안 학습, 미세조정, 대규모 추론 같은 무거운 기업용 AI 작업은 리눅스 기반의 데이터센터급 시스템에서 처리해야 했다. 반면 포춘 500대 기업의 대다수는 업무, 디자인, 엔지니어링 등 일상 작업에 윈도우를 사용한다. 두 환경이 분리돼 있어 기업이 AI를 실제 업무에 연결하기 어려웠다는 것이 엔비디아의 설명이다.

DGX 스테이션 포 윈도우는 엔비디아 'GB300 그레이스 블랙웰' 계열의 AI 인프라를 윈도우 생태계에 직접 들여온 첫 데스크사이드 슈퍼컴퓨터다. 엔비디아는 IT 팀이 기존 윈도우 인프라에 그대로 배포할 수 있어 새로운 그룹 정책이나 운영체제 변경, 업무 중단이 필요 없다고 강조했다.

크리스 매리엇 엔비디아 기업 플랫폼 담당 부사장은 "기업이 조직 전반에 AI 에이전트를 확대하면서, 업무를 떠받치는 애플리케이션과 워크플로에 직접 연결되는 AI 인프라가 필요해졌다"며 "DGX 스테이션은 수백만 명이 매일 설계하고 연구하고 창작하는 윈도우 환경에 슈퍼컴퓨팅급 AI를 직접 제공한다"고 말했다.

이번 제품은 마이크로소프트와의 협력으로 개발됐다. 파반 다불루리 마이크로소프트 윈도우 및 디바이스 담당 부사장은 "수십 년간 마이크로소프트와 엔비디아는 세계에서 가장 강력한 컴퓨팅 플랫폼을 함께 발전시켜 왔다"며 "GB300 기반 DGX 스테이션으로 윈도우의 성능을 얇고 가벼운 PC부터 데이터센터급 워크스테이션까지 확장하게 됐다"고 밝혔다.

748GB 통합 메모리에 20페타플롭스 성능

DGX 스테이션의 핵심은 'GB300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩'이다. 이 칩은 블랙웰 울트라 GPU와 72코어 그레이스 CPU를 엔비디아의 'NV링크-C2C' 인터커넥트로 연결해 시스템 간 통신과 성능을 끌어올렸다. 두 프로세서는 초당 900기가바이트(GB/s)의 대역폭으로 데이터를 주고받는다. 페타플롭스는 1초에 1000조 번 연산을 수행하는 단위를 가리킨다.

메모리는 GPU용 252GB(HBM3e)와 CPU용 496GB(LPDDR5X)를 합쳐 최대 748GB의 통합 메모리를 제공한다. 이 단일 메모리 풀 덕분에 기존 CPU·GPU 시스템의 병목 없이 1조 파라미터 규모의 모델을 효율적으로 구동할 수 있다는 설명이다. 연산 성능은 FP4 기준 최대 20페타플롭스, 시스템 총 전력은 1600와트(W)다.

여기에 'RTX PRO 6000 블랙웰 워크스테이션 GPU'를 한 개까지 추가하면 첨단 AI 연산과 광선 추적 기반 시각화·시뮬레이션을 함께 처리할 수 있다. 네트워크에는 'ConnectX-8 슈퍼NIC'를 탑재해 최대 초당 800기가비트(Gb/s)의 속도를 지원하며, 여러 대의 DGX 스테이션을 빠르게 연결해 더 큰 작업을 처리할 수 있다.

수백 개 에이전트 동시 구동...보안은 '오픈셸'로

엔비디아는 기업용 AI가 단순한 챗봇 대화에서, 실시간으로 추론하며 끊김 없이 작동하는 '에이전틱 추론'으로 진화하고 있다고 진단했다. DGX 스테이션은 최대 1조 파라미터 모델을 지원하며, 수백 개의 에이전트가 동시에 작업을 수행하도록 구동할 수 있다. 토큰 생성을 로컬에서 처리해 클라우드 사용 비용을 줄이는 효과도 있다.

보안 측면에서는 오픈소스 런타임 '엔비디아 오픈셸(OpenShell)'을 지원한다. 오픈셸은 윈도우의 보안·격리 기능을 토대로 에이전트마다 독립된 격리 공간(샌드박스)을 만들고, 애플리케이션 단계의 작업과 인프라 단계의 정책 집행을 분리한다. 엔비디아는 이 방식이 행동을 유도하는 시스템 프롬프트에 의존하는 대신, 에이전트가 실행되는 환경 자체에 제약을 적용한다고 설명했다. 이를 통해 에이전트가 정책을 무력화하거나 자격 증명, 개인정보를 유출하지 못하도록 막는다는 것이다.

기업 관리 기능도 갖췄다. 별도 관리 칩(BMC)을 통한 원격 점검과 모니터링, 하드웨어 기반 신뢰점(root of trust), 보안 부팅 기능으로 IT 팀이 다수의 시스템을 안전하게 관리할 수 있다. 리눅스 작업은 '윈도우 서브시스템 포 리눅스(WSL)'를 통해 동일한 수준으로 관리되며, 기존 마이크로소프트 도구로 에이전트 배포와 운영을 다룰 수 있다.

리눅스 기반 'DGX 스테이션'도 나란히

엔비디아는 같은 GB300 슈퍼칩을 쓰되 우분투(리눅스) 운영체제를 탑재한 기존 'DGX 스테이션'도 함께 제공한다. 이 제품은 'NVIDIA AI 개발자 도구'와 'CUDA-X' 라이브러리가 미리 설치돼 있어, 개발자와 연구자, 데이터 과학자가 곧바로 대형 모델을 개발·미세조정·추론할 수 있다. 이번에 발표된 윈도우 버전은 같은 성능을 윈도우 사용자에게도 열어주는 셈이다.

우분투 버전은 한 장의 GPU를 최대 7개의 독립된 인스턴스로 나누는 'MIG' 기술을 지원한다. 이를 통해 한 명의 전용 데스크톱으로도, 여러 팀원이 공유하는 연산 노드로도 활용할 수 있다. 두 버전 모두 작업 부하를 데이터센터나 클라우드의 GB300으로 자연스럽게 확장할 수 있다.

5대 워크플로 겨냥...연말 6개사 통해 출시

DGX 스테이션 포 윈도우는 ▲AI 에이전트 ▲AI 개발 ▲데이터 과학 ▲AI 추론 ▲피지컬 AI 등 기업용 AI 작업 전반을 겨냥한다. 데이터 과학에서는 최대 748GB의 통합 메모리에 대용량 데이터를 올려 데이터 이동에 따른 병목을 줄인다. 피지컬 AI 분야에서는 GB300 슈퍼칩에 RTX PRO GPU를 결합해, 로봇이나 자율주행처럼 현실 세계에서 동작하는 AI를 학습·시뮬레이션·시각화하는 데 필요한 성능을 한 대로 제공한다.

엔비디아와 마이크로소프트는 첨단 에이전트뿐 아니라 슬림한 노트북과 소형 PC를 겨냥한 '엔비디아 RTX 스파크(RTX Spark)'까지 윈도우용 AI 제품군을 넓히고 있다. DGX 스테이션 포 윈도우는 에이수스, 델 테크놀로지스, 기가바이트, HP, MSI, 슈퍼마이크로 등 6개 제조사를 통해 올해 4분기 공급될 예정이다. AI 연산이 데이터센터를 넘어 개인 책상으로 내려오는 흐름이 본격화할지 주목된다.

한국정보기술신문 인공지능분과 박연호 기자 news@kitpa.org