한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

책상 위에서 1조 파라미터 AI 모델 돌리는 슈퍼컴퓨터가 윈도우에 온다
제목 없음-2.png
NVIDIA 제공
[한국정보기술신문] 엔비디아가 윈도우 환경에서 최대 1조 파라미터 규모의 첨단 인공지능(AI) 모델을 로컬에서 구동할 수 있는 데스크사이드 AI 슈퍼컴퓨터 'DGX 스테이션 포 윈도우(DGX Station for Windows)'를 공개했다. 엔비디아는 지난달 31일 대만에서 열린 'GTC 타이베이'에서 이 제품을 발표했으며, 올해 4분기 출시를 예고했다. 데스크사이드란 데이터센터가 아니라 사무실 책상 옆에 두고 쓰는 형태를 뜻한다.
엔비디아는 이 제품을 "AI 에이전트를 개발하고 구동하기 위한, 세계에서 가장 강력한 데스크사이드 AI 슈퍼컴퓨터"라고 소개했다. AI 에이전트는 사용자의 지시를 받아 스스로 추론하고 작업을 수행하는 소프트웨어를 말한다.

윈도우와 데이터센터급 AI의 간극을 메운다

그동안 학습, 미세조정, 대규모 추론 같은 무거운 기업용 AI 작업은 리눅스 기반의 데이터센터급 시스템에서 처리해야 했다. 반면 포춘 500대 기업의 대다수는 업무, 디자인, 엔지니어링 등 일상 작업에 윈도우를 사용한다. 두 환경이 분리돼 있어 기업이 AI를 실제 업무에 연결하기 어려웠다는 것이 엔비디아의 설명이다.
DGX 스테이션 포 윈도우는 엔비디아 'GB300 그레이스 블랙웰' 계열의 AI 인프라를 윈도우 생태계에 직접 들여온 첫 데스크사이드 슈퍼컴퓨터다. 엔비디아는 IT 팀이 기존 윈도우 인프라에 그대로 배포할 수 있어 새로운 그룹 정책이나 운영체제 변경, 업무 중단이 필요 없다고 강조했다.
크리스 매리엇 엔비디아 기업 플랫폼 담당 부사장은 "기업이 조직 전반에 AI 에이전트를 확대하면서, 업무를 떠받치는 애플리케이션과 워크플로에 직접 연결되는 AI 인프라가 필요해졌다"며 "DGX 스테이션은 수백만 명이 매일 설계하고 연구하고 창작하는 윈도우 환경에 슈퍼컴퓨팅급 AI를 직접 제공한다"고 말했다.
이번 제품은 마이크로소프트와의 협력으로 개발됐다. 파반 다불루리 마이크로소프트 윈도우 및 디바이스 담당 부사장은 "수십 년간 마이크로소프트와 엔비디아는 세계에서 가장 강력한 컴퓨팅 플랫폼을 함께 발전시켜 왔다"며 "GB300 기반 DGX 스테이션으로 윈도우의 성능을 얇고 가벼운 PC부터 데이터센터급 워크스테이션까지 확장하게 됐다"고 밝혔다.

748GB 통합 메모리에 20페타플롭스 성능

DGX 스테이션의 핵심은 'GB300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩'이다. 이 칩은 블랙웰 울트라 GPU와 72코어 그레이스 CPU를 엔비디아의 'NV링크-C2C' 인터커넥트로 연결해 시스템 간 통신과 성능을 끌어올렸다. 두 프로세서는 초당 900기가바이트(GB/s)의 대역폭으로 데이터를 주고받는다. 페타플롭스는 1초에 1000조 번 연산을 수행하는 단위를 가리킨다.
메모리는 GPU용 252GB(HBM3e)와 CPU용 496GB(LPDDR5X)를 합쳐 최대 748GB의 통합 메모리를 제공한다. 이 단일 메모리 풀 덕분에 기존 CPU·GPU 시스템의 병목 없이 1조 파라미터 규모의 모델을 효율적으로 구동할 수 있다는 설명이다. 연산 성능은 FP4 기준 최대 20페타플롭스, 시스템 총 전력은 1600와트(W)다.
여기에 'RTX PRO 6000 블랙웰 워크스테이션 GPU'를 한 개까지 추가하면 첨단 AI 연산과 광선 추적 기반 시각화·시뮬레이션을 함께 처리할 수 있다. 네트워크에는 'ConnectX-8 슈퍼NIC'를 탑재해 최대 초당 800기가비트(Gb/s)의 속도를 지원하며, 여러 대의 DGX 스테이션을 빠르게 연결해 더 큰 작업을 처리할 수 있다.

수백 개 에이전트 동시 구동...보안은 '오픈셸'로

엔비디아는 기업용 AI가 단순한 챗봇 대화에서, 실시간으로 추론하며 끊김 없이 작동하는 '에이전틱 추론'으로 진화하고 있다고 진단했다. DGX 스테이션은 최대 1조 파라미터 모델을 지원하며, 수백 개의 에이전트가 동시에 작업을 수행하도록 구동할 수 있다. 토큰 생성을 로컬에서 처리해 클라우드 사용 비용을 줄이는 효과도 있다.
보안 측면에서는 오픈소스 런타임 '엔비디아 오픈셸(OpenShell)'을 지원한다. 오픈셸은 윈도우의 보안·격리 기능을 토대로 에이전트마다 독립된 격리 공간(샌드박스)을 만들고, 애플리케이션 단계의 작업과 인프라 단계의 정책 집행을 분리한다. 엔비디아는 이 방식이 행동을 유도하는 시스템 프롬프트에 의존하는 대신, 에이전트가 실행되는 환경 자체에 제약을 적용한다고 설명했다. 이를 통해 에이전트가 정책을 무력화하거나 자격 증명, 개인정보를 유출하지 못하도록 막는다는 것이다.
기업 관리 기능도 갖췄다. 별도 관리 칩(BMC)을 통한 원격 점검과 모니터링, 하드웨어 기반 신뢰점(root of trust), 보안 부팅 기능으로 IT 팀이 다수의 시스템을 안전하게 관리할 수 있다. 리눅스 작업은 '윈도우 서브시스템 포 리눅스(WSL)'를 통해 동일한 수준으로 관리되며, 기존 마이크로소프트 도구로 에이전트 배포와 운영을 다룰 수 있다.

리눅스 기반 'DGX 스테이션'도 나란히

엔비디아는 같은 GB300 슈퍼칩을 쓰되 우분투(리눅스) 운영체제를 탑재한 기존 'DGX 스테이션'도 함께 제공한다. 이 제품은 'NVIDIA AI 개발자 도구'와 'CUDA-X' 라이브러리가 미리 설치돼 있어, 개발자와 연구자, 데이터 과학자가 곧바로 대형 모델을 개발·미세조정·추론할 수 있다. 이번에 발표된 윈도우 버전은 같은 성능을 윈도우 사용자에게도 열어주는 셈이다.
우분투 버전은 한 장의 GPU를 최대 7개의 독립된 인스턴스로 나누는 'MIG' 기술을 지원한다. 이를 통해 한 명의 전용 데스크톱으로도, 여러 팀원이 공유하는 연산 노드로도 활용할 수 있다. 두 버전 모두 작업 부하를 데이터센터나 클라우드의 GB300으로 자연스럽게 확장할 수 있다.

5대 워크플로 겨냥...연말 6개사 통해 출시

DGX 스테이션 포 윈도우는 ▲AI 에이전트 ▲AI 개발 ▲데이터 과학 ▲AI 추론 ▲피지컬 AI 등 기업용 AI 작업 전반을 겨냥한다. 데이터 과학에서는 최대 748GB의 통합 메모리에 대용량 데이터를 올려 데이터 이동에 따른 병목을 줄인다. 피지컬 AI 분야에서는 GB300 슈퍼칩에 RTX PRO GPU를 결합해, 로봇이나 자율주행처럼 현실 세계에서 동작하는 AI를 학습·시뮬레이션·시각화하는 데 필요한 성능을 한 대로 제공한다.
엔비디아와 마이크로소프트는 첨단 에이전트뿐 아니라 슬림한 노트북과 소형 PC를 겨냥한 '엔비디아 RTX 스파크(RTX Spark)'까지 윈도우용 AI 제품군을 넓히고 있다. DGX 스테이션 포 윈도우는 에이수스, 델 테크놀로지스, 기가바이트, HP, MSI, 슈퍼마이크로 등 6개 제조사를 통해 올해 4분기 공급될 예정이다. AI 연산이 데이터센터를 넘어 개인 책상으로 내려오는 흐름이 본격화할지 주목된다.
한국정보기술신문 인공지능분과 박연호 기자 news@kitpa.org

함께 읽으면 좋은 기사

하와이 마우나로아 5월 평균 CO2 432.34ppm '역대 최고'...전년比 1.83ppm 상승, 최근 3년 기록적 급증세는 다소 꺾여

하와이 마우나로아 5월 평균 CO2 432.34ppm '역대 최고'...전년比 1.83ppm 상승, 최근 3년 기록적 급증세는 다소 꺾여

학제간융합 4
CU 편의점 택배 BGF네트웍스 해킹, 고객 개인정보 무더기 유출...웹 취약점 뚫려 연계정보(CI)까지 노출, 크리덴셜 스터핑 2차 피해 우려

CU 편의점 택배 BGF네트웍스 해킹, 고객 개인정보 무더기 유출...웹 취약점 뚫려 연계정보(CI)까지 노출, 크리덴셜 스터핑 2차 피해 우려

정보보안 3
칙센트미하이 몰입 이론, 도전과 역량 균형 이룰 때 최고의 행복 경험...몰입 위한 8가지 조건 제시

칙센트미하이 몰입 이론, 도전과 역량 균형 이룰 때 최고의 행복 경험...몰입 위한 8가지 조건 제시

교육 3
무료 인증서기관 '렛츠인크립트', 양자내성 웹 보안 전환 청사진 공개...'머클트리 인증서'로 접속 데이터 안 늘리고 양자 위협 대비, 2027년 정식 도입 목표

무료 인증서기관 '렛츠인크립트', 양자내성 웹 보안 전환 청사진 공개...'머클트리 인증서'로 접속 데이터 안 늘리고 양자 위협 대비, 2027년 정식 도입 목표

인공지능 · 정보보안 4
구글, 노트북서 구동되는 멀티모달 AI '젬마 4 12B' 공개...인코더 없는 통합 구조로 음성·이미지 직접 처리

구글, 노트북서 구동되는 멀티모달 AI '젬마 4 12B' 공개...인코더 없는 통합 구조로 음성·이미지 직접 처리

인공지능 2
UC버클리 컴퓨터과학 수업서 낙제율 급등...교수들 "AI 과의존·수학 기초 부족이 원인"...CS 10 낙제 35%로 학과 기준 5배, 한 강의는 AI·인터넷 허용 시험까지

UC버클리 컴퓨터과학 수업서 낙제율 급등...교수들 "AI 과의존·수학 기초 부족이 원인"...CS 10 낙제 35%로 학과 기준 5배, 한 강의는 AI·인터넷 허용 시험까지

교육 · 인공지능 4
프로그래밍 언어 '엘릭서' 1.20 공개...타입 표기 없이도 모든 코드 자동 검사해 '확정 버그' 잡아낸다...개발자가 따로 손댈 일 없이 오탐도 적어, 4년 연구의 첫 결실

프로그래밍 언어 '엘릭서' 1.20 공개...타입 표기 없이도 모든 코드 자동 검사해 '확정 버그' 잡아낸다...개발자가 따로 손댈 일 없이 오탐도 적어, 4년 연구의 첫 결실

정보기술 4
호주 연구진, 격자 지도 경로 탐색 'A*' 최대 수십 배 빠르게 하는 '점프 포인트' 기법 발표...최적 경로 보장하면서 사전 작업도 추가 메모리도 필요 없어

호주 연구진, 격자 지도 경로 탐색 'A*' 최대 수십 배 빠르게 하는 '점프 포인트' 기법 발표...최적 경로 보장하면서 사전 작업도 추가 메모리도 필요 없어

인공지능 5
한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

인공지능 · 오피니언 4
마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

인공지능 3
게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

인공지능 2
정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

인공지능 · 반도체 · 유관기관 3