엔비디아, 'AI 팩토리'에 투자 자본 끌어들인다...대규모 컴퓨팅 자원 개방 새 전략 공개
엔비디아가 AI 컴퓨팅 자원을 개방하는 새 사업 모델을 내놨다.
[한국정보기술신문] 그래픽처리장치(GPU) 기업 엔비디아(NVIDIA)가 인공지능(AI) 연산에 필요한 대규모 컴퓨팅 자원을 더 많은 기업이 쓸 수 있도록 개방하는 새로운 사업 전략을 공개했다. 엔비디아는 현지시간 7월 1일 공식 블로그를 통해, AI 서비스를 제공하는 클라우드 기업들과 손잡고 대규모 'AI 팩토리(AI factory)'를 세우되, 거기서 나오는 수익을 나누고 자금 조달에 필요한 신용을 뒷받침해 주는 방식으로 서로의 이해관계를 맞추겠다고 밝혔다. 이 글은 콜레트 크레스(Colette Kress) 엔비디아 최고재무책임자(CFO)와 라지 미르푸리(Raj Mirpuri)가 함께 썼다. AI 팩토리란 공장이 물건을 찍어 내듯 AI가 답변·이미지 같은 결과물을 대량으로 만들어 내도록 설계된 대규모 데이터센터를 가리키는 말이다.

"모델 만들기에서 서비스 운영으로"...AI 연산 수요 급증
엔비디아는 이번 전략의 배경으로 AI 산업의 무게중심이 옮겨 가고 있는 점을 들었다. AI가 새 모델을 만들어 내는 개발 단계를 지나, 실제 이용자에게 답을 내놓는 서비스 운영 단계로 넘어가면서 필요한 연산량이 빠르게 늘고 있다는 것이다. 이용자의 질문에 AI가 답을 만들어 내는 과정을 '추론(inference)'이라고 하는데, 이 추론이 쉴 새 없이 돌아가려면 상시 가동되는 대규모 컴퓨팅 시설이 있어야 한다. 엔비디아는 이런 시설이 이른바 '토큰(token)'을 대량으로 생산한다고 설명했다. 토큰은 AI가 글이나 답변을 만들어 낼 때 처리하는 최소 단위로, AI 서비스의 사용량과 비용을 재는 기준으로 쓰인다.
문제는 이런 대규모 시설을 갖추는 데 막대한 자본이 든다는 점이다. 엔비디아는 새로 생겨나는 AI 기업들이 그동안 이처럼 자본이 많이 드는 인프라에 접근하기 어려웠다고 짚었다. 오랜 기간 쓰겠다는 장기 계약을 맺더라도, 그것만으로는 컴퓨팅 시설을 짓는 데 필요한 자금을 끌어오기가 쉽지 않았다는 것이다. 이 때문에 유망한 기술을 가진 스타트업이나 연구 조직이 정작 이를 구현할 연산 자원을 확보하지 못하는 상황이 벌어졌다는 설명이다.
GPU 인프라 열어 주고 수익 나눠...엔비디아엔 '반복 매출'
엔비디아가 내놓은 해법은 자사의 대규모 인프라를 AI 클라우드 기업에 열어 주는 대신, 수익 배분과 신용 지원으로 위험과 이익을 함께 나누는 구조다. AI 클라우드 기업은 엔비디아의 'DSX AI 팩토리'를 통해 클라우드 서비스를 만들어 고객에게 판매한다. DSX는 엔비디아가 제시하는 AI 팩토리 설계 방식으로, 클라우드 기업이 이 방식에 맞춰 대규모 연산 시설을 짓는 형태다. 여기서 나온 사용료 수익을 엔비디아와 클라우드 기업이 나눠 갖고, 엔비디아는 시설 구축에 필요한 자금 조달을 신용으로 뒷받침한다.
엔비디아는 이 모델이 세 방향으로 이득이 된다고 설명했다. 우선 고객들 사이에서 엔비디아 플랫폼의 도입이 빨라지고, 클라우드 기업은 큰돈을 미리 들이지 않고도 규모를 키울 수 있는 자본 효율적인 길을 얻는다. 엔비디아로서는 기기를 한 번 팔고 끝나는 것이 아니라, 실제 사용량에 연동돼 꾸준히 들어오는 새로운 반복 매출원을 확보하게 된다.
컴퓨팅 자원을 쓰려는 기업 입장에서도 이점이 있다. 모델을 만드는 기업이나 추론 서비스 제공사, AI가 스스로 작업을 수행하는 '에이전트' 플랫폼, AI를 확장하려는 일반 기업은 부지 선정과 전력 조달, 건설, 하드웨어 설치 같은 오랜 준비 과정을 거치지 않고도 완비된 형태의 가속 컴퓨팅 자원을 비교적 빠르게 확보할 수 있다는 것이다. 가속 컴퓨팅은 일반 중앙처리장치(CPU)만으로 처리하기 어려운 대규모 연산을 GPU 같은 전용 장치로 빠르게 처리하는 방식을 말한다.
첫 파트너로 샤론AI·퍼머스...최대 17만 GPU 규모까지
이 전략은 이미 실제 사업으로 이어지고 있다. 엔비디아는 여러 AI 클라우드 기업이 지역과 작업 성격에 맞춰 DSX AI 팩토리를 짓고 있다고 밝혔다. 이 가운데 샤론AI(Sharon AI)와 퍼머스(Firmus)가 이번 전략에 처음으로 참여하는 기업으로 이름을 올렸다.
샤론AI는 엔비디아의 '그레이스 블랙웰 GB300(Grace Blackwell GB300)' GPU를 최대 4만 장까지 도입할 계획이다. 그레이스 블랙웰은 엔비디아의 고성능 AI 연산용 반도체 계열이다. 샤론AI 공동창업자 겸 최고경영자(CEO) 제임스 매닝(James Manning)은 "엔비디아와의 이번 협력은 주권적이고 대규모인 AI 컴퓨팅 인프라를 제공하겠다는 샤론AI의 사명에서 중요한 전환점"이라고 밝혔다. 여기서 '주권적'이라는 표현은 특정 국가나 기업이 외부에 의존하지 않고 자체적으로 통제하는 컴퓨팅 자원을 뜻한다.
퍼머스는 인도네시아 바탐(Batam)에 DSX AI 팩토리 단지를 짓고 있다. 이 단지는 최대 360메가와트(㎿) 규모의 전력을 쓰며 엔비디아 GPU를 최대 17만 장까지 갖출 것으로 예상된다. 메가와트는 시설이 한꺼번에 쓰는 전력의 크기를 나타내는 단위로, 데이터센터의 규모를 가늠하는 기준으로 쓰인다. 퍼머스 테크놀로지스(Firmus Technologies) 공동 CEO 팀 로젠필드(Tim Rosenfield)는 AI 기반 기업들이 세계 시장에서 경쟁하려면 규모를 키울 수 있고 에너지·비용 효율이 높은 컴퓨팅 인프라가 필요하다며, 자사가 엔비디아 DSX 방식에 맞춘 AI 팩토리를 지어 더 많은 고객이 필요한 연산 자원을 확보하도록 돕겠다고 말했다.
엔비디아는 컴퓨팅 수요가 어디로 향하는지 보여 주는 사례로 베이스텐(Baseten)과 파이어웍스AI(Fireworks AI), 투게더AI(Together AI) 같은 이른바 'AI 네이티브' 기업을 꼽았다. AI 네이티브는 사업 자체가 AI를 중심으로 세워진 기업을 말한다. 엔비디아에 따르면 이들은 모델을 학습시키고 추가로 다듬으며(사후 학습·미세 조정), 대량의 에이전트 추론을 돌리기 위해 AI 클라우드 자원에 즉시 접근할 수 있어야 한다. 또 이들의 고객은 사용량이 늘어남에 따라 대규모 연산 자원을 안정적으로 쓸 수 있어야 하고, 서비스가 시험 단계에서 정식 운영으로 넘어갈 때 계약 조건을 유연하게 조정할 수 있어야 한다는 것이 엔비디아의 설명이다.
남는 과제
이번 발표는 엔비디아가 자사 블로그를 통해 직접 알린 내용으로, 새 모델의 취지와 기대 효과에 무게가 실려 있다는 점은 감안할 대목이다. 최대 4만 장, 17만 장, 360메가와트 같은 규모 수치는 모두 엔비디아와 참여 기업이 제시한 계획상의 수치여서, 실제로 얼마나 구축돼 가동될지는 앞으로 사업이 진행되면서 가려질 전망이다. 특히 이번 구조의 핵심인 수익 배분의 비율이나 신용 지원의 구체적인 방식, 위험을 누가 어디까지 떠안는지 등 세부 조건은 이번 발표에서 공개되지 않았다. AI 반도체를 만드는 엔비디아가 자사 장비를 사들이는 클라우드 기업의 자금 조달까지 뒷받침하는 방식은, 매출을 스스로 떠받치는 것 아니냐는 시각을 부를 수 있어 조건이 투명하게 공개될 필요가 있다는 지적도 나올 수 있다. 결국 이 전략의 성패는 대규모 AI 팩토리가 계획대로 지어져 실제 사용량과 수익으로 이어지는지, 그리고 참여 기업과 엔비디아가 위험을 어떻게 나누는지에 달려 있는 셈이다.
한국정보기술신문 클라우드분과 유민건 기자 news@kitpa.org











