구글, 메타에 '제미나이' 공급 제한...AI 연산력 부족이 발목 잡았다...메타가 요청한 용량 다 못 채워 내부 AI 프로젝트 차질, 직원엔 토큰 절약 지시에 자체 모델 '뮤즈 스파크' 전환 가속
구글이 연산 능력 부족으로 메타의 제미나이 사용을 제한했다.
[한국정보기술신문] 구글(Google)이 경쟁사인 메타(Meta)의 자사 인공지능(AI) 모델 '제미나이(Gemini)' 사용에 제한을 걸었다. 영국 경제지 파이낸셜타임스(FT)는 현지시간 6월 28일, 메타가 구글이 제공할 수 있는 것보다 더 많은 컴퓨팅 용량을 요구하자 구글이 제미나이 사용을 제한했다고 보도했다. 컴퓨팅 용량이란 AI 모델을 작동시키는 데 필요한 연산 처리 능력을 말한다. FT에 따르면 알파벳(Alphabet)의 자회사인 구글은 지난 3월경 메타에 구매를 원하는 제미나이 용량을 다 채워 줄 수 없다고 통보했고, 이로 인해 메타의 일부 내부 AI 프로젝트가 차질을 빚거나 지연됐다.
구글의 이번 제한이 메타에만 국한된 것은 아니다. FT는 사정에 밝은 세 명의 관계자를 인용해, 다른 여러 구글 고객사도 같은 영향을 받았으나 그 정도는 메타보다 덜했다고 전했다. 메타가 유독 큰 타격을 입은 것은 구글 모델에 대한 수요가 다른 고객사보다 훨씬 컸기 때문이라는 설명이다. 다만 통신사 로이터(Reuters)는 익명의 관계자를 인용한 이 보도 내용을 곧바로 확인하지는 못했다고 밝혔으며, 구글과 메타는 영업시간 외 입장 요청에 즉시 답하지 않았다.

메타, 직원에 "토큰 아껴 써라" 지시
사용 제한에 따라 메타는 직원들에게 AI '토큰(token)'을 더 효율적으로 쓰라고 당부한 것으로 전해졌다. 토큰은 AI가 처리하는 데이터의 양을 재는 단위로, 사용량이 많을수록 그만큼 더 많은 연산 자원과 비용이 든다. 쓸 수 있는 용량이 줄어들자, 같은 자원으로 더 많은 일을 처리하도록 토큰을 절약하라고 주문한 셈이다. 이는 돈을 더 낸다고 해서 곧바로 더 많은 연산 능력을 살 수 있는 상황이 아니라는 점을 보여 준다. 칩과 데이터센터 공급이 폭증하는 수요를 따라가지 못하면서, 세계적 규모의 기업조차 이미 확보한 자원을 더 알뜰하게 쓰는 쪽으로 방향을 틀고 있는 것이다. 토큰을 아껴 쓰라는 주문은 그런 압박이 일선 엔지니어의 일상 업무에까지 미쳤음을 보여 주는 단면이다.
메타가 구글의 모델에 기대 온 데는 이유가 있다. 메타는 당초 유해 콘텐츠를 걸러 내고 사기성 게시물을 차단하는 등 안전 관련 작업을 자동화하는 데 제미나이를 활용해 왔다. 제미나이가 메타의 자체 공개 모델인 '라마(Llama)'보다 이 작업에서 더 나은 성능을 보였기 때문이다. 라마는 메타가 소스 코드를 공개해 누구나 내려받아 쓸 수 있도록 한 오픈소스 AI 모델을 말한다.
경쟁사 의존 줄이려...자체 모델 '뮤즈 스파크'로 무게 이동
메타는 외부 AI 공급업체에 대한 의존을 줄이기 위해, 작업을 자체 개발 모델인 '뮤즈 스파크(Muse Spark)'로 점차 옮기고 있다. 뮤즈 스파크는 메타가 새로 꾸린 'AI 슈퍼인텔리전스 랩스(Superintelligence Labs)' 부문 산하에서 내놓은 내부용 모델이다. 경쟁사의 모델에 핵심 업무를 맡기는 것은 메타로서도 줄곧 부담스러운 구조였던 만큼, 이번 제한은 메타가 이미 추진하던 전환에 속도를 붙였다는 분석이 나온다. 외부의 첨단 모델을 빌려 쓰던 데서 벗어나, 콘텐츠 검수 같은 핵심 업무를 대규모로 처리할 수 있는 내부 모델을 직접 갖추겠다는 것이다. 메타와 구글은 AI 분야에서 정면으로 맞붙는 경쟁자다. 그런 메타가 그동안 핵심 안전 업무를 경쟁사 모델에 기대 온 셈이어서, 이번 일을 계기로 두 회사의 미묘한 관계가 새삼 드러났다는 평가도 나온다.
실제로 메타는 AI에 회사의 명운을 걸고 있다. 메타는 지난 5월 8,000명을 감원하는 한편 수십억 달러를 AI 인프라에 쏟아붓고 있으며, 올해 자본적 지출(캐펙스) 전망치로 1,150억~1,350억 달러를 제시했다. 자본적 지출은 시설과 장비 등 미래를 위한 투자에 들이는 돈을 말한다. 또 직원 7,000명을 AI 관련 업무로 재배치했다. 마크 저커버그(Mark Zuckerberg) 메타 최고경영자(CEO)는 슈퍼인텔리전스 랩스 출범 당시 초지능(superintelligence) 개발이 가시권에 들어오고 있다며, 메타가 그 길을 이끌도록 필요한 모든 것을 다하겠다고 밝힌 바 있다.
구글도 연산력 '비상'...스페이스X에서 GPU 빌린다
정작 구글도 연산 능력이 빠듯하기는 마찬가지다. FT 등에 따르면 구글은 치솟는 수요를 감당하기 위해 일론 머스크의 우주기업 스페이스X(SpaceX)에 월 9억 2,000만 달러를 지급하고 엔비디아(Nvidia)의 그래픽처리장치(GPU) 11만 개를 빌려 쓰기로 했다. 구글은 이를 수요를 메우기 위한 '임시 용량(bridge capacity)'이라고 표현했다. GPU는 본래 그래픽 연산에 쓰이던 반도체로, 많은 계산을 동시에 처리하는 데 강점이 있어 AI 학습과 구동의 핵심 부품으로 꼽힌다. 구글이 스페이스X에서 빌리기로 한 이 용량은 자사 기업용 AI 서비스 '제미나이 엔터프라이즈(Gemini Enterprise)'의 급증하는 수요를 메우기 위한 것으로 전해졌다. 외부 고객에게 모델을 파는 것과 별개로, 정작 구글 스스로 쓸 연산 능력조차 빠듯하다는 뜻이다.
구글이 올해 시설 투자에 들이는 돈은 1,800억 달러를 넘어선다. 그런데도 모든 고객의 수요를 다 대지 못하고 있는 셈이다. 앞서 순다르 피차이(Sundar Pichai) 알파벳 CEO는 1분기 실적 발표에서 구글 클라우드 매출이 1년 전보다 63% 늘어난 200억 달러를 기록했다고 밝히면서도, 연산 능력 부족이 더 높은 성장을 가로막았다고 언급한 바 있다. 그는 이로 인해 클라우드 부문의 수주잔고가 직전 분기 대비 거의 두 배인 4,600억 달러로 불었다고 설명했다. 수주잔고는 주문은 받았으나 아직 처리하지 못한 일감을 말한다.
"AI 수요가 인프라 투자 속도 앞질러"
이번 사안은 AI 연산 자원 부족이 업계 최대 기업들 사이의 관계마저 바꿔 놓고 있음을 보여 준다. 칩과 데이터센터에 수십억 달러를 들이고도, 기업들은 빠르게 늘어나는 AI 서비스 수요를 떠받칠 연산 능력을 확보하는 데 여전히 애를 먹고 있다. 세계 최대 규모의 AI 인프라를 보유한 구글마저 메타 같은 거대 고객에게 사용량을 나눠 배분하면서, 동시에 로켓 기업으로부터 GPU를 빌리는 상황이 벌어지고 있다. AI 기업 앤트로픽(Anthropic)이 스페이스X로부터 데이터센터 한 곳을 통째로 빌리는 등, 연산력 확보 경쟁은 업계 전반으로 번지고 있다.
다만 이번 내용은 FT가 익명의 관계자들을 인용해 보도한 것으로, 로이터가 곧바로 검증하지 못했고 구글과 메타도 공식 확인을 내놓지 않았다는 점은 감안해 볼 대목이다. 제한의 구체적 범위와 기간, 메타의 자체 모델 전환이 실제로 얼마나 빠르게 이뤄질지는 추가 발표와 사용 사례가 쌓이면서 가려질 전망이다. 분명한 것은 AI 시대의 가장 뚜렷한 병목이 알고리즘이나 인재가 아니라, 이를 돌릴 물리적 인프라에 있다는 점이라고 FT는 짚었다.
한국정보기술신문 인공지능분과 윤서빈 기자 news@kitpa.org











