구글 8세대 TPU 공개...에이전트 AI 시대 맞춰 특화 설계

발행: 2026년 5월 3일

구글이 클라우드 넥스트 2026에서 학습과 추론 최적화한 TPU 8t, 8i 공개했다.

[한국정보기술신문] 구글이 최신 8세대 텐서 프로세싱 유닛(TPU) 8t와 8i를 발표했다. 10년 이상 칩 개발을 진행한 결과물로, 에이전트형 인공지능이 요구하는 지속적 추론과 다단계 실행 능력을 갖췄다. 구글 클라우드 넥스트에서 공개된 이번 칩은 AI 인프라 경쟁에서 구글의 입지를 강화할 전망이다.

학습 최적화된 TPU 8t

TPU 8t는 대규모 언어 모델(LLM) 개발에 최적화된 학습용 칩이다. 이전 세대 대비 약 3배 높은 연산 성능을 제공한다. 최대 9600개 칩을 연결해 121 엑사플롭스의 막대한 연산 능력을 구현한다.

메모리 구성도 획기적이다. 2페타바이트의 고대역폭 메모리를 칩 간에 공유하며, 칩 간 대역폭을 이전 세대 대비 2배 늘렸다. 이로써 대형 모델 학습 사이클을 수개월에서 수주일로 단축할 수 있다.

안정성도 개선됐다. 고급 신뢰성 기능으로 97% 이상의 실제 처리량을 보장한다. 투명한 액체 냉각 기술을 적용해 전력 효율을 높였다.

추론 최적화된 TPU 8i

TPU 8i는 지연 시간을 최소화해야 하는 추론 서빙에 특화됐다. 에이전트형 AI 시스템의 협력적 작동을 지원할 수 있도록 설계됐다.

메모리 용량은 288기가바이트의 고대역폭 메모리를 탑재했고, 온칩 메모리는 384메가바이트로 이전 세대 대비 3배 증가했다. 혼합 전문가(MoE) 모델을 위한 상호 연결 대역폭은 19.2 테라비트/초에 달한다.

TPU 8i hierarchical Boardfly topology building up from a building block of four fully connected chips into a fully connected group of eight boards, with 36 of such groups fully connected into a TPU 8i pod | 구글 제공

구글은 보드플라이 토폴로지를 도입해 네트워크 직경을 50% 이상 줄였다. 성능 대비 가격 효율은 80% 향상됐다. CPU 호스트는 커스텀 액시온 암 기반 프로세서 2개를 탑재했다.

개발자 친화적 설계

두 칩 모두 구글 액시온 암 기반 CPU 호스트를 통합했다. 개발자들이 이미 사용하는 프레임워크를 지원한다. JAX, 맥스텍스트, 파이토치, SGLang, vLLM 등이 그것이다.

성능 대비 전력 효율도 2배 향상됐다. 이는 데이터센터 운영 비용 절감으로 이어진다. 협동 설계 방식으로 구글의 AI 하이퍼컴퓨터 플랫폼과 완벽하게 호환된다.

Google Cloud’s fourth generation cooling distribution unit | 구글 제공

출시 일정

일반 공급 시작은 2026년 하반기로 예정돼 있다. 구글의 AI 하이퍼컴퓨터 플랫폼을 통해 접근 가능하다. 업계 전문가들은 이번 신칩이 엔터프라이즈급 AI 수요에 효과적으로 대응할 것으로 평가하고 있다.

한국정보기술신문 클라우드분과 이준호 기자 news@kitpa.org

함께 읽으면 좋은 기사

엔비디아, 로봇용 소형 AI 컴퓨터 '젯슨 토르' 2종 내놨다...손바닥만 한 모듈로 로봇·엣지 AI 대중화 겨냥...블랙웰 기반 T3000·T2000 공개, 크기·전력 절반으로 줄이고 파운데이션 모델을 현장 기기에서 직접 구동, 2027년 1분기 정식 출시

반도체 4분

마이크로소프트, 30년 전 '만화 채팅' 코믹챗 오픈소스로 공개...코믹 산스 세상에 알린 그 프로그램...대화를 만화 컷으로 바꾸던 1996년 IRC 채팅 프로그램, 깃허브에 소스코드 전면 개방하고 AI 현대화 시도까지 함께 담아

정보기술 · 인공지능 4분

구글, 새 학기 쇼핑 돕는 'AI 쇼핑 도구' 6가지 공개...검색 속 AI 모드부터 렌즈·가상 착용까지...연결한 앱으로 개인 맞춤 추천하고, 매장별 가격 3개월 이력 비교하며, 옷은 사기 전 화면에서 입어본다

인공지능 3분

삼성, '포용금융' 확대 위해 2000억원 낸다...미소금융재단 통해 취약계층·영세 자영업자 약 4만명 지원, 삼성전자 1500억·금융 계열사 500억 공동 출연으로 '5년간 5조원 사회 기여' 약속 이행

유관기관 3분

프리즘ML, '27B급 AI' 스마트폰서 돌린다...세계 최초 '손안의 27B 모델' 공개...3.9GB로 아이폰에 담아, 삼진·1비트 초저비트 기술로 성능 90% 지키며 온디바이스 에이전트 시대 연다

인공지능 4분

코레일-에스알, 8월 통합 앱 앞두고 '철도회원 통합' 시작...9월 통합열차 예매 위해 통합회원 전환 필요, 7월 14일 전환 웹사이트 열려 코레일 회원은 자동 전환·SR 단독회원은 신규 가입

유관기관 3분

공무원이 직접 만든 'AI 법령 비서', 14일 시범 개시...법제처·행안부·과기정통부 협업으로 1개월 만에 개발...판례 6만·법령 24만 건 탑재해 중앙·지방 공무원의 법적 질문에 AI가 즉시 응답, 독자 AI 파운데이션 모델 활용

유관기관 · 인공지능 4분

SK하이닉스, 나스닥 상장으로 '글로벌 투자자 저변' 넓힌다...'AI 핵심 파트너' 입지 굳히기...美 자본시장서 HBM 경쟁력 앞세워 차세대 컴퓨팅 생태계와 연결 강화, 상장 전 로드쇼서 성장성 주목받아

반도체 · 인공지능 3분

구글, 광고에 'AI로 만들었나' 표시 붙인다...'이 광고는 어떻게 만들어졌나' 패널 도입...검색·유튜브·디스커버에 전 세계 적용, 구글 AI 도구로 만든 광고엔 자동 고지하고 다른 도구도 광고주가 직접 표시

인공지능 2분

클로드 코드, 첫 요청에 오픈코드보다 토큰 4.7배 더 쓴다...한 컨설팅사가 'API 경계'에서 측정...사용자가 한 글자 치기 전 3만3천 토큰 소모, 캐시 재작성으로 요금 눈덩이

인공지능 4분

SK하이닉스 곽노정 CEO, 나스닥서 'AI 리더십' 선언...신뢰·혁신·성장 3대 원칙 제시...오프닝 벨 타종식 기념사서 25년 위기 극복사와 HBM 혁신 되짚으며 "AI가 있는 모든 곳에 함께할 것" 다짐

반도체 3분

구글 제미나이, 'AI 개인 과외' 스터디 노트북 내놨다...퀴즈로 약점 찾아 맞춤 수업 짜준다...자료 올리면 진단 시험으로 강·약점 파악해 짧은 수업 제공, SAT 등 시험 대비까지…전 세계 무료 공개

인공지능 4분