한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

구글, AI 모델 메모리 6분의 1로 줄이는 압축 알고리즘 'TurboQuant' 공개...정확도 손실 제로

thumbnail.webp
3비트 압축으로 H100 GPU 대비 최대 8배 속도 향상, ICLR 2026 발표 예정
구글 리서치가 AI 메모리 병목을 획기적으로 줄이는 새 압축 기술을 선보였다.
[한국정보기술신문] 구글 리서치가 대규모 언어 모델(LLM)과 벡터 검색 엔진에서 발생하는 메모리 병목 문제를 해결하는 새로운 양자화 압축 알고리즘 'TurboQuant'를 공개했다. 이번 연구는 구글 리서치 소속 아미르 잔디에 연구 과학자와 바하브 미로크니 구글 펠로우가 주도했으며, 오는 2026년 ICLR(국제 학습 표현 학술대회)에서 정식 발표될 예정이다.

TurboQuant란 무엇인가

TurboQuant는 AI 모델이 연산 과정에서 빈번하게 참조하는 정보를 저장해두는 핵심 구조인 키-값(KV) 캐시의 압축 문제를 해결하기 위해 설계된 알고리즘이다. 기존의 벡터 양자화 기법은 데이터를 압축하는 과정에서 추가적인 메모리 오버헤드가 발생하는 구조적 한계를 안고 있었다. 블록 단위 데이터마다 양자화 상수를 별도로 계산하고 저장해야 했기 때문에, 압축 효과의 상당 부분이 상쇄되곤 했다.
TurboQuant는 두 단계로 이 문제에 접근한다. 첫째, 함께 공개된 PolarQuant 기법을 활용해 데이터 벡터를 무작위로 회전시킨 뒤 극 좌표계로 변환해 압축한다. 이 방식은 기존 직교 좌표 기반 압축에서 필수적이던 데이터 정규화 단계를 생략할 수 있게 해 메모리 오버헤드를 원천 차단한다. 둘째, QJL(양자화 존슨-린덴슈트라우스) 알고리즘을 적용해 1비트만으로 압축 오차를 수학적으로 교정함으로써 정확도를 보존한다.

성능 실험 결과

구글 리서치 팀은 Gemma와 Mistral 등 오픈소스 LLM을 대상으로 LongBench, Needle In A Haystack, RULER 등 표준 장문 맥락 벤치마크에서 세 알고리즘을 종합 평가했다.
실험 결과, TurboQuant는 KV 캐시를 3비트까지 압축하면서도 추가적인 학습이나 미세 조정 없이 모델 정확도를 완전히 유지하는 데 성공했다. 특히 방대한 텍스트 속에서 특정 정보를 찾아내는 '바늘 찾기' 형식의 장문 맥락 테스트에서 KV 메모리를 최소 6분의 1 수준으로 줄이면서 완벽한 정확도를 달성했다.
속도 측면에서도 두드러진 성과를 보였다. 엔비디아 H100 GPU 환경에서 4비트 TurboQuant는 32비트 비압축 방식 대비 어텐션 로짓 연산 속도를 최대 8배까지 끌어올렸다.

벡터 검색 분야로의 확장

TurboQuant의 활용 범위는 LLM 압축에만 국한되지 않는다. 구글은 이 기술이 수십억 개 규모의 벡터 데이터베이스에서 의미적으로 유사한 항목을 찾는 벡터 검색 분야에도 핵심적인 역할을 할 수 있다고 밝혔다. 최신 기준 방법들(PQ, RabbiQ)과 비교한 실험에서 TurboQuant는 GloVe 데이터셋 기준으로 데이터 의존적 학습 없이도 더 높은 검색 재현율을 기록했다.
구글 리서치 팀은 "이 기법들은 실용적 공학 해법을 넘어 이론적 하한선에 근접한 수준의 효율을 갖춘 알고리즘"이라며 "Gemini를 포함한 대형 모델의 KV 캐시 병목 해소와 구글 규모의 시맨틱 검색 고도화에 기여할 것"이라고 설명했다.
연구에는 구글 리서치의 프라니스 카참·라스 고테스뷰렌·라제시 자야람, 구글 딥마인드의 마지드 하디안, 한국과학기술원(KAIST)의 한인수 교수, 뉴욕대학교의 마지드 달리리 박사 과정생이 공동 참여했다.
한국정보기술신문 인공지능분과 김주호 기자 news@kitpa.org

함께 읽으면 좋은 기사

전국 25개 대학 리듬게임 동아리, 광주서 실력 겨룬다...'UCRC 2026' 온라인 예선 진행 중, 7월 17~19일 광주 게임플라자서 오프라인 본선

전국 25개 대학 리듬게임 동아리, 광주서 실력 겨룬다...'UCRC 2026' 온라인 예선 진행 중, 7월 17~19일 광주 게임플라자서 오프라인 본선

실감형콘텐츠 3
미 정부, 앤트로픽 최신 AI '페이블 5·미토스 5' 외국인 접근 전면 차단...한 논객 "앤트로픽이 스스로 요구한 규제, 제 발등 찍었다"...아모데이 '정부에 모델 차단권 부여' 제안 이틀 만에 수출통제 직격, 앤트로픽은 "오해" 반박

미 정부, 앤트로픽 최신 AI '페이블 5·미토스 5' 외국인 접근 전면 차단...한 논객 "앤트로픽이 스스로 요구한 규제, 제 발등 찍었다"...아모데이 '정부에 모델 차단권 부여' 제안 이틀 만에 수출통제 직격, 앤트로픽은 "오해" 반박

인공지능 4
블루 아카이브 팬 4500명, 하남에서 함께 달렸다...넥슨, 서비스 4.5주년 맞아 14일 '키보토스 런 2026' 개최, 티켓 7분 만에 매진·수익 일부 어린이 재활병원에 기부

블루 아카이브 팬 4500명, 하남에서 함께 달렸다...넥슨, 서비스 4.5주년 맞아 14일 '키보토스 런 2026' 개최, 티켓 7분 만에 매진·수익 일부 어린이 재활병원에 기부

실감형콘텐츠 3
"AI가 코드를 짜는 시대, 진짜 일은 '안전한 병합'부터 시작된다"...개발자 유수프 아이타스 "데모 완성은 결승선 아냐"

"AI가 코드를 짜는 시대, 진짜 일은 '안전한 병합'부터 시작된다"...개발자 유수프 아이타스 "데모 완성은 결승선 아냐"

정보기술 7
국산 AI칩, 설계부터 제조까지 손잡는다...산업부 'M.AX 얼라이언스' 총회서 '반도체 제조지원 TF' 발족, 8천억 투입 '온디바이스 AI칩' 10종 개발 본격화

국산 AI칩, 설계부터 제조까지 손잡는다...산업부 'M.AX 얼라이언스' 총회서 '반도체 제조지원 TF' 발족, 8천억 투입 '온디바이스 AI칩' 10종 개발 본격화

반도체 · 유관기관 4
구글, 'AI 가짜 문자' 사기조직에 소송 건다...FBI·통신3사와 손잡고 中 기반 '아웃사이더 엔터프라이즈' 인프라 해체 추진, 가짜 사이트 9000개·피해자 수십만 명

구글, 'AI 가짜 문자' 사기조직에 소송 건다...FBI·통신3사와 손잡고 中 기반 '아웃사이더 엔터프라이즈' 인프라 해체 추진, 가짜 사이트 9000개·피해자 수십만 명

인공지능 · 유관기관 · 정보보안 4
개인정보위 "깃허브에 접근키·API키 저장 말라"...클라우드·협업도구 자격증명 노출로 개인정보 유출 잇따라, 국내 한 기업선 1천만 건 새나가

개인정보위 "깃허브에 접근키·API키 저장 말라"...클라우드·협업도구 자격증명 노출로 개인정보 유출 잇따라, 국내 한 기업선 1천만 건 새나가

정보보안 · 유관기관 4
"모두가 AI로 모든 걸 한다"는 건 착각...미국인 3분의 1은 AI를 아예 안 쓴다, 덕덕고 창업자 "써 본 사람 상당수도 가끔 이용자일 뿐"

"모두가 AI로 모든 걸 한다"는 건 착각...미국인 3분의 1은 AI를 아예 안 쓴다, 덕덕고 창업자 "써 본 사람 상당수도 가끔 이용자일 뿐"

인공지능 5
AI업체 넥스AGI "브라질 리우市 'Rio 3.5' 모델은 우리 것 짜깁기"...깃허브로 공개 고발, 시스템 지시문 떼면 스스로 "나는 넥스" 자처

AI업체 넥스AGI "브라질 리우市 'Rio 3.5' 모델은 우리 것 짜깁기"...깃허브로 공개 고발, 시스템 지시문 떼면 스스로 "나는 넥스" 자처

인공지능 4
개인정보위, 공공부문 개인정보 관리실태 현장 점검 본격 나섰다...한국지역정보개발원 첫 방문, '공공실태점검단' 신설해 사전 예방체계로 전환

개인정보위, 공공부문 개인정보 관리실태 현장 점검 본격 나섰다...한국지역정보개발원 첫 방문, '공공실태점검단' 신설해 사전 예방체계로 전환

정보보안 · 유관기관 2
클라우드 AI 코딩 비용 치솟자 "내 컴퓨터서 직접 돌리자"...깃허브 코파일럿 종량제 전환에 개발자, 무료 오픈웨이트 모델로 갈아타는 법 공개

클라우드 AI 코딩 비용 치솟자 "내 컴퓨터서 직접 돌리자"...깃허브 코파일럿 종량제 전환에 개발자, 무료 오픈웨이트 모델로 갈아타는 법 공개

클라우드 · 인공지능 4
한국, 싱가포르·영국·호주·캐나다와 'AI 사전표준화' 협력 MoU 체결...국제표준 개발 전 단계부터 5개국 협력체계 구축, 제조·헬스케어 공동 시범사업으로 표준 파트너십 강화

한국, 싱가포르·영국·호주·캐나다와 'AI 사전표준화' 협력 MoU 체결...국제표준 개발 전 단계부터 5개국 협력체계 구축, 제조·헬스케어 공동 시범사업으로 표준 파트너십 강화

유관기관 · 인공지능 3