한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

발행: 2026년 6월 4일

한국어는 영어보다 AI 토큰을 3~5배 더 써 사용량 제한에 빨리 걸린다.

[한국정보기술신문] 같은 요금제를 쓰는데도 누구는 금세 "사용량 제한에 도달했다"는 안내를 받고, 누구는 한참을 더 쓴다. 그 차이의 한 원인으로 '사용 언어'가 지목되고 있다. 클로드(Claude)나 챗지피티(ChatGPT) 같은 생성형 인공지능(AI) 서비스에서 한국어로 질문하면, 같은 의미를 영어로 물을 때보다 토큰을 3~5배 더 소비하는 것으로 나타났다. 의미도, 받는 답변도, 내는 구독료도 같지만 한국어 사용자는 같은 돈을 내고도 더 적은 질문밖에 할 수 없는 구조다.

토큰이 곧 비용이자 사용량 제한

AI 모델은 문장을 글자 그대로 읽지 않고 '토큰(token)'이라는 조각으로 쪼개 처리한다. 영어는 대체로 단어 하나가 토큰 하나에 대응해, "I love coffee"는 3개 토큰으로 처리된다. 문장을 토큰으로 나누는 장치를 토크나이저(tokenizer)라 부르는데, 대부분의 AI 서비스는 자주 등장하는 글자 조합을 하나의 토큰으로 묶는 BPE(Byte Pair Encoding) 방식을 쓴다.

훈련 데이터의 대부분이 영어이기 때문에 "the", "ing", "tion" 같은 영어 조합은 효율적으로 한 토큰에 담긴다. 반면 한국어는 훈련 데이터에서 차지하는 비중이 작아 글자 조합이 충분히 묶이지 못한다. 영어 "hello"가 1토큰인 데 비해 한국어 "안녕하세요"는 3~5토큰으로 쪼개지는 식이다. AI 서비스의 사용량 제한이 이 토큰 수를 기준으로 적용되기 때문에, 토큰을 많이 쓸수록 제한에 더 빨리 걸린다.

한국어가 불리한 세 가지 구조적 이유

한국어가 토큰 면에서 불리한 데에는 세 가지 구조적 원인이 있다. 첫째는 교착어라는 특성이다. 한국어는 어근에 조사와 어미가 붙어 "먹다", "먹었다", "먹었었다", "먹었었겠다"처럼 한 단어가 다양하게 변형된다. 토크나이저는 이 변형을 각각 별개의 패턴으로 처리해야 해, "eat", "ate", "eaten" 수준에서 끝나는 영어보다 복잡도가 높다.

둘째는 글자를 저장하는 방식이다. 영어 알파벳은 UTF-8 인코딩 기준 1바이트지만 한글 한 글자는 3바이트다. BPE 토크나이저가 바이트 단위로 작동하는 만큼, 한국어 한 글자를 처리하는 데 영어의 3배에 해당하는 원재료가 든다.

셋째이자 핵심은 훈련 데이터의 편향이다. 클로드의 토크나이저 어휘에 담긴 한국어 토큰은 수백 개 수준에 불과한 반면 영어 토큰은 수만 개에 이른다. 태국어는 4개, 조지아어는 1개뿐인 경우도 있다. 자주 보는 패턴을 더 효율적으로 묶는 BPE 원리상, 데이터에 적게 등장하는 언어는 구조적으로 불리할 수밖에 없다.

영어 100토큰 대화, 한국어는 300~500토큰

커뮤니티 벤치마크와 학술 연구를 종합하면, 같은 의미를 전달할 때 영어 사용자가 100토큰으로 하는 대화를 한국어로는 300~500토큰을 써야 한다. 토큰이 곧 비용이자 사용량 제한인 환경에서 이 격차는 무시하기 어렵다. 한국어 사용자 사이에서는 "같은 동아시아 언어인 일본어보다도 비효율적인 경우가 있다"는 지적도 나온다. 교착어 특성과 토크나이저 어휘 규모의 차이가 겹치면서 한국어가 특히 불리한 위치에 놓인다는 것이다.

문제는 이 격차가 당장의 불편으로 이어진다는 점이다. 주요 AI 서비스는 모두 토큰 기반 사용량 제한을 두고 있다. 클로드 프로(Pro·월 20달러)는 5시간마다 약 45개 메시지로 제한되고, 챗지피티 플러스(Plus·월 20달러)는 3시간마다 모델별 80~160개 메시지로 묶인다. 코딩 보조 도구인 클로드 코드(Claude Code) 프로는 5시간당 약 4만4000토큰을 쓸 수 있는데, 영어로 작업하면 넉넉하지만 한국어로 대화하면 실질적으로 1만5000토큰 이하의 예산과 다름없다. 구독료는 같은데 받는 서비스의 양이 다른 셈이다.

일본·중국·태국, 각자의 대응책

이 문제는 한국만의 것이 아니다. 비영어권 전반이 비슷한 상황에 놓여 있고 각국이 나름의 대응을 하고 있다. 일본 핀테크 기업 레이어엑스(LayerX)는 2025년 엔지니어링 블로그에서 AI의 중간 추론 과정은 영어로 수행하고 최종 답변만 일본어로 출력하게 한 결과 출력 토큰을 약 20% 줄였다고 밝혔다. 일본 개발자 커뮤니티에서는 이런 방식이 이미 표준 관행에 가깝다는 분석도 나온다.

중국은 모델 자체를 만드는 길을 택했다. 딥시크(DeepSeek)-V3는 12만8000개 어휘의 토크나이저를, 큐원(Qwen) 3은 15만2000개 어휘에 119개 언어를 지원하는 토크나이저를 자체 개발했다. 토큰 배율이 10~15배로 한국어보다 상황이 심각한 태국에서는, SCB10X가 개발한 타이푼(Typhoon)이 태국어 토크나이징 효율을 기존보다 2.62배 개선했고, 오픈타이지피티(OpenThaiGPT)는 기존 토크나이저에 태국어 토큰 2만4554개를 더해 토큰 소비를 3분의 1로 줄였다.

한국에서는 서울대 연구팀이 한국어 문법 구조에 맞춘 토크나이저 '선더톡(Thunder-Tok)'을 개발해 기존 라마(LLaMA) 토크나이저 대비 44%의 토큰 절감을 달성하고 특허를 출원했다. 연구팀은 이를 해외 빅테크에 의존하지 않는 독자적 거대언어모델(LLM) 개발, 즉 'AI 주권'의 문제로 보고 있다.

요금 정책 차원의 문제 제기도 있다. 2025년 국제머신러닝학회(ICML)에서 막스플랑크연구소는 토큰당 과금이 구조적으로 불공정하다는 점을 수학적으로 증명하고 '글자당 과금(pay-per-character)'을 대안으로 제시했다. 기술을 바꿀 필요 없이 과금 단위만 바꾸면 되는 사업적 결정이라는 것이다. 메타(Meta)는 2024년 토크나이저 자체를 없애고 바이트 단위로 처리하는 아키텍처 '바이트 레이턴트 트랜스포머(BLT)'를 발표하기도 했다. 다만 2026년 현재 오픈AI, 앤스로픽, 구글 가운데 언어별 차등 요금이나 글자당 과금을 도입한 곳은 없으며, 새 토크나이저와 아키텍처, 요금 정책은 모두 연구·제안 단계에 머물러 있다.

"영어로 묻고 한국어로 받아라"

근본 해법이 모두 연구 단계인 가운데, 당장 쓸 수 있는 것은 사용자 측의 대응뿐이다. 가장 직접적인 방법은 프롬프트를 영어로 쓰는 것이다. 질문이나 지시를 영어로 적고 끝에 "Reply in Korean"(한국어로 답하라) 한 줄만 더하면, 입력 토큰은 3~5배 줄고 결과물은 여전히 한국어로 나온다.

한 단계 더 나아가 AI의 사고 과정까지 영어로 돌릴 수도 있다. 최신 모델은 답변을 내놓기 전 내부적으로 '생각'하는 과정을 거치는데, 한국어로 질문하면 이 과정에서도 한국어 토큰이 소비된다. 프롬프트에 "Think in English"(영어로 생각하라)를 추가하면 사고 과정 자체가 더 적은 토큰으로 처리된다. 앞서 레이어엑스가 출력 토큰을 20% 줄인 것도 이 기법을 적용한 사례다. 코드 리뷰나 데이터 분석처럼 결과물의 언어가 중요하지 않은 작업이라면, 입력·사고·출력을 모두 영어로 하는 것이 토큰 효율 면에서는 가장 낫다.

전문가들은 AI에 보내는 영어가 완벽할 필요는 없다고 조언한다. 문법이 틀려도 AI가 의도를 파악하므로, 유창함보다 토큰 효율이 목적임을 기억하면 된다는 것이다. 대화가 길어질수록 이전 내용이 매번 다시 전송돼 격차가 누적되는 만큼, 처음부터 영어로 시작하는 편이 유리하다. 한국어 보고서나 콘텐츠처럼 결과물이 반드시 한국어여야 하는 경우가 아니라면, 프롬프트 언어 하나를 바꾸는 것만으로 사용 가능 시간이 두세 배 늘어날 수 있다.

한국정보기술신문 news@kitpa.org

한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

토큰이 곧 비용이자 사용량 제한

한국어가 불리한 세 가지 구조적 이유

영어 100토큰 대화, 한국어는 300~500토큰

일본·중국·태국, 각자의 대응책

"영어로 묻고 한국어로 받아라"

함께 읽으면 좋은 기사

정부, '전력감독원' 신설 추진...22일 국회서 전력 거버넌스 혁신 토론회...하반기 '전기사업법' 개정 앞두고 국회·전문가 공감대 형성, '전기국가' 도약 뒷받침

오픈 AI 모델, '최고 성능' 넘본다...美 리서치사 "앤트로픽 사업모델 흔들릴 수 있어"...무료 공개 '키미 K3'·'큐원 3.8'이 최전선 위협, 데이터센터·전력 안 가진 모델 중심 기업의 수익구조 취약성 지적

엔비디아 '베라 루빈' AI 시스템, 전 세계로 확산...전력당 성능·토큰당 비용 앞세워 대형 클라우드에 도입...코어위브·구글 클라우드·MS·오라클서 가동, 30개국 350여 공장서 생산 이어져

샤오미, 로봇 기초모델 '샤오미-로보틱스-1' 공개...10만 시간 실제 조작 데이터로 학습...로봇 없이 모은 데이터로 사전학습해 '데이터 장벽' 넘어

구글, 이모지 약 4,000개 '3D'로 통째 재설계...세계 이모지의 날 맞아 'Noto 3D' 공개...표현력·접근성 높이고 다크모드용 고대비 옵션 더해, 3D 모델은 오픈소스로 개방

세계유산 안동 하회마을 침수 위험, 실시간으로 감시한다...국가유산청·국립재난안전연구원, 문화유산에 첫 침수계측장비 시범 설치...계측 데이터를 침수모니터링시스템 'RAINSYS'와 실시간 연동해 상시 예측

미국 제약사 BMS, 세계 최강 '생명과학 AI 공장' 짓는다...엔비디아 '베라 루빈'으로 신약 개발 가속...모든 연구원에게 슈퍼컴 개방, 표적 발굴·분자 설계에 AI 전면 도입

한-아세안, 'AI 교통' 미래 함께 그린다...22일 서울서 제16차 교통협력포럼 개막...동티모르 첫 참여 등 아세안 11개 회원국 고위급 참석, 자율주행 실증·AI 교통신호 등 한국 미래 교통정책 사례 공유

MPEG-4 비주얼 마지막 특허 만료...30년 만에 전 세계서 완전 무료화...브라질에 홀로 남아 있던 특허 7월 19일 소멸, DivX·Xvid 등 영상 코덱 자유롭게 쓸 수 있어

삼성전자, '삼성 계정' 하나로 기기·서비스 잇는다...월렛·파인드·스마트싱스 아우르고 '가족 단위' 경험으로 확대

구글, "제미나이로 부업 창업하세요"...AI 하나로 사업계획부터 가격 책정까지...사업 구상·시장 조사·브랜드 디자인·업무 자동화·가격 설계 등 다섯 가지 활용법 제시, 24시간 일하는 AI 대리인 '스파크'도 소개