인공지능

LG AI연구원 '엑사원 4.5' 멀티모달 AI 모델 공개...텍스트·이미지 동시 추론, GPT-4o·클로드 4.5 성능 넘어서

2026년 4월 9일
1분
thumbnail.webp
LG AI연구원이 텍스트와 이미지를 동시 이해하는 멀티모달 AI 모델 엑사원 4.5를 공개하며 글로벌 경쟁사를 앞섰다.
[한국정보기술신문] LG AI연구원이 텍스트와 이미지를 동시에 이해할 수 있는 차세대 멀티모달 인공지능 모델 '엑사원 4.5'를 공개했다고 9일 밝혔다. 이 모델은 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로 개발됐다.

STEM 분야에서 글로벌 경쟁사 제압

엑사원 4.5는 STEM 분야 5개 지표에서 평균 77.3점을 기록하며 주요 경쟁사 모델들을 앞질렀다. 오픈AI의 GPT-4o mini는 73.5점, 앤스로픽의 클로드 소넷 4.5는 74.6점을 기록했다. 알리바바 큐웬3 235B 모델(77.0점)도 근소하게 뛰어넘었다.
특히 코딩 성능을 측정하는 라이브코드벤치 v6에서는 81.4점으로 구글의 젬마4(80.0점)를 상회하는 성과를 보였다. 이는 한국 기업이 개발한 AI 모델이 글로벌 빅테크 기업들의 최신 모델을 능가한 첫 사례로 평가된다.

효율성과 성능의 균형 달성

엑사원 4.5는 330억 개 파라미터 규모로 설계됐다. 이는 기존 K-엑사원의 약 7분의 1 크기에 불과하지만 텍스트 이해 능력은 동등한 수준을 유지한다. 하이브리드 어텐션 구조와 멀티 토큰 예측 기술을 적용해 계산 효율성을 대폭 개선했다.
LG AI연구원 관계자는 "모델 크기를 줄이면서도 성능을 유지하는 것이 핵심 과제였다"며 "독자적인 아키텍처 최적화를 통해 이를 해결했다"고 설명했다.

멀티모달 역량으로 실무 활용도 확대

엑사원 4.5의 가장 큰 특징은 텍스트와 이미지를 동시에 처리하는 멀티모달 기능이다. 문서 속 글자나 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있다. 이를 통해 업무용 문서 분석, 제품 설명서 해석, 의료 영상 판독 등 다양한 실무 영역에 활용 가능하다.

국내 AI 생태계 경쟁력 강화 기대

업계는 엑사원 4.5의 성과를 한국 AI 기술력의 새로운 전환점으로 평가하고 있다. 그동안 국내 AI 모델들은 글로벌 경쟁사 대비 성능에서 뒤처진다는 평가가 지배적이었다.
한 AI 전문가는 "LG의 이번 성과는 한국 기업들도 충분히 경쟁력 있는 AI 모델을 개발할 수 있음을 보여준다"며 "특히 효율성과 성능을 동시에 확보한 점에서 의미가 크다"고 평가했다.
LG는 엑사원 4.5를 자사 제품과 서비스에 우선 적용한 후 외부 기업들에게도 API 형태로 제공할 계획이라고 밝혔다.
한국정보기술신문 인공지능분과 성연주 기자 news@kitpa.org