인공지능 ·
엔비디아, AI 에이전트로 문서를 실시간 비즈니스 인텐리전스로 전환...Nemotron 오픈 모델 기반 지능형 문서 처리로 연구·금융·법률 워크플로우 혁신
엔비디아가 오픈소스 AI 모델을 활용한 지능형 문서 처리 기술을 공개했다.
[한국정보기술신문] 엔비디아가 AI 에이전트 기반의 지능형 문서 처리 기술을 공개하며 기업의 문서 관리 방식을 혁신하고 있다. 엔비디아는 지난 4일 공식 블로그를 통해 Nemotron 오픈 모델을 활용한 문서 지능 처리 시스템을 소개했다. 이 시스템은 보고서, 프레젠테이션, PDF, 웹페이지, 스프레드시트 등 다양한 형식의 문서에서 숨겨진 인사이트를 자동으로 추출하고 분석한다.
기업들은 그동안 문서에 담긴 가치 있는 정보를 찾기 위해 수작업으로 파일을 검토하고 데이터를 스프레드시트에 복사하는 등 비효율적인 프로세스를 거쳐야 했다. 기존의 템플릿 기반 광학 문자 인식 도구는 복잡한 미디어의 중요한 세부 정보를 놓치는 경우가 많았다. 엔비디아의 새로운 접근 방식은 이러한 한계를 극복하고 문서를 실시간 비즈니스 인텔리전스 자산으로 전환한다.
복잡한 문서 구조 이해하는 AI 시스템
엔비디아의 지능형 문서 처리 시스템은 단순 텍스트 추출을 넘어 표, 차트, 이미지, 텍스트를 포함한 다양한 형식을 해석한다. AI 에이전트와 검색 증강 생성 기술을 활용해 멀티모달 콘텐츠를 다른 멀티 에이전트 시스템과 사람이 쉽게 사용할 수 있는 인사이트로 변환한다.
이 시스템은 문서를 사람처럼 이해하며 구조, 관계, 맥락을 인식한다. 대규모 파일 라이브러리를 병렬로 처리하고 지식 베이스를 지속적으로 업데이트할 수 있다. 쿼리와 가장 관련성 높은 구절, 표, 단락을 정확히 찾아내며 특정 페이지나 차트에 대한 인용을 제공해 투명성과 감사 가능성을 보장한다.
엔비디아 Nemotron RAG 모델은 MTEB, MMTEB, ViDoRe V3 등 다국어 및 멀티모달 검색 모델 평가 벤치마크에서 우수한 성능을 기록했다. 팀들은 검색과 질의응답 같은 작업에 가장 적합한 모델을 선택할 수 있다.
금융·법률·연구 분야 혁신 사례
지능형 문서 처리 시스템은 이미 여러 산업 분야에서 실제 성과를 내고 있다. 금융 서비스 분야의 저스트닷에이아이는 AI 기반 지불 분쟁 관리 플랫폼을 운영한다. 거래 기록, 고객 커뮤니케이션, 정책 문서가 여러 시스템에 분산돼 있어 분쟁 처리가 느리고 비용이 많이 드는 문제를 해결하기 위해 Nemotron Parse를 활용했다.
이 플랫폼은 결제 서비스 제공업체와 판매자 데이터 소스에 직접 연결돼 거래 데이터, 고객 상호작용, 정책을 수집하고 카드 네트워크 및 발급사 요구사항에 맞는 분쟁별 증거를 자동으로 구성한다. HEI 호텔앤리조트 같은 선도적인 호스피탈리티 운영업체는 이 플랫폼을 사용해 부동산 전반의 분쟁 처리를 자동화하고 수익을 회복하면서도 고객 관계를 유지하고 있다.
전자서명 분야의 글로벌 리더 도큐사인은 매일 180만 고객과 10억 이상의 사용자를 위해 수백만 건의 거래를 처리한다. 계약서 내 중요 정보를 찾기 위해 Nemotron Parse를 평가 중이다. 엔비디아 GPU에서 실행되는 이 모델은 고급 AI와 레이아웃 감지 및 OCR을 결합해 복잡한 표를 안정적으로 해석하고 필요한 정보가 포함된 표를 재구성한다. 이를 통해 수동 수정 필요성을 줄이고 가장 복잡한 계약도 고객이 기대하는 속도와 정확도로 처리할 수 있다.
과학 연구 분야에서는 에디슨 사이언티픽의 Kosmos AI 과학자가 연구자들이 복잡한 과학 환경을 탐색하고 문헌을 종합하며 연결고리를 식별하고 증거를 찾도록 돕고 있다. 에디슨은 방정식, 표, 그림을 포함한 대량의 PDF에서 구조화된 정보를 빠르고 정확하게 추출하기 위해 Nemotron Parse 모델을 PaperQA 파이프라인에 통합했다. 이 접근 방식은 방대한 연구 자료를 상호작용 가능한 지식 엔진으로 전환해 가설 생성과 문헌 검토를 가속화한다.
포괄적인 기술 스택과 구현 방법
강력한 문서 지능 파이프라인을 구축하려면 데이터 추출, 임베딩, 재순위 지정을 처리하면서 데이터를 안전하게 유지하고 규정을 준수할 수 있는 기술이 필요하다. 엔비디아는 이를 위한 포괄적인 기술 스택을 제공한다.
Nemotron 추출 및 OCR 모델은 멀티모달 PDF, 텍스트, 표, 그래프, 이미지를 빠르게 수집해 레이아웃과 의미를 보존하면서 구조화된 기계 판독 가능 콘텐츠로 변환한다. Nemotron 임베딩 모델은 구절, 엔티티, 시각적 요소를 문서 검색에 최적화된 벡터 표현으로 변환해 의미적으로 정확한 검색을 가능하게 한다.
Nemotron 재순위 지정 모델은 후보 구절을 평가해 대형 언어 모델의 컨텍스트로 가장 관련성 높은 콘텐츠가 표시되도록 하여 답변 충실도를 개선하고 환각을 줄인다. Nemotron Parse 모델은 문서 의미를 해독해 정확한 공간 기반과 올바른 읽기 흐름으로 텍스트와 표를 추출한다. 레이아웃 변동성을 극복해 구조화되지 않은 문서를 대형 언어 모델과 에이전트 워크플로우의 정확도를 향상시키는 실행 가능한 데이터로 전환한다.
이러한 기능은 엔비디아 GPU에서 효율적으로 실행되는 엔비디아 NIM 마이크로서비스와 파운데이션 모델로 패키징돼 있다. 팀은 민감한 데이터를 선택한 클라우드나 데이터 센터 환경에 보관하면서 개념 증명에서 프로덕션으로 확장할 수 있다.
가장 효과적인 AI 시스템은 프론티어 모델과 엔비디아 Nemotron 같은 오픈소스 모델을 혼합해 사용하며 LLM 라우터가 각 작업을 분석하고 가장 적합한 모델을 자동으로 선택한다. 이 접근 방식은 컴퓨팅 비용을 관리하고 효율성을 개선하면서도 강력한 성능을 유지한다.
문서를 지능형 자산으로 전환
엔비디아는 RAG 기능을 갖춘 문서 처리 파이프라인 구축에 대한 단계별 튜토리얼을 제공한다. 개발자들은 Nemotron RAG 모델과 엔비디아 NeMo Retriever 오픈 라이브러리를 깃허브와 허깅페이스에서 실험할 수 있으며 Nemotron Parse도 허깅페이스에서 이용할 수 있다.
업계를 선도하는 12개 AI 데이터 플랫폼 제공업체가 신뢰하는 엔터프라이즈 RAG용 엔비디아 블루프린트는 빌드닷엔비디아닷컴, 깃허브, NGC 카탈로그에서 제공된다. 이 블루프린트를 통해 개발자 커뮤니티는 다양한 산업에 맞춤화된 전문 에이전트를 구축할 수 있다.
정적인 문서 아카이브에서 비즈니스 인텔리전스, 고객 경험, 운영 워크플로우를 직접 지원하는 살아있는 지식 시스템으로의 전환이 진행되고 있다. 엔비디아의 오픈 모델과 GPU 가속 라이브러리는 조직이 과학 연구, 금융 서비스, 법률 워크플로우 등 다양한 분야에서 AI 기반 문서 지능 시스템을 구축할 수 있도록 지원한다.
한국정보기술신문 인공지능분과 이준 기자 news@kitpa.org