엔비디아, 생명과학 AI 가속 도구 '바이오네모' 클로드 사이언스에 통합...연구자가 일상 언어로 지시하면 AI가 유전체 분석·단백질 구조 예측·신약 후보 설계까지
엔비디아가 생명과학 AI 도구를 클로드 사이언스에 연결했다.
[한국정보기술신문] 그래픽처리장치(GPU) 기업 엔비디아(NVIDIA)가 생명과학 연구에 쓰이는 자사의 인공지능(AI) 가속 도구 '바이오네모 에이전트 툴킷(BioNeMo Agent Toolkit)'을 앤스로픽(Anthropic)의 과학 연구용 AI 작업대 '클로드 사이언스(Claude Science)'에 연결했다. 엔비디아는 현지시간 6월 30일 공식 블로그를 통해, 연구자가 클로드 사이언스에서 일상 언어로 AI 에이전트와 대화하며 유전체 분석부터 단백질 구조 예측까지 연구 작업의 전 과정을 처리할 수 있게 됐다고 밝혔다. 이 글은 엔비디아의 앤서니 코스타(Anthony Costa)가 썼다. AI 에이전트란 사람이 목표만 일러 주면 스스로 필요한 도구를 골라 쓰고 여러 단계의 작업을 이어서 처리하는 AI를 가리킨다.
클로드 사이언스는 앤스로픽이 이번 주 선보인 과학 연구용 AI 작업 환경으로, 과학자가 자연어로 에이전트와 대화하며 연구를 처음부터 끝까지 진행할 수 있도록 설계됐다. 여기에 엔비디아의 바이오네모 에이전트 툴킷이 연구 흐름 안에서 불러 쓸 수 있는 자원으로 통합된 것이다. 클로드 사이언스는 6월 30일 누구나 신청해 써 볼 수 있는 공개 시험(퍼블릭 베타) 단계에 들어갔다.

엔비디아 가속 기능을 '스킬'로 묶어 AI가 직접 호출
바이오네모 에이전트 툴킷은 엔비디아가 GPU로 빠르게 처리하도록 다듬은 여러 기능을, AI가 필요할 때 불러 쓸 수 있는 '스킬(skill)' 형태로 묶어 놓은 것이다. 각 스킬에는 그 기능이 무엇을 하는지, 어떤 입력값이 필요한지에 대한 정보가 담겨 있다. 덕분에 클로드 사이언스는 상황에 맞는 도구를 스스로 고르고, 알맞은 입력값을 준비한 뒤 작업을 실행할 수 있다. 이 과정에서 어디에 설치돼 있든 엔비디아의 연산 자원에 연결해 결과를 받아 온다.
이를 통해 엔비디아의 가속 모델과 소프트웨어 라이브러리, 그리고 'NIM 마이크로서비스'가 나머지 연구가 이뤄지는 것과 같은 환경 안으로 들어오게 된다. NIM 마이크로서비스란 복잡한 AI 모델을 곧바로 가져다 쓸 수 있도록, 필요한 소프트웨어까지 미리 갖춰 하나의 서비스 형태로 포장해 둔 것을 말한다. 개발자는 이를 정해진 방식으로 호출하기만 하면 되므로, 모델을 일일이 설치하고 맞추는 수고를 덜 수 있다.
엔비디아에 따르면 세계 상위 20대 제약사 가운데 18곳이 바이오네모를 활용해 신약 개발, 유전체 분석, 의료 영상, 분자 설계, 단백질 공학 등 AI 기반 연구를 진행하고 있다. 바이오네모가 이미 제약·바이오 업계에서 폭넓게 쓰이고 있다는 설명이다.
말로 과제 설명하면 분야별 전문 에이전트가 처리
작동 방식은 이렇다. 연구자가 유전체 서열 분석이나 단백질 구조 예측, 결합 물질(바인더) 설계 같은 연구 과제를 일상 언어로 설명하면, 클로드 사이언스가 그 요청을 해석해 작업을 나눠 맡긴다. 이때 유전체학, 단백질체학, 단일세포 분석, 케모인포매틱스(화학정보학), 임상 연구 등 각 분야의 정해진 작업 절차를 이미 알고 있는 전문 에이전트들이 일을 나눠 처리한다. 단백질체학은 세포 안 단백질 전체를 다루는 연구, 단일세포 분석은 세포 하나하나를 따로 들여다보는 방법, 케모인포매틱스는 화합물 정보를 컴퓨터로 다루는 분야를 뜻한다.
바이오네모 에이전트 툴킷은 이들 에이전트가 각 단계를 알맞은 엔비디아 기능과 연결하도록 필요한 정보를 제공한다. 그 결과 과학적 사고와 빠른 연산 작업이 서로 오가는 반복 과정이 만들어진다. 연구자는 나온 결과를 살펴보고 질문을 다듬으며 다음 단계를 정하는 식으로, 연산 자체보다 연구 내용에 집중할 수 있다는 것이 엔비디아의 설명이다. 이 과정에는 유전체 모델 '에보 2(Evo 2)', 단백질 구조 예측 모델 '볼츠-2(Boltz-2)'와 '오픈폴드3(OpenFold3)' 같은 가속 모델이 쓰인다.
엔비디아는 대표적 활용 사례로 암 치료용 억제제 설계를 들었다. 연구자가 암을 일으키는 특정 항원의 돌연변이에서 출발해 클로드에 여러 억제제 후보를 설계해 달라고 요청하면, 클로드 사이언스가 툴킷 및 NIM 마이크로서비스와 연동해 다수의 후보 물질을 빠르게 예측하고 최적화·검증하는 작업을 가속한다는 것이다. 억제제란 특정 단백질의 작용을 막아 병의 진행을 억누르는 물질로, 신약 후보를 찾는 출발점이 된다.
유전체 분석 '시간→분', 화합물 탐색 최대 3000배
엔비디아는 이번 툴킷에 담긴 가속 도구들이 연구 속도를 크게 끌어올린다고 소개했다. 유전체 분석 도구 '파라브릭스(Parabricks)'는 몇 시간 걸리던 유전체 분석을 몇 분 수준으로 줄인다. 단일세포 분석 도구 'RAPIDS-singlecell'은 130만 개 세포의 전처리·군집화 작업을 52분에서 25초로 단축한다고 엔비디아는 밝혔다. 이 도구는 분석 커뮤니티 스크버스(scverse)가 개발했다.
화합물을 다루는 도구 'nvMolKit'은 서로 비슷한 물질을 찾는 유사도 검색이나, 분자가 취할 수 있는 여러 3차원 모양을 만들어 내는 '컨포머(conformer) 생성' 같은 작업을 최대 3000배까지 빠르게 처리한다. 이 밖에 바이오네모의 공개(오픈) 모델들은 엔비디아 라이브러리로 가속된 핵심 생체분자 기능을 제공하며, 앞서 설명한 NIM 마이크로서비스는 이 모델들을 기업 환경에서 바로 쓸 수 있는 형태로 묶어 안정적으로 호출할 수 있게 해 준다. 다만 이러한 성능 수치는 모두 엔비디아가 제시한 것으로, 실제 연구 환경에서의 효과는 독립적인 검증과 사용 사례가 쌓이면서 가려질 전망이다.
오픈·프레임워크 비종속...남는 과제
엔비디아는 바이오네모 에이전트 툴킷이 개방형이며 특정 실행 환경에 묶이지 않아, 같은 과학용 스킬을 여러 에이전트 프레임워크와 연구 플랫폼에서 두루 쓸 수 있다고 밝혔다. 툴킷과 스킬은 엔비디아 개발자 리소스와 개발자 협업 공간인 깃허브(GitHub)를 통해 지금 이용할 수 있다. 앤스로픽은 이번 공개 시험 기간에 연구자들로부터 추가로 필요한 분야별 전문 기능과 연동에 대한 의견을 받고 있다고 덧붙였다.
한국정보기술신문 인공지능분과 정유리 기자 news@kitpa.org











