한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 · 정보통신 ·

구글, AI로 상호작용 세계 생성하는 '프로젝트 지니' 공개...미국 구글 AI 울트라 구독자 대상 시범 서비스 시작

발행일
읽는 시간2분 3초

텍스트와 이미지로 가상세계 만들고 실시간 탐험 가능

[한국정보기술신문] 구글이 사용자가 직접 상호작용 가능한 가상세계를 만들 수 있는 인공지능 기술 프로젝트 지니를 29일 공개했다. 미국의 구글 AI 울트라 구독자를 대상으로 시범 서비스를 시작한다.

프로젝트 지니는 구글 딥마인드가 지난해 8월 발표한 범용 월드 모델 지니 3를 기반으로 한다. 월드 모델은 환경의 역학을 시뮬레이션하고 행동이 환경에 미치는 영향을 예측하는 AI 시스템이다.

구글은 인공일반지능 개발을 위해 현실 세계의 다양성을 탐색할 수 있는 시스템이 필요하다고 판단해 지니 3를 개발했다. 지니 3는 정적인 3D 스냅샷과 달리 사용자가 이동하고 상호작용할 때 실시간으로 경로를 생성한다.

세 가지 핵심 기능 제공

프로젝트 지니는 월드 스케치, 월드 탐험, 월드 리믹스 세 가지 핵심 기능을 제공한다. 월드 스케치 기능은 텍스트 프롬프트와 이미지를 활용해 살아있고 확장 가능한 환경을 만든다. 사용자는 캐릭터와 세계를 만들고 걷기, 탑승, 비행, 운전 등 탐험 방식을 정의할 수 있다.

나노 바나나 프로와의 통합으로 세계 진입 전 모습을 미리 보고 이미지를 수정해 세계를 조정할 수 있다. 1인칭이나 3인칭 같은 캐릭터 시점도 설정 가능하다.

월드 탐험 기능에서는 생성된 세계를 탐색할 수 있다. 사용자가 이동하면 프로젝트 지니가 행동에 따라 실시간으로 앞의 경로를 생성한다. 세계를 이동하며 카메라 각도도 조정할 수 있다.

월드 리믹스 기능은 기존 세계를 새롭게 해석할 수 있게 한다. 갤러리나 랜덤 생성기에서 선별된 세계를 탐색하거나 영감을 얻어 그 위에 새로 만들 수 있다. 완성된 세계와 탐험 영상은 다운로드할 수 있다.

물리 법칙 시뮬레이션과 일관성

지니 3의 혁신적인 일관성은 로봇공학 모델링부터 애니메이션, 픽션, 장소 탐험, 역사적 배경까지 모든 현실 시나리오 시뮬레이션을 가능하게 한다. 동적 세계를 위한 물리 법칙과 상호작용을 시뮬레이션한다.

프로젝트 지니는 지니 3와 나노 바나나 프로, 제미나이를 활용한 프로토타입 웹 애플리케이션이다. 사용자가 월드 모델의 몰입형 경험을 직접 실험할 수 있도록 설계됐다.

구글 딥마인드 디에고 리바스 제품 관리자는 산업과 영역을 넘나드는 신뢰받는 테스터들과의 모델 연구를 바탕으로 실험적 연구 프로토타입으로 다음 단계를 밟는다고 밝혔다.

제한사항과 개선 방향

초기 연구 모델인 만큼 몇 가지 개선이 필요한 영역이 있다. 생성된 세계가 완전히 사실적이지 않거나 프롬프트나 이미지, 실제 물리 법칙을 정확히 따르지 않을 수 있다.

캐릭터 제어가 어렵거나 제어 지연이 발생할 수 있으며, 생성은 60초로 제한된다. 지난 8월 발표된 지니 3의 일부 기능인 탐험 중 세계를 변화시키는 프롬프트 가능 이벤트는 아직 이 프로토타입에 포함되지 않았다.

구글은 신뢰받는 테스터들과 진행해온 작업을 기반으로 가장 진보된 AI 사용자와 프로토타입을 공유하며 AI 연구와 생성형 미디어 여러 영역에서 사람들이 월드 모델을 어떻게 사용할지 파악하겠다고 밝혔다.

프로젝트 지니 접근 권한은 미국의 18세 이상 구글 AI 울트라 구독자를 대상으로 오늘부터 순차적으로 제공되며, 향후 더 많은 지역으로 확대될 예정이다. 구글은 시간이 지나면서 이러한 경험과 기술을 더 많은 사용자가 접근할 수 있도록 만드는 것을 목표로 한다.

한국정보기술신문 정보통신분과 문창우 기자 news@kitpa.org