한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 ·

구글, AI로 이미지 하나에서 여러 객체 동시 검색 가능…"팬아웃 기법" 공개

발행일
읽는 시간2분 21초

구글이 AI 기반 시각 검색 기술 '팬아웃'을 공개해 이미지 내 복수 객체를 동시 검색하는 시대를 열었다.

[한국정보기술신문] 구글이 인공지능(AI) 기술을 활용해 이미지 하나에서 여러 개의 객체를 동시에 검색할 수 있는 '팬아웃(fan-out)' 기법을 공개했다. 구글 서치 시니어 엔지니어링 디렉터 두니아 베라다(Dounia Berrada)는 구글 공식 블로그 '더 키워드'를 통해 이번 기술의 원리와 활용 방향을 상세히 설명했다. 이 기술은 구글 렌즈와 서클 투 서치에 이미 적용되어 있으며, AI 모드와 결합해 사용자 경험을 한층 확장하고 있다.

기존 시각 검색의 한계를 넘다

지금까지 시각 검색은 이미지에서 한 번에 하나의 객체만 검색할 수 있었다. 예를 들어 특정 인테리어 사진에서 마음에 드는 소품을 찾으려면 램프, 러그, 의자 등을 각각 따로 검색해야 했다. 하지만 구글의 새로운 AI 모드는 이미지를 분석해 여러 객체를 동시에 식별하고, 각각에 대한 검색을 병렬로 실행한다. 베라다 디렉터는 "이전에는 하나하나 따로 검색해야 했지만, 이제는 AI가 복잡한 이미지를 분해해 각각의 구성 요소를 동시에 검색한다"고 설명했다.

팬아웃 기법의 원리

이번 기술의 핵심은 '팬아웃' 기법이다. 이는 AI가 하나의 검색 요청을 받았을 때, 내부적으로 수십 개의 하위 검색을 동시에 실행한 뒤 결과를 하나의 통합된 답변으로 제공하는 방식이다. 구글 측의 설명에 따르면, AI 모델은 이미지를 '보는' 두뇌 역할을 하고, 시각 검색 백엔드는 수십억 개의 웹 결과를 보유한 도서관 역할을 한다. 두뇌가 이미지 내 여러 객체를 인식하면, 도서관에서 각각에 대한 결과를 한꺼번에 가져와 하나의 응답으로 통합하는 구조다.

예를 들어 사용자가 좋아하는 정원 사진을 업로드하면, AI는 그 안에 있는 식물들을 자동으로 식별하고, 각각의 식물이 그늘에서 생존 가능한지, 해당 기후에 적합한지, 유지 관리는 얼마나 필요한지 등을 동시에 검색해 한눈에 보여준다.

구글 렌즈와 제미나이 모델의 결합

이 기술은 구글의 최신 멀티모달 AI 모델인 제미나이의 능력을 바탕으로 한다. 제미나이는 텍스트와 이미지를 함께 이해하는 능력을 갖추고 있어, 사용자가 이미지와 함께 질문을 입력하면 어떤 도구를 사용해야 할지 스스로 판단한다. 예를 들어 소셜 미디어에서 마음에 드는 패션 사진을 발견하고 이를 검색하면, 모델은 모자, 신발, 재킷 등 각각의 아이템에 대한 이미지 검색 결과를 동시에 가져와 하나의 응답으로 제공한다.

베라다 디렉터는 "렌즈는 수년에 걸쳐 쌓아온 시각 전문성 위에 구축됐으며, 제미나이의 멀티모달 능력과 결합해 AI 모드가 가능해졌다"고 밝혔다.

텍스트에서 시작해도 시각 검색 가능

이번 업그레이드의 또 다른 특징은 반드시 이미지를 먼저 업로드하지 않아도 된다는 점이다. 사용자가 텍스트로 "출근용 패션 영감을 보여줘"라고 검색한 뒤, 마음에 드는 결과를 보고 "두 번째 스커트와 비슷한 걸 더 보여줘"라고 말하면, AI가 해당 이미지를 기준으로 팬아웃 검색을 시작한다. 즉, 텍스트와 이미지 검색이 자연스럽게 이어지는 연속적인 검색 경험이 가능해졌다.

쇼핑·여행·교육 등 다양한 분야에서의 활용 가능성

구글은 이 기술이 쇼핑에만 국한되지 않는다고 강조한다. 박물관 벽면을 촬영해 각 작품에 대한 설명을 동시에 요청하거나, 빵집 진열장 사진을 찍어 모든 빵의 종류와 재료를 한꺼번에 알아볼 수도 있다. 베라다 디렉터는 "이제 '이것이 무엇인가?'라는 단순 질문에서 '이 장면 전체를 설명해줘'라는 복합적 요청으로 검색이 진화하고 있다"고 말했다.

이처럼 구글의 AI 시각 검색 기술은 단순한 이미지 인식을 넘어, 장면 전체를 이해하고 복합적인 정보를 통합 제공하는 방향으로 발전하고 있다. 전문가들은 이 기술이 전자상거래, 교육, 관광 등 다양한 산업 분야에 걸쳐 큰 변화를 가져올 것으로 전망한다.

한국정보기술신문 인공지능분과 박정후 기자 news@kitpa.org