정보기술 · 클라우드 ·
"서버리스 데이터베이스는 죽었다"... LambdaDB, 진정한 서버리스 네이티브 아키텍처 발표
기존 서버리스 DB의 허상 지적하며 "10배 저렴한" 새로운 솔루션 제시
[한국정보기술신문] 클라우드 기술 업계의 핵심 트렌드인 '서버리스'가 사실은 환상에 불과하다는 주장이 제기됐다. LambdaDB는 8월 10일 공식 블로그를 통해 현재 시장의 대부분 서버리스 데이터베이스들이 진정한 서버리스가 아니라고 주장했다. 이 회사는 일래스틱(Elastic), 컨플루언트(Confluent), 파인콘(Pinecone) 등 기존 업체들과 니온(Neon), 업스태시(Upstash) 등 신규 업체들 모두 겉으로만 서버리스를 표방하고 있다고 비판했다.
LambdaDB에 따르면 기존 '서버리스' 데이터베이스들은 내부적으로는 여전히 서버 클러스터를 운영하고 있다. 스노우플레이크가 10년 전 개척한 클라우드 네이티브 아키텍처를 사용하고 있지만, 이는 AWS 람다(Lambda) 같은 현대적 서버리스 컴포넌트를 위해 설계된 것이 아니라는 것이다.
사용자가 겪는 실질적 문제들
이러한 아키텍처적 불일치는 사용자들에게 실질적인 문제를 야기하고 있다. 첫째, 유휴 서버 비용을 지불해야 한다는 점이다. 서버 클러스터가 요청 처리와 백그라운드 작업을 위해 항상 가동되고 있어 실제 사용량과 무관한 월 기본료와 상당한 비용 증가가 발생한다.
둘째, 확장성이 느리고 제한적이다. 클러스터에 새 서버를 추가하는 데 몇 분이 소요되며, 성능 문제를 피하기 위해 보수적으로 축소하여 더 오랜 시간 유휴 자원이 남게 된다. 이로 인해 갑작스러운 트래픽 급증에 즉시 대응할 수 없고, 데이터 크기와 요청에 제한적인 한계가 생긴다.
지속 불가능한 비즈니스 모델
LambdaDB는 서버풀 아키텍처 기반의 서버리스 데이터베이스가 제공업체와 사용자 모두에게 지속 불가능하다고 주장한다. 제공업체들은 수천 개의 대부분 유휴 상태인 데이터베이스를 위한 서버 클러스터 운영에만 상당한 투자 자금이 필요하다. 이러한 비용을 충당하기 위해 결국 가격을 인상할 수밖에 없으며, 가벼운 사용자들은 과도한 비용을 지불하고 성공한 사용자들은 확장 시 가파른 가격 인상을 경험하게 된다.
구글 트렌드에 따르면 서버리스 컴퓨팅에 대한 관심은 2010년 이후 꾸준히 증가하고 있지만, 진정한 서버리스 솔루션은 부족한 상황이다.
서버리스 네이티브 아키텍처의 등장
클라우드 컴퓨팅 초기에 대부분의 '클라우드' 데이터베이스는 로컬 디스크가 있는 클라우드 VM에서 실행되는 레거시 데이터베이스였다. 진정한 클라우드 네이티브 아키텍처가 등장하여 서버풀 클라우드의 잠재력을 완전히 활용하는 데 10년이 걸렸다.
AWS 람다 출시 후 거의 10년이 지난 지금, 또 다른 전환점에 와 있다고 LambdaDB는 주장한다. 해결책은 기존 아키텍처에 서버리스 스티커를 붙이는 것이 아니라 처음부터 다르게 구축하는 것이다. 이들은 이러한 새로운 접근 방식을 '서버리스 네이티브'라고 명명했다.
LambdaDB의 혁신적 접근법
서버리스 네이티브 아키텍처는 모든 인프라 관리를 클라우드 제공업체로 이관한다. 서버 클러스터 대신 완전히 스테이트리스 함수와 서버리스 서비스에 의존한다. 이 공유형 접근법은 클라우드 인프라를 하나의 거대한 슈퍼컴퓨터, 즉 진정한 클라우드 규모 컴퓨터로 취급한다.
진정한 서버리스 네이티브인지 판단하는 간단한 리트머스 테스트가 있다. 쿠버네티스 클러스터, 단일 VM 또는 기타 컴퓨팅 서버를 프로비저닝하지 않고도 클라우드 계정에 배포할 수 있는가? 답이 '아니오'라면 서버리스 네이티브가 아니다.
LambdaDB 아키텍처와 작동 원리
LambdaDB는 첫 번째 원칙부터 서버리스 네이티브로 구축된 새로운 검색 엔진이다. 벡터, 전문, 하이브리드 검색을 필터링 및 정렬과 함께 제공하며, 특정 시점 복원 및 제로 카피 복제 등 엔터프라이즈급 기능을 모두 제로 인프라 관리로 제공한다.
LambdaDB는 AWS 내의 서버리스 함수와 리소스 모음으로 작동하여 데이터베이스 로직을 인프라에서 완전히 분리한다. 사용자 요청은 지역 게이트웨이를 통해 흘러들어와 제어 또는 데이터 함수로 라우팅되며, 빌더 함수가 주기적으로 모든 버퍼된 데이터를 S3 스토리지에 지속시킨다.
직관과는 반대로 LambdaDB는 람다의 단위당 가격이 EC2 인스턴스보다 높음에도 불구하고 서버풀 데이터베이스 대비 컴퓨팅 비용을 절감한다. 프로덕션 배포에서 고가용성과 내결함성을 보장하기 위해 최소 2개의 리더와 2개의 라이터가 필요한 중복성이 람다에서는 불필요하기 때문이다.
실제로 기업의 평균 컴퓨팅 활용률은 10-20%에 불과하며, 이는 서버리스 컴퓨팅이 50-90%의 비용을 절약할 수 있음을 의미한다. 실제 운영 서비스의 일주일간 트래픽 변동 차트를 보면 주중이 주말보다, 낮이 밤보다 트래픽이 높으며, 하루 중 최고 트래픽은 최저 트래픽의 약 7배에 달한다.
실증된 성능 데이터
LambdaDB의 성능과 확장성을 실증하기 위해 960차원 벡터 100만 개를 다양한 동시성 수준으로 컬렉션에 추가한 테스트 결과가 공개됐다. 초당 10개 업서트에서 중간 지연시간은 43ms에 불과했고 99번째 백분위수에서도 133ms였다. 트래픽이 100배 증가해도 지연시간은 유사하게 유지되어 뛰어난 쓰기 확장성을 보여줬다.
쿼리 지연시간도 다양한 로드 하에서 안정적이고 확장 가능했다. 99번째 백분위수 범위가 172ms에서 210ms였다. 함수 콜드 스타트로 인해 가끔 몇 초의 지연이 발생할 수 있지만, 프로덕션 데이터에 따르면 이는 호출의 0.01% 미만에서만 발생한다.
엔터프라이즈급 기능과 미래 계획
LambdaDB는 유휴 서버 비용 없이 일래스틱이나 파인콘 같은 주요 대안보다 10배 저렴하다고 주장한다. 사용자는 요청한 것과 사용한 스토리지에 대해서만 비용을 지불한다. 또한 구성 없이도 트래픽 급증을 처리하기 위해 밀리초 단위로 제로에서 수천 개의 병렬 함수로 진정한 즉석 무한 확장이 가능하다.
LambdaDB는 현재 매일 수십억 개의 문서에 걸쳐 수백만 건의 요청을 제로 관리로 처리하고 있다. 장기적으로는 관계형 데이터, 스트림, 키-값, 그래프 등 다른 데이터 모델도 동일한 서버리스 네이티브 아키텍처로 지원할 계획이다.
서버리스 컴퓨팅 시장이 지속적으로 성장하는 가운데, LambdaDB의 이러한 접근법이 업계에 새로운 패러다임을 제시할 것으로 전망된다. 기존 서버리스 데이터베이스 제공업체들의 대응과 함께 진정한 서버리스 네이티브 솔루션에 대한 시장의 반응이 주목된다.
현재 LambdaDB는 얼리 액세스 프로그램을 통해 서비스를 제공하고 있으며, 개발자들이 빠른 시작 가이드를 통해 직접 체험해볼 수 있도록 하고 있다.
한국정보기술신문 클라우드분과 유민건 기자 news@kitpa.org