한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

GPU 공유 기반 LLM 서비스 'sllm' 출시...월 10~40달러로 대형 언어모델 이용

thumbnail.webp
코호트 구독 방식으로 GPU 인프라 비용 절감
[한국정보기술신문] GPU 자원을 여러 사용자가 공유해 대형 언어모델에 저렴하게 접근할 수 있는 서비스 'sllm'이 출시됐다. '코호트 구독' 방식을 통해 기존 서비스보다 합리적인 가격에 LLM을 이용할 수 있다.
sllm은 Llama-4-Scout-109B, Qwen-3.5-122B, GLM-5-754B, Kimi-K2.5-1T, DeepSeek-V3.2-685B 등 다양한 대규모 언어모델을 제공한다. 사용자는 필요에 따라 적합한 모델을 선택할 수 있다.
서비스는 초당 15~35 토큰의 처리 속도를 제공하며, 가용성은 모델과 구독 플랜에 따라 차이가 있다. 월간 또는 분기 약정 옵션을 통해 더욱 유연한 이용이 가능하다.
기존의 개별 GPU 임대나 API 서비스와 달리, sllm은 여러 사용자가 GPU 인프라를 공유하는 방식으로 비용을 대폭 절감했다. 월 10달러부터 40달러까지의 합리적인 요금으로 고성능 LLM에 접근할 수 있다.
이러한 공유 경제 모델은 개인 개발자나 소규모 스타트업이 대형 언어모델을 활용한 서비스를 개발하는 데 큰 도움이 될 것으로 전망된다.
한국정보기술신문 클라우드분과 이준호 기자 news@kitpa.org

함께 읽으면 좋은 기사

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

인공지능 3
게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

인공지능 2
정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

인공지능 · 반도체 · 유관기관 3
구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

인공지능 2
애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

정보기술 2
엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

정보기술 · 인공지능 3
파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

정보기술 2
롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

정보기술 1
엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

인공지능 · 정보기술 4
앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

인공지능 4
산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

유관기관 · 인공지능 2
개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

정보보안 · 유관기관 2