한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

클라우드플레어, 에이전트 최적화 AI 플랫폼 발표...단일 API로 14개 제공업체 70여 모델 통합 지원

thumbnail.webp
글로벌 CDN 기업이 AI 추론을 위한 통합 레이어로 AI 에이전트 개발 시장 공략 나서
[한국정보기술신문] 글로벌 콘텐츠 전송 네트워크 기업 클라우드플레어가 AI 에이전트 개발에 특화된 AI 플랫폼을 발표했다고 16일(현지시간) 공식 블로그를 통해 밝혔다. 이 플랫폼은 단일 API를 통해 여러 AI 모델 제공업체의 서비스를 이용할 수 있게 해준다.

통합 AI 추론 레이어 제공

클라우드플레어 AI 게이트웨이는 'AI를 위한 통합 추론 레이어'로 설계됐다. 개발자들은 OpenAI, 앤트로픽, 구글 등 14개 이상의 제공업체에서 70여 개 모델에 단일 API 엔드포인트로 접근할 수 있다. 코드 한 줄만 수정하면 다른 모델로 전환이 가능하다.

에이전트 개발 최적화

이번 플랫폼의 핵심은 AI 에이전트 개발에 특화된 기능이다. 일반적인 AI 애플리케이션과 달리 에이전트는 여러 단계의 추론 호출이 연결되어 있어 단일 제공업체 지연이 전체 성능에 큰 영향을 미친다. 클라우드플레어는 전 세계 330개 이상 데이터센터를 통해 지연시간을 최소화하고 다단계 워크플로우의 안정성을 높인다고 설명했다.

비용 관리와 안정성 강화

플랫폼은 여러 제공업체에 걸친 AI 지출을 중앙화하여 관리할 수 있게 해준다. 사용자는 고객별, 사용자 등급별, 워크플로별로 비용을 추적하기 위해 맞춤 메타데이터를 추가할 수 있다. 또한 자동 장애 조치 기능을 통해 한 제공업체에 장애가 발생하면 요청을 대체 제공업체로 라우팅한다.

맞춤 모델 배포 지원

리플리케이트의 Cog 기술과 통합하여 개발자들은 자체 미세조정 모델을 컨테이너화하고 워커스 AI 인프라에 배포할 수 있다. 스트리밍 응답이 독립적으로 버퍼링되어 중복 요금 없이 재연결이 가능하다.

통합 옵션과 SDK 제공

현재 워커스 바인딩을 통한 AI.run() API를 지원하며, REST API 지원도 곧 추가될 예정이다. 장기 실행 애플리케이션을 위한 에이전트 SDK도 제공한다.
클라우드플레어는 이번 플랫폼이 여러 모델 제공업체 간 유연성과 세밀한 비용 가시성이 필요한 AI 기반 애플리케이션 및 에이전틱 시스템 개발자들을 대상으로 한다고 밝혔다.
한국정보기술신문 클라우드분과 이준호 기자 news@kitpa.org

함께 읽으면 좋은 기사

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

인공지능 3
게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

인공지능 2
정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

인공지능 · 반도체 · 유관기관 3
구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

구글, 자사 AI로 'I/O 2026' 행사 직접 제작...제미나이·나노 바나나 전면 투입

인공지능 2
애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

애플, 접근성 기능 이유로 받아쓰기 앱 등록 거부...손 부상 개발자, 앱 두 버전으로 갈라 대응

정보기술 2
엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

엔비디아, AI·RTX 그래픽 합친 'RTX 스파크 슈퍼칩' 공개...슬림 노트북·소형 데스크톱 겨냥

정보기술 · 인공지능 3
파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

파이러트베이, 압수수색 20년 지나도 건재...사흘 만의 부활이 단속을 무색하게 만들다

정보기술 2
롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

롤·발로란트도 ARM 윈도우서 돌아간다...라이엇, 인기 게임 지원 공식화

정보기술 1
엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

엔비디아, 윈도우용 AI 슈퍼컴퓨터 'DGX 스테이션' 공개...GB300 기반으로 1조 파라미터 모델 로컬 구동, 올해 4분기 출시

인공지능 · 정보기술 4
앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

앤트로픽, 최상위 모델 '클로드 오푸스 4.8' 출시...벤치마크 끌어올리고 '노력 제어'·'동적 워크플로'로 협업 강화, 가격은 그대로

인공지능 4
산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

산업통상부, 부내 행정업무에 AI 도입 본격 추진...AI 혁신 자문단 출범하고 거버넌스·서비스·역량 3대 과제 가동

유관기관 · 인공지능 2
개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

개인정보위·프랑스 CNIL, 아동·청소년 'AI 안전 사용' 포스터 공동제작...질문 6가지로 풀어내 전국 초·중·고에 배포

정보보안 · 유관기관 2