한국정보기술진흥원
한국정보기술신문
thumbnail

정보보안 · 클라우드 ·

클라우드플레어 대규모 장애로 웹사이트 접속 불능...중앙화 서비스의 위험성 재조명

발행일
읽는 시간1분 55초

11월 18일 오후 클라우드플레어 서비스 장애로 수많은 웹사이트가 동시 다운되며 단일 장애 지점의 위험성이 다시 한번 드러났다.

[한국정보기술신문] 현지시각 11월 18일 12시 43분(UTC), 글로벌 콘텐츠 전송 네트워크(CDN) 및 DDoS 보호 서비스 제공업체인 클라우드플레어(Cloudflare)에서 대규모 장애가 발생하면서 이 서비스를 이용하는 수많은 웹사이트가 동시에 접속 불능 상태에 빠졌다. 이용자들이 웹사이트에 접속하려 할 때 절반 가량의 사이트에서 오류 메시지가 표시되는 현상이 발생했다.

이번 장애는 월 방문자 수천 명 수준의 작은 규모 웹사이트부터 대형 사이트까지 광범위하게 영향을 미친 것으로 알려졌다. 클라우드플레어와 같은 중앙화된 서비스를 이용할 경우, 해당 서비스가 단일 장애 지점(Single Point of Failure)이 되어 대규모 인터넷 서비스 중단을 초래할 수 있다는 점이 다시 한번 입증됐다.

과도한 DDoS 공격 우려가 클라우드플레어 의존 초래

image.png
커뮤니티 캡처

많은 웹사이트 운영자들이 클라우드플레어를 사용하는 주된 이유는 DDoS(분산 서비스 거부) 공격에 대한 보호 때문이다. 그러나 정보보안 전문가들은 소규모 웹사이트의 경우 실제로 DDoS 공격의 대상이 될 가능성이 매우 낮다고 지적한다.

보안 업계에서는 "누구도 당신에게 제로데이 취약점을 낭비하지 않는다"는 말이 있다. 이는 소규모 목표물에 대해 귀중한 공격 자원을 사용하지 않는다는 의미다. 월 방문자 수백 명 수준의 작은 블로그의 경우에도 마찬가지로, 공격자가 DDoS 공격 역량을 소진할 만한 가치가 없다는 것이다.

분산형 웹의 역설

흥미로운 점은 많은 사람들이 분산형 웹의 중요성을 강조하면서도, 정작 자신의 웹사이트는 클라우드플레어와 같은 중앙화된 서비스 뒤에 배치한다는 것이다. 이는 분산화에 대한 담론과 실제 행동 사이의 모순을 보여준다.

이번 장애 사례는 대형 기업이라 할지라도 실수를 하고 서비스가 중단될 수 있다는 사실을 다시 한번 상기시켰다. 클라우드플레어는 업계에서 확고한 입지를 가진 기업이지만, 이러한 기업도 예기치 않은 장애로부터 자유롭지 않다.

대안으로 제시되는 라운드로빈 DNS

서버 다운에 대비하고 싶다면, 클라우드플레어와 같은 중앙화된 서비스에 의존하기보다는 다른 위치에 두 번째 버전의 웹사이트를 구축하고, A 레코드와 AAAA 레코드를 통해 해당 서버를 가리키는 라운드로빈 DNS 방식을 사용할 것을 전문가들은 권고한다.

이 방식은 여러 서버에 트래픽을 분산시켜, 하나의 서버에 장애가 발생하더라도 다른 서버가 서비스를 계속 제공할 수 있도록 한다. 중앙화된 단일 서비스에 의존하는 것보다 진정한 의미의 분산화를 구현할 수 있는 방법이다.

두려움을 극복하고 직접 운영해야

일각에서는 웹사이트 운영자들이 과도한 두려움으로 인해 실제로 필요하지 않은 서비스에 의존하게 된다고 지적한다. 서비스가 다운될 수 있다는 두려움을 직면하고, 직접 인터넷에 서비스를 배치하는 것이 장기적으로는 더 건강한 웹 생태계를 만드는 길이라는 것이다.

물론 서비스가 일시적으로 중단될 수 있지만, 적어도 클라우드플레어와 같은 제3자 서비스의 또 다른 장애로 인한 피해는 피할 수 있다. 이번 사례는 중앙화된 서비스에 대한 과도한 의존이 오히려 더 큰 위험을 초래할 수 있음을 보여주는 교훈이 됐다.

한국정보기술신문 정보보안분과 이승기 기자 news@kitpa.org