클라우드 ·
AWS 미국 동부 리전 대규모 장애 발생...전 세계 주요 서비스 마비
AWS 미국 동부 리전에서 발생한 서버 장애로 코인베이스, 퍼플렉시티, 포트나이트 등 전 세계 주요 온라인 서비스가 동시다발적으로 마비됐다.
[한국정보기술신문] 아마존웹서비스(AWS)에서 대규모 서버 장애가 발생해 전 세계 주요 인터넷 서비스가 일시 중단되는 사태가 벌어졌다. 20일 업계에 따르면 한국시각 오후 4시경 AWS 미국 동부 리전(US-EAST-1)에서 오류율과 지연시간이 급격히 증가하면서 관련 서비스들이 대거 마비됐다.
IT 장애 모니터링 사이트 다운디텍터에는 수천 건의 오류 신고가 접수됐으며, AWS는 원인을 조사해 복구 작업을 진행 중인 것으로 전해졌다. 이번 장애는 AWS의 핵심 거점인 미국 버지니아주 노스버지니아 데이터센터에서 발생한 것으로 추정되며, 이 지역은 전 세계 인터넷 트래픽의 주요 허브로 장애가 글로벌 서비스에 광범위하게 파급됐다.
글로벌 주요 서비스 동시 마비
이번 장애로 인공지능 검색 서비스 퍼플렉시티를 비롯해 디지털자산 플랫폼 코인베이스와 로빈후드, 게임 플랫폼 포트나이트와 로블록스, 메신저 앱 스냅챗, 아마존 알렉사, 업무 메신저 슬랙 등 주요 글로벌 플랫폼이 일시 중단됐다. 듀오링고, 링, 타이달, 에어테이블, 캔바, 맥도날드 앱까지 접속 불가 상태가 됐다.
퍼플렉시티는 오후 4시 이후 홈페이지에서 죄송합니다, 문제가 발생했습니다 문구가 표시되며 검색과 연구 기능이 중단됐다. 아라빈드 스리니바스 퍼플렉시티 최고경영자는 소셜미디어를 통해 퍼플렉시티가 현재 다운됐다. 원인은 AWS 이슈이며, 해결 작업을 하고 있다고 밝혔다.
코인베이스 고객지원팀은 현재 AWS 장애로 인해 다수의 사용자가 코인베이스에 접속할 수 없는 상황을 인지하고 있다며 문제 해결을 위해 팀이 즉시 대응 중이며, 모든 자금은 안전하다고 밝혔다.
국내 서비스도 여파
국내에서도 AWS 클라우드를 사용하는 기업이 많아 피해가 발생했다. 삼성닷컴에서 일부 접속 문제가 발생했고 크래프톤의 대표 게임 배틀그라운드에서도 서버 접속 장애가 이어진 것으로 알려졌다. 배틀그라운드에 접속하면 현재 접속 유저가 많아 접속이 어렵습니다. 나중에 다시 시도하세요라는 오류 창이 떴다.
크래프톤 관계자는 AWS에서 장애가 발생하며 현재 배틀그라운드에도 영향이 발생했다고 설명했다. 현재 국내 주요 대기업인 삼성전자, 현대자동차, 넥슨 등도 AWS 인프라를 활용하고 있어 장애가 확산될 경우 더 큰 여파가 우려된다.
업계 관계자는 국내 주요 서비스들도 AWS 클라우드에 기반을 두고 있어 미국 동부 리전에서 발생한 장애라 하더라도 일정 부분 영향을 받았을 가능성이 높다고 말했다.
DynamoDB DNS 해석 문제 추정
AWS는 다수 서비스들이 운영 문제로 영향을 받고 있다며 미국 동부 리전 내 여러 AWS 서비스들에 나타나는 오류 급증과 지연 문제를 조사하고 있다고 밝혔다. 특히 다이나모DB(DynamoDB)에 들어오는 요청에서 오류가 급증하고 있으며, 이로 인해 다른 AWS 서비스도 영향을 받고 있다고 설명했다.
AWS는 태평양시간 기준 오전 12시 11분부터 오류율 증가와 지연 현상이 감지됐으며, 다이나모DB API 요청에 대해 심각한 장애가 발생했다고 밝혔다. 오전 2시 1분에는 다이나모DB API 엔드포인트의 DNS 해석 문제를 장애 원인으로 추정하고 있다며 복구를 가속화하기 위해 여러 경로로 대응 중이라고 설명했다.
오전 2시 22분에는 일부 서비스에서 초기 복구 징후가 나타나고 있으나, 여전히 요청 실패가 발생할 수 있어 고객에게 재시도를 권고했다. AWS는 문제가 완전히 해결될 때까지 지속적으로 정보를 업데이트할 예정이며, 장애로 인한 작업 백로그가 남아 있어 일부 서비스는 정상화까지 시간이 더 걸릴 수 있다고 밝혔다.
클라우드 의존도 높아 파급력 커
AWS는 글로벌 클라우드 컴퓨팅 시장 점유율 30퍼센트 이상을 차지하는 1위 사업자로, 이번 사태는 인터넷 전반에 광범위한 영향을 줬다. 다이나모DB와 일래스틱컴퓨트클라우드(EC2)는 수천 개 기업이 자체 애플리케이션을 운영하기 위해 사용하는 데이터베이스 및 컴퓨팅 자원을 제공하는 핵심 서비스다.
이번 장애는 현대 인터넷 서비스의 클라우드 의존도가 얼마나 높은지를 보여주는 사례로, 단일 클라우드 사업자의 장애가 전 세계 수많은 서비스에 동시다발적인 영향을 미칠 수 있음을 확인시켰다. 업계에서는 멀티 클라우드 전략의 필요성이 본격적으로 제기될 것으로 보인다.
한국정보기술신문 클라우드분과 이준호 기자 news@kitpa.org