한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 ·

AI 예보, 구름보다 먼저 움직인다—인공지능이 바꾸는 기상 서비스의 현재와 과제

발행일
읽는 시간3분 57초

[한국정보기술신문] 비가 올지, 눈이 올지 미리 아는 일은 수천 억 원의 경제적 손실을 막는 핵심 정보다. 그런데 전통적인 수치예보(NWP)는 지구 대기를 수백만 격자로 쪼개 미분방정식을 풀어야 해 슈퍼컴퓨터 시간이 모자랄 때가 많다.

계산 부담이 커지면 해상도나 갱신 주기를 줄일 수밖에 없고, 그때마다 예보의 ‘선명도’가 떨어진다. 기상청과 연구기관이 인공지능(AI)에 눈을 돌린 이유도 여기 있다. 학습이 끝난 AI는 수학식이 아니라 경험적 패턴으로 날씨를 예측해, 예보 속도를 극적으로 높일 수 있다.

AI는 수십 년치 관측·위성·레이더 데이터를 단번에 삼켜 패턴을 학습한다. 이렇게 길게 쌓인 ‘기후 기억’은 인간 예보관이 일일이 살피기 어려운 미묘한 상관관계까지 짚어 낸다.

또 다른 이점은 전력 소비다. 최고 성능 슈퍼컴 한 번 돌릴 전기로, 랩톱 GPU 한 대가 AI 예보를 완성할 수 있다는 연구도 나왔다. 친환경·저비용을 동시에 노릴 수 있다는 얘기다.

수치예보를 완전히 대체하긴 이르지만, AI가 빠른 ‘값싼’ 1차 결과를 던져주고, 슈퍼컴이 세밀한 교정을 맡는 하이브리드 전략이 이미 현실이 됐다.

실제로 유럽·미국·일본 등 주요 기관은 “2030년대 중반엔 AI 예보가 일상 서비스의 절반 이상을 차지할 것”이라는 로드맵을 공표했다.

AI 모델, 누구냐 넌

image.png
구글 그래프캐스트 영상, 구글 딥마인드 제공

2023년 11월, 구글 딥마인드가 공개한 ‘그래프캐스트(GraphCast)’는 10일짜리 전 지구 예보를 1분 만에 돌려 ‘충격’이라는 평가를 얻었다. 동급 해상도의 ECMWF 수치모델보다 90% 지표에서 더 정확했다는 논문 결과가 뒤따랐다.

엔비디아와 캘텍이 2022년에 발표한 ‘포캐스트넷(FourCastNet)’도 대표 주자다. 이 모델은 물리 방정식을 부분적으로 학습한 ‘물리 기반 AI(physics-ML)’ 기법을 채택해 18킬로미터 해상도를 초당 수십 회 예측한다.

중국 화웨이는 2023년 ‘판구-웨더(Pangu-Weather)’를 내놓아, 24시간 후 대기 흐름 예측에서 ECMWF 대비 오차를 20 % 줄였다고 발표했다. ECMWF는 즉시 오픈소스 도구를 만들어 이들 모델을 내부 검증 파이프라인에 연결했다.

단기 국지 예보에서는 구글 리서치의 ‘메트넷-3(MetNet-3)’가 돋보인다. 1~4킬로미터 해상도로 2분 단위 강수 예보를 제공하며, 24시간짜리 ‘고해상도 영상’을 뽑아낸다.

image.png
GRAF, IBM 제공

IBM은 2019년부터 ‘GRAF(Global High-Resolution Atmospheric Forecast System)’을 운영해 왔다. 세계 최초로 3킬로미터급 격자를 1시간마다 갱신하는 모델로, 머신러닝 기반 동·정지 위성 데이터 융합 기법을 채택했다.

미국 NOAA와 영국 Met Office도 AI 전담 조직을 세우고 있다. NOAA는 2021년 ‘AI 센터(NCAI)’를 출범해 중장기 AI 예보 챌린지를 열었고, Met Office는 2024년 튜링연구소와 공동으로 자체 AI 모델을 개발 중이다.

데이터·알고리즘·하드웨어 삼각편대

image.png
Accelerating Extreme Weather Prediction with FourCastNet, 엔비디아 제공

AI 날씨 모델의 성패는 ‘얼마나 많은 과거’를 학습했느냐에 달려 있다. GraphCast는 ECMWF 40년치 재분석(Re-analysis) 데이터를, FourCastNet은 1979년 이후 ERA5 10테라바이트 이상을 학습 데이터로 삼았다.

모델 구조도 진화했다. GraphCast는 지역 간 상호작용을 그래프로 표현하는 GNN(Graph Neural Network)을, FourCastNet은 대기 변화를 영상으로 간주해 비전 트랜스포머를 사용한다.

하드웨어는 GPU·TPU 클러스터가 대세다. 학습에만 수천 개의 A100 GPU가 투입되기도 하지만, 한 번 훈련된 모델은 엔비디아 RTX 한 장으로도 실시간 추론이 가능하다.

이런 ‘한 번 훈련, 어디서나 추론’ 구조 덕분에 개발도상국 기상청도 AI 모델을 바로 구동할 수 있다는 평가가 나온다. 클라우드 API 형태로 호출하면 슈퍼컴 없이도 전 지구 예보가 떨어진다.

데이터 전처리와 검증 파이프라인도 중요해졌다. ECMWF는 2023년 ‘AIFS(Artificial Intelligence/Integrated Forecasting System)’ 프로젝트로 수치모델, AI모델, 검증 도구를 통합했다.

한국 기상청도 2024년부터 ‘AI-날씨 챌린지’를 열어 전국 레이더·위성·관측 자료를 오픈한 상태다. 국내 스타트업·대학이 자체 모델을 만들고, 공모전 결과는 현업 예보관 해석 지원에 활용된다.

정확도는 뛰지만, 한계도 존재

여러 논문이 “AI 모델이 5일 예보까지는 수치예보와 대등하거나 우수하다”고 평가했지만, 태풍 급격 발달·대기 대순환 변화처럼 드문 사건엔 여전히 약점을 드러낸다. GraphCast의 경우 2023년 허리케인 오티스 RI(폭발적 강화)를 과소 예측했다.

이는 AI가 과거 통계에 의존하기 때문인데, 극단적 이벤트가 데이터세트에 적게 포함돼 있으면 예측이 흔들린다. 기후변화로 ‘전례 없는’ 기상이 잦아진다는 점도 불확실성을 키운다.

또 하나의 도전은 ‘해석 가능성’이다. 수치모델은 물리 법칙에 기반하지만, 딥러닝 모델은 ‘왜 그런 예측을 했는지’ 설명하기 어렵다. 예보관 입장에선 신뢰 구축이 중요하다.

하이브리드 방식이 등장한 배경이다. Met Office는 AI 예보를 수치모델 초기장으로 넣거나, 수치결과를 AI로 보정하는 방법을 시험 중이다. 이렇게 하면 두 모델의 장점을 결합할 수 있다.

데이터 품질 관리도 골칫거리다. 관측 장비 교체나 결측 구간이 많으면 모델 성능이 출렁인다. 연구자들은 가짜 영상 생성(GAN)이나 시계열 보간으로 빈틈을 메우지만, 과도한 인공보정은 새 오류를 부를 수 있다.

마지막으로, 글로벌 공조가 필요하다. 국가별 관측 데이터가 제각각 포맷을 쓰면 AI 학습 효율이 떨어진다. WMO는 2024년 ‘AI-Ready Weather Data’ 표준화를 논의하기 시작했다.

산업·일상에 미치는 파장

image.png
웨더뉴스 사장 겸 대표이사 이시바시 토모히로, 구글 리서치 프로그램 매니저 이살로 몬타큐트, 구글 검색 제품 매니저 마야 에크론, 웨더뉴스 제공

항공사는 AI 난류 예보로 안전·연료 두 마리 토끼를 잡는다. 구글과 웨더뉴스가 2024년부터 일본 항로에 ‘AI Nowcast’를 제공해 착륙 지연을 12% 줄였다는 내부 보고가 있다.

재생에너지 기업도 수혜자다. 태양광·풍력 출력은 날씨 민감도가 크다. AI 예보가 분 단위 일사량과 풍속을 잡아내면, 전력 시장에서 효율적인 발전 계획을 세울 수 있다.

보험 업계는 극한 기상 리스크 모델링에 AI 결과를 결합한다. 오스트리아의 한 재보험사는 FourCastNet 기반 리스크맵으로 홍수 손실 추정 오차를 30% 줄였다고 밝혔다.

농업 현장에선 모바일 앱으로 ‘다음 주 서리 위험도’를 받아본다. 국내 스타트업 A사는 GraphCast 파생 예보를 농가 맞춤판으로 가공해, 생산량 손실을 15% 줄였다고 주장한다.

일반 소비자도 체감한다. 기상청 ‘AI 미세먼지 예보’는 레이더·위성 데이터를 딥러닝으로 분석해 6시간 앞 미세먼지 급변 포인트를 알려준다. 외출 계획을 세우는 시민들에게 실시간 알림이 도착한다.

요컨대 AI 기상예보는 슈퍼컴 투자 장벽을 낮추고, 초단기부터 중기까지 예보 정확도를 끌어올리는 ‘게임 체인저’로 떠오르고 있다. 다만 기후변화와 극단 현상이 늘어나는 만큼, 데이터·물리·AI를 아우르는 융합 연구가 필수다.

한국정보기술신문 인공지능분과 이지원 기자 news@kitpa.org