WeatherNext 2 от DeepMind: функциональная генеративная сеть для быстрых вероятностных прогнозов на 15 дней
'WeatherNext 2 от DeepMind применяет функциональную генеративную сеть и большой ансамбль для генерации быстрых и точных вероятностных 15‑дневных прогнозов, уже интегрированных в сервисы Google.'
Что такое WeatherNext 2
DeepMind представила WeatherNext 2, систему среднесрочного глобального прогнозирования погоды на основе ИИ, которая уже обновляет прогнозы в Google Search, Gemini, Pixel Weather и Weather API платформы Google Maps. Полная интеграция с картами ожидается. Система формирует вероятностные 15-дневные траектории погоды с разрешением 0.25° и шагом 6 часов, и доступна в виде дата-продуктов в Earth Engine, BigQuery и как ранний доступ на Vertex AI.
Архитектура Functional Generative Network
Сердцем WeatherNext 2 является Functional Generative Network (FGN). Вместо прогноза единственного детерминированного поля FGN напрямую дискретизирует совместное распределение полных 15-дневных глобальных траекторий. Состояние X_t включает шесть атмосферных переменных на 13 уровнях давления и шесть поверхностных переменных на сетке 0.25° с шагом 6 часов.
Модель переводит регулярную сетку в латентное представление на сферической икосаэдральной сетке, уточненной в шесть раз. Энкодер и декодер на графовой нейросети обеспечивают переходы между сеткой и мешем, а графовый трансформер работает по узлам меша. Продакшен-модель крупнее GenCast: примерно 180 миллионов параметров на сид, латентное пространство 768 и 24 слоя трансформера, в то время как GenCast имел 57 миллионов параметров, латент 512 и 16 слоев. Генерация ансамбля происходит автогресcивно из двух начальных анализных кадров.
Учёт эпистемической и алеаторической неопределённости
WeatherNext 2 разделяет эпистемическую и алеаторическую неопределённости в масштабируемой архитектуре. Эпистемическая неопределённость моделируется глубоким ансамблем из четырёх независимо инициализированных FGN сидов. Для каждого сида генерируется равное число членов ансамбля.
Алеаторическая неопределённость задаётся через функциональные возмущения. На каждом шаге прогноза модель выбирает 32-мерный гауссов шум epsilon_t и пропускает его через условные нормализации с разделяемыми параметрами внутри сети. Это эквивалентно выбору нового набора весов theta_t для данного прохода. Разные реализации шума дают динамически согласованные альтернативные прогнозы для одного начального состояния, то есть члены ансамбля представляют правдоподобные альтернативы, а не независимый шум в каждой ячейке.
Обучение по маргиналям с CRPS и обучение совместной структуры
FGN обучается только по маргиналам для каждой точки и переменной, используя Continuous Ranked Probability Score (CRPS) как функцию потерь. CRPS оценивается честно по образцам ансамбля в каждой точке и усредняется по переменным, уровням и времени, что стимулирует точные и хорошо откалиброванные предсказания для скалярных величин. На поздних этапах обучения вводят короткие автогрессивные развертки до восьми шагов и выполняют обратное распространение через них для повышения стабильности на большом горизонте.
Несмотря на маргинальное обучение, низкоразмерный глобальный шум и совместные функциональные возмущения заставляют модель изучать правдоподобную совместную пространственную и межпеременную структуру. Один 32-мерный вектор шума, влияющий на всё поле, поощряет кодирование физических пространственных корреляций и взаимосвязей между переменными, что эффективнее снижает CRPS, чем независимые флуктуации. Эксперименты показывают, что ансамбль воспроизводит реалистичные региональные агрегаты и производные величины.
Результаты и практическая значимость
По маргинальным метрикам ансамбль FGN улучшает GenCast в 99.9% случаев по комбинациям переменных, уровней и времён прогноза, со средним улучшением CRPS около 6.5% и максимальными выигрышами до 18% для некоторых переменных на коротких горизонтах. Среднеквадратичная ошибка среднего ансамбля также снижается при сохранении корректных отношений между разбросом ансамбля и ошибкой прогноза до 15 дней.
Для оценки совместной структуры исследователи использовали пуллинг CRPS по пространственным окнам и производные величины, такие как скорость ветра на 10 метрах и разность геопотенциальной высоты между 300 и 500 гПа. FGN показывает лучшее поведение по пуллированному CRPS, то есть лучше моделирует региональные агрегаты и многомерные зависимости.
Отслеживание тропических циклонов — важный кейс. С использованием внешнего трекера FGN показывает ошибки позиции, эквивалентные примерно одному дополнительному дню полезного предсказательного умения по сравнению с GenCast. Даже при ограничении до шага 12 часов FGN превосходит GenCast за пределами двух дней прогноза. Анализ относительной экономической ценности также в пользу FGN для разных соотношений затрат и потерь, что критично для принятия решений по эвакуации и защите активов.
Доступность
WeatherNext 2 представлен в Earth Engine и BigQuery, а также как ранний доступ на Vertex AI. Он уже используется в обновлённых погодных функциях Google Search, Gemini и Pixel Weather, и доступен через Weather API платформы Google Maps, с расширенной интеграцией карт в планах. Для технических деталей и исходных материалов авторы публикуют статью, проектную страницу и репозиторий с туториалами и ноутбуками.
Switch Language
Read this article in English