<НА ГЛАВНУЮ

Cisco представила модель временных рядов для улучшенного прогнозирования

Новая модель Cisco оптимизирует прогнозирование временных рядов для метрик безопасности.

Обзор модели Cisco Time Series

Cisco и Splunk представили Cisco Time Series Model, унивариантную нулевую модель временных рядов, предназначенную для мониторинга и метрик безопасности. Она выпущена в виде открытого контрольного пункта на Hugging Face под лицензией Apache 2.0 и нацелена на прогнозирование нагрузки без необходимости в специализированной настройке под задачи. Модель расширяет TimesFM 2.0 с помощью явной многорезолюционной архитектуры, которая объединяет грубую и тонкую историю в одном контекстном окне.

Почему мониторинг нуждается в многорезолюционном контексте

Производственные метрики – это сложные сигналы. Недельные паттерны и долгосрочные тенденции роста видны только на грубых разрешениях, в то время как события насыщения и резкие скачки трафика проявляются на интервалах в 1 или 5 минут. Обычные модели для временных рядов в основном работают на едином разрешении, с окнами контекста от 512 до 4096 точек. Модель временных рядов пополняет этот дефицит, поддерживая до 16 384 точек, что учитывает ограничения, часто наблюдаемые в мониторинге, когда данные часто хранятся в агрегированных формах.

Многорезолюционный ввод и задача прогнозирования

Модель работает с парой контекстов, (xc, xf), где как грубый контекст (xc), так и тонкий контекст (xf) имеют длину до 512. Интервал (xc) фиксирован в 60 раз больше, чем у (xf). Модель прогнозирует 128 тонких этапов разрешения, выдавая как средние, так и квантильные результаты.

Архитектура: ядро TimesFM с разрешающими эмбеддингами

Cisco Time Series Model использует основанную на патчах декодирующую цепочку, основанную на TimesFM. Она нормализует входные данные, разбивает их на неперекрывающиеся куски и обрабатывает через остаточный эмбеддинг-блок. Архитектура состоит из 50 слоев только декодера и заменяет позиционные эмбеддинги на структуру многорезолюции, повышая эффективность моделирования.

Данные для обучения и методология

Эта модель обладает 500 миллионами параметров и тренируется с использованием AdamW для смещений, норм и эмбеддингов, а также Muon для скрытых слоев. Обучающая выборка включает около 400 миллионов метрик временных рядов, собранных из Splunk Observability Cloud, что в итоге составляет более 300 миллиардов уникальных точек данных.

Результаты бенчмаркинга по мониторингу и GIFT Eval

Бенчмаркинг на основе датасетов наблюдаемости с разрешением 1 и 5 минут показывает, что модель Cisco Time Series уменьшает среднюю абсолютную ошибку по сравнению с TimesFM 2.0. На бенчмарке GIFT Eval она конкурентоспособна с другими моделями, сохраняет стабильное качество прогнозирования.

Ключевые выводы

  1. Модель Cisco Time Series предназначена для нулевой модели временных рядов, улучшая мониторинг и метрики безопасности.
  2. Она использует многорезолюционный контекст, добиваясь точности предсказания за счет уникальной архитектуры.
  3. Модель обучалась на разнообразном наборе данных, превышающем 300 миллиардов точек данных, и имеет около 500 миллионов параметров.
  4. На нескольких бенчмарках она постоянно превосходит предыдущие модели, демонстрируя свои сильные стороны в задачах наблюдаемости.
🇬🇧

Switch Language

Read this article in English

Switch to English