SEA-LION v4: мультимодальная эффективная модель для языков Юго-Восточной Азии

Коротко о SEA-LION v4

AI Singapore (AISG) совместно с Google представили SEA-LION v4 — открытую мультимодальную модель на базе Gemma 3 (27B). Она заточена под языки Юго-Восточной Азии, включая низкоресурсные языки и диалекты, и сочетает обработку текста и изображений с коммерчески разрешительной лицензией и возможностью простого развёртывания на стандартном оборудовании.

Результаты на SEA-HELM

Модель была протестирована на бенчмарке SEA-HELM, специально разработанном для языков региона. Несмотря на компактный размер в 27 миллиардов параметров, v4 занимает первое место среди моделей до 200B и пятую позицию из 55 моделей в общем зачёте. Основные показатели:

Filipino: 74.53 (v4) против 74.09 (Gemma 3-27B)
Malay: 71.31 (v4) против 71.20 (Gemma 3-27B)
Tamil: 68.47 (v4) против 68.45 (Gemma 3-27B)
Burmese: 57.18 (v4), почти на уровне Gemma 3 и превосходит более крупные MoE-модели

В ряде языков SEA-LION v4 показывает результаты, сопоставимые или превосходящие модели в 3–10 раз большего размера, что свидетельствует о сочетании эффективности и качества для исследований и промышленного применения.

Технические улучшения

SEA-LION v4 включает несколько важных усовершенствований:

Открытый доступ и разрешительная лицензия: выпуск под лицензией Gemma с поддержкой размещения на Hugging Face, Google Cloud Vertex AI, AWS SageMaker, Kaggle, NVIDIA NIM и Ollama.
Эффективность и портативность: квантизированные версии в FP4 и FP8 дают менее 0.5% падения качества по сравнению с полной точностью, ускорение вывода до 50% и возможность запуска на обычных устройствах, например ноутбуке с 32GB RAM.
Мультимодальность: первая мультимодальная версия проекта, поддерживающая анализ изображений вместе с текстом и способная работать с контекстом до 128K токенов для длинных документов и многошаговых диалогов.
Агентные и структурированные взаимодействия: функция вызова внешних API, генерация структурированных JSON-ответов и совместимость с агентными рабочими процессами.

Тренировка и региональная направленность

Модель обучалась на более чем триллионе токенов с акцентом на тщательно подобранный набор данных по странам Юго-Восточной Азии. Такое доменное обучение повышает качество работы с низкоресурсными языками, диалектами и культурно-специфичными контекстами, где глобальные модели часто дают слабые результаты. На задачах SEA-HELM по Filipino, Malay, Tamil и Burmese v4 стабильно находится в числе лидеров.

В то же время унаследованная от Gemma хорошая общая способность к рассуждению делает модель конкурентоспособной и для англоязычных и международных задач.

Применение и доступность

SEA-LION v4 упрощает доступ к качественным мультимодальным моделям в регионе. Примеры использования:

Многоязычный анализ документов и перевод с изображениями
Вопросно-ответные системы на основе изображений на локальных языках
Интерактивные агенты и автоматизация рабочих процессов с структурированными выходами

Благодаря открытому распространению и переносимости модель подходит для облачных интеграций и локальных развёртываний, что способствует цифровому равенству в регионе.

Где посмотреть

Модель доступна на Hugging Face и поддерживается на нескольких облачных и edge-платформах. Также доступны обучающие материалы, ноутбуки и SEA-LION playground для экспериментов и внедрения.