Claude Haiku 4.5 от Anthropic: уровень Sonnet 4 в кодинге за треть цены и с двойной скоростью
Что такое Claude Haiku 4.5
Anthropic выпустила Claude Haiku 4.5, оптимизированную для низкой задержки «малую» модель, предназначенную для интерактивных и чувствительных к стоимости задач. Модель обещает производительность в задачах кодирования, сопоставимую с Claude Sonnet 4, при более чем двукратно большей скорости и примерно в три раза меньшей стоимости. Haiku 4.5 уже доступна через API Anthropic и в каталогах партнеров на Amazon Bedrock и Google Cloud Vertex AI.
Целевые сценарии и позиционирование
Haiku 4.5 ориентирована на ассистентов в реальном времени, автоматизацию поддержки клиентов, pair-programming и другие сценарии, где важны задержка и пропускная способность. Anthropic предлагает рассматривать Haiku 4.5 как замену Haiku 3.5 и как экономичную альтернативу Sonnet 4 в тех случаях, когда стоимость или отклик критичны. Sonnet 4.5 остается флагманской моделью для сложного многозадачного планирования, а Haiku 4.5 обеспечивает близкую к фронтиру производительность при лучшей стоимости.
Рекомендуемая архитектура использования
Anthropic рекомендует схему planner–executor: использовать Sonnet 4.5 для планирования и оркестрации многошаговых задач, а выполнение параллелизовать на пуле Haiku 4.5 воркеров. Такой подход сохраняет тяжелую логику на более мощной модели и снижает затраты и задержку при массовом выполнении задач.
Доступность и цены
Модель с идентификатором claude-haiku-4-5 доступна через API Anthropic. Anthropic также указывает наличие Haiku 4.5 в каталогах Amazon Bedrock и Google Cloud Vertex AI; конкретные идентификаторы и регионы могут обновляться. Цены на старте: $1 за миллион входных токенов и $5 за миллион выходных токенов. Кэширование подсказок указано по цене $1.25/MTok на запись и $0.10/MTok на чтение.
Бенчмарки и методология
Anthropic опубликовала сводные результаты по нескольким стандартным и агентным наборам тестов и описала методологию, чтобы дать контекст числам. Примеры включают:
- SWE-bench Verified: скелет с двумя инструментами (bash, правка файлов), 73.3% по среднему за 50 прогонов с бюджетом мышления 128K.
- Terminal-Bench: эксперименты с агентом Terminus-2, среднее по нескольким прогонам с разными бюджетами мышления.
- OSWorld-Verified: прогоны с общим бюджетом мышления 128K и конфигурацией по шагам.
- AIME / MMMLU: усредненные результаты при стандартной семплинговой политике и бюджетах 128K.
Anthropic отмечает паритет в задачах кодирования с Sonnet 4 на этих каркасах и улучшения в задачах взаимодействия с интерфейсом (GUI/browser). Компания советует воспроизводить тесты с собственными оркестрацией, инструментами и бюджетами мышления перед тем, как экстраполировать результаты.
Основные выводы для разработчиков
- Haiku 4.5 даёт сопоставимую с Sonnet 4 производительность в кодировании при более низкой стоимости и задержке.
- Сильна в задачах работы с интерфейсом, что полезно для автоматизации браузера и мультиагентных потоков в кодировании.
- Рекомендуемая схема: Sonnet 4.5 для планирования и Haiku 4.5 для параллельного выполнения.
- Модель доступна через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI; распространяется под лицензией ASL-2 и по результатам внутренних тестов показывает меньший уровень несовместимости поведения по сравнению с Sonnet 4.5 и Opus 4.1.
Подробности и техническую документацию можно посмотреть в анонсе на странице Anthropic: https://www.anthropic.com/news/claude-haiku-4-5.