Step 3.7 Flash
Step 3.7 Flash — это высокоэффективная мультимодальная модель ИИ, разработанная для агентных приложений реального мира. На базе архитектуры с 196 млрд параметров и 11 млрд активных параметров она обеспечивает исключительную производительность в кодировании, рассуждении и визуальном понимании, сохраняя скорость и экономическую эффективность уровня Flash.
Ключевые особенности
- Превосходство в агентном кодировании: Достигает 56,3% на SWE-Bench Pro и 59,6% на Terminal-Bench 2.1, превосходя сопоставимые Flash-модели DeepSeek и Gemini и приближаясь к системам уровня Pro.
- Нативное мультимодальное понимание: Обрабатывает изображения, документы, диаграммы и естественные сцены и действует на их основе с интегрированным использованием инструментов для комплексного визуального рассуждения.
- Продвинутые возможности поиска: Результат 75,8% на BrowseComp и 47,2% на HLE с инструментами, обеспечивая глубокое исследование и синтез информации из множества источников.
- Надёжная оркестрация инструментов: Управляет терминалами, браузерами, инструментами Office и системами поиска с минимальным дрейфом и сбоем вызовов инструментов в долгосрочных рабочих процессах.
- Совместимость с экосистемой агентов: Бесперебойно работает с Claude Code, KiloCode, Hermes Agent, OpenClaw и OpenCode с сниженными затратами на интеграцию.
Сценарии использования
- Разработка программного обеспечения: Автономные агенты кодирования, которые пишут, отлаживают и развёртывают код в разнородных средах разработки.
- Корпоративная автоматизация: Выполнение долгосрочных задач, сочетающее обработку документов, анализ данных и оркестрацию между приложениями.
- Исследования и анализ: Глубокий поиск и синтез через академические статьи, техническую документацию и живые веб-источники.
- Визуально-GUI взаимодействие: Автоматизация телефона и рабочего стола через восприятие GUI, клики и проверку в нескольких приложениях.
Целевая аудитория
Step 3.7 Flash обслуживает разработчиков, создающих приложения на базе ИИ, корпоративные команды, автоматизирующие сложные рабочие процессы, и исследователей, требующих эффективного мультимодального рассуждения—предоставляя производительность, близкую к уровню Pro, при экономике уровня Flash.