Step 3.7 Flash
O Step 3.7 Flash é um modelo de IA multimodal de alta eficiência projetado para aplicações agenticas do mundo real. Com uma arquitetura de 196B de parâmetros e 11B de parâmetros ativos, ele oferece desempenho excepcional em codificação, raciocínio e compreensão visual, mantendo a velocidade e eficiência de custo típica de modelos Flash.
Destaques do Produto
- Excelência em Codificação Agêntica: Alcança 56,3% no SWE-Bench Pro e 59,6% no Terminal-Bench 2.1, superando modelos Flash comparáveis da DeepSeek e Gemini, aproximando-se de sistemas de nível Pro.
- Compreensão Multimodal Nativa: Processa e age sobre imagens, documentos, gráficos e cenas naturais com uso integrado de ferramentas para raciocínio visual abrangente.
- Capacidades Avançadas de Busca: Pontuação de 75,8% no BrowseComp e 47,2% no HLE com ferramentas, permitindo pesquisa profunda e síntese de informações de múltiplas fontes.
- Orquestração Confiável de Ferramentas: Controla terminais, navegadores, ferramentas Office e sistemas de busca com mínima deriva e falhas em fluxos de trabalho de longo prazo.
- Compatibilidade com Ecossistema de Agentes: Funciona perfeitamente com Claude Code, KiloCode, Hermes Agent, OpenClaw e OpenCode, reduzindo custos de integração.
Casos de Uso
- Desenvolvimento de Software: Agentes de codificação autônomos que escrevem, depuram e implantam código em ambientes de desenvolvimento heterogêneos.
- Automação Empresarial: Execução de tarefas de longo prazo combinando processamento de documentos, análise de dados e orquestração entre aplicativos.
- Pesquisa e Análise: Busca profunda e síntese através de artigos acadêmicos, documentação técnica e fontes web ao vivo.
- Interação Visual-GUI: Automação de telefone e desktop através de percepção GUI, cliques e verificação em múltiplos aplicativos.
Público-Alvo
O Step 3.7 Flash atende desenvolvedores que constroem aplicativos impulsionados por IA, equipes empresariais que automatizam fluxos de trabalho complexos e pesquisadores que exigem raciocínio multimodal eficiente—oferecendo desempenho próximo ao de nível Pro com economia de nível Flash.