Ferramentas como GitHub Copilot, Amazon CodeWhisperer e ChatGPT colocaram os agentes de IA que programam sozinhos no centro das discussões sobre produtividade. Mas, junto com a promessa de entregas em minutos, veio um efeito colateral: blocos inteiros de código mal formatado, sem testes e repletos de “code smells” que acabam sobrando para você corrigir. É exatamente aí que a Factory, startup criada por ex-pesquisadores de grandes laboratórios de modelos de linguagem, quer se diferenciar.
Durante a última edição do AWS re:Invent, conversamos com Eno Reyes, cofundador e CTO da empresa. Ele detalhou por que o seu agente, batizado de Droid, pretende competir de igual para igual com os gigantes do mercado — e por que a qualidade do seu repositório pode ser o fator decisivo para extrair (ou não) velocidade dessas IAs.
Agente de IA “agnóstico” em três frentes
Enquanto boa parte das soluções obriga o desenvolvedor a usar um único modelo de linguagem ou migrar para um IDE específico, a Factory aposta em três pilares:
- Modelo agnóstico – Compatível com qualquer LLM, seja GPT-4, Claude 3, Llama 2 ou modelos proprietários rodando on-premise.
- Ambiente universal – Funciona em Windows, macOS e Linux, direto no VS Code, JetBrains, terminal ou mesmo em pipelines do GitHub Actions.
- Instrumentação pesada – Centenas de “sinais” de qualidade (lint, testes, análise estática, documentação) integrados por padrão.
Reyes chama esse trabalho de “harness engineering”. A ideia é construir uma camada de orquestração que gerencie contexto, chamadas de ferramentas e limites de tokens durante horas de execução contínua. “São centenas de micro-otimizações”, explica o CTO. “Não há um truque único, mas um processo industrial de melhoria constante”.
Por que qualidade é tudo — e o que isso diz sobre o seu repositório
Estudo recente da Universidade de Stanford (citado por Reyes) analisou produtividade em empresas que adotaram IA. A conclusão foi direta: volume de código gerado ou quantidade de usuários avançados não predizem sucesso. A variável crítica foi a qualidade base do código. Quanto melhor o padrão já existente, maior o ganho — e o inverso também vale.
Nesse cenário, o Droid atua em duas etapas:
- Diagnóstico – Ele roda uma “maturidade de autonomia” no repositório, mapeando lacunas como ausência de testes, documentação desatualizada ou regras de lint inconsistentes.
- Correção automática – Comandos simples permitem que o agente implemente linters, configure CI/CD ou crie testes onde faltam. O objetivo é preparar o terreno para que futuras gerações de código sejam mais limpas desde o primeiro commit.
Code smells: de buzzword a métrica acionável
Programadores experientes reconhecem um “fedor” de código intuitivamente. A Factory quer transformar essa experiência em métrica. Ao se plugar no pipeline de build, o Droid pode atuar como um revisor de pull requests, sinalizando práticas ruins que escorregam por ferramentas tradicionais.
Isso inclui padrões complexos de copy-paste, classes gigantes ou dependências circulares que passam ilesas por compiladores. Para times grandes — aquele cenário de “cem estagiários” que Reyes usa como metáfora — esse filtro automatizado vira um multiplicador de tempo dos seniors.
Impacto prático para você
Seja freelancer ou líder de squad, vale ficar de olho em três pontos:
Imagem: Internet
- ROI imediato em testes e lint – Quanto mais sinais você já tem, mais valor extrai do agente.
- Ecossistema aberto – Por não depender de IDE específico, o Droid permite adotar o fluxo no ambiente que você já domina.
- Escalonamento sem dor – O agente reduz o “ruído” de revisões triviais, liberando tempo dos devs sêniors para arquitetura ou features.
E o hardware, faz diferença?
Embora a Factory foque em nuvem, quem pretende rodar modelos localmente — por privacidade ou latência — precisa de GPUs com bastante VRAM. Placas como a NVIDIA RTX 4070 Super (12 GB) ou, para quem busca treinamento leve, a RTX 4090 (24 GB) entregam musculatura para LLMs medianos. Combine isso com um SSD NVMe PCIe 4.0 rápido e 32 GB (ou mais) de RAM para evitar gargalos de swap. Uma fonte de alimentação de qualidade (750 W ou superior) e um bom sistema de refrigeração fecham o pacote para sessões prolongadas de inferência.
Para o setup de digitação intensa, considere teclados mecânicos com switches táteis — por exemplo os modelos da linha Keychron K Pro — e mouses ergonômicos precisos, como o Logitech MX Master 3S, que oferecem múltiplos perfis e botões programáveis, ideais para alternar entre janelas de terminal e IDE.
Próximos passos da Factory
Segundo Reyes, a meta é expandir o conceito de “tudo é tarefa de software”. Isso significa levar o agente além do código: geração de apresentações, respostas a clientes e até suporte de vendas se tornam potenciais alvos. “Os melhores agentes gerais serão, no fundo, os melhores agentes de desenvolvimento”, resume o executivo.
Para quem quer acompanhar, a Factory oferece lista de espera no site oficial e demonstrações privadas para equipes interessadas em testar o Droid em seus fluxos de CI/CD.
Resta saber se essa abordagem mais “cirúrgica” — combater o lixo antes que ele se acumule — será suficiente para convencer desenvolvedores já acostumados a soluções como Copilot. Se a tese de que qualidade puxa qualidade se mantiver, podemos estar diante de um ponto de virada no uso de IA em engenharia de software.
Com informações de Stack Overflow Blog