Como a Intuit faz exércitos de agentes de IA trabalharem juntos – e o que você pode aprender para turbinar seus próprios projetos

Gerenciar um único modelo de linguagem já é um desafio; coordenar vários agentes de IA atuando em paralelo dentro de um sistema usado por milhões de pessoas é quase um malabarismo de altíssimo nível. Foi sobre esse tema que Chase Roossin (Group Engineering Manager) e Steven Kulesza (Staff Software Engineer), ambos da Intuit, conversaram no podcast do Stack Overflow. A dupla revelou como a empresa – dona de serviços financeiros globais como TurboTax e QuickBooks – vem domando verdadeiros enxames de agentes autônomos para entregar respostas mais rápidas, reduzir erros e, claro, gerar valor de negócio.

Anúncios

Índice de Conteúdo

Por que coordenar múltiplos agentes é tão difícil?

Cada agente é treinado para uma função específica: entender documentos fiscais, extrair entidades, sugerir correções, etc. Quando somamos dezenas (ou centenas) deles, surgem conflitos de contexto, redundância de tarefas e até loopings indesejados. Roossin resume o problema: “Os agentes começam a brigar pelos mesmos recursos computacionais e, às vezes, pelas mesmas prompts”.

Avaliações automatizadas: QA contínua para robôs

Para transformar comportamentos caóticos em previsíveis, a Intuit criou um pipeline de evoluções automatizadas (auto-evals). Sempre que um agente recebe uma nova instrução ou é atualizado, scripts comparam o resultado com métricas históricas de precisão, latência e custo de inferência. Se o desempenho cai, ele volta para a prancheta. Essa prática, segundo Kulesza, reduziu em 40% o tempo gasto em testes manuais.

“Enxame” de especialistas ou um superagente?

Outro dilema debatido no podcast foi: vale mais ter um “supermodelo” gigante ou um conjunto de agentes menores, especializados? A Intuit testou ambos. O enxame se saiu melhor em tarefas paralelizáveis (coleta de dados, validação de formulários), enquanto o monolito brilhou em consultas muito complexas, porém lineares. Na prática, eles optaram por uma arquitetura híbrida: um agente orquestrador – treinado com reinforcement learning – decide quando chamar o enxame ou delegar tudo ao modelo central.

Impacto direto no usuário (e no seu bolso)

O resultado aparece no front end: usuários de produtos financeiros querem respostas imediatas sobre deduções ou conformidade fiscal. Cada milissegundo conta. Ao distribuir a carga entre agentes autônomos, a Intuit viu a latência média cair de 1,2s para 650 ms. Traduzindo para o gamer ou criador de conteúdo que nos lê: menos espera significa mais produtividade – e o mesmo conceito serve para seus bots no Discord, scripts de automação ou GPTs pessoais.

Infraestrutura: da GPU doméstica à nuvem corporativa

Coordenar agentes em escala exige hardware de respeito. Embora a Intuit execute tudo em clusters de data center, as lições cabem no setup de qualquer entusiasta:

Memória VRAM generosa – Placas como a NVIDIA RTX 4070 ou 4080 (à venda na Amazon) são ideais para rodar múltiplos threads de inferência sem engasgar.
Armazenamento NVMe – Reduz o tempo de swap quando o agente precisa carregar novos pesos ou embeddings.
Redundância de rede – Mesmo em casa, um roteador Wi-Fi 6 garante menor latência na comunicação entre notebooks/PCs que compartilham modelos.

Ou seja, se você pensa em experimentar arquiteturas multi-agente para jogos, trading ou automação doméstica, investir em uma GPU com boa VRAM e um SSD NVMe pode ser o divisor de águas.

Como a Intuit faz exércitos de agentes de IA trabalharem juntos – e o que você pode aprender para turbinar seus próprios projetos - Imagem do artigo

Imagem: Internet

O que vem a seguir

Roossin e Kulesza acreditam que o próximo passo é dar aos agentes memória de longo prazo e senso de hierarquia mais refinado. Espera-se ver sistemas capazes de negociar prioridades em tempo real, algo que pode revolucionar desde assistentes virtuais até robótica industrial.

Para quem quer seguir nessa trilha, os engenheiros recomendam:

Implementar avaliadores de nível zero desde o primeiro protótipo para evitar “viés de última hora”.
Testar diferentes tamanhos de modelos em placas locais antes de migrar para APIs pagas.
Monitorar custos: agentes mal configurados podem disparar chamadas desnecessárias a serviços na nuvem.

No fim, a lição é clara: coordenar inteligências artificiais exige tanto arte quanto engenharia. Mas, com as ferramentas certas – de código aberto a hardware parrudo –, você pode replicar em casa parte da mágica que empresas bilionárias já experimentam em produção.

Com informações de Stack Overflow Blog

Como a Intuit faz exércitos de agentes de IA trabalharem juntos – e o que você pode aprender para turbinar seus próprios projetos

Por que coordenar múltiplos agentes é tão difícil?

Avaliações automatizadas: QA contínua para robôs

“Enxame” de especialistas ou um superagente?

Impacto direto no usuário (e no seu bolso)

Infraestrutura: da GPU doméstica à nuvem corporativa

O que vem a seguir

Esteja Conectado

Melhores Placas De Vídeos 2025

Tim Cook se despede da Apple ainda devendo na IA — novo CEO terá de correr para não perder Google e Microsoft de vista

SpaceX anuncia produção de GPUs próprias no Texas e desafia Nvidia: entenda o impacto para IA e gamers

Snapdragon 8 Elite Gen 6 pode nascer nos 2 nm da Samsung — e promete elevar o nível dos flagships Android em 2027

TCL dá passo ousado e mira o topo: conheça a estratégia que pode sacudir o mercado de TVs premium

Aqui no Smartoutlets você encontra as melhores análises e reviews de produtos gamers, análises sinceras e o melhor preço do Mercado.

Institucional

Por que coordenar múltiplos agentes é tão difícil?

Avaliações automatizadas: QA contínua para robôs

“Enxame” de especialistas ou um superagente?

Impacto direto no usuário (e no seu bolso)

Infraestrutura: da GPU doméstica à nuvem corporativa

O que vem a seguir

Esteja Conectado

Melhores Placas De Vídeos 2025

Você também pode gostar disso