Se você já perdeu segundos preciosos vendo o spinner do GitHub Copilot girar no VS Code, boas notícias: a Microsoft acaba de enxugar o arsenal de comandos do assistente de IA, reduzindo o conjunto padrão de 40 para apenas 13 ferramentas essenciais. O resultado? Respostas em média 400 ms mais rápidas e até 5 pontos percentuais de acerto a mais em benchmarks como SWE-Lancer e SWEbench-Verified.
Por que menos é mais na prática
Até então, o Copilot Chat precisava “raciocinar” sobre dezenas — ou centenas, caso houvesse servidores MCP (Model Context Protocol) adicionais — de funções diferentes, de utilitários de terminal a plug-ins específicos para Jupyter Notebook. A oferta farta aumentava a chance de o modelo ultrapassar limites de tokens, além de inflar a latência de cada chamada.
A solução veio em duas frentes complementares:
- Agrupamento adaptativo de ferramentas: algoritmos de clustering por semelhança (embeddings) criam “pastas virtuais” que reúnem utilidades parecidas, apresentando ao modelo apenas uma visão geral até que ele abra o grupo necessário.
- Roteamento guiado por embeddings: antes de expandir qualquer pasta, o sistema compara o vetor da sua pergunta com o vetor de todas as ferramentas, antecipando quais são as candidatas ideais. Segundo a equipe, isso garantiu 94,5% de cobertura — ou seja, na maioria esmagadora dos casos o Copilot já começa a conversa “vendo” a ferramenta certa.
O novo “kit básico” de 13 ferramentas
A curadoria se baseou em estatísticas reais de uso e desempenho. Permanecem apenas os utilitários indispensáveis para:
- interpretar a estrutura do repositório;
- ler e editar arquivos;
- pesquisar no contexto;
- executar comandos de terminal.
Os recursos menos requisitados agora moram em quatro grupos virtuais: Ferramentas para Jupyter Notebook, Web, Workspace do VS Code e Testes. O Copilot só os expande se detectar a necessidade, evitando chamadas desnecessárias que consumiam tokens e paciência do dev.
Ganhos mensuráveis em benchmarks e no mundo real
Nos testes offline, a cobertura subiu 27,5 pontos percentuais em relação ao método antigo. Online, a história se repetiu: apenas 19% das chamadas de ferramenta no canal Stable foram pré-expandidas corretamente, contra 72% no canal Insiders com o novo roteamento.
Mesmo sem esbarrar nos limites de tokens, o excesso de ferramentas fazia o Copilot se atrapalhar: a resolução de problemas despencava até 25 pontos em cenários com o kit completo. Com a dieta enxuta, o TTFT (Time to First Token) caiu em média 190 ms, e o tempo total de resposta, 400 ms.
Imagem: Internet
Mais que escolha de tool: o futuro é long-context reasoning
Para a GitHub, selecionar a ferramenta certa é só o início. O próximo passo é combinar embeddings, memória de longo prazo e sinais de reforço para que o assistente “lembre” das suas preferências, planeje múltiplas etapas e até decida quando delegar tarefas. Pense em conversas que duram horas ou dias sem o Copilot se perder — algo que nenhuma atualização de hardware sozinha consegue entregar.
O que isso significa para você, desenvolvedor?
Menos tempo esperando o spinner, mais tempo codando. Se você já investe em um mouse ergonômico e em um teclado mecânico para ganhar produtividade — produtos que, aliás, vale pesquisar na Amazon para achar o modelo ideal —, otimizar também o ferramental de software é passo natural. Com o Copilot enxuto, seu fluxo de trabalho fica mais ágil sem que você precise alterar uma linha de configuração.
No ritmo em que o VS Code e o Copilot evoluem, vale ficar de olho nas próximas versões. Atualize seu ambiente, monitore a latência das respostas e aproveite a pausa para café: agora ela vai ser mais curta.
Com informações de GitHub Blog