Se você já se frustrou com uma resposta confusa do ChatGPT, Gemini ou Claude, a ciência acaba de entregar um atalho gratuito para aumentar drasticamente a precisão dos chatbots em poucos segundos. Pesquisadores do Google demonstraram que repetir o mesmo prompt duas ou três vezes na sequência faz modelos de linguagem sem “turbo-raciocínio” (aqueles presentes nas versões gratuitas) acertarem muito mais — em alguns casos, quase cinco vezes mais.
O truque do “eco de prompt”
Modelos como ChatGPT 3.5, Gemini 2.0 Flash e DeepSeek V3 processam frases token por token (pequenos pedaços de palavra). O primeiro token não tem visibilidade total do último, o que pode gerar respostas sem contexto completo. Quando você duplica o comando, o segundo bloco já “enxerga” tudo o que foi dito antes, montando um panorama completo antes de formular a resposta. Resultado: mais coerência e menos alucinação.
Sete modelos colocados à prova
No estudo, os engenheiros Yaniv Leviathan, Matan Kalman e Yossi Matias rodaram sete baterias de teste em sete IA comerciais:
- Gemini 2.0 Flash (Google)
- Gemini 2.0 Flash Lite (Google)
- GPT-4o-mini (OpenAI)
- GPT-4o (OpenAI)
- Claude 3 Haiku (Anthropic)
- Claude 3.7 Sonnet (Anthropic)
- DeepSeek V3 (DeepSeek)
Em 47 das 70 combinações, houve ganho de desempenho; em nenhuma, piora. O caso mais extremo ocorreu no benchmark NameIndex: o Gemini 2.0 Flash Lite saltou de 21,33 % para impressionantes 97,33 % de acerto apenas com o prompt duplicado.
Na prática, o que muda para você?
Nenhum custo extra e zero espera adicional. O estudo mostra que o truque não alonga a resposta nem aumenta a latência. Então, da próxima vez que perguntar “Qual placa de vídeo combina com meu Ryzen 5 5600X?” ou “Quais mouses gamer oferecem sensor 26 000 DPI?”, digite a mesma frase duas vezes antes de enviar. O bot devolverá uma lista mais afinada de GPUs ou periféricos — perfeito para quem está decidindo compras tecnológicas.
Três dicas rápidas de uso
- Copie e cole: digite o prompt, dê um espaço e cole de novo. Simples assim.
- Inclua uma ponte: entre as repetições, frases como “vou repetir:” também funcionam.
- Teste o trio: em certas tarefas, repetir três vezes foi ainda melhor — experimente em análises de código ou resumos longos.
Impacto para desenvolvedores e empresas
Para quem integra APIs em sites ou bots de atendimento, o artigo recomenda fazer fine-tuning com prompts duplicados. Isso pode reduzir consumo de tokens nos grandes modelos de raciocínio avançado, mantendo custos sob controle. Pense nisso como um overclock de software: mais performance sem trocar de hardware — o sonho de qualquer gestor de TI.
Imagem: Internet
Por que gamers, criadores e entusiastas devem ligar para isso
Ferramentas de IA já ajudam a otimizar configurações em jogos, gerar descrições de produtos e criar roteiros de vídeo. Quanto mais precisas as respostas, mais tempo você economiza para o que realmente importa: testar aquele teclado mecânico novo ou turbinar o setup com a GPU dos sonhos. Repetir prompts é um ajuste milimétrico que libera potência extra, assim como ativar o XMP na memória RAM.
O que vem a seguir
Os autores sugerem explorar mais de duas repetições e aplicar a técnica em modelos “pensantes”, como o Gemini 2.0 Flash Thinking e o GPT-4o com raciocínio avançado. Se os ganhos se confirmarem, podemos ver chatbots mais enxutos oferecendo a mesma qualidade dos planos premium — ótimo para usuários finais e para o bolso das empresas.
No fim das contas, seu próximo upgrade pode não vir de uma nova CPU ou placa-mãe, mas de duas linhas a mais no campo de texto. Experimente e tire suas próprias conclusões.
Com informações de Mundo Conectado