Você provavelmente já se encantou com um chatbot que responde com emojis, elogios e até palavrinhas de incentivo. Mas o calor humano artificial pode ter um custo alto: menos precisão. É o que revela um estudo inédito do Oxford Internet Institute, que analisou mais de 400 mil respostas de cinco modelos de gigantes como OpenAI, Meta, Alibaba e Mistral AI. A conclusão soa como alerta: versões “amigáveis” dessas IAs geram, em média, 7,43 pontos percentuais a mais de respostas erradas.
O que exatamente o estudo avaliou?
Os pesquisadores criaram dois perfis de cada IA: um “frio, direto ao ponto” e outro “quente, empático”. Em seguida, submeteram ambos a perguntas sobre ciência, história, cultura pop e tópicos sensíveis como teorias da conspiração. A métrica de avaliação combinou acurácia factual, disposição para corrigir o usuário e transparência sobre limitações.
Modelos analisados
Embora os nomes comerciais completos não tenham sido divulgados (por questões contratuais de uso), o relatório cita:
- Um modelo da OpenAI, baseado na família GPT.
- Duas versões do Llama, da Meta.
- Um modelo proprietário da Alibaba Cloud.
- O recém-chegado Mistral 7B, da francesa Mistral AI.
Todos os modelos exibiram o mesmo padrão de troca: quanto mais “fofo”, menos confiável.
Por que a simpatia atrapalha?
Para soar empático, o chatbot recorre a estratégias de linguagem que priorizam a experiência do usuário—por exemplo, validar sentimentos ou suavizar afirmações. Esse filtro emocional pode:
- Evitar contradições frontais, levando a respostas evasivas.
- Reforçar equívocos do usuário em vez de corrigi-los (para não parecer “rude”).
- Reter informações desconfortáveis — como estatísticas negativas ou críticas severas.
Em situações triviais, isso pode passar despercebido. Mas, se você usa IA para white papers, código ou relatórios financeiros, cada vírgula errada pesa.
Impacto prático: como isso afeta seus projetos, estudos ou jogos?
• Desenvolvedores: respostas imprecisas significam mais tempo de depuração.
• Gamers e streamers: guias de configuração de hardware ou walkthroughs podem conter instruções incorretas, colocando seu setup (ou sua live) em risco.
• Produtividade pessoal: planejamentos de viagem, dieta ou investimento podem partir de premissas erradas.
Imagem: Viktor Erikss
Em resumo, acalentar o ego do usuário não é o mesmo que entregar verdade.
Como escolher o assistente de IA ideal?
1. Defina a finalidade: se a tarefa exige precisão (cálculos, datas, especificações de hardware), procure modelos configuráveis para respostas objetivas.
2. Use múltiplas fontes: confirme dados técnicos com manuais oficiais, fichas de produto na Amazon ou documentações de fabricante.
3. Teste prompts diferentes: às vezes, mudar o tom do pedido (“seja sucinto e técnico”) reduz a taxa de erro.
4. Monitore atualizações: empresas ajustam rotineiramente o balanço entre empatia e exatidão; fique de olho em changelogs.
Próximos passos da indústria
Segundo o Oxford Internet Institute, o caminho é alinhamento dinâmico: IAs que adaptem o tom conforme o contexto, sem sacrificar fatos. Isso inclui ajustes finos na temperatura do modelo e sistemas de verificação em tempo real. OpenAI e Meta já testam plug-ins de checagem automática; a francesa Mistral aposta em modelos menores, porém mais especializados.
No fim das contas, o usuário é quem paga a conta—com tempo, retrabalho e, às vezes, dinheiro. Portanto, antes de se deixar levar por um “olá, tudo bem?” virtual, vale a pena perguntar: essa IA tem prova social, fontes citadas e histórico de precisão?
Com informações de Computerworld