Você já pensou em perguntar ao ChatGPT ou a outro chatbot de inteligência artificial o que significa aquela dor incômoda no peito? Um novo estudo da Universidade de Oxford sugere que essa não é a melhor ideia — pelo menos por enquanto. A pesquisa comparou a performance de grandes modelos de linguagem (LLMs) como GPT-4o, Llama 3 e Command R com métodos tradicionais de busca (Google, Bing ou até o “achismo” do próprio usuário) na hora de avaliar sintomas e sugerir o que fazer.
O experimento: IA x métodos de busca
Participaram 1.298 voluntários no Reino Unido. Metade usou os chatbots para relatar sintomas e receber orientações; a outra metade recorreu aos seus meios habituais: motores de pesquisa ou conhecimento prévio.
Resultados principais:
- Nenhuma melhora na avaliação de urgência: quem usou IA não determinou melhor se o caso era leve, moderado ou grave.
- Diagnósticos menos precisos: os chatbots erraram mais ao apontar a condição correta.
Por que a IA falhou?
Os pesquisadores identificaram dois gargalos:
- Entrada de dados incompleta: usuários não conseguiram descrever sintomas de forma detalhada para a IA.
- Saídas inconsistentes: os modelos, às vezes, ofereceram conselhos contraditórios ou simplesmente errados.
Em outras palavras, passar em exames teóricos — como acontece com LLMs treinados em provas de Medicina — não garante que o sistema funcione no “mundo real”, onde informações chegam desorganizadas e as consequências de um deslize podem ser graves.
O que isso significa para você?
• Não descarte o médico (nem o bom e velho Google): até que chatbots mostrem consistência, recorrer a fontes múltiplas e, sobretudo, a profissionais de saúde continua imprescindível.
• Use a IA como complemento, não como autoridade final: se optar por consultar um chatbot, trate a resposta como ponto de partida para pesquisar mais a fundo.
• Descreva sintomas de forma objetiva: inclua duração, intensidade, histórico e fatores de risco; isso melhora qualquer busca, seja em IA, seja no Google.
Imagem: Viktor Erikss
Impacto no ecossistema de tecnologia
Para as empresas que desenvolvem LLMs, o estudo de Oxford é um sinal vermelho: será preciso investir em fine-tuning clínico, parcerias com hospitais e, possivelmente, hardware especializado para processar dados médicos com maior segurança. Enquanto isso, fabricantes de wearables — smartwatches e pulseiras que monitoram batimentos, sono e oxigenação — ganham relevância: sensores robustos entregam dados biométricos confiáveis, algo que modelos de linguagem não conseguem inferir sozinhos.
Na prática, a notícia reforça que a IA generativa está avançada, mas ainda não substitui o diagnóstico humano. Se você é entusiasta de tecnologia e cogita utilizar assistentes de IA para cuidar da saúde, tenha em mente que, por ora, eles funcionam melhor para explicar conceitos do que para indicar tratamentos.
Com informações de Computerworld