Imagine passar 20 anos caçando imagens manipuladas, bater o martelo em tribunais do mundo inteiro e, de repente, perceber que já não consegue mais distinguir o real do falso. Foi exatamente o que aconteceu com Hany Farid, professor pioneiro nos estudos de autenticação de imagens digitais. O alerta dele, dado em entrevista recente ao New York Times, não poderia ser mais direto: “estamos ferrados”.
Do PhotoDNA ao ponto sem retorno
Farid não é qualquer analista de redes sociais. Em 2007, em conjunto com engenheiros da Microsoft, ele criou o PhotoDNA, algoritmo que gera uma assinatura digital única para cada imagem. A solução continua responsável por identificar mais de 30 milhões de fotos ilegais por ano em serviços como OneDrive, Facebook e WhatsApp. Mas a mesma experiência que o tornou referência agora escancara o salto qualitativo dos deepfakes: segundo o pesquisador, a atual geração de modelos de IA já consegue remapear rostos e vozes com um realismo “indistinguível para olhos humanos e ferramentas tradicionais”.
Quem caça acaba virando presa
O pesadelo de Farid virou pessoal. Cibercriminosos clonaram seu número de telefone, alimentaram um modelo de IA com gravações públicas de suas palestras e — voz perfeita em mãos — ligaram para um contato envolvido em processo judicial. O objetivo era arrancar informações sigilosas, e conseguiram. A experiência levou o especialista e a esposa, pesquisadora de percepção visual em Berkeley, a adotar uma palavra-código antes de qualquer ligação familiar. Se a senha não vem na primeira frase, a chamada é encerrada.
Brasil lidera casos de fraude com deepfake na América Latina
O problema não está restrito aos Estados Unidos. De acordo com o Identity Fraud Report 2025-2026 da Sumsub, o Brasil concentra 39% de todos os casos de deepfake detectados na América Latina. O número impressiona ainda mais pelo crescimento: +126% em apenas um ano. Bancos, fintechs e casas de apostas online são os alvos prediletos, já que dependem de validações de identidade por selfie ou reconhecimento de voz.
Por que os deepfakes ficaram tão bons tão rápido?
Três fatores explicam a escalada:
- Placas de vídeo cada vez mais poderosas – GPUs como a série NVIDIA RTX 40 oferecem núcleos tensores dedicados a IA. Isso reduz o tempo de treinamento de modelos que antes demandavam clusters de data center.
- Modelos de código aberto – Ferramentas como Stable Diffusion e projetos no GitHub democratizaram pipelines completos de criação de vídeo e áudio sintético.
- Gigabytes de dados fáceis de obter – Redes sociais, podcasts e vídeos ao vivo fornecem matéria-prima em qualidade 4K para clonar vozes e expressões faciais.
Impactos práticos para você
1. Golpes financeiros: ligações do “gerente do banco” ou mensagens de parentes pedindo PIX agora podem vir com voz idêntica à original, multiplicando a taxa de sucesso.
Imagem: William R
2. Multiplayer tóxico: perfis falsos em plataformas de streaming e jogos online já usam avatares hiper-realistas para aplicar phishing em comunidades de e-sports.
3. Mercado de trabalho: entrevistas de emprego virtuais começam a exigir verificação dupla, incluindo tokens físicos (como chaves de segurança USB/NFC vendidas no varejo) e confirmação em vídeo 3D.
Como se proteger — boas práticas e algumas peças de hardware que ajudam
- Autenticação multifator: sempre ative 2FA. Chaves físicas como YubiKey e Titan Security Key reduzem o risco de voice phishing.
- Palavra-código: faça como Farid. Combine uma frase que só família ou equipe de trabalho conheça.
- Webcams com obturador físico: modelos da Logitech, Razer e Dell incluem tampa integrada; bloqueiam gravações não autorizadas.
- Headsets com cancelamento ativo: além de qualidade de áudio para home office, microfones direcionais dificultam a captura ambiente usada em clonagem de voz.
- Softwares de detecção em tempo real: soluções de empresas como Intel (banco neural na 14ª gen Core) e NVIDIA (Maxine) já analisam padrões microexpressivos para alertar o usuário.
O que vem pela frente?
Farid deixou a UC Berkeley e voltou ao Dartmouth College, em New Hampshire, onde lecionou por 20 anos. Nas folgas, corta lenha em sua fazenda em Vermont para escapar das telas. Um símbolo do estado atual da tecnologia: enquanto especialistas recuam para a natureza, os deepfakers avançam sustentados por GPUs que cabem em qualquer setup gamer. Se até o pioneiro das imagens forenses jogou a toalha, talvez seja hora de todos nós atualizarmos nosso “kit de sobrevivência digital”.
Com informações de Hardware.com.br