A OpenAI acaba de oficializar o GPT-5.2, nova geração do seu modelo de linguagem que, segundo a empresa, executa tarefas de negócios em nível de especialista e dá um salto em eficiência frente ao GPT-5.1, apresentado em novembro. A atualização chega em três faixas de desempenho — Instant, Thinking e Pro — e já começou a ser distribuída aos assinantes do ChatGPT.
O que muda na prática?
No benchmark interno GDPval, que compara a performance de IA com a de profissionais humanos em 44 tarefas corporativas, o GPT-5.2 igualou ou superou especialistas em 70,9 % dos testes. O GPT-5.1 ficava em 38,8 %. Um exemplo concreto: a versão Thinking do novo modelo foi capaz de formatar completamente uma planilha de planejamento de equipes; o antecessor gerava a mesma planilha, porém sem formatação avançada.
Em provas de raciocínio geral (ARC-AGI-1/2) e na suíte SWE-Bench — que simula tarefas de programação do mundo real —, o GPT-5.2 também mostrou ganhos, prometendo:
- depuração de bugs em produção com menos intervenção manual;
- implementação de novas funcionalidades sob especificação aberta;
- refatoração de grandes bases de código;
- entregas end-to-end mais rápidas.
Preço, planos e eficiência de tokens
Para APIs, o custo é de US$ 1,75 por 1 milhão de tokens de entrada e US$ 14 por 1 milhão de tokens de saída, com 90 % de desconto em entradas armazenadas em cache. Apesar do valor absoluto maior que o do GPT-5.1, a OpenAI afirma que a eficiência de tokens compensa: menos chamadas são necessárias para alcançar a mesma qualidade.
Corrida contra o Google Gemini 3: quem leva vantagem?
A rapidez na liberação do GPT-5.2 ocorre após um “código vermelho” interno disparado pelo CEO Sam Altman em dezembro, temendo perder terreno para o Gemini 3 do Google. Segundo Altman, os avanços da rival foram “menos substanciais do que se pensava”, mas a OpenAI evitou publicar comparativos diretos no anúncio oficial.
Em avaliações independentes, o GPT-5.2 Thinking registrou 8,4 % de alucinação no ranking da Vectara — o melhor da família GPT até agora, porém abaixo do DeepSeek V3.2 (6,3 %) e acima do Gemini 3 (13,6 %). Ou seja, há progresso, mas ainda não se chegou ao “erro zero”.
Ceticismo e recomendações do mercado
Analistas como Maria Sukhareva, da Siemens, lembram que benchmarks proprietários podem mascarar limitações: “É fácil treinar o modelo nos 44 casos do GDPval e falhar em outras áreas”, afirma. Já Rachid Rush Wehbi, CEO da Sell The Trend, prefere resultados práticos: “O GPT-5.2 mantém a linha de raciocínio por mais tempo — algo crítico em cenários de atendimento e automação corporativa”.
Imagem: John E
Para Bob Hutchins, fundador da Human Voice Media, o novo modelo ataca justamente “o último 20 %” que frustra empresas: formatação, restrições e repasses de tarefa. Sua dica: faça um piloto controlado antes de escalar.
O que tudo isso significa para você?
Se sua equipe depende de planilhas complexas, geração de relatórios, automação de código ou criação de apresentações, o GPT-5.2 promete reduzir tempo de retrabalho e demandas de formatação — pontos que costumam travar fluxos de produção. Ainda assim, vale monitorar:
- taxa de alucinação em dados críticos;
- custos reais de tokens após otimizações;
- integração com ferramentas já usadas pela sua empresa (CRMs, IDEs, suites de escritório).
Resumo rápido: o GPT-5.2 é um passo sólido rumo a IAs mais “empresarialmente úteis”, mas não encerra a disputa. Quem busca implementar IA generativa deve comparar números internos de ROI, não só benchmarks de mercado.
Com informações de Computerworld