Em menos de 24 meses, ChatGPT passou de “imbatível” a ameaçado. Dados do relatório State of AI 2026, da Sensor Tower, mostram que a fatia global do bot da OpenAI caiu de 86% em janeiro de 2024 para 46,4% em maio de 2026 — mesmo período em que a plataforma comemorou 1 bilhão de usuários ativos mensais, o recorde mais rápido da história da internet. Como isso é possível? A resposta atende pelos nomes Gemini (Google) e Claude (Anthropic).
O Google inventou a peça-chave, mas saiu atrasado
Em 2017, o Google criou o Transformer — arquitetura que sustenta praticamente todos os modelos de linguagem atuais, inclusive GPT-4, Gemini Ultra e Claude 3. Mas o histórico negativo de chatbots racistas (alô, Tay) e a obsessão por “não estragar a festa” fez a gigante frear lançamentos. Quando abriu os olhos, o laboratório independente OpenAI já somava milhões de prompts viralizados.
Agora a empresa corre atrás do prejuízo com Gemini integrado no Android, no Gmail e até nas buscas. A estratégia de distribuição fez a participação do bot subir de 5,7% para 27,7% em um ano, sem depender — ao menos por enquanto — de ganhar todas as comparações técnicas contra o GPT-4. É a mesma receita que, no passado, matou o Netscape quando o Internet Explorer passou a ser instalado “de fábrica” no Windows.
O divórcio que pariu o Claude (e criou um novo gigante)
Dario e Daniela Amodei, ex-OpenAI, deixaram a companhia em 2020 alegando que a antiga missão “IA segura para todos” dera lugar a pressões comerciais. Nascia a Anthropic. Enquanto a concorrência quebrava regras para chegar antes, o time dos irmãos passou meses afinando protocolos de segurança. Resultado: Claude estreou em março de 2023, quatro meses depois do ChatGPT, mas com foco cirúrgico no mercado corporativo.
Deu certo. Entre 2025 e 2026, o número de usuários do Claude saltou 640%, contra 62% do ChatGPT. Nos EUA, a participação pulou de 4,4% para 14%. Para fincar os dois pés no ringue, a startup firmou um acordo de US$ 8 bilhões com a Amazon Web Services, garantindo acesso prioritário a instâncias de GPU generativas como as Nvidia H100 e as recém-lançadas AWS Trainium2.
Bajulação ou precisão? A batalha invisível pelo comportamento da IA
Treinar um modelo a partir de likes e tempo de tela estimula a “bajulação”: o bot aprende que concordar com o usuário rende melhores avaliações do que corrigi-lo. A Anthropic aposta no caminho oposto. Empresas de advocacia, farmacêuticas e bancos preferem um modelo que erre menos — e não que elogie mais. Cada alucinação jurídica pode custar milhões em processos.
Custos fora da curva: por que só os gigantes sobrevivem
Para quem ainda sonha em montar o “próximo GPT” na garagem, os números assustam:
- Treinar o GPT-3 (2020): US$ 4,6 milhões;
- GPT-4 (2023): ~US$ 100 milhões;
- Gemini Ultra (2024): ~US$ 191 milhões;
- Projeção para GPT-5 (2026): entre US$ 500 milhões e US$ 2 bilhões.
Segundo a Epoch AI, os gastos dobram a cada 18 meses. É aqui que entra o combo hardware + nuvem: enquanto a OpenAI queima bilhões em clusters Azure com GPUs Nvidia H100 e GH200 Grace Hopper, o Google recorre aos próprios datacenters equipados com TPUs v5e. Já a Anthropic ganha fôlego com a infraestrutura baseada nos chips AWS Inferentia2.
O fator Pentágono: publicidade (gratuita) para Claude
Em fevereiro de 2026, o Departamento de Defesa dos EUA exigiu o direito de usar Claude na criação de armas autônomas. A Anthropic recusou. A postura ética repercutiu: downloads do Claude cresceram e o tempo gasto dentro do ChatGPT pelos americanos caiu 5% logo no mês seguinte — primeira prova de canibalização direta entre bots.
Imagem: William R
O que essa disputa significa para você?
1. Mais opções de qualidade: com três gigantes brigando, o ritmo de evolução é frenético. Cada update entrega respostas mais precisas, plugins mais úteis e integração em tudo — do smartphone ao IDE preferido.
2. Preços (ligeiramente) mais baixos: ChatGPT Plus já passou de US$ 20 para US$ 19/mês em algumas regiões. O Google liberou camadas gratuitas do Gemini Pro e a Anthropic oferece 50 mensagens/dia sem custar nada.
3. Corrida por hardware mais potente: quanto maior o modelo, maior a fome por GPUs topo de linha. Isso pressiona Nvidia, AMD e até a Intel a lançar placas com mais VRAM e largura de banda — o que respinga diretamente no mercado gamer e de estações de trabalho. Se você busca uma RTX 4090 ou Radeon RX 7900 XTX para IA local e render, prepare-se: a demanda corporativa pode manter os preços salgados.
Para onde o pêndulo aponta?
Especialistas ouvidos pela Sensor Tower apostam em um “oligopólio de chatbots” sustentado por quem consegue pagar a conta da nuvem. OpenAI, Google e Anthropic lideram porque têm parceiros (Microsoft, Google Cloud e AWS) capazes de torrar bilhões em clusters cheios de H100, MI300 e TPUs sem esperar retorno imediato.
A curto prazo, o ChatGPT ainda reina em engajamento, mas a curva de crescimento de Gemini e Claude indica que 2026 pode ser lembrado como o ano em que a OpenAI perdeu a aura de invencível — retomando um roteiro que lembra o Yahoo! sendo ultrapassado pelo Google nos anos 2000.
No fim, o consumidor vira troféu. Quanto mais nós testamos respostas, pedimos códigos e geramos imagens, mais dados entram nos modelos, que ficam melhores e mais viciantes. É um ciclo onde hardware de ponta, nuvem escalável e UX intuitiva contam quase tanto quanto a qualidade algorítmica.
Com informações de Hardware.com.br