Prepare-se para uma virada no tabuleiro dos chips de inteligência artificial. Depois de anos oferecendo seus aceleradores apenas como serviço em nuvem, Google e Amazon começaram a vender suas TPUs e Trainium em racks completos para empresas externas. A jogada coloca as duas gigantes frente a frente com a NVIDIA, que hoje controla cerca de 90 % desse mercado bilionário.
Por que isso importa?
Se você trabalha (ou investe) em IA generativa, treinamento de LLMs ou mesmo renderização avançada para jogos, a notícia significa mais oferta de hardware, preços potencialmente menores e maior liberdade de escolha. Até agora, quem precisava de poder bruto de GPU praticamente se via obrigado a ir de H100 ou A100 da NVIDIA — e aceitar a fila de espera.
Google TPUs fora do Google Cloud: o modelo Anthropic
O Google selou um acordo de US $ 3,2 bilhões com a Blackstone para equipar o gigantesco complexo Lake Mariner (Nova York) com milhares de TPUs dedicadas à startup Anthropic, a criadora do Claude. O contrato replica a estratégia da NVIDIA de “investir primeiro, faturar depois”: o fornecedor banca ou facilita o data center e garante a venda dos chips.
Clientes que já migraram relatam ganhos concretos. A Citadel Securities, por exemplo, afirma que certas cargas de trabalho rodam até 4 × mais rápido nas TPUs, com economia de 30 % no custo operacional. O reflexo aparece no bolso: o Google Cloud saltou para US $ 20 bilhões de receita no 1º trimestre de 2026, um crescimento de impressionantes 63 % ano contra ano.
Amazon Trainium ganha vida própria — e fôlego de US $ 50 bi
A Amazon segue a mesma trilha com o Trainium3. Peter DeSantis, head de IA, chips e computação quântica da companhia, confirmou à Bloomberg que o hardware já está sendo negociado com operadores externos. “Há tanta demanda que vender racks completos não canibaliza a AWS”, comentou.
• Capacidade reservada: a Anthropic sozinha assinou um compromisso de US $ 100 bilhões em capacidade Trainium ao longo de 10 anos (até 5 GW). A OpenAI ocupa mais 2 GW.
• Desempenho: o Trainium3 oferece ganho de 30–40 % sobre o Trainium2 e já está praticamente esgotado desde o lançamento em janeiro de 2026.
• Projeção de receita: somando Trainium, Graviton (CPU Arm) e Nitro (DPU), o negócio já ultrapassa uma run rate de US $ 20 bilhões. Com vendas externas, a Amazon acredita que pode chegar a US $ 50 bilhões/ano.
NVIDIA ainda reina… mas o castelo tem novas pontes levadiças
Não é exagero: a NVIDIA detém mais de 90 % do mercado, sustentada pelo ecossistema CUDA + cuDNN e por uma maturidade de software que as rivais ainda correm para alcançar. A barreira de saída é alta: trocar toda a pilha de IA de um data center significa migrar frameworks, refatorar código e treinar equipe. Mesmo assim, a carência global de chips faz muitos provedores cogitarem um mix de fornecedores.
Segundo Jensen Huang, CEO da NVIDIA, “o alcance da nossa plataforma vai além de qualquer linha de chips personalizada”. A declaração é um recado direto: mesmo que Google e Amazon vendam hardware, ainda será preciso competir com o universo de bibliotecas, otimizações e comunidade que a NVIDIA cultiva há mais de 15 anos.
TPU vs. H100 vs. Trainium: números que o seu CFO quer ver
Embora os benchmarks variem por modelo de IA e otimização, estudos internos indicam:
Imagem: William R
- TPU v5p (Google): até 4,7 PFLOPS em FP8 por pod (8× mais que a v4), eficiência energética de 95 % no uso de matriz.
- NVIDIA H100: 4 PFLOPS em FP8 por GPU (modo sparsity), NVLink 4ª Geração de 900 GB/s e consumo de até 700 W.
- Amazon Trainium3: estimado em 3 PFLOPS em BF16/FP8, com 30–40 % mais performance que o Trainium2 e TDP de 350 W.
Em dados puros, o H100 ainda leva vantagem unitária, mas o custo por TFLOP entregue por rack nas soluções de Google e Amazon tende a ser menor, exatamente onde grandes treinos de IA consomem mais orçamento.
O que muda para você e sua empresa?
1. Concorrência no preço: mais chips no mercado = maior poder de barganha.
2. Disponibilidade: filas menores, sobretudo em 2027, quando a 4ª geração do Trainium chegar e as TPUs v6 entrarem em produção.
3. Liberdade de arquitetura: companhias podem optar por nuvem híbrida ou comprar racks dedicados, mantendo dados sensíveis on-premises.
Impacto para gamers e criadores de conteúdo
Se você é entusiasta de jogos ou creator profissional, a briga lá no topo significa que tecnologias de upscaling, ray tracing em tempo real e geração de assets por IA devem evoluir mais rápido. Afinal, quando datacenters ganham potência extra — e mais barata —, plataformas como GeForce NOW, Xbox Cloud Gaming e até ferramentas de IA generativa para game design podem reduzir latência ou cortar custos de assinatura.
Próximos passos dessa disputa trilionária
• 2026: consolidação das vendas externas de TPU v5p e Trainium3.
• 2027: estreia do Trainium4 e provável TPU v6, ambos fabricados em nós abaixo de 3 nm.
• Médio prazo: meta de Google e Amazon é conquistar entre 15 % e 25 % do mercado hoje dominado pela NVIDIA. Se alcançarem, o impacto poderá derrubar preços de treinamento de modelos em até 40 %, segundo analistas do JP Morgan.
No fim das contas, a corrida dos chips de IA entrou em uma nova fase. Com TPUs e Trainium disponíveis fora das nuvens proprietárias, data centers do mundo todo ganham munição para desafogar gargalos, acelerar projetos e, claro, fazer pressão por descontos. E onde há competição, quem sai ganhando é quem precisa rodar IA — de startups a gamers exigentes.
Com informações de Hardware.com.br