Em pleno boom da inteligência artificial generativa, nem mesmo gigantes como Google e Meta conseguem escapar da lei da física — a de que silício e energia têm limites. Fontes ouvidas pela imprensa norte-americana revelam que, em março, o Google Cloud avisou à Meta que não poderia entregar todo o poder de fogo do Gemini solicitado para treinar e rodar modelos proprietários como o Llama. O volume de computação pedido pelo time de Mark Zuckerberg superava a capacidade disponível nos clusters do Google, forçando a empresa a impor um teto e, de quebra, colocar vários projetos internos da Meta em modo de espera.
O que, exatamente, faltou?
A escassez não é de software, mas de GPU e aceleradores de IA de última geração. Placas como a NVIDIA H100, instâncias TPUv5e do próprio Google e soluções customizadas vêm sendo compradas aos milhares pelos maiores players do mercado. Mesmo assim, a demanda explodiu em um ritmo maior do que a capacidade de ampliar data centers.
Para driblar o gargalo, a liderança da Meta orientou equipes a “gastar” menos tokens — a unidade que mede quantas palavras ou sequências de dados um modelo processa. Em outras palavras, engenheiros passaram a otimizar prompts, reduzir lotes de treino e repriorizar tarefas.
Impacto direto no mercado de nuvem
A limitação não afetou só a Meta; outros clientes do Google Cloud também receberam cortes, mas em escala menor. Ainda assim, o episódio joga luz sobre uma questão crítica: a capacidade computacional virou o novo barril de petróleo da era digital. Sundar Pichai admitiu que, se houvesse mais servidores, a divisão de nuvem teria crescido além dos US$ 20 bilhões faturados no trimestre encerrado em março de 2026. A carteira de pedidos, segundo o executivo, “quase dobrou” justamente porque não havia ferro suficiente para atender todo mundo.
Por que isso importa para gamers, criadores e profissionais de TI?
1. Preços de GPU no varejo podem continuar altos. Quando as big techs compram lotes inteiros de chips H100 ou AMD MI300X, sobra menos silício para o consumidor final — reflexo que já vimos nas séries RTX 40 e Radeon 7000.
2. Serviços de IA podem encarecer. Ferramentas baseadas em nuvem, de APIs de linguagem a editores de imagem por IA, repassam parte do custo de processamento.
3. Novo ciclo de hardware à vista. Tanto Google quanto Amazon trabalham em aceleradores próprios (TPU v6, Graviton4, Inferentia2). A competição promete acelerar a chegada de placas PCIe e kits de desenvolvimento mais acessíveis para usuários finais interessados em IA local.
Imagem: William R
Comparativo rápido: Google TPU vs. NVIDIA H100
Google TPU v5e (estimativa pública)
– 105 teraflops (FP16)
– 256 GB HBM2e por módulo
– 800 GB/s de banda
NVIDIA H100 PCIe
– 197 teraflops (FP16)
– 80 GB HBM3
– 3 000 GB/s de banda (NVLink)
Embora a TPU entregue mais memória total por pod, a H100 leva vantagem em largura de banda e ecossistema de software (CUDA). É justamente essa combinação que faz a NVIDIA dominar hoje cerca de 80 % do mercado de IA em nuvem, de acordo com analistas da Omdia.
O que vem a seguir?
Analistas preveem que a falta de chips de IA deve persistir até pelo menos 2025, quando novas fábricas da TSMC e Samsung entrarem em operação. Enquanto isso, clientes corporativos podem buscar diversificar fornecedores — daí o interesse em Instâncias Graviton4 da Amazon ou em parcerias com AMD e Intel Gaudi.
No curto prazo, espere ver batalhas por contratos multibilionários, otimizações de software para “fazer mais com menos” e, claro, a corrida pelo design de hardware cada vez mais eficiente. Para o usuário final, o recado é claro: manter seu setup atualizado e de olho nos lançamentos de GPUs pode fazer diferença quando a próxima onda de aplicações de IA bater à porta.
Com informações de Hardware.com.br