Corrida pela IA trava no gargalo: Google freia mega-pedido da Meta e escancara crise de hardware nos data centers

Em pleno boom da inteligência artificial generativa, nem mesmo gigantes como Google e Meta conseguem escapar da lei da física — a de que silício e energia têm limites. Fontes ouvidas pela imprensa norte-americana revelam que, em março, o Google Cloud avisou à Meta que não poderia entregar todo o poder de fogo do Gemini solicitado para treinar e rodar modelos proprietários como o Llama. O volume de computação pedido pelo time de Mark Zuckerberg superava a capacidade disponível nos clusters do Google, forçando a empresa a impor um teto e, de quebra, colocar vários projetos internos da Meta em modo de espera.

Anúncios

Índice de Conteúdo

O que, exatamente, faltou?

A escassez não é de software, mas de GPU e aceleradores de IA de última geração. Placas como a NVIDIA H100, instâncias TPUv5e do próprio Google e soluções customizadas vêm sendo compradas aos milhares pelos maiores players do mercado. Mesmo assim, a demanda explodiu em um ritmo maior do que a capacidade de ampliar data centers.

Para driblar o gargalo, a liderança da Meta orientou equipes a “gastar” menos tokens — a unidade que mede quantas palavras ou sequências de dados um modelo processa. Em outras palavras, engenheiros passaram a otimizar prompts, reduzir lotes de treino e repriorizar tarefas.

Impacto direto no mercado de nuvem

A limitação não afetou só a Meta; outros clientes do Google Cloud também receberam cortes, mas em escala menor. Ainda assim, o episódio joga luz sobre uma questão crítica: a capacidade computacional virou o novo barril de petróleo da era digital. Sundar Pichai admitiu que, se houvesse mais servidores, a divisão de nuvem teria crescido além dos US$ 20 bilhões faturados no trimestre encerrado em março de 2026. A carteira de pedidos, segundo o executivo, “quase dobrou” justamente porque não havia ferro suficiente para atender todo mundo.

Por que isso importa para gamers, criadores e profissionais de TI?

1. Preços de GPU no varejo podem continuar altos. Quando as big techs compram lotes inteiros de chips H100 ou AMD MI300X, sobra menos silício para o consumidor final — reflexo que já vimos nas séries RTX 40 e Radeon 7000.

2. Serviços de IA podem encarecer. Ferramentas baseadas em nuvem, de APIs de linguagem a editores de imagem por IA, repassam parte do custo de processamento.

3. Novo ciclo de hardware à vista. Tanto Google quanto Amazon trabalham em aceleradores próprios (TPU v6, Graviton4, Inferentia2). A competição promete acelerar a chegada de placas PCIe e kits de desenvolvimento mais acessíveis para usuários finais interessados em IA local.

Corrida pela IA trava no gargalo: Google freia mega-pedido da Meta e escancara crise de hardware nos data centers - Imagem do artigo

Imagem: William R

Comparativo rápido: Google TPU vs. NVIDIA H100

Google TPU v5e (estimativa pública)
– 105 teraflops (FP16)
– 256 GB HBM2e por módulo
– 800 GB/s de banda

NVIDIA H100 PCIe
– 197 teraflops (FP16)
– 80 GB HBM3
– 3 000 GB/s de banda (NVLink)

Embora a TPU entregue mais memória total por pod, a H100 leva vantagem em largura de banda e ecossistema de software (CUDA). É justamente essa combinação que faz a NVIDIA dominar hoje cerca de 80 % do mercado de IA em nuvem, de acordo com analistas da Omdia.

O que vem a seguir?

Analistas preveem que a falta de chips de IA deve persistir até pelo menos 2025, quando novas fábricas da TSMC e Samsung entrarem em operação. Enquanto isso, clientes corporativos podem buscar diversificar fornecedores — daí o interesse em Instâncias Graviton4 da Amazon ou em parcerias com AMD e Intel Gaudi.

No curto prazo, espere ver batalhas por contratos multibilionários, otimizações de software para “fazer mais com menos” e, claro, a corrida pelo design de hardware cada vez mais eficiente. Para o usuário final, o recado é claro: manter seu setup atualizado e de olho nos lançamentos de GPUs pode fazer diferença quando a próxima onda de aplicações de IA bater à porta.

Com informações de Hardware.com.br

Corrida pela IA trava no gargalo: Google freia mega-pedido da Meta e escancara crise de hardware nos data centers

O que, exatamente, faltou?

Impacto direto no mercado de nuvem

Por que isso importa para gamers, criadores e profissionais de TI?

Comparativo rápido: Google TPU vs. NVIDIA H100

O que vem a seguir?

Esteja Conectado

Melhores Placas De Vídeos 2025

iPhone Air 256 GB despenca de preço na Amazon: ultrafino, chip A19 Pro e câmeras de 48 MP no menor valor histórico

Uber libera corridas exclusivas com motoristas mulheres em todo o Brasil: entenda como usar cada modalidade

Prime Day 2026: 7 truques para usar cupons de até R$ 1.000 e economizar no upgrade do seu setup gamer

Galaxy Z Fold 8 pode largar tela estreita: teasers da Samsung indicam formato “wide” e prometem 8 segredos

Aqui no Smartoutlets você encontra as melhores análises e reviews de produtos gamers, análises sinceras e o melhor preço do Mercado.

Institucional

O que, exatamente, faltou?

Impacto direto no mercado de nuvem

Por que isso importa para gamers, criadores e profissionais de TI?

Comparativo rápido: Google TPU vs. NVIDIA H100

O que vem a seguir?

Esteja Conectado

Melhores Placas De Vídeos 2025

Você também pode gostar disso