Você pisca, e um novo termo domina as apresentações de CEOs na CES, relatórios de analistas e posts de LinkedIn. A bola da vez é a AI Factory — ou “fábrica de inteligência artificial”. Mas afinal, estamos falando de um data center turbinado, de um rack pronto para uso ou de um pacote de software? A resposta é: depende de quem está vendendo. E essa confusão pode custar caro para empresas que pretendem surfar a próxima onda de IA generativa.
Por que você vai ouvir (muito) falar em AI Factory
A demanda por GPUs de ponta como a NVIDIA H100, interconexões InfiniBand de baixa latência e dissipação térmica cada vez mais agressiva criou um gargalo: data centers tradicionais não aguentam o tranco. Assim nasceu a ideia de concentrar energia, resfriamento e automação em ambientes pensados 100% para treinar modelos gigantes de IA — uma operação que, na prática, se assemelha a uma linha de produção industrial. Daí o apelido “fábrica”.
NVIDIA: “Não é só um data center”
No palco da CES, Jensen Huang deixou claro que, para a NVIDIA, AI Factory significa um novo tipo de infraestrutura. “Data center é onde você guarda dados; aqui estamos fabricando conhecimento”, resumiu o CEO. Na visão da empresa, isso implica:
- Consumo de megawatts extras para alimentar dezenas de milhares de GPUs.
- Liquid cooling como padrão, já que ar condensado não dá conta de chips de 700 W.
- Sistemas de orquestração que distribuem modelos gigantescos (transformers com trilhões de parâmetros) em clusters heterogêneos.
Quando o prédio vira parte do hardware
Segundo a Siemens, controlar uma AI Factory exige automação industrial, não BMS (Building Management System) tradicional. Já Bill Vass, CTO da Booz Allen Hamilton, cita detalhes práticos: pisos de concreto reforçado para racks de até 1 tonelada, geminação com gêmeos digitais (digital twins) para prever falhas e otimizar rotas de ar e líquido. É a arquitetura de TI encontrando a engenharia civil.
De um rack a centenas: AWS e Lenovo apostam no “pacote fechado”
Nem toda fábrica de IA ocupa um galpão. A AWS AI Factory oferece hardware + software rodando on-premises, mas gerenciado pela nuvem de Seattle: entra Bedrock para LLMs, sai a dor de cabeça de manutenção.
Na Lenovo, o conceito ganhou forma em módulos: cada rack, pouco maior que uma geladeira, chega pré-configurado para o caso de uso do cliente. De 1 a 100+ racks, tudo opera como um supercluster único. É plug-and-play no sentido mais literal: o time de instalação só conecta energia e fibra ótica.
Software: a “esteira” invisível que acelera modelos
Pesquisadores do MIT Sloan definem AI Factory como stack completo: plataformas, métodos, dados e algoritmos recicláveis. Sem essa base, cada novo projeto começa do zero — caro e demorado. A Deloitte adiciona um KPI: throughput de tokens. Produzir tokens gerados por LLM vira o equivalente moderno das unidades por hora de uma indústria automobilística.
Imagem: Maria Korolov
Europa vai de “gigafábricas”
A Comissão Europeia reservou € 20 bilhões até 2025 para até cinco AI Gigafactories. O objetivo: treinar modelos de próxima geração em solo europeu, reduzindo dependência de hyperscalers dos EUA e da Ásia.
O que isso muda para você — e para a lista de compras de TI
• Orçamento de energia: se sua empresa cogita IA generativa em escala, prepare-se para contas elétricas maiores (e talvez incentivos “verdes” para compensar).
• Liquid cooling deixa de ser exótico: blocos de água, cold plates e unidades de rear-door heat exchanger começam a aparecer em catálogos — inclusive na Amazon.
• GPUs e DPUs sob demanda: modelos prontos (como as instâncias AWS ou racks Lenovo) oferecem caminho rápido, mas quem quiser “montar em casa” terá de garantir estoque de GPUs de datacenter, cabos DAC e NICs de 400 GbE.
• ROI focado em tokens: não basta comprar hardware; é preciso medir quantos tokens úteis esses petaflops entregam. Ferramentas de observabilidade entram no orçamento.
No fim do dia, “AI Factory” é rótulo elástico. Pode ser um galpão monstro com lago artificial para resfriamento, pode ser um rack turnkey ou um framework de software. Na próxima vez que um fornecedor oferecer uma, pergunte: estamos falando de concreto, de código — ou de ambos?
Com informações de Computerworld