Se você está usando créditos gratuitos para testar modelos de inteligência artificial na nuvem, vale redobrar a atenção. Pelo menos 20 fundadores de startups acusam a Azure AI Foundry, plataforma de IA da Microsoft, de aplicar um “efeito surpresa” na hora da cobrança, gerando faturas de até US$ 1.600 sem aviso prévio. O grupo organizou um abaixo-assinado no Change.org direcionado ao CEO Satya Nadella e pede mudanças urgentes na interface e na política de billing.
O que aconteceu
A polêmica começou com Takuya Tominaga, fundador da startup japonesa Leach. Ele só descobriu que havia ultrapassado o limite dos créditos gratuitos quando o cartão de crédito foi debitado em cerca de US$ 1.600 pelo uso do modelo Claude, da Anthropic, disponível no marketplace da Azure.
Segundo o empreendedor, a UI da Azure AI Foundry coloca modelos próprios (Azure OpenAI) e de terceiros (Anthropic, Cohere, Hugging Face, etc.) no mesmo painel, sem qualquer diferença visual ou aviso de que a cobrança será direta no cartão. Resultado: quem acredita estar consumindo apenas os créditos promocionais da iniciativa Microsoft for Startups pode acabar “queimando” o orçamento da noite para o dia.
Por que isso importa para o seu caixa — e para o seu roadmap de hardware
Modelos de IA generativa consomem muita infraestrutura de GPU — um insumo caro que, fora do ecossistema de créditos, pesa no bolso como uma nova placa de vídeo topo de linha. Testar protótipos em nuvem é o caminho mais rápido para validar produtos, mas custos imprevisíveis minam qualquer planejamento de compra de hardware, seja para montar um laboratório local com placas RTX ou para contratar instâncias mais robustas de GPU na cloud.
Microsoft e Anthropic trocam responsabilidades
Tominaga tentou contestar a cobrança pelo suporte da Microsoft, mas recebeu apenas uma oferta parcial de estorno de US$ 1.000 em créditos, que ele recusou. A empresa sugeriu que o resto fosse negociado diretamente com a Anthropic, que, por sua vez, afirmou não ter visibilidade sobre o uso do modelo dentro da Azure Foundry.
Casos semelhantes relatados por Riyaj Shaikh, da EPAM Systems, e Bogdan Sevriukov, da Comprenders, mostram que o vai-e-vem entre as duas companhias é recorrente. Enquanto isso, um moderador do fórum oficial Microsoft Learn chegou a confirmar — e depois corrigir — que os créditos de startup cobririam o uso de modelos Claude, aumentando a confusão.
O que as startups estão pedindo
No abaixo-assinado, os fundadores sugerem mudanças simples na interface:
- Rótulos claros para diferenciar serviços cobertos pelos créditos daqueles cobrados à parte;
- Pop-ups de confirmação antes de iniciar o deploy de modelos de terceiros;
- Alertas em tempo real quando o consumo ultrapassar o saldo gratuito.
Segundo eles, ajustes de design como esses evitariam que equipes early-stage estourassem o budget sem perceber — algo crítico quando cada dólar economizado pode ser revertido em marketing, novas contratações ou, para quem é entusiasta de hardware, na compra de GPUs dedicadas para workloads locais.
Como se proteger de cobranças inesperadas
1. Configure alertas de gasto na Azure Cost Management. É o passo mais rápido para saber, em tempo real, se a conta começou a subir demais.
Imagem: Anirban Ghoshal
2. Use tags e orçamentos por recurso. Dessa forma, você visualiza se um endpoint específico (por exemplo, “Claude-dev”) está desviando do planejado.
3. Compare preços antes do deploy. Modelos de terceiros podem ser até 3× mais caros que o Azure OpenAI para a mesma quantidade de tokens.
4. Considere workloads híbridas. Dependendo do volume, comprar uma GPU RTX 4090 ou mesmo uma workstation com placas profissionais pode sair mais barato a médio prazo, especialmente se você já pensa em comercializar uma solução on-prem.
O que vem a seguir
Até o momento, a Microsoft não respondeu oficialmente às críticas nem confirmou se mudará a forma de exibir e tarifar modelos terceirizados na Azure AI Foundry. Enquanto isso, o abaixo-assinado segue ganhando adesões, e novos relatos de cobrança inesperada podem pressionar a gigante a rever o design da plataforma — algo que todo desenvolvedor de IA, seja ele usuário de Azure, AWS ou Google Cloud, deveria acompanhar de perto.
Para quem está avaliando investir em hardware próprio ou em instâncias de nuvem para treinar LLMs, a lição é clara: transparência de custos é tão importante quanto a potência da GPU. E, antes de clicar em “Deploy”, vale um duplo clique no orçamento.
Com informações de Computerworld