A Apple foi arrastada para o centro de uma nova batalha judicial que promete repercutir em toda a indústria de inteligência artificial. Três canais do YouTube — h3h3Productions, MrShortGame Golf e Golfholics — acusam a gigante de Cupertino de ter baixado ilegalmente cerca de 70 milhões de clipes da plataforma para treinar um modelo avançado de geração de vídeo. A ação coletiva, aberta na Califórnia, levanta a possibilidade de multas pesadas e, mais importante, coloca em xeque a estratégia da Apple para turbinar o Siri e disputar espaço com Google, OpenAI e Meta.
O que está sendo contestado?
No centro da disputa está o Panda-70M, um banco de dados que funciona como um “índice” para vídeos hospedados no YouTube. De acordo com a petição, a Apple teria usado o acervo para alimentar o projeto descrito no estudo científico STIV: Scalable Text and Image Conditioned Video Generation, publicado pela própria companhia no fim de 2024.
Para chegar aos arquivos originais, a empresa teria contornado ao menos cinco camadas de proteção do YouTube, incluindo:
- Quebra do rolling cipher, que esconde a URL real do vídeo;
- Uso de máquinas virtuais para trocar de IP e fugir de bloqueios por acesso em massa;
- Atualização automática de URLs de sessão com expiração curta;
- Suposta fraude em sistemas CAPTCHA;
- Falsificação de tokens que comprovam se a requisição vem de um player autorizado.
Pelos cálculos dos advogados, cada violação à Lei de Direitos Autorais do Milênio Digital (DMCA) pode render uma indenização de até US$ 150 mil por obra. Multiplique essa cifra pelo volume de clipes e o valor sobe à casa dos bilhões.
Por que isso importa para você?
Se você é criador de conteúdo, streamer ou até um desenvolvedor curioso sobre IA, o veredito deste caso pode definir quem tem direito a ser pago quando suas obras viram “alimento” de modelos generativos. Para o consumidor final, a decisão pode atrasar — ou acelerar — a chegada de um Siri realmente competitivo, capaz de gerar vídeos e interagir em linguagem natural como o ChatGPT.
Vale lembrar que a Apple corre contra o tempo: desde 2022, Google e OpenAI vêm demonstrando assistentes multimodais que entendem texto, imagem e até vídeo. Para fechar a lacuna, a empresa precisa de potência de hardware (os chips M3 Pro e M3 Max já trazem aceleração dedicada para IA) e, claro, de dados em grande escala. É aí que o Panda-70M entra em cena.
Um padrão de processos contra big techs
Os mesmos youtubers já abriram ações semelhantes contra Meta, Nvidia, ByteDance, Snap, Amazon e OpenAI. Todas giram em torno do uso não autorizado do mesmo dataset. O movimento sugere uma estratégia coordenada para pressionar as gigantes a criarem fundos de compensação ou firmarem acordos de licenciamento — algo que a indústria musical fez na era do streaming.
Imagem: William R
Fragilidades da acusação (por enquanto)
Apesar do barulho, os autores reconhecem que ainda não possuem logs técnicos detalhados das descargas feitas pela Apple. Eles se apoiam majoritariamente nos próprios artigos acadêmicos da companhia, que citam os canais como parte do material coletado. A ausência de provas forenses pode adiar uma decisão definitiva, mas o debate público sobre “IA justa” já ganhou novo fôlego.
Próximos capítulos e impacto no mercado
• Se o juiz determinar que o treinamento violou a DMCA, a Apple terá de descartar (ou “esterilizar”) modelos criados com o Panda-70M — algo tecnicamente complexo e caro.
• Uma derrota também obrigaria outras big techs a rever coleções de dados usadas em projetos de IA generativa.
• Para criadores, abre-se a porta para royalties ou acordos de licenciamento automáticos, semelhante ao que acontece com músicas em plataformas de streaming.
Enquanto isso, a Apple segue investindo na integração de IA em todo seu ecossistema — de MacBooks com GPU dedicada a iPhones que já rodam modelos on-device. Se o caso atrasar esse roadmap, consumidores podem ver recursos de concorrentes chegarem primeiro, inclusive em gadgets que você encontra hoje com desconto em programas de afiliados da Amazon.
No fim das contas, o que está em jogo não é apenas um conjunto de vídeos, mas o modelo de negócios que sustentará a próxima geração de assistentes virtuais, PCs e consoles. Fique de olho: decisões como essa moldarão desde o FPS que você joga até o teclado mecânico que você decide comprar para melhorar sua produtividade (e que, quem sabe, já traz macros alimentadas por IA).
Com informações de Hardware.com.br