Ao utilizar este site, você concorda com a Política de Privacidade com os Termos de Uso.
Aceitar
smartoutletssmartoutletssmartoutlets
  • Blog
  • Análises e Comparações
    Análises e ComparaçõesMostrar mais
    Suposto “Steam Machine” chinês de R$ 3,5 mil impressiona no papel, mas detalhes denunciam golpe de hardware
    5 Leitura mínima
    Nova Gigabyte B850 AORUS Elite X3D traz overclock por IA, DDR5 a 8.200 MT/s e Wi-Fi 7 para quem mira os Ryzen 9000
    5 Leitura mínima
    Promoção de Férias Steam derruba preços de clássicos da Konami em até 85% – Metal Gear, Silent Hill e mais
    4 Leitura mínima
    AION 2 voa alto: NC libera diários de desenvolvimento globais e crava estreia em setembro no Steam
    6 Leitura mínima
    State of Decay 3 promete co-op sem correntes e bases gigantes: veja tudo que mudou no survival da Xbox
    5 Leitura mínima
  • Dicas e Inspiração
    Dicas e InspiraçãoMostrar mais
    GitHub automatiza a conformidade de licenças open source: veja como evitar dores de cabeça jurídicas e retrabalho
    4 Leitura mínima
    Memora: nova tecnologia da Microsoft promete “memória de elefante” para agentes de IA e até 98% menos tokens
    5 Leitura mínima
    El Niño poderá durar até 2027 e acender o alerta para ondas de calor que castigam PCs, consoles e data centers
    5 Leitura mínima
    Microsoft 365 na mira: Itália investiga aumento de preço após chegada do Copilot e Designer
    5 Leitura mínima
    Crise global de memória RAM: por que o encarecimento que assombra a Apple vai bater no seu bolso até 2027
    6 Leitura mínima
  • Arena Performance
    Arena PerformanceMostrar mais
    Galaxy Watch 9 e Watch Ultra 2 vazam com 12 novas pulseiras: personalização total antes do próximo Unpacked
    4 Leitura mínima
    Semana gamer: Monopoly Star Wars redefine o tabuleiro digital enquanto Rhythm Heaven Groove faz o Switch dançar
    5 Leitura mínima
    10 Personagens de The Elder Scrolls que Todo Fã Precisa Conhecer (e Relembrar Antes do TES VI)
    6 Leitura mínima
    Novo ataque Shai-Hulud sequestra projetos no GitHub e espalha malware em npm e Go: veja como proteger seu código
    6 Leitura mínima
    Supergirl lidera as estreias de 25 de junho: veja por que o novo filme da heroína (e mais 4 lançamentos) merecem entrar no seu radar
    6 Leitura mínima
  • Radar de Lançamentos
    Radar de LançamentosMostrar mais
    LG StanbyME 2 Max: a tela 4K de 32″ que roda pela casa inteira e troca o sofá pelo toque
    6 Leitura mínima
    iPhone 15 de 128 GB despenca 51% e atinge menor preço histórico para assinantes Amazon Prime
    5 Leitura mínima
    Disney+ dispara preço no Brasil e assume o topo do ranking: veja quanto vai custar e se ainda vale a pena
    5 Leitura mínima
    Galaxy S27 mantém telas premium da Samsung: entenda o recuo nos painéis chineses e o impacto no preço final
    5 Leitura mínima
    Disney+ aumenta mensalidades no Brasil e ultrapassa Netflix: veja novos preços e como isso impacta seu bolso
    5 Leitura mínima
  • Guias e Tutoriais
    Guias e TutoriaisMostrar mais
    WhatsApp libera usernames e permite esconder seu número — garanta o seu antes que acabe
    4 Leitura mínima
    OpenAI lança “controle remoto” para programadores: macro pad exclusivo do Codex chega em 15 de julho
    5 Leitura mínima
    Carros de GTA 6 chamam atenção e já desafiam Forza Horizon e Gran Turismo em qualidade gráfica; compare você mesmo
    6 Leitura mínima
    Microsoft usa Age of Empires II (com cabras!) para mostrar por que ChatGPT não “pensa” — e o que isso muda para você
    4 Leitura mínima
    Surto de CPUs Ryzen X3D queimadas em placas-mãe AM5 acende alerta: 70% dos relatos envolvem modelos ASRock
    5 Leitura mínima
  • Páginas
    • Política de Privacidade
    • Termos de Uso do
    • Contato
Search
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Leitura: Memora: nova tecnologia da Microsoft promete “memória de elefante” para agentes de IA e até 98% menos tokens
Compartilhar
Entrar
Notificação Mostrar mais
Redimensionamento de fontesAa
smartoutletssmartoutlets
Redimensionamento de fontesAa
Search
  • Blog
  • Análises e Comparações
  • Dicas e Inspiração
  • Arena Performance
  • Radar de Lançamentos
  • Guias e Tutoriais
  • Páginas
    • Política de Privacidade
    • Termos de Uso do
    • Contato
Já tem uma conta? Entrar
Siga os EUA
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
smartoutlets > Blog > Dicas e Inspiração > Memora: nova tecnologia da Microsoft promete “memória de elefante” para agentes de IA e até 98% menos tokens
Dicas e Inspiração

Memora: nova tecnologia da Microsoft promete “memória de elefante” para agentes de IA e até 98% menos tokens

Última atualização: junho 30, 2026 2:21 pm
bezerra_1513
Compartilhar
COMPARTILHAR

Imagine um assistente de inteligência artificial que lembre de cada preferência sua — dos pedidos de pizza às configurações ideais do seu teclado mecânico — mesmos meses depois da conversa inicial. Essa é a ambição do Memora, sistema de memória de longo prazo recém-apresentado pelo Microsoft Research. A novidade pretende eliminar o grande gargalo dos agentes baseados em LLMs: a incapacidade de guardar contexto extenso sem explodir o consumo de tokens (e, consequentemente, de GPU na nuvem).

Anúncios
Índice de Conteúdo
  • Por que a memória virou o calcanhar de Aquiles dos LLMs?
  • Como o Memora resolve o problema
  • Benchmarks: números que chamam atenção
  • Nem tudo são flores: latência e governança
  • Disponibilidade e o que isso significa para desenvolvedores
  • Por que ficar de olho se você é entusiasta de hardware?

Por que a memória virou o calcanhar de Aquiles dos LLMs?

Modelos como GPT-4, Claude ou Gemini são excelentes em raciocínio, mas começam cada sessão “do zero”. Para manter a coerência em diálogos longos — pense em atendimentos de suporte, campanhas de marketing ou monitoramento de servidores — as soluções atuais resumem ou armazenam blocos de texto sem muito critério. O resultado é fragmentação de dados, perda de detalhes cruciais e contas salgadas de infraestrutura.

Abordagens populares hoje caem em dois extremos:

  • RAG/Mem0 – preservam cada fragmento de conversa, mas geram milhares de entradas soltas.
  • Sumarização grosseira – reduz o tamanho do prompt, mas “apaga” números, exceções e casos de uso específicos.

Para quem desenvolve chatbots de e-commerce ou agentes que monitoram placas de vídeo em datacenters, esses limites viram custos extras de GPU, latência e, principalmente, usuários frustrados.

Como o Memora resolve o problema

A arquitetura aposta em separar o que o agente lembra de como ele encontra essa informação.

1. Abstração primária: uma frase curta (6 a 8 palavras) que resume o tema central de cada memória.
2. Valor da memória: todo o conteúdo rico — detalhes técnicos, números, exceções.

Entradas sobre um mesmo assunto são mescladas sob a mesma abstração, evitando duplicidade. Para facilitar a busca, o Memora gera automaticamente cue anchors, tags contextuais que funcionam como “atalhos” semânticos.

O motor de busca também mudou: em vez de retornar simplesmente o top-k mais parecido, ele faz buscas iterativas, expande por cue anchors e decide sozinho quando parar, navegando na memória como quem folheia um índice inteligente.

Benchmarks: números que chamam atenção

Nos testes LoCoMo (600 interações) e LongMemEval (115 mil tokens), o Memora atingiu 86,3% e 87,4% de acurácia, superando RAG, Mem0, Nemori, Zep, LangMem e até a inferência com contexto completo. Além disso:

Memora: nova tecnologia da Microsoft promete “memória de elefante” para agentes de IA e até 98% menos tokens - Imagem do artigo

Imagem: Nidhi Singal

  • 98% menos tokens que o prompt integral.
  • 344 entradas por conversa (quase metade do Mem0).

Traduzindo: menos tokens significa menos chamadas de API, menos ciclos de GPU e potencial economia, algo vital para empresas que treinam modelos em placas como NVIDIA H100 ou até em builds locais com RTX 4090.

Nem tudo são flores: latência e governança

O analista Sanchit Vir Gogia lembra que o modo de busca “inteligente” leva de 5 a 6 segundos por query — bem acima dos < 1s do RAG simples. O ganho em tokens pode voltar como latência. Além disso, a conta de nuvem inclui construção, indexação e auditoria da memória, itens fora dos benchmarks.

Há também questões regulatórias: sob o EU AI Act ou a Lei Indiana de Proteção de Dados, empresas precisarão registrar quem escreveu, quem leu e por que aquela memória foi usada em determinada decisão.

Disponibilidade e o que isso significa para desenvolvedores

O código-fonte está no GitHub, aberto para experimentação. Nada impede que você plugue o Memora em um chatbot que indique o melhor mouse gamer ou faça RAG de reviews da Amazon. Entretanto, o próprio Microsoft Research admite: é projeto ativo, não produto pronto. Antes de rodar em produção, será preciso validar performance, segurança e compliance.

Por que ficar de olho se você é entusiasta de hardware?

Cada token economizado significa menos VRAM, menos tempo de GPU e mais espaço para rodar outros processos — ótimo para quem já espreme múltiplas instâncias de IA em uma única RTX 3060 Ti de 8 GB ou planeja montar um home lab com processadores Ryzen e placas usadas. Se essa tecnologia vingar, poderemos ver assistentes locais mais completos sem necessidade de upgrades caros.

O Memora ainda está em fase de pesquisa, mas traz uma visão clara: a próxima geração de agentes de IA precisará de memória tão organizada quanto rápida. Quem sair na frente hoje pode ter vantagem competitiva — e economizar bons dólares em nuvem no caminho.

Com informações de Computerworld

Apple Intelligence chegará em 2026: Tim Cook garante salto de IA que promete turbinar iPhone, Mac e todo o ecossistema
Relatório da Microsoft Questiona Necessidade de Ferramentas Extras de Segurança de E-mail — Mas Especialistas Alertam: “Não Abra Mão da Redundância”
Encélado surpreende: estudo confirma oceano com moléculas orgânicas complexas e reacende a caça à vida fora da Terra
Corte de 75% no preço do DeepSeek V4-Pro acirra a guerra da IA e pode baratear seus projetos (e até seu próximo PC)
8 joias do cinema mundial para ver nos streamings — e os gadgets que transformam sua sala em um verdadeiro cinema
Compartilhe este artigo
Facebook Copiar link Imprimir
Porbezerra_1513
Acompanhe:
Olá, sou Marcos Bezerra. Aos 34 anos, uni minhas duas grandes paixões: games e tecnologia. Sou formado em Programação e TI e fundei o site smartoutlets com uma missão clara: oferecer os melhores produtos com um custo-benefício excelente para os clientes. Bem-vindo!
Artigo anterior Disney+ aumenta mensalidades no Brasil e ultrapassa Netflix: veja novos preços e como isso impacta seu bolso
Próximo Artigo Galaxy S27 mantém telas premium da Samsung: entenda o recuo nos painéis chineses e o impacto no preço final

Esteja Conectado

54.3kSeguir
bandeira bandeira
Melhores Placas De Vídeos 2025
Compre o seu pc gamers, e atualize seu setup com as melhores placas de vídeo em um preço imperdivel.
Compre com Desconto
GitHub automatiza a conformidade de licenças open source: veja como evitar dores de cabeça jurídicas e retrabalho
Dicas e Inspiração
WhatsApp libera usernames e permite esconder seu número — garanta o seu antes que acabe
Guias e Tutoriais
LG StanbyME 2 Max: a tela 4K de 32″ que roda pela casa inteira e troca o sofá pelo toque
Radar de Lançamentos
iPhone 15 de 128 GB despenca 51% e atinge menor preço histórico para assinantes Amazon Prime
Radar de Lançamentos

Você também pode gostar disso

Dicas e Inspiração

Amazon vs. Perplexity: a disputa que pode mudar a forma como você escolhe e compra peças de PC

bezerra_1513
5 Leitura mínima
Dicas e Inspiração

Microsoft Teams 2024: o guia turbo para dominar chats, reuniões, Loop e Copilot sem sofrer

bezerra_1513
8 Leitura mínima
Dicas e Inspiração

Chá verde turbo para o metabolismo? Estudo brasileiro revela como a bebida pode ajudar no controle de peso

bezerra_1513
4 Leitura mínima
Dicas e Inspiração

Lua “pisca” duas vezes em 48 h: entenda os impactos que brilharam no céu e saiba como observar o próximo fenômeno

bezerra_1513
6 Leitura mínima
Dicas e Inspiração

Microsoft lança trio de IAs ultrarrápidas para texto, voz e imagem e reduz a dependência da OpenAI

bezerra_1513
5 Leitura mínima
Dicas e Inspiração

Lua Cheia de 96% ilumina o céu neste sábado: veja o calendário lunar de abril e dicas para fotografar o satélite

bezerra_1513
5 Leitura mínima

Aqui no Smartoutlets você encontra as melhores análises e reviews de produtos gamers, análises sinceras e o melhor preço do Mercado.

Institucional

  • Fale Conosco
  • Política de Privacidade
  • Termos de Uso
smartoutletssmartoutlets
Siga os EUA
© 2025 Smartoutlets . Todos os direitos reservados.
Welcome Back!

Sign in to your account

Nome de usuário ou endereço de e-mail
Senha

Perdeu sua senha?