Claude Mythos 5: O que 10 trilhões de parâmetros dizem sobre o futuro da IA

Um vazamento acidental expôs o modelo mais poderoso da Anthropic. Vou te contar o que isso significa de verdade pra quem trabalha com IA.

No final de março, a Anthropic deixou vazar acidentalmente milhares de arquivos internos. Entre eles, um rascunho de anúncio do Claude Mythos 5 — um modelo com incríveis 10 trilhões de parâmetros.

Eu vi a comunidade de IA explodir. Fóruns, X (antigo Twitter), grupos de desenvolvedores — todo mundo debatendo se isso é real, se faz sentido, se já chegamos no limite das leis de escala.

Vou ser direta: esse vazamento não é só sobre números grandes. É sobre onde a IA está indo e o que isso muda pra quem trabalha com tecnologia hoje.

O vazamento que ninguém esperava

Por volta de 26 de março, pesquisadores de segurança descobriram que o CMS da Anthropic estava com configuração errada. Resultado: 3.000 arquivos internos ficaram expostos publicamente.

Entre os documentos, havia descrições do Mythos (codinome interno "Capivara") como uma "mudança radical" e "de longe o modelo mais poderoso" que eles já desenvolveram.

O detalhe que chamou atenção? 10 trilhões de parâmetros — um salto absurdo comparado com o Claude Opus 4.6, o modelo principal deles hoje.

A Anthropic confirmou o vazamento e disse que foi erro humano ao marcar arquivos como privados. Também confirmou que o modelo existe e está em testes com clientes selecionados, principalmente na área de defesa cibernética.

Mas não divulgou benchmarks oficiais nem deu data de lançamento público. Alegam que precisam melhorar a eficiência e garantir "implementação responsável" por causa das capacidades avançadas do modelo.

Se os 10 trilhões de parâmetros se confirmarem, o Mythos 5 representa um novo patamar nas leis de escalabilidade que guiaram o avanço da IA desde 2020.

Por que 10 trilhões de parâmetros importa

Pra entender a dimensão disso, preciso voltar um pouco nas leis de escala.

Desde os estudos de Kaplan em 2020 e as leis Chinchilla em 2022, sabemos que o desempenho de modelos de IA melhora de forma previsível quando você aumenta três coisas:

Parâmetros (tamanho do modelo)
Dados de treinamento (quantidade de tokens)
Poder computacional (GPUs, TPUs, energia)

Mas entre 2024 e 2025, os grandes laboratórios começaram a ver retornos decrescentes só com escala bruta. A solução? Inovações como:

Mixture of Experts (MoE) — ativa só parte dos parâmetros por vez
Curadoria de dados melhor, incluindo dados sintéticos
Melhorias arquitetônicas (atenção aprimorada, modelos de espaço de estados)
Pós-treinamento mais sofisticado (RLHF, ajuste fino com agentes)

O Mythos 5 parece estar combinando tudo isso numa escala que ninguém tentou antes.

Mesmo usando MoE — onde só uma fração dos parâmetros fica ativa — ter 10 trilhões no total significa que as inferências podem usar centenas de bilhões de parâmetros ativos. Muito além do GPT-4 ou do Opus 4.6.

Onde o Mythos 5 supostamente brilha

A Anthropic não liberou benchmarks oficiais, mas os documentos vazados e relatos de quem teve acesso antecipado apontam três áreas principais:

1. Cibersegurança ofensiva e defensiva

A descrição da própria empresa é impressionante — e preocupante. Eles dizem que o Mythos está "muito à frente de qualquer outro modelo de IA" em capacidades cibernéticas.

Estamos falando de um modelo que pode explorar vulnerabilidades de formas que superam os esforços dos defensores. Isso não é chatbot melhorado. É automação de testes de intrusão em escala sem precedentes.

É por isso que o acesso antecipado está indo primeiro pra quem trabalha com defesa cibernética.

2. Programação e engenharia de software

Benchmarks como o SWE-bench (que testa a capacidade de resolver issues reais do GitHub) e o Terminal-Bench 2.0 devem mostrar ganhos significativos.

Relatos de comunidade mencionam +13 pontos no Terminal-Bench e melhorias ainda maiores em tarefas agentivas — aquelas que exigem edição em vários arquivos, depuração de repositórios grandes, planejamento em múltiplas etapas.

Na minha experiência com o Opus 4.6, já dá pra ver o quanto esses modelos estão ficando bons em contexto longo e raciocínio sobre código. O Mythos 5 parece levar isso a outro nível.

3. Raciocínio acadêmico e contexto amplo

Com janela de contexto estimada entre 500 mil e 1 milhão de tokens, o modelo consegue processar bases de código inteiras, artigos científicos extensos ou documentos jurídicos complexos — e fazer sínteses profundas.

Isso alinha com a tendência de equipes de agentes que estamos vendo em 2026: modelos que não só respondem, mas planejam, executam e iteram de forma autônoma.

O que isso muda pra quem trabalha com IA

Na prática, modelos como o Mythos 5 vão exigir mudanças de fluxo de trabalho:

Benchmarks tradicionais estão saturados. Precisamos de avaliações mais adversárias, especialmente em tarefas de longo prazo e cibersegurança.
Cientistas de dados viram orquestradores de agentes. Em vez de escrever pipelines, você vai dirigir equipes de agentes que exploram dados, geram hipóteses e iteram sozinhas.
Custo continua sendo fator crítico. Modelos desse porte custam caro pra treinar (estimativas falam em US$ 5 a 15 bilhões) e pra rodar. Espere preços escalonados e necessidade de destilação pra tornar as capacidades acessíveis.

Pra quem está no Brasil ou em mercados emergentes, a questão não é só ter acesso ao modelo mais poderoso — é saber usar técnicas de eficiência como quantização, cache otimizado, ajustes finos locais e configurações de nuvem híbrida.

A mensagem é clara: o gargalo não é mais a capacidade dos modelos, mas como nós integramos esses sistemas de forma produtiva e responsável.

O dilema da IA responsável

A Anthropic está hesitando no lançamento público por um motivo que eu respeito: o potencial ofensivo do modelo supera as ferramentas defensivas atuais.

Eles vêm defendendo há anos a necessidade de pausas ou estruturação cuidadosa quando os riscos aumentam. Isso faz parte da filosofia de IA Constitucional deles.

Claro, alguns críticos dizem que isso é marketing ou posicionamento competitivo. Mas eu vejo valor em desacelerar voluntariamente quando você tem algo tão poderoso em mãos.

Questões que precisamos debater como indústria:

Certas funcionalidades (geração autônoma de exploits, por exemplo) devem ter controles de acesso estruturados?
Como medir quantitativamente a "vantagem do defensor" em cibersegurança?
Que governança é escalável com a capacidade dos modelos?

Não tenho respostas prontas. Mas acho fundamental que empresas, desenvolvedores e governos estejam nessa conversa agora, não depois que os problemas aparecerem.

E o custo ambiental?

Treinar um modelo de 10 trilhões de parâmetros consome energia equivalente ao uso de milhares de residências por meses. A inferência em larga escala só aumenta essa pegada.

Por outro lado, esses modelos podem acelerar descobertas científicas — modelagem climática, descoberta de medicamentos, otimização de energia — que geram impacto ambiental líquido positivo.

Não dá pra ignorar a conta, mas também não dá pra simplificar dizendo que "IA grande = ruim pro planeta". A equação é mais complexa.

Laboratórios estão investindo pesado em data centers movidos a energia renovável e em técnicas de eficiência energética justamente por isso.

O que vem depois?

Se as leis de escalabilidade continuarem válidas — e tudo indica que sim, com inovações arquitetônicas — podemos esperar:

Modelos esparsos ainda maiores em 2027
Mais foco em escalabilidade em tempo de teste (mais compute na inferência via busca, verificação, debate multiagente)
Convergência entre raciocínio, codificação e cibersegurança em sistemas agentes gerais
Escrutínio regulatório crescente em todos os mercados

Mercados de previsão indicam boas chances de o Mythos 5 (ou algo parecido) ficar disponível ao público até meados ou final de 2026. Mas obstáculos de eficiência podem atrasar o acesso amplo.

Meu takeaway pra você

O Claude Mythos 5 não é só sobre números maiores. É sobre o que acontece quando você combina escala inteligente com arquitetura melhor, dados melhores e pós-treinamento mais sofisticado.

Se você trabalha com IA, agentes ou automação, minha sugestão é clara:

Experimente as ferramentas de agentes atuais. Não espere o Mythos 5 chegar. O Opus 4.6, o GPT-5.x, o Gemini 3.1 — já dá pra fazer muita coisa hoje.
Estude técnicas de eficiência. Quantização, destilação, cache otimizado. Isso vai fazer diferença quando modelos maiores ficarem disponíveis.
Participe do debate sobre segurança e governança. Isso não é só pra acadêmicos ou policy makers. É pra quem constrói e usa esses sistemas.

A fronteira da IA está avançando mais rápido do que a maioria das organizações consegue acompanhar. Quem experimentar agora vai estar na frente quando a próxima onda chegar.

E você, já está testando agentes de IA no seu trabalho? Conta aqui nos comentários qual ferramenta você tá usando e o que tem achado da evolução dos modelos.