Claude Mythos 5: O que 10 trilhões de parâmetros dizem sobre o futuro da IA
Um vazamento acidental expôs o modelo mais poderoso da Anthropic. Vou te contar o que isso significa de verdade pra quem trabalha com IA.
No final de março, a Anthropic deixou vazar acidentalmente milhares de arquivos internos. Entre eles, um rascunho de anúncio do Claude Mythos 5 — um modelo com incríveis 10 trilhões de parâmetros.
Eu vi a comunidade de IA explodir. Fóruns, X (antigo Twitter), grupos de desenvolvedores — todo mundo debatendo se isso é real, se faz sentido, se já chegamos no limite das leis de escala.
Vou ser direta: esse vazamento não é só sobre números grandes. É sobre onde a IA está indo e o que isso muda pra quem trabalha com tecnologia hoje.
O vazamento que ninguém esperava
Por volta de 26 de março, pesquisadores de segurança descobriram que o CMS da Anthropic estava com configuração errada. Resultado: 3.000 arquivos internos ficaram expostos publicamente.
Entre os documentos, havia descrições do Mythos (codinome interno "Capivara") como uma "mudança radical" e "de longe o modelo mais poderoso" que eles já desenvolveram.
O detalhe que chamou atenção? 10 trilhões de parâmetros — um salto absurdo comparado com o Claude Opus 4.6, o modelo principal deles hoje.
A Anthropic confirmou o vazamento e disse que foi erro humano ao marcar arquivos como privados. Também confirmou que o modelo existe e está em testes com clientes selecionados, principalmente na área de defesa cibernética.
Mas não divulgou benchmarks oficiais nem deu data de lançamento público. Alegam que precisam melhorar a eficiência e garantir "implementação responsável" por causa das capacidades avançadas do modelo.
Se os 10 trilhões de parâmetros se confirmarem, o Mythos 5 representa um novo patamar nas leis de escalabilidade que guiaram o avanço da IA desde 2020.
Por que 10 trilhões de parâmetros importa
Pra entender a dimensão disso, preciso voltar um pouco nas leis de escala.
Desde os estudos de Kaplan em 2020 e as leis Chinchilla em 2022, sabemos que o desempenho de modelos de IA melhora de forma previsível quando você aumenta três coisas:
- Parâmetros (tamanho do modelo)
- Dados de treinamento (quantidade de tokens)
- Poder computacional (GPUs, TPUs, energia)
Mas entre 2024 e 2025, os grandes laboratórios começaram a ver retornos decrescentes só com escala bruta. A solução? Inovações como:
- Mixture of Experts (MoE) — ativa só parte dos parâmetros por vez
- Curadoria de dados melhor, incluindo dados sintéticos
- Melhorias arquitetônicas (atenção aprimorada, modelos de espaço de estados)
- Pós-treinamento mais sofisticado (RLHF, ajuste fino com agentes)
O Mythos 5 parece estar combinando tudo isso numa escala que ninguém tentou antes.
Mesmo usando MoE — onde só uma fração dos parâmetros fica ativa — ter 10 trilhões no total significa que as inferências podem usar centenas de bilhões de parâmetros ativos. Muito além do GPT-4 ou do Opus 4.6.
Onde o Mythos 5 supostamente brilha
A Anthropic não liberou benchmarks oficiais, mas os documentos vazados e relatos de quem teve acesso antecipado apontam três áreas principais:
1. Cibersegurança ofensiva e defensiva
A descrição da própria empresa é impressionante — e preocupante. Eles dizem que o Mythos está "muito à frente de qualquer outro modelo de IA" em capacidades cibernéticas.
Estamos falando de um modelo que pode explorar vulnerabilidades de formas que superam os esforços dos defensores. Isso não é chatbot melhorado. É automação de testes de intrusão em escala sem precedentes.
É por isso que o acesso antecipado está indo primeiro pra quem trabalha com defesa cibernética.
2. Programação e engenharia de software
Benchmarks como o SWE-bench (que testa a capacidade de resolver issues reais do GitHub) e o Terminal-Bench 2.0 devem mostrar ganhos significativos.
Relatos de comunidade mencionam +13 pontos no Terminal-Bench e melhorias ainda maiores em tarefas agentivas — aquelas que exigem edição em vários arquivos, depuração de repositórios grandes, planejamento em múltiplas etapas.
Na minha experiência com o Opus 4.6, já dá pra ver o quanto esses modelos estão ficando bons em contexto longo e raciocínio sobre código. O Mythos 5 parece levar isso a outro nível.
3. Raciocínio acadêmico e contexto amplo
Com janela de contexto estimada entre 500 mil e 1 milhão de tokens, o modelo consegue processar bases de código inteiras, artigos científicos extensos ou documentos jurídicos complexos — e fazer sínteses profundas.
Isso alinha com a tendência de equipes de agentes que estamos vendo em 2026: modelos que não só respondem, mas planejam, executam e iteram de forma autônoma.
O que isso muda pra quem trabalha com IA
Na prática, modelos como o Mythos 5 vão exigir mudanças de fluxo de trabalho:
- Benchmarks tradicionais estão saturados. Precisamos de avaliações mais adversárias, especialmente em tarefas de longo prazo e cibersegurança.
- Cientistas de dados viram orquestradores de agentes. Em vez de escrever pipelines, você vai dirigir equipes de agentes que exploram dados, geram hipóteses e iteram sozinhas.
- Custo continua sendo fator crítico. Modelos desse porte custam caro pra treinar (estimativas falam em US$ 5 a 15 bilhões) e pra rodar. Espere preços escalonados e necessidade de destilação pra tornar as capacidades acessíveis.
Pra quem está no Brasil ou em mercados emergentes, a questão não é só ter acesso ao modelo mais poderoso — é saber usar técnicas de eficiência como quantização, cache otimizado, ajustes finos locais e configurações de nuvem híbrida.
A mensagem é clara: o gargalo não é mais a capacidade dos modelos, mas como nós integramos esses sistemas de forma produtiva e responsável.
O dilema da IA responsável
A Anthropic está hesitando no lançamento público por um motivo que eu respeito: o potencial ofensivo do modelo supera as ferramentas defensivas atuais.
Eles vêm defendendo há anos a necessidade de pausas ou estruturação cuidadosa quando os riscos aumentam. Isso faz parte da filosofia de IA Constitucional deles.
Claro, alguns críticos dizem que isso é marketing ou posicionamento competitivo. Mas eu vejo valor em desacelerar voluntariamente quando você tem algo tão poderoso em mãos.
Questões que precisamos debater como indústria:
- Certas funcionalidades (geração autônoma de exploits, por exemplo) devem ter controles de acesso estruturados?
- Como medir quantitativamente a "vantagem do defensor" em cibersegurança?
- Que governança é escalável com a capacidade dos modelos?
Não tenho respostas prontas. Mas acho fundamental que empresas, desenvolvedores e governos estejam nessa conversa agora, não depois que os problemas aparecerem.
E o custo ambiental?
Treinar um modelo de 10 trilhões de parâmetros consome energia equivalente ao uso de milhares de residências por meses. A inferência em larga escala só aumenta essa pegada.
Por outro lado, esses modelos podem acelerar descobertas científicas — modelagem climática, descoberta de medicamentos, otimização de energia — que geram impacto ambiental líquido positivo.
Não dá pra ignorar a conta, mas também não dá pra simplificar dizendo que "IA grande = ruim pro planeta". A equação é mais complexa.
Laboratórios estão investindo pesado em data centers movidos a energia renovável e em técnicas de eficiência energética justamente por isso.
O que vem depois?
Se as leis de escalabilidade continuarem válidas — e tudo indica que sim, com inovações arquitetônicas — podemos esperar:
- Modelos esparsos ainda maiores em 2027
- Mais foco em escalabilidade em tempo de teste (mais compute na inferência via busca, verificação, debate multiagente)
- Convergência entre raciocínio, codificação e cibersegurança em sistemas agentes gerais
- Escrutínio regulatório crescente em todos os mercados
Mercados de previsão indicam boas chances de o Mythos 5 (ou algo parecido) ficar disponível ao público até meados ou final de 2026. Mas obstáculos de eficiência podem atrasar o acesso amplo.
Meu takeaway pra você
O Claude Mythos 5 não é só sobre números maiores. É sobre o que acontece quando você combina escala inteligente com arquitetura melhor, dados melhores e pós-treinamento mais sofisticado.
Se você trabalha com IA, agentes ou automação, minha sugestão é clara:
- Experimente as ferramentas de agentes atuais. Não espere o Mythos 5 chegar. O Opus 4.6, o GPT-5.x, o Gemini 3.1 — já dá pra fazer muita coisa hoje.
- Estude técnicas de eficiência. Quantização, destilação, cache otimizado. Isso vai fazer diferença quando modelos maiores ficarem disponíveis.
- Participe do debate sobre segurança e governança. Isso não é só pra acadêmicos ou policy makers. É pra quem constrói e usa esses sistemas.
A fronteira da IA está avançando mais rápido do que a maioria das organizações consegue acompanhar. Quem experimentar agora vai estar na frente quando a próxima onda chegar.
E você, já está testando agentes de IA no seu trabalho? Conta aqui nos comentários qual ferramenta você tá usando e o que tem achado da evolução dos modelos.
