Um grupo formado por dezenas de especialistas em segurança cibernética, incluindo vários veteranos conhecidos do setor, publicou uma carta aberta ao governo dos EUA pedindo-lhe que suspendesse a ordem de controle de exportação dos modelos Fable e Mythos da Antrópico.
De acordo com a carta aberta, “esta ação retirou os melhores modelos dos defensores (da segurança cibernética)” que agora não podem usar os modelos para encontrar vulnerabilidades e tornar os seus softwares e produtos mais seguros.
“Retirar as melhores capacidades dos defensores sem uma boa razão quando nossos adversários estão avançando rapidamente é perigoso”, dizia a carta.
Na sexta-feira, o governo dos EUA ordenou que a Anthropic limitasse a exportação de Fable e Mythos, citando preocupações de segurança nacional, sem explicar as razões específicas por trás da ordem, segundo a Anthropic. Em resposta, a empresa suspendeu o acesso aos modelos a todos os usuários em todo o mundo.
No momento em que este livro foi escrito, a carta era assinada por 76 especialistas em segurança cibernética, incluindo: o ex-chefe de segurança do Facebook, Alex Stamos; Casey Ellis, o fundador da plataforma de recompensas de bugs Bugcrowd; o famoso criptógrafo e ex-gerente de design e arquitetura de segurança da Apple, Jon Callas; o cientista da computação Paul Vixie; Dino Dai Zovi, ex-chefe de engenharia de segurança aplicada da Block; Katie Mossouris, fundadora da Luta Security; e Rachel Tobac, CEO da empresa de treinamento de conscientização em segurança SocialProof Security.
Quando o Mythos foi lançado como uma prévia em abril, a Anthropic afirmou que ele era tão poderoso para encontrar vulnerabilidades de segurança que a empresa precisava restringir fortemente o acesso para evitar que hackers mal-intencionados ou adversários estrangeiros o usassem para causar estragos na Internet. Na prática, isso significou que a Anthropic deu a cerca de 50 empresas acesso inicial ao Mythos, expandindo recentemente esse grupo para incluir cerca de 150 organizações em 15 países.
Na semana passada, a Anthropic lançou o Fable, uma versão pública do Mythos que, segundo a empresa, tinha barreiras rígidas para bloquear seu uso nas áreas de biologia, química e segurança cibernética, bem como para impedir que outros destilassem o modelo para recriá-lo. As proteções do Fable eram tão rígidas que muitos especialistas em segurança cibernética descobriram que ele basicamente interrompeu qualquer solicitação relacionada à segurança cibernética.
A Anthropic disse que a ordem de controle de exportação da Casa Branca pode ter sido baseada em um relatório de que havia um método para contornar – ou o chamado jailbreak – Fable para desbloquear suas poderosas capacidades de nível Mythos.
Contate-nos
Você tem mais informações sobre o jornal da Amazon que motivou a proibição? Adoraríamos ouvir de você. A partir de um dispositivo e rede que não seja de trabalho, você pode entrar em contato com Lorenzo Franceschi-Bicchierai com segurança no Signal pelo telefone +1 917 257 1382, ou via Telegram e Keybase @lorenzofb, ou e-mail.
Segundo Katie Moussouris, uma das signatárias da carta aberta, o método foi demonstrado por pesquisadores da Amazon em um artigo que não é público, mas que ela revisou.
Mas Moussouris disse em um blog que o jornal não demonstrou realmente uma fuga de prisão real. Em vez disso, escreveu ela, os pesquisadores simplesmente pediram à Fable que corrigisse o código-fonte aberto com vulnerabilidades públicas e conhecidas, juntamente com “vulnerabilidades deliberadamente plantadas”, depois que o modelo inicialmente se recusou a “revisar o código em busca de problemas de segurança”.
“O comportamento descrito no artigo não pode ser corrigido de forma significativa e qualquer tentativa apenas enfraqueceria o modelo de defesa”, escreveu Moussouris. “Os defensores precisam ser capazes de pedir à IA para corrigir os bugs em um arquivo, explicar por que a correção é importante e escrever testes que confirmem que o patch funciona. Isso não é um desvio de proteção. É a coisa mais valiosa que um modelo de IA pode fazer para a segurança defensiva: executar o loop de localização, correção e teste que os defensores executam todos os dias.”
A crítica de Moussouris foi ecoada na carta aberta, que também disse que o grupo de especialistas acredita que o método no artigo da Amazon “pode ser replicado” no GPT-5.5 da OpenAI, no próprio Claude Opus 4.8 e Sonnet da Anthropic, disponíveis publicamente, “e até mesmo em modelos chineses como Kimi 2.7”.
A carta também pedia regulamentos aplicados de forma transparente e justa, criados por “um processo democrático de elaboração de regras” que se baseiam em pesquisas científicas realizadas pela indústria e por especialistas acadêmicos, e “usados apenas na medida mínima necessária para garantir a segurança do público americano”.
Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.