Anthropic diz que o mundo deveria ter a opção de ‘pausar’ a IA

A Anthropic lançou a ideia de uma “pausa temporária” mundial no desenvolvimento da IA ​​– e disse que iria convocar “formadores políticos” para discutir os perigos da IA ​​avançada – em seu último lançamento, divulgando as capacidades de seus produtos.

Num longo post na quinta-feira, a Anthropic detalhou o progresso do seu modelo de IA, Claude, em direção ao “autoaperfeiçoamento recursivo” – isto é, ser capaz de fazer versões melhores e mais poderosas de si mesmo. O autoaperfeiçoamento recursivo é um bicho-papão para os pesquisadores de segurança da IA, visto como o passo fundamental para que a IA se torne superinteligente e, portanto, desencadeie consequências generalizadas sobre a humanidade.

A ideia aparece fortemente no amplamente lido cenário do Juízo Final da IA ​​2027 do ano passado, que imagina agentes de IA projetando versões cada vez mais inteligentes de si mesmos, uma das quais eventualmente mata toda a humanidade com uma arma biológica, a fim de abrir espaço para mais centros de dados e painéis solares.

A postagem da Anthropic observa uma “tendência” de aumento de capacidade em Claude que, “levando longe o suficiente e com computação suficiente… aponta para um sistema de IA capaz de projetar e desenvolver de forma totalmente autônoma seu próprio sucessor”. Isto, disse a Anthropic, pode aumentar o risco de “os humanos perderem o controle sobre os sistemas de IA”.

Para lidar com isso, a Anthropic propôs organizar conversas onde “decisores políticos, investigadores, sociedade civil e outras empresas de IA possam ajudar a responder algumas das questões que este artigo levanta”.

A notícia surge juntamente com um relatório separado, do Financial Times, de que a empresa norte-americana de IA incorporou engenheiros na Agência de Segurança Nacional, apesar de uma batalha legal com o Pentágono sobre a utilização das suas ferramentas. Os engenheiros estão supostamente ajudando a NSA a usar o modelo Mythos da Anthropic para operações ofensivas de segurança cibernética.

Se apelar a uma conversa mundial sobre o risco da IA ​​está em contradição com o apoio a uma agência de espionagem dos EUA para – potencialmente – atacar o Irão e a China com armas cibernéticas, nenhum dos desenvolvimentos foi “surpreendente” dadas as ações passadas da empresa de IA, disse Steven Murdoch, professor da University College London.

“A Antrópico pode dar a impressão de ser calorosa e confusa, mas a sua definição de segurança da IA ​​é estreita. Apoiar as autoridades dos EUA no desenvolvimento de capacidades ofensivas nunca foi algo contra o qual tenham falado”, disse ele.

Murdoch disse que a postagem da Anthropic não oferece evidências de quaisquer mudanças radicais no progresso das capacidades de IA.

“É verdade que há algumas evidências de que as capacidades da IA ​​aumentaram e continuam a aumentar sem que nenhum limite se torne imediatamente claro”, disse ele, mas acrescentou: “Não creio que nada tenha mudado fundamentalmente hoje que tenha levado a Anthropic a publicar este artigo.”

Os avanços que a Anthropic parece detalhar no seu post não equivalem a uma melhoria recursiva da IA ​​– pelo menos, não ainda. Em vez disso, a empresa relata que uma parte substancial do trabalho realizado para melhorar os seus sistemas de IA é agora feito com IA. Claude é bom em “realizar experimentos”, diz, ou pelo menos acelerar certas seções do código.

Tal como outros sistemas de IA, Claude parece estar a melhorar na resolução de tarefas mais desafiantes. A Anthropic descreveu-a como “dirigindo a investigação” e “propondo as suas próprias experiências”, embora estas realizações pareçam ter ocorrido dentro de limites estritos e confinadas a tarefas relacionadas com a codificação.

A qualidade do código escrito pela IA também estava melhorando, disse a Anthropic: “Em maio de 2026, mais de 80% do código que fundimos na base de código da Anthropic era de autoria de Claude.”

Murdoch disse que o apelo da Anthropic para uma “pausa temporária” na IA ecoou outras propostas sobre segurança da IA ​​que a empresa tinha feito ao longo dos anos – assim como o seu plano para envolver os decisores políticos. “É um lembrete do que os preocupa e com que se preocupam há muitos anos.”

“Tenho certeza de que a atenção é bem-vinda, mas, novamente, isso não é algo novo. A Anthropic tem tentado chamar a atenção dos legisladores desde que foi fundada.”

Há dois meses, a Anthropic anunciou – mas recusou-se a lançar – o Mythos, um modelo de IA que implicava ser demasiado poderoso para ser divulgado ao público, devido a preocupações de segurança cibernética. O anúncio gerou rebuliço generalizado e chamou a atenção do secretário do Tesouro dos EUA, Scott Bessent, e do MI5.

Alguns especialistas, no entanto, sugeriram que poderia haver mais entusiasmo por trás do anúncio do Mythos da Antrópico do que substância, especialmente dada a imprecisão com que a empresa descreveu algumas das capacidades do Mythos. Heidy Khlaaf, cientista-chefe de IA do AI Now Institute, chamou o anúncio do Mythos de “uma postagem de marketing”.

A Antthropic entrou com pedido esta semana para um IPO que poderia avaliar a empresa em US$ 1 trilhão. A empresa foi procurada para comentar.

Fuente