Anthropic diz que o mundo deveria ter a opção de ‘pausar’ a IA -

A Anthropic lançou a ideia de uma “pausa temporária” mundial no desenvolvimento da IA – e disse que iria convocar “formadores políticos” para discutir os perigos da IA avançada – em seu último lançamento, divulgando as capacidades de seus produtos.

Num longo post na quinta-feira, a Anthropic detalhou o progresso do seu modelo de IA, Claude, em direção ao “autoaperfeiçoamento recursivo” – isto é, ser capaz de fazer versões melhores e mais poderosas de si mesmo. O autoaperfeiçoamento recursivo é um bicho-papão para os pesquisadores de segurança da IA, visto como o passo fundamental para que a IA se torne superinteligente e, portanto, desencadeie consequências generalizadas sobre a humanidade.

A ideia aparece fortemente no amplamente lido cenário do Juízo Final da IA 2027 do ano passado, que imagina agentes de IA projetando versões cada vez mais inteligentes de si mesmos, uma das quais eventualmente mata toda a humanidade com uma arma biológica, a fim de abrir espaço para mais centros de dados e painéis solares.

A postagem da Anthropic observa uma “tendência” de aumento de capacidade em Claude que, “levando longe o suficiente e com computação suficiente… aponta para um sistema de IA capaz de projetar e desenvolver de forma totalmente autônoma seu próprio sucessor”. Isto, disse a Anthropic, pode aumentar o risco de “os humanos perderem o controle sobre os sistemas de IA”.

Para lidar com isso, a Anthropic propôs organizar conversas onde “decisores políticos, investigadores, sociedade civil e outras empresas de IA possam ajudar a responder algumas das questões que este artigo levanta”.

A notícia surge juntamente com um relatório separado, do Financial Times, de que a empresa norte-americana de IA incorporou engenheiros na Agência de Segurança Nacional, apesar de uma batalha legal com o Pentágono sobre a utilização das suas ferramentas. Os engenheiros estão supostamente ajudando a NSA a usar o modelo Mythos da Anthropic para operações ofensivas de segurança cibernética.

Se apelar a uma conversa mundial sobre o risco da IA está em contradição com o apoio a uma agência de espionagem dos EUA para – potencialmente – atacar o Irão e a China com armas cibernéticas, nenhum dos desenvolvimentos foi “surpreendente” dadas as ações passadas da empresa de IA, disse Steven Murdoch, professor da University College London.

“A Antrópico pode dar a impressão de ser calorosa e confusa, mas a sua definição de segurança da IA é estreita. Apoiar as autoridades dos EUA no desenvolvimento de capacidades ofensivas nunca foi algo contra o qual tenham falado”, disse ele.

Murdoch disse que a postagem da Anthropic não oferece evidências de quaisquer mudanças radicais no progresso das capacidades de IA.

“É verdade que há algumas evidências de que as capacidades da IA aumentaram e continuam a aumentar sem que nenhum limite se torne imediatamente claro”, disse ele, mas acrescentou: “Não creio que nada tenha mudado fundamentalmente hoje que tenha levado a Anthropic a publicar este artigo.”

Os avanços que a Anthropic parece detalhar no seu post não equivalem a uma melhoria recursiva da IA – pelo menos, não ainda. Em vez disso, a empresa relata que uma parte substancial do trabalho realizado para melhorar os seus sistemas de IA é agora feito com IA. Claude é bom em “realizar experimentos”, diz, ou pelo menos acelerar certas seções do código.

Tal como outros sistemas de IA, Claude parece estar a melhorar na resolução de tarefas mais desafiantes. A Anthropic descreveu-a como “dirigindo a investigação” e “propondo as suas próprias experiências”, embora estas realizações pareçam ter ocorrido dentro de limites estritos e confinadas a tarefas relacionadas com a codificação.

A qualidade do código escrito pela IA também estava melhorando, disse a Anthropic: “Em maio de 2026, mais de 80% do código que fundimos na base de código da Anthropic era de autoria de Claude.”

Murdoch disse que o apelo da Anthropic para uma “pausa temporária” na IA ecoou outras propostas sobre segurança da IA que a empresa tinha feito ao longo dos anos – assim como o seu plano para envolver os decisores políticos. “É um lembrete do que os preocupa e com que se preocupam há muitos anos.”

“Tenho certeza de que a atenção é bem-vinda, mas, novamente, isso não é algo novo. A Anthropic tem tentado chamar a atenção dos legisladores desde que foi fundada.”

Há dois meses, a Anthropic anunciou – mas recusou-se a lançar – o Mythos, um modelo de IA que implicava ser demasiado poderoso para ser divulgado ao público, devido a preocupações de segurança cibernética. O anúncio gerou rebuliço generalizado e chamou a atenção do secretário do Tesouro dos EUA, Scott Bessent, e do MI5.

Alguns especialistas, no entanto, sugeriram que poderia haver mais entusiasmo por trás do anúncio do Mythos da Antrópico do que substância, especialmente dada a imprecisão com que a empresa descreveu algumas das capacidades do Mythos. Heidy Khlaaf, cientista-chefe de IA do AI Now Institute, chamou o anúncio do Mythos de “uma postagem de marketing”.

A Antthropic entrou com pedido esta semana para um IPO que poderia avaliar a empresa em US$ 1 trilhão. A empresa foi procurada para comentar.

Fuente