A IA está perigosamente perto de resolver um teste que apenas as mentes mais brilhantes da Terra poderiam: 'A experiência humana ainda importa' -

Este sistema poderia nos enganar.

A inteligência artificial já está superando os humanos em diversas atividades baseadas na inteligência, desde o xadrez até o reconhecimento de padrões. Agora, os especialistas afirmam que estão a um ano de vencer o “Último Exame da Humanidade” (HLE) – um teste supostamente insolúvel no qual apenas os nossos melhores e mais brilhantes podem passar.

“Os construtores de modelos realmente fizeram um ótimo trabalho ao melhorar esses modelos de raciocínio”, disse Calvin Zhang, líder de pesquisa da Scale, a empresa de IA por trás do HLE, ao The Times de Londres.

“O Último Exame da Humanidade é uma das avaliações mais claras da lacuna entre a IA e a inteligência humana”, declarou o Dr. Tung Nguyen, professor de ciência da computação e engenharia da Texas A&M que contribuiu com 73 das questões (a segunda maior). Mojahid Mottakin – stock.adobe.com

Desenvolvido para ver o quão próxima a IA está das “fronteiras da experiência humana”, este benchmark de inteligência é composto por 2.500 perguntas abrangendo mais de 100 campos altamente especializados, que vão da mitologia à ciência de foguetes.

Mais de 1.000 autoridades das áreas de ciências, humanidades e artes contribuíram para o HLE, que foi projetado para exigir níveis de compreensão de PHD – um pouco além da experiência em IA, informou o Nueroscience News.

Zhang disse que o objetivo final era criar um “referência acadêmica fechada, definida na fronteira dos humanos especialistas, que apenas um punhado de pessoas na Terra pode realmente resolver”.

No entanto, o desempenho da IA no HLE melhorou a velocidades exponenciais num curto período de tempo. Embora o ChatGPT tenha respondido corretamente menos de 3% das perguntas durante sua primeira tentativa em 2024, seu rival Google Gemini acertou 18,8% das perguntas em poucos meses.

No mês passado, esse número melhorou para mais de 45%.

Grupos de activistas anti-IA lideraram uma “Marcha Contra as Máquinas” através de King’s Cross, no Reino Unido, para defender uma pausa global no desenvolvimento de inteligência artificial avançada. ZUMAPRESS. com

Zhang acredita que a IA pode se aproximar da nota máxima – qualquer pessoa com pontuação próxima de 100% é definida como um “especialista universal” dentro de um ano.

“Se realmente nos importássemos com isso como a única coisa na vida, acho que poderíamos chegar lá muito rapidamente”, gabou-se Kate Olszewska, gerente de produto do Google DeepMind.

Kate Olszewska, gerente de produto do Google DeepMind, concorda: “Se realmente nos importássemos com isso como a única coisa na vida, acho que poderíamos chegar lá muito rapidamente”.

Este progresso na velocidade da luz é impressionante, dado o esforço que Scale teve para tornar o HLE à prova de IA. Os realizadores do teste teriam oferecido um prêmio de US$ 500 mil a especialistas que pudessem contribuir com perguntas que não pudessem ser facilmente respondidas por meio de pesquisa na web, obtendo eventualmente mais de 70 mil respostas.

Eles garantiram que as perguntas não pudessem ser respondidas por meio de uma simples pesquisa online. Ascannio – stock.adobe.com

Quaisquer perguntas que pudessem ser respondidas pelos modelos existentes foram descartadas até que o exame fosse reduzido para 2.500 das consultas mais rígidas de IA. Por exemplo, os testados podem ser solicitados a traduzir inscrições antigas de Palmira ou a identificar estruturas microanatômicas em aves durante o exame.

Para garantir ainda mais que o teste fosse reforçado pela IA, a equipe manteve a maioria das respostas ocultas para que os modelos posteriores não pudessem memorizá-las.

Ele argumentou que, embora alguns dos modelos acima mencionados tenham tido um bom desempenho, as pontuações baixas dos restantes ilustram que o abismo entre a IA e a inteligência humana permanece “grande”.

“Quando os sistemas de IA começam a funcionar extremamente bem em benchmarks humanos, é tentador pensar que estão se aproximando da compreensão do nível humano”, disse Nguyen. “Mas o HLE nos lembra que a inteligência não se trata apenas de reconhecimento de padrões – trata-se de profundidade, contexto e conhecimento especializado.”

O especialista técnico disse que o objetivo final não era confundir a “IA”, mas sim ilustrar os pontos fortes e fracos dos sistemas.

Por sua vez, isto ajudar-nos-ia a construir “tecnologias mais seguras e fiáveis”, ao mesmo tempo que demonstraria “porque é que a experiência humana ainda é importante” – um objectivo importante num mundo onde a IA parece estar a substituir-nos em todos os sectores, desde a alimentação rápida à medicina.

Dito isto, a IA demonstrou uma aptidão surpreendentemente humana para a resolução de problemas, demonstrando que os seus poderes de processamento não são relegados à memória mecânica.

Em 2025, testes realizados por pesquisadores chineses revelaram semelhanças entre a “percepção” dos modelos de IA e a cognição humana — particularmente quando se tratava de agrupamento de idiomas.

A partir disso, os pesquisadores deduziram que os alunos de máquina “desenvolvem representações conceituais de objetos semelhantes às humanas”.

“Análises adicionais mostraram um forte alinhamento entre a incorporação de modelos e os padrões de atividade neural” na região do cérebro associada à memória e ao reconhecimento de cena.

Fuente