Início Tecnologia Google Rolls Gêmeos Pensando profundamente na IA, um modelo de raciocínio que...

Google Rolls Gêmeos Pensando profundamente na IA, um modelo de raciocínio que testa várias idéias paralelas

24
0
Gemini 2.5 Pro

O Google DeepMind está lançando Gemini 2.5 Deep Think, o que, diz a empresa, o modelo de raciocínio mais avançado da IA é capaz de responder a perguntas explorando e considerando várias idéias ao mesmo tempo e usando essa saída para escolher a melhor resposta.

Os assinantes da assinatura Ultra de US $ 250 por mês de US $ 250 por mês terão acesso ao Gemini 2,5 Deep Think no aplicativo Gemini a partir de sexta -feira.

Pela primeira vez, revelado em maio no Google I/O 2025, o Gemini 2.5 Diep Think é o primeiro modelo multi-agente disponível ao público do Google. Esses sistemas geram AI, vários agentes para combater um paralelo de demanda, um processo que usa fontes computacionais consideravelmente mais computacionais do que um único agente, mas tende a levar a melhores respostas.

O Google usou uma variação de Gemini 2.5 Diep pensando em marcar uma medalha de ouro na Olimpiade de Matemática (IMO) deste ano.

Além do Gemini 2.5 Deep Think, a empresa diz que libera o modelo que usou com a IMO em um grupo seleto de matemáticos e acadêmicos. O Google diz que esse modelo de IA ‘Horas para raciocinar’ em vez de segundos ou minutos, como a maioria dos modelos de IA orientados ao consumidor. A empresa espera que o modelo da IMO melhore os esforços de pesquisa e deseja obter feedback sobre como melhorar o sistema multi-agente para casos de uso acadêmico.

O Google observa que o modelo de pensamento profundo Gemini 2.5 é uma melhoria significativa em comparação com o que anunciou na E/S. A empresa também afirma que ele desenvolveu “novas técnicas de aprendizado para reforço” para pensar profundamente em Gemini 2.5 para usar melhor seus caminhos de raciocínio.

“O pensamento profundo pode ajudar as pessoas a resolver problemas que exigem criatividade, exigem planejamento estratégico e fazem melhorias no passo”, disse o Google em uma postagem de blog compartilhada com o TechCrunch.

Evento do TechCrunch

São Francisco
|
27-29 de outubro de 2025

A empresa diz que Gemini 2.5 Dep Think Think atinge o desempenho de última geração no último exame da humanidade (HLE)-um teste desafiador que mede a capacidade da AI de responder a milhares de perguntas de crowdsourcing sobre matemática, humanidades e ciências. O Google afirma que seu modelo obteve 34,8%no HLE (sem ferramentas), em comparação com o GROK 4 da Xai, que obteve 25,4%, e o OpenAI da O3, que obteve 20,3%.

O Google também diz que o Gemini 2.5 Diep Think tem um desempenho melhor do que os modelos de IA do OpenAI, XAI e Anthropic no LivecodeBench6, um teste desafiador de tarefas de codificação competitiva. O modelo do Google obteve 87,6%, enquanto Grok obteve 4 79%e o Open O3 marcou 72%.

Pontuações de referência. Créditos da imagem: Google

O Gemini 2.5 Deep Think funciona automaticamente com ferramentas como implementação de código e pesquisa do Google, e a empresa diz que é capaz de produzir “respostas muito mais longas” do que os modelos de IA tradicionais.

Ao testar o Google, o modelo produziu tarefas de desenvolvimento da Web mais detalhadas e esteticamente agradáveis em comparação com outros modelos de IA. A empresa afirma que o modelo pode ajudar os pesquisadores e “pode acelerar o caminho para a descoberta”.

Cenas de arte feitas pela IA do Google (Crédito: Google)

Parece que diferentes laboratórios de IA líderes convergem em torno da abordagem multi-agente.

O Xai, de Elon Musk, lançou recentemente seu próprio sistema multi-agente, Grok 4 Heavy, dos quais foi capaz de alcançar o desempenho líder da indústria em vários benchmarks. O pesquisador do Openai, Noam Brown, disse em um podcast que o modelo de IA não derramado que a empresa usou para alcançar uma medalha de ouro na Olimpíada de Matemática (IMO) deste ano também era um sistema multi-agente. Enquanto isso, o agente de pesquisa do Antrópico, que gera distúrbios completos da pesquisa, também é alimentado por um sistema multi-agente.

Apesar do forte desempenho, parece que os sistemas multi-agentes são ainda mais caros de servir do que os modelos tradicionais de IA. Isso significa que as empresas de tecnologia podem manter esses sistemas por trás de seus planos de assinatura mais caros que Xai e agora escolheram o Google.

Nas próximas semanas, o Google diz que planeja pensar profundamente Gemini 2.5 com um grupo seleto de testadores através da API Gemini. A empresa diz que deseja entender melhor como desenvolvedores e empresas podem usar seu sistema multi-agente.

Fuente