Início Tecnologia Melhorias nos modelos de IA de ‘raciocínio’ podem atrasar em breve, a...

Melhorias nos modelos de IA de ‘raciocínio’ podem atrasar em breve, a análise encontra

26
0
Treinamento de modelo de raciocínio de época

Uma análise da época da IA, um instituto de pesquisa de IA sem fins lucrativos, sugere que a indústria da IA ​​pode não ser capaz de fazer um enorme desempenho do raciocínio dos modelos de IA por muito mais tempo. Assim que o progresso dos modelos de raciocínio pode desacelerar dentro de um ano, de acordo com as conclusões do relatório.

Nos últimos meses, modelos de raciocínio como o OpenAI da O3 levaram a um lucro substancial em benchmarks de IA, em particular os benchmarks que medem as habilidades de matemática e programação. Os modelos podem aplicar mais computação a problemas, o que pode melhorar seu desempenho, com a desvantagem de que eles duram mais tempo que os modelos convencionais para concluir as tarefas.

Os modelos de raciocínio são desenvolvidos primeiro treinando um modelo convencional em uma enorme quantidade de dados e depois aplicando uma técnica chamada Aprendizagem de Reforço, que efetivamente fornece “feedback” o modelo sobre suas soluções para problemas difíceis.

Até agora, os laboratórios de Frontier AI, como o OpenAI, não aplicaram uma enorme quantidade de poder de computação ao estágio de aprendizado do aprendizado do modelo de raciocínio.

Isso muda. A OpenAI disse que aplicou aproximadamente 10x a mais de computação para treinar O3 do que seu antecessor, O1 e Epoch especula que a maioria desse uso de computador foi dedicada ao aprendizado de reforço. E o pesquisador do Openai Dan Roberts demonstrou recentemente que os planos futuros da empresa pedem prioridade ao aprendizado de fortalecimento para usar muito mais poder de computação, ainda mais do que para o treinamento inicial do modelo.

Mas ainda existe um limite superior quanto a computação pode ser aplicada ao reforço de aprendizado, por período.

De acordo com uma análise EPOC AI, a escala do modelo de raciocínio pode desacelerar o treinamento.Créditos da imagem:Ai era

Josh You, analista da Epoch e autor da análise, explica que os lucros de desempenho do treinamento padrão da IA ​​Modelt atualmente quadratam a cada ano, enquanto os lucros do desempenho do reforço de aprendizado crescem dez vezes a cada 3-5 meses. O progresso do treinamento de raciocínio provavelmente se reunirá com a fronteira geral até 2026 “, continua ele.

Evento do TechCrunch

Berkeley, CA.
|
5 de junho

Reserve agora

A análise da Epoch faz uma série de suposições e é parcialmente baseada em comentários públicos dos executivos da empresa de IA. Mas também afirma que a escala de modelos de raciocínio pode ser um desafio por razões, além do uso do computador, incluindo altos custos indiretos de pesquisa.

“Se houver custos indiretos persistentes necessários para a pesquisa, os modelos de raciocínio não podem estar na medida do esperado”, você escreve. “O cálculo rápido é potencialmente um ingrediente muito importante no progresso do modelo de raciocínio, por isso vale a pena seguir isso de perto”.

Todas as indicações de que os modelos de raciocínio podem atingir um tipo de limite em um futuro próximo provavelmente estarão preocupados com a indústria de IA, que investiu enormes recursos que desenvolvem esses tipos de modelos. Os estudos já mostraram que os modelos de raciocínio, que podem ser incrivelmente caros de girar, têm defeitos graves, como uma tendência a alucinar mais do que certos modelos convencionais.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here