Início Tecnologia O pequeno modelo de AI da AI2 tem um desempenho melhor do...

O pequeno modelo de AI da AI2 tem um desempenho melhor do que os modelos de tamanho semelhante pelo Google e Meta

17
0
Lumen Orbit, startups, venture capital, space, data centers

Parece que pequenos modelos de IA são a tendência nesta semana. A AI2, uma organização de pesquisa de IA sem fins lucrativos, anunciou o lançamento do OLMO 2 1B na quinta -feira. O modelo possui 1 bilhão de parâmetros e a AI2 diz que supera os modelos de tamanho semelhante pelo Google, Meta e Alibaba em vários benchmarks. Os parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que orienta seu comportamento.

O OLMO 2 1B está disponível sob uma licença permissiva do Apache 2.0 na plataforma AI, abraçando o rosto. OLMO 2 1B, diferentemente da maioria dos modelos, pode ser recriado completamente do zero. O AI2 forneceu todos os dados e código (OLMO Mix 1124, Dolmino Mix 1124) que foram usados ​​em seu desenvolvimento. Os pequenos modelos podem não ter os mesmos recursos que seus colegas maiores, mas exigem hardware menos poderoso. Isso torna os pequenos modelos mais acessíveis para entusiastas e desenvolvedores limitados por máquinas e computadores de consumo mais baixos. Houve muitos pequenos modelos lançados nos últimos dias. Da família de raciocínio Phi 4 da Microsoft até Qwen 2.5 Omni 3b. OLMO 2 1B e a maioria dos outros modelos pode ser executada facilmente em laptops modernos ou dispositivos móveis. Os tokens representam os dados que os modelos geram e ingerem. 1 milhão de tokens equivale a cerca de 750.000 palavras escritas.

Em um teste que media o raciocínio na aritmética, o olmo 2 do GSM8K, 1B, pontuou melhor que o Google Gemma 3, 1B e Meta llama, 3,2, 1b. Alibaba Qwen, 2,5, 1,5b também teve um bom desempenho. O OLMO 2 1B supera esses três modelos em Verdadeiro QA, que é um teste para avaliar a precisão factual.

Evento do TechCrunch

Berkeley, CA.

|

5 de junho

Reserve agora

Esse modelo foi pré-terenciado em tokens 4T de dados de alta qualidade, seguindo o mesmo pré-treinamento padrão em recozimento de alta qualidade de nossos modelos 7, 13 e 32b. Carregamos pontos de verificação intermediários de cada 1000 etapas no treinamento.

Acesse o modelo base: https://t.co/xofywjmo85 pic.twitter.com/7usj6symdl
– AI2 (@Allen_Ai) 1 de maio de 2025 OLMO 2 1B não está sem risco, avisa
AI2. A organização alerta que o OLMO 2 1B também pode produzir “resultados problemáticos”, como material prejudicial ou “sensível” e declarações factualmente incorretas. AI2 aconselha -se ao uso comercial do OLMO 2 1B.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here