O pequeno modelo de AI da AI2 tem um desempenho melhor do que os modelos de tamanho semelhante pelo Google e Meta

maio 1, 2025

379

Parece que pequenos modelos de IA são a tendência nesta semana. A AI2, uma organização de pesquisa de IA sem fins lucrativos, anunciou o lançamento do OLMO 2 1B na quinta -feira. O modelo possui 1 bilhão de parâmetros e a AI2 diz que supera os modelos de tamanho semelhante pelo Google, Meta e Alibaba em vários benchmarks. Os parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que orienta seu comportamento.

O OLMO 2 1B está disponível sob uma licença permissiva do Apache 2.0 na plataforma AI, abraçando o rosto. OLMO 2 1B, diferentemente da maioria dos modelos, pode ser recriado completamente do zero. O AI2 forneceu todos os dados e código (OLMO Mix 1124, Dolmino Mix 1124) que foram usados em seu desenvolvimento. Os pequenos modelos podem não ter os mesmos recursos que seus colegas maiores, mas exigem hardware menos poderoso. Isso torna os pequenos modelos mais acessíveis para entusiastas e desenvolvedores limitados por máquinas e computadores de consumo mais baixos. Houve muitos pequenos modelos lançados nos últimos dias. Da família de raciocínio Phi 4 da Microsoft até Qwen 2.5 Omni 3b. OLMO 2 1B e a maioria dos outros modelos pode ser executada facilmente em laptops modernos ou dispositivos móveis. Os tokens representam os dados que os modelos geram e ingerem. 1 milhão de tokens equivale a cerca de 750.000 palavras escritas.

Em um teste que media o raciocínio na aritmética, o olmo 2 do GSM8K, 1B, pontuou melhor que o Google Gemma 3, 1B e Meta llama, 3,2, 1b. Alibaba Qwen, 2,5, 1,5b também teve um bom desempenho. O OLMO 2 1B supera esses três modelos em Verdadeiro QA, que é um teste para avaliar a precisão factual.

Evento do TechCrunch

Berkeley, CA.

5 de junho

Reserve agora

Esse modelo foi pré-terenciado em tokens 4T de dados de alta qualidade, seguindo o mesmo pré-treinamento padrão em recozimento de alta qualidade de nossos modelos 7, 13 e 32b. Carregamos pontos de verificação intermediários de cada 1000 etapas no treinamento.

Acesse o modelo base: https://t.co/xofywjmo85 pic.twitter.com/7usj6symdl
– AI2 (@Allen_Ai) 1 de maio de 2025 OLMO 2 1B não está sem risco, avisa
AI2. A organização alerta que o OLMO 2 1B também pode produzir “resultados problemáticos”, como material prejudicial ou “sensível” e declarações factualmente incorretas. AI2 aconselha -se ao uso comercial do OLMO 2 1B.

Fuente

O pequeno modelo de AI da AI2 tem um desempenho melhor do que os modelos de tamanho semelhante pelo Google e Meta

LEAVE A REPLY Cancel reply

Categorias

RELATED ARTICLESMORE FROM AUTHOR

Krispy Kreme está comemorando a missão Artemis II da NASA com um novo donut com tema espacial – como tentar

Estas são as melhores vendas de óculos inteligentes no momento

Menos de um mês: StrictlyVC San Francisco reúne líderes da TDK Ventures, Replit e muito mais

LEAVE A REPLY Cancel reply

Categorias

RELATED ARTICLES MORE FROM AUTHOR