Início Tecnologia O novo modelo devstral de Mistral foi projetado para codificação

O novo modelo devstral de Mistral foi projetado para codificação

19
0
Mistral logo on laptop screen

A IA Startup Mistral anunciou um novo modelo de IA na quarta -feira, com o objetivo de codificar: Devstral.

Devstral, da qual Mistral diz que foi desenvolvido em colaboração com a empresa de IA All Hands AI, está abertamente disponível sob uma licença Apache 2.0, o que significa que ela pode ser usada comercialmente sem limitação. Mistral afirma que o Devstral tem um desempenho melhor do que outros modelos abertos, como o Gemma 3 27B do Google e o V3 da AI Lab Chinese Deepseek no SWE-banch Verificado, uma referência que mede as habilidades de codificação.

“Devstral se destaca no uso de ferramentas para explorar as bases de código, editar vários arquivos e editar agentes de engenharia de software (ING)”, escreve Mistral em uma postagem de blog no TechCrunch. “(I) T está sobre andaimes de agentes de código, como OpenHands ou SWE Agent, que definem a interface entre o modelo e os casos de teste (…) DevStral é leve o suficiente para estar em uma única (NVIDIA) RTX 4090 ou um Mac com 32 GB de RAM, tornando-a uma escolha ideal para a implementação local e o uso do dispositivo” “.

O benchmarking resulta do Mistral para Devstral.Créditos da imagem:Mistral

Devstral chega como assistentes de codificação de IA – e os modelos que os alimentam – estão se tornando cada vez mais populares. No mês passado, a JetBrains, a empresa por trás de uma série de ferramentas de aplicativos populares para o desenvolvimento de aplicativos, publicou seu primeiro modelo “aberto” para codificação. Nos últimos meses, roupas de IA, incluindo Google, Windsurf e Openai, também revelaram modelos, disponíveis abertamente e próprios, otimizados para tarefas de programação.

Os modelos de IA ainda estão lutando para incentivar o software de qualidade IA a introduzir vulnerabilidades e erros de segurança, devido a fraquezas em áreas como a capacidade de entender a lógica de programação. No entanto, sua promessa de estimular a produtividade da codificação, empresas – e desenvolvedores – para incentivá -los a aceitá -los rapidamente. Uma pesquisa recente mostrou que 76% dos desenvolvimentos usados ​​no ano passado ou destinados a usar ferramentas de IA em seus processos de desenvolvimento.

Mistral anteriormente entrou no espaço de programação de suporte com o Codeestral, um modelo generativo para o código. Mas o Codeestral não foi divulgado sob uma licença com a qual os desenvolvedores poderiam usar o modelo para aplicações comerciais; A licença proíbe explicitamente “qualquer uso interno pelos funcionários no contexto de (a) atividades comerciais”.

Devstral, que chama Mistral de ‘revisão de pesquisa’, pode ser baixado de plataformas de desenvolvimento de IA, incluindo um rosto fofinho e também tocado pela API de Mistral. Custa US $ 0,1 por milhão de tokens de entrada e US $ 0,3 por milhão de tokens de produção, os tokens são os dados brutos com os quais os modelos de IA funcionam. (Um milhão de tokens é igual a cerca de 750.000 palavras, ou cerca de 163.000 palavras a mais que “guerra e paz”.)

Mistral diz que é “difícil construir um modelo de codificação de agentes maiores que estará disponível nas próximas semanas”. Devstral não é um modelo pequeno em si, mas está do lado menor com 24 bilhões de parâmetros. (Os parâmetros estão de acordo com as habilidades de solução de problemas de um modelo e modelos com mais parâmetros geralmente têm um desempenho melhor do que aqueles com menos parâmetros.)

A Mistral, fundada em 2023, é um laboratório para a Frontier, com o objetivo de construir uma série de serviços orientados a IA, incluindo uma plataforma de chatbot, LE Chat e aplicativos móveis. É apoiado por VCs, incluindo um catalisador geral e até agora levantou mais de 1,1 bilhão de euros (cerca de US $ 1,24 bilhão). Os clientes da Mistral são BNP Paribas, Axa e Mirakl.

Devstral é o lançamento do terceiro produto da Mistral este mês. Algumas semanas atrás, o Midtral Midral 3, um modelo geral eficiente geral. Na mesma época, a LE Chat Enterprise Company foi lançada, um serviço de chatbot orientado para negócios que oferece ferramentas como um construtor de “agente” da IA ​​e os modelos Mistral se integra a serviços de terceiros, como Gmail, Google Drive e SharePoint.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here