Início Tecnologia A IA de estabilidade libera um modelo de cerca de áudio que...

A IA de estabilidade libera um modelo de cerca de áudio que pode ser realizado em smartphones

18
0
A robot reading music

A IA Startup Stability A IA lançou o estável Audio Open Small, um modelo de IA de geração de áudio “estéreo” que a empresa reivindica que o mais rápido do mercado é e eficiente o suficiente para ser executado em smartphones.

O Audio Open estável é o fruto de uma colaboração entre a AI e o braço de estabilidade, o fabricante de chips que produz muitos dos processadores em tablets, telefones e outros dispositivos móveis. Embora vários aplicativos orientados a IA possam gerar áudio, como SUNO e UDIO, eles dependem mais do processamento da nuvem, o que significa que não podem ser usados ​​offline.

A estabilidade também afirma que o conjunto de treinamento pequeno em áudio estável consiste inteiramente de músicas do arquivo de música livre de bibliotecas de áudio e livre de royalties e Freesound. Em contraste com os conjuntos de treinamento do acima mencionado SUNO e UDIO, que se diz que contém conteúdo protegido por direitos autorais, o que significa que um risco de IP implica.

O AUDIO ESTABLE OPEN SPING tem 341 milhões de parâmetros em tamanho e otimizado para ser realizado nas CPUs do ARM. (Os parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que acompanha seu comportamento.) Para a geração rápida de monstros de áudio curtos e efeitos sonoros (por exemplo, tambor e instrumentos), o áudio estável aberto pequeno pode até 11 segundos áudio em menos de 8 segundos.

Aqui, um monstro foi gerado por áudio estável aberto pequeno:

E aqui está outro:

O modelo não é isento de limitações. O AUDIO ESTABLE OPEN SPING suporta apenas instruções escritas em inglês e notas de estabilidade em sua documentação de que o modelo não pode gerar canto realista ou músicas de alta qualidade. O modelo também não tem um bom desempenho sobre estilos musicais, a estabilidade alerta uma conseqüência dos dados de treinamento ocidental.

Em outra ruga em potencial para os desenvolvedores, o áudio estável Open Small possui condições de uso um pouco restritas. É gratuito para pesquisadores, entusiastas e empresas com menos de US $ 1 milhão em rotatividade anual, mas desenvolvedores e organizações que ganham mais de US $ 1 milhão em renda precisam pagar pela permissão comercial de estabilidade.

A estabilidade, a empresa sitiada por trás do popular modelo de geração de imagens, difusão estável, aumentou o dinheiro novo como investidores no ano passado, incluindo Eric Schmidt e fundador da Napster Sean Parker, queria virar a empresa. Emad Mostaque, co-fundador da estabilidade e ex-CEO, supostamente gerenciado incorretamente a estabilidade na ruína financeira, como resultado da qual a equipe renunciou, uma parceria com o Canva para cair e os investidores estão preocupados com as perspectivas da empresa.

Nos últimos meses, a estabilidade contratou um novo CEO, o diretor da Titanic, James Cameron, coletou seu conselho de administração e lançou vários novos modelos para gerar geração de imagens.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here