A IA Startup Stability A IA lançou o estável Audio Open Small, um modelo de IA de geração de áudio “estéreo” que a empresa reivindica que o mais rápido do mercado é e eficiente o suficiente para ser executado em smartphones.
O Audio Open estável é o fruto de uma colaboração entre a AI e o braço de estabilidade, o fabricante de chips que produz muitos dos processadores em tablets, telefones e outros dispositivos móveis. Embora vários aplicativos orientados a IA possam gerar áudio, como SUNO e UDIO, eles dependem mais do processamento da nuvem, o que significa que não podem ser usados offline.
A estabilidade também afirma que o conjunto de treinamento pequeno em áudio estável consiste inteiramente de músicas do arquivo de música livre de bibliotecas de áudio e livre de royalties e Freesound. Em contraste com os conjuntos de treinamento do acima mencionado SUNO e UDIO, que se diz que contém conteúdo protegido por direitos autorais, o que significa que um risco de IP implica.
O AUDIO ESTABLE OPEN SPING tem 341 milhões de parâmetros em tamanho e otimizado para ser realizado nas CPUs do ARM. (Os parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que acompanha seu comportamento.) Para a geração rápida de monstros de áudio curtos e efeitos sonoros (por exemplo, tambor e instrumentos), o áudio estável aberto pequeno pode até 11 segundos áudio em menos de 8 segundos.
Aqui, um monstro foi gerado por áudio estável aberto pequeno:
E aqui está outro:
O modelo não é isento de limitações. O AUDIO ESTABLE OPEN SPING suporta apenas instruções escritas em inglês e notas de estabilidade em sua documentação de que o modelo não pode gerar canto realista ou músicas de alta qualidade. O modelo também não tem um bom desempenho sobre estilos musicais, a estabilidade alerta uma conseqüência dos dados de treinamento ocidental.
Em outra ruga em potencial para os desenvolvedores, o áudio estável Open Small possui condições de uso um pouco restritas. É gratuito para pesquisadores, entusiastas e empresas com menos de US $ 1 milhão em rotatividade anual, mas desenvolvedores e organizações que ganham mais de US $ 1 milhão em renda precisam pagar pela permissão comercial de estabilidade.
A estabilidade, a empresa sitiada por trás do popular modelo de geração de imagens, difusão estável, aumentou o dinheiro novo como investidores no ano passado, incluindo Eric Schmidt e fundador da Napster Sean Parker, queria virar a empresa. Emad Mostaque, co-fundador da estabilidade e ex-CEO, supostamente gerenciado incorretamente a estabilidade na ruína financeira, como resultado da qual a equipe renunciou, uma parceria com o Canva para cair e os investidores estão preocupados com as perspectivas da empresa.
Nos últimos meses, a estabilidade contratou um novo CEO, o diretor da Titanic, James Cameron, coletou seu conselho de administração e lançou vários novos modelos para gerar geração de imagens.