O Google está integrando o Lyria 3, modelo de geração musical da DeepMind, diretamente no Gemini. Sim, além de gerar imagens e vídeos guiados pelas suas instruções, o Gemini agora também poderá gerar músicas.
A nova integração do Gemini ainda está em beta, mas, independentemente disso, está pronta para causar impacto.
A geração musical funciona de forma semelhante às suas contrapartes visuais. Você simplesmente descreve o que está procurando e o Gemini analisará sua solicitação para criar um resultado relevante.
“Basta descrever uma ideia ou fazer upload de uma foto, como ‘uma lenta jam cômica de R&B sobre uma meia encontrando seu par’ e, em questão de segundos, Gemini irá traduzi-la em uma faixa cativante e de alta qualidade”, escreveu o Google.
Depois de imagens e vídeos, Gemini agora também pode gerar música
Comparado aos modelos Lyria mais antigos, o Lyria 3 melhora a geração de áudio de três maneiras principais:
-
Não há necessidade de fornecer suas próprias letras! Eles serão gerados para você com base no seu prompt.
-
Você tem mais controle criativo sobre elementos como estilo, vocais e andamento desejados.
-
Você pode criar faixas mais realistas e musicalmente complexas.
Além disso, o que torna o modelo especial é a sua abordagem multimodal. Ele não só pode gerar faixas a partir de texto, mas também a partir de fotos e vídeos. Então, embora você possa alertar Gêmeos com algo como “Estou com saudades. Crie uma faixa para minha mãe sobre os ótimos momentos que tivemos quando crianças e as memórias de suas bananas caseiras. Torne-a uma faixa divertida de afrobeat com uma verdadeira vibração africana”, você também poderá enviar uma foto ou vídeo e solicitar que Gêmeos gere uma faixa baseada nela.
É importante notar que Lyria 3 em Gemini está limitado a faixas de 30 segundos. Ele se integra ao Nano Banana para gerar capa personalizada para a faixa, o que essencialmente envolve toda a experiência.
A geração de música está sendo lançada no aplicativo Gemini para todos os usuários maiores de 18 anos em inglês, alemão, espanhol, francês, hindi, japonês, coreano e português. Atualmente está limitado ao desktop, com suporte para o aplicativo móvel chegando “nos próximos dias”.



