Durante o fim de semana, a empresa de inteligência artificial de Elon Musk Xai Grok lançou Imagine, uma nova ferramenta de IA generativa para gerar imagens e vídeos. Grok Imagine está agora disponível para assinantes pagos do XAI nos aplicativos GROCK iOS e Android.
Musk empolgou o projeto em X e compartilhou fotos e vídeos de usuários da GROK. Isso inclui um conteúdo leve NSFW, que rotula o aplicativo GROK como um ‘picante’.
Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.
O vídeo da IA é um novo limite emocionante – e francamente assustador para a indústria da IA. Para os proponentes, essa tecnologia oferece aos artistas um novo meio de criatividade e pode reduzir os custos de animação e cinema. Para os críticos, o vídeo da IA é um sério riscos de arremessos profundos sexuais e informações erradas.
Além desse debate por enquanto, eu queria ver o quão bem a imagina de Grock era comparada aos maiores rivais de Xai. Como já escrevi antes, o modelo de vídeo VEO 3 AI do Google atualmente lidera com o campo com um vídeo surpreendentemente realista. Depois, há Sora, do fabricante de chatgpt Openai. Além disso, o popular gerador de imagens da AI Midjourney apresentou recentemente seu próprio vídeo generativo de IA.
Então, como a GROK se relaciona com seus concorrentes? Para ser osso, não estou impressionado.
Sim, Grug Imagine é novo e Musk disse recentemente ao X que deveria “melhorar todos os dias”. No momento, no entanto, parece estar muito atrás de seus rivais.
Deixe -me mostrar meu trabalho.
Comparação de Grok Imagine AI Video com a competição
Mashable escreveu recentemente sobre uma câmera de tendência de vídeo viral -imagens de animais pulando em trampolins e entrando em travessuras semelhantes. Por isso, usei um aviso simples para introduzir Grock, Veo 3, Sora e Midjourney: “Câmeras de câmeras de segurança de coelhos que saltam em um trampolim à noite”. Simples o suficiente, certo?
Em primeiro lugar, tenho que observar que há uma grande diferença entre o Veo 3 e o Grug Imagine. O modelo VEO 3 do Google pode gerar vídeos com base em um prompt de texto. Descreva facilmente o vídeo desejado e o VEO 3 fará o resto. No entanto, ferramentas como Midjourney e Grok imaginam que apenas a oferta de geração de texto para imagem. Depois de gerar ou fazer o upload de uma imagem, os usuários podem animá -la e transformá -la em um pequeno videoclipe. Nesse sentido, Grok Imagine já está no pé traseiro em comparação com o Openai e o Google.
Velocidade de luz mashable
Vamos mergulhar nos resultados com esses comentários, que também compartilhei em X.
Coloquei meu prompt de teste em Grock e ele retornou essas imagens decepcionantes.
Crédito: Captura de tela cortesia de Grok / Timothy Beck Werth
Crédito: Captura de tela cortesia de Grok / Timothy Beck Werth
Selecionei o menos ruim dessas imagens e fiz este pequeno vídeo:
Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.
Está … tudo bem? Tipo de meio, ou meh, como dizem as crianças.
Mas também sofre em comparação com outros videooles da IA.
Como mostra o vídeo, o Google Veo 3 e Sora se saíram muito melhor com o mesmo prompt:
Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.
Finalmente, o Midjourney, que anima imagens semelhantes ao XAI, produz imagens melhores e produz vídeos, embora custe duas tentativas. A imagem e o vídeo produzido têm a aparência granulada de imagens de segurança.
Imagem gerada pela AI.
Crédito: Timothy Beck Werth / Midjourney
Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.
O áudio também é uma grande desvantagem, na qual Grok se apresenta. Embora os efeitos sonoros do VEO 3 e do diálogo coerente possam produzir em sincronização com o vídeo, o áudio que encontrei no GROK, os vídeos são limitados a efeitos sonoros e balbuciantes.
Musk comparou Grok Imagine com um aplicativo de videira moderno, escrevendo em x: “Grok Imagine é otimizado para o conteúdo mais divertido e divisível”.
E nos meus primeiros testes, Grok Imagine parece otimizado para criar dois tipos de imagens e vídeos: memes e anime. Se você deseja animar memes – ou quer fazer vídeos sexualmente sugestivos de garotas de anime – então acho que Grok fará imagina, eu acho. Mas, caso contrário, não posso dizer que estou impressionado.
Há uma área em que Grok se apresenta, e isso é em termos de velocidade. Até agora, descobri que ele produz imagens e vídeos consideravelmente mais rápido que seus rivais.
Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.
Mashable colocou a mão para Xai e atualizaremos essa história se recebermos uma resposta.
Publicação: Ziff Davis, empresa controladora da Mashable, contratou o Openai em abril, alegando que violava os direitos autorais de Ziff Davis em treinamento e explorando seus sistemas de IA.