Início Tecnologia Eu testei imagine, e não é uma festa para o Google Veo...

Eu testei imagine, e não é uma festa para o Google Veo 3 ou Sora

34
0
Captura de tela de Grok -App com imagens geradas por IA de coelhos em trampolins

Durante o fim de semana, a empresa de inteligência artificial de Elon Musk Xai Grok lançou Imagine, uma nova ferramenta de IA generativa para gerar imagens e vídeos. Grok Imagine está agora disponível para assinantes pagos do XAI nos aplicativos GROCK iOS e Android.

Musk empolgou o projeto em X e compartilhou fotos e vídeos de usuários da GROK. Isso inclui um conteúdo leve NSFW, que rotula o aplicativo GROK como um ‘picante’.

Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.

O vídeo da IA é um novo limite emocionante – e francamente assustador para a indústria da IA. Para os proponentes, essa tecnologia oferece aos artistas um novo meio de criatividade e pode reduzir os custos de animação e cinema. Para os críticos, o vídeo da IA é um sério riscos de arremessos profundos sexuais e informações erradas.

Além desse debate por enquanto, eu queria ver o quão bem a imagina de Grock era comparada aos maiores rivais de Xai. Como já escrevi antes, o modelo de vídeo VEO 3 AI do Google atualmente lidera com o campo com um vídeo surpreendentemente realista. Depois, há Sora, do fabricante de chatgpt Openai. Além disso, o popular gerador de imagens da AI Midjourney apresentou recentemente seu próprio vídeo generativo de IA.

Então, como a GROK se relaciona com seus concorrentes? Para ser osso, não estou impressionado.

Sim, Grug Imagine é novo e Musk disse recentemente ao X que deveria “melhorar todos os dias”. No momento, no entanto, parece estar muito atrás de seus rivais.

Deixe -me mostrar meu trabalho.

Comparação de Grok Imagine AI Video com a competição

Mashable escreveu recentemente sobre uma câmera de tendência de vídeo viral -imagens de animais pulando em trampolins e entrando em travessuras semelhantes. Por isso, usei um aviso simples para introduzir Grock, Veo 3, Sora e Midjourney: “Câmeras de câmeras de segurança de coelhos que saltam em um trampolim à noite”. Simples o suficiente, certo?

Em primeiro lugar, tenho que observar que há uma grande diferença entre o Veo 3 e o Grug Imagine. O modelo VEO 3 do Google pode gerar vídeos com base em um prompt de texto. Descreva facilmente o vídeo desejado e o VEO 3 fará o resto. No entanto, ferramentas como Midjourney e Grok imaginam que apenas a oferta de geração de texto para imagem. Depois de gerar ou fazer o upload de uma imagem, os usuários podem animá -la e transformá -la em um pequeno videoclipe. Nesse sentido, Grok Imagine já está no pé traseiro em comparação com o Openai e o Google.

Velocidade de luz mashable

Vamos mergulhar nos resultados com esses comentários, que também compartilhei em X.

Coloquei meu prompt de teste em Grock e ele retornou essas imagens decepcionantes.

Crédito: Captura de tela cortesia de Grok / Timothy Beck Werth

Captura de tela de Grok -App com imagens geradas por IA de coelhos em trampolins

Crédito: Captura de tela cortesia de Grok / Timothy Beck Werth

Selecionei o menos ruim dessas imagens e fiz este pequeno vídeo:

Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.

Está … tudo bem? Tipo de meio, ou meh, como dizem as crianças.

Mas também sofre em comparação com outros videooles da IA.

Como mostra o vídeo, o Google Veo 3 e Sora se saíram muito melhor com o mesmo prompt:

Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.

Finalmente, o Midjourney, que anima imagens semelhantes ao XAI, produz imagens melhores e produz vídeos, embora custe duas tentativas. A imagem e o vídeo produzido têm a aparência granulada de imagens de segurança.

Ai gerou a imagem de coelhos que saltam no trampolim

Imagem gerada pela AI.
Crédito: Timothy Beck Werth / Midjourney

Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.

O áudio também é uma grande desvantagem, na qual Grok se apresenta. Embora os efeitos sonoros do VEO 3 e do diálogo coerente possam produzir em sincronização com o vídeo, o áudio que encontrei no GROK, os vídeos são limitados a efeitos sonoros e balbuciantes.

Musk comparou Grok Imagine com um aplicativo de videira moderno, escrevendo em x: “Grok Imagine é otimizado para o conteúdo mais divertido e divisível”.

E nos meus primeiros testes, Grok Imagine parece otimizado para criar dois tipos de imagens e vídeos: memes e anime. Se você deseja animar memes – ou quer fazer vídeos sexualmente sugestivos de garotas de anime – então acho que Grok fará imagina, eu acho. Mas, caso contrário, não posso dizer que estou impressionado.

Há uma área em que Grok se apresenta, e isso é em termos de velocidade. Até agora, descobri que ele produz imagens e vídeos consideravelmente mais rápido que seus rivais.

Este tweet atualmente não está disponível. Pode carregar ou ter sido removido.

Mashable colocou a mão para Xai e atualizaremos essa história se recebermos uma resposta.

Publicação: Ziff Davis, empresa controladora da Mashable, contratou o Openai em abril, alegando que violava os direitos autorais de Ziff Davis em treinamento e explorando seus sistemas de IA.

Fuente