Experimentei o Gemini Omni e não estava pronto para o quão futurista parecia

Todo gigante da tecnologia afirma ter construído o próximo grande sucesso.

Então, quando inicializei o Gemini Omni, esperava o polimento incremental usual. Eu estava completamente despreparado para o que realmente aconteceu.

Entrei cético e saí completamente impressionado.

Acontece que eu não estava preparado para o quão fluido, profundamente integrado e totalmente futurista esse ecossistema parece na prática.

Relacionado

7 maneiras inesperadas de usar o Gemini além do chat

Tornou-se uma parte crucial do meu fluxo de trabalho Android

Afinal, o que é Gemini Omni?

Gêmeos Omni

Se você tem acompanhado os últimos lançamentos de IA, provavelmente já ouviu muitos rumores sobre o Google Omni. Mas o que realmente é quando você remove o boato do marketing?

Basicamente, pense no Gemini Omni como um parceiro criativo projetado especificamente para criação e edição de vídeos de última geração.

Não é apenas mais um chatbot padrão onde você digita um prompt de texto e reza para que a saída de vídeo pareça decente.

É um multimodal integrado diretamente no ecossistema Gemini para assinantes pagos.

Em vez de apenas adivinhar como deveria ser o próximo quadro, Omni combina os modelos de mídia generativa do Google com uma compreensão real de física, iluminação e cultura.

Posso alimentá-lo com texto, várias fotos e um videoclipe de uma só vez para construir uma saída de vídeo de alta qualidade.

A edição de vídeo conversacional é seu recurso matador.

Como o Omni entende o que vê e o que cria, você pode editar qualquer vídeo apenas conversando com ele.

É basicamente como ter um editor e diretor de efeitos visuais habilidoso sentado na barra lateral.

Uma variedade de modelos para escolher

use modelo para criar vídeo no Gemini Omni

Quando você entra pela primeira vez na guia Vídeos dedicada, você não está apenas olhando para uma caixa de aviso em branco e piscando, imaginando como definir uma obra-prima cinematográfica.

O Google incluiu um recurso interessante para novos usuários: uma biblioteca de modelos prontos para uso.

Para mim, esta é uma grande vitória porque nem todo mundo é fluente na elaboração de prompts complexos de IA, nem quer gastar 20 minutos ajustando adjetivos descritivos apenas para obter um simples vídeo de convite de aniversário.

Você pode percorrer uma variedade de modelos estilizados, desde videogame, história em quadrinhos, anime, animais falantes, meme e outros estilos.

Depois de escolher um modelo, você troca alguns detalhes básicos do espaço reservado. Se estiver fazendo um convite ou um clipe comemorativo, digite o nome do aniversariante, o horário, o local ou um tema específico.

Você pressiona Enter e o Omni cuida do trabalho pesado e gera um vídeo de alta qualidade rapidamente.

Codificação Vibe para vídeo

crie um vídeo no Gemini Omni

Para testar seus limites, eu lhe dei uma mensagem altamente específica e complexa sobre como o sensor da câmera de um smartphone captura luz.

A maioria dos modelos teria me dado um clipe genérico de aparência técnica. Omni, no entanto, acertou em cheio nos detalhes físicos – a forma como a luz atingiu a abertura, as mudanças de campo padrão e o movimento mecânico foram surpreendentemente precisos.

O que mais me impressionou não foi apenas o resultado inicial, mas o fato de que eu poderia dizer: ‘Na verdade, aumente a abertura um pouco mais e dê a ela uma iluminação cinematográfica com tons frios’, e ajustou toda a cena instantaneamente.

Mas o verdadeiro momento surpreendente veio quando me coloquei no quadro.

Carreguei uma foto normal minha sentado em um carro e dei a ela um conjunto de instruções bastante malucas: ‘Dê vida a essa imagem, faça a pessoa cantar uma música de Bollywood e deixe seu cabelo ostentar de forma realista, como se houvesse uma brisa.’

crie um vídeo a partir de uma imagem no Gemini Omni

Fez um trabalho surpreendentemente bom. Capturou o movimento do canto, adicionou um movimento suave com árvores, trânsito e outros detalhes.

E é aqui que a edição conversacional realmente brilha.

Não precisei recarregar a foto ou começar de novo. Acabei de conversar com ele: ‘Ok, isso é ótimo, mas por favor mude a música para esta e faça meu rosto parecer um pouco mais magro.’

Alguns segundos depois, estava feito. Ele carregou a sincronização labial para a nova faixa e ajustou minha estrutura facial sem quebrar a continuidade da cena.

Conecte o WhatsApp com Gêmeos

Relacionado

Comecei a usar o Gemini com o WhatsApp e isso mudou o jogo

Gêmeos conhece WhatsApp

Usando Omni para conteúdo educacional

vídeo educativo em Gemini Omni

Omni possui enormes capacidades educacionais e instrucionais.

Imagine ser um professor ou criador de conteúdo e precisar explicar física complexa e cronogramas históricos.

Normalmente, você precisa de um software caro como o After Effects e uma curva de aprendizado acentuada para realizar esse tipo de tipografia.

Com o Gemini Omni, você pode simplesmente descrever a experiência que deseja.

Para testar sua precisão, lancei um prompt complexo e de várias camadas no Omni e esperava que ele tivesse dificuldades, mas acertou em cheio os estilos visuais na primeira tentativa.

O que me surpreendeu não foi apenas o resultado, mas a velocidade de geração.

Não compreendeu apenas a direção criativa; ele sincronizou a animação e a trilha de áudio em segundos e provou que Omni é uma potência para conteúdo educacional de nível profissional.

Não é outra demonstração chamativa

É raro terminar uma análise técnica e sentir uma verdadeira sensação de admiração, mas é exatamente isso que o Gemini Omni deixa você.

Se você está esperando o momento em que a inteligência artificial deixa de parecer uma novidade e o sentimento começa a ser animado, é isso.

O futuro da IA ​​não é mais apenas um roteiro; está aqui, é fluido e, francamente, todo o resto parece passado agora.

A experiência Gemini não se limita apenas ao complemento Omni. Aqui estão outras dicas e truques para aproveitar ao máximo a IA do Google.

Fuente