Início Tecnologia Experimentei o recurso mais recente do YouTube e foi tão surreal que...

Experimentei o recurso mais recente do YouTube e foi tão surreal que pensei ter imaginado

33
0
Mulher usando o telefone ao lado de um grande logotipo 3D do YouTube e de um ícone do aplicativo NotebookLM.

Foi quase como um sonho febril bizarro onde de repente eu conseguia entender coreano, mas as vozes das pessoas que eu achava que sabia como soavam, na verdade soavam bem diferentes.

Então, quase tão rápido quanto começou, tudo voltou ao normal e as evidências do que eu pensava ter experimentado desapareceram completamente.

Alguém enfiou um peixe Babel na minha orelha e depois o removeu silenciosamente enquanto eu dormia?

Não, era o incrível recurso de dublagem automática do YouTube. Eu tentei, foi muito estranho e agora desapareceu completamente.

Relacionado

Estou usando o NotebookLM para assistir ao YouTube e estou aprendendo o dobro

NotebookLM acerta o que os criadores do YouTube muitas vezes não conseguem entregar

O que diabos aconteceu?

ainda não tenho certeza

Você terá que me permitir enquanto explico como tudo isso aconteceu. Resolvi assistir a um vídeo dos bastidores do grupo de K-pop Ive sobre a gravação de sua recente música Blackhole.

Esses vídeos não são incomuns no mundo do K-pop e dão aos fãs não apenas a chance de ouvir seus membros favoritos cantando ao vivo e sem edição, mas também oferecem uma visão divertida do processo geral e do trabalho envolvido na gravação de uma música.

Todos no vídeo falam coreano, mas os estúdios entendem que os grupos têm seguidores internacionais leais e, na maioria das vezes, fornecem faixas de legendas abrangentes. Isso era o que eu esperava ver quando apertei o play no vídeo.

Em vez disso, enquanto as legendas apareciam, todos também falavam em inglês. Isso foi chocante por si só, mas ficou ainda mais estranho porque ficou claro que não eram os membros que falavam inglês.

Também não é outra pessoa humana que faz a dublagem. É IA e, apesar das coisas impressionantes que o Google alcançou, você sabe que não é uma pessoa real falando.

Vozes do além

Não é o som que eu esperava

Opções de reprodução de vídeo no aplicativo YouTube

Levei um momento para entender o que estava acontecendo.

A princípio não tive certeza se era obra do estúdio, o que me levou ao menu Configurações para verificar as opções de idioma, onde descobri o modo Auto-dublagem. Estava ativo por padrão e não era algo que eu havia selecionado, daí minha surpresa.

Depois que a origem da língua inglesa foi descoberta, fiquei intrigado.

As vozes que eu ouvia não eram as vozes dos membros do Ive, e a dublagem automática ainda mudava sutilmente o tom e a entonação de cada membro quando eles falavam, a ponto de ser silenciado quando o membro estava obviamente falando baixo.

Teve o efeito de dar caráter, individualidade e personalidade às vozes artificiais dos membros, mas não era sua própria personalidade. Foi gerado pelo Google Gemini, a força por trás da tecnologia de dublagem do YouTube.

Foi inegavelmente inteligente, mas ainda assim muito perturbador e, na verdade, bastante preocupante.

Os tons vocais das pessoas ainda são únicos e reconhecíveis, mesmo que elas não falem a mesma língua que você.

Para um recurso de dublagem automática evocar seu próprio tom vocal e aplicá-lo a uma pessoa é, na melhor das hipóteses, uma licença artística e, na pior, uma liberdade assustadora, quase distópica.

Pior de tudo, a dublagem automática funcionou quando os membros estavam cantando. Gêmeos pode ser muitas coisas, mas não é um vocalista maravilhoso.

Eu me pergunto como as pessoas que vivem da voz se sentem sobre o fato de o Google permitir que Gêmeos lhes dê uma voz que não é a deles.

Um pouco bagunçado demais

Um vôo está acontecendo

Um vídeo do YouTube sendo reproduzido em um telefone

Não foram apenas as vozes do grupo que mudaram. igualmente estranho e perturbador foi como dublou a voz do produtor fora da tela, dando à pessoa um tom mais agressivo.

A voz dublada automaticamente desse indivíduo invisível frequentemente interrompia o canto dublado devido à maneira como o áudio padrão tinha que ser silenciado para que “isso” falasse.

O silenciamento e o atraso resultante na fala da voz dublada automaticamente foram um problema. O áudio original deve ser silenciado, caso contrário, tudo se tornaria uma confusão de palavras distorcidas.

O problema é que era difícil focar em uma só voz, especialmente porque ela nunca soava muito humana e não era o que eu esperava que os membros soassem quando conversavam.

O que supostamente pretendia abrir vídeos em idiomas diferentes do inglês para um público mais amplo, serviu como uma grande distração, pegando o que normalmente era apenas uma pessoa falando para uma câmera e tornando-o caótico, e qualquer pessoa que quisesse entender e aproveitar o vídeo ficaria muito melhor lendo as legendas.

Isso me tirou totalmente do vídeo, pois tudo que fiz foi focar no vale misterioso de vozes artificiais que agora o dominavam.

E assim mesmo

Foi embora

Opções de recurso de dublagem automática do YouTube

Você deve ter notado que falei sobre o recurso de dublagem automática do YouTube no passado, e isso porque, desde aquele dia, nunca mais o vi.

Eu assisto regularmente vídeos em coreano e japonês, mas a dublagem automática não apenas não foi ativada, como nem sequer foi uma opção. Assisti principalmente no aplicativo YouTube TV por meio da Apple TV.

Após algumas pesquisas, o recurso só foi lançado globalmente em fevereiro de 2026 e também pode ser algo que os canais devem habilitar.

Seu súbito desaparecimento do canal de Ive sugere que pode não ter sido bem recebido e também que o Google entende que o recurso ainda precisa de algum trabalho.

Minha única experiência com a dublagem automática do YouTube foi surreal o suficiente para ser memorável, e eu gostaria de ver como o recurso muda com diferentes tipos de vídeo.

Talvez seja melhor quando ninguém está cantando? Como isso lida com vozes masculinas? E os vídeos com muito ruído de fundo?

Como o recurso desapareceu completamente, não posso responder a essas perguntas. Quase me faz pensar se eu imaginei isso.

Fuente