Início Tecnologia Experimentei o novo aplicativo de transcrição de IA no dispositivo do Google...

Experimentei o novo aplicativo de transcrição de IA no dispositivo do Google para iPhone e foi surpreendentemente preciso

23
0
Experimentei o novo aplicativo de transcrição de IA no dispositivo do Google para iPhone e foi surpreendentemente preciso

O Google está de volta com mais um serviço de IA – desta vez, um programa de ditado offline usando sua arquitetura “Gemma”. Mas, em vez de incluí-lo no aplicativo Gemini ou como uma função do Gemini, a empresa decidiu implementá-lo em um aplicativo dedicado para iPhone, com o nome cativante de “Google AI Edge Eloquent”.

Decidi dar uma chance ao aplicativo no dia do lançamento, embora a política de privacidade me tenha feito hesitar. O Google diz que sua localização, contatos, identificadores, diagnósticos de dispositivos, informações de contato, conteúdo do usuário, dados de uso e “outros” dados podem ser vinculados a você, enquanto compras e outros diagnósticos podem ser coletados, mas não vinculados a você. São muitos dados, especialmente para um aplicativo que anuncia que “áudio, conversas confidenciais e dados pessoais nunca saem do seu dispositivo”, e não tenho certeza se gostaria de baixar o aplicativo de outra forma. Mas, como diz o ditado, se um serviço é gratuito, você é o produto. Entrei em contato com o Google para obter esclarecimentos aqui e atualizarei esta história se receber resposta.

Como experimentar o novo aplicativo de transcrição de IA do Google

Depois de baixar o aplicativo, a configuração é fácil: você grava um exemplo de frase que o aplicativo lhe diz para dizer e, em seguida, faz uma escolha: “Modo no dispositivo”, que é totalmente offline e armazena suas conversas on-line no seu dispositivo; ou “Polimento de texto aprimorado”, que mantém o áudio em seu dispositivo, mas usa o Gemini para “polir” seu texto, o que exige que você envie dados para a nuvem (e é presumivelmente para onde vão todos os dados da política de privacidade mencionados acima). No entanto, você não precisará manter o Gemini ativado para que o aplicativo faça uma edição básica de sua transcrição – por design, o aplicativo remove palavras de “preenchimento” como “um”. Lembre-se de que o aplicativo parece abrir no modo “Polimento de texto aprimorado” por padrão – pelo menos foi assim que funcionou do meu lado. Mas um simples toque em um botão no canto superior direito da tela principal muda você para o “modo no dispositivo”.

Tive alguns problemas para colocar o aplicativo em funcionamento: toda vez que tentei testá-lo, ele alegava que eu não falava nada. Mas depois de emparelhar os AirPods com meu iPhone e desemparelhá-los, o aplicativo pareceu funcionar. Para testar o aplicativo, reproduzi a introdução deste vídeo do YouTube da Audio University, que é inteiramente baseado em diálogos. Assim que o aplicativo começou a funcionar, ele imediatamente começou a transcrever o vídeo, com uma precisão quase perfeita – pelo menos no final. Eu observaria o aplicativo inserir palavras incorretas e, em seguida, retraí-las e substituí-las conforme as palavras subsequentes forneciam contexto. Assim que a gravação foi concluída, a transcrição era quase idêntica à transcrição do vídeo, exceto por algumas peculiaridades: erroneamente pensou que “Se este é nosso primeiro encontro” era “Este é nosso primeiro encontro” e gravou uma única frase duas vezes. Mas fora isso, esta é uma transcrição totalmente utilizável do início do vídeo.

O que você acha até agora?

A partir daqui, você tem várias opções – especialmente se convidar Gêmeos para ajudar. De cara, você pode tocar no ícone de lápis sobre a transcrição para editá-la manualmente, caso queira corrigir algum texto que a IA “poliu” errado. Acima disso, você pode ver “Estatísticas de uso”, incluindo o número de palavras faladas, as palavras faladas por minuto e o número de edições que a IA fez. Se você ativar o Gemini, terá acesso a ferramentas adicionais de edição de IA, incluindo “Pontos-chave”, “Formal”, “Curto” e “Longo”. Quando estiver satisfeito com a transcrição, você pode tocar no botão copiar para mover o texto para a área de transferência e colar em outro lugar. Na aba “Histórico”, você pode visualizar suas transcrições anteriores e retornar a elas para editá-las (manualmente ou com IA). Na guia “Dicionários”, você pode adicionar palavras obscuras que usa com frequência, mas a IA pode não captar, melhorando a precisão de suas gravações no futuro.

Em meus breves testes, o aplicativo funciona bem e agradeço a opção de usá-lo apenas no dispositivo. Definitivamente, eu consideraria usá-lo em vez das transcrições integradas do iOS se parecesse mais rápido ou preciso, especialmente porque existem alguns recursos mais robustos aqui – presumindo que no dispositivo realmente significa manter meus dados fora do alcance do Google.

Fuente