Diga o que quiser sobre IA (e eu já disse bastante), mas o progresso na transcrição e no software de fala para texto é genuinamente impressionante. Embora antes esse software fosse desajeitado ou caro, agora existem todos os tipos de excelentes ferramentas de código aberto que funcionam bem.
O que me leva ao Pipit, um aplicativo de ditado gratuito para Mac que funciona offline, o que significa que é totalmente privado. Ainda mais interessante, ele pode ser usado para fazer mais do que apenas transcrever fala – ele pode iniciar aplicativos, alternar configurações e até mesmo iniciar uma pesquisa na web ou consultar um serviço de IA.
Na primeira vez que você abrir o aplicativo, ele pedirá permissão para usar seu microfone antes de baixar o modelo Periquito para transcrição offline. Depois que tudo estiver configurado, você poderá usar o aplicativo pressionando e segurando o Opção tecla e depois falar – o aplicativo gravará o que você diz, transformará isso em texto e colará o texto no campo de texto atualmente ativo.
Estou tentando isso há alguns dias e descobri que as transcrições geralmente são bastante precisas, completas com pontuação. Há pós-processamento opcional, que pode transformar fala não estruturada em um documento formatado corretamente, mas seu uso requer uma chave de API OpenRouter.
A janela de configurações permite alterar a tecla de disparo, escolher um dispositivo de entrada e alternar o ícone da barra de menu. Há também uma ferramenta para transcrever arquivos de áudio, completa com identificação do locutor. Basta arrastar um arquivo e você obterá uma transcrição.
O que você acha até agora?
A tela de uploads do Pipit, permitindo transcrever arquivos de áudio.
Crédito: Justin Pot
Finalmente, no Melhorar guia, você pode ativar o Ações rápidas recurso. Isso permite que você diga verbalmente ao seu computador o que fazer e veja o que acontece. Para usar isso, inicie a transcrição normalmente, mas diga algo como “abra o Safari” para abrir um aplicativo ou “pergunte ao Claude” seguido de uma pergunta para iniciar uma conversa com aquele assistente de IA em seu navegador. É um pouco enigmático, claro, mas gostei de usá-lo.

Os comandos de voz que você pode usar com o Pipit, conforme visto nas configurações.
Crédito: Justin Pot
É excelente que ferramentas como essa sejam amplamente gratuitas agora e o Pipit tenha uma coleção interessante de recursos.



