Início Tecnologia OpenAI aposta alto em áudio enquanto o Vale do Silício declara guerra...

OpenAI aposta alto em áudio enquanto o Vale do Silício declara guerra às telas

17
0
Sam Altman, CEO of OpenAI

A OpenAI está apostando alto na IA de áudio, e não se trata apenas de melhorar o som do ChatGPT. De acordo com novos relatórios do The Information, a empresa unificou várias equipes de engenharia, produto e pesquisa nos últimos dois meses para revisar seus modelos de áudio, tudo em preparação para um primeiro dispositivo pessoal de áudio com lançamento previsto para cerca de um ano.

A mudança reflete o rumo que toda a indústria tecnológica está caminhando – em direção a um futuro onde as telas se tornam ruído de fundo e o áudio ocupa o centro do palco. Alto-falantes inteligentes já transformaram os assistentes de voz em mais de um terço dos lares dos EUA. A Meta acaba de lançar um recurso para seus óculos inteligentes Ray-Ban que usa um conjunto de cinco microfones para ajudá-lo a ouvir conversas em salas barulhentas – essencialmente transformando seu rosto em um dispositivo de escuta direcional. Enquanto isso, o Google começou a experimentar em junho “Visões gerais de áudio” que transformam os resultados da pesquisa em resumos de conversação. E a Tesla está integrando Grok e outros LLMs em seus veículos para criar assistentes de voz conversacionais que podem lidar com tudo, desde navegação até controle climático por meio de diálogo natural.

Não são apenas os gigantes da tecnologia que fazem esta aposta. Um grupo heterogéneo de startups emergiu com a mesma convicção, embora com graus variados de sucesso. Os criadores do Humane AI Pin gastaram centenas de milhões antes que seu wearable sem tela se tornasse um conto de advertência. O pingente Friend AI, um colar que registra sua vida e oferece companheirismo, despertou preocupações com privacidade e pavor existencial em igual medida. E agora pelo menos duas empresas, incluindo a Sandbar e uma dirigida pelo fundador da Pebble, Eric Migicovsky, estão construindo anéis de IA com estreia prevista para 2026, permitindo que os usuários falem literalmente com a mão.

Os formatos podem ser diferentes, mas a tese é a mesma: o áudio é a interface do futuro. Cada espaço – sua casa, seu carro e até mesmo seu rosto – está se tornando uma interface.

O novo modelo de áudio da OpenAI, previsto para o início de 2026, soará mais natural, lidará com interrupções como um verdadeiro interlocutor e até falará enquanto você fala, algo que os modelos atuais não conseguem gerenciar. A empresa também prevê uma família de dispositivos, possivelmente incluindo óculos ou alto-falantes inteligentes sem tela, que atuem menos como ferramentas e mais como companheiros.

Como observa o The Information, o ex-chefe de design da Apple Jony Ive, que se juntou aos esforços de hardware da OpenAI por meio da aquisição de sua empresa io por US$ 6,5 bilhões pela empresa em maio, tornou a redução do vício em dispositivos uma prioridade, vendo o design que prioriza o áudio como uma chance de “corrigir os erros” dos gadgets de consumo anteriores.

Fuente