Para construir as máquinas autônomas do futuro, às vezes o seu modelo precisa de um modelo.
As empresas que desenvolvem carros autónomos, robôs que manipulam o ambiente físico ou equipamentos de construção autónomos recolhem milhares, senão milhões, de horas de dados de vídeo para avaliação e formação.
Organizar e catalogar esse vídeo agora é um trabalho para o ser humano, que tem que assistir tudo. Mesmo o avanço rápido, isso não é escalonável. A Nomadic AI, uma startup fundada pelo CEO Mustafa Bal e pelo CTO Varun Krishnan, quer resolver problemas para clientes que têm 95% dos dados de sua frota arquivados.
O desafio se torna mais difícil quando se procura casos extremos – os dados mais valiosos retratam eventos que raramente ocorrem e podem ser confundidos por modelos físicos de IA inexperientes.
A Nomadic está trabalhando para resolver esse problema com uma plataforma que transforma imagens em um conjunto de dados estruturado e pesquisável por meio de uma coleção de modelos de linguagem de visão. Isso, por sua vez, permite um melhor monitoramento da frota e a criação de conjuntos de dados exclusivos para reforço de aprendizagem e iteração mais rápida.
A empresa anunciou uma rodada inicial de US$ 8,4 milhões na terça-feira, com uma avaliação pós-dinheiro de US$ 50 milhões. A rodada foi liderada pela TQ Ventures, com a participação de Pear VC e Jeff Dean, e permitirá à empresa integrar mais clientes e continuar refinando sua plataforma. Nomadic também ganhou o primeiro prêmio no concurso de pitch da Nvidia GTC no mês passado.
Os dois fundadores, que se conheceram quando eram estudantes de ciência da computação em Harvard, “continuavam enfrentando os mesmos desafios técnicos repetidamente em nossos empregos” em empresas como Lyft e Snowflake, disse Bal ao TechCrunch.
Evento Techcrunch
São Francisco, Califórnia
|
13 a 15 de outubro de 2026
“Estamos fornecendo às pessoas informações sobre suas próprias filmagens, o que quer que acione seus próprios AVs (e) robôs”, disse ele. “É isso que move esses construtores de sistemas autônomos, e não dados aleatórios.”
Imagine, por exemplo, tentar ajustar a compreensão de um AV de que ele pode passar um sinal vermelho se um policial o instruir a fazê-lo, ou isolar cada vez que os veículos passam sob um tipo específico de ponte. A plataforma da Nomadic permite que esses incidentes sejam identificados tanto para fins de conformidade quanto para serem alimentados diretamente em pipelines de treinamento.
Clientes como Zoox, Mitsubishi Electric, Natix Network e Zendar já utilizam a plataforma para desenvolver máquinas inteligentes. Antonio Puglielli, vice-presidente de engenharia da Zendar, disse que a ferramenta da Nomadic permitiu à empresa ampliar seu trabalho muito mais rápido do que a alternativa de terceirização, e que sua experiência no domínio a diferenciava de outros concorrentes.
Esse tipo de ferramenta de anotação automática baseada em modelo está emergindo como um fluxo de trabalho importante para IA física. Empresas estabelecidas de rotulagem de dados como Scale, Kognic e Encord estão desenvolvendo ferramentas de IA para fazer esse trabalho, enquanto a Nvidia lançou uma família de modelos de código aberto, Alpamayo, que pode ser adaptada para resolver o problema.
Varun argumenta que a ferramenta de sua empresa é mais do que uma etiquetadora; é um “sistema de raciocínio agêntico: você descreve o que ele precisa e ele descobre como encontrá-lo”, usando vários modelos para compreender a ação que está ocorrendo e colocá-la em contexto. Os apoiadores da Nomadic esperam que o foco da startup nesta infraestrutura específica vença.
“É a mesma razão pela qual a Salesforce não constrói sua própria nuvem e a Netflix não constrói suas próprias (instalações de distribuição de conteúdo)”, disse Schuster Tanger, parceiro da TQ Ventures que liderou a rodada, ao TechCrunch. “No momento em que uma empresa de veículos autônomos tenta construir o Nomadic internamente, ela se distrai do que a faz vencer, que é o próprio robô.”
Tanger elogia o talento de Nomadic, observando que Krishnan é um mestre internacional de xadrez classificado como o 1.549º melhor jogador do mundo. Enquanto isso, Krishnan se gaba de que todos os cerca de uma dúzia de engenheiros da empresa publicaram artigos científicos.
Agora, eles estão trabalhando arduamente no desenvolvimento de ferramentas específicas, como uma que entende a física das mudanças de faixa a partir de imagens de câmeras, ou outra que deriva locais mais precisos para as garras de um robô em um vídeo. O próximo desafio, do ponto de vista da Nomadic e de seus clientes, é desenvolver ferramentas semelhantes para dados não visuais, como leituras de sensores lidar, ou integrar dados de sensores em vários modos.
“Fazer malabarismos com terabytes de vídeo, compará-los com centenas de modelos de mais de 100 bilhões de parâmetros e, em seguida, extrair seus insights precisos é realmente extremamente difícil”, disse Bal.



