Início Tecnologia O World Labs de Fei-Fei Li acelera a corrida mundial de modelos...

O World Labs de Fei-Fei Li acelera a corrida mundial de modelos com Marble, seu primeiro produto comercial

27
0
O World Labs de Fei-Fei Li acelera a corrida mundial de modelos com Marble, seu primeiro produto comercial

World Labs, a startup fundada pelo pioneiro da IA ​​Fei-Fei Li, está lançando seu primeiro produto comercial de modelo mundial. O Marble agora está disponível em níveis freemium e pagos que permitem aos usuários transformar prompts de texto, fotos, vídeos, layouts 3D ou panoramas em ambientes 3D editáveis ​​e para download.

O lançamento do modelo mundial generativo, lançado pela primeira vez em versão beta limitada há dois meses, ocorre pouco mais de um ano depois que o World Labs saiu do sigilo com US$ 230 milhões em financiamento e coloca a startup à frente dos concorrentes que constroem modelos mundiais. Os modelos mundiais são sistemas de IA que geram uma representação interna de um ambiente e podem ser usados ​​para prever resultados futuros e planear ações.

Startups como Decart e Odyssey lançaram demonstrações gratuitas, e o Genie do Google ainda está em pré-visualização de pesquisa limitada. O Marble difere destes – e até mesmo do próprio modelo em tempo real do World Labs, RTFM – porque cria ambientes 3D persistentes e baixáveis, em vez de gerar mundos dinamicamente enquanto você explora. Isso, diz a empresa, resulta em menos transformações ou inconsistências e permite que os usuários exportem mundos como splats, malhas ou vídeos gaussianos.

O Marble também é o primeiro modelo desse tipo a oferecer ferramentas de edição nativas de IA e um editor 3D híbrido que permite aos usuários bloquear estruturas espaciais antes que a IA preencha os detalhes visuais.

Créditos da imagem:Laboratórios Mundiais

“Esta é uma categoria totalmente nova de modelo que está gerando mundos 3D e é algo que vai melhorar com o tempo. É algo que já melhoramos bastante”, disse Justin Johnson, cofundador do World Labs, ao TechCrunch.

Em dezembro passado, o World Labs mostrou como seus primeiros modelos poderiam gerar cenas 3D interativas baseadas em uma única imagem. Embora impressionantes, as cenas um tanto caricaturais não eram totalmente exploráveis, pois os movimentos eram limitados a uma pequena área e havia erros ocasionais de renderização.

Em meu teste da versão beta, descobri que o Marble gerou mundos impressionantes apenas a partir de imagens – de ambientes semelhantes a jogos a versões fotorrealistas da minha sala de estar. As cenas se transformaram nas bordas, embora isso aparentemente tenha sido melhorado no lançamento de hoje. Dito isso, um mundo que gerei na versão beta usando um único prompt parecia melhor e correspondia melhor à minha intenção do que o mesmo prompt agora.

Evento Techcrunch

São Francisco
|
13 a 15 de outubro de 2026

Ainda não testei os recursos de edição, embora Johnson diga que eles tornam o Marble prático para projetos de jogos de curto prazo, efeitos visuais e realidade virtual (VR).

“Um dos nossos principais temas para o futuro do Marble é o controle criativo”, disse Johnson. “Sempre deve haver um caminho rápido para gerar algo, mas você deve ser capaz de mergulhar ainda mais fundo e ter muito controle sobre as coisas que está gerando. Você não quer que a máquina simplesmente assuma o volante e tire toda a criatividade de você.”

Pipeline de entrada para saída do Marble.Créditos da imagem:Laboratórios Mundiais

A abordagem do Marble sobre o controle criativo começa com flexibilidade de entrada. A versão beta aceitava apenas imagens únicas, forçando o modelo a inventar detalhes invisíveis para uma visão de 360 ​​graus. Com o lançamento completo, os usuários agora podem fazer upload de várias imagens ou clipes curtos para mostrar um espaço de diferentes ângulos e fazer com que o modelo gere gêmeos digitais bastante realistas.

Depois temos o Chisel, um editor 3D experimental que permite aos usuários bloquear layouts espaciais grosseiros (pense em paredes, caixas ou planos) e, em seguida, adicionar prompts de texto para orientar o estilo visual. O Marble gera o mundo, dissociando estrutura do estilo – semelhante a como o HTML fornece a estrutura de um site e o CSS adiciona cores. Ao contrário da edição baseada em texto, o Chisel permite manipular objetos diretamente.

O recurso Cinzel do Marble separa a estrutura do estilo. Créditos da imagem:Laboratórios Mundiais

“Posso simplesmente entrar lá e pegar o bloco 3D que representa o sofá e movê-lo para outro lugar”, disse Johnson.

Outro novo recurso que oferece mais controle de edição é a capacidade de expandir um mundo.

“Depois de gerar um mundo, você pode expandi-lo até uma vez”, disse Johnson. “Quando você se move para um pedaço do mundo que está começando a se desintegrar, você pode basicamente dizer ao modelo para se expandir ali ou gerar mais mundo nas proximidades de onde você está atualmente, e então ele pode adicionar mais detalhes naquela região.”

Os usuários que desejam criar espaços extremamente grandes podem combinar vários mundos com o “modo compositor”. Johnson demonstrou isso para mim com dois mundos que ele já havia construído – uma sala feita de queijo com cadeiras de uva e outra de uma sala de reuniões futurista no espaço.

O caminho para a inteligência espacial

Ambiente de nave espacial criado em Marble com prompt de texto sobreposto. Observe como as luzes são refletidas de forma realista nas paredes do hub.Créditos da imagem:Laboratórios Mundiais/TechCrunch

O Marble está disponível em quatro níveis de assinatura: Gratuito (quatro gerações de texto, imagem ou panorama), Padrão (US$ 20/mês, 12 gerações mais entrada de múltiplas imagens/vídeo e edição avançada), Pro (US$ 35/mês, 25 gerações com expansão de cena e direitos comerciais) e Max (US$ 95/mês, todos os recursos e 75 gerações).

Johnson acredita que os casos de uso iniciais do Marble serão jogos, efeitos visuais para filmes e realidade virtual.

Os desenvolvedores de jogos têm sentimentos confusos sobre a tecnologia. Uma pesquisa recente da Game Developers Conference descobriu que um terço dos entrevistados acredita que a IA generativa tem um impacto negativo na indústria de jogos – 12% a mais do que a pesquisa indicou no ano anterior. O roubo de propriedade intelectual, o consumo de energia e a diminuição da qualidade do conteúdo gerado por IA estavam entre as principais preocupações transmitidas. E no ano passado, uma investigação da Wired descobriu que estúdios de jogos como a Activision Blizzard estão usando IA para economizar e combater o atrito.

Nos jogos, Johnson vê os desenvolvedores usando o Marble para gerar ambientes de fundo e espaços ambientais e, em seguida, importar esses ativos para mecanismos de jogos como Unity ou Unreal Engine para adicionar elementos interativos, lógica e código.

“Ele não foi projetado para substituir todo o pipeline existente para jogos, mas apenas para fornecer recursos que você pode colocar nesse pipeline”, disse ele.

Para o trabalho de efeitos visuais, o Marble evita a inconsistência e o controle deficiente da câmera que atormentam os geradores de vídeo de IA, segundo Johnson. Seus recursos 3D permitem que os artistas encenem cenas e controlem os movimentos da câmera com precisão de quadro perfeito, disse ele.

Embora Johnson tenha dito que o World Labs não está se concentrando em aplicativos de realidade virtual (VR) no momento, ele observou que a indústria está “faminta por conteúdo” e entusiasmada com o lançamento. O Marble já é compatível com os headsets Vision Pro e Quest 3 VR, e todos os mundos gerados podem ser visualizados em VR hoje.

O Marble também pode ter casos de uso potenciais para robótica. Johnson observou que, diferentemente da geração de imagens e vídeos, a robótica não tem o benefício de um grande repositório de dados de treinamento. Mas com geradores como o Marble, fica mais fácil simular ambientes de treinamento.

De acordo com um manifesto recente de Fei-Fei Li, CEO e cofundador do World Labs, o Marble representa o primeiro passo para a criação de “um modelo mundial verdadeiramente espacialmente inteligente”.

Li acredita que “a próxima geração de modelos mundiais permitirá que as máquinas alcancem inteligência espacial num nível totalmente novo”. Se grandes modelos de linguagem podem ensinar máquinas a ler e escrever, Li espera que sistemas como o Marble possam ensiná-las a ver e construir. Ela diz que a capacidade de compreender como as coisas existem e interagem em espaços tridimensionais pode eventualmente ajudar as máquinas a fazer avanços além dos jogos e da robótica, e até mesmo na ciência e na medicina.

“Nossos sonhos de máquinas verdadeiramente inteligentes não estarão completos sem inteligência espacial”, escreveu Li.

Tem uma dica sensível ou documentos confidenciais? Estamos relatando o funcionamento interno da indústria de IA — desde as empresas que moldam seu futuro até as pessoas afetadas por suas decisões. Entre em contato com Rebecca Bellan em rebecca.bellan@techcrunch.com ou Russell Brandom em russell.brandom@techcrunch.com. Para uma comunicação segura, você pode contatá-los via Signal em @rebeccabellan.491 e russellbrandom.49.

Fuente