Início Tecnologia Em 2026, a IA passará do exagero ao pragmatismo

Em 2026, a IA passará do exagero ao pragmatismo

26
0
Centro de dados da Amazon

Se 2025 foi o ano em que a IA obteve uma verificação de vibração, 2026 será o ano em que a tecnologia se tornará prática. O foco já está mudando da construção de modelos de linguagem cada vez maiores para o trabalho mais árduo de tornar a IA utilizável. Na prática, isso envolve a implantação de modelos menores onde cabem, a incorporação de inteligência em dispositivos físicos e o projeto de sistemas que se integrem de forma limpa aos fluxos de trabalho humanos.

Os especialistas do TechCrunch falaram para ver 2026 como um ano de transição, um ano que evolui do dimensionamento de força bruta para a pesquisa de novas arquiteturas, de demonstrações chamativas a implantações direcionadas e de agentes que prometem autonomia para aqueles que realmente melhoram a forma como as pessoas trabalham.

A festa ainda não acabou, mas a indústria começa a ficar sóbria.

Leis de escalonamento não vão resolver isso

Créditos da imagem:Amazônia

Em 2012, o artigo de Alex Krizhevsky, Ilya Sutskever e Geoffrey Hinton na AlexNet mostrou como os sistemas de IA poderiam “aprender” a reconhecer objetos em imagens observando milhões de exemplos. A abordagem era computacionalmente cara, mas tornou-se possível com GPUs. O resultado? Uma década de pesquisas intensas em IA enquanto os cientistas trabalhavam para inventar novas arquiteturas para diferentes tarefas.

Isso culminou por volta de 2020, quando a OpenAI lançou o GPT-3, que mostrou como simplesmente tornar o modelo 100 vezes maior desbloqueia habilidades como codificação e raciocínio sem exigir treinamento explícito. Isto marcou a transição para o que Kian Katanforoosh, CEO e fundador da plataforma de agentes de IA Workera, chama de “era da expansão”: um período definido pela crença de que mais computação, mais dados e modelos de transformadores maiores conduziriam inevitavelmente aos próximos grandes avanços na IA.

Hoje, muitos investigadores pensam que a indústria da IA ​​está a começar a esgotar os limites das leis de escala e irá mais uma vez fazer a transição para uma era de investigação.

Yann LeCun, ex-cientista-chefe de IA da Meta, há muito argumenta contra a dependência excessiva do dimensionamento e enfatizou a necessidade de desenvolver arquiteturas melhores. E Sutskever disse numa entrevista recente que os modelos actuais estão a estagnar e os resultados pré-formação estagnaram, indicando a necessidade de novas ideias.

Evento Techcrunch

São Francisco
|
13 a 15 de outubro de 2026

“Acho que provavelmente nos próximos cinco anos encontraremos uma arquitetura melhor que representará uma melhoria significativa nos transformadores”, disse Katanforoosh. “E se não o fizermos, não podemos esperar muitas melhorias nos modelos.”

Às vezes menos é mais

Grandes modelos de linguagem são ótimos para generalizar o conhecimento, mas muitos especialistas dizem que a próxima onda de adoção de IA empresarial será impulsionada por modelos de linguagem menores e mais ágeis que podem ser ajustados para soluções específicas de domínio.

“SLMs ajustados serão a grande tendência e se tornarão um produto básico usado por empresas maduras de IA em 2026, já que as vantagens de custo e desempenho impulsionarão o uso em relação aos LLMs prontos para uso”, disse Andy Markus, diretor de dados da AT&T, ao TechCrunch. “Já vimos empresas confiarem cada vez mais em SLMs porque, se ajustados adequadamente, eles se equiparam aos modelos maiores e generalizados em precisão para aplicações de negócios empresariais e são excelentes em termos de custo e velocidade.”

Já vimos esse argumento antes da startup francesa de IA aberta Mistral: ela argumenta que seus modelos pequenos, na verdade, têm desempenho melhor do que modelos maiores em vários benchmarks após o ajuste fino.

“A eficiência, a relação custo-benefício e a adaptabilidade dos SLMs os tornam ideais para aplicações personalizadas onde a precisão é fundamental”, disse Jon Knisley, estrategista de IA da ABBYY, uma empresa empresarial de IA com sede em Austin.

Embora Markus acredite que os SLMs serão fundamentais na era da agência, Knisley diz que a natureza dos modelos pequenos significa que eles são melhores para implantação em dispositivos locais, “uma tendência acelerada pelos avanços na computação de ponta”.

Aprendendo através da experiência

Ambiente de nave espacial criado em Marble com prompt de texto sobreposto. Observe como as luzes são refletidas de forma realista nas paredes do hub.Ambiente de nave espacial criado em Marble com prompt de texto sobreposto. Observe como as luzes são refletidas de forma realista nas paredes do hub.Créditos da imagem:Laboratórios Mundiais/TechCrunch

Os humanos não aprendem apenas através da linguagem; aprendemos experimentando como o mundo funciona. Mas os LLMs realmente não entendem o mundo; eles apenas prevêem a próxima palavra ou ideia. É por isso que muitos investigadores acreditam que o próximo grande salto virá dos modelos mundiais: sistemas de IA que aprendem como as coisas se movem e interagem em espaços 3D para que possam fazer previsões e tomar medidas.

Os sinais de que 2026 será um grande ano para os modelos mundiais multiplicam-se. LeCun deixou a Meta para iniciar seu próprio laboratório de modelos mundiais e está buscando uma avaliação de US$ 5 bilhões. O DeepMind do Google está trabalhando no Genie e, em agosto, lançou seu modelo mais recente que cria modelos mundiais interativos de uso geral em tempo real. Juntamente com demonstrações de startups como Decart e Odyssey, o World Labs de Fei-Fei Li lançou seu primeiro modelo comercial mundial, o Marble. Recém-chegados como a General Intuition em outubro obtiveram uma rodada inicial de US$ 134 milhões para ensinar raciocínio espacial aos agentes, e a startup de geração de vídeo Runway lançou em dezembro seu primeiro modelo mundial, GWM-1.

Embora os investigadores vejam potencial a longo prazo na robótica e na autonomia, o impacto a curto prazo provavelmente será visto primeiro nos videojogos. A PitchBook prevê que o mercado de modelos mundiais em jogos poderá crescer de US$ 1,2 bilhão entre 2022 e 2025 para US$ 276 bilhões até 2030, impulsionado pela capacidade da tecnologia de gerar mundos interativos e personagens não-jogadores mais realistas.

Pim de Witte, fundador da General Intuition, disse ao TechCrunch que os ambientes virtuais podem não apenas remodelar os jogos, mas também se tornar campos de testes críticos para a próxima geração de modelos básicos.

Nação agente

Os agentes não conseguiram corresponder ao hype em 2025, mas um grande motivo para isso é porque é difícil conectá-los aos sistemas onde o trabalho realmente acontece. Sem uma forma de acessar ferramentas e contexto, a maioria dos agentes ficou presa em fluxos de trabalho piloto.

O Model Context Protocol (MCP) da Anthropic, um “USB-C para IA” que permite que agentes de IA se comuniquem com ferramentas externas como bancos de dados, mecanismos de busca e APIs, provou ser o tecido conjuntivo que faltava e está rapidamente se tornando o padrão. OpenAI e Microsoft adotaram publicamente o MCP, e a Anthropic doou-o recentemente para a nova Agentic AI Foundation da Linux Foundation, que visa ajudar a padronizar ferramentas de agente de código aberto. O Google também começou a montar seus próprios servidores MCP gerenciados para conectar agentes de IA aos seus produtos e serviços.

Com o MCP reduzindo o atrito de conectar agentes a sistemas reais, 2026 provavelmente será o ano em que os fluxos de trabalho dos agentes finalmente passarão das demonstrações para a prática diária.

Rajeev Dham, sócio da Sapphire Ventures, afirma que esses avanços levarão a soluções que priorizam os agentes, assumindo “funções de sistema de registro” em todos os setores.

“À medida que os agentes de voz lidam com tarefas mais completas, como captação e comunicação com o cliente, eles também começarão a formar os sistemas centrais subjacentes”, disse Dham. “Veremos isso em vários setores, como serviços domésticos, proptech e saúde, bem como em funções horizontais, como vendas, TI e suporte.”

Aumento, não automação

Créditos da imagem:Foto de Igor Omilaev no Unsplash

Embora fluxos de trabalho mais agentes possam levantar preocupações de que possam ocorrer demissões, Katanforoosh, da Workera, não tem tanta certeza de que essa seja a mensagem.

“2026 será o ano dos humanos”, disse ele.

Em 2024, todas as empresas de IA previram que iriam automatizar trabalhos devido à necessidade de humanos. Mas a tecnologia ainda não chegou e, numa economia instável, essa não é uma retórica popular. Katanforoosh diz que no próximo ano perceberemos que “a IA não funcionou de forma tão autônoma quanto pensávamos” e a conversa se concentrará mais em como a IA está sendo usada para aumentar os fluxos de trabalho humanos, em vez de substituí-los.

“E penso que muitas empresas vão começar a contratar”, acrescentou, observando que espera que haja novas funções na governação da IA, transparência, segurança e gestão de dados. “Estou bastante otimista quanto ao desemprego, em média inferior a 4% no próximo ano.”

“As pessoas querem estar acima da API, não abaixo dela, e acho que 2026 é um ano importante para isso”, acrescentou de Witte.

Ficando físico

Mark Zuckerberg usa um par de óculos Meta Oakley Vanguard AI durante o evento Meta Connect, 17 de setembro de 2025. Créditos da imagem:David Paul Morris/Bloomberg/Getty Images

Avanços em tecnologias como modelos pequenos, modelos mundiais e computação de ponta permitirão mais aplicações físicas de aprendizado de máquina, dizem os especialistas.

“A IA física chegará ao mercado em 2026, à medida que novas categorias de dispositivos alimentados por IA, incluindo robótica, AVs, drones e wearables, começarem a entrar no mercado”, disse Vikram Taneja, chefe da AT&T Ventures, ao TechCrunch.

Embora os veículos autónomos e a robótica sejam casos de utilização óbvios para a IA física que sem dúvida continuarão a crescer em 2026, a formação e a implantação necessárias ainda são caras. Os wearables, por outro lado, oferecem uma vantagem menos dispendiosa com a adesão do consumidor. Óculos inteligentes como os Ray Bans da Meta estão começando a enviar assistentes que podem responder a perguntas sobre o que você está vendo, e novos fatores de forma, como anéis de saúde alimentados por IA e relógios inteligentes, estão normalizando a inferência sempre ativa no corpo.

“Os fornecedores de conectividade trabalharão para optimizar a sua infra-estrutura de rede para suportar esta nova onda de dispositivos, e aqueles com flexibilidade na forma como podem oferecer conectividade estarão melhor posicionados”, disse Taneja.

Fuente