O OpenAI está lançando um novo agente de IA para fins gerais no ChatGPT, a empresa diz que pode concluir uma ampla gama de tarefas baseadas em computador em nome dos usuários. O OpenAI diz que o agente pode navegar automaticamente na agenda de um usuário, gerar apresentações editáveis e performances de slide e executar código.
A ferramenta, chamada ChatGPT -Agent, combina várias opções das ferramentas anteriores do agente do OpenAI, incluindo a capacidade do operador de clicar em sites, bem como a capacidade da pesquisa profunda de sintetizar informações de dezenas de sites em um relatório conciso de pesquisa. O OpenAI diz que os usuários poderão se comunicar com o agente simplesmente solicitando o ChatGPT em linguagem natural.
Na quinta -feira, o agente do OpenAI Chatgpt é lançado para os assinantes de seu profissional, mais e planos de equipe. Para ativar a ferramenta, os usuários podem selecionar o “modo agente” no menu ChatGPT With Tools Drop -.
O lançamento do agente do ChatGPT representa a tentativa mais corajosa do OpenAI de transformar o ChatGPT em um produto Agentic que pode executar ações e pode executar tarefas para os usuários, em vez de apenas responder perguntas. Nos últimos anos, as empresas do Vale do Silício, incluindo Openai, Google e Parmexity, revelaram dezenas de agentes de IA que prometeram fazer isso exatamente. No entanto, essa versão inicial dos agentes da IA provou que eles estão lutando com tarefas complexas e parecem menos atraentes como produtos do que os executivos finais da Vision Tech em torno dos agentes da IA.
Dito isto, o Openai diz que o agente do ChatGPT é muito mais capaz do que suas ofertas anteriores.
O novo agente do OpenAI tem acesso aos Connectores ChatGPT, para que os usuários possam conectar aplicativos como Gmail e Github, para que o agente possa encontrar informações relevantes para seus prompts. Além disso, o OpenAI diz que o agente do ChatGPT tem acesso a um terminal e pode usar APIs para obter acesso a determinados aplicativos.
O agente do ChatGPT subjacente do modelo-Underneath oferece desempenho de última geração em vários benchmarks, de acordo com o Openai.
Evento do TechCrunch
São Francisco
|
27-29 de outubro de 2025
A empresa diz que o modelo ChatGPT -Agent obtém 41,6% no último exame da humanidade (PASS@1), um teste difícil que consiste em milhares de perguntas sobre mais de cem tópicos. Isso é sobre o dobro do que o Open O3 e O4-mini marcaram no teste.
Na FrontierMath, um dos benchmarks matemáticos mais difíceis, o OpenAI diz que o ChatGPT Agent obtém 27,4% quando tem acesso a ferramentas, como um terminal para a versão de código. A pontuação anterior de última geração vem da O4-Mini, que marcou apenas 6,3%.
O Openai observa que o agente do ChatGPT se desenvolveu com a segurança em mente, principalmente porque o produto apresenta algumas novas possibilidades que podem torná -lo mais perigoso nas mãos de um ator ruim. No entanto, ainda é para ser visto como o agente de chatgpt capaz é real.