Depois que a atualização do GPT-4O foi lançada, os usuários de mídia social observaram que o ChatGPT começou a responder aos comentários de uma maneira que parecia ser excessivamente agradável e validada. Os usuários postaram capturas de tela do ChatGPT aplaudindo todos os tipos de decisões e idéias problemáticas e perigosas. Os usuários postaram capturas de tela do ChatGPT aplaudindo todos os tipos de decisões e idéias problemáticas e perigosas.
Em um post no X no domingo, o CEO Sam Altman reconheceu o problema e disse que o Openai trabalharia em correções “o mais rápido possível”. Na terça-feira, Altman anunciou que a atualização do GPT-4O estava sendo revertida e que o Openai estava trabalhando em “correções adicionais” na personalidade do modelo.
De acordo com o OpenAI, a atualização, destinada a tornar a personalidade padrão do modelo “parecer mais intuitiva e eficaz”, foi informada demais por “feedback de curto prazo” e “não explicaram completamente como as interações dos usuários com o ChatGPT evoluem ao longo do tempo”.
“Como resultado, o GPT-4O distorceu as respostas que eram excessivamente favoráveis, mas falsas”, escreveu o Openai em um post no blog. A interação bancada pode deixar as pessoas desconfortáveis e desconfortáveis. Ficamos aquém e estamos trabalhando para acertar. “
O Openai diz que está implementando várias correções, incluindo refinar suas técnicas principais de treinamento de modelo e instruções do sistema para afastar explicitamente o GPT-4O da bajulação. A empresa também está construindo mais corrimãos de segurança para “aumentar
honestidade e transparência “, diz.
O Openai também diz que está explorando maneiras de permitir que os usuários dêem “feedback em tempo real” para “influenciar diretamente suas interações” com o ChatGPT e escolher entre várias “personalidades” do chatgpt “(The Model’s)”
Explorando novas maneiras de incorporar feedback mais amplo e democrático aos comportamentos padrão do ChatGPT “, escreveu a empresa em sua postagem no blog. A empresa escreveu em sua postagem no blog que eles estão explorando novas maneiras de incorporar feedback mais amplo e democrático aos comportamentos padrão do ChatGPT.
Fuente