A última atualização do ChatGPT torna mais difícil do que nunca detectar imagens geradas por IA

As imagens geradas por IA estão cada vez mais difíceis de detectar. Existem os sinais usuais, é claro, mas esses sinais são minimizados a cada novo modelo de imagem de IA. Você poderia contar com mãos geradas por IA incluindo muitos ou poucos dedos nas pessoas, por exemplo; hoje em dia, esse não é necessariamente o caso.

Uma área específica de fraqueza dos modelos de imagem de IA é a geração de texto. A imagem em si pode parecer convincente, mas observe atentamente as palavras e muitas vezes você perceberá que elas não estão realmente certas. Talvez alguns sejam precisos, enquanto outros são bem próximos, mas, em muitos casos, você notará muitas inconsistências: muitas letras repetidas, letras que não são realmente letras, caracteres que se misturam e se misturam uns com os outros. Muitas dessas peculiaridades me lembram a aparência da linguagem de Star Wars, pelo menos quando a IA está tentando replicar o inglês americano.

O Images 2.0 da OpenAI é capaz de gerar imagens de IA altamente realistas

Mas os modelos mais recentes de IA estão melhorando muito na geração de texto. Na verdade, o modelo mais recente da OpenAI para ChatGPT, Images 2.0, pode renderizar texto altamente realista, e muito dele – a tal ponto que não tenho certeza se muitos de nós (ou qualquer um de nós) conseguiremos identificá-lo. De acordo com a OpenAI, o Images 2.0 é o primeiro modelo de imagem da empresa com capacidade de raciocínio: isso significa que o modelo pode demorar para quebrar cada etapa de uma solicitação, o que pode gerar imagens mais detalhadas ou precisas, bem como a capacidade de gerar até oito imagens a partir de um prompt (embora esteja disponível apenas para assinantes pagos). Os usuários gratuitos ainda podem aproveitar as vantagens do Images 2.0, como a forma como ele pesquisa informações na web e verifica seu trabalho. A empresa diz que “os resultados parecem menos gerados por IA e mais projetados intencionalmente”, o que essencialmente significa que as imagens geradas usando ChatGPT serão muito mais difíceis de detectar no futuro.

A empresa parece muito confiante neste último modelo. Ele apregoa o número de diferentes tipos de imagens que pode criar – não apenas imagens fotorrealistas, mas capturas de tela da interface do usuário de um computador, uma colagem de revista, um monte de arroz (isso é muito para gerar), uma página de revista e um ensaio manuscrito. Eles também significam escritos à mão, até uma mancha de café no papel. Você pode percorrer esses exemplos no anúncio oficial da OpenAI para ver como eles são chocantemente realistas. A postagem inclui outros exemplos, como fotografias altamente realistas, páginas de histórias em quadrinhos, pôsteres de filmes e imagens com diferentes proporções – até a visualização panorâmica do iPhone.

O que você acha até agora?

Todos esses desenvolvimentos são tão impressionantes quanto angustiantes, mas para mim são as melhorias no texto que realmente levam isso a outro nível. Muitos modelos estão ficando muito bons na geração de imagens que enganam os usuários fazendo-os pensar que são reais, mas o nível de detalhe no texto e na escrita desses exemplos é algo que ainda não vi. Pedi ao ChatGPT que me gerasse um cardápio para um restaurante italiano, destacando cinco pratos de jantar e duas sobremesas – deixei os pratos específicos a critério da IA. Conseguiu gerar algo realista, com entradas de jantar e sobremesa sem erros – pelo que eu sabia. Pedi então que gerasse uma entrada de jornal anunciando que os Red Sox e os Yankees mudariam de cidade. Fez isso também, novamente sem erros óbvios.


Crédito: Lifehacker

Não estou dizendo que essas imagens sejam perfeitas: elas ainda têm um “brilho” de IA, que um olho treinado ou um observador atento seria capaz de perceber. OpenAI diz que o Images 2.0 enfrenta certas tarefas complexas, como quebra-cabeças, bem como detalhes encontrados em áreas ocultas ou colocadas de maneira estranha, como superfícies invertidas. Mas nada disso realmente importa quando as imagens que este modelo produz são impressionantes o suficiente para enganar a maioria das pessoas que passam por elas. Infográficos, fotografias, mapas, quadrinhos, pôsteres de filmes, o que você quiser: as pessoas usarão essa ferramenta e você começará a ver muito mais imagens de IA em sua vida – muitas vezes sem nunca saber disso.

Fuente