As imagens geradas por IA estão cada vez mais difíceis de detectar. Existem os sinais usuais, é claro, mas esses sinais são minimizados a cada novo modelo de imagem de IA. Você poderia contar com mãos geradas por IA incluindo muitos ou poucos dedos nas pessoas, por exemplo; hoje em dia, esse não é necessariamente o caso.
Uma área específica de fraqueza dos modelos de imagem de IA é a geração de texto. A imagem em si pode parecer convincente, mas observe atentamente as palavras e muitas vezes você perceberá que elas não estão realmente certas. Talvez alguns sejam precisos, enquanto outros são bem próximos, mas, em muitos casos, você notará muitas inconsistências: muitas letras repetidas, letras que não são realmente letras, caracteres que se misturam e se misturam uns com os outros. Muitas dessas peculiaridades me lembram a aparência da linguagem de Star Wars, pelo menos quando a IA está tentando replicar o inglês americano.
O Images 2.0 da OpenAI é capaz de gerar imagens de IA altamente realistas
Mas os modelos mais recentes de IA estão melhorando muito na geração de texto. Na verdade, o modelo mais recente da OpenAI para ChatGPT, Images 2.0, pode renderizar texto altamente realista, e muito dele – a tal ponto que não tenho certeza se muitos de nós (ou qualquer um de nós) conseguiremos identificá-lo. De acordo com a OpenAI, o Images 2.0 é o primeiro modelo de imagem da empresa com capacidade de raciocínio: isso significa que o modelo pode demorar para quebrar cada etapa de uma solicitação, o que pode gerar imagens mais detalhadas ou precisas, bem como a capacidade de gerar até oito imagens a partir de um prompt (embora esteja disponível apenas para assinantes pagos). Os usuários gratuitos ainda podem aproveitar as vantagens do Images 2.0, como a forma como ele pesquisa informações na web e verifica seu trabalho. A empresa diz que “os resultados parecem menos gerados por IA e mais projetados intencionalmente”, o que essencialmente significa que as imagens geradas usando ChatGPT serão muito mais difíceis de detectar no futuro.
A empresa parece muito confiante neste último modelo. Ele apregoa o número de diferentes tipos de imagens que pode criar – não apenas imagens fotorrealistas, mas capturas de tela da interface do usuário de um computador, uma colagem de revista, um monte de arroz (isso é muito para gerar), uma página de revista e um ensaio manuscrito. Eles também significam escritos à mão, até uma mancha de café no papel. Você pode percorrer esses exemplos no anúncio oficial da OpenAI para ver como eles são chocantemente realistas. A postagem inclui outros exemplos, como fotografias altamente realistas, páginas de histórias em quadrinhos, pôsteres de filmes e imagens com diferentes proporções – até a visualização panorâmica do iPhone.
O que você acha até agora?
Todos esses desenvolvimentos são tão impressionantes quanto angustiantes, mas para mim são as melhorias no texto que realmente levam isso a outro nível. Muitos modelos estão ficando muito bons na geração de imagens que enganam os usuários fazendo-os pensar que são reais, mas o nível de detalhe no texto e na escrita desses exemplos é algo que ainda não vi. Pedi ao ChatGPT que me gerasse um cardápio para um restaurante italiano, destacando cinco pratos de jantar e duas sobremesas – deixei os pratos específicos a critério da IA. Conseguiu gerar algo realista, com entradas de jantar e sobremesa sem erros – pelo que eu sabia. Pedi então que gerasse uma entrada de jornal anunciando que os Red Sox e os Yankees mudariam de cidade. Fez isso também, novamente sem erros óbvios.
Crédito: Lifehacker
Não estou dizendo que essas imagens sejam perfeitas: elas ainda têm um “brilho” de IA, que um olho treinado ou um observador atento seria capaz de perceber. OpenAI diz que o Images 2.0 enfrenta certas tarefas complexas, como quebra-cabeças, bem como detalhes encontrados em áreas ocultas ou colocadas de maneira estranha, como superfícies invertidas. Mas nada disso realmente importa quando as imagens que este modelo produz são impressionantes o suficiente para enganar a maioria das pessoas que passam por elas. Infográficos, fotografias, mapas, quadrinhos, pôsteres de filmes, o que você quiser: as pessoas usarão essa ferramenta e você começará a ver muito mais imagens de IA em sua vida – muitas vezes sem nunca saber disso.



