EUn Mid-2023, se um usuário solicitou ao Chatgpt of OpenAI uma receita para massas de alcachofra ou instruções sobre como fazer uma oferta ritual à antiga divindade cananesa Moloch, a resposta poderia ter durado 2 watts-2 watts-2 watt-de-2 ou aproximadamente a mesma quantidade de eletricidade que uma lâmpada incandescente em 2 minutos.
O Openai lançou um modelo na quinta-feira que apoiará o popular chatbot-5. Peça à versão da IA para uma receita de alcachofra e a mesma quantidade de texto relacionado a massas pode levar várias vezes a quantidade de energia, dizem os especialistas.
Enquanto o GPT-5 foi lançado, a empresa enfatizou as possibilidades inovadoras do modelo: a capacidade de criar sites, responder a perguntas científicas no nível de doutorado e razões para problemas difíceis.
Mas especialistas que trabalharam nos últimos anos para comparar o uso de energia e recursos dos modelos de IA dizem que esses novos poderes envolvem custos: uma reação do GPT-5 pode exigir uma quantidade consideravelmente maior de energia do que uma reação das versões anteriores do ChatGPT.
Como a maioria de seus concorrentes, o OpenAI não divulgou informações oficiais sobre o consumo de energia de seus modelos desde o GPT-3, lançado em 2020. Sam Altman, seu CEO, jogou fora alguns números sobre o consumo de recursos da ChatGPT em seu blog em junho. No entanto, esses números, a água de 0,34 watt e 0,000085 galões por consulta, não se referem a um modelo específico e não têm documentação de suporte.
“Um modelo mais complexo, como o GPT-5, consome mais força durante o treinamento e durante a conclusão. Também tem como objetivo pensar muito … posso dizer com segurança que vai consumir muito mais poder do que o GPT-4”, disse Rakesh Kumar, professor da Universidade de Illinois, que atualmente está trabalhando com a consumo de energia dos modos de cálculo e IA.
No dia em que o GPT-5 foi lançado, pesquisadores do laboratório da IA da Universidade de Rhode Island descobriram que o modelo pode usar eletricidade de até 40 watts para gerar uma resposta média de aproximadamente 1.000 tokens que são os blocos de texto de texto para um modelo de IA e são aproximadamente equivalentes às palavras.
Um painel que eles estabelecem na sexta-feira indica que o consumo médio de energia do GPT-5 para uma resposta do comprimento médio é pouco mais de 18 watts, um número maior do que todos os outros modelos que eles realizado, exceto o modelo de raciocínio da O3 do OpenAI, lançado em abril e R1, fabricado pela IA chinês.
Isso é “consideravelmente mais energia que o GPT-4O”, o modelo anterior do Openai, disse Nidhal Jegham, pesquisador do grupo.
Dezoito Wattuur corresponderia à queima dessa lâmpada por 18 minutos. Dados relatórios recentes de que o ChatGPT processa 2,5 bilhões de solicitações por dia, o consumo total do GPT-5 poderia atingir a demanda diária de eletricidade de 1,5 milhão de casas americanas.
Não importa o tamanho desses números, os pesquisadores do campo dizem que correspondem às suas amplas expectativas para o consumo de energia do GPT-5, uma vez que o GPT-5 é considerado várias vezes maiores que os modelos anteriores do OpenAI. O OpenAI não lançou as linhas do Parametell que determinam o tamanho de um modelo para um dos modelos desde o GPT-3, que tinha 175 bilhões de parâmetros.
Uma divulgação deste verão da empresa francesa de IA Mistral encontra uma “forte correlação” entre o tamanho de um modelo e seu consumo de energia, com base no estudo de Mistral sobre seus sistemas internos.
“Com base no tamanho do modelo, a quantidade de recursos (usados pelo GPT-5) deve ser maior que os do GPT-3”, diz Shaoleei Ren, professor da Universidade da Califórnia, Riverside, que estuda a pegada de recursos da IA.
Benchmarking AI Power -Use
O GPT-4 foi geralmente considerado 10 vezes o tamanho do GPT-3. Jegham, Kumar, Ren e outros dizem que o GPT-5 é provavelmente consideravelmente maior que o GPT-4.
As principais empresas de IA como o OpenAI acreditam que modelos extremamente grandes podem ser necessários para alcançar a AGI, ou seja, um sistema de IA capaz de fazer o trabalho das pessoas. Altman argumentou fortemente por essa visão e escreve em fevereiro: “Parece que você pode gastar quantias aleatórias e obter lucros contínuos e previsíveis”, embora ele tenha dito que o GPT-5 não supera a inteligência humana.
Passe a promoção do boletim informativo
Um mergulho semanal em como a tecnologia projeta nossas vidas
Notificação de privacidade: Os boletins podem conter informações sobre instituições de caridade, anúncios on -line e conteúdo financiados por partes externas. Consulte nossa Política de Privacidade para obter mais informações. Usamos o Google Recaptcha para proteger nosso site e a Política de Privacidade do Google e as condições de serviço se aplicam.
Após a promoção do boletim informativo
Em seu estudo de benchmarking em julho, que analisou o consumo de energia, o consumo de água e as emissões de carbono para o LE Chat-Bot de Mistral, a startup encontrou uma relação individual entre o tamanho de um modelo e o consumo de recursos, escrevendo: “Um modelo 10 vezes maior gerará uma ordem de uma ordem de tamanho para a mesma quantidade para a mesma quantidade para a quantidade da quantidade”.
Jegham, Kumar e Ren disseram que, embora a escala do GPT-5 seja considerável, provavelmente existem outros fatores que entrarão em jogo ao determinar o consumo de recursos. O GPT-5 é implementado em hardware mais eficiente do que alguns modelos anteriores. O GPT-5 parece usar uma arquitetura “mistura de especialistas”, o que significa que é simplificado para que nem todos os seus parâmetros sejam ativados ao responder a uma consulta, uma construção que provavelmente reduzirá seu consumo de energia.
Por outro lado, o GPT-5 também é um modelo de raciocínio e funciona em vídeo e imagens, além de texto, o que significa que sua pegada de energia é provavelmente muito maior do que apenas operações de texto, dizem Ren e Kumar, especialmente porque o modo de raciocínio significa que o modelo calculará mais tempo antes de responder a uma pesquisa.
“Se você usar o modo de raciocínio, a quantidade de fontes que você gasta para obter a mesma resposta provavelmente será várias vezes mais alta, cinco a 10”, disse Ren.
Informações ocultas
Para calcular o consumo de recursos de um modelo de IA, o grupo da Universidade de Rhode Island multiplicou o tempo médio que o modelo precisa para responder a uma pesquisa – seja uma receita de macarrão ou uma oferta a Moloch – devido à redução média de energia do modelo durante a operação.
A estimativa do desenho de poder de um modelo foi “muito trabalho”, disse Abdeltawab Hendawi, professor de ciência de dados da Universidade de Rhode Island. O grupo teve dificuldade em encontrar informações sobre como diferentes modelos são implementados em data centers. Seu último artigo contém estimativas para as quais os chips são usados para um determinado modelo e como diferentes perguntas são excluídas entre diferentes chips em um data center.
A postagem do blog de Altman em junho confirmou suas descobertas. A figura que ele deu para o consumo de energia de chatgpt por pesquisa, 0,34 watt-hora por consulta, corresponde de perto o que o grupo encontrou para o GPT-4O.
Hendawi, Jegham e outros em seu grupo disseram que suas descobertas sublinham a necessidade de mais transparência das empresas de IA se liberarem modelos crescentes.
“É mais crítico do que nunca enfrentar os verdadeiros custos ambientais da IA”, disse Marwan Abdelatti, professor da URI. “Pedimos ao Openai e a outros desenvolvedores que usem esse momento para se comprometer com a total transparência, tornando o impacto ambiental do GPT-5 conhecido publicamente”.