Início Tecnologia O CEO da Cloudflare explica exatamente o que causou a interrupção global

O CEO da Cloudflare explica exatamente o que causou a interrupção global

12
0
O CEO da Cloudflare explica exatamente o que causou a interrupção global

Uma interrupção do Cloudflare destruiu uma grande parte da Internet na terça-feira, com os usuários impossibilitados de acessar vários sites e serviços como X, ChatGPT, Spotify, YouTube e Uber. A empresa de segurança cibernética publicou agora uma postagem no blog detalhando exatamente o que aconteceu.

VEJA TAMBÉM:

Por que a internet continua travando com tanta frequência? Primeiro Google Cloud, depois AWS, agora Cloudflare.

O cofundador e CEO da Cloudflare, Matthew Prince, pediu desculpas no post na noite de terça-feira, afirmando que essa interrupção foi a pior que a empresa já experimentou desde 2019.

“(Nos últimos 6 anos ou mais, não tivemos outra interrupção que fizesse com que a maior parte do tráfego principal parasse de fluir pela nossa rede”, disse Prince. “Em nome de toda a equipe da Cloudflare, gostaria de pedir desculpas pela dor que causamos à Internet hoje.”

Prince explicou que a interrupção do Cloudflare foi causada por um problema no sistema usado para proteger sites contra ataques DDoS.

Interrupção do Cloudflare, explicada

Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.

O sistema Bot Management da Cloudflare é um serviço que protege sites contra ataques de bots maliciosos. Estes incluem ataques DDoS que inundam websites com tráfego excessivo, ataques de raspagem de conteúdo que recolhem dados de websites sem autorização e ataques autónomos de preenchimento de credenciais que tentam obter acesso a websites utilizando detalhes de login vazados de outros sites.

Velocidade da luz mashável

Este sistema de gerenciamento de bots inclui um modelo de IA que pontua solicitações de tráfego. Sempre que há uma tentativa de acessar um site protegido pelo Bot Management da Cloudflare, a IA gera uma pontuação para determinar se é provável que tenha sido de um bot. Para fazer isso, a IA considera vários recursos da solicitação, que são mantidos em um “arquivo de recursos”.

O arquivo de recurso é onde o problema ocorreu. Esse arquivo é atualizado a cada cinco minutos para acompanhar a evolução dos comportamentos dos bots e é usado em toda a rede de segurança cibernética da Cloudflare. No entanto, a empresa implementou uma alteração na consulta subjacente que gerou o arquivo, o que fez com que ele duplicasse as informações um grande número de vezes. Isso tornou o arquivo de recurso maior do que o normal, provocando um erro no sistema de gerenciamento de bots.

Como resultado, a tentativa de acessar sites que usam o sistema de gerenciamento de bots da Cloudflare resultou em um código de erro. A Cloudflare afirma que sua rede começou a apresentar falhas significativas cerca de 15 minutos após a implementação da atualização de geração de arquivos de recursos.

A Cloudflare inicialmente suspeitou que a interrupção era um ataque malicioso, principalmente porque sua página de status caiu, apesar de ser independente da infraestrutura da empresa. No entanto, Prince afirmou que isso acabou sendo uma coincidência.

“O problema não foi causado, direta ou indiretamente, por um ataque cibernético ou atividade maliciosa de qualquer tipo”, enfatizou Prince. “Depois que inicialmente suspeitamos erroneamente que os sintomas que víamos eram causados ​​por um ataque DDoS em hiperescala, identificamos corretamente o problema principal e conseguimos interromper a propagação do arquivo de recurso maior do que o esperado e substituí-lo por uma versão anterior do arquivo.”

Quando contatado anteriormente pelo Mashable antes da postagem no blog, um porta-voz da Cloudflare também enfatizou que “não havia nenhuma evidência de que (a interrupção) foi resultado de um ataque ou causada por atividade maliciosa”.

Os serviços da Cloudflare foram amplamente restaurados em três horas e totalmente restaurados após aproximadamente cinco horas. Prince afirmou que a empresa já está planejando medidas para evitar interrupções semelhantes no futuro, incluindo impedir que relatórios de erros sobrecarreguem seus sistemas.

Fuente