Strava declara guerra aos scrapers antes do IPO

As empresas de IA tornaram-se entidades ávidas por dados, pois seus modelos exigem conjuntos de dados cada vez maiores para treinamento. Para atender a essa necessidade, muitas startups de IA desafiam convenções de longa data da Internet – como respeitar os arquivos robots.txt, que sinalizam aos rastreadores automatizados quais partes de um site estão fora dos limites – e coletam dados de forma agressiva. Isto forçou os websites a restringir o acesso aos seus dados e, em alguns casos, a fechar acordos de licenciamento com empresas de IA. A empresa de fitness e gestão social Strava está caminhando nessa direção, restringindo seu site e introduzindo taxas para acesso do desenvolvedor.

Para impedir a raspagem, a empresa está aumentando a segurança em seu site e agora permitirá apenas que usuários autenticados visualizem determinados dados. Anteriormente, os usuários podiam ver detalhes como perfis públicos e listas de academias de ginástica sem fazer login. A empresa está colocando todos esses dados sob autenticação para protegê-los contra captura não autorizada de IA.

No que diz respeito à API, os desenvolvedores poderiam começar a criar aplicativos no Strava por meio de um programa de acesso gratuito e escalonado – solicitando primeiro o acesso básico e depois solicitando mais à medida que seu aplicativo crescia. Agora, a empresa está adicionando uma taxa fixa de US$ 11,99 por mês para todos os desenvolvedores, embora tenha observado que o preço pode variar de acordo com a região.

Strava disse que sua comunidade de desenvolvedores cresceu de 185 mil membros no ano passado para 241 mil este ano, e a empresa planeja continuar a apoiá-los. Como parte disso, o Strava também planeja adicionar suporte ao Model Context Protocol (MCP), um padrão emergente que permite que assistentes e aplicativos de IA acessem dados externos de forma estruturada, dando ao Strava mais controle sobre exatamente o que é compartilhado e como.

A empresa também está planejando retirar alguns endpoints de API – pontos de acesso discretos que permitem que aplicativos externos extraiam dados específicos, como detalhes de clubes – para proteger os dados do usuário. O Strava já havia reforçado as regras da API em 2024, proibindo seu uso para treinamento de IA e limitando a exibição de dados de outros usuários por aplicativos de terceiros. Essas mudanças geraram reação de desenvolvedores que disseram que seus aplicativos seriam severamente afetados.

Embora alguns desenvolvedores possam aceitar o pagamento de uma taxa de assinatura, a desativação de determinados endpoints de API ainda pode afetar os aplicativos dependentes. O Strava está dando aos desenvolvedores um período de carência de 90 dias antes de fazer essas alterações.

Em entrevista ao TechCrunch, Michael Martin, CEO do Strava, disse que a raspagem descontrolada de IA pode ser a sentença de morte da Internet pública.

“As empresas de IA estão eliminando implacavelmente sites públicos, dada a sua necessidade infinita de dados de treinamento, o que está degradando o desempenho geral do site”, disse Martin. Tivemos vários casos nos últimos meses em que o desempenho foi diminuído e, em alguns casos, prejudicado. Além de explorar sites públicos, eles também estão tentando usar nossa API para obter acesso aos nossos dados, ignorando os termos da API.”

Ele observou que o Strava recusou propostas dos principais laboratórios de IA em busca de acordos de licenciamento de dados. Ele destacou especificamente a Perplexity, dizendo que a startup de pesquisa de IA encaminhou sua coleta por meio de serviços agregadores para ocultar sua origem, apesar de ter sido rejeitada. Isso é consistente com o fato de Perplexity ter sido acusado de comportamento semelhante em outros lugares no passado.

Martin também sinalizou a sobrecarga do servidor causada por aplicativos mal construídos com código de vibração, cujas chamadas de API são muitas vezes estruturadas de forma ineficiente e geram uma carga desproporcional nos sistemas do Strava. É um padrão: quando a Meta baniu chatbots de terceiros do WhatsApp no ​​ano passado, apresentou um argumento semelhante sobre a sobrecarga do sistema.

O momento provavelmente não é coincidência. A Strava solicitou confidencialmente um IPO no início deste ano, e sua ação para proteger seus dados pode ter como objetivo sinalizar a disciplina de dados para possíveis investidores. A comparação com a repressão do Reddit ao acesso à API em 2024 é algo que Martin foi rápido em abordar. Ao contrário do Reddit, que fixa o preço do acesso à API pelo número de chamadas (tornando-o inacessível para muitos desenvolvedores de aplicativos), o Strava aposta que uma taxa fixa mantém o ecossistema do desenvolvedor intacto.

“Queremos que os usuários sintam que são donos de seus dados e se sintam confortáveis ​​com a forma como os controlamos e protegemos. Mas queremos que os desenvolvedores continuem a florescer e a crescer”, disse Martin.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

Fuente