O Creative Commons, sem fins lucrativos, que liderou o movimento de licença com o qual os fabricantes podem compartilhar seus trabalhos, mantendo os direitos autorais, agora estão se preparando para a era da IA. Na quarta -feira, a organização anunciou o lançamento de um novo projeto, o CC Signals, com o qual os titulares de dados podem ser detalhados como seu conteúdo pode ou não ser reutilizado por máquinas, como no caso de treinamento de modelos de IA.
A idéia é criar um equilíbrio entre a natureza aberta da Internet e a demanda por mais e mais dados para alimentar a IA.
Como o Creative Commons explica em uma postagem no blog, o início contínuo dos dados pode abrir na Internet e as entidades podem ocultar seus sites ou monitá -los com os paywalls, em vez de compartilhar acesso aos seus dados.
O projeto CC Signals, por outro lado, pretende oferecer uma solução legal e técnica que ofereça uma estrutura para compartilhar o conjunto de dados destinado a ser usado entre aqueles que controlam os dados e os que o usam para treinar IA.
A questão aumenta essa ferramenta, porque as empresas estão lutando para alterar suas condições de política e serviço para limitar o treinamento de IA em seus dados ou explicar em que medida eles usarão os dados dos usuários para fins em relação à IA.
Por exemplo, X, por exemplo, fez uma alteração para que terceiros pudessem treinar seus modelos em seus dados públicos e mais tarde revertidos. Reddit usa seu arquivo robots.txt, que se destina a informar os rastreadores da Web automatizados se eles tiverem acesso ao site, para limitar os bots para raspar seus dados para o treinamento da IA. O Cloudflare analisa uma solução que carrega os bots AI para raspar, bem como as ferramentas para confundi -las. E os desenvolvedores de código aberto também criaram ferramentas para desacelerar e desperdiçar os meios dos rastreadores de IA que não respeitavam suas diretrizes “sem rastreamento”.
Em vez disso, o Projeto Sinais CC propõe uma solução diferente: uma série de ferramentas que oferecem uma série de aplicabilidade legal, mas que todos têm um peso ético, semelhante às licenças CC que atualmente cobrem bilhões de obras criativas abertamente licenciadas.
“Os sinais de CC são projetados para apoiar o Commons na era da IA”, disse Anna Tumadóttir, CEO da Creative Commons, em um anúncio. “Assim como os licenciados da CC contribuíram para a construção da Web aberta, acreditamos que os sinais de CC ajudarão a moldar um ecossistema de IA aberto baseado na reciprocidade”.
O projeto só está começando a tomar forma. Os primeiros designs são publicados no site do CC e na página do Github. A organização está procurando ativamente feedback público antes de seus planos para um lançamento alfa (teste antecipado) em novembro de 2025. Também organizará uma série de prefeituras para feedback e perguntas.