Verboden Vruchten: De Piratenbibliotheken als Verleiding voor AI-bedrijven

Vandaag de dag lijkt de toekomst van AI-innovatie te hangen aan een zijden draadje, afhankelijk van de uitkomst van een wereldwijde auteursrechtdebat. In de Verenigde Staten hebben rechthebbenden de handen ineengeslagen en voeren ze een strenge strijd tegen AI-bedrijven die auteursrechtelijk beschermd materiaal gebruiken zonder toestemming. Elders in de wereld daarentegen, omarmen landen een meer soepele benadering, waardoor AI-modellen kunnen leren van de immense datastromen die te vinden zijn in zogenaamde 'piratenbibliotheken'. Deze kloof in auteursrecht kan verstrekkende gevolgen hebben.

De Strijd om Auteursrechten en AI

Deze week hebben verschillende groeperingen van rechthebbenden hun aanbevelingen ingediend voor het Special 301 Rapport 2025. Dit jaarlijkse overzicht van de Amerikaanse handelsvertegenwoordiger belicht landen die niet voldoen aan de auteursrechtbeschermingsnormen van de VS. De nadruk ligt vooral op het belang van auteursrechtelijke bescherming met betrekking tot nieuwe AI-technologieën. Ze dringen er bij buitenlandse overheden op aan om zich bewust te zijn van potentiële inbreuken op auteursrechten.

De Chinese overheid wordt bijvoorbeeld bekritiseerd omdat zij overweegt een uitzondering voor tekst- en datamining (TDM) voor AI in te voeren. Andere landen, zoals Japan, hebben al AI-excepties in hun wetgeving opgenomen. Dit doet vragen rijzen, niet alleen voor rechthebbenden, maar ook voor Amerikaanse technologiegiganten.

Piratenbibliotheken en de Amerikaanse Technologie-industrie

In de Verenigde Staten zijn expliciete uitzonderingen voor AI-leren op het gebied van auteursrechten niet aanwezig. Integendeel, verschillende spraakmakende rechtszaken zijn aan de gang waarin technologiebedrijven zoals Meta, OpenAI en Google worden beschuldigd van inbreuk op auteursrechten. Rechthebbenden beschuldigen deze bedrijven ervan hun grote taalmodellen (LLM's) te trainen op inhoud die verkregen is uit ongeautoriseerde bronnen, waaronder piratenbibliotheken. Deze repositories bleken een goudmijn te zijn, gevuld met een overvloed aan tekst, vrij voor het grijpen. Het probleem is echter dat auteursrechthouders nooit toestemming hebben gegeven voor het gebruik ervan.

De rechtszaken zullen uiteindelijk bepalen of de technologiebedrijven aansprakelijk zijn voor inbreuk op auteursrechten of dat 'fair use' een geldige verdediging is. Het kan jaren duren voordat deze zaken zijn beslecht, terwijl piratenbibliotheken zoals Z-Library, LibGen en Anna’s Archive verboden terrein blijven. In landen waar de wetgeving soepeler of minder transparant is, kan dit echter een heel ander verhaal zijn. Dit zou kunnen leiden tot een auteursrechtelijke kloof met potentieel verstrekkende gevolgen.

DeepSeek: De Nieuwe Uitdaging voor Amerikaanse AI

Deze week werden honderden nieuwe artikelen gepubliceerd over het meest recente AI-model van het Chinese bedrijf DeepSeek. Dit model is niet alleen accuraat, maar ook veel goedkoper in gebruik, wat de kosten van AI-ontwikkeling aanzienlijk verlaagd. Deskundigen suggereren dat DeepSeek een bedreiging vormt voor de Amerikaanse dominantie en leiderschap op het gebied van AI. Hoewel vroege reacties vaak overdreven zijn, toont het aan dat AI-ontwikkeling een serieuze, hoogst riskante onderneming is.

Hoewel de innovatie van DeepSeek niet rechtstreeks voortkomt uit schaduwbibliotheken, heeft het bedrijf ze wel als belangrijke input gebruikt. Recente publicaties zijn minder transparant over hun databronnen, maar een eerder onderzoek vermeldt duidelijk een afhankelijkheid van Anna’s Archive. “We hebben 860.000 Engelse en 180.000 Chinese e-books uit Anna’s Archive gereinigd,” aldus een paper van DeepSeek, gepubliceerd in maart.

De Verleidingen van Anna’s Archive

DeepSeek is niet alleen in deze zoektocht. Volgens Anna’s Archive hebben veel AI-teams, waaronder die van grote Amerikaanse en Chinese bedrijven, contact opgenomen met de site voor snelle toegang tot data. Anna’s Archive biedt samenwerking aan AI-bedrijven in ruil voor een genereuze donatie of een databronruil. Terwijl Amerikaanse bedrijven vaak terugschrikken vanwege zorgen over auteursrechten, werken andere teams graag samen met de schaduwbibliotheek. “We hebben ongeveer 20-30 bedrijven/teams van onze volledige dataset voorzien. Het is dezelfde data die op onze torrents-pagina staat, maar zij krijgen toegang tot supersnelle SFTP-servers,” zegt een ‘Archivaris’ van Anna’s Archive.

De Verleidelijkheid van Verboden Vruchten

Ondanks de miljoenen dollar kostende rechtszaken zijn grote Amerikaanse bedrijven niet langer enthousiast om samen te werken met Anna’s Archive. AI-teams in andere landen zijn echter minder terughoudend, wat spanningen met zich meebrengt. De aantrekkingskracht van schaduwbibliotheken voor AI-ontwikkeling is te vergelijken met de bijbelse verboden vrucht. Net zoals Adam en Eva verleid werden door de boom van kennis, worden AI-ontwikkelaars aangetrokken door de enorme hoeveelheden ‘gratis’ data binnen deze ongeautoriseerde collecties.

Schaduwbibliotheken, vol met piratenwerken, bieden de mogelijkheid om krachtige AI-modellen te trainen. Echter, net als de oorspronkelijke verboden vrucht, komt deze toegang met een prijs, althans voor sommigen. In de VS maken auteursrechtwetten en druk van rechthebbenden dat AI-bedrijven huiverig zijn om in deze vrucht te bijten, uit angst voor juridische gevolgen. Deze terughoudendheid kan Amerikaanse AI-ontwikkeling op een “kennisachterstand” zetten.

Innovatie en de AI-Auteursrecht Dilemma

In landen met soepelere auteursrechtelijke uitzonderingen voor AI-training zijn bedrijven vrij om zich te tegoed te doen aan de kennis die door schaduwbibliotheken wordt aangeboden. Dit kan hun AI-capaciteiten versnellen en hen een concurrentievoordeel geven. Dit heeft het potentieel om een “auteursrechtelijke kloof” te creëren, waarbij AI-ontwikkeling in sommige landen vooruitstroomt, gesponsord door gemakkelijk beschikbare data, terwijl andere landen worden tegengehouden door juridische beperkingen.

Zonder waardeoordelen of te veel hyperbool te gebruiken, roept deze situatie complexe vragen op over de balans tussen het beschermen van intellectueel eigendom en het bevorderen van innovatie. Is het eerlijk dat sommige landen een kennisvoordeel hebben vanwege verschillende auteursrechtwetten? Zou dit kunnen leiden tot een wereldwijde AI-kloof, waarbij bepaalde naties het veld domineren door hun toegang tot “verboden” data?

We hebben geen antwoorden op deze vragen. Zoals eerder benadrukt, geloven rechthebbenden dat strengere wereldwijde AI-regelgeving de oplossing is. Als AI-bedrijven toegang willen, kunnen ze deals onderhandelen en ervoor betalen. De schaduwbibliotheek heeft echter begrijpelijkerwijs een heel andere visie. “Dit zou een geopolitiek argument kunnen zijn voor het Westen om de auteursrechtregels te versoepelen. Als het Westen voorop wil blijven lopen in AI, moeten het archiveren en verspreiden van boeken volledig legaal worden gemaakt,” vertelt de ‘Archivaris’ van Anna’s Archive ons.

Conclusie: De Toekomst van AI en Auteursrecht

De toekomst van AI-innovatie staat op het spel, en de verschillende benaderingen van auteursrechten wereldwijd kunnen leiden tot ingrijpende veranderingen in wie er voorop loopt in deze technologie. Terwijl sommige landen profiteren van de toegang tot ongeautoriseerde data, blijven anderen gevangen in een web van juridische restricties. Het is een spannend en onvoorspelbaar speelveld, waar de uitkomst van het auteursrechtdebat niet alleen de toekomst van AI, maar ook de wereldwijde machtsdynamiek kan beïnvloeden. De strijd om kennis en toegang tot informatie is nog maar net begonnen.

Bron: https://www.duken.nl

Door Eater

Februari 1

Aanbevolen reactie

Doe je mee?

Je kunt nu een bericht plaatsen en je later registeren. Als je al een account hebt, kun je je hier aanmelden.
Note: Your post will require moderator approval before it will be visible.

Voeg een reactie toe...

× Je hebt opgemaakte inhoud geplakt. Opmaak verwijderen

Only 75 emoji are allowed.

× Jouw link is automatisch embedded. Toon als een normale link

× Je vorige inhoud is hersteld. Schoon editor

× You cannot paste images directly. Upload or insert images from URL.

Voeg afbeelding uit URL in

Aanmelden

Verboden Vruchten: De Piratenbibliotheken als Verleiding voor AI-bedrijven

Terugkoppeling

Aanbevolen reactie

Doe je mee?

Vergelijkbare bijdragen

OpenAi gratis afbeeldingen met watermerk?

En wie is de eigenaar van de gemaakte Ai afbeelding?

Copilot AI nu met gepersonaliseerde podcasts, real-time visie, automatische acties en chatgeheugen.

Wie zijn er online? 7 leden zijn actief

Mededelingen

Nieuwe handleiding

Zen Browser: Een Modern & leuk alternatief

Laatste nieuws

Hoe een storing kan leiden tot een verbetering voor Windows.

windows 11 en de folder Inetpub?

Internet Archive vs. Muzieklabels

Willekeurig topic

Nu op het forum

Tux

jackjack78

jackjack78

Recente actieve topics

Nieuws

Handleidingen

Forums

Activiteit

Mijn tijdlijn activiteit

Reviews

Eregalerij