Home

Data als het ‘nieuwe goud’: met de opkomst van AI is het een onvermijdelijk cliché

nieuwsbriefBroncode

Broncode Wordt straks net zoveel voor onze data neergelegd als nu voor de bouw van datacenters? Er is in ieder geval een groeiende honger naar, valt op tijdens presentaties door techbedrijven, persconferenties en panels. Want zonder goede data geen goede AI.

„Om problemen met AI te kunnen oplossen hebben we data nodig. We hebben goede data nodig. We hebben toegang nodig”, zei Turan Bulmus van Google, afgelopen week tijdens de ‘AI Connect’, een middag georganiseerd door Google en TechLeap, in de zijlijn van de World Summit AI 2025 in Zaandam.

Nieuwsbrief Broncode

Je leest hier een artikelversie van onze nieuwsbrief NRC Broncode. Wekelijks schrijven wij over technologische ontwikkelingen die op de redactievloer tot opwinding leiden. Inschrijven (voor Plus-abonnees) doe je hier:

Inschrijven voor NRC Broncode

Bulmus heeft net een artikel over astronomie gepubliceerd in het toonaangevende wetenschappelijke tijdschrift Nature Astronomy, hoewel hij geen astronoom is. Dat is hem gelukt doordat hij Gemini (het large language model van Google) allerlei taken heeft laten doen die astronomen tot nu toe handmatig deden, vertelde hij op het podium. Bulmus sprak van de ‘democratisering van wetenschappelijke ontdekkingen’. En herhaalde zijn kernboodschap: „Open toegang tot data is cruciaal.”

Daaraan bleef ik hangen. We weten natuurlijk al heel lang dat data geld waard zijn. En de informatie die je over jezelf deelt een soort valuta zijn waarmee je betaalt als je gebruik maakt van op het oog gratis diensten van grote techbedrijven, zoals Meta, TikTok en Google. Maar de honger naar die data werd altijd een beetje verhuld.

Recent komt de behoefte aan (goede) data juist voortdurend ter sprake. Veel presentaties en persconferenties van techbedrijven volgen ongeveer dit patroon: eerst worden de AI-ontwikkelingen de AI-revolutie genoemd. Dan wordt benadrukt dat die AI-revolutie ons veel goeds zal brengen. Dat wordt bij voorkeur geïllustreerd met een voorbeeld uit de medische wetenschap. Vervolgens kondigen bedrijven forse investeringen aan. De miljoenen en miljarden gaan met name naar de hardware, dus de datacentrums. In de laatste minuten volgt dan dat ze ook data nodig zullen hebben. Veel data. Open data. Is dat een ander woord voor gratis data?

Strategisch voordeel

Een paar maanden geleden deed ik mee aan een online persconferentie van het Duitse softwarebedrijf SAP. De SAP-directie prees in dat gesprek de kwaliteit van de Europese data. Blijkbaar heb je goede data en slechte data en is die in Europa van hoge kwaliteit. Ze zien dat als een strategisch voordeel.

Eindelijk een grondstof die we in Europa wél zelf hebben, was mijn eerste gedachte. Gevolgd door het besef dat ik niet weet wie die data genereert en waar die staat. Vermoedelijk bij grote Amerikaanse bedrijven, maar dat wil ik nu even niet horen.

Als journalist ben ik hier niet neutraal over. Bedrijven zoals mijn werkgever NRC (van Mediahuis) hebben er last van dat wat wij maken, zonder onze instemming wordt gebruikt om grote taalmodellen (LLM’s) te trainen. Waarna die LLM’s ook nog eens ons verdienmodel ondermijnen. Ik ben dus ook een grondstoffenleverancier, die in ieder geval op het eerste gezicht niet profiteert van de be- en verwerking van die grondstof.

Data als bezit

Ik belde erover met Viivi Lähteenoja van MyData, een ngo die het Europese debat over data aanjaagt. Over data praten als grondstof is niet nieuw, benadrukt ze. „Staatsbedrijven in China zetten ‘data’ als bezit op hun balans. En in Amerika zijn de bedrijven die het meeste waard zijn de bedrijven met de meeste data.”

Maar de puur commerciële metafoor van ‘data als grondstof’ doet geen recht aan wat data zijn, zegt Lähteenoja, van huis uit filosoof. Data is ook intellectueel eigendom, data is infrastructuur. Data kun je moeilijk in een vacuüm produceren, dus het zegt ook altijd iets over een relatie en de context, somt ze op.

Europeanen spreken tot nu toe meer over data in termen van privacy, soevereiniteit, persoonsgegevens. Het valt ook haar op dat de Amerikaansere manier van praten, met data als grondstof, nu het Europese discours binnensijpelt. Dat kan wat Lähteenoja betreft leiden tot een te platte versimpeling van wat data zijn.

Het is bovendien onnodig negatief, omdat je daarmee net doet alsof de handel en het ‘bezit’ van data vergelijkbaar zijn met zeg goud of graan. „Twee mensen kunnen data op hetzelfde moment gebruiken en ervan profiteren. Je kunt data vrijwel kosteloos kopiëren en delen.”

Het moet volgens Lähteenoja mogelijk zijn data zowel te beschermen als daarvan te profiteren. Daartoe moeten mensen zelf kunnen besluiten wat ze delen en onder welke voorwaarden, zegt ze. Die voorwaarden kunnen ook een vergoeding zijn, lijkt mij dan. 

NIEUW: Geef dit artikel cadeauAls NRC-abonnee kun je elke maand 10 artikelen cadeau geven aan iemand zonder NRC-abonnement. De ontvanger kan het artikel direct lezen, zonder betaalmuur.

Schrijf je in voor de nieuwsbrief NRC Voorkennis

Economieredacteuren nemen je mee in de discussies die zij op de redactie voeren over actuele ontwikkelingen

Source: NRC

Previous

Next