De eerste tien jaar was internet

een nogal statische plek.

Je kon online gaan 
en pagina's bekijken

die erop gezet waren

door organisaties,
waar teams dat deden,

of door mensen die voor die tijd

technisch onderlegd waren.

Met de groei van sociale media

en sociale netwerken
in de beginjaren 2000,

veranderde het internet volkomen

tot een plek waar nu
de meeste inhoud van het internet

door gemiddelde gebruikers
wordt geleverd.

Zij het in YouTube-video's of weblogs

of productbesprekingen
of in sociale media.

Het wordt ook 
een steeds interactievere plek,

waar mensen interactief zijn met elkaar.

Ze geven commentaar en delen,

ze lezen niet alleen maar.

Facebook is er niet de enige plek voor,

maar wel de grootste.

De cijfers spreken boekdelen.

Facebook heeft 1,2 miljard
gebruikers per maand.

Dus de helft van alle internetgebruikers
gebruikt Facebook.

Op deze website, net als op andere,

kunnen mensen 
zonder veel technische kennis

een online persona creëren.

Men reageerde daarop

door enorm veel persoonlijke gegevens
online te zetten.

Het gevolg is dat we gedrag, voorkeuren

en demografische gegevens

van honderden miljoenen mensen kennen,

wat ongeëvenaard is in de geschiedenis.

Als computerwetenschapper 
kan ik daardoor modellen maken

die allerlei verborgen kenmerken
over je kunnen voorspellen

waarvan jullie zelf niet eens weten

dat je er informatie over deelt.

Als wetenschappers
gebruiken we dat

om mensen te helpen
bij hun online gedrag.

Maar er zijn ook minder
menslievende toepassingen.

Het probleem is dat gebruikers

de werking van deze technieken 
niet goed snappen.

Zelfs dan nog hebben ze er
niet veel controle over.

Ik heb het vandaag over dingen

die we kunnen doen

om te begrijpen hoe we
vooruit kunnen gaan

en die controle kunnen
teruggeven aan de gebruiker.

Dit is Target, het bedrijf.

Ik heb dat logo niet zomaar 
op de buik gedaan

van deze arme zwangere vrouw.

Misschien heb je het verhaal gelezen

in het tijdschrift Forbes 
over Target, die

een folder stuurde
naar een 15-jarig meisje

met advertenties en tegoedbonnen

voor babyflesjes en luiers en bedjes,

twee weken voor ze
haar ouders vertelde

dat ze zwanger was.

Tja, de vader was nogal overstuur.

Hij zei: "Hoe weet Target

dat dit schoolkind zwanger was

voordat ze het haar ouders vertelde?"

Het bleek dat ze koopgegevens hebben

van honderdduizenden klanten.

Ze berekenen wat ze noemen
een zwangerschaps-score.

Niet óf een vrouw zwanger is

maar wanneer ze uitgeteld is.

Ze berekenden dat niet

aan de hand van bekende dingen

zoals het kopen van 
een bedje of kleertjes,

maar omdat ze bijvoorbeeld
meer vitaminen kocht dan normaal,

of ze kocht een handtas

die groot genoeg is voor luiers.

En elk op zichzelf 
onthult dat niet veel

maar als je deze gedragspatronen

bij duizenden mensen bekijkt,

geeft dit daadwerkelijk 
bepaalde inzichten.

Dat zijn we aan het doen

als we dingen voorspellen
over jou en sociale media.

We kijken naar subtiele 
gedragspatronen die,

als je dat ziet bij miljoenen mensen,

allerlei dingen onthullen.

In mijn lab met mijn collega's,

hebben we bedacht hoe we dingen
aardig kunnen voorspellen

zoals je politieke voorkeur,

je persoonlijkheid, aard,
seksuele voorkeur,

geloof, leeftijd, intelligentie,

en nog veel meer:

in hoeverre je je kennissen vertrouwt

en hoe sterk je relatie met hen is.

We kunnen dat behoorlijk goed.

Het komt niet van wat je zou denken,

uit voor de hand liggende informatie.

Mijn favoriete voorbeeld
is van een onderzoek

dat dit jaar stond

in het tijdschrift PNAS.

Googel maar eens.

Vier pagina's, goed leesbaar.

Ze keken alleen
naar de 'likes' op Facebook.

Dus: dingen die je
leuk vindt op Facebook.

Ze gebruikten dat
om die kenmerken te voorspellen

en nog wat andere dingen.

In hun scriptie noemden ze de vijf 'likes'

die het sterkst wezen
op een hoge intelligentie.

Daartussen stond ook het 'liken'

van krulfriet. 
(Gelach)

Krulfriet is heerlijk,

maar ervan houden
betekent niet per se

dat je slimmer bent dan gemiddeld.

Hoe kan het dan dat
een van de sterkste aanwijzingen

over je intelligentie

het 'liken' van deze pagina is

als de inhoud totaal los staat

van het kenmerk dat voorspeld wordt?

Het blijkt dat we moeten kijken

naar onderliggende theorieën

om te zien hoe we dat kunnen doen.

Een ervan is een sociologische theorie
die homofilie heet.

Je bent bevriend
met mensen zoals jezelf.

Slimme mensen
hebben slimme vrienden.

Als je jong bent 
heb je jonge vrienden.

Dat is al eeuwen ingeburgerd.

We weten ook veel over

hoe informatie wordt verspreid
in netwerken.

Het blijkt dat virale video's

of likes op Facebook en andere informatie

zich op precies dezelfde 
manier verspreiden

als ziektes in een sociaal netwerk.

Dat hebben we lang bestudeerd.

We hebben er goede modellen voor.

Je kan die dingen dus naast elkaar zetten

en zien waarom zulke dingen gebeuren.

Mijn hypothese is 
dat een slim iemand

deze pagina is begonnen,

of dat één van de eersten 
die het 'liketen'

hoog scoorde in die test.

Zij 'liketen' het 
en hun vrienden zagen dat,

en door homofilie weten we
dat hij slimme vrienden zal hebben.

Zo kregen zij het te zien
en sommigen 'liketen' het

en zo kwam het bij hún slimme vrienden,

en verspreidde zich 
via dit netwerk

naar heel veel slimme mensen

zodat aan het einde

het 'liken' van de krulfriet-pagina

intelligentie impliceert.

Niet vanwege de inhoud

maar omdat de handeling van het 'liken'

de bekende eigenschappen teruggeeft

van anderen die dat hebben gedaan.

Dat is nogal ingewikkeld hè?

Het is moeilijk uit te leggen

aan de gemiddelde gebruiker,
en al leg je het uit,

wat kan die gemiddelde gebruiker
eraan doen?

Hoe weet je dat een 'like'

iets impliceert over jou,

dat helemaal los staat
van de inhoud die je 'liket'?

Er is veel macht
die gebruikers niet hebben

om te bepalen
hoe de gegevens worden gebruikt.

Ik zie dat als een probleem
dat steeds groter wordt.

Ik denk dat we een aantal 
richtingen op kunnen

als we de gebruikers
willen laten bepalen

hoe die gegevens worden gebruikt,

want het wordt niet altijd
in hun voordeel gebruikt.

Ik zeg vaak:
als professor zijn me gaat vervelen,

ga ik een bedrijf beginnen

dat eigenschappen voorspelt.

Dingen als teamwork

en of drugs gebruikt,
of je alcoholist bent.

We weten hoe je dat voorspelt.

Ik ga verslagen verkopen

aan HR-firma's en grote ondernemingen

die je willen inhuren.

We kunnen dat allemaal al.

Ik kan dat bedrijf morgen beginnen

en jij zou niet kunnen voorkomen

dat ik jouw gegevens zo gebruik.

Dat lijkt me wel een probleem.

Eén mogelijkheid is

dat we ons richten 
op beleid en wetgeving.

In sommige opzichten zou dat 
het effectiefst zijn

maar het probleem is
om het daadwerkelijk te doen.

Als ik kijk naar de politiek

dan lijkt me het niet waarschijnlijk

dat we vertegenwoordigers krijgen

die zich hier 
grondig over informeren

en dan het intellectueel eigendomsrecht
ingrijpend gaan veranderen,

zodat gebruikers controle krijgen
over hun gegevens.

Je kan het beleidsmatig doen,

als sociale mediabedrijven

jou volledige controle geven 
over je gegevens.

Maar de verdienmodellen
van de meeste sociale mediabedrijven

berusten op het delen of uitbaten
van de gebruikersgegevens.

Ze zeggen van Facebook dat de gebruikers
niet de klant zijn, maar het product.

Hoe krijg je dan een bedrijf zover

dat ze de macht
over hun belangrijkste troef

teruggeven aan de klant?

Het is mogelijk, maar ik denk niet

dat we dat snel 
zullen zien veranderen.

Ik denk dat het op 
een effectievere manier kan

door middel van 
meer wetenschap.

Door wetenschap te bedrijven

konden we de
mechanismes ontwikkelen

om persoonlijke gegevens te berekenen.

Dat is bijna hetzelfde onderzoek

dat we zouden moeten doen

als we mechanismes willen ontwikkelen

die een gebruiker zeggen:

"Dit is het risico
van wat je zojuist deed."

Doordat jij deze Facebook-pagina 'liket',

of deze persoonlijke informatie deelt,

kan ik nu beter voorspellen

of je drugs gebruikt

en of je populair bent op je werk.

Dat kan volgens mij 
beïnvloeden of mensen

wel of niet iets willen delen,

het afgeschermd houden
of het offline houden.

Ook zouden we mensen

in staat kunnen stellen
hun geüploade data te versleutelen

zodat die onzichtbaar
en waardeloos wordt

voor sites als Facebook

of derde partijen die erbij kunnen.

Dan bepaalt degene
die het gepost heeft

welke gebruikers toegang hebben.

Dat is allemaal erg spannend onderzoek

vanuit intellectueel oogpunt,

dus doen wetenschappers het graag.

Dat geeft ons een voordeel
ten opzichte van de juridische optie.

Een probleem dat mensen aandragen

als ik hierover praat is:

"Als mensen die gegevens
voor zichzelf houden,

werken al jouw methodes

om hun eigenschappen 
te voorspellen niet meer."

Ik zeg dan: "Jazeker, 
en dat noem ik succes,

want als wetenschapper

is mijn doel niet om informatie 
over gebruikers te krijgen,

maar om de interactie 
online te verbeteren.

Soms houdt dat in dat
je gegevens van hen achterhaalt,

maar als gebruikers
niet willen dat ik die gebruik,

moeten ze dat recht hebben.

Ik wil dat gebruikers geïnformeerd zijn

en instemmen met de tools 
die we maken.

Deze manier van wetenschap aanmoedigen

en onderzoekers ondersteunen

die wat zeggenschap
teruggeven aan de gebruikers

ten koste van de 
sociale mediabedrijven,

betekent dat we met de 
verbeteringen van deze tools

ook beter onderlegde gebruikers
met betere middelen krijgen.

Ik denk dat we dat allemaal

een vrij ideale weg
voorwaarts vinden.

Dank je wel.

(Applaus)