De eerste tien jaar was internet
een nogal statische plek.
Je kon online gaan
en pagina's bekijken
die erop gezet waren
door organisaties,
waar teams dat deden,
of door mensen die voor die tijd
technisch onderlegd waren.
Met de groei van sociale media
en sociale netwerken
in de beginjaren 2000,
veranderde het internet volkomen
tot een plek waar nu
de meeste inhoud van het internet
door gemiddelde gebruikers
wordt geleverd.
Zij het in YouTube-video's of weblogs
of productbesprekingen
of in sociale media.
Het wordt ook
een steeds interactievere plek,
waar mensen interactief zijn met elkaar.
Ze geven commentaar en delen,
ze lezen niet alleen maar.
Facebook is er niet de enige plek voor,
maar wel de grootste.
De cijfers spreken boekdelen.
Facebook heeft 1,2 miljard
gebruikers per maand.
Dus de helft van alle internetgebruikers
gebruikt Facebook.
Op deze website, net als op andere,
kunnen mensen
zonder veel technische kennis
een online persona creëren.
Men reageerde daarop
door enorm veel persoonlijke gegevens
online te zetten.
Het gevolg is dat we gedrag, voorkeuren
en demografische gegevens
van honderden miljoenen mensen kennen,
wat ongeëvenaard is in de geschiedenis.
Als computerwetenschapper
kan ik daardoor modellen maken
die allerlei verborgen kenmerken
over je kunnen voorspellen
waarvan jullie zelf niet eens weten
dat je er informatie over deelt.
Als wetenschappers
gebruiken we dat
om mensen te helpen
bij hun online gedrag.
Maar er zijn ook minder
menslievende toepassingen.
Het probleem is dat gebruikers
de werking van deze technieken
niet goed snappen.
Zelfs dan nog hebben ze er
niet veel controle over.
Ik heb het vandaag over dingen
die we kunnen doen
om te begrijpen hoe we
vooruit kunnen gaan
en die controle kunnen
teruggeven aan de gebruiker.
Dit is Target, het bedrijf.
Ik heb dat logo niet zomaar
op de buik gedaan
van deze arme zwangere vrouw.
Misschien heb je het verhaal gelezen
in het tijdschrift Forbes
over Target, die
een folder stuurde
naar een 15-jarig meisje
met advertenties en tegoedbonnen
voor babyflesjes en luiers en bedjes,
twee weken voor ze
haar ouders vertelde
dat ze zwanger was.
Tja, de vader was nogal overstuur.
Hij zei: "Hoe weet Target
dat dit schoolkind zwanger was
voordat ze het haar ouders vertelde?"
Het bleek dat ze koopgegevens hebben
van honderdduizenden klanten.
Ze berekenen wat ze noemen
een zwangerschaps-score.
Niet óf een vrouw zwanger is
maar wanneer ze uitgeteld is.
Ze berekenden dat niet
aan de hand van bekende dingen
zoals het kopen van
een bedje of kleertjes,
maar omdat ze bijvoorbeeld
meer vitaminen kocht dan normaal,
of ze kocht een handtas
die groot genoeg is voor luiers.
En elk op zichzelf
onthult dat niet veel
maar als je deze gedragspatronen
bij duizenden mensen bekijkt,
geeft dit daadwerkelijk
bepaalde inzichten.
Dat zijn we aan het doen
als we dingen voorspellen
over jou en sociale media.
We kijken naar subtiele
gedragspatronen die,
als je dat ziet bij miljoenen mensen,
allerlei dingen onthullen.
In mijn lab met mijn collega's,
hebben we bedacht hoe we dingen
aardig kunnen voorspellen
zoals je politieke voorkeur,
je persoonlijkheid, aard,
seksuele voorkeur,
geloof, leeftijd, intelligentie,
en nog veel meer:
in hoeverre je je kennissen vertrouwt
en hoe sterk je relatie met hen is.
We kunnen dat behoorlijk goed.
Het komt niet van wat je zou denken,
uit voor de hand liggende informatie.
Mijn favoriete voorbeeld
is van een onderzoek
dat dit jaar stond
in het tijdschrift PNAS.
Googel maar eens.
Vier pagina's, goed leesbaar.
Ze keken alleen
naar de 'likes' op Facebook.
Dus: dingen die je
leuk vindt op Facebook.
Ze gebruikten dat
om die kenmerken te voorspellen
en nog wat andere dingen.
In hun scriptie noemden ze de vijf 'likes'
die het sterkst wezen
op een hoge intelligentie.
Daartussen stond ook het 'liken'
van krulfriet.
(Gelach)
Krulfriet is heerlijk,
maar ervan houden
betekent niet per se
dat je slimmer bent dan gemiddeld.
Hoe kan het dan dat
een van de sterkste aanwijzingen
over je intelligentie
het 'liken' van deze pagina is
als de inhoud totaal los staat
van het kenmerk dat voorspeld wordt?
Het blijkt dat we moeten kijken
naar onderliggende theorieën
om te zien hoe we dat kunnen doen.
Een ervan is een sociologische theorie
die homofilie heet.
Je bent bevriend
met mensen zoals jezelf.
Slimme mensen
hebben slimme vrienden.
Als je jong bent
heb je jonge vrienden.
Dat is al eeuwen ingeburgerd.
We weten ook veel over
hoe informatie wordt verspreid
in netwerken.
Het blijkt dat virale video's
of likes op Facebook en andere informatie
zich op precies dezelfde
manier verspreiden
als ziektes in een sociaal netwerk.
Dat hebben we lang bestudeerd.
We hebben er goede modellen voor.
Je kan die dingen dus naast elkaar zetten
en zien waarom zulke dingen gebeuren.
Mijn hypothese is
dat een slim iemand
deze pagina is begonnen,
of dat één van de eersten
die het 'liketen'
hoog scoorde in die test.
Zij 'liketen' het
en hun vrienden zagen dat,
en door homofilie weten we
dat hij slimme vrienden zal hebben.
Zo kregen zij het te zien
en sommigen 'liketen' het
en zo kwam het bij hún slimme vrienden,
en verspreidde zich
via dit netwerk
naar heel veel slimme mensen
zodat aan het einde
het 'liken' van de krulfriet-pagina
intelligentie impliceert.
Niet vanwege de inhoud
maar omdat de handeling van het 'liken'
de bekende eigenschappen teruggeeft
van anderen die dat hebben gedaan.
Dat is nogal ingewikkeld hè?
Het is moeilijk uit te leggen
aan de gemiddelde gebruiker,
en al leg je het uit,
wat kan die gemiddelde gebruiker
eraan doen?
Hoe weet je dat een 'like'
iets impliceert over jou,
dat helemaal los staat
van de inhoud die je 'liket'?
Er is veel macht
die gebruikers niet hebben
om te bepalen
hoe de gegevens worden gebruikt.
Ik zie dat als een probleem
dat steeds groter wordt.
Ik denk dat we een aantal
richtingen op kunnen
als we de gebruikers
willen laten bepalen
hoe die gegevens worden gebruikt,
want het wordt niet altijd
in hun voordeel gebruikt.
Ik zeg vaak:
als professor zijn me gaat vervelen,
ga ik een bedrijf beginnen
dat eigenschappen voorspelt.
Dingen als teamwork
en of drugs gebruikt,
of je alcoholist bent.
We weten hoe je dat voorspelt.
Ik ga verslagen verkopen
aan HR-firma's en grote ondernemingen
die je willen inhuren.
We kunnen dat allemaal al.
Ik kan dat bedrijf morgen beginnen
en jij zou niet kunnen voorkomen
dat ik jouw gegevens zo gebruik.
Dat lijkt me wel een probleem.
Eén mogelijkheid is
dat we ons richten
op beleid en wetgeving.
In sommige opzichten zou dat
het effectiefst zijn
maar het probleem is
om het daadwerkelijk te doen.
Als ik kijk naar de politiek
dan lijkt me het niet waarschijnlijk
dat we vertegenwoordigers krijgen
die zich hier
grondig over informeren
en dan het intellectueel eigendomsrecht
ingrijpend gaan veranderen,
zodat gebruikers controle krijgen
over hun gegevens.
Je kan het beleidsmatig doen,
als sociale mediabedrijven
jou volledige controle geven
over je gegevens.
Maar de verdienmodellen
van de meeste sociale mediabedrijven
berusten op het delen of uitbaten
van de gebruikersgegevens.
Ze zeggen van Facebook dat de gebruikers
niet de klant zijn, maar het product.
Hoe krijg je dan een bedrijf zover
dat ze de macht
over hun belangrijkste troef
teruggeven aan de klant?
Het is mogelijk, maar ik denk niet
dat we dat snel
zullen zien veranderen.
Ik denk dat het op
een effectievere manier kan
door middel van
meer wetenschap.
Door wetenschap te bedrijven
konden we de
mechanismes ontwikkelen
om persoonlijke gegevens te berekenen.
Dat is bijna hetzelfde onderzoek
dat we zouden moeten doen
als we mechanismes willen ontwikkelen
die een gebruiker zeggen:
"Dit is het risico
van wat je zojuist deed."
Doordat jij deze Facebook-pagina 'liket',
of deze persoonlijke informatie deelt,
kan ik nu beter voorspellen
of je drugs gebruikt
en of je populair bent op je werk.
Dat kan volgens mij
beïnvloeden of mensen
wel of niet iets willen delen,
het afgeschermd houden
of het offline houden.
Ook zouden we mensen
in staat kunnen stellen
hun geüploade data te versleutelen
zodat die onzichtbaar
en waardeloos wordt
voor sites als Facebook
of derde partijen die erbij kunnen.
Dan bepaalt degene
die het gepost heeft
welke gebruikers toegang hebben.
Dat is allemaal erg spannend onderzoek
vanuit intellectueel oogpunt,
dus doen wetenschappers het graag.
Dat geeft ons een voordeel
ten opzichte van de juridische optie.
Een probleem dat mensen aandragen
als ik hierover praat is:
"Als mensen die gegevens
voor zichzelf houden,
werken al jouw methodes
om hun eigenschappen
te voorspellen niet meer."
Ik zeg dan: "Jazeker,
en dat noem ik succes,
want als wetenschapper
is mijn doel niet om informatie
over gebruikers te krijgen,
maar om de interactie
online te verbeteren.
Soms houdt dat in dat
je gegevens van hen achterhaalt,
maar als gebruikers
niet willen dat ik die gebruik,
moeten ze dat recht hebben.
Ik wil dat gebruikers geïnformeerd zijn
en instemmen met de tools
die we maken.
Deze manier van wetenschap aanmoedigen
en onderzoekers ondersteunen
die wat zeggenschap
teruggeven aan de gebruikers
ten koste van de
sociale mediabedrijven,
betekent dat we met de
verbeteringen van deze tools
ook beter onderlegde gebruikers
met betere middelen krijgen.
Ik denk dat we dat allemaal
een vrij ideale weg
voorwaarts vinden.
Dank je wel.
(Applaus)