Om du minns internets första decennium,

så var det ett väldigt stelt ställe.

Man kunde koppla upp sig, 
besöka webbsidor,

och dessa sattes upp
av antingen organisationer

som hade folk som gjorde det

eller av teknikkunniga individer

vid den tiden.

Och med sociala mediers ökning

och sociala nätverk under tidigt 2000-tal,

förändrades internet
helt och hållet till en plats

där majoriteten av innehållet
som vi använder

läggs upp av vanliga användare,

antingen med Youtube-videor
eller blogginlägg

eller produktrecensioner
eller inlägg på sociala medier.

Det har också blivit
en mycket mer interaktiv plats,

där folk interagerar med varandra,

de kommenterar, de delar,

de läser inte bara.

Facebook är inte den enda plats
där man gör detta

men den är störst

och kan illustrera siffrorna.

Facebook har 1,2 miljarder
användare per månad.

Så halva jordens internetbefolkning

använder Facebook.

De är en webbplats
som tillsammans med andra

har möjliggjort för folk
att skapa sig en onlineidentitet

med väldigt begränsade teknikkunskaper,

och folk svarade med att lägga upp enormt

mycket personlig information online.

Så resultatet är att vi har behovsmässig,

preferensmässig och demografisk data

för hundratals miljoner människor,

vilket inte tidigare funnits i historien.

För en datorforskare som mig
betyder detta att

jag har kunnat bygga modeller

som kan förutse många gömda attribut

om alla er som ni inte ens visste

att ni delar mer er information om.

Som forskare använder vi det för
att förbättra sättet

som folk interagerar på nätet,

men det finns applikationer
som är mindre osjälviska

och det är ett problem
att användarna inte riktigt

förstår dessa tekniker
och hur de fungerar,

och även om de gjorde det,
har de inte så stor kontroll över det.

Det jag vill prata med er om idag

handlar om de saker
vi har en möjlighet att göra,

och sen ge oss några idéer
om hur vi kan röra oss mot

att ge tillbaka kontrollen
till användarna.

Detta är Target, ett företag.

Jag satte inte det emblemet

på denna stackars gravida kvinnans mage.

Du kanske har sett anekdoten
som publicerades i Forbes

där Target skickade ett flygblad

till en 15-årig flicka

med reklam och kuponger

för nappflaskor, blöjor och spjälsängar

två veckor innan hon berättat
för sina föräldrar

att hon var gravid.

Ja, pappan var väldigt upprörd.

Han sa, "Hur listade Target ut

att denna gymnasietjejen var gravid

innan hon berättade för sina föräldrar?".

Det visade sig att de hade köphistoriken

för tiotusentals kvinnor

och beräknat, som de kallar det,
en graviditetspoäng,

vilket inte bara räknar ut
om kvinnan är gravid,

utan också när barnet kommer.

De räknar inte ut det

bara genom att se på det uppenbara,

som att hon köper en spjälsäng
eller barnkläder,

utan saker som att hon köpt mer vitaminer

än vanligt

eller att hon en handväska

som är stor nog att rymma blöjor.

Och för sig själva verkar inte dessa inköp

avslöja särskilt mycket

men det är ett beteendemönster, så när

man sätter det i samma kontext
som tusentals andra,

börjar det visa ett antal insikter.

Det är den sortens saker vi gör

när vi förutser saker om dig
på sociala medier.

Vi letar efter små beteendemönster,

som visar sig bland miljontals människor,

som låter oss få reda på
alla möjliga saker.

I mitt labb och med kollegor,

har vi utvecklat mekanismer som låter oss

förutsäga saker rätt precist

som dina politiska preferenser

din personlighetstyp, kön,
sexuell läggning,

religion, ålder, intelligens,

tillsammans med saker som

hur mycket du litar på dina medmänniskor

och hur starka dessa relationer är.

Vi kan göra allt detta väldigt väl.

Återigen, det kommer inte från vad ni tror

är uppenbara saker.

Mitt favoritexempel från en studie

som publicerades i år

i Proceedings of the National Academies.

Om du googlar så hittar du den.

Den är på fyra sidor och lättläst.

De såg bara

på folks gillningar på Facebook,

så bara de saker man gillar på Facebook,

och använde det
för att förutse alla attribut

tillsammans med andra saker.

Och i deras text listade de
de fem gillningarna

som bäst indikerade hög intelligens.

Bland dessa fanns en sida

om curly fries. (Skratt)

Curly fries är jättegoda,

men att gilla dem
betyder inte nödvändigtvis

att du är smartare än en
genomsnittlig person.

Hur kommer det sig
att en av de starkaste indikationerna

på ens intelligens

är att gilla denna sida

med innehåll som är totalt irrelevant

för attributet som förutses?

Och det visar sig att vi måste se

till en massa bakomliggande teorier

för att se hur vi kan göra detta.

En av dem är en sociologisk teori
som kallas homofili,

vilket betyder att folk är vänner
med folk som liknar dem själva.

Så om du är smart känner du ofta
andra smarta människor

och om du är ung
känner du ofta unga människor

och detta är etablerat sen

hundratals år tillbaka.

Vi vet också mycket om

hur information sprids genom nätverk.

Det visar sig att virala videos

eller Facebookgillningar
eller annan information

sprider som på exakt samma sätt

som sjukdomar sprider sig
genom sociala nätverk.

Detta har vi studerat länge.

Vi har bra modeller för det.

Och man kan sätta ihop saker

och börja se varför såna här saker händer.

Om jag ger er en hypotes,

skulle det vara att en smart kille
startade den här sidan,

eller kanske att en av de första
som gillade sidan

hade fått bra resultat på testet.

Och de gillade det,
deras vänner såg det,

och genom homofili vet vi
att han förmodligen hade smarta vänner,

och så spreds det till dem,
vissa av dem gillade det,

och de hade smarta vänner
och det spreds vidare,

och så fortplanade det sig
genom nätverket

till en samling smarta människor

så till slut blev

gillandet av curly fries-sidan

en indikation på hög intelligens,

inte på grund av innehållet,

utan för att själva gillningen

reflekterar vanliga attribut

hos andra som har gjort det.

Det är rätt komplicerade saker, eller hur?

Det är svårt att sätta sig och förklara

för en typisk användare,
och även om man gör det,

vad kan den medelanvändaren

göra åt det?

Hur vet du att du gillat något

som indikerar ett av dina drag

som är helt irrelevant
för innehållet du gillar?

Det finns mycket makt
som användaren inte har

för att kontrollera hur datan används.

Och jag ser det som
ett stort problem i framtiden.

Jag tror det finns ett par vägar

som borde kolla på

om vi vill ge användarna kontroll

över hur datan används,

för det kommer inte alltid att användas

till deras fördel.

Ett exempel jag ofta ger

är att om jag någonsin tröttnar på
att vara professor

kommer jag starta ett företag

som förutser alla attribut

och saker som hur du jobbar i grupp

och om du är drogmissbrukare
eller alkoholist.

Vi vet hur vi ska förutse allt det.

Och jag ska sälja rapporter

till försäkringsbolag och storföretag

som vill anställa dig.

Vi kan göra det nu.

Jag kan starta företaget imorgon,

och du skulle inte ha någon kontroll

över hur jag använder datan.

Det verkar för mig vara ett stort problem.

En av vägarna vi kan gå

är politikens och lagens väg.

I vissa avseenden tror jag
att det skulle vara det mest effektiva,

men problemet är att vi faktiskt
skulle behöva göra det.

Att se hur vår politiska process fungerar

får mig att tro
att det är högst osannolikt

att vi kommer få en massa folkvalda

att sätta sig ner och lära sig om detta,

och sedan få igenom avgörande förändringar

på immaterialrättens lag i USA

så att användarna får kontroll
över sin data.

Vi kan gå politikens väg,

där företag inom sociala medier säger

"Vet du vad? Du äger din data.

Du har kontroll över hur den används".

Problemet är att intäktsmodellerna

för flertalet företag inom sociala medier

baserar sig på att dela eller utnyttja
användarnas data på något sätt.

Det påstås ibland
om Facebook att användaren

inte är kunden, utan de är varan.

Hur får man ett företag

att ge tillbaka kontrollen
över sin främsta tillgång

till användarna?

Det är möjligt, men jag tror inte att

det kommer ändras särskilt snabbt.

Jag tror att den andra vägen

vi kan gå som är mer effektiv

är en väg med mer vetenskap.

Det är genom vetenskapen
som vi kan utveckla

alla dessa mekanismer för beräkningar

av personliga data från första början.

Undersökningarna är faktiskt
väldigt lika de som vi måste göra

om vi vill utveckla mekanismer

som kan säga till användaren,

"Det här är risken
med den handling du nyss begick".

Genom att gilla den där Facebooksidan

eller genom att dela en del
personlig information,

har du förbättrat
min möjlighet att förutse

om du använder droger eller inte

eller om du kommer bra överens
med folk på jobbet eller inte.

Det tror jag kan påverka

om folk vill dela något,

hålla det för sig själv, eller bara
vara offline helt och hållet.

Vi kan också kika på saker som

att låta folk kryptera uppladdade data,

så det är osynligt och värdelöst

för webbplatser som Facebook

eller tredjepartstjänster
som använder det,

men den utvalda personen
som valts av uppladdaren

kommer att ha möjlighet att se det.

Detta är superspännande forskning

från ett intellektuellt perspektiv,

och forskare kommer vilja göra det.

Det ger oss ett övertag över lagsidan.

Ett av problemen som folk tar upp

när jag pratar om detta är,

"Du vet, om folk börjar hålla
all data privat, så kommer

alla metoder som du utvecklat

som förutser deras karaktärsdrag
att misslyckas."

Då säger jag "Absolut,
och för mig är det en succé",

för som forskare

är mitt mål inte att få tag på
information om användarna,

utan att förbättra interaktionen
mellan folk online.

Och ibland innebär det
att dra slutsatser om dem,

men om användare inte vill ge mig
tillgång till den informationen,

tycker jag att de har rätt att göra det.

Jag vill att användare ska vara
informerade och samtyckande

användare av verktygen som vi utvecklar.

Och jag tycker att vi
genom att uppmuntra denna sorts vetenskap

och att stötta forskare

som vill ge tillbaka kontrollen
till användarna

från företagen inom sociala medier

betyder att vi går framåt
när dessa verktyg utvecklas

och går framåt,

och vi kommer få en utbildad

och kraftfull användarbas,

och jag tror vi är överens om
att det är rätt väg att gå framåt.

Tack.

(Applåder)