Big data er bedre data
-
0:01 - 0:05USAs yndlingstærte er?
-
0:05 - 0:08Publikum: Æble
Kenneth Cukier: Æble. Selvfølgelig er det det. -
0:08 - 0:09Hvordan ved vi det?
-
0:09 - 0:12På grund af data.
-
0:12 - 0:14Man kigger på supermarkedssalget.
-
0:14 - 0:17Man kigger på salget af frosne 30-centimeter tærter
-
0:17 - 0:21og her vinder æble-tærter, uden konkurrence.
-
0:21 - 0:24Størstedelen af salget er æble.
-
0:26 - 0:29Men så startede supermarkederne med at sælge
-
0:29 - 0:32mindre 11-centimeter tærter,
-
0:32 - 0:36og pludselig faldt æbletærter til 4. eller 5. pladsen.
-
0:36 - 0:39Hvorfor? Hvad skete der?
-
0:39 - 0:42Ok, tænk jer om.
-
0:42 - 0:46Når man køber en en 30-centimeter tærte,
-
0:46 - 0:48så er hele familien nødt til at enes,
-
0:48 - 0:52og æble er alles anden-favorit.
-
0:52 - 0:54(Latter)
-
0:54 - 0:57Men når man køber en 11-centimeter
tærte til sig selv, -
0:57 - 1:01så kan man købe den, man helst vil have.
-
1:01 - 1:05Man kan få sit førstevalg.
-
1:05 - 1:07Man har mere data.
-
1:07 - 1:08Man kan se noget,
-
1:08 - 1:09som man ikke kunne se,
-
1:09 - 1:13da man havde mindre mængder af det.
-
1:13 - 1:16Pointen er her, at mere data,
-
1:16 - 1:18ikke bare lader os se mere,
-
1:18 - 1:20mere af det samme, som vi kiggede på.
-
1:20 - 1:23Mere data tillader os at se noget nyt.
-
1:23 - 1:27Det tillader os at se bedre.
-
1:27 - 1:30Det tillader os at se anderledes.
-
1:30 - 1:33I dette tilfælde tillader det os at se,
-
1:33 - 1:36hvad USAs yndlingstærte er:
-
1:36 - 1:39ikke æble.
-
1:39 - 1:42I har formentlig alle hørt om begrebet "big data".
-
1:42 - 1:44I er formentlig endda allerede trætte af
at høre om begrebet -
1:44 - 1:46"big data".
-
1:46 - 1:49Det er sandt, at der er en masse hype
omkring begrebet, -
1:49 - 1:52hvilket er meget uheldigt,
-
1:52 - 1:55fordi "big data" er et ekstremt vigtigt redskab
-
1:55 - 1:59til at udvikle samfundet.
-
1:59 - 2:02Indtil nu har vi analyseret på
mindre mængde data -
2:02 - 2:04og tænk på, hvad det har betydet
-
2:04 - 2:05for at prøve at forstå verdenen,
-
2:05 - 2:07og nu har vi meget mere af det,
-
2:07 - 2:10kan vi forstå mere end nogensinde før.
-
2:10 - 2:12Det vi opnår, når vi har
-
2:12 - 2:15en stor mængde data er,
at vi grundlæggende kan gøre ting, -
2:15 - 2:18som vi ikke kunne, da vi havde
mindre mængder data. -
2:18 - 2:21"Big data" er vigtigt og "big data" er nyt,
-
2:21 - 2:22og når man tænker over det,
-
2:22 - 2:25så er den eneste måde
denne planet kan håndtere -
2:25 - 2:26med dens globale udfordringer -
-
2:26 - 2:30at give folk mad, give dem lægebehandling,
-
2:30 - 2:33levere energi, strøm
-
2:33 - 2:34og sikre sig, at de ikke bliver forbrændte
-
2:34 - 2:36pga. global opvarmning -
-
2:36 - 2:40er pga. den effektive udnyttelse af data.
-
2:40 - 2:44Så hvad er det det nye ved "big data"?
Hvad handler det om? -
2:44 - 2:46For at besvare dette spørgsmål,
så lad os huske på, -
2:46 - 2:48hvordan information så ud,
-
2:48 - 2:51fysisk så ud i fortiden.
-
2:51 - 2:55I 1908 på øen Kreta
-
2:55 - 3:00opdagede arkæologer en skive ler.
-
3:00 - 3:04De daterede den til 2000 år f.kr.,
så den er 4000 år gammel. -
3:04 - 3:06Der er inskriptioner på denne skive,
-
3:06 - 3:07men vi aner faktisk ikke, hvad de betyder.
-
3:07 - 3:09Det er et komplet mysterie, men pointen er,
-
3:09 - 3:11at det var sådan information så ud
-
3:11 - 3:13for 4000 år siden.
-
3:13 - 3:16Det var sådan samfundet opbevarede
-
3:16 - 3:19og overførte information.
-
3:19 - 3:23Samfundet har egentlig ikke ændret sig så meget.
-
3:23 - 3:27Vi gemmer stadig information på skiver,
-
3:27 - 3:30men nu kan vi gemme meget mere information,
-
3:30 - 3:31mere end nogensinde.
-
3:31 - 3:34At søge i det er nemmere.
At kopiere det er nemmere. -
3:34 - 3:38At dele det er nemmere.
At bearbejde det er nemmere. -
3:38 - 3:41Og det vi kan gøre er,
at vi kan genbruge denne information -
3:41 - 3:42til ting vi aldrig havde forestillet os,
-
3:42 - 3:46da vi først indsamlede de data.
-
3:46 - 3:48I den henseende er data gået
-
3:48 - 3:51fra at være fast til at være flydende,
-
3:51 - 3:55fra noget der er stationært og statisk
-
3:55 - 3:59til noget der er flydende og dynamisk.
-
3:59 - 4:03Der er, om man vil,
en likviditet af information. -
4:03 - 4:06Den disk, der blev opdaget på Kreta,
-
4:06 - 4:10der er 4000 år gammel, er tung,
-
4:10 - 4:12den kan ikke opbevare meget information,
-
4:12 - 4:15og informationen kan ikke ændres.
-
4:15 - 4:19Omvendt, så kan alle de filer
-
4:19 - 4:21som Edward Snowden tog
-
4:21 - 4:24fra NSA i USA
-
4:24 - 4:26være på et USB-stik
-
4:26 - 4:29på størrelse med en fingernegl,
-
4:29 - 4:34og de kan blive delt med lysets hastighed.
-
4:34 - 4:37Mere data. Mere.
-
4:39 - 4:41En af grundene til, at vi har så
meget data i verden i dag er, -
4:41 - 4:43at vi indsamler ting,
-
4:43 - 4:46som vi altid har indsamlet information om,
-
4:46 - 4:49men en anden grund hvorfor er, at vi tager ting,
-
4:49 - 4:51der altid har været information,
-
4:51 - 4:54men som aldrig har eksisteret som data
-
4:54 - 4:56og vi omsætter det til data.
-
4:56 - 5:00Tænke f.eks. på spørgsmålet om lokation.
-
5:00 - 5:02Tag f.eks. Martin Luther.
-
5:02 - 5:03Hvis vi ønskede at vide i 1500-tallet,
-
5:03 - 5:06hvor Martin Luther var,
-
5:06 - 5:08ville vi være nødt til at følge ham konstant,
-
5:08 - 5:10eventuelt med en fjer og et blækhus
-
5:10 - 5:12og nedfælde det,
-
5:12 - 5:14men tænk på hvordan det foregår i dag.
-
5:14 - 5:16Man ved at et eller andet sted,
-
5:16 - 5:19formentlig i en telekommunikations-
virksomheds database, -
5:19 - 5:22er der et dataark eller i det mindste
en databaseindgang, -
5:22 - 5:24der optager ens information,
-
5:24 - 5:26om hvor man har opholdt sig til hver en tid.
-
5:26 - 5:27Hvis man har en mobiltelefon
-
5:27 - 5:30og den telefon har GPS,
og selvom det ikke har GPS, -
5:30 - 5:33kan den optage den information.
-
5:33 - 5:37I den henseende, så er ens lokation
blevet omsat til data. -
5:37 - 5:41Tænk f.eks. på emnet kropsholdning,
-
5:41 - 5:42den måde I alle sidder på lige nu,
-
5:42 - 5:45den måde du sidder på,
-
5:45 - 5:47den måde du sidder på,
den måde du sidder på, -
5:47 - 5:49de er alle forskellige og er en
funktion af jeres benlængde, -
5:49 - 5:51jeres ryg og konturerne af jeres ryg
-
5:51 - 5:54og hvis jeg skulle sætte, måske 100 censorer
-
5:54 - 5:56på alle jeres stole lige nu,
-
5:56 - 5:59så kunne jeg skabe et indeks,
der er ganske unikt for jer, -
5:59 - 6:04på en måde som et fingeraftryk,
men det det er ikke jeres finger. -
6:04 - 6:07Så hvad kan vi bruge dette til?
-
6:07 - 6:09Forskere i Tokyo bruger det
-
6:09 - 6:14som en potentiel tyverialarm i biler
-
6:14 - 6:16Ideen er at biltyven sidder bag rattet
-
6:16 - 6:19og forsøger at komme væk,
men bilen genkender, -
6:19 - 6:21at en ikke-godkendt chauffør sidder bag rattet
-
6:21 - 6:23og måske stopper motoren medmindre
-
6:23 - 6:26man indtaster et password i kontrolpanelet
-
6:26 - 6:31for at sige: "Hej, jeg har godkendelse til at køre."
Fantastisk. -
6:31 - 6:33Hvad hvis hver eneste bil i Europa
-
6:33 - 6:35havde denne teknologi indbygget?
-
6:35 - 6:38Hvad kunne vi så gøre?
-
6:38 - 6:40Måske, hvis vi aggregerede data,
-
6:40 - 6:44kunne vi identificere afslørende tegn,
-
6:44 - 6:47der bedst kan forudsige, at en ulykke
-
6:47 - 6:53vil ske indenfor de næste fem sekunder.
-
6:53 - 6:55Og så er det, som vi har omsat til data
-
6:55 - 6:57chauffør-træthed
-
6:57 - 6:59og servicen vil så være,
at når bilen registrerer, -
6:59 - 7:03at personen falder sammen i den postitur
-
7:03 - 7:07vil den automatisk vide det og
sætte en intern alarm i gang, -
7:07 - 7:09der ville få rattet til at vibrere,
indvendigt dytte hornet -
7:09 - 7:11for at sige, "Hallo, vågn op,
-
7:11 - 7:12være mere opmærksom på vejen."
-
7:12 - 7:14Det er den slags ting, som vi kan gøre,
-
7:14 - 7:17når vi får data på flere aspekter af vores liv.
-
7:17 - 7:21Så hvad er værdien af "big data"?
-
7:21 - 7:23Tænk over det.
-
7:23 - 7:25Man har mere information.
-
7:25 - 7:29Man kan gøre ting, man ikke kunne gøre før.
-
7:29 - 7:30Et af de mest imponerende områder,
-
7:30 - 7:32hvor dette koncept forekommer
-
7:32 - 7:35er indenfor området for maskinindlæring.
-
7:35 - 7:39Maskine-indlæring er en kategori
indenfor kunstig intelligens, -
7:39 - 7:42der i sig selv er en kategori
indenfor computervidenskab. -
7:42 - 7:43Den generelle ide er, at i stedet for
-
7:43 - 7:46at instruere en computer i,
hvad den skal gøre, -
7:46 - 7:48vil vil ganske enkelt smide data efter problemet
-
7:48 - 7:51og fortælle computeren,
at den selv skal finde ud af det. -
7:51 - 7:53Og den vil hjælpe en med at forstå det
-
7:53 - 7:57ved at se dets oprindelse.
-
7:57 - 7:59I 1950'erne var der er en datamatiker hos IBM,
-
7:59 - 8:03der hed Arthur Samuel,
som kunne lide at spille dam, -
8:03 - 8:04så han skrev et computer program,
-
8:04 - 8:07så han kunne spille mod computeren.
-
8:07 - 8:10Han spillede. Han vandt.
-
8:10 - 8:12Han spillede. Han vandt.
-
8:12 - 8:15Han spillede. Han vandt,
-
8:15 - 8:17fordi computeren vidste kun,
-
8:17 - 8:19hvad der var et lovligt træk.
-
8:19 - 8:21Arthur Samuel vidste mere end det.
-
8:21 - 8:26Arthur Samuel kendte til strategi.
-
8:26 - 8:28Så han skrev et mindre
under-program ved siden af, -
8:28 - 8:30der kørte i baggrunden og alt det gjorde,
-
8:30 - 8:32var at udregne sandsynligheden for,
-
8:32 - 8:34at en given stilling på
pladen formentlig ville føre -
8:34 - 8:37til et vindende spil i forhold
til et tabende spil -
8:37 - 8:40for hvert træk.
-
8:40 - 8:43Han spiller mod computeren. Han vinder.
-
8:43 - 8:45Han spiller mod computeren. Han vinder.
-
8:45 - 8:49Han spiller mod computeren. Han vinder.
-
8:49 - 8:51Og så lader Arthur Samuel computeren
-
8:51 - 8:54spille mod sig selv.
-
8:54 - 8:57Den spiller mod sig selv.
Den indsamler mere data. -
8:57 - 9:01Den indsamler mere data.
Den øger nøjagtigheden af sine forudsigelser. -
9:01 - 9:03Og så går Arthur Samuel tilbage til computeren
-
9:03 - 9:06og han spiller mod den, og han taber,
-
9:06 - 9:08og han spiller mod den, og han taber,
-
9:08 - 9:10og han spiller mod den, og han taber.
-
9:10 - 9:13Så Arthur Samuel har skabt en maskine,
-
9:13 - 9:19der overgår hans evner for en opgave,
som han har lært den. -
9:19 - 9:21Og denne ide om maskine-indlæring
-
9:21 - 9:25forekommer overalt.
-
9:25 - 9:28Hvordan tror I vi har selv-kørende biler?
-
9:28 - 9:31Er vi bedre stillet som samfund,
-
9:31 - 9:34ved at programmere alle trafikregler
ind i noget software? -
9:34 - 9:36Nej. Hukommelse er billigere. Nej.
-
9:36 - 9:40Algoritmer er hurtigere. Nej.
Processorer er bedre. Nej -
9:40 - 9:43Alle disse ting betyder noget,
men det er ikke derfor. -
9:43 - 9:46Det er fordi vi har ændret på
karakteren af problemet. -
9:46 - 9:48Vi ændrede problemets karakter fra et,
-
9:48 - 9:50hvor vi tydeligt og eksplicit
-
9:50 - 9:53forklarer computeren, hvordan man kører,
-
9:53 - 9:54til et hvor vi siger:
-
9:54 - 9:56Her er en masse data om køretøjet.
-
9:56 - 9:57Regn det selv ud.
-
9:57 - 9:59Regn selv ud, at det er et trafiklys,
-
9:59 - 10:01at det trafiklys er rødt og ikke grønt,
-
10:01 - 10:03at det betyder, at man er nødt til at stoppe
-
10:03 - 10:06og ikke fortsætte fremad."
-
10:06 - 10:08Maskinindlæring er grundlaget
-
10:08 - 10:10for mange af de ting vi foretager os online:
-
10:10 - 10:12søgemaskiner,
-
10:12 - 10:16Amazons personaliserings-algoritme
-
10:16 - 10:18computer-oversættelser
-
10:18 - 10:22stemmegenkendelse-programmer
-
10:22 - 10:25Forskere har for nyligt set på
-
10:25 - 10:28spørgsmålet vedrørende biopsier,
-
10:28 - 10:31kræft-biopsier,
-
10:31 - 10:33og de har bedt en computer
om at identificere -
10:33 - 10:36ved at kigge på data og overlevelsesrater
-
10:36 - 10:40for at afgøre, om celler rent faktisk er
-
10:40 - 10:43kræft eller ej,
-
10:43 - 10:45og ganske rigtigt, når man smider data efter det,
-
10:45 - 10:47gennem en maskinlært algoritme,
-
10:47 - 10:49var maskinen i stand til at identificere
-
10:49 - 10:51de 12 indikatorer, der bedst kan forudsige
-
10:51 - 10:54om denne biopsi af brystkræftceller
-
10:54 - 10:57rent faktisk er kræft
-
10:57 - 11:00Problemet: Den medicinske litteratur
-
11:00 - 11:03kendte kun ni af dem.
-
11:03 - 11:04Tre af disse træk var nogle,
-
11:04 - 11:07som folk ikke behøvede at kigge efter,
-
11:07 - 11:13men som maskinen identificerede.
-
11:13 - 11:19Der er dog også skyggesider ved "big data".
-
11:19 - 11:21Det vil forbedre vores liv,
men der er problemer, -
11:21 - 11:24som vi er nødt til at være bevidste omkring,
-
11:24 - 11:26og den første er den ide,
-
11:26 - 11:29at vi muligvis bliver straffet for forudsigelser,
-
11:29 - 11:33at politiet måske vil benytte
"big data" til deres formål, -
11:33 - 11:35lidt som i "Minority Report".
-
11:35 - 11:38Det er et begreb der kaldes
prædiktivt politiarbejde, -
11:38 - 11:40eller algoritmisk kriminalarbejde,
-
11:40 - 11:42og ideen er,
at hvis vi tager en masse data, -
11:42 - 11:44f.eks. hvor tidligere forbrydelser
har fundet sted, -
11:44 - 11:47så ved vi, hvor vi skal sende patruljer hen.
-
11:47 - 11:49Det giver mening,
men problemet er selvfølgelig, -
11:49 - 11:53at det ikke stopper ved data for lokation,
-
11:53 - 11:56det vil komme helt ned på individ-niveau.
-
11:56 - 11:59Hvorfor benytter vi ikke data om en persons
-
11:59 - 12:01gymnasie-papirer?
-
12:01 - 12:02Måske skulle vi benytte det faktum,
-
12:02 - 12:04om de er arbejdsløse eller ej,
deres kreditværdighed -
12:04 - 12:06deres internet-adfærd,
-
12:06 - 12:08om de er oppe sent om aftenen.
-
12:08 - 12:11Deres Fitbit, når det er i stand til
at identificere biokemi, -
12:11 - 12:15vil afsløre, når de har aggressive tanker.
-
12:15 - 12:17Vi vil muligvis have algoritmer,
der sandsynligt kan forudsige, -
12:17 - 12:19hvad vi skal til at foretage os,
-
12:19 - 12:20og vi vil måske blive holdt ansvarlige,
-
12:20 - 12:23før vi overhovedet handlede.
-
12:23 - 12:25Privatlivet var en central udfordring
-
12:25 - 12:28i æraen for "small data"
-
12:28 - 12:30I "big data"-tidsalderen
-
12:30 - 12:34vil udfordringen være at beskytte den frie vilje
-
12:34 - 12:38moralske valg, menneskelig vilje,
-
12:38 - 12:41menneskets evne til at tage beslutninger.
-
12:43 - 12:45Der er et andet problem:
-
12:45 - 12:48"Big data" vil komme til at stjæle vores jobs.
-
12:48 - 12:52"Big data" og algoritmer vil udfordre
-
12:52 - 12:55administrativt arbejde,
professionelt vidensarbejde -
12:55 - 12:57i det 21. århundrede
-
12:57 - 12:59på samme måde som
automatisering af fabrikker -
12:59 - 13:01og samlebåndsteknikken
-
13:01 - 13:04udfordrede det fysiske
arbejde i det 20. århundrede. -
13:04 - 13:06Tænk på en laborant,
-
13:06 - 13:08der kigger i et mikroskop
-
13:08 - 13:09på en kræft-biopsi
-
13:09 - 13:12og skal afgøre om det er kræft eller ej.
-
13:12 - 13:14Den person gik på universitetet.
-
13:14 - 13:15Den person køber ejendom.
-
13:15 - 13:17Han eller hun stemmer.
-
13:17 - 13:21Han eller hun er en interessent i samfundet.
-
13:21 - 13:22Og den persons arbejde,
-
13:22 - 13:24så vel som en lang række andre
-
13:24 - 13:26beskæftigede som den person,
-
13:26 - 13:29vil opdage, at deres jobs vil ændre sig radikalt
-
13:29 - 13:31eller simpelthen forsvinde.
-
13:31 - 13:33Vi kan godt lide at tænke på,
-
13:33 - 13:36at teknologi skaber jobs over tid
-
13:36 - 13:39efter en kort midlertidig periode med uro,
-
13:39 - 13:41og det skete også for reference-
rammen som vi alle -
13:41 - 13:43har, den industrielle revolution,
-
13:43 - 13:46fordi det er præcis det, der skete.
-
13:46 - 13:48Men vi glemte noget i den analyse:
-
13:48 - 13:50Der er nogen kategorier af jobs
-
13:50 - 13:53der simpelthen forsvinder og
aldrig kommer tilbage. -
13:53 - 13:55Den industrielle revolution var ikke særlig god,
-
13:55 - 13:59hvis man var en hest.
-
13:59 - 14:01Så vi er nødt til at være meget forsigtige
-
14:01 - 14:05og tage "big data" og justere det til vores behov,
-
14:05 - 14:08vores meget menneskelige behov.
-
14:08 - 14:10Vi er nødt til at være herre over denne teknologi
-
14:10 - 14:12ikke dens tjener.
-
14:12 - 14:15Vi står lige på tærsklen til "big data"-æraen
-
14:15 - 14:18og helt ærligt, så er vi ikke særligt gode til
-
14:18 - 14:22at behandle alle disse data,
som vi nu kan indsamle. -
14:22 - 14:25Det er ikke kun et problem for NSA.
-
14:25 - 14:28Forretningsverdenen indsamler
mange data og de bruger det også dårligt -
14:28 - 14:32og vi er nødt til at blive bedre til dette
og det vil tage tid. -
14:32 - 14:34Det er lidt ligesom udfordringen som
-
14:34 - 14:36stenaldermanden havde med ild.
-
14:36 - 14:38Det er et værktøj, men det er et værktøj der,
-
14:38 - 14:42medmindre vi er forsigtige, vil brænde os.
-
14:44 - 14:47"Big data" vil forandre, hvordan vi bor,
-
14:47 - 14:50hvordan vi arbejder og hvordan vi tænker
-
14:50 - 14:52Det vil hjælpe os med at styre vores karriere
-
14:52 - 14:55og leve et liv med tilfredsstillelse, håb
-
14:55 - 14:58glæde og sundhed
-
14:58 - 15:02men tidligere har vi ofte set på
informationsteknologi -
15:02 - 15:04og vores øjne har kun set T'et
-
15:04 - 15:06teknologien, hardwaren,
-
15:06 - 15:08fordi den var fysisk.
-
15:08 - 15:11Vi er nu nødt til at ændre vores syn på I'et
-
15:11 - 15:12informationen,
-
15:12 - 15:14der er mindre åbenlys,
-
15:14 - 15:18men på nogle områder meget vigtigere.
-
15:18 - 15:21Menneskeheden kan endelig
lære fra den information, -
15:21 - 15:24som den indsamler,
-
15:24 - 15:26som del af en tidløs stræben efter
-
15:26 - 15:29at forstå verden og vores rolle i den,
-
15:29 - 15:34og det er derfor, at "big data" betyder så meget.
-
15:34 - 15:38(Klapsalver)
- Title:
- Big data er bedre data
- Speaker:
- Kenneth Cukier
- Description:
-
Selvkørende biler var bare starten. Hvad er fremtiden for big data-drevet teknologi og design? I en spændende videnskabs-tale, Kenneth Cukier ser på, hvad der er det næste indenfor maskin-indlæring og menneskelig viden.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Anders Finn Jørgensen edited Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen edited Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen edited Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen approved Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen edited Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen edited Danish subtitles for Big data is better data | ||
Anders Finn Jørgensen accepted Danish subtitles for Big data is better data | ||
Simon Bugge Jensen edited Danish subtitles for Big data is better data |