Big data är bättre data
-
0:01 - 0:04Vilken är USA:s favoritpaj?
-
0:05 - 0:08Publiken: Äpple.
Kenneth Cukier: Äpple såklart. -
0:08 - 0:09Hur vet vi det?
-
0:09 - 0:12Tack vare data.
-
0:12 - 0:14Om man ser på stormarknadsförsäljning.
-
0:14 - 0:18Om man ser på säljsiffror
för 30 centimeters frysta pajer -
0:18 - 0:21så vinner äpple utan konkurrens.
-
0:21 - 0:24Majoriteten av försäljningen är äpple.
-
0:27 - 0:31Men sen började stormarknader
sälja mindre, 11 cm:s pajer, -
0:31 - 0:33och plötsligt föll äpple
-
0:33 - 0:35till fjärde eller femte plats.
-
0:36 - 0:38Varför? Vad hände?
-
0:39 - 0:41OK, fundera på det.
-
0:42 - 0:45När man köper en 30 centimeters paj
-
0:46 - 0:48så behöver hela familjen samsas,
-
0:48 - 0:52och äpple är då allas andrahandsval.
-
0:52 - 0:54(Skratt)
-
0:54 - 0:57Men när man köper
en enskild 11 centimeters paj -
0:57 - 1:01så kan man köpa den man vill ha.
-
1:01 - 1:04Du kan få ditt förstahandsval.
-
1:05 - 1:07Vi har mer data
-
1:07 - 1:09Vi kan se något som vi inte kunde se
-
1:09 - 1:12när vi hade mindre mängder av det.
-
1:13 - 1:16Poängen här är att mer data
-
1:16 - 1:18inte bara låter oss se mera,
-
1:18 - 1:20mer av samma sak vi tittar på.
-
1:20 - 1:23Mer data låter oss att se nytt.
-
1:23 - 1:27Det låter oss att se bättre.
-
1:27 - 1:30Det låter oss att se annorlunda.
-
1:30 - 1:33I detta fall, så låter det oss att se
-
1:33 - 1:36vad USA:s favoritpaj är:
-
1:36 - 1:38inte äpple.
-
1:39 - 1:42Ni har troligen hört termen big data.
-
1:42 - 1:46Ni är troligen trötta på
att höra termen big data. -
1:46 - 1:49Det är sant att termen har blivit trendig
-
1:49 - 1:51och det är väldigt synd,
-
1:52 - 1:55för big data är
ett väldigt viktigt verktyg -
1:55 - 1:58för samhällsutvecklingen.
-
1:59 - 2:02Tidigare har vi tittat på mindre data
-
2:02 - 2:05och funderat på vad den betyder
för att försöka förstå världen, -
2:05 - 2:07och nu har vi mycket mer av det,
-
2:07 - 2:10mer än vi någonsin hade innan.
-
2:10 - 2:12Vad vi upptäcker när vi har
-
2:12 - 2:15en stor mängd med data,
är att vi kan i grunden göra saker -
2:15 - 2:18som inte gick när vi hade mindre mängder.
-
2:18 - 2:21Big data är viktigt
och big data är nytt, -
2:21 - 2:22och när du tänker på det
-
2:22 - 2:25är det enda sättet som planeten
kommer hantera -
2:25 - 2:26sina globala utmaningar på -
-
2:26 - 2:30att ge människor mat,
förse dem med sjukvård, -
2:30 - 2:33förse dem med energi, elektricitet,
-
2:33 - 2:36se till att dom inte blir knaperstekta
på grund av global uppvärmning - -
2:36 - 2:39är med hjälp av effektiv dataanvändning.
-
2:40 - 2:42Så vad är nytt med big data?
-
2:42 - 2:44Vad är den stora grejen?
-
2:44 - 2:46För att besvara frågan, fundera på
-
2:46 - 2:49hur information såg ut fysiskt,
-
2:49 - 2:51hur den såg ut förr i tiden.
-
2:52 - 2:551908, på ön Kreta
-
2:55 - 3:00hittade arkeologer en lerskiva.
-
3:00 - 3:04Dom daterade skivan till 2 000 år f.Kr.,
så den är 4 000 år gammal. -
3:04 - 3:07Det finns inskriptioner på skivan,
men vi vet inte vad de betyder. -
3:07 - 3:09Det är ett mysterium, men poängen är
-
3:09 - 3:11att så här brukade information se ut
-
3:11 - 3:13för 4 000 år sedan.
-
3:13 - 3:16Detta är hur samhället lagrade
-
3:16 - 3:18och överförde information.
-
3:19 - 3:23Samhället har inte utvecklats så mycket.
-
3:23 - 3:26Vi lagrar fortfarande
information på skivor, -
3:27 - 3:30men nu kan vi lagra
väldigt mycket mera information, -
3:30 - 3:31mer än någonsin tidigare.
-
3:31 - 3:34Det är lättare att söka och kopiera den.
-
3:34 - 3:38Det är lättare att dela och bearbeta den.
-
3:38 - 3:41Och vi kan återanvända informationen
-
3:41 - 3:42inom områden vi inte ens drömt om
-
3:42 - 3:45när vi först samlade informationen.
-
3:46 - 3:48I detta avseende så har data gått
-
3:48 - 3:51från ett lager till ett flöde,
-
3:51 - 3:55från att vara stationärt och statiskt
-
3:55 - 3:59till att vara flytande och dynamiskt.
-
3:59 - 4:03Man kan säga att information
har blivit mer flytande. -
4:03 - 4:06Skivan som upptäcktes nära Kreta,
-
4:06 - 4:09som är 4 000 år gammal, är tung,
-
4:10 - 4:12den lagrar inte så mycket information,
-
4:12 - 4:15och den informationen är oföränderlig.
-
4:15 - 4:19Som kontrast kunde alla filerna
-
4:19 - 4:21som Edward Snowden tog
-
4:21 - 4:24från National Security Agency i USA
-
4:24 - 4:26få plats på en minnessticka
-
4:26 - 4:29lika stor som en fingernagel
-
4:29 - 4:32och den kan delas med ljusets hastighet.
-
4:34 - 4:38Mer data, mer.
-
4:38 - 4:41En orsak till att vi har
så mycket data i världen i dag -
4:41 - 4:43är att vi samlar på saker
-
4:43 - 4:46som vi alltid samlat information om
-
4:46 - 4:49men en annan anledning är att vi tar saker
-
4:49 - 4:51som alltid haft mycket information
-
4:51 - 4:54men som aldrig har gjorts i ett dataformat
-
4:54 - 4:56och vi lägger till det bland våra data.
-
4:56 - 5:00Tänk till exempel på frågan om plats.
-
5:00 - 5:02Ta till exempel Martin Luther.
-
5:02 - 5:03Om vi på 1500-talet ville veta
-
5:03 - 5:06var Martin Luther var,
-
5:06 - 5:08så behöver vi följa efter honom hela tiden
-
5:08 - 5:12kanske med en fjäderpenna
och ett bläckhorn, för att skriva ner det, -
5:12 - 5:14men tänk nu på hur det ser ut idag.
-
5:14 - 5:16Du vet att någonstans,
-
5:16 - 5:19antagligen i en teleoperatörs databas,
-
5:19 - 5:22finns det ett kalkylblad,
eller minst en databaspost -
5:22 - 5:24som sparar din information
-
5:24 - 5:26om var du varit hela tiden.
-
5:26 - 5:27Om du har en mobiltelefon
-
5:27 - 5:30och mobiltelefonen har GPS,
men även om den inte har GPS, -
5:30 - 5:33så kan den spara din information.
-
5:33 - 5:36I detta avseende har plats
blivit digitaliserat. -
5:37 - 5:41Tänk till exempel på frågan
om kroppshållning, -
5:41 - 5:43det sätt som ni alla sitter på just nu,
-
5:43 - 5:45hur du sitter,
-
5:45 - 5:47hur du sitter, hur du sitter.
-
5:47 - 5:49Alla sätt är olika
och de beror på din benlängd -
5:49 - 5:51och din rygg och din ryggs konturer,
-
5:51 - 5:54och om jag skulle sätta sensorer,
kanske 100 sensorer -
5:54 - 5:56på alla era stolar just nu,
-
5:56 - 5:59så skulle jag kunna skapa ett index
som är ganska unikt för dig, -
5:59 - 6:03ungefär som ett fingeravtryck,
men som inte är ditt finger. -
6:04 - 6:06Så vad kan vi göra med detta?
-
6:07 - 6:09Forskare i Tokyo använder det
-
6:09 - 6:13som ett potentiellt stöldskydd till bilar.
-
6:14 - 6:16Idén är att biltjuven sitter bakom ratten,
-
6:16 - 6:19försöker köra iväg, men bilen känner igen
-
6:19 - 6:21att en icke-godkänd förare
sitter bakom ratten, -
6:21 - 6:23kanske stannar motorn, fram tills du
-
6:23 - 6:26skriver in ett lösenord
på instrumentbrädan -
6:26 - 6:29för att säga: "Hej,
jag har rätt att köra". -
6:29 - 6:30Bra.
-
6:31 - 6:33Tänk om varje bil i Europa
-
6:33 - 6:35hade den här tekniken?
-
6:35 - 6:37Vad skulle vi kunna göra då?
-
6:38 - 6:40Om vi kombinerade all data
-
6:40 - 6:44kanske vi kunde
identifiera varningstecknen -
6:44 - 6:47som bäst förutsäger att en bilolycka
-
6:47 - 6:52kommer att ske inom fem sekunder.
-
6:53 - 6:57Och vad vi då har fastställt
är förartrötthet, -
6:57 - 6:59och tjänsten skulle handla om
att bilen känner av -
6:59 - 7:02att personen tappar sin hållning,
-
7:03 - 7:06automatiskt vet och ställer in
ett internt alarm -
7:06 - 7:09som får ratten att vibrera
och tutar inuti bilen för att säga, -
7:09 - 7:12"Hallå, vakna upp,
fokusera mera på vägen." -
7:12 - 7:14Detta är den typ av saker vi kan göra
-
7:14 - 7:17när vi digitaliserar
fler delar av våra liv. -
7:17 - 7:20Så vad är värdet av big data?
-
7:21 - 7:23Tja, tänk på det.
-
7:23 - 7:25Vi har mer information.
-
7:25 - 7:28Vi kan göra saker som inte gick tidigare.
-
7:29 - 7:32Ett av det mest imponerande ställen
där detta begrepp vinner mark -
7:32 - 7:35är inom området för maskininlärning.
-
7:35 - 7:39Maskininlärning är den gren
av artificiell intelligens, -
7:39 - 7:41som i sig är en gren av datavetenskap.
-
7:41 - 7:43Det går ut på
-
7:43 - 7:46att istället för att instruera en dator
om vad den ska göra, -
7:46 - 7:48ger vi den helt enkelt data om ett problem
-
7:48 - 7:51och säger åt datorn
att lista ut lösningen själv. -
7:51 - 7:53Det hjälper er att förstå det
-
7:53 - 7:56genom att se källan.
-
7:57 - 8:00En datavetare på IBM på 50-talet
-
8:00 - 8:03som hette Arthur Samuel
gillade att spela dam, -
8:03 - 8:04så han skrev ett dataprogram
-
8:04 - 8:06så han kunde spela mot datorn.
-
8:07 - 8:10Han spelade. Han vann.
-
8:10 - 8:12Han spelade. Han vann.
-
8:12 - 8:14Han spelade. Han vann,
-
8:15 - 8:17eftersom datorn visste bara
-
8:17 - 8:19vad ett giltigt drag var.
-
8:19 - 8:21Arthur Samuel kunde något annat.
-
8:21 - 8:25Arthur Samuel kunde använda strategi.
-
8:26 - 8:28Så han skrev ett mindre underprogram
-
8:28 - 8:30som arbetade i bakgrunden,
och allt det gjorde var -
8:30 - 8:32att poängsätta sannolikheten
-
8:32 - 8:34att en viss brädkonfiguration
sannolikt skulle leda -
8:34 - 8:37till ett vinnande bräde
jämfört med ett förlorande bräde -
8:37 - 8:39efter varje drag.
-
8:40 - 8:43Han spelade mot datorn. Han vinner.
-
8:43 - 8:45Han spelade mot datorn. Han vinner.
-
8:45 - 8:48Han spelade mot datorn. Han vinner.
-
8:49 - 8:51Sedan lämnar Arthur Samuel datorn
-
8:51 - 8:53så den spelar mot sig själv.
-
8:54 - 8:57Den spelar själv. Den samlar mer data.
-
8:57 - 8:58Den samlar mer data.
-
8:58 - 9:01Den ökar noggrannheten
i dess förutsägelser. -
9:01 - 9:03Sedan går Arthur Samuel
tillbaka till datorn -
9:03 - 9:06och spelar själv mot den,
och han förlorar. -
9:06 - 9:08och han spelar, och han förlorar,
-
9:08 - 9:10och han spelar, och han förlorar,
-
9:10 - 9:13och Arthur Samuel har skapat en maskin
-
9:13 - 9:18som överträffar hans förmåga
i en uppgift som han lärde den. -
9:19 - 9:21Och maskininlärning
-
9:21 - 9:24kommer att finnas överallt.
-
9:25 - 9:28Hur tror du att vi har fått
självkörande bilar? -
9:28 - 9:31Är vi ett bättre samhälle
-
9:31 - 9:34för att vi lägger in
alla trafikregler i mjukvara? Nej. -
9:35 - 9:36Minne är billigt. Nej.
-
9:36 - 9:38Algoritmerna är snabbare. Nej.
-
9:38 - 9:40Processorerna är bättre. Nej.
-
9:40 - 9:43Dom sakerna gör skillnad,
men det är inte därför. -
9:43 - 9:46Det är för att vi ändrat problemets natur.
-
9:46 - 9:49Vi ändrade problemets art
från en där vi försökt -
9:49 - 9:52att öppet och tydligt förklara
för datorn hur man kör -
9:52 - 9:54till en där vi säger,
-
9:54 - 9:56"Här är en massa data om fordonet.
-
9:56 - 9:57Du kan räkna ut det.
-
9:57 - 9:59Räkna ut att det finns ett trafikljus,
-
9:59 - 10:01att trafikljuset är rött och inte grönt,
-
10:01 - 10:03att det betyder att du måste stanna
-
10:03 - 10:05och inte köra framåt."
-
10:06 - 10:08Maskininlärning är grunden
-
10:08 - 10:10till många saker vi gör online:
-
10:10 - 10:12sökmotorer,
-
10:12 - 10:14Amazons algoritm för personalisering,
-
10:16 - 10:18datoröversättning,
-
10:18 - 10:20röstigenkänningssystem.
-
10:22 - 10:25Forskare har nyligen kollat på
-
10:25 - 10:28frågan om biopsier,
-
10:28 - 10:30cancerbiopsier
-
10:31 - 10:33och dom bad en dator att identifiera,
-
10:33 - 10:36genom att se på data
och överlevnadsstatistik -
10:36 - 10:40för att bedöma om celler är
-
10:41 - 10:43drabbade av cancer eller inte,
-
10:43 - 10:45och visst, när man kastar data på den
-
10:45 - 10:47genom en algoritm för maskininlärning
-
10:47 - 10:48så kunde datorn identifiera
-
10:48 - 10:51de 12 varningssignalerna
som bäst förutspådde -
10:51 - 10:54att biopsin av bröstcancerceller
-
10:54 - 10:57verkligen är cancer.
-
10:57 - 11:00Problemet var att medicinsk facklitteratur
-
11:00 - 11:02bara kände till nio av dom.
-
11:03 - 11:04Tre av egenskaperna var sådana
-
11:04 - 11:07som folk inte behövde leta efter,
-
11:07 - 11:10men som datorn upptäckte.
-
11:14 - 11:18Men det finns också
mörka sidor av big data -
11:19 - 11:21Den förbättrar våra liv,
men det finns problem -
11:21 - 11:23som vi måste vara medvetna om,
-
11:23 - 11:26och den första är tanken
-
11:26 - 11:29att vi kan straffas för förutsägelser,
-
11:29 - 11:33att polisen får använda
big data för sina syften, -
11:33 - 11:35lite som i "Minority Report."
-
11:35 - 11:38Det finns en term som kallas
för prediktivt polisarbete, -
11:38 - 11:40eller algoritmisk kriminologi,
-
11:40 - 11:42och idén är att om vi tar en massa data,
-
11:42 - 11:44till exempel om
var tidigare brott har skett, -
11:44 - 11:46vet vi vart vi ska skicka patruller.
-
11:47 - 11:49Det är vettigt, men problemet
är naturligtvis -
11:49 - 11:53att det inte bara kommer
att stanna vid platsuppgifter, -
11:53 - 11:56det kommer att gå ner till individnivå.
-
11:56 - 12:00Varför använder vi inte uppgifter
om personens gymnasiebetyg? -
12:00 - 12:02Vi kanske ska använda det faktum
-
12:02 - 12:04att de är arbetslösa eller inte,
deras kreditvärdering, -
12:04 - 12:06deras beteende på internet,
-
12:06 - 12:08huruvida de är uppe sent på natten.
-
12:08 - 12:11Deras fitnessklocka,
när den kan kontrollera biokemin, -
12:11 - 12:14kommer visa att de har
aggressiva tankar. -
12:15 - 12:17Vi kan ha algoritmer
som sannolikt kommer förutse -
12:17 - 12:19vad vi kommer att göra,
-
12:19 - 12:22och vi kan hållas ansvariga
innan vi faktiskt har agerat. -
12:23 - 12:25Sekretess var den centrala utmaningen
-
12:25 - 12:27i eran av små datamängder.
-
12:28 - 12:30I big data-åldern är utmaningen
-
12:30 - 12:34att värna om den fria viljan,
-
12:34 - 12:38moraliskt val, mänsklig vilja,
-
12:38 - 12:40mänsklig inverkan.
-
12:43 - 12:45Det finns ett problem till:
-
12:45 - 12:48Big data kommer att stjäla våra jobb.
-
12:48 - 12:52Big data och algoritmer kommer att utmana
-
12:52 - 12:55tjänstemäns yrkesmässiga kunskapsarbete
-
12:55 - 12:56på 2000-talet
-
12:56 - 12:59på samma sätt som fabriksautomation
-
12:59 - 13:01och monteringslinjen
-
13:01 - 13:04utmanade industriarbetaren på 1900-talet.
-
13:04 - 13:06Tänk på labbteknikern
-
13:06 - 13:08som tittar genom ett mikroskop
-
13:08 - 13:09på en cancerbiopsi
-
13:09 - 13:12och bestämmer om det är cancer eller inte.
-
13:12 - 13:14Personen har gått på universitetet.
-
13:14 - 13:15Personen köper egendom.
-
13:15 - 13:17Han eller hon röstar.
-
13:17 - 13:20Han eller hon är nu en samhällsaktör.
-
13:21 - 13:22Och den personens jobb,
-
13:22 - 13:24samt en hel flotta
-
13:24 - 13:26av proffs som den personen,
-
13:26 - 13:29kommer att finna att deras jobb
har förändrats radikalt -
13:29 - 13:31eller faktiskt helt elimineras.
-
13:31 - 13:33Vi vill gärna tro
-
13:33 - 13:36att tekniken skapar arbetstillfällen
under en tid efter -
13:36 - 13:39en kort, tillfällig period av störning,
-
13:39 - 13:41och det är sant för den referensram
-
13:41 - 13:43som vi alla lever i,
den industriella revolutionen, -
13:43 - 13:45för det är precis vad som hände.
-
13:45 - 13:48Men vi glömmer något i den analysen:
-
13:48 - 13:50Det finns vissa kategorier av jobb
-
13:50 - 13:53som helt enkelt försvinner
och aldrig kommer tillbaka. -
13:53 - 13:54Den industriella revolutionen
-
13:54 - 13:57var inte särskilt bra för hästar.
-
13:59 - 14:01Så vi måste vara försiktiga
-
14:01 - 14:05och ta big data och anpassa den
efter våra behov, -
14:05 - 14:07våra väldigt mänskliga behov.
-
14:08 - 14:10Vi måste vara herre över denna teknik,
-
14:10 - 14:11inte dess tjänare.
-
14:11 - 14:15Vi är bara i början av big data-eran,
-
14:15 - 14:18och ärligt talat så är vi inte så bra
-
14:18 - 14:21på att hantera all den data
som vi nu samlar in. -
14:22 - 14:25Det är inte bara ett problem
för National Security Agency. -
14:25 - 14:28Företagen samlar massor av data,
och de missbrukar den också, -
14:28 - 14:32och vi måste bli bättre på detta,
och det kommer att ta tid. -
14:32 - 14:36Det är lite som utmaningen
när den primitiva människan mötte eld. -
14:36 - 14:38Detta är ett verktyg, men ett verktyg
-
14:38 - 14:41som om det inte hanteras försiktigt
kommer att skada oss. -
14:44 - 14:47Big data kommer omvandla hur vi lever,
-
14:47 - 14:50hur vi arbetar och hur vi tänker.
-
14:50 - 14:52Det kommer hjälpa oss hantera våra karriär
-
14:52 - 14:55och leva liv som innehåller
tillfredsställelse och hopp, -
14:55 - 14:58lycka och hälsa,
-
14:58 - 15:02men i det förflutna har vi ofta
sett på informationsteknik -
15:02 - 15:04och vi har bara sett T:et,
-
15:04 - 15:06tekniken, hårdvaran,
-
15:06 - 15:08eftersom det är vad som fanns fysiskt
-
15:08 - 15:11Nu måste vi rikta blicken mot I:et,
-
15:11 - 15:12informationen,
-
15:12 - 15:14vilken är mindre uppenbart,
-
15:14 - 15:17men på vissa sätt mycket viktigare.
-
15:18 - 15:21Mänskligheten kan äntligen
lära sig saker från informationen -
15:21 - 15:23som den samlar in,
-
15:24 - 15:26som en del i ett tidlöst uppdrag
-
15:26 - 15:28att förstå världen och vår plats i den,
-
15:29 - 15:33och det är därför big data är en stor sak.
-
15:34 - 15:37(Applåder)
- Title:
- Big data är bättre data
- Speaker:
- Kenneth Cukier
- Description:
-
Självstyrande bilar var bara början. Hur ser framtiden ut för teknik och design som styrs av big data? I en spännande vetenskapsföreläsning tittar Kenneth Cukier på vad som är på gång inom maskininlärning - och mänsklig kunskap.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Lisbeth Pekkari edited Swedish subtitles for Big data is better data | ||
Lisbeth Pekkari edited Swedish subtitles for Big data is better data | ||
Lisbeth Pekkari edited Swedish subtitles for Big data is better data | ||
Lisbeth Pekkari approved Swedish subtitles for Big data is better data | ||
Lisbeth Pekkari edited Swedish subtitles for Big data is better data | ||
Lisbeth Pekkari edited Swedish subtitles for Big data is better data | ||
Annika Bidner edited Swedish subtitles for Big data is better data | ||
Annika Bidner edited Swedish subtitles for Big data is better data |