Big data betekent betere data
-
0:01 - 0:05Wat is de lievelingstaart van Amerika?
-
0:05 - 0:08Publiek: Appel.
Kenneth Cukier: Appel, natuurlijk. -
0:08 - 0:09Hoe weten we dat?
-
0:09 - 0:12Door gegevens.
-
0:12 - 0:14Je kijkt naar de supermarktverkoop.
-
0:14 - 0:16Je kijkt naar omzetcijfers
-
0:16 - 0:19van diepvriestaart van 30 centimeter
-
0:19 - 0:21en appel wint zeker.
-
0:21 - 0:26Appel is het meest verkocht.
-
0:26 - 0:30Toen gingen supermarkten ook
kleinere taarten verkopen -
0:30 - 0:32van 11 centimeter.
-
0:32 - 0:36Dan komt appel
op de vierde of vijfde plaats. -
0:36 - 0:39Hoezo? Hoe komt dat nou?
-
0:39 - 0:42Denk eens goed na.
-
0:42 - 0:46Als je een taart van 30 centimeter koopt,
-
0:46 - 0:48moet het hele gezin het eens zijn.
-
0:48 - 0:52Appel staat bij iedereen
op de tweede plaats. -
0:52 - 0:54(Gelach)
-
0:54 - 0:57Maar als je een eenpersoonstaart
van 11 centimeter koopt, -
0:57 - 1:01kan je kopen wat je zelf wilt.
-
1:01 - 1:05Je kan je eerste keus nemen.
-
1:05 - 1:07Je hebt meer gegevens.
-
1:07 - 1:09Je ziet iets dat je eerst niet zag
-
1:09 - 1:13toen er nog niet zoveel gegevens waren.
-
1:13 - 1:16Het gaat erom dat je met meer gegevens
-
1:16 - 1:19niet alleen meer ziet, meer van hetzelfde.
-
1:20 - 1:23Met meer gegevens zien we nieuwe dingen.
-
1:23 - 1:27Je krijgt er een betere kijk op.
-
1:27 - 1:30Je gaat er anders tegenaan kijken.
-
1:30 - 1:33In dit geval onthult het
-
1:33 - 1:36wat de lievelingstaart van Amerika is:
-
1:36 - 1:39geen appel.
-
1:39 - 1:42Je hebt vast wel gehoord
van de kreet 'big data'. -
1:42 - 1:44Je wordt vast doodziek
-
1:44 - 1:46van de kreet 'big data'.
-
1:46 - 1:49Het is inderdaad een hype
-
1:49 - 1:52en dat is erg jammer,
-
1:52 - 1:55omdat big data
een enorm belangrijk middel is -
1:55 - 1:59waarmee de maatschappij opgestuwd wordt.
-
1:59 - 2:03In het verleden keken we naar 'small data'
en dachten we daarover na. -
2:03 - 2:05Zo poogden we de wereld te snappen.
-
2:05 - 2:07Nu hebben we veel meer gegevens.
-
2:07 - 2:10Meer dan we ooit hebben gehad.
-
2:10 - 2:12We ontdekken dat we
-
2:12 - 2:15met een grote hoeveelheid gegevens
dingen kunnen doen -
2:15 - 2:18die we niet konden doen
met kleinere hoeveelheden. -
2:18 - 2:21Big data is belangrijk en nieuw.
-
2:21 - 2:22Ga maar na:
-
2:22 - 2:25de enige manier waarmee
deze aarde om kan gaan -
2:25 - 2:26met wereldwijde uitdagingen --
-
2:26 - 2:30de wereld voeden,
medische verzorging geven, -
2:30 - 2:33van energie voorzien, van elektriciteit,
-
2:33 - 2:36en zorgen dat we niet verbranden
door opwarming van de aarde -- -
2:36 - 2:40is door effectief gebruik van gegevens.
-
2:40 - 2:44Wat is nieuw aan big data?
Wat is het bijzondere? -
2:44 - 2:46Om daar antwoord op te geven,
moet je eens bedenken -
2:46 - 2:48hoe informatie eruitzag.
-
2:48 - 2:51Hoe het er ooit fysiek uitzag.
-
2:51 - 2:55In 1908, op het eiland Kreta,
-
2:55 - 3:00ontdekten archeologen een schijf van klei.
-
3:00 - 3:04Ze dateerden die op 2.000 voor Christus,
dus 4.000 jaar oud. -
3:04 - 3:07Er staan inscripties op die schijf,
maar die kunnen we niet lezen. -
3:07 - 3:09Het is een raadsel, maar het gaat erom
-
3:09 - 3:13dat informatie er
4.000 jaar geleden zo uitzag. -
3:13 - 3:18Zo bewaarde en communiceerde
de maatschappij informatie. -
3:19 - 3:23De maatschappij is niet zoveel veranderd.
-
3:23 - 3:27We bewaren informatie
nog steeds op schijven, -
3:27 - 3:30maar nu kunnen we
veel meer informatie bewaren. -
3:30 - 3:31Meer dan ooit.
-
3:31 - 3:34Zoeken is makkelijker.
Kopiëren is makkelijker. -
3:34 - 3:38Delen en verwerken zijn makkelijker.
-
3:38 - 3:41We kunnen deze informatie hergebruiken
-
3:41 - 3:42voor dingen waar we nooit aan dachten
-
3:42 - 3:46toen we die informatie verzamelden.
-
3:46 - 3:48In dit verband zijn de gegevens gegaan
-
3:48 - 3:51van een stapel naar een stroom.
-
3:51 - 3:55Van iets bewegingsloos en statisch
-
3:55 - 3:59naar iets dat vloeiend en dynamisch is.
-
3:59 - 4:03Je kan stellen dat informatie vloeibaar is.
-
4:03 - 4:09De schijf die 4.000 jaar geleden
op Kreta werd ontdekt, is zwaar. -
4:10 - 4:12Er staat weinig informatie op,
-
4:12 - 4:15en die informatie is niet te wijzigen.
-
4:15 - 4:19Aan de andere kant pasten alle bestanden
-
4:19 - 4:21die Edward Snowden pikte
-
4:21 - 4:24van de NSA in de VS
-
4:24 - 4:26op een geheugenstick
-
4:26 - 4:29met de grootte van een vingernagel.
-
4:29 - 4:34De informatie kan worden gedeeld
met lichtsnelheid. -
4:34 - 4:38Meer data. Meer.
-
4:39 - 4:41We hebben nu veel meer data,
-
4:41 - 4:45omdat we dingen verzamelen waarover we
van oudsher informatie verzamelen. -
4:46 - 4:49Maar ook omdat we dingen verzamelen
-
4:49 - 4:51die altijd al informatie boden,
-
4:51 - 4:54maar die nooit in dataformaat
werden opgeslagen. -
4:54 - 4:56We maken er nu gegevens van.
-
4:56 - 5:00Denk eens aan de locatie.
-
5:00 - 5:02Neem bijvoorbeeld Martin Luther.
-
5:02 - 5:04Als we in de 16e eeuw wilden weten
-
5:04 - 5:06waar Martin Luther zich bevond,
-
5:06 - 5:08zouden we hem steeds moeten volgen,
-
5:08 - 5:10misschien met inkt en een veer,
-
5:10 - 5:12en we zouden dat vastleggen.
-
5:12 - 5:14Maar bedenk eens hoe dat er nu uitziet.
-
5:14 - 5:16Je weet dat er ergens,
-
5:16 - 5:19in een database van een telefoonbedrijf
-
5:19 - 5:24een bestand is, of iets in dat bestand,
dat informatie over jou bevat. -
5:24 - 5:26Over waar je ooit hebt uitgehangen.
-
5:26 - 5:29Als je een mobieltje hebt met gps,
-
5:29 - 5:30maar zelfs zonder,
-
5:30 - 5:33dan bewaart het die informatie.
-
5:33 - 5:37Hierbij wordt locatie in gegevens omgezet.
-
5:37 - 5:41Denk bijvoorbeeld eens aan je houding.
-
5:41 - 5:43Hoe je op dit moment zit.
-
5:43 - 5:45Hoe jij zit,
-
5:45 - 5:47hoe jij zit, hoe jij zit.
-
5:47 - 5:48Dat is verschillend
-
5:48 - 5:50en hangt af van je beenlengte
-
5:50 - 5:51en je rug en de kromming ervan.
-
5:51 - 5:54Als ik 100 sensoren zou plaatsen
-
5:54 - 5:56in jullie stoelen,
-
5:56 - 5:59zou ik een serie getallen krijgen
die uniek voor jou is. -
5:59 - 6:04Een soort vingerafdruk
maar niet van je vinger. -
6:04 - 6:07Wat zouden we er dan mee kunnen doen?
-
6:07 - 6:09Onderzoekers in Tokyo gebruiken dit
-
6:09 - 6:14als mogelijk anti-autodiefstal-apparaat.
-
6:14 - 6:16Het idee is dat de autodief
achter het stuur zit -
6:16 - 6:19en ervandoor gaat, maar de auto ontdekt
-
6:19 - 6:21dat iemand stuurt die daar niet hoort.
-
6:21 - 6:22De motor stopt dan,
-
6:22 - 6:26tenzij je een wachtwoord intypt
op het dashboard -
6:26 - 6:29waarmee je zegt: "Ik heb toestemming."
-
6:29 - 6:30Geweldig.
-
6:31 - 6:33Als alle auto's in Europa
-
6:33 - 6:35deze technologie nou eens hadden?
-
6:35 - 6:38Wat zouden we nog meer kunnen doen?
-
6:38 - 6:40Als we deze informatie zouden verzamelen
-
6:40 - 6:44konden we aanwijzingen signaleren
-
6:44 - 6:51die voorspellen dat over 5 seconden
een auto-ongeluk gaat gebeuren. -
6:53 - 6:55Wat we daarvoor zullen gaan vastleggen,
-
6:55 - 6:57is vermoeidheid tijdens het rijden.
-
6:57 - 6:59De applicatie in de auto merkt het
-
6:59 - 7:03als de persoon wegzakt
-
7:03 - 7:07en weet dan automatisch
dat er een wekker moet afgaan -
7:07 - 7:09die het stuurwiel laat trillen, toetert,
-
7:09 - 7:11en zegt: "Wakker worden,
-
7:11 - 7:12beter opletten op de weg."
-
7:12 - 7:14Dit soort dingen kunnen we doen
-
7:14 - 7:17als we nog meer van ons leven
vastleggen in gegevens. -
7:17 - 7:21Wat is de waarde van big data?
-
7:21 - 7:23Denk eens na.
-
7:23 - 7:25Je hebt meer informatie.
-
7:25 - 7:29Je kan dingen doen
die je eerst niet kon doen. -
7:29 - 7:30Een van de indrukwekkendste plekken
-
7:30 - 7:32waar dit idee wordt uitgevoerd
-
7:32 - 7:35is die van machine-leren.
-
7:35 - 7:39Machine-leren is een tak
van kunstmatige intelligentie -
7:39 - 7:42die zelf weer onderdeel is
van computerwetenschap. -
7:42 - 7:46Het idee is dat we de computer
niet vertellen wat hij moet doen -
7:46 - 7:48maar dat we er gewoon gegevens in gooien
-
7:48 - 7:51en de computer opdragen
het probleem zelf op te lossen. -
7:51 - 7:55Je begrijpt het beter als je ziet
waar het vandaan komt. -
7:57 - 7:58In de vijftiger jaren
-
7:58 - 8:03vond computerwetenschapper Arthur Samuel
van IBM, het leuk om te dammen. -
8:03 - 8:04Hij schreef een programma
-
8:04 - 8:07zodat hij tegen de computer kon spelen.
-
8:07 - 8:10Hij speelde en won.
-
8:10 - 8:12Hij speelde en won.
-
8:12 - 8:15Hij speelde en won,
-
8:15 - 8:17omdat de computer alleen wist
-
8:17 - 8:19wat een geldige zet was.
-
8:19 - 8:21Arthur Samuel wist nog meer.
-
8:21 - 8:25Arthur Samuel kende strategie.
-
8:26 - 8:28Hij schreef er een programmaatje bij
-
8:28 - 8:30dat op de achtergrond werkte
-
8:30 - 8:32en bijhield hoe groot de kans was
-
8:32 - 8:34dat een bepaalde spelsituatie leidde
-
8:34 - 8:37naar winst of verlies
-
8:37 - 8:40na elke zet.
-
8:40 - 8:43Hij speelt tegen de computer. Hij wint.
-
8:43 - 8:45Hij speelt tegen de computer. Hij wint.
-
8:45 - 8:48Hij speelt tegen de computer. Hij wint.
-
8:49 - 8:54En dan laat hij het de computer
tegen zichzelf spelen. -
8:54 - 8:57Hij speelt tegen zichzelf
en verzamelt meer gegevens. -
8:57 - 9:01Hij verzamelt meer gegevens
en wordt preciezer in zijn voorspelling. -
9:01 - 9:03Dan gaat Samuel terug naar de computer,
-
9:03 - 9:06speelt tegen hem en verliest.
-
9:06 - 9:08En speelt nogmaals en verliest.
-
9:08 - 9:10En speelt weer en verliest.
-
9:10 - 9:13Arthur Samuel heeft een machine gemaakt
-
9:13 - 9:19die beter is dan Arthur, in een taak
die Arthur hem aangeleerd heeft. -
9:19 - 9:21Dit idee van machine-leren
-
9:21 - 9:25heeft allerlei gevolgen.
-
9:25 - 9:28Hoe denk je dat we
zelfrijdende auto's krijgen? -
9:28 - 9:31Zijn we beter af als maatschappij
-
9:31 - 9:34door alle regels van de weg
in software te stoppen? -
9:34 - 9:36Nee. Geheugen is goedkoper. Nee.
-
9:36 - 9:40Algoritmes zijn sneller. Nee.
Processors zijn beter. Nee. -
9:40 - 9:43Die dingen doen ertoe,
maar dat is niet de reden. -
9:43 - 9:46Het komt omdat we de aard
van het probleem veranderd hebben. -
9:46 - 9:48Vroeger probeerden we
-
9:48 - 9:50aan de computer uit te leggen
-
9:50 - 9:53hoe hij moet rijden.
-
9:53 - 9:54Nu zeggen we:
-
9:54 - 9:57"Hier zijn veel gegevens over dit voertuig.
Zoek het maar uit. -
9:57 - 9:59Vind maar uit
dat het een verkeerslicht is, -
9:59 - 10:01dat het rood is en niet groen,
-
10:01 - 10:03dat je dan moet stoppen
-
10:03 - 10:06en niet meer vooruit moet gaan."
-
10:06 - 10:08Machine-leren is de basis
-
10:08 - 10:10van veel dingen die we online doen:
-
10:10 - 10:12zoekmachines,
-
10:12 - 10:16het personaliseer-algoritme van Amazon,
-
10:16 - 10:18computervertalingen,
-
10:18 - 10:20systemen voor stemherkenning.
-
10:22 - 10:25Onderzoekers hebben onlangs gekeken
-
10:25 - 10:28naar de kwestie van biopsies,
-
10:28 - 10:31kankerbiopsies.
-
10:31 - 10:33Ze vroegen de computer te kijken
-
10:33 - 10:36naar de gegevens
en overlevingsstatistieken -
10:36 - 10:42om te bepalen of het kankercellen zijn
-
10:42 - 10:43
of niet. -
10:43 - 10:45Als je de gegevens erin gooit
-
10:45 - 10:47en een machine-leer-algoritme gebruikt,
-
10:47 - 10:50bleek dat de machine
12 verklikkers kon bepalen -
10:50 - 10:51die het beste voorspellen
-
10:51 - 10:54of een biopsie van kankercellen
-
10:54 - 10:57inderdaad kanker is.
-
10:57 - 11:00Het probleem: de medische literatuur
-
11:00 - 11:03kende er maar negen.
-
11:03 - 11:04Naar drie kenmerken
-
11:04 - 11:07hoefde de mens niet te kijken,
-
11:07 - 11:10maar de machine zag ze wel.
-
11:13 - 11:19Er zit ook een zwarte kant aan big data.
-
11:19 - 11:21Het verbetert ons leven,
maar er zijn problemen -
11:21 - 11:24waar we ons van bewust moeten zijn.
-
11:24 - 11:26De eerste is het idee
-
11:26 - 11:29dat we gestraft kunnen worden
voor onze voorspellingen -
11:29 - 11:33en dat de politie ook big data gebruikt.
-
11:33 - 11:35Een beetje als in de film 'Minory Report'.
-
11:35 - 11:38Het heet 'predictive policing'
(voorspellend politiewerk), -
11:38 - 11:40of algoritme-criminologie.
-
11:40 - 11:42We nemen daarbij een hoop gegevens
-
11:42 - 11:44bijvoorbeeld waar criminaliteit voorkwam,
-
11:44 - 11:47om te weten we waar agenten
hun ronde moeten doen. -
11:47 - 11:49Dat lijkt slim maar het probleem
-
11:49 - 11:53is dat het niet zal blijven
bij gegevens over de locatie, -
11:53 - 11:56maar dat tot op
het individuele niveau zal gaan. -
11:56 - 11:58Waarom gebruiken we geen gegevens
-
11:58 - 12:01over iemands middelbareschoolverleden?
-
12:01 - 12:03Of ze werkloos zijn of niet,
-
12:03 - 12:04hun kredietwaardigheid,
-
12:04 - 12:06hun websurfgedrag,
-
12:06 - 12:08of ze laat naar bed gaan.
-
12:08 - 12:11Als hun gps-horloge
biologische dingen kan meten, -
12:11 - 12:14zal het merken
of hij agressieve gedachten heeft. -
12:15 - 12:17We zullen algoritmes krijgen
die voorspellen -
12:17 - 12:19wat we van plan zijn te doen
-
12:19 - 12:23en zouden kunnen worden aangesproken
voordat we gehandeld hebben. -
12:23 - 12:25Privacy was de grote uitdaging
-
12:25 - 12:28bij weinig gegevens.
-
12:28 - 12:30In het big data-tijdperk
-
12:30 - 12:34wordt de uitdaging het waarborgen
van de vrije wil, -
12:34 - 12:38morele keuzevrijheid, menselijke wil,
-
12:38 - 12:41menselijk handelen.
-
12:43 - 12:45Er is nog een probleem.
-
12:45 - 12:48Big data zal banen gaan kosten.
-
12:48 - 12:52Big data en algoritmes zullen het opnemen
-
12:52 - 12:55tegen de kantoormensen, kenniswerk,
-
12:55 - 12:57in de 21ste eeuw.
-
12:57 - 12:59Net zoals fabrieksautomatisering
-
12:59 - 13:01en lopende banden
-
13:01 - 13:04het opnamen tegen de fabrieksaarbeiders
in de 20ste eeuw. -
13:04 - 13:06Denk eens aan een laborant
-
13:06 - 13:08die in een microscoop kijkt
-
13:08 - 13:09naar een kankerbiopsie
-
13:09 - 13:12om te kijken of het kanker is of niet.
-
13:12 - 13:14Deze persoon is afgestudeerd,
-
13:14 - 13:15koopt een huis,
-
13:15 - 13:17hij of zij gaat naar de stembus,
-
13:17 - 13:21en neemt deel aan de maatschappij.
-
13:21 - 13:25Die persoon en nog een hele rij
soortgelijke professionals -
13:26 - 13:29zullen merken dat hun baan
heel erg verandert -
13:29 - 13:31of helemaal verdwijnt.
-
13:31 - 13:33We willen graag geloven
-
13:33 - 13:36dat techniek mettertijd
voor banen zorgt, -
13:36 - 13:39na een periode van ontwrichting.
-
13:39 - 13:41Dat klopt voor het referentiekader
-
13:41 - 13:43waarin we leven, de industriële revolutie.
-
13:43 - 13:46Want dat is precies wat er is gebeurd.
-
13:46 - 13:48Maar we hebben iets vergeten
in die analyse. -
13:48 - 13:50Er zijn een paar soorten banen
-
13:50 - 13:53die gewoon verdwijnen
en nooit meer terugkomen. -
13:53 - 13:55De industriële revolutie was niet best
-
13:55 - 13:59als je een paard was.
-
13:59 - 14:01We moeten dus erg zorgvuldig zijn,
-
14:01 - 14:05en big data aanpassen aan onze behoeftes,
-
14:05 - 14:08onze zeer menselijke behoeftes.
-
14:08 - 14:10We moeten de technologie de baas zijn.
-
14:10 - 14:12niet omgekeerd.
-
14:12 - 14:15We staan aan het begin
van het big data-tijdperk, -
14:15 - 14:18en eerlijk gezegd
zijn we nog niet zo goed -
14:18 - 14:22in het omgaan met de big data
die we verzamelen. -
14:22 - 14:25Het is niet alleen een probleem
voor de NSA. -
14:25 - 14:28Bedrijven verzamelen veel data
en misbruiken die ook. -
14:28 - 14:32We moeten er beter in worden
en dat kost tijd. -
14:32 - 14:34Het lijkt op de uitdaging
-
14:34 - 14:36die de mens ooit had met vuur.
-
14:36 - 14:38Het is een gereedschap,
-
14:38 - 14:42maar als je niet uitkijkt, verbrand je.
-
14:44 - 14:47Big data gaat ons leven veranderen.
-
14:47 - 14:50Hoe we leven, hoe we werken
en hoe we denken. -
14:50 - 14:52Het gaat ons helpen bij onze carrière
-
14:52 - 14:55en ons een tevreden
en hoopvol leven laten leiden -
14:55 - 14:58in blijdschap en gezondheid.
-
14:58 - 15:02Maar vroeger keken we vaak
naar informatietechnologie -
15:02 - 15:04en zagen we alleen de T,
-
15:04 - 15:06Technologie, de spullen,
-
15:06 - 15:08omdat dat fysiek was.
-
15:08 - 15:11Maar nu moeten we onze blik aanpassen
om de I te zien, -
15:11 - 15:12de Informatie,
-
15:12 - 15:14die minder zichtbaar is
-
15:14 - 15:18maar in zekere zin belangrijker.
-
15:18 - 15:21De mensheid kan eindelijk leren
van informatie -
15:21 - 15:24die ze verzamelt
-
15:24 - 15:26als onderdeel van onze eeuwige zoektocht
-
15:26 - 15:29om de wereld en onze plek erin
beter te begrijpen. -
15:29 - 15:34Daarom is big data van groot belang.
-
15:34 - 15:38(Applaus)
- Title:
- Big data betekent betere data
- Speaker:
- Kenneth Cukier
- Description:
-
Zelfrijdende auto's waren nog maar het begin. Wat is de toekomst van een technologie die gestuurd wordt door big data? In een spannende wetenschapstalk kijkt Kenneth Cukier naar de toekomst voor machine-leren -- en de menselijke kennis.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Els De Keyser approved Dutch subtitles for Big data is better data | ||
Dick Stada accepted Dutch subtitles for Big data is better data | ||
Dick Stada edited Dutch subtitles for Big data is better data | ||
Dick Stada edited Dutch subtitles for Big data is better data | ||
Dick Stada edited Dutch subtitles for Big data is better data | ||
Els De Keyser declined Dutch subtitles for Big data is better data | ||
Els De Keyser edited Dutch subtitles for Big data is better data | ||
Els De Keyser edited Dutch subtitles for Big data is better data |