Hoe ik een informatietijdmachine heb gebouwd

0:00 - 0:03

Dit is een afbeelding van de planeet Aarde.
0:03 - 0:07

Het lijkt heel erg op de bekende
Apollo-foto's van de aarde.
0:07 - 0:11

Echter, er is een verschil:
je kunt erop klikken
0:11 - 0:15

en dan kan je inzoomen
op bijna elke plek op aarde
0:15 - 0:20

In vogelperspectief zie je de EPFL
(École Polytechnique Fédérale de Lausanne)
0:20 - 0:26

Vaak kun je ook een gebouw
vanuit een nabijgelegen straat bekijken.
0:26 - 0:27

Wonderbaarlijk.
0:27 - 0:31

Maar er ontbreekt nog iets
aan deze prachtige toer:
0:31 - 0:33

de tijd.
0:33 - 0:36

Ik weet niet zeker wanneer
deze foto is genomen.
0:36 - 0:42

Was het op hetzelfde moment
als het vogelperspectief?
0:42 - 0:46

We ontwikkelen instrumenten in mijn lab
0:46 - 0:50

zodat we niet alleen in de ruimte,
maar ook in de tijd kunnen reizen.
0:50 - 0:52

De vraag die we ons dan stellen, is:
0:52 - 0:56

"Is het mogelijk om een Google Maps
van 't verleden te bouwen?
0:56 - 0:59

Kan ik een schuifbalk
bovenaan Google Maps zetten
0:59 - 1:01

en simpelweg het jaar veranderen,
1:01 - 1:04

om te zien hoe het er 100 jaar of
zelfs 1000 jaar geleden uitzag?
1:04 - 1:09

Kan dat? Kan ik sociale netwerken
van het verleden reconstrueren?
1:09 - 1:12

Kan ik een Facebook van
de middeleeuwen maken?
1:12 - 1:16

Kortom, kan ik tijdmachines bouwen?"
1:16 - 1:18

We kunnen zeggen:
"Nee, dat kan niet".
1:18 - 1:22

We kunnen het ook vanuit
een informatieve invalshoek benaderen.
1:22 - 1:25

Ik noem dit de informatiepaddenstoel.
1:25 - 1:27

Verticaal staat de tijd,
1:27 - 1:29

horizontaal de beschikbaarheid
van digitale informatie.
1:29 - 1:33

We hebben natuurlijk veel informatie
van de afgelopen 10 jaar.
1:33 - 1:36

Hoe verder we het verleden induiken,
hoe minder informatie we hebben.
1:36 - 1:40

Als we een Google Maps of Facebook
van het verleden willen bouwen,
1:40 - 1:44

dan moet dit gedeelte groter worden:
dit moet een rechthoek worden.
1:44 - 1:45

Hoe krijgen we dat voor elkaar?
1:45 - 1:48

Een manier om dat te doen,
is digitalisering.
1:48 - 1:55

Er is veel materiaal beschikbaar:
kranten, duizenden gedrukte boeken.
1:55 - 2:01

Die kan ik digitaliseren.
Ik kan er informatie uit halen.
2:01 - 2:03

Hoe meer je het verleden ingaat,
des te minder informatie je hebt.
2:03 - 2:06

Dan heb je wellicht
onvoldoende informatie.
2:07 - 2:10

Ik kan historici nadoen:
ik kan extrapoleren.
2:10 - 2:15

Dit noemen we in de computerindustrie
'simulatie.'
2:15 - 2:18

Een logboek kan ik gaan beschouwen
als niet zomaar een logboek
2:18 - 2:22

van een Venetiaanse kapitein
die een bepaalde reis maakt.
2:22 - 2:23

Als ik het beschouw als een logboek
2:23 - 2:26

dat representatief is voor
vele reizen uit die periode,
2:26 - 2:28

dan ben ik aan het extrapoleren.
2:28 - 2:30

Een schilderij van een voorgevel
2:30 - 2:33

beschouw ik niet alleen
als dat specifieke bouwsel.
2:33 - 2:37

Het vertoont waarschijnlijk
fundamentale overeenkomsten
2:37 - 2:41

met bouwsels waarvan we
de informatie niet meer hebben.
2:41 - 2:45

We hebben twee dingen nodig voor
het bouwen van een tijdmachine:
2:45 - 2:50

hele grote archieven
en uitstekende specialisten.
2:50 - 2:54

De 'Venice Time Machine',
het project waar ik het over ga hebben,
2:54 - 2:56

is een samenwerkingsproject van EPFL
2:56 - 2:59

en de Universiteit van Venetië,
Ca' Foscari.
2:59 - 3:05

Het uitzonderlijke aan Venetië
is dat de administratie
3:05 - 3:07

héél bureaucratisch was.
3:07 - 3:11

Ze hebben alles bijgehouden,
net zoals Google tegenwoordig.
3:11 - 3:14

Het Rijksarchief van Venetië
bevat 80 kilometer aan archieven
3:14 - 3:17

waarin elk aspect vermeld staat
3:17 - 3:20

van het leven van Venetië
over een periode van meer dan 1000 jaar.
3:20 - 3:22

Elk in- en uitgaande boot.
3:22 - 3:25

Elke verandering die er
in de stad was aangebracht.
3:25 - 3:29

Het staat er allemaal in.
3:29 - 3:32

We zijn een 10-jarig digitaliserings-
programma aan het opzetten
3:32 - 3:35

om dit immens grote archief
om te zetten
3:35 - 3:38

in een gigantisch informatiesysteem.
3:38 - 3:40

Het doel dat we willen bereiken
3:40 - 3:45

is het digitaliseren van
450 boeken per dag.
3:45 - 3:47

Als je dat doet,
dan is dat niet voldoende,
3:47 - 3:48

want deze documenten
3:48 - 3:52

zijn vaak in het Latijn, het Toscaanse
of het Venetiaanse dialect geschreven.
3:52 - 3:56

Je moet ze eerst transcriberen
en soms vertalen
3:56 - 3:59

om ze te kunnen indexeren.
Dit is geen makkelijke taak.
3:59 - 4:02

De traditionele optische
tekenherkenningmethode (OCR),
4:02 - 4:04

die toegepast kan worden op
geprinte manuscripten,
4:04 - 4:08

werkt niet goed met
handgeschreven documenten.
4:08 - 4:13

De oplossing is geïnspireerd door
een ander domein: spraakherkenning.
4:13 - 4:15

Het lijkt onmogelijk,
4:15 - 4:18

maar het kan wel
degelijk gedaan worden,
4:18 - 4:20

door er simpelweg
extra beperkingen op te leggen.
4:20 - 4:23

Als je een heel goed model hebt
van een gebruikte taal
4:23 - 4:27

en een goed model van een document
dat goed gestructureerd is,
4:27 - 4:30

-- en vele van deze
administratieve documenten zijn dat --
4:30 - 4:33

en als je dit enorme archief
in kleinere subsets opdeelt,
4:33 - 4:36

waarbij de kleinere dezelfde
gelijkende kenmerken delen,
4:36 - 4:40

dan is er een kans
dat het zal werken.
4:42 - 4:45

Als dat lukt,
kunnen we een stap verder gaan.
4:45 - 4:49

We kunnen ook gebeurtenissen
uit dit document halen.
4:49 - 4:51

Er kunnen vast 10 miljard gebeurtenissen
4:51 - 4:53

uit dit archief worden gehaald.
4:53 - 4:56

Dit enorme informatiesysteem kan
op vele manieren worden doorzocht.
4:56 - 4:58

Je kunt vragen:
4:58 - 5:01

"Wie leefde er in 1323 in dit gebouw?
5:01 - 5:05

Hoeveel kostte een zeebrasem
op de Rialtomarkt in 1434 ?
5:05 - 5:08

Wat verdiende een glasmaker
in Murano,
5:08 - 5:09

over een periode van tien jaar?"
5:09 - 5:13

Je kunt grotere vragen stellen.
Alles is semantisch gecodeerd.
5:13 - 5:16

Dan kan je dat localiseren,
want dit soort informatie
5:16 - 5:18

is vaak ruimtelijke informatie,
5:18 - 5:22

Dan kan je de buitengewone
reis reconstrueren
5:22 - 5:25

van een stad die voortdurend groeit
5:25 - 5:27

gedurende een periode van 1000 jaar,
5:27 - 5:32

die het evenwicht met
haar omgeving weet te behouden.
5:32 - 5:33

Je kunt zo'n reis reconstrueren
5:33 - 5:36

en ze op verschillende
manieren uitdrukken.
5:36 - 5:39

Je leert Venetië niet kennen door
enkel naar de stad te kijken.
5:39 - 5:41

Plaats het in een grotere
Europese context.
5:41 - 5:44

Het idee is om alle dingen
te documenteren
5:44 - 5:46

die op Europees niveau liggen.
5:46 - 5:50

We kunnen de reis van het Venetiaanse
maritieme imperium namaken
5:50 - 5:54

en laten zien hoe het stap voor stap
de Adriatische Zee veroverde,
5:54 - 5:59

hoe het het machtigste middeleeuwse
imperium van zijn tijd werd
5:59 - 6:05

en van Oost tot Zuid controle had
over de meeste zeeroutes.
6:05 - 6:08

Je kunt er ook andere dingen mee doen,
6:08 - 6:12

want bij deze zeeroutes zijn er
regelmatige patronen.
6:12 - 6:19

Je kunt een stapje verdergaan en
zelfs een mediterrane simulator creëren
6:19 - 6:24

die in staat is om de ontbrekende
informatie te reconstrueren
6:24 - 6:30

zodat we vragen kunnen stellen,
zoals bij een routeplanner:
6:30 - 6:36

"Als ik in juni 1323 in Corfu ben
en naar Constantinopel wil gaan,
6:36 - 6:38

waar kan ik dan de boot nemen?"
6:38 - 6:44

Wij kunnen die vraag beantwoorden
met een foutenmarge van 1 tot 3 dagen.
6:44 - 6:45

"Hoeveel gaat het kosten?
6:45 - 6:49

Wat is de kans dat ik piraten
tegen zal komen?"
6:49 - 6:53

De grootste wetenschappelijke uitdaging
voor dit soort van project
6:53 - 6:57

is het kwalificeren, kwantificeren
en voorstellen van onzekerheid
6:57 - 7:00

en inconsistentie
bij elke stap van het proces.
7:00 - 7:03

Je komt overal fouten tegen:
7:03 - 7:06

de verkeerde naam van een kapitein,
7:06 - 7:09

sommige boten zijn
nooit de zee op gegaan.
7:09 - 7:14

Er zijn vertaalfouten en er is sprake van
interpretatieve vooringenomenheid.
7:14 - 7:17

Bovendien krijg je, als je
algoritmische processen toevoegt,
7:17 - 7:22

ook nog eens herkenningsfouten
of extractiefouten,
7:22 - 7:26

dus je hebt zéér onbetrouwbare data.
7:26 - 7:30

Hoe kunnen we deze inconsistenties
opsporen en corrigeren?
7:30 - 7:34

Hoe kunnen we deze vorm van
onbetrouwbaarheid aanpakken?
7:34 - 7:36

Het is lastig. Eén ding dat je kunt doen,
7:36 - 7:38

is elke stap van het proces documenteren.
7:38 - 7:41

Kijk niet alleen naar
de historische informatie,
7:41 - 7:43

maar naar de zogeheten
meta-historische informatie,
7:43 - 7:46

van hoe historische kennis is opgebouwd,
7:46 - 7:48

en documenteer elke stap.
7:48 - 7:50

Dat betekent niet dat we uiteindelijk
7:50 - 7:52

één verhaal over Venetië zullen hebben.
7:52 - 7:57

We kunnen wel een onderbouwde mogelijke
geschiedenis van Venetië reconstrueren.
7:57 - 7:59

Misschien heb je niet één plattegrond,
7:59 - 8:01

maar zijn er wel meerdere.
8:01 - 8:03

Het systeem moet dat mogelijk maken.
8:03 - 8:06

We moeten leren omgaan met
een nieuwe soort van onbetrouwbaarheid.
8:06 - 8:11

Dit is nieuw voor dit soort
enorme databanken.
8:12 - 8:16

Hoe moeten we dit nieuwe onderzoek
delen met het grote publiek?
8:16 - 8:19

Wederom, Venetië leent zich daar
buitengewoon goed voor.
8:19 - 8:22

Er komen elk jaar miljoenen bezoekers.
8:22 - 8:23

Het is één van de beste plaatsen
8:23 - 8:26

om er het museum van
de toekomst te ontwikkelen.
8:26 - 8:31

Horizontaal zie je de gereconstrueerde
kaart van een bepaald jaar
8:31 - 8:35

en verticaal het document
dat de reconstructie gebruikte,
8:35 - 8:38

schilderijen, bijvoorbeeld.
8:38 - 8:42

Beeld je een systeem in waar je helemaal
in opgaat en dat je toegang verleent
8:42 - 8:45

tot het Venetië van een bepaald jaar,
8:45 - 8:48

waarbij je je ervaringen
met een groep kunt delen.
8:48 - 8:50

Of stel je eens voor dat je begint
8:50 - 8:52

met een document,
een Venetiaans manuscript,
8:52 - 8:55

en dat je laat zien
wat je daaruit kunt halen,
8:55 - 8:57

hoe het is ontcijferd wordt
8:57 - 8:59

en hoe zijn context
nagebootst kan worden.
8:59 - 9:01

Dit is een afbeelding
van een tentoonstelling
9:01 - 9:03

die momenteel in Genève
wordt gehouden,
9:03 - 9:06

en die ook zo'n systeem heeft.
9:06 - 9:10

Kortom, onderzoek op het gebied van
geesteswetenschappen staat op het punt
9:10 - 9:13

om een evolutie te ondergaan
die misschien vergelijkbaar is
9:13 - 9:17

met wat er 30 jaar terug is gebeurd
met de levenswetenschappen.
9:17 - 9:22

Het is eigenlijk een kwestie van schaal.
9:22 - 9:25

We zien projecten die
niet uitgevoerd kunnen worden
9:25 - 9:29

door slechts één onderzoeksteam.
9:29 - 9:32

Dit is een nieuwe ontwikkeling voor
de geesteswetenschappen.
9:32 - 9:34

Die zijn vaak gewend om
9:34 - 9:39

in klein groepsverband of met
een paar onderzoekers te werken.
9:39 - 9:42

Als je het Rijksarchief bezoekt,
9:42 - 9:44

weet je dat dit te groot is
voor eender welk onderzoeksteam
9:44 - 9:48

Er moet een gezamenlijke
inspanning worden geleverd.
9:48 - 9:52

Voor deze paradigmaverschuiving
moeten we eigenlijk een nieuwe generatie
9:52 - 9:57

van 'digitale humanisten' opleiden
die klaar zijn voor deze verschuiving.
9:57 - 9:59

Ik dank jullie zeer.
9:59 - 10:03

(Applaus)
10:03 - 10:03

(Applaus)

Title:: Hoe ik een informatietijdmachine heb gebouwd
Speaker:: Frederic Kaplan
Description:: Stel je eens voor dat je door Facebook kon surfen... vanuit de middeleeuwen. Nou, het is misschien wel dichterbij dan je zou denken. Aan de hand van een leuke en interessante lezing presenteert onderzoeker en ingenieur Frederic Kaplan 'The Venice Time Machine'. In dit project wordt er 80 kilometer aan boeken gedigitaliseerd om zo een historische en geografische simulatie van Venetië over een periode van 1000 jaar te maken. (Gefilmd bij TEDxCaFoscariU.)

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 10:20

	Els De Keyser approved Dutch subtitles for How to build an information time machine
	Els De Keyser accepted Dutch subtitles for How to build an information time machine
	Els De Keyser edited Dutch subtitles for How to build an information time machine
	Els De Keyser commented on Dutch subtitles for How to build an information time machine
	Els De Keyser edited Dutch subtitles for How to build an information time machine
	Els De Keyser edited Dutch subtitles for How to build an information time machine
	Els De Keyser edited Dutch subtitles for How to build an information time machine
	Els De Keyser edited Dutch subtitles for How to build an information time machine

Show all

Els De Keyser

In de beta-editor kan je de timing van de ondertitels aanpassen. Dat werkt beter dan 'dubbele' ondertitels: het gaat soms fout als je achteraf iets aanpast, want je moet het dan twee keer doen.

Voor wat betreft lengte en leessnelheid verwijs ik graag naar dit filmpje:
http://www.amara.org/en/videos/bVTsaCmTWlpm/info/the-subtitle-info-box-subtitle-length-and-reading-speed/

Sommige zinnen zijn echt te lang. Als je het filmpje achteraf nog eens bekijkt, zal je dat merken. Als je in de beta-editor werkt, kan je het aantal karakters per regel aflezen in het infovenster.

Omdat je zoveel dubbele ondertitels hebt, stuur ik de talk naar je terug, zodat je zelf met de timing aan de slag kan. Het is niet zo moeilijk. Verwijder in de beta-editor de tweede van de dubbele ondertitels door op het ronde kruisje rechts te klikken. 'Rek' dan de eerste titel uit in de tijdsbalk. Ik heb er al een aantal aangepast en van een volgende reeks de dubbele ondertitel weggehaald, zodat je het kan zien.

Succes ermee!

Els De Keyser
Taalcoördinator Nederlands
Els De Keyser

De passage over het logboek was niet helemaal accuraat vertaald (2:14 e.v.).

Ik ben niet zo'n voorstander van 'n en 't in geschreven tekst. Het is vermoeiend om te lezen en het levert nauwelijks winst op.

3:48 Latijn is m.i. een taal op zich, geen dialect.

4:25 Hij zegt 'how well they are structured', maar hij bedoelt m.i. de documenten, niet de documenten en de taal. Dat blijkt uit het vervolg.

6:37 Het gaat niet om de snelheid van het antwoord, maar wel om de precisie ervan.

6:48 De betekenis van deze zin was m.i. niet goed weergegeven in het Nederlands.

7:52 Hier ontbrak het woord 'documented', dat m.i. cruciaal is voor de betekenis. Ik heb de zin moeten omgooien om hem in de toegemeten tijd te laten passen.

9:44 Een woord splitsen in een ondertitel is geen goed idee.

Hier en daar hangen de zinnen niet helemaal aan elkaar (punt in het midden van de zin, komma aan het einde, enkelvoud en meervoud door elkaar gebruikt, te veel of juist te weinig hoofdletters, foute voornaamwoorden).

Ik besef dat het een hoop aanpassingen zijn, maar ik vrees dat ze noodzakelijk waren. Aarzel niet om contact op te nemen als je vragen of opmerkingen hebt.

Vriendelijke groeten,

Els

Dutch subtitles

Revisions

Revision 17 Edited (legacy editor)

Els De Keyser

Hoe ik een informatietijdmachine heb gebouwd

Revisions

Our website uses cookies

Operating cookies (Required)