Hoe ik een informatietijdmachine heb gebouwd
-
0:00 - 0:03Dit is een afbeelding van de planeet Aarde.
-
0:03 - 0:07Het lijkt heel erg op de bekende
Apollo-foto's van de aarde. -
0:07 - 0:11Echter, er is een verschil:
je kunt erop klikken -
0:11 - 0:15en dan kan je inzoomen
op bijna elke plek op aarde -
0:15 - 0:20In vogelperspectief zie je de EPFL
(École Polytechnique Fédérale de Lausanne) -
0:20 - 0:26Vaak kun je ook een gebouw
vanuit een nabijgelegen straat bekijken. -
0:26 - 0:27Wonderbaarlijk.
-
0:27 - 0:31Maar er ontbreekt nog iets
aan deze prachtige toer: -
0:31 - 0:33de tijd.
-
0:33 - 0:36Ik weet niet zeker wanneer
deze foto is genomen. -
0:36 - 0:42Was het op hetzelfde moment
als het vogelperspectief? -
0:42 - 0:46We ontwikkelen instrumenten in mijn lab
-
0:46 - 0:50zodat we niet alleen in de ruimte,
maar ook in de tijd kunnen reizen. -
0:50 - 0:52De vraag die we ons dan stellen, is:
-
0:52 - 0:56"Is het mogelijk om een Google Maps
van 't verleden te bouwen? -
0:56 - 0:59Kan ik een schuifbalk
bovenaan Google Maps zetten -
0:59 - 1:01en simpelweg het jaar veranderen,
-
1:01 - 1:04om te zien hoe het er 100 jaar of
zelfs 1000 jaar geleden uitzag? -
1:04 - 1:09Kan dat? Kan ik sociale netwerken
van het verleden reconstrueren? -
1:09 - 1:12Kan ik een Facebook van
de middeleeuwen maken? -
1:12 - 1:16Kortom, kan ik tijdmachines bouwen?"
-
1:16 - 1:18We kunnen zeggen:
"Nee, dat kan niet". -
1:18 - 1:22We kunnen het ook vanuit
een informatieve invalshoek benaderen. -
1:22 - 1:25Ik noem dit de informatiepaddenstoel.
-
1:25 - 1:27Verticaal staat de tijd,
-
1:27 - 1:29horizontaal de beschikbaarheid
van digitale informatie. -
1:29 - 1:33We hebben natuurlijk veel informatie
van de afgelopen 10 jaar. -
1:33 - 1:36Hoe verder we het verleden induiken,
hoe minder informatie we hebben. -
1:36 - 1:40Als we een Google Maps of Facebook
van het verleden willen bouwen, -
1:40 - 1:44dan moet dit gedeelte groter worden:
dit moet een rechthoek worden. -
1:44 - 1:45Hoe krijgen we dat voor elkaar?
-
1:45 - 1:48Een manier om dat te doen,
is digitalisering. -
1:48 - 1:55Er is veel materiaal beschikbaar:
kranten, duizenden gedrukte boeken. -
1:55 - 2:01Die kan ik digitaliseren.
Ik kan er informatie uit halen. -
2:01 - 2:03Hoe meer je het verleden ingaat,
des te minder informatie je hebt. -
2:03 - 2:06Dan heb je wellicht
onvoldoende informatie. -
2:07 - 2:10Ik kan historici nadoen:
ik kan extrapoleren. -
2:10 - 2:15Dit noemen we in de computerindustrie
'simulatie.' -
2:15 - 2:18Een logboek kan ik gaan beschouwen
als niet zomaar een logboek -
2:18 - 2:22van een Venetiaanse kapitein
die een bepaalde reis maakt. -
2:22 - 2:23Als ik het beschouw als een logboek
-
2:23 - 2:26dat representatief is voor
vele reizen uit die periode, -
2:26 - 2:28dan ben ik aan het extrapoleren.
-
2:28 - 2:30Een schilderij van een voorgevel
-
2:30 - 2:33beschouw ik niet alleen
als dat specifieke bouwsel. -
2:33 - 2:37Het vertoont waarschijnlijk
fundamentale overeenkomsten -
2:37 - 2:41met bouwsels waarvan we
de informatie niet meer hebben. -
2:41 - 2:45We hebben twee dingen nodig voor
het bouwen van een tijdmachine: -
2:45 - 2:50hele grote archieven
en uitstekende specialisten. -
2:50 - 2:54De 'Venice Time Machine',
het project waar ik het over ga hebben, -
2:54 - 2:56is een samenwerkingsproject van EPFL
-
2:56 - 2:59en de Universiteit van Venetië,
Ca' Foscari. -
2:59 - 3:05Het uitzonderlijke aan Venetië
is dat de administratie -
3:05 - 3:07héél bureaucratisch was.
-
3:07 - 3:11Ze hebben alles bijgehouden,
net zoals Google tegenwoordig. -
3:11 - 3:14Het Rijksarchief van Venetië
bevat 80 kilometer aan archieven -
3:14 - 3:17waarin elk aspect vermeld staat
-
3:17 - 3:20van het leven van Venetië
over een periode van meer dan 1000 jaar. -
3:20 - 3:22Elk in- en uitgaande boot.
-
3:22 - 3:25Elke verandering die er
in de stad was aangebracht. -
3:25 - 3:29Het staat er allemaal in.
-
3:29 - 3:32We zijn een 10-jarig digitaliserings-
programma aan het opzetten -
3:32 - 3:35om dit immens grote archief
om te zetten -
3:35 - 3:38in een gigantisch informatiesysteem.
-
3:38 - 3:40Het doel dat we willen bereiken
-
3:40 - 3:45is het digitaliseren van
450 boeken per dag. -
3:45 - 3:47Als je dat doet,
dan is dat niet voldoende, -
3:47 - 3:48want deze documenten
-
3:48 - 3:52zijn vaak in het Latijn, het Toscaanse
of het Venetiaanse dialect geschreven. -
3:52 - 3:56Je moet ze eerst transcriberen
en soms vertalen -
3:56 - 3:59om ze te kunnen indexeren.
Dit is geen makkelijke taak. -
3:59 - 4:02De traditionele optische
tekenherkenningmethode (OCR), -
4:02 - 4:04die toegepast kan worden op
geprinte manuscripten, -
4:04 - 4:08werkt niet goed met
handgeschreven documenten. -
4:08 - 4:13De oplossing is geïnspireerd door
een ander domein: spraakherkenning. -
4:13 - 4:15Het lijkt onmogelijk,
-
4:15 - 4:18maar het kan wel
degelijk gedaan worden, -
4:18 - 4:20door er simpelweg
extra beperkingen op te leggen. -
4:20 - 4:23Als je een heel goed model hebt
van een gebruikte taal -
4:23 - 4:27en een goed model van een document
dat goed gestructureerd is, -
4:27 - 4:30-- en vele van deze
administratieve documenten zijn dat -- -
4:30 - 4:33en als je dit enorme archief
in kleinere subsets opdeelt, -
4:33 - 4:36waarbij de kleinere dezelfde
gelijkende kenmerken delen, -
4:36 - 4:40dan is er een kans
dat het zal werken. -
4:42 - 4:45Als dat lukt,
kunnen we een stap verder gaan. -
4:45 - 4:49We kunnen ook gebeurtenissen
uit dit document halen. -
4:49 - 4:51Er kunnen vast 10 miljard gebeurtenissen
-
4:51 - 4:53uit dit archief worden gehaald.
-
4:53 - 4:56Dit enorme informatiesysteem kan
op vele manieren worden doorzocht. -
4:56 - 4:58Je kunt vragen:
-
4:58 - 5:01"Wie leefde er in 1323 in dit gebouw?
-
5:01 - 5:05Hoeveel kostte een zeebrasem
op de Rialtomarkt in 1434 ? -
5:05 - 5:08Wat verdiende een glasmaker
in Murano, -
5:08 - 5:09over een periode van tien jaar?"
-
5:09 - 5:13Je kunt grotere vragen stellen.
Alles is semantisch gecodeerd. -
5:13 - 5:16Dan kan je dat localiseren,
want dit soort informatie -
5:16 - 5:18is vaak ruimtelijke informatie,
-
5:18 - 5:22Dan kan je de buitengewone
reis reconstrueren -
5:22 - 5:25van een stad die voortdurend groeit
-
5:25 - 5:27gedurende een periode van 1000 jaar,
-
5:27 - 5:32die het evenwicht met
haar omgeving weet te behouden. -
5:32 - 5:33Je kunt zo'n reis reconstrueren
-
5:33 - 5:36en ze op verschillende
manieren uitdrukken. -
5:36 - 5:39Je leert Venetië niet kennen door
enkel naar de stad te kijken. -
5:39 - 5:41Plaats het in een grotere
Europese context. -
5:41 - 5:44Het idee is om alle dingen
te documenteren -
5:44 - 5:46die op Europees niveau liggen.
-
5:46 - 5:50We kunnen de reis van het Venetiaanse
maritieme imperium namaken -
5:50 - 5:54en laten zien hoe het stap voor stap
de Adriatische Zee veroverde, -
5:54 - 5:59hoe het het machtigste middeleeuwse
imperium van zijn tijd werd -
5:59 - 6:05en van Oost tot Zuid controle had
over de meeste zeeroutes. -
6:05 - 6:08Je kunt er ook andere dingen mee doen,
-
6:08 - 6:12want bij deze zeeroutes zijn er
regelmatige patronen. -
6:12 - 6:19Je kunt een stapje verdergaan en
zelfs een mediterrane simulator creëren -
6:19 - 6:24die in staat is om de ontbrekende
informatie te reconstrueren -
6:24 - 6:30zodat we vragen kunnen stellen,
zoals bij een routeplanner: -
6:30 - 6:36"Als ik in juni 1323 in Corfu ben
en naar Constantinopel wil gaan, -
6:36 - 6:38waar kan ik dan de boot nemen?"
-
6:38 - 6:44Wij kunnen die vraag beantwoorden
met een foutenmarge van 1 tot 3 dagen. -
6:44 - 6:45"Hoeveel gaat het kosten?
-
6:45 - 6:49Wat is de kans dat ik piraten
tegen zal komen?" -
6:49 - 6:53De grootste wetenschappelijke uitdaging
voor dit soort van project -
6:53 - 6:57is het kwalificeren, kwantificeren
en voorstellen van onzekerheid -
6:57 - 7:00en inconsistentie
bij elke stap van het proces. -
7:00 - 7:03Je komt overal fouten tegen:
-
7:03 - 7:06de verkeerde naam van een kapitein,
-
7:06 - 7:09sommige boten zijn
nooit de zee op gegaan. -
7:09 - 7:14Er zijn vertaalfouten en er is sprake van
interpretatieve vooringenomenheid. -
7:14 - 7:17Bovendien krijg je, als je
algoritmische processen toevoegt, -
7:17 - 7:22ook nog eens herkenningsfouten
of extractiefouten, -
7:22 - 7:26dus je hebt zéér onbetrouwbare data.
-
7:26 - 7:30Hoe kunnen we deze inconsistenties
opsporen en corrigeren? -
7:30 - 7:34Hoe kunnen we deze vorm van
onbetrouwbaarheid aanpakken? -
7:34 - 7:36Het is lastig. Eén ding dat je kunt doen,
-
7:36 - 7:38is elke stap van het proces documenteren.
-
7:38 - 7:41Kijk niet alleen naar
de historische informatie, -
7:41 - 7:43maar naar de zogeheten
meta-historische informatie, -
7:43 - 7:46van hoe historische kennis is opgebouwd,
-
7:46 - 7:48en documenteer elke stap.
-
7:48 - 7:50Dat betekent niet dat we uiteindelijk
-
7:50 - 7:52één verhaal over Venetië zullen hebben.
-
7:52 - 7:57We kunnen wel een onderbouwde mogelijke
geschiedenis van Venetië reconstrueren. -
7:57 - 7:59Misschien heb je niet één plattegrond,
-
7:59 - 8:01maar zijn er wel meerdere.
-
8:01 - 8:03Het systeem moet dat mogelijk maken.
-
8:03 - 8:06We moeten leren omgaan met
een nieuwe soort van onbetrouwbaarheid. -
8:06 - 8:11Dit is nieuw voor dit soort
enorme databanken. -
8:12 - 8:16Hoe moeten we dit nieuwe onderzoek
delen met het grote publiek? -
8:16 - 8:19Wederom, Venetië leent zich daar
buitengewoon goed voor. -
8:19 - 8:22Er komen elk jaar miljoenen bezoekers.
-
8:22 - 8:23Het is één van de beste plaatsen
-
8:23 - 8:26om er het museum van
de toekomst te ontwikkelen. -
8:26 - 8:31Horizontaal zie je de gereconstrueerde
kaart van een bepaald jaar -
8:31 - 8:35en verticaal het document
dat de reconstructie gebruikte, -
8:35 - 8:38schilderijen, bijvoorbeeld.
-
8:38 - 8:42Beeld je een systeem in waar je helemaal
in opgaat en dat je toegang verleent -
8:42 - 8:45tot het Venetië van een bepaald jaar,
-
8:45 - 8:48waarbij je je ervaringen
met een groep kunt delen. -
8:48 - 8:50Of stel je eens voor dat je begint
-
8:50 - 8:52met een document,
een Venetiaans manuscript, -
8:52 - 8:55en dat je laat zien
wat je daaruit kunt halen, -
8:55 - 8:57hoe het is ontcijferd wordt
-
8:57 - 8:59en hoe zijn context
nagebootst kan worden. -
8:59 - 9:01Dit is een afbeelding
van een tentoonstelling -
9:01 - 9:03die momenteel in Genève
wordt gehouden, -
9:03 - 9:06en die ook zo'n systeem heeft.
-
9:06 - 9:10Kortom, onderzoek op het gebied van
geesteswetenschappen staat op het punt -
9:10 - 9:13om een evolutie te ondergaan
die misschien vergelijkbaar is -
9:13 - 9:17met wat er 30 jaar terug is gebeurd
met de levenswetenschappen. -
9:17 - 9:22Het is eigenlijk een kwestie van schaal.
-
9:22 - 9:25We zien projecten die
niet uitgevoerd kunnen worden -
9:25 - 9:29door slechts één onderzoeksteam.
-
9:29 - 9:32Dit is een nieuwe ontwikkeling voor
de geesteswetenschappen. -
9:32 - 9:34Die zijn vaak gewend om
-
9:34 - 9:39in klein groepsverband of met
een paar onderzoekers te werken. -
9:39 - 9:42Als je het Rijksarchief bezoekt,
-
9:42 - 9:44weet je dat dit te groot is
voor eender welk onderzoeksteam -
9:44 - 9:48Er moet een gezamenlijke
inspanning worden geleverd. -
9:48 - 9:52Voor deze paradigmaverschuiving
moeten we eigenlijk een nieuwe generatie -
9:52 - 9:57van 'digitale humanisten' opleiden
die klaar zijn voor deze verschuiving. -
9:57 - 9:59Ik dank jullie zeer.
-
9:59 - 10:03(Applaus)
-
10:03 - 10:03(Applaus)
- Title:
- Hoe ik een informatietijdmachine heb gebouwd
- Speaker:
- Frederic Kaplan
- Description:
-
Stel je eens voor dat je door Facebook kon surfen... vanuit de middeleeuwen. Nou, het is misschien wel dichterbij dan je zou denken. Aan de hand van een leuke en interessante lezing presenteert onderzoeker en ingenieur Frederic Kaplan 'The Venice Time Machine'. In dit project wordt er 80 kilometer aan boeken gedigitaliseerd om zo een historische en geografische simulatie van Venetië over een periode van 1000 jaar te maken. (Gefilmd bij TEDxCaFoscariU.)
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 10:20
Els De Keyser approved Dutch subtitles for How to build an information time machine | ||
Els De Keyser accepted Dutch subtitles for How to build an information time machine | ||
Els De Keyser edited Dutch subtitles for How to build an information time machine | ||
Els De Keyser commented on Dutch subtitles for How to build an information time machine | ||
Els De Keyser edited Dutch subtitles for How to build an information time machine | ||
Els De Keyser edited Dutch subtitles for How to build an information time machine | ||
Els De Keyser edited Dutch subtitles for How to build an information time machine | ||
Els De Keyser edited Dutch subtitles for How to build an information time machine |
Els De Keyser
In de beta-editor kan je de timing van de ondertitels aanpassen. Dat werkt beter dan 'dubbele' ondertitels: het gaat soms fout als je achteraf iets aanpast, want je moet het dan twee keer doen.
Voor wat betreft lengte en leessnelheid verwijs ik graag naar dit filmpje:
http://www.amara.org/en/videos/bVTsaCmTWlpm/info/the-subtitle-info-box-subtitle-length-and-reading-speed/
Sommige zinnen zijn echt te lang. Als je het filmpje achteraf nog eens bekijkt, zal je dat merken. Als je in de beta-editor werkt, kan je het aantal karakters per regel aflezen in het infovenster.
Omdat je zoveel dubbele ondertitels hebt, stuur ik de talk naar je terug, zodat je zelf met de timing aan de slag kan. Het is niet zo moeilijk. Verwijder in de beta-editor de tweede van de dubbele ondertitels door op het ronde kruisje rechts te klikken. 'Rek' dan de eerste titel uit in de tijdsbalk. Ik heb er al een aantal aangepast en van een volgende reeks de dubbele ondertitel weggehaald, zodat je het kan zien.
Succes ermee!
Els De Keyser
Taalcoördinator Nederlands
Els De Keyser
De passage over het logboek was niet helemaal accuraat vertaald (2:14 e.v.).
Ik ben niet zo'n voorstander van 'n en 't in geschreven tekst. Het is vermoeiend om te lezen en het levert nauwelijks winst op.
3:48 Latijn is m.i. een taal op zich, geen dialect.
4:25 Hij zegt 'how well they are structured', maar hij bedoelt m.i. de documenten, niet de documenten en de taal. Dat blijkt uit het vervolg.
6:37 Het gaat niet om de snelheid van het antwoord, maar wel om de precisie ervan.
6:48 De betekenis van deze zin was m.i. niet goed weergegeven in het Nederlands.
7:52 Hier ontbrak het woord 'documented', dat m.i. cruciaal is voor de betekenis. Ik heb de zin moeten omgooien om hem in de toegemeten tijd te laten passen.
9:44 Een woord splitsen in een ondertitel is geen goed idee.
Hier en daar hangen de zinnen niet helemaal aan elkaar (punt in het midden van de zin, komma aan het einde, enkelvoud en meervoud door elkaar gebruikt, te veel of juist te weinig hoofdletters, foute voornaamwoorden).
Ik besef dat het een hoop aanpassingen zijn, maar ik vrees dat ze noodzakelijk waren. Aarzel niet om contact op te nemen als je vragen of opmerkingen hebt.
Vriendelijke groeten,
Els