Dit is een afbeelding van de planeet Aarde.

Het lijkt heel erg op de bekende 
Apollo-foto's van de aarde.

Echter, er is een verschil:
je kunt erop klikken

en dan kan je inzoomen 
op bijna elke plek op aarde

In vogelperspectief zie je de EPFL 
(École Polytechnique Fédérale de Lausanne)

Vaak kun je ook een gebouw 
vanuit een nabijgelegen straat bekijken.

Wonderbaarlijk.

Maar er ontbreekt nog iets
aan deze prachtige toer:

de tijd.

Ik weet niet zeker wanneer 
deze foto is genomen.

Was het op hetzelfde moment 
als het vogelperspectief?

We ontwikkelen instrumenten in mijn lab

zodat we niet alleen in de ruimte,
maar ook in de tijd kunnen reizen.

De vraag die we ons dan stellen, is:

"Is het mogelijk om een Google Maps 
van 't verleden te bouwen?

Kan ik een schuifbalk 
bovenaan Google Maps zetten

en simpelweg het jaar veranderen,

om te zien hoe het er 100 jaar of 
zelfs 1000 jaar geleden uitzag?

Kan dat? Kan ik sociale netwerken 
van het verleden reconstrueren?

Kan ik een Facebook van 
de middeleeuwen maken?

Kortom, kan ik tijdmachines bouwen?"

We kunnen zeggen: 
"Nee, dat kan niet".

We kunnen het ook vanuit 
een informatieve invalshoek benaderen.

Ik noem dit de informatiepaddenstoel.

Verticaal staat de tijd,

horizontaal de beschikbaarheid 
van digitale informatie.

We hebben natuurlijk veel informatie 
van de afgelopen 10 jaar.

Hoe verder we het verleden induiken, 
hoe minder informatie we hebben.

Als we een Google Maps of Facebook 
van het verleden willen bouwen,

dan moet dit gedeelte groter worden: 
dit moet een rechthoek worden.

Hoe krijgen we dat voor elkaar?

Een manier om dat te doen, 
is digitalisering.

Er is veel materiaal beschikbaar: 
kranten, duizenden gedrukte boeken.

Die kan ik digitaliseren.
Ik kan er informatie uit halen.

Hoe meer je het verleden ingaat,
des te minder informatie je hebt.

Dan heb je wellicht 
onvoldoende informatie.

Ik kan historici nadoen:
ik kan extrapoleren.

Dit noemen we in de computerindustrie
'simulatie.'

Een logboek kan ik gaan beschouwen 
als niet zomaar een logboek

van een Venetiaanse kapitein 
die een bepaalde reis maakt.

Als ik het beschouw als een logboek

dat representatief is voor 
vele reizen uit die periode,

dan ben ik aan het extrapoleren.

Een schilderij van een voorgevel

beschouw ik niet alleen
als dat specifieke bouwsel.

Het vertoont waarschijnlijk 
fundamentale overeenkomsten

met bouwsels waarvan we 
de informatie niet meer hebben.

We hebben twee dingen nodig voor
het bouwen van een tijdmachine:

hele grote archieven 
en uitstekende specialisten.

De 'Venice Time Machine', 
het project waar ik het over ga hebben,

is een samenwerkingsproject van EPFL

en de Universiteit van Venetië, 
Ca' Foscari.

Het uitzonderlijke aan Venetië 
is dat de administratie

héél bureaucratisch was.

Ze hebben alles bijgehouden, 
net zoals Google tegenwoordig.

Het Rijksarchief van Venetië
bevat 80 kilometer aan archieven

waarin elk aspect vermeld staat

van het leven van Venetië 
over een periode van meer dan 1000 jaar.

Elk in- en uitgaande boot.

Elke verandering die er 
in de stad was aangebracht.

Het staat er allemaal in.

We zijn een 10-jarig digitaliserings-
programma aan het opzetten

om dit immens grote archief 
om te zetten

in een gigantisch informatiesysteem.

Het doel dat we willen bereiken

is het digitaliseren van 
450 boeken per dag.

Als je dat doet, 
dan is dat niet voldoende,

want deze documenten

zijn vaak in het Latijn, het Toscaanse
of het Venetiaanse dialect geschreven.

Je moet ze eerst transcriberen 
en soms vertalen

om ze te kunnen indexeren. 
Dit is geen makkelijke taak.

De traditionele optische 
tekenherkenningmethode (OCR),

die toegepast kan worden op
geprinte manuscripten,

werkt niet goed met 
handgeschreven documenten.

De oplossing is geïnspireerd door 
een ander domein: spraakherkenning.

Het lijkt onmogelijk,

maar het kan wel 
degelijk gedaan worden,

door er simpelweg 
extra beperkingen op te leggen.

Als je een heel goed model hebt 
van een gebruikte taal

en een goed model van een document
dat goed gestructureerd is,

-- en vele van deze 
administratieve documenten zijn dat --

en als je dit enorme archief 
in kleinere subsets opdeelt,

waarbij de kleinere dezelfde 
gelijkende kenmerken delen,

dan is er een kans 
dat het zal werken.

Als dat lukt,
kunnen we een stap verder gaan.

We kunnen ook gebeurtenissen
uit dit document halen.

Er kunnen vast 10 miljard gebeurtenissen

uit dit archief worden gehaald.

Dit enorme informatiesysteem kan 
op vele manieren worden doorzocht.

Je kunt vragen:

"Wie leefde er in 1323 in dit gebouw?

Hoeveel kostte een zeebrasem 
op de Rialtomarkt in 1434 ?

Wat verdiende een glasmaker 
in Murano,

over een periode van tien jaar?"

Je kunt grotere vragen stellen.
Alles is semantisch gecodeerd.

Dan kan je dat localiseren,
want dit soort informatie

is vaak ruimtelijke informatie,

Dan kan je de buitengewone 
reis reconstrueren

van een stad die voortdurend groeit

gedurende een periode van 1000 jaar,

die het evenwicht met 
haar omgeving weet te behouden.

Je kunt zo'n reis reconstrueren

en ze op verschillende 
manieren uitdrukken.

Je leert Venetië niet kennen door
enkel naar de stad te kijken.

Plaats het in een grotere 
Europese context.

Het idee is om alle dingen 
te documenteren

die op Europees niveau liggen.

We kunnen de reis van het Venetiaanse 
maritieme imperium namaken

en laten zien hoe het stap voor stap 
de Adriatische Zee veroverde,

hoe het het machtigste middeleeuwse 
imperium van zijn tijd werd

en van Oost tot Zuid controle had 
over de meeste zeeroutes.

Je kunt er ook andere dingen mee doen,

want bij deze zeeroutes zijn er 
regelmatige patronen.

Je kunt een stapje verdergaan en 
zelfs een mediterrane simulator creëren

die in staat is om de ontbrekende 
informatie te reconstrueren

zodat we vragen kunnen stellen, 
zoals bij een routeplanner:

"Als ik in juni 1323 in Corfu ben
en naar Constantinopel wil gaan,

waar kan ik dan de boot nemen?"

Wij kunnen die vraag beantwoorden
met een foutenmarge van 1 tot 3 dagen.

"Hoeveel gaat het kosten?

Wat is de kans dat ik piraten 
tegen zal komen?"

De grootste wetenschappelijke uitdaging 
voor dit soort van project

is het kwalificeren, kwantificeren 
en voorstellen van onzekerheid

en inconsistentie 
bij elke stap van het proces.

Je komt overal fouten tegen:

de verkeerde naam van een kapitein,

sommige boten zijn 
nooit de zee op gegaan.

Er zijn vertaalfouten en er is sprake van 
interpretatieve vooringenomenheid.

Bovendien krijg je, als je 
algoritmische processen toevoegt,

ook nog eens herkenningsfouten 
of extractiefouten,

dus je hebt zéér onbetrouwbare data.

Hoe kunnen we deze inconsistenties
opsporen en corrigeren?

Hoe kunnen we deze vorm van
onbetrouwbaarheid aanpakken?

Het is lastig. Eén ding dat je kunt doen,

is elke stap van het proces documenteren.

Kijk niet alleen naar 
de historische informatie,

maar naar de zogeheten 
meta-historische informatie,

van hoe historische kennis is opgebouwd,

en documenteer elke stap.

Dat betekent niet dat we uiteindelijk

één verhaal over Venetië zullen hebben.

We kunnen wel een onderbouwde mogelijke 
geschiedenis van Venetië reconstrueren.

Misschien heb je niet één plattegrond,

maar zijn er wel meerdere.

Het systeem moet dat mogelijk maken.

We moeten leren omgaan met 
een nieuwe soort van onbetrouwbaarheid.

Dit is nieuw voor dit soort 
enorme databanken.

Hoe moeten we dit nieuwe onderzoek 
delen met het grote publiek?

Wederom, Venetië leent zich daar 
buitengewoon goed voor.

Er komen elk jaar miljoenen bezoekers.

Het is één van de beste plaatsen

om er het museum van 
de toekomst te ontwikkelen.

Horizontaal zie je de gereconstrueerde 
kaart van een bepaald jaar

en verticaal het document 
dat de reconstructie gebruikte,

schilderijen, bijvoorbeeld.

Beeld je een systeem in waar je helemaal 
in opgaat en dat je toegang verleent

tot het Venetië van een bepaald jaar,

waarbij je je ervaringen
met een groep kunt delen.

Of stel je eens voor dat je begint

met een document, 
een Venetiaans manuscript,

en dat je laat zien 
wat je daaruit kunt halen,

hoe het is ontcijferd wordt

en hoe zijn context 
nagebootst kan worden.

Dit is een afbeelding 
van een tentoonstelling

die momenteel in Genève 
wordt gehouden,

en die ook zo'n systeem heeft.

Kortom, onderzoek op het gebied van 
geesteswetenschappen staat op het punt

om een evolutie te ondergaan 
die misschien vergelijkbaar is

met wat er 30 jaar terug is gebeurd 
met de levenswetenschappen.

Het is eigenlijk een kwestie van schaal.

We zien projecten die 
niet uitgevoerd kunnen worden

door slechts één onderzoeksteam.

Dit is een nieuwe ontwikkeling voor 
de geesteswetenschappen.

Die zijn vaak gewend om

in klein groepsverband of met 
een paar onderzoekers te werken.

Als je het Rijksarchief bezoekt,

weet je dat dit te groot is 
voor eender welk onderzoeksteam

Er moet een gezamenlijke 
inspanning worden geleverd.

Voor deze paradigmaverschuiving 
moeten we eigenlijk een nieuwe generatie

van 'digitale humanisten' opleiden 
die klaar zijn voor deze verschuiving.

Ik dank jullie zeer.

(Applaus)

(Applaus)