Dit is een afbeelding van de planeet Aarde. Het lijkt heel erg op de bekende Apollo-foto's van de aarde. Echter, er is een verschil: je kunt erop klikken en dan kan je inzoomen op bijna elke plek op aarde In vogelperspectief zie je de EPFL (École Polytechnique Fédérale de Lausanne) Vaak kun je ook een gebouw vanuit een nabijgelegen straat bekijken. Wonderbaarlijk. Maar er ontbreekt nog iets aan deze prachtige toer: de tijd. Ik weet niet zeker wanneer deze foto is genomen. Was het op hetzelfde moment als het vogelperspectief? We ontwikkelen instrumenten in mijn lab zodat we niet alleen in de ruimte, maar ook in de tijd kunnen reizen. De vraag die we ons dan stellen, is: "Is het mogelijk om een Google Maps van 't verleden te bouwen? Kan ik een schuifbalk bovenaan Google Maps zetten en simpelweg het jaar veranderen, om te zien hoe het er 100 jaar of zelfs 1000 jaar geleden uitzag? Kan dat? Kan ik sociale netwerken van het verleden reconstrueren? Kan ik een Facebook van de middeleeuwen maken? Kortom, kan ik tijdmachines bouwen?" We kunnen zeggen: "Nee, dat kan niet". We kunnen het ook vanuit een informatieve invalshoek benaderen. Ik noem dit de informatiepaddenstoel. Verticaal staat de tijd, horizontaal de beschikbaarheid van digitale informatie. We hebben natuurlijk veel informatie van de afgelopen 10 jaar. Hoe verder we het verleden induiken, hoe minder informatie we hebben. Als we een Google Maps of Facebook van het verleden willen bouwen, dan moet dit gedeelte groter worden: dit moet een rechthoek worden. Hoe krijgen we dat voor elkaar? Een manier om dat te doen, is digitalisering. Er is veel materiaal beschikbaar: kranten, duizenden gedrukte boeken. Die kan ik digitaliseren. Ik kan er informatie uit halen. Hoe meer je het verleden ingaat, des te minder informatie je hebt. Dan heb je wellicht onvoldoende informatie. Ik kan historici nadoen: ik kan extrapoleren. Dit noemen we in de computerindustrie 'simulatie.' Een logboek kan ik gaan beschouwen als niet zomaar een logboek van een Venetiaanse kapitein die een bepaalde reis maakt. Als ik het beschouw als een logboek dat representatief is voor vele reizen uit die periode, dan ben ik aan het extrapoleren. Een schilderij van een voorgevel beschouw ik niet alleen als dat specifieke bouwsel. Het vertoont waarschijnlijk fundamentale overeenkomsten met bouwsels waarvan we de informatie niet meer hebben. We hebben twee dingen nodig voor het bouwen van een tijdmachine: hele grote archieven en uitstekende specialisten. De 'Venice Time Machine', het project waar ik het over ga hebben, is een samenwerkingsproject van EPFL en de Universiteit van Venetië, Ca' Foscari. Het uitzonderlijke aan Venetië is dat de administratie héél bureaucratisch was. Ze hebben alles bijgehouden, net zoals Google tegenwoordig. Het Rijksarchief van Venetië bevat 80 kilometer aan archieven waarin elk aspect vermeld staat van het leven van Venetië over een periode van meer dan 1000 jaar. Elk in- en uitgaande boot. Elke verandering die er in de stad was aangebracht. Het staat er allemaal in. We zijn een 10-jarig digitaliserings- programma aan het opzetten om dit immens grote archief om te zetten in een gigantisch informatiesysteem. Het doel dat we willen bereiken is het digitaliseren van 450 boeken per dag. Als je dat doet, dan is dat niet voldoende, want deze documenten zijn vaak in het Latijn, het Toscaanse of het Venetiaanse dialect geschreven. Je moet ze eerst transcriberen en soms vertalen om ze te kunnen indexeren. Dit is geen makkelijke taak. De traditionele optische tekenherkenningmethode (OCR), die toegepast kan worden op geprinte manuscripten, werkt niet goed met handgeschreven documenten. De oplossing is geïnspireerd door een ander domein: spraakherkenning. Het lijkt onmogelijk, maar het kan wel degelijk gedaan worden, door er simpelweg extra beperkingen op te leggen. Als je een heel goed model hebt van een gebruikte taal en een goed model van een document dat goed gestructureerd is, -- en vele van deze administratieve documenten zijn dat -- en als je dit enorme archief in kleinere subsets opdeelt, waarbij de kleinere dezelfde gelijkende kenmerken delen, dan is er een kans dat het zal werken. Als dat lukt, kunnen we een stap verder gaan. We kunnen ook gebeurtenissen uit dit document halen. Er kunnen vast 10 miljard gebeurtenissen uit dit archief worden gehaald. Dit enorme informatiesysteem kan op vele manieren worden doorzocht. Je kunt vragen: "Wie leefde er in 1323 in dit gebouw? Hoeveel kostte een zeebrasem op de Rialtomarkt in 1434 ? Wat verdiende een glasmaker in Murano, over een periode van tien jaar?" Je kunt grotere vragen stellen. Alles is semantisch gecodeerd. Dan kan je dat localiseren, want dit soort informatie is vaak ruimtelijke informatie, Dan kan je de buitengewone reis reconstrueren van een stad die voortdurend groeit gedurende een periode van 1000 jaar, die het evenwicht met haar omgeving weet te behouden. Je kunt zo'n reis reconstrueren en ze op verschillende manieren uitdrukken. Je leert Venetië niet kennen door enkel naar de stad te kijken. Plaats het in een grotere Europese context. Het idee is om alle dingen te documenteren die op Europees niveau liggen. We kunnen de reis van het Venetiaanse maritieme imperium namaken en laten zien hoe het stap voor stap de Adriatische Zee veroverde, hoe het het machtigste middeleeuwse imperium van zijn tijd werd en van Oost tot Zuid controle had over de meeste zeeroutes. Je kunt er ook andere dingen mee doen, want bij deze zeeroutes zijn er regelmatige patronen. Je kunt een stapje verdergaan en zelfs een mediterrane simulator creëren die in staat is om de ontbrekende informatie te reconstrueren zodat we vragen kunnen stellen, zoals bij een routeplanner: "Als ik in juni 1323 in Corfu ben en naar Constantinopel wil gaan, waar kan ik dan de boot nemen?" Wij kunnen die vraag beantwoorden met een foutenmarge van 1 tot 3 dagen. "Hoeveel gaat het kosten? Wat is de kans dat ik piraten tegen zal komen?" De grootste wetenschappelijke uitdaging voor dit soort van project is het kwalificeren, kwantificeren en voorstellen van onzekerheid en inconsistentie bij elke stap van het proces. Je komt overal fouten tegen: de verkeerde naam van een kapitein, sommige boten zijn nooit de zee op gegaan. Er zijn vertaalfouten en er is sprake van interpretatieve vooringenomenheid. Bovendien krijg je, als je algoritmische processen toevoegt, ook nog eens herkenningsfouten of extractiefouten, dus je hebt zéér onbetrouwbare data. Hoe kunnen we deze inconsistenties opsporen en corrigeren? Hoe kunnen we deze vorm van onbetrouwbaarheid aanpakken? Het is lastig. Eén ding dat je kunt doen, is elke stap van het proces documenteren. Kijk niet alleen naar de historische informatie, maar naar de zogeheten meta-historische informatie, van hoe historische kennis is opgebouwd, en documenteer elke stap. Dat betekent niet dat we uiteindelijk één verhaal over Venetië zullen hebben. We kunnen wel een onderbouwde mogelijke geschiedenis van Venetië reconstrueren. Misschien heb je niet één plattegrond, maar zijn er wel meerdere. Het systeem moet dat mogelijk maken. We moeten leren omgaan met een nieuwe soort van onbetrouwbaarheid. Dit is nieuw voor dit soort enorme databanken. Hoe moeten we dit nieuwe onderzoek delen met het grote publiek? Wederom, Venetië leent zich daar buitengewoon goed voor. Er komen elk jaar miljoenen bezoekers. Het is één van de beste plaatsen om er het museum van de toekomst te ontwikkelen. Horizontaal zie je de gereconstrueerde kaart van een bepaald jaar en verticaal het document dat de reconstructie gebruikte, schilderijen, bijvoorbeeld. Beeld je een systeem in waar je helemaal in opgaat en dat je toegang verleent tot het Venetië van een bepaald jaar, waarbij je je ervaringen met een groep kunt delen. Of stel je eens voor dat je begint met een document, een Venetiaans manuscript, en dat je laat zien wat je daaruit kunt halen, hoe het is ontcijferd wordt en hoe zijn context nagebootst kan worden. Dit is een afbeelding van een tentoonstelling die momenteel in Genève wordt gehouden, en die ook zo'n systeem heeft. Kortom, onderzoek op het gebied van geesteswetenschappen staat op het punt om een evolutie te ondergaan die misschien vergelijkbaar is met wat er 30 jaar terug is gebeurd met de levenswetenschappen. Het is eigenlijk een kwestie van schaal. We zien projecten die niet uitgevoerd kunnen worden door slechts één onderzoeksteam. Dit is een nieuwe ontwikkeling voor de geesteswetenschappen. Die zijn vaak gewend om in klein groepsverband of met een paar onderzoekers te werken. Als je het Rijksarchief bezoekt, weet je dat dit te groot is voor eender welk onderzoeksteam Er moet een gezamenlijke inspanning worden geleverd. Voor deze paradigmaverschuiving moeten we eigenlijk een nieuwe generatie van 'digitale humanisten' opleiden die klaar zijn voor deze verschuiving. Ik dank jullie zeer. (Applaus) (Applaus)