Return to Video

Hoe ik een informatietijdmachine heb gebouwd

  • 0:00 - 0:03
    Dit is een afbeelding van de planeet Aarde.
  • 0:03 - 0:07
    Het lijkt heel erg op de bekende
    Apollo-foto's van de aarde.
  • 0:07 - 0:11
    Echter, er is een verschil:
    je kunt erop klikken
  • 0:11 - 0:15
    en dan kan je inzoomen
    op bijna elke plek op aarde
  • 0:15 - 0:20
    In vogelperspectief zie je de EPFL
    (École Polytechnique Fédérale de Lausanne)
  • 0:20 - 0:26
    Vaak kun je ook een gebouw
    vanuit een nabijgelegen straat bekijken.
  • 0:26 - 0:27
    Wonderbaarlijk.
  • 0:27 - 0:31
    Maar er ontbreekt nog iets
    aan deze prachtige toer:
  • 0:31 - 0:33
    de tijd.
  • 0:33 - 0:36
    Ik weet niet zeker wanneer
    deze foto is genomen.
  • 0:36 - 0:42
    Was het op hetzelfde moment
    als het vogelperspectief?
  • 0:42 - 0:46
    We ontwikkelen instrumenten in mijn lab
  • 0:46 - 0:50
    zodat we niet alleen in de ruimte,
    maar ook in de tijd kunnen reizen.
  • 0:50 - 0:52
    De vraag die we ons dan stellen, is:
  • 0:52 - 0:56
    "Is het mogelijk om een Google Maps
    van 't verleden te bouwen?
  • 0:56 - 0:59
    Kan ik een schuifbalk
    bovenaan Google Maps zetten
  • 0:59 - 1:01
    en simpelweg het jaar veranderen,
  • 1:01 - 1:04
    om te zien hoe het er 100 jaar of
    zelfs 1000 jaar geleden uitzag?
  • 1:04 - 1:09
    Kan dat? Kan ik sociale netwerken
    van het verleden reconstrueren?
  • 1:09 - 1:12
    Kan ik een Facebook van
    de middeleeuwen maken?
  • 1:12 - 1:16
    Kortom, kan ik tijdmachines bouwen?"
  • 1:16 - 1:18
    We kunnen zeggen:
    "Nee, dat kan niet".
  • 1:18 - 1:22
    We kunnen het ook vanuit
    een informatieve invalshoek benaderen.
  • 1:22 - 1:25
    Ik noem dit de informatiepaddenstoel.
  • 1:25 - 1:27
    Verticaal staat de tijd,
  • 1:27 - 1:29
    horizontaal de beschikbaarheid
    van digitale informatie.
  • 1:29 - 1:33
    We hebben natuurlijk veel informatie
    van de afgelopen 10 jaar.
  • 1:33 - 1:36
    Hoe verder we het verleden induiken,
    hoe minder informatie we hebben.
  • 1:36 - 1:40
    Als we een Google Maps of Facebook
    van het verleden willen bouwen,
  • 1:40 - 1:44
    dan moet dit gedeelte groter worden:
    dit moet een rechthoek worden.
  • 1:44 - 1:45
    Hoe krijgen we dat voor elkaar?
  • 1:45 - 1:48
    Een manier om dat te doen,
    is digitalisering.
  • 1:48 - 1:55
    Er is veel materiaal beschikbaar:
    kranten, duizenden gedrukte boeken.
  • 1:55 - 2:01
    Die kan ik digitaliseren.
    Ik kan er informatie uit halen.
  • 2:01 - 2:03
    Hoe meer je het verleden ingaat,
    des te minder informatie je hebt.
  • 2:03 - 2:06
    Dan heb je wellicht
    onvoldoende informatie.
  • 2:07 - 2:10
    Ik kan historici nadoen:
    ik kan extrapoleren.
  • 2:10 - 2:15
    Dit noemen we in de computerindustrie
    'simulatie.'
  • 2:15 - 2:18
    Een logboek kan ik gaan beschouwen
    als niet zomaar een logboek
  • 2:18 - 2:22
    van een Venetiaanse kapitein
    die een bepaalde reis maakt.
  • 2:22 - 2:23
    Als ik het beschouw als een logboek
  • 2:23 - 2:26
    dat representatief is voor
    vele reizen uit die periode,
  • 2:26 - 2:28
    dan ben ik aan het extrapoleren.
  • 2:28 - 2:30
    Een schilderij van een voorgevel
  • 2:30 - 2:33
    beschouw ik niet alleen
    als dat specifieke bouwsel.
  • 2:33 - 2:37
    Het vertoont waarschijnlijk
    fundamentale overeenkomsten
  • 2:37 - 2:41
    met bouwsels waarvan we
    de informatie niet meer hebben.
  • 2:41 - 2:45
    We hebben twee dingen nodig voor
    het bouwen van een tijdmachine:
  • 2:45 - 2:50
    hele grote archieven
    en uitstekende specialisten.
  • 2:50 - 2:54
    De 'Venice Time Machine',
    het project waar ik het over ga hebben,
  • 2:54 - 2:56
    is een samenwerkingsproject van EPFL
  • 2:56 - 2:59
    en de Universiteit van Venetië,
    Ca' Foscari.
  • 2:59 - 3:05
    Het uitzonderlijke aan Venetië
    is dat de administratie
  • 3:05 - 3:07
    héél bureaucratisch was.
  • 3:07 - 3:11
    Ze hebben alles bijgehouden,
    net zoals Google tegenwoordig.
  • 3:11 - 3:14
    Het Rijksarchief van Venetië
    bevat 80 kilometer aan archieven
  • 3:14 - 3:17
    waarin elk aspect vermeld staat
  • 3:17 - 3:20
    van het leven van Venetië
    over een periode van meer dan 1000 jaar.
  • 3:20 - 3:22
    Elk in- en uitgaande boot.
  • 3:22 - 3:25
    Elke verandering die er
    in de stad was aangebracht.
  • 3:25 - 3:29
    Het staat er allemaal in.
  • 3:29 - 3:32
    We zijn een 10-jarig digitaliserings-
    programma aan het opzetten
  • 3:32 - 3:35
    om dit immens grote archief
    om te zetten
  • 3:35 - 3:38
    in een gigantisch informatiesysteem.
  • 3:38 - 3:40
    Het doel dat we willen bereiken
  • 3:40 - 3:45
    is het digitaliseren van
    450 boeken per dag.
  • 3:45 - 3:47
    Als je dat doet,
    dan is dat niet voldoende,
  • 3:47 - 3:48
    want deze documenten
  • 3:48 - 3:52
    zijn vaak in het Latijn, het Toscaanse
    of het Venetiaanse dialect geschreven.
  • 3:52 - 3:56
    Je moet ze eerst transcriberen
    en soms vertalen
  • 3:56 - 3:59
    om ze te kunnen indexeren.
    Dit is geen makkelijke taak.
  • 3:59 - 4:02
    De traditionele optische
    tekenherkenningmethode (OCR),
  • 4:02 - 4:04
    die toegepast kan worden op
    geprinte manuscripten,
  • 4:04 - 4:08
    werkt niet goed met
    handgeschreven documenten.
  • 4:08 - 4:13
    De oplossing is geïnspireerd door
    een ander domein: spraakherkenning.
  • 4:13 - 4:15
    Het lijkt onmogelijk,
  • 4:15 - 4:18
    maar het kan wel
    degelijk gedaan worden,
  • 4:18 - 4:20
    door er simpelweg
    extra beperkingen op te leggen.
  • 4:20 - 4:23
    Als je een heel goed model hebt
    van een gebruikte taal
  • 4:23 - 4:27
    en een goed model van een document
    dat goed gestructureerd is,
  • 4:27 - 4:30
    -- en vele van deze
    administratieve documenten zijn dat --
  • 4:30 - 4:33
    en als je dit enorme archief
    in kleinere subsets opdeelt,
  • 4:33 - 4:36
    waarbij de kleinere dezelfde
    gelijkende kenmerken delen,
  • 4:36 - 4:40
    dan is er een kans
    dat het zal werken.
  • 4:42 - 4:45
    Als dat lukt,
    kunnen we een stap verder gaan.
  • 4:45 - 4:49
    We kunnen ook gebeurtenissen
    uit dit document halen.
  • 4:49 - 4:51
    Er kunnen vast 10 miljard gebeurtenissen
  • 4:51 - 4:53
    uit dit archief worden gehaald.
  • 4:53 - 4:56
    Dit enorme informatiesysteem kan
    op vele manieren worden doorzocht.
  • 4:56 - 4:58
    Je kunt vragen:
  • 4:58 - 5:01
    "Wie leefde er in 1323 in dit gebouw?
  • 5:01 - 5:05
    Hoeveel kostte een zeebrasem
    op de Rialtomarkt in 1434 ?
  • 5:05 - 5:08
    Wat verdiende een glasmaker
    in Murano,
  • 5:08 - 5:09
    over een periode van tien jaar?"
  • 5:09 - 5:13
    Je kunt grotere vragen stellen.
    Alles is semantisch gecodeerd.
  • 5:13 - 5:16
    Dan kan je dat localiseren,
    want dit soort informatie
  • 5:16 - 5:18
    is vaak ruimtelijke informatie,
  • 5:18 - 5:22
    Dan kan je de buitengewone
    reis reconstrueren
  • 5:22 - 5:25
    van een stad die voortdurend groeit
  • 5:25 - 5:27
    gedurende een periode van 1000 jaar,
  • 5:27 - 5:32
    die het evenwicht met
    haar omgeving weet te behouden.
  • 5:32 - 5:33
    Je kunt zo'n reis reconstrueren
  • 5:33 - 5:36
    en ze op verschillende
    manieren uitdrukken.
  • 5:36 - 5:39
    Je leert Venetië niet kennen door
    enkel naar de stad te kijken.
  • 5:39 - 5:41
    Plaats het in een grotere
    Europese context.
  • 5:41 - 5:44
    Het idee is om alle dingen
    te documenteren
  • 5:44 - 5:46
    die op Europees niveau liggen.
  • 5:46 - 5:50
    We kunnen de reis van het Venetiaanse
    maritieme imperium namaken
  • 5:50 - 5:54
    en laten zien hoe het stap voor stap
    de Adriatische Zee veroverde,
  • 5:54 - 5:59
    hoe het het machtigste middeleeuwse
    imperium van zijn tijd werd
  • 5:59 - 6:05
    en van Oost tot Zuid controle had
    over de meeste zeeroutes.
  • 6:05 - 6:08
    Je kunt er ook andere dingen mee doen,
  • 6:08 - 6:12
    want bij deze zeeroutes zijn er
    regelmatige patronen.
  • 6:12 - 6:19
    Je kunt een stapje verdergaan en
    zelfs een mediterrane simulator creëren
  • 6:19 - 6:24
    die in staat is om de ontbrekende
    informatie te reconstrueren
  • 6:24 - 6:30
    zodat we vragen kunnen stellen,
    zoals bij een routeplanner:
  • 6:30 - 6:36
    "Als ik in juni 1323 in Corfu ben
    en naar Constantinopel wil gaan,
  • 6:36 - 6:38
    waar kan ik dan de boot nemen?"
  • 6:38 - 6:44
    Wij kunnen die vraag beantwoorden
    met een foutenmarge van 1 tot 3 dagen.
  • 6:44 - 6:45
    "Hoeveel gaat het kosten?
  • 6:45 - 6:49
    Wat is de kans dat ik piraten
    tegen zal komen?"
  • 6:49 - 6:53
    De grootste wetenschappelijke uitdaging
    voor dit soort van project
  • 6:53 - 6:57
    is het kwalificeren, kwantificeren
    en voorstellen van onzekerheid
  • 6:57 - 7:00
    en inconsistentie
    bij elke stap van het proces.
  • 7:00 - 7:03
    Je komt overal fouten tegen:
  • 7:03 - 7:06
    de verkeerde naam van een kapitein,
  • 7:06 - 7:09
    sommige boten zijn
    nooit de zee op gegaan.
  • 7:09 - 7:14
    Er zijn vertaalfouten en er is sprake van
    interpretatieve vooringenomenheid.
  • 7:14 - 7:17
    Bovendien krijg je, als je
    algoritmische processen toevoegt,
  • 7:17 - 7:22
    ook nog eens herkenningsfouten
    of extractiefouten,
  • 7:22 - 7:26
    dus je hebt zéér onbetrouwbare data.
  • 7:26 - 7:30
    Hoe kunnen we deze inconsistenties
    opsporen en corrigeren?
  • 7:30 - 7:34
    Hoe kunnen we deze vorm van
    onbetrouwbaarheid aanpakken?
  • 7:34 - 7:36
    Het is lastig. Eén ding dat je kunt doen,
  • 7:36 - 7:38
    is elke stap van het proces documenteren.
  • 7:38 - 7:41
    Kijk niet alleen naar
    de historische informatie,
  • 7:41 - 7:43
    maar naar de zogeheten
    meta-historische informatie,
  • 7:43 - 7:46
    van hoe historische kennis is opgebouwd,
  • 7:46 - 7:48
    en documenteer elke stap.
  • 7:48 - 7:50
    Dat betekent niet dat we uiteindelijk
  • 7:50 - 7:52
    één verhaal over Venetië zullen hebben.
  • 7:52 - 7:57
    We kunnen wel een onderbouwde mogelijke
    geschiedenis van Venetië reconstrueren.
  • 7:57 - 7:59
    Misschien heb je niet één plattegrond,
  • 7:59 - 8:01
    maar zijn er wel meerdere.
  • 8:01 - 8:03
    Het systeem moet dat mogelijk maken.
  • 8:03 - 8:06
    We moeten leren omgaan met
    een nieuwe soort van onbetrouwbaarheid.
  • 8:06 - 8:11
    Dit is nieuw voor dit soort
    enorme databanken.
  • 8:12 - 8:16
    Hoe moeten we dit nieuwe onderzoek
    delen met het grote publiek?
  • 8:16 - 8:19
    Wederom, Venetië leent zich daar
    buitengewoon goed voor.
  • 8:19 - 8:22
    Er komen elk jaar miljoenen bezoekers.
  • 8:22 - 8:23
    Het is één van de beste plaatsen
  • 8:23 - 8:26
    om er het museum van
    de toekomst te ontwikkelen.
  • 8:26 - 8:31
    Horizontaal zie je de gereconstrueerde
    kaart van een bepaald jaar
  • 8:31 - 8:35
    en verticaal het document
    dat de reconstructie gebruikte,
  • 8:35 - 8:38
    schilderijen, bijvoorbeeld.
  • 8:38 - 8:42
    Beeld je een systeem in waar je helemaal
    in opgaat en dat je toegang verleent
  • 8:42 - 8:45
    tot het Venetië van een bepaald jaar,
  • 8:45 - 8:48
    waarbij je je ervaringen
    met een groep kunt delen.
  • 8:48 - 8:50
    Of stel je eens voor dat je begint
  • 8:50 - 8:52
    met een document,
    een Venetiaans manuscript,
  • 8:52 - 8:55
    en dat je laat zien
    wat je daaruit kunt halen,
  • 8:55 - 8:57
    hoe het is ontcijferd wordt
  • 8:57 - 8:59
    en hoe zijn context
    nagebootst kan worden.
  • 8:59 - 9:01
    Dit is een afbeelding
    van een tentoonstelling
  • 9:01 - 9:03
    die momenteel in Genève
    wordt gehouden,
  • 9:03 - 9:06
    en die ook zo'n systeem heeft.
  • 9:06 - 9:10
    Kortom, onderzoek op het gebied van
    geesteswetenschappen staat op het punt
  • 9:10 - 9:13
    om een evolutie te ondergaan
    die misschien vergelijkbaar is
  • 9:13 - 9:17
    met wat er 30 jaar terug is gebeurd
    met de levenswetenschappen.
  • 9:17 - 9:22
    Het is eigenlijk een kwestie van schaal.
  • 9:22 - 9:25
    We zien projecten die
    niet uitgevoerd kunnen worden
  • 9:25 - 9:29
    door slechts één onderzoeksteam.
  • 9:29 - 9:32
    Dit is een nieuwe ontwikkeling voor
    de geesteswetenschappen.
  • 9:32 - 9:34
    Die zijn vaak gewend om
  • 9:34 - 9:39
    in klein groepsverband of met
    een paar onderzoekers te werken.
  • 9:39 - 9:42
    Als je het Rijksarchief bezoekt,
  • 9:42 - 9:44
    weet je dat dit te groot is
    voor eender welk onderzoeksteam
  • 9:44 - 9:48
    Er moet een gezamenlijke
    inspanning worden geleverd.
  • 9:48 - 9:52
    Voor deze paradigmaverschuiving
    moeten we eigenlijk een nieuwe generatie
  • 9:52 - 9:57
    van 'digitale humanisten' opleiden
    die klaar zijn voor deze verschuiving.
  • 9:57 - 9:59
    Ik dank jullie zeer.
  • 9:59 - 10:03
    (Applaus)
  • 10:03 - 10:03
    (Applaus)
Title:
Hoe ik een informatietijdmachine heb gebouwd
Speaker:
Frederic Kaplan
Description:

Stel je eens voor dat je door Facebook kon surfen... vanuit de middeleeuwen. Nou, het is misschien wel dichterbij dan je zou denken. Aan de hand van een leuke en interessante lezing presenteert onderzoeker en ingenieur Frederic Kaplan 'The Venice Time Machine'. In dit project wordt er 80 kilometer aan boeken gedigitaliseerd om zo een historische en geografische simulatie van Venetië over een periode van 1000 jaar te maken. (Gefilmd bij TEDxCaFoscariU.)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20
  • In de beta-editor kan je de timing van de ondertitels aanpassen. Dat werkt beter dan 'dubbele' ondertitels: het gaat soms fout als je achteraf iets aanpast, want je moet het dan twee keer doen.

    Voor wat betreft lengte en leessnelheid verwijs ik graag naar dit filmpje:
    http://www.amara.org/en/videos/bVTsaCmTWlpm/info/the-subtitle-info-box-subtitle-length-and-reading-speed/

    Sommige zinnen zijn echt te lang. Als je het filmpje achteraf nog eens bekijkt, zal je dat merken. Als je in de beta-editor werkt, kan je het aantal karakters per regel aflezen in het infovenster.

    Omdat je zoveel dubbele ondertitels hebt, stuur ik de talk naar je terug, zodat je zelf met de timing aan de slag kan. Het is niet zo moeilijk. Verwijder in de beta-editor de tweede van de dubbele ondertitels door op het ronde kruisje rechts te klikken. 'Rek' dan de eerste titel uit in de tijdsbalk. Ik heb er al een aantal aangepast en van een volgende reeks de dubbele ondertitel weggehaald, zodat je het kan zien.

    Succes ermee!

    Els De Keyser
    Taalcoördinator Nederlands

  • De passage over het logboek was niet helemaal accuraat vertaald (2:14 e.v.).

    Ik ben niet zo'n voorstander van 'n en 't in geschreven tekst. Het is vermoeiend om te lezen en het levert nauwelijks winst op.

    3:48 Latijn is m.i. een taal op zich, geen dialect.

    4:25 Hij zegt 'how well they are structured', maar hij bedoelt m.i. de documenten, niet de documenten en de taal. Dat blijkt uit het vervolg.

    6:37 Het gaat niet om de snelheid van het antwoord, maar wel om de precisie ervan.

    6:48 De betekenis van deze zin was m.i. niet goed weergegeven in het Nederlands.

    7:52 Hier ontbrak het woord 'documented', dat m.i. cruciaal is voor de betekenis. Ik heb de zin moeten omgooien om hem in de toegemeten tijd te laten passen.

    9:44 Een woord splitsen in een ondertitel is geen goed idee.

    Hier en daar hangen de zinnen niet helemaal aan elkaar (punt in het midden van de zin, komma aan het einde, enkelvoud en meervoud door elkaar gebruikt, te veel of juist te weinig hoofdletters, foute voornaamwoorden).

    Ik besef dat het een hoop aanpassingen zijn, maar ik vrees dat ze noodzakelijk waren. Aarzel niet om contact op te nemen als je vragen of opmerkingen hebt.

    Vriendelijke groeten,

    Els

Dutch subtitles

Revisions