Return to Video

Hoe computers menselijke taal vertalen - Ioannis Papachimonas

  • 0:06 - 0:11
    Hoe komt het dat zoveel
    buitenaardse wezens in films en op tv
  • 0:11 - 0:14
    toevallig perfect Engels spreken?
  • 0:14 - 0:18
    Het korte antwoord is dat je
    geen ruimteschipbemanning wilt zien
  • 0:18 - 0:21
    dat jaren bezig is om een woordenboek
    Buitenaards-Engels samen te stellen.
  • 0:21 - 0:23
    Maar om consequent te blijven,
  • 0:23 - 0:27
    hebben de makers van Star Trek
    en andere science-fiction
  • 0:27 - 0:30
    een universele vertaler bedacht.
  • 0:30 - 0:35
    Een draagbaar apparaat dat ogenblikkelijk
    alle talen kan vertalen.
  • 0:35 - 0:38
    Is zo'n universele vertaler
    in het echte leven mogelijk?
  • 0:38 - 0:42
    Er bestaan al veel programma's
    die beweren dat te doen.
  • 0:42 - 0:46
    Een woord, een zin of een compleet boek
    in een bepaalde taal
  • 0:46 - 0:49
    vertalen naar bijna elke andere taal,
  • 0:49 - 0:52
    of het nou modern Engels
    of Oud-Sanskriet is.
  • 0:52 - 0:56
    Als vertalen alleen zou bestaan
    uit woorden opzoeken in een woordenboek,
  • 0:56 - 1:00
    dan zouden die programma's
    de mens makkelijk verslaan.
  • 1:00 - 1:03
    De realiteit is echter veel ingewikkelder.
  • 1:03 - 1:07
    Een op regels gebaseerd vertaalprogramma
    gebruikt een lexicale database,
  • 1:07 - 1:10
    die alle woorden bevat
    die in een woordenboek staan
  • 1:10 - 1:13
    met alle grammaticale vormen
    die ze kunnen hebben,
  • 1:13 - 1:19
    en een aantal regels om de taalelementen
    van de brontaal te herkennen.
  • 1:19 - 1:22
    Voor een ogenschijnlijk eenvoudige zin
    als 'De kinderen eten de muffins'
  • 1:22 - 1:27
    zoekt het programma eerst uit
    wat de syntax of grammaticale structuur is
  • 1:27 - 1:30
    door de kinderen
    als onderwerp te benoemen
  • 1:30 - 1:32
    en de rest van de zin als gezegde,
  • 1:32 - 1:34
    bestaande uit het werkwoord 'eten'
  • 1:34 - 1:37
    en het lijdend voorwerp 'de muffins'.
  • 1:37 - 1:40
    Daarna moet het de Engelse
    woordstructuur herkennen,
  • 1:40 - 1:45
    oftewel hoe de taal kan worden opgedeeld
    in de kleinste stukjes met betekenis,
  • 1:45 - 1:47
    zoals het woord 'muffin'
    en het aanhangsel 's',
  • 1:47 - 1:50
    dat het meervoud aangeeft.
  • 1:50 - 1:52
    Tot slot moet het de semantiek begrijpen:
  • 1:52 - 1:56
    wat de verschillende zinsdelen betekenen.
  • 1:56 - 1:58
    Om deze zin netjes te vertalen,
  • 1:58 - 2:02
    zou het programma moeten verwijzen
    naar een andere woordenschat en regels
  • 2:02 - 2:05
    voor elk onderdeel in de doeltaal.
  • 2:05 - 2:07
    Hier wordt het lastiger.
  • 2:07 - 2:12
    Soms kan de syntax van een taal toestaan
    dat de woordvolgorde niet uitmaakt,
  • 2:12 - 2:17
    terwijl dat bij andere talen betekent
    dat de muffin het kind eet.
  • 2:17 - 2:20
    Morfologie kan ook nog
    roet in het eten gooien.
  • 2:20 - 2:23
    Slovenen maken onderscheid
    tussen twee en drie of meer kinderen
  • 2:23 - 2:27
    door twee achtervoegsels te gebruiken
    die veel andere talen niet hebben,
  • 2:27 - 2:31
    terwijl je je door het Russische gebrek
    aan lidwoorden blijft afvragen
  • 2:31 - 2:34
    of de kinderen bepaalde muffins eten,
  • 2:34 - 2:37
    of muffins in het algemeen.
  • 2:37 - 2:40
    Zelfs als de semantiek technisch klopt,
  • 2:40 - 2:43
    kan het programma nog steeds
    de finesses missen,
  • 2:43 - 2:46
    bijvoorbeeld of de kinderen
    de muffins 'mangiano'
  • 2:46 - 2:48
    of 'divorano'.
  • 2:48 - 2:52
    Een andere methode is
    de statistische machinevertaling,
  • 2:52 - 2:56
    die een database analyseert
    met boeken, artikelen en documenten
  • 2:56 - 2:59
    die al zijn vertaald door de mens.
  • 2:59 - 3:03
    Door overeenkomsten te zoeken
    tussen de bron en de vertaalde tekst
  • 3:03 - 3:05
    die niet toevallig lijken te bestaan,
  • 3:05 - 3:09
    kan het programma overeenkomstige
    uitdrukkingen en patronen vinden,
  • 3:09 - 3:12
    en ze gebruiken voor
    toekomstige vertalingen.
  • 3:12 - 3:15
    De kwaliteit van dit soort vertalingen
  • 3:15 - 3:18
    hangt echter af
    van de grootte van de database
  • 3:18 - 3:23
    en de aanwezigheid van voorbeelden
    voor bepaalde talen of schrijfstijlen.
  • 3:23 - 3:27
    Het probleem dat computers hebben
    met uitzonderingen, onregelmatigheden
  • 3:27 - 3:31
    en nuances die mensen
    instinctief aanvoelen,
  • 3:31 - 3:35
    hebben bij onderzoekers geleid
    tot de gedachte dat taalbegrip
  • 3:35 - 3:39
    het unieke resultaat is
    van onze biologische hersenstructuur.
  • 3:39 - 3:43
    Een van de beroemdste
    fictieve universele vertalers,
  • 3:43 - 3:46
    Babelvis uit 'The Hitchhiker's
    Guide to the Galaxy',
  • 3:46 - 3:50
    is immers geen machine,
    maar een klein wezen
  • 3:50 - 3:54
    dat de hersengolven en zenuwsignalen
    van levende soorten vertaalt
  • 3:54 - 3:57
    via een soort telepathie.
  • 3:57 - 4:00
    Voorlopig geeft het leren van een taal
    op de ouderwetse manier
  • 4:00 - 4:05
    betere resultaten dan
    welk computerprogramma ook.
  • 4:05 - 4:07
    Dat is niet eenvoudig.
  • 4:07 - 4:09
    Het grote aantal talen op de wereld
  • 4:09 - 4:13
    en de toenemende interactie
    tussen de sprekers ervan
  • 4:13 - 4:18
    zal het automatisch vertalen
    alleen maar sneller doen verbeteren.
  • 4:18 - 4:21
    Tegen de tijd dat we
    buitenaardse levensvormen ontdekken,
  • 4:21 - 4:25
    kunnen we wellicht praten via een gadget,
  • 4:25 - 4:29
    of we moeten alsnog
    dat woordenboek schrijven.
Title:
Hoe computers menselijke taal vertalen - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Volledige les: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Is een universele vertaler echt mogelijk? We kennen al veel programma's die beweren dat ze een woord, zin of een compleet boek kunnen vertalen naar bijna elke andere taal. De realiteit ligt echter iets ingewikkelder. Ioannis Papachimonas laat zien hoe deze automatische vertalers werken en legt uit waarom ze vaak een beetje in de war raken.

Les: Ioannis Papachimonas, animatie: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Dutch subtitles

Revisions