Return to Video

Kako računala prevode ljudski jezik - Ioannis Papachimonas

  • 0:06 - 0:11
    Zašto brojne intergalaktičke vrste
    u filmovima i na TV-u
  • 0:11 - 0:14
    sasvim slučajno savršeno govore engleski?
  • 0:14 - 0:18
    Ukratko, jer nitko ne želi gledati
    posadu svemirske letjelice
  • 0:18 - 0:21
    kako godinama sastavlja
    izvanzemaljski rječnik.
  • 0:22 - 0:23
    Zbog dosljednosti,
  • 0:23 - 0:27
    tvorci Zvjezdanih staza
    i drugih znanstveno-fantastičnih svjetova
  • 0:27 - 0:31
    uveli su ideju univerzalnog prevoditelja,
  • 0:31 - 0:35
    prijenosnog uređaja
    koji brzo prevodi bilo koji jezik.
  • 0:35 - 0:38
    Može li univerzalni prevoditelj
    postojati u stvarnom svijetu?
  • 0:38 - 0:42
    Već postoje brojni programi
    koji to navodno mogu.
  • 0:42 - 0:46
    Riječ, rečenicu, ili čak cijelu knjigu
    na nekom jeziku
  • 0:46 - 0:48
    prevode na bilo koji drugi jezik,
  • 0:49 - 0:52
    bio to suvremeni engleski jezik
    ili drevni sanskrt.
  • 0:52 - 0:56
    Kada bi se prevođenje
    svodilo na traženje riječi u rječniku,
  • 0:56 - 0:59
    ti bi programi odmah nadmašili ljude.
  • 1:00 - 1:03
    Zapravo, stvar nije tako jednostavna.
  • 1:03 - 1:07
    Sustav za prevođenje temeljen na pravilima
    prevodi pomoću leksičke baze podataka.
  • 1:07 - 1:10
    U njoj se nalaze sve riječi
    koje se mogu naći i u rječniku
  • 1:10 - 1:13
    i svi njihovi mogući gramatički oblici
  • 1:13 - 1:19
    te skup pravila kojima se prepoznaju
    jezični elementi izvornog jezika.
  • 1:19 - 1:22
    Za naizgled jednostavnu rečenicu, kao
    "Djeca jedu kolače",
  • 1:22 - 1:27
    program prvo raščlanjuje sintaksu,
    to jest gramatičke strukture,
  • 1:27 - 1:30
    prepoznajući djecu kao subjekt,
  • 1:30 - 1:32
    a ostatak rečenice kao predikat
  • 1:32 - 1:34
    koji se sastoji od glagola ,"jedu",
  • 1:34 - 1:37
    i izravnog objekta "kolače".
  • 1:37 - 1:40
    Zatim prepoznaje morfološku strukturu,
  • 1:40 - 1:45
    to jest, kako se jezik razlaže
    na najmanje značenjske jedinice.
  • 1:45 - 1:46
    Tako prepoznaje riječ "kolač"
  • 1:46 - 1:50
    i sufiks "e" koji označava množinu.
  • 1:50 - 1:52
    Na kraju, mora razumjeti semantiku,
  • 1:52 - 1:56
    koje je značenje rečeničnih djelova.
  • 1:56 - 1:58
    Za pravilan prijevod ove rečenice,
  • 1:58 - 2:02
    program u obzir uzima
    brojne skupove rječničkih unosa i pravila
  • 2:02 - 2:04
    za svaki element u ciljnom jeziku.
  • 2:05 - 2:07
    Ovdje stvar postaje komplicirana.
  • 2:07 - 2:12
    Sintaksa nekih jezika
    omogućuje slobodan raspored riječi,
  • 2:12 - 2:17
    za druge bi primjena tog pravila
    uzrokovala da kolač jede dijete.
  • 2:17 - 2:20
    I morfologija može biti problem.
  • 2:20 - 2:23
    Slovenski razlikuje
    dvoje djece od troje ili više
  • 2:23 - 2:27
    jer ima sufiks koji označava dvojinu,
    za razliku od brojnih drugih jezika.
  • 2:27 - 2:31
    Ruski nema određene članove
    te više nije jasno
  • 2:31 - 2:33
    jedu li djeca neke određene kolače
  • 2:33 - 2:36
    ili bilo koje kolače.
  • 2:37 - 2:40
    Na kraju, kada je
    i semantika otprilike točna,
  • 2:40 - 2:43
    program ponekad ne uhvati finese,
  • 2:43 - 2:46
    kao "mangiano" (jedu) li djeca kolače
  • 2:46 - 2:48
    ili ih pak "divorano" (proždiru).
  • 2:48 - 2:52
    Postoje i sustavi za
    statističko strojno prevođenje
  • 2:52 - 2:56
    koji analiziraju
    baze knjiga, članaka i dokumenata
  • 2:56 - 2:59
    koje su ljudi već preveli.
  • 2:59 - 3:03
    Pronalaze podudarnosti
    izvornog i ciljnog teksta
  • 3:03 - 3:05
    koje najvjerojatnije nisu slučajne
  • 3:05 - 3:09
    te određuju
    odgovarajuće fraze i uzorke
  • 3:09 - 3:12
    koje koriste za buduće prijevode.
  • 3:12 - 3:15
    Unatoč tome, kvaliteta te vrste prijevoda
  • 3:15 - 3:18
    ovisi o veličini početne baze podataka
  • 3:18 - 3:21
    i dostupnosti uzoraka za određene jezike
  • 3:21 - 3:23
    ili stilove pisanja.
  • 3:23 - 3:27
    Računala imaju poteškoće
    s iznimkama i nepravilnostima
  • 3:27 - 3:31
    te nijansama značenja
    koje ljudi instinktivno razumiju.
  • 3:31 - 3:35
    Zbog toga neki istraživači vjeruju
    da je naše razumijevanje jezika
  • 3:35 - 3:39
    jedinstven proizvod
    biološke strukture našeg mozga.
  • 3:39 - 3:43
    Zapravo, jedna od najpoznatijih
    fiktivnih univerzalnih prevoditelja,
  • 3:43 - 3:46
    babilonska ribica
    iz "Vodiča kroz galaksiju za autostopere",
  • 3:46 - 3:50
    nije stroj, već malo stvorenje
  • 3:50 - 3:54
    koje prevodi moždane valove
    i signale živaca vrsta sa sviješću
  • 3:54 - 3:57
    jednom vrstom telepatije.
  • 3:57 - 4:00
    Za sada, učenje jezika na staromodan način
  • 4:00 - 4:05
    i dalje pruža bolje rezultate
    od trenutno dostupnih računalnih sustava.
  • 4:05 - 4:07
    To nije jednostavno,
  • 4:07 - 4:09
    a i sam broj jezika na svijetu,
  • 4:09 - 4:13
    kao i sve češća interakcija
    među govornicima tih jezika,
  • 4:13 - 4:18
    samo povećava
    napredak automatiziranog prevođenja.
  • 4:18 - 4:21
    Možda ćemo s izvanzemaljskim vrstama
    koje susretnemo
  • 4:21 - 4:25
    moći komunicirati pomoću spravice,
  • 4:25 - 4:29
    a možda ćemo ipak
    morati sastavljati rječnike.
Title:
Kako računala prevode ljudski jezik - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Cijela lekcija dostupna na: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Može li univerzalni prevoditelj postojati u stvarnom životu? Već postoje brojni programi koji riječ, rečenicu, ili pak cijelu knjigu, navodno mogu prevesti s jednog jezika na drugi. Zapravo, stvari su malo složenije od toga. Ioannis Papachimonas istražuje kako računalni prevoditelji rade i objašnjava zašto često griješe.

Lekcija: Ioannis Papachimonas, animacija: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Croatian subtitles

Revisions