Return to Video

Hogyan fordítják a gépek az emberi nyelvet - Ioannis Papachimonas

  • 0:07 - 0:11
    Hogyan lehetséges, hogy sok, filmekben
    és tévében szereplő intergalaktikus faj
  • 0:11 - 0:14
    tökéletesen beszél angolul?
  • 0:14 - 0:18
    A rövid válasz az, hogy senki
    nem akarja végignézni,
  • 0:18 - 0:22
    ahogy egy csillaghajó legénysége
    éveket tölt egy szótár összeállításával.
  • 0:22 - 0:24
    De hogy következetesek
    maradjanak, a Star Trek
  • 0:24 - 0:27
    és más tudományos-fantasztikus
    világok alkotói,
  • 0:27 - 0:31
    bevezették az univerzális
    fordítóeszköz fogalmát.
  • 0:31 - 0:35
    Ez egy hordozható eszköz, amely
    azonnal fordít bármely két nyelv között.
  • 0:35 - 0:39
    Létezik ilyen univerzális
    fordítóeszköz a valóságban?
  • 0:39 - 0:42
    Sok program tudja elvileg megcsinálni azt,
  • 0:42 - 0:46
    hogy vesz egy szót, mondatot,
    vagy egy egész könyvet egy nyelven
  • 0:46 - 0:49
    és lefordítja szinte bármely másikra,
  • 0:49 - 0:52
    legyen az mai angol vagy ősi szanszkrit.
  • 0:52 - 0:56
    És ha a fordítás csak annyiból állna,
    hogy megtaláljunk szavakat a szótárban,
  • 0:56 - 1:00
    ezek a programok leköröznék az embereket.
  • 1:00 - 1:03
    A valóság azonban egy kicsit bonyolultabb.
  • 1:03 - 1:07
    A szabályokon alapuló fordítóprogram
    lexikális adatbázist használ,
  • 1:07 - 1:10
    ami tartalmaz minden szótárban
    megtalálható szót,
  • 1:10 - 1:14
    annak minden lehetséges nyelvtani
    alakjával, és egy szabályhalmazt,
  • 1:14 - 1:19
    amivel felismeri a nyelvészeti
    alkotóelemeket a bemeneti nyelvben.
  • 1:19 - 1:22
    Egy olyan egyszerűnek tűnő mondatot, mint
    "The children eat the muffins,"
  • 1:22 - 1:27
    a program először szintaktikailag elemez,
    vagyis a nyelvtani struktúrát nézi,
  • 1:27 - 1:30
    és azonosítja, hogy
    a "the children" az alany,
  • 1:30 - 1:32
    és a mondat további része az állítmány,
  • 1:32 - 1:34
    ami az "eat" igéből
  • 1:34 - 1:37
    és a "the muffins" tárgyból áll.
  • 1:37 - 1:40
    Ezután következik
    az angol morfológiai elemzés,
  • 1:40 - 1:45
    avagy hogyan lehet a nyelvet
    a legkisebb értelmes egységekre bontani,
  • 1:45 - 1:46
    mint például a "muffin" szó
  • 1:46 - 1:50
    és az "s" utótag, ami [az angolban]
    a többesszámot jelenti.
  • 1:50 - 1:52
    Végül értenie kell a szemantikát,
  • 1:52 - 1:56
    vagyis a mondat különböző
    részeinek jelentését.
  • 1:56 - 1:58
    A mondat megfelelő lefordításához
  • 1:58 - 2:02
    a program a célnyelv minden egyes elemére
  • 2:02 - 2:05
    egy másik szó- és szabályhalmazt alkalmaz.
  • 2:05 - 2:07
    És itt válik trükkössé a dolog.
  • 2:07 - 2:12
    Pár nyelv szintaxisa lehetővé teszi, hogy
    a szavak bármilyen sorrendben legyenek,
  • 2:12 - 2:17
    míg más nyelveken, ha így teszünk,
    akkor a muffin eszi meg a gyereket.
  • 2:17 - 2:20
    A morfológia is problémás lehet.
  • 2:20 - 2:23
    A szlovén különbséget tesz kettő,
    és három vagy több gyerek között
  • 2:23 - 2:27
    a más nyelveken nem létező
    dupla utótag használatával.
  • 2:27 - 2:31
    Az oroszban pedig a határozott névelők
    hiánya miatt azon gondolkodsz,
  • 2:31 - 2:34
    hogy a gyerekek néhány
    konkrét muffint esznek
  • 2:34 - 2:37
    vagy csak általában esznek muffint.
  • 2:37 - 2:40
    Végül, még ha a szemantika
    gyakorlatilag helyes is,
  • 2:40 - 2:43
    a program eltévesztheti
    a finomabb részleteket,
  • 2:43 - 2:46
    mint például, hogy a gyerekek
    "mangiano" (megeszik) a muffinokat,
  • 2:46 - 2:48
    vagy "divorano" (felfalják) azokat.
  • 2:48 - 2:52
    Egy másik módszer
    a statisztikai gépi fordítás,
  • 2:52 - 2:56
    ami egy olyan könyvekből, cikkekből és
    dokumentumokból álló adatbázist elemez,
  • 2:56 - 2:59
    amit emberek már lefordítottak.
  • 2:59 - 3:03
    Ha egyezéseket talál a forrás-
    és a célszövegek között,
  • 3:03 - 3:05
    amik nem valószínű, hogy
    véletlenül fordulnak elő,
  • 3:05 - 3:09
    a program összetartozó frázisokat
    és mintázatokat azonosíthat,
  • 3:09 - 3:12
    és használhatja őket
    jövőbeni fordításokban.
  • 3:12 - 3:15
    Viszont az effajta fordítás minősége
  • 3:15 - 3:18
    függ a kezdeti adatbázis nagyságától,
  • 3:18 - 3:21
    és attól, hogy mennyi minta áll
    rendelkezésre bizonyos nyelveken
  • 3:21 - 3:23
    illetve bizonyos stílusú írásokból.
  • 3:23 - 3:27
    Az emberek számára
    ösztönösen érezhető kivételek,
  • 3:27 - 3:31
    szabálytalanságok és jelentésárnyalatok,
    amik a gépeknek nehézséget okoznak,
  • 3:31 - 3:35
    azt a benyomást keltik a kutatókban,
    hogy a nyelv megértése
  • 3:35 - 3:39
    biológiai agyunk struktúrájának
    egyedi terméke.
  • 3:39 - 3:43
    Az egyik legismertebb
    kitalált univerzális fordítóeszköz,
  • 3:43 - 3:46
    a Bábel-hal, a Galaxis útikalauz
    stopposoknak című alkotásból,
  • 3:46 - 3:50
    valójában nem is egy gép,
    hanem egy apró teremtmény,
  • 3:50 - 3:54
    amely az élőlények agyhullámait
  • 3:54 - 3:57
    és idegjelzéseit egyféle telepátián
    keresztül fordítja le.
  • 3:57 - 4:01
    Egyelőre a régimódi nyelvtanulás
    még mindig jobb eredményeket hoz,
  • 4:01 - 4:05
    mint bármelyik jelenleg elérhető
    számítógépes program.
  • 4:05 - 4:07
    De ez nem egyszerű feladat,
  • 4:07 - 4:09
    a világ nyelveinek puszta száma,
  • 4:09 - 4:13
    illetve a növekvő interakció
    a nyelveket beszélők között,
  • 4:13 - 4:18
    továbbra is viszi előre
    az automatizált fordítás fejlesztését.
  • 4:18 - 4:21
    Talán mire találkozunk
    az intergalaktikus életformákkal,
  • 4:21 - 4:25
    tudunk majd kommunikálni velük
    egy apró kütyüvel.
  • 4:25 - 4:29
    Vagy lehet mégis el kell kezdenünk
    összeállítani azt a szótárat.
Title:
Hogyan fordítják a gépek az emberi nyelvet - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

A teljes lecke angol nyelven itt található: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Létezik univerzális fordítóeszköz a valóságban? Sok program tudja elvileg megcsinálni azt, hogy vesz egy szót, mondatot, vagy egy egész könyvet egy nyelven és lefordítja szinte bármely másikra. A valóság azonban egy kicsit bonyolultabb. Papachimonas megmutatja hogyan működnek ezek a gépi fordítóeszközök és elmagyarázza miért zavarodnak össze olyan gyakran.

Lecke: Ioannis Papachimonas
Animáció: NOWAY Video Club

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45
  • Szia, Évi!
    Kivettem átnézésre a fordításodat. Tetszik, nagyon jó. :)
    Egy dolog merült fel bennem: a őéldamondat (The children...) angol nyelvű maradt, és az jó is, mert a videón annak az elemzése látszik. Viszont a szöveg további részében már a magyar fordítást használod a részek magyarázatára (hm, ez jó:)). "A gyerekeek megeszik a muffint..". Nem gondolod, hogy valahova be kéne szúrni a mondat magyar vűltozatát? Vagy valahogy összekötni az eredetit a magyar nyelvű részekkel? Még nincs jó ötletem, de gondolkozom én is rajta.

Hungarian subtitles

Revisions