Return to Video

Jak počítače překládají lidský jazyk - Ioannis Papachimonas

  • 0:07 - 0:11
    Jak je možné, že se tolika mezigalaktickým
    druhům ve filmech a televizi
  • 0:11 - 0:14
    daří mluvit perfektní angličtinou?
  • 0:14 - 0:18
    Jednoduchá odpověď je,
    že nikdo nechce vidět hvězdnou posádku,
  • 0:18 - 0:22
    jak roky sestavuje vesmírný slovník.
  • 0:22 - 0:23
    Ale buďme důslední,
  • 0:23 - 0:27
    tvůrci Star Treku a dalších sci-fi světů
  • 0:27 - 0:31
    představili myšlenku
    univerzálního překladače,
  • 0:31 - 0:35
    přenositelného zařízení pro okamžitý
    překlad mezi jakýmikoliv jazyky.
  • 0:35 - 0:39
    Může univerzální překladač
    existovat v reálném světě?
  • 0:39 - 0:42
    Dnes již máme mnoho programů,
    které tvrdí, že to umí,
  • 0:42 - 0:46
    vezmou slovo, větu nebo celou knihu
    v jednom jazyce
  • 0:46 - 0:49
    a přeloží je do téměř kteréhokoliv jiného,
  • 0:49 - 0:52
    ať už je to moderní angličtina
    nebo starověký sanskrt.
  • 0:52 - 0:56
    A kdyby překládání bylo pouze
    o vyhledávání slov ve slovníku,
  • 0:56 - 1:00
    tyto programy by předčily lidi.
  • 1:00 - 1:03
    Skutečnost je však trochu komplikovanější.
  • 1:03 - 1:07
    Pravidlový překladač
    využívá slovní databázi
  • 1:07 - 1:10
    zahrnující všechna slova ze slovníku
  • 1:10 - 1:13
    ve všech jejich gramatických formách
  • 1:13 - 1:19
    a sadu pravidel k rozpoznání základních
    lingvistických složek ve vstupním jazyce.
  • 1:19 - 1:22
    Pro zdánlivě jednoduchou větu jako
    "Děti jedí muffiny",
  • 1:22 - 1:27
    program nejprve rozebere její syntax,
    či gramatickou strukturu,
  • 1:27 - 1:30
    rozpozná "děti" jako podmět
  • 1:30 - 1:32
    a zbytek věty jako přísudek
  • 1:32 - 1:34
    sestávající ze slovesa "jíst"
  • 1:34 - 1:37
    a přímého předmětu "muffiny".
  • 1:37 - 1:40
    Potom potřebuje rozpoznat morfologii
  • 1:40 - 1:45
    či jak může být jazyk rozebrán
    na své nejmenší významové jednotky,
  • 1:45 - 1:46
    jako slovo "muffin"
  • 1:46 - 1:50
    a přípona "y" užívaná
    pro vyjádření množného čísla.
  • 1:50 - 1:52
    Nakonec potřebuje porozumět sémantice,
  • 1:52 - 1:56
    pro pochopení významu
    jednotlivých částí ve větě.
  • 1:56 - 1:58
    Pro správné přeložení věty
  • 1:58 - 2:02
    by musel program odkazovat
    na různou sadu slov a pravidel
  • 2:02 - 2:05
    pro každé slovo v cílovém jazyce.
  • 2:05 - 2:07
    Ale právě to je ta ošidná část.
  • 2:07 - 2:12
    Syntax v některých jazycích povoluje
    použití jakéhokoliv slovosledu,
  • 2:12 - 2:17
    zatímco v jiných
    by mohl muffin jíst dítě.
  • 2:17 - 2:20
    I morfologie může představovat problém.
  • 2:20 - 2:23
    Slovinština rozlišuje mezi
    dvěma dětmi a třemi či více,
  • 2:23 - 2:27
    užíváním dvojné přípony
    neexistující v mnoha dalších jazycích,
  • 2:27 - 2:31
    zatímco nepřítomnost určitého členu
    v ruštině může vyvolat nejasnost,
  • 2:31 - 2:34
    jestli děti jedí nějaké konkrétní muffiny,
  • 2:34 - 2:37
    nebo jen jedí muffiny obecně.
  • 2:37 - 2:40
    Nakonec, přestože je sémantika
    technicky správně,
  • 2:40 - 2:43
    program mohl opomenout
    jemnější záležitosti,
  • 2:43 - 2:46
    např. zda děti
    "mangiano" (jedí) muffiny,
  • 2:46 - 2:48
    nebo je "divorano" (hltají).
  • 2:48 - 2:52
    Jinou metodou je
    statistický strojový překlad,
  • 2:52 - 2:56
    který analyzuje databázi
    knih, článků a dokumentů,
  • 2:56 - 2:59
    které již byly přeloženy lidmi.
  • 2:59 - 3:03
    Nalezením protějšků
    mezi zdrojem a přeloženým textem,
  • 3:03 - 3:05
    které nejspíš nejsou náhodné,
  • 3:05 - 3:09
    může program identifikovat
    odpovídající fráze a vzorce
  • 3:09 - 3:12
    a užít je pro budoucí překlad.
  • 3:12 - 3:15
    Nicméně kvalita tohoto typu překladu
  • 3:15 - 3:18
    závisí na velikosti počáteční databáze
  • 3:18 - 3:21
    a dostupnosti vzorků pro určité jazyky
  • 3:21 - 3:23
    nebo styly psaní.
  • 3:23 - 3:27
    Problémy, které může mít počítač
    s výjimkami, nepravidelnostmi
  • 3:27 - 3:31
    a odstíny významu,
    patrně pocházejícími z lidského instinktu,
  • 3:31 - 3:35
    vedly některé výzkumníky k přesvědčení,
    že naše porozumění jazyka
  • 3:35 - 3:39
    je jedinečný výsledek
    biologické struktury našeho mozku.
  • 3:39 - 3:43
    Ve skutečnosti jeden z nejslavnějších
    fiktivních univerzálních překladačů,
  • 3:43 - 3:46
    babylónská rybka z knih
    "Stopařův průvodce Galaxií",
  • 3:46 - 3:50
    není vůbec přístroj,
    ale malé stvoření
  • 3:50 - 3:54
    překládající vibrace
    z mozku a nervů
  • 3:54 - 3:57
    prostřednictvím jakési formy telepatie.
  • 3:57 - 4:00
    V současnosti vám učení se jazyků
    staromódní cestou
  • 4:00 - 4:05
    dá stále lepší výsledky
    než dostupné počítačové programy.
  • 4:05 - 4:07
    Ale toto není lehký úkol
  • 4:07 - 4:09
    a naprosto všechny jazyky na světě,
  • 4:09 - 4:13
    stejně jako zvyšující se množství
    interakcí mezi lidmi, kteří jimi mluví,
  • 4:13 - 4:18
    budou nadále vyžadovat větší pokroky
    v automatickém překladu.
  • 4:18 - 4:21
    Možná, že v době, kdy potkáme
    mezigalaktické formy života,
  • 4:21 - 4:25
    budeme schopni komunikovat
    pomocí malého "udělátka",
  • 4:25 - 4:29
    jinak bychom museli začít sestavovat
    vesmírný slovník.
Title:
Jak počítače překládají lidský jazyk - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Sledujte celou lekci na: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Může univerzální překladač existovat ve skutečném světě? Již máme mnoho programů, které se pyšní tím, že vezmou slovo, větu, nebo celou knihu v jednom jazyce a přeloží je do téměř kteréhokoliv jiného. Skutečnost je však trochu komplikovanější. Ioannis Papachimonas ukazuje, jak tyto strojové překladače pracují a vysvětluje, proč často něco popletou.

Lekce: Ioannis Papachimonas, animace: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Czech subtitles

Revisions