Return to Video

Ako počítače prekladajú ľudský jazyk - Ioannis Papachimonas

  • 0:07 - 0:11
    Ako je možné, že toľko medzigalaktických
    rás vo filmoch a TV
  • 0:11 - 0:14
    náhodou ovláda perfektnú angličtinu?
  • 0:14 - 0:18
    Krátka odpoveď: nikto nechce pozerať
    na posádku vesmírnej lode,
  • 0:18 - 0:22
    ako roky kompiluje slovník
    k jazyku mimozemšťanov.
  • 0:22 - 0:23
    Ale z dôvodu konzistentnosti
  • 0:23 - 0:27
    tvorcovia Star Treku a iných sci-fi svetov
  • 0:27 - 0:31
    zaviedli používanie
    univerzálneho prekladača,
  • 0:31 - 0:35
    prenosného zariadenia, ktoré dokáže
    okamžite prekladať medzi všetkými jazykmi.
  • 0:35 - 0:39
    Je univerzálny prekladač
    možný v skutočnosti?
  • 0:39 - 0:42
    Už teraz máme mnoho programov,
    ktoré tvrdia, že to dokážu,
  • 0:42 - 0:46
    zoberú si slovo, vetu,
    či celú knihu v jednom jazyku
  • 0:46 - 0:49
    a preložia ju do takmer akéhokoľvek iného,
  • 0:49 - 0:52
    či už ide o modernú angličtinu,
    alebo staroveký Sanskrit.
  • 0:52 - 0:56
    A ak by pri preklade išlo len
    o vyhľadávanie slovíčok v slovníku,
  • 0:56 - 1:00
    tieto programy by ľudia
    ani nepustili z ruky.
  • 1:00 - 1:03
    Skutočnosť je však trochu zložitejšia.
  • 1:03 - 1:07
    Program na základe pravidiel
    používa databázu slov,
  • 1:07 - 1:10
    ktorá obsahuje všetky slová zo slovníka
  • 1:10 - 1:13
    a všetky gramatické formy,
    ktoré môže mať,
  • 1:13 - 1:19
    aj sadu pravidiel, podľa ktorých rozoznať základné
    lingvistické prvky východiskového jazyka.
  • 1:19 - 1:22
    Pri zdanlivo jednoduchých vetách ako:
    „Deti jedia muffiny“
  • 1:22 - 1:27
    program najprv analyzuje vetnú syntax,
    teda gramatickú štruktúru,
  • 1:27 - 1:30
    tým, že deti identifikuje ako podmet
  • 1:30 - 1:32
    a zvyšok vety ako prísudok,
  • 1:32 - 1:34
    ktorý pozostáva zo slova "jesť" (eat)
  • 1:34 - 1:37
    a priamy predmet - "muffiny" (muffins).
  • 1:37 - 1:40
    Potom potrebuje rozoznať
    anglickú morfológiu,
  • 1:40 - 1:45
    čiže to, ako sa jazyk môže rozdeliť
    na najmenšie zmysluplné jednotky,
  • 1:45 - 1:46
    ako je slovo muffin
  • 1:46 - 1:50
    a prípona -s, ktorá sa používa
    na označenie množného čísla.
  • 1:50 - 1:52
    Nakoniec potrebuje porozumieť sémantike,
  • 1:52 - 1:56
    čiže tomu, čo vlastne znamenajú
    rôzne časti vety.
  • 1:56 - 1:58
    Aby program túto vetu preložil správne,
  • 1:58 - 2:02
    odkáže na rôzne sady slovnej
    zásoby a pravidiel,
  • 2:02 - 2:05
    a to pre každý prvok cieľového jazyka.
  • 2:05 - 2:07
    Ale tu sa to zamotáva.
  • 2:07 - 2:12
    Syntax niektorých jazykov umožňuje,
    aby sa slová zoradili do rôzneho poradia,
  • 2:12 - 2:17
    kým v iných jazykoch by z toho
    vzniklo, že muffiny jedia deti.
  • 2:17 - 2:20
    Problémom môže byť aj morfológia.
  • 2:20 - 2:23
    Slovinčina rozlišuje medzi dvoma
    deťmi a troma a viacerými
  • 2:23 - 2:27
    pomocou prípony, ktorá
    v ostatných jazykoch nie je,
  • 2:27 - 2:31
    kým neprítomnosť určitých členov
    v ruštine môže spôsobiť, že neviete,
  • 2:31 - 2:34
    či deti jedia nejaké určité muffiny,
  • 2:34 - 2:36
    alebo len vo všeobecnosti jedia muffiny.
  • 2:36 - 2:40
    Nakoniec, dokonca aj keď je sémantika
    technicky správna,
  • 2:40 - 2:43
    program by mohol opomenúť
    niektoré jemnejšie narážky,
  • 2:43 - 2:46
    napríklad, či deti „margiano“
    tie muffiny,
  • 2:46 - 2:48
    alebo či ich „divorano“.
  • 2:48 - 2:52
    Ďalšou metódou je strojový
    preklad pomocou štatistiky,
  • 2:52 - 2:56
    ktorý analyzuje databázu kníh,
    článkov a dokumentov,
  • 2:56 - 2:59
    ktoré už boli preložené ľuďmi.
  • 2:59 - 3:03
    Hľadaním zhody medzi zdrojom
    a preloženými textami,
  • 3:03 - 3:05
    pri ktorých nie je pravdepodobné,
    že sa vyskytnú náhodou,
  • 3:05 - 3:09
    program vie identifikovať zodpovedajúce
    frázy a vzory
  • 3:09 - 3:12
    a využiť ich pri budúcich prekladoch.
  • 3:12 - 3:15
    Avšak kvalita takéhoto typu prekladu
  • 3:15 - 3:18
    závisí od veľkosti počiatočnej databázy
  • 3:18 - 3:21
    a dostupnosti vzoriek
    niektorých jazykov
  • 3:21 - 3:23
    alebo štýlov písania.
  • 3:23 - 3:27
    Problém, ktorý majú počítače
    s výnimkami, odchýlkami
  • 3:27 - 3:31
    a odtienkami zmyslu, ktoré sú pre ľudí
    očividne inštinktívnejšie,
  • 3:31 - 3:35
    niektorých vedcov viedol k názoru,
    že naše chápanie jazyka
  • 3:35 - 3:39
    je jedinečným produktom
    našej biologickej štruktúry mozgu.
  • 3:39 - 3:43
    Vlastne jeden z najslávnejších fiktívnych
    univerzálnych prekladačov,
  • 3:43 - 3:46
    babylonská rybka z knihy
    „Stopárov sprievodca galaxiou“,
  • 3:46 - 3:50
    nie je stroj, ale malý tvor,
  • 3:50 - 3:54
    ktorý prekladá mozgové vlny
    a nervové signály vnímavých tvorov
  • 3:54 - 3:57
    formou telepatie.
  • 3:57 - 4:00
    Učenie jazyka starým
    spôsobom vám momentálne
  • 4:00 - 4:05
    poskytne lepšie výsledky
    ako akýkoľvek dostupný počítačový program.
  • 4:05 - 4:07
    Ale nie je to ľahká úloha,
  • 4:07 - 4:09
    a už len počet jazykov na svete
  • 4:09 - 4:13
    a zväčšujúca sa interakcia
    medzi ľuďmi, ktorí nimi hovoria,
  • 4:13 - 4:18
    bude len podporovať väčšie pokroky
    v automatickom preklade.
  • 4:18 - 4:21
    Možno kým sa stretneme
    s intergalaktickými formami života,
  • 4:21 - 4:25
    s nimi budeme vedieť
    komunikovať cez malé niečo,
  • 4:25 - 4:29
    alebo možno začneme
    aj tak vytvárať ten slovník.
Title:
Ako počítače prekladajú ľudský jazyk - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Celá lekcia: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Je v skutočnom živote možný univerzálny prekladač? Už teraz máme veľa programov, ktoré o sebe tvrdia, že vedia zobrať slovo, vetu či celú knihu v jednom jazyku a preložiť ju do takmer akéhokoľvek jazyka. Realita je však trochu komplikovanejšia. Ioannis Papachimonas ukáže, ako tieto strojové prekladače fungujú, a vysvetľuje, prečo často domotajú texty.

Lekcia: Ioannis Papachimonas, animácia: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Slovak subtitles

Revisions