Return to Video

Jak komputery tłumaczą języki naturalne - Ioannis Papachimonas

  • 0:07 - 0:11
    Jak to możliwe, że w telewizji
    tak wiele międzygalaktycznych ras
  • 0:11 - 0:14
    mówi doskonale po angielsku?
  • 0:14 - 0:18
    Po prostu nikt nie chce oglądać
    załogi statku kosmicznego
  • 0:18 - 0:22
    tworzącej latami słownik języka kosmitów.
  • 0:22 - 0:23
    Dla porządku trzeba wspomnieć,
  • 0:23 - 0:27
    że twórcy Star Treka
    i innych światów science-fiction,
  • 0:27 - 0:31
    wprowadzili ideę
    uniwersalnego translatora,
  • 0:31 - 0:35
    przenośnego urządzenia
    tłumaczącego na dowolny język.
  • 0:35 - 0:39
    Czy taki wynalazek jest w ogóle realny?
  • 0:39 - 0:42
    Istnieje wiele programów,
    które mają to właśnie robić:
  • 0:42 - 0:46
    wziąć z jednego języka słowo,
    zdanie, a nawet całą książkę
  • 0:46 - 0:49
    i przełożyć na niemal każdy inny język,
  • 0:49 - 0:52
    zarówno współczesny angielski,
    jak i starożytny sanskryt.
  • 0:52 - 0:56
    Gdyby tłumaczenie polegało jedynie
    na wyszukiwaniu słów w słowniku,
  • 0:56 - 1:00
    programy te byłyby lepsze
    od tłumacza-człowieka.
  • 1:00 - 1:03
    W rzeczywistości jest to
    bardziej skomplikowane.
  • 1:03 - 1:07
    Program o systemie regułowym
    korzysta z leksykalnej bazy danych
  • 1:07 - 1:10
    zawierającej wszystkie słowa ze słownika,
  • 1:10 - 1:13
    ich wszystkie formy gramatyczne
  • 1:13 - 1:19
    oraz zbiór zasad gramatycznych
    do rozpoznawania elementów języka.
  • 1:19 - 1:22
    W pozornie prostym zdaniu:
    "Dzieci jedzą muffinki",
  • 1:22 - 1:27
    program najpierw analizuje składnię
    albo strukturę gramatyczną,
  • 1:27 - 1:30
    rozpoznając "dzieci" jako podmiot,
  • 1:30 - 1:32
    a resztę zdania jako orzeczenie,
  • 1:32 - 1:34
    składające się z czasownika "jeść",
  • 1:34 - 1:37
    oraz dopełnienia bliższego "muffinki".
  • 1:37 - 1:40
    Potem musi rozpoznać angielską morfologię,
  • 1:40 - 1:45
    czyli jak można rozbić język
    na najmniejsze elementy znaczeniowe,
  • 1:45 - 1:46
    takie jak słowo muffinka
  • 1:46 - 1:50
    i "s", angielski sufiks liczby mnogiej.
  • 1:50 - 1:52
    Wreszcie musi zrozumieć semantykę,
  • 1:52 - 1:56
    czyli co właściwie znaczą
    poszczególne części zdania.
  • 1:56 - 1:58
    Żeby przetłumaczyć to zdanie prawidłowo,
  • 1:58 - 2:02
    program odniesie się do innego
    słownictwa oraz zasad gramatycznych
  • 2:02 - 2:05
    dla każdego elementu w języku docelowym.
  • 2:05 - 2:07
    Tutaj sprawy zaczynają się komplikować.
  • 2:07 - 2:12
    Składnia niektórych języków
    pozwala dowolnie zmieniać szyk zdania,
  • 2:12 - 2:17
    a w innych po zmianie szyku
    okazałoby się, że muffinki jedzą dzieci.
  • 2:17 - 2:20
    Morfologia też może stanowić problem.
  • 2:20 - 2:23
    Słoweński rozróżnia między dwójką
    a trójką i więcej dzieci
  • 2:23 - 2:27
    za pomocą sufiksu liczby podwójnej,
    nieobecnej w wielu językach.
  • 2:27 - 2:31
    W rosyjskim brak przedimków określonych
  • 2:31 - 2:34
    powoduje, że nie wiemy,
    czy dzieci jedzą konkretne muffinki,
  • 2:34 - 2:37
    czy jadają je w ogóle.
  • 2:37 - 2:40
    Wreszcie, nawet gdy znaczenie
    jest technicznie poprawne,
  • 2:40 - 2:43
    program może przeoczyć
    drobne różnice znaczeniowe,
  • 2:43 - 2:46
    jak to, czy dzieci "jedzą" muffinki,
  • 2:46 - 2:48
    czy je "pożerają".
  • 2:48 - 2:52
    Inną metodą jest statystyczne
    tłumaczenie maszynowe,
  • 2:52 - 2:56
    czyli analiza bazy danych
    z książkami, artykułami i dokumentami,
  • 2:56 - 2:59
    które wcześniej zostały
    przetłumaczone przez człowieka.
  • 2:59 - 3:03
    Wyszukując dopasowania między źródłem
    a przetłumaczonym tekstem,
  • 3:03 - 3:05
    które raczej nie pojawiają się
    przez przypadek,
  • 3:05 - 3:09
    program może rozpoznać
    odpowiadające sobie frazy i wzory
  • 3:09 - 3:12
    i wykorzystać je potem w tłumaczeniach.
  • 3:12 - 3:15
    Jednak jakość takiego tłumaczenia
  • 3:15 - 3:18
    zależy od wielkości bazy danych
  • 3:18 - 3:21
    oraz dostępności próbek
    dla poszczególnych języków
  • 3:21 - 3:23
    lub stylów pisania.
  • 3:23 - 3:27
    Problemy, jakie komputery mają
    z wyjątkami, nieregularnościami
  • 3:27 - 3:31
    i odcieniami znaczeniowymi
    zrozumiałymi tylko dla człowieka,
  • 3:31 - 3:35
    doprowadziły pewnych badaczy do wniosku,
    że rozumienie przez nas języka
  • 3:35 - 3:39
    jest wytworem biologicznej
    struktury naszego mózgu.
  • 3:39 - 3:43
    Jeden z najbardziej znanych
    fikcyjnych uniwersalnych translatorów,
  • 3:43 - 3:46
    Ryba Babel z "Autostopem przez galaktykę",
  • 3:46 - 3:50
    nie jest maszyną, ale stworzonkiem,
  • 3:50 - 3:54
    które tłumaczy fale mózgowe
    i sygnały nerwowe czujących istot
  • 3:54 - 3:57
    za pomocą telepatii.
  • 3:57 - 4:00
    Na razie nauka języków
    w tradycyjny sposób
  • 4:00 - 4:05
    wciąż da nam lepsze wyniki
    niż jakikolwiek dostępny program.
  • 4:05 - 4:07
    To niełatwe zadanie,
  • 4:07 - 4:09
    a ogromna ilość języków na świecie
  • 4:09 - 4:13
    i coraz więcej interakcji
    między ich użytkownikami
  • 4:13 - 4:18
    pozostanie bodźcem do dalszego rozwoju
    tłumaczenia automatycznego.
  • 4:18 - 4:21
    Być może do czasu, gdy spotkamy
    obcych z innych galaktyk,
  • 4:21 - 4:25
    będziemy mogli porozmawiać z nimi
    za pomocą maleńkiego gadżetu,
  • 4:25 - 4:29
    a może będziemy musieli
    i tak sporządzić słownik.
Title:
Jak komputery tłumaczą języki naturalne - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Zobacz całą lekcję: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Czy uniwersalny translator jest w ogóle realny? Obecnie jest wiele programów, które mają przetłumaczyć dowolne słowo, zdanie czy nawet całą książkę z jednego języka na drugi. W rzeczywistości jednak jest to trochę bardziej skomplikowane. Ioannis Papachimonas przedstawia, jak działa tłumaczenie maszynowe i wyjaśnia, dlaczego jego wyniki często są nieco pogmatwane.

Lekcja: Ioannis Papachimonas, animacja: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Polish subtitles

Revisions