WEBVTT

00:00:06.677 --> 00:00:11.306
Jak to możliwe, że w telewizji
tak wiele międzygalaktycznych ras

00:00:11.306 --> 00:00:14.483
mówi doskonale po angielsku?

00:00:14.483 --> 00:00:17.886
Po prostu nikt nie chce oglądać
załogi statku kosmicznego

00:00:17.886 --> 00:00:21.774
tworzącej latami słownik języka kosmitów.

00:00:21.774 --> 00:00:23.392
Dla porządku trzeba wspomnieć,

00:00:23.392 --> 00:00:26.789
że twórcy Star Treka
i innych światów science-fiction,

00:00:26.789 --> 00:00:30.514
wprowadzili ideę
uniwersalnego translatora,

00:00:30.514 --> 00:00:35.012
przenośnego urządzenia
tłumaczącego na dowolny język.

00:00:35.012 --> 00:00:38.539
Czy taki wynalazek jest w ogóle realny?

00:00:38.539 --> 00:00:42.137
Istnieje wiele programów, 
które mają to właśnie robić:

00:00:42.137 --> 00:00:45.954
wziąć z jednego języka słowo,
zdanie, a nawet całą książkę

00:00:45.954 --> 00:00:49.004
i przełożyć na niemal każdy inny język,

00:00:49.004 --> 00:00:52.337
zarówno współczesny angielski,
jak i starożytny sanskryt.

00:00:52.337 --> 00:00:55.913
Gdyby tłumaczenie polegało jedynie
na wyszukiwaniu słów w słowniku,

00:00:55.913 --> 00:00:59.825
programy te byłyby lepsze
od tłumacza-człowieka.

00:00:59.825 --> 00:01:03.299
W rzeczywistości jest to
bardziej skomplikowane.

00:01:03.299 --> 00:01:07.349
Program o systemie regułowym
korzysta z leksykalnej bazy danych

00:01:07.349 --> 00:01:10.302
zawierającej wszystkie słowa ze słownika,

00:01:10.302 --> 00:01:13.283
ich wszystkie formy gramatyczne

00:01:13.283 --> 00:01:18.925
oraz zbiór zasad gramatycznych
do rozpoznawania elementów języka.

00:01:18.925 --> 00:01:22.396
W pozornie prostym zdaniu:
"Dzieci jedzą muffinki",

00:01:22.396 --> 00:01:27.050
program najpierw analizuje składnię
albo strukturę gramatyczną,

00:01:27.050 --> 00:01:29.587
rozpoznając "dzieci" jako podmiot,

00:01:29.587 --> 00:01:32.317
a resztę zdania jako orzeczenie,

00:01:32.317 --> 00:01:34.368
składające się z czasownika "jeść",

00:01:34.368 --> 00:01:37.422
oraz dopełnienia bliższego "muffinki".

00:01:37.422 --> 00:01:40.249
Potem musi rozpoznać angielską morfologię,

00:01:40.249 --> 00:01:44.681
czyli jak można rozbić język
na najmniejsze elementy znaczeniowe,

00:01:44.681 --> 00:01:46.124
takie jak słowo muffinka

00:01:46.124 --> 00:01:49.755
i "s", angielski sufiks liczby mnogiej.

00:01:49.755 --> 00:01:52.449
Wreszcie musi zrozumieć semantykę,

00:01:52.449 --> 00:01:56.178
czyli co właściwie znaczą 
poszczególne części zdania.

00:01:56.178 --> 00:01:58.124
Żeby przetłumaczyć to zdanie prawidłowo,

00:01:58.124 --> 00:02:01.982
program odniesie się do innego
słownictwa oraz zasad gramatycznych

00:02:01.982 --> 00:02:05.166
dla każdego elementu w języku docelowym.

00:02:05.166 --> 00:02:07.020
Tutaj sprawy zaczynają się komplikować.

00:02:07.020 --> 00:02:11.820
Składnia niektórych języków
pozwala dowolnie zmieniać szyk zdania,

00:02:11.820 --> 00:02:16.954
a w innych po zmianie szyku
okazałoby się, że muffinki jedzą dzieci.

00:02:16.954 --> 00:02:19.647
Morfologia też może stanowić problem.

00:02:19.647 --> 00:02:23.243
Słoweński rozróżnia między dwójką
a trójką i więcej dzieci

00:02:23.243 --> 00:02:27.097
za pomocą sufiksu liczby podwójnej,
nieobecnej w wielu językach.

00:02:27.097 --> 00:02:30.532
W rosyjskim brak przedimków określonych

00:02:30.532 --> 00:02:33.575
powoduje, że nie wiemy,
czy dzieci jedzą konkretne muffinki,

00:02:33.575 --> 00:02:36.719
czy jadają je w ogóle.

00:02:36.719 --> 00:02:39.708
Wreszcie, nawet gdy znaczenie
jest technicznie poprawne,

00:02:39.708 --> 00:02:42.757
program może przeoczyć
drobne różnice znaczeniowe,

00:02:42.757 --> 00:02:45.809
jak to, czy dzieci "jedzą" muffinki,

00:02:45.809 --> 00:02:47.794
czy je "pożerają".

00:02:47.794 --> 00:02:51.558
Inną metodą jest statystyczne
tłumaczenie maszynowe,

00:02:51.558 --> 00:02:55.762
czyli analiza bazy danych
z książkami, artykułami i dokumentami,

00:02:55.762 --> 00:02:59.488
które wcześniej zostały
przetłumaczone przez człowieka.

00:02:59.488 --> 00:03:02.959
Wyszukując dopasowania między źródłem
a przetłumaczonym tekstem,

00:03:02.959 --> 00:03:05.393
które raczej nie pojawiają się
przez przypadek,

00:03:05.393 --> 00:03:09.345
program może rozpoznać 
odpowiadające sobie frazy i wzory

00:03:09.345 --> 00:03:12.429
i wykorzystać je potem w tłumaczeniach.

00:03:12.429 --> 00:03:14.969
Jednak jakość takiego tłumaczenia

00:03:14.969 --> 00:03:17.690
zależy od wielkości bazy danych

00:03:17.690 --> 00:03:21.357
oraz dostępności próbek
dla poszczególnych języków

00:03:21.357 --> 00:03:23.383
lub stylów pisania.

00:03:23.383 --> 00:03:27.140
Problemy, jakie komputery mają
z wyjątkami, nieregularnościami

00:03:27.140 --> 00:03:30.994
i odcieniami znaczeniowymi 
zrozumiałymi tylko dla człowieka,

00:03:30.994 --> 00:03:35.045
doprowadziły pewnych badaczy do wniosku,
że rozumienie przez nas języka

00:03:35.045 --> 00:03:39.251
jest wytworem biologicznej
struktury naszego mózgu.

00:03:39.251 --> 00:03:43.101
Jeden z najbardziej znanych
fikcyjnych uniwersalnych translatorów,

00:03:43.101 --> 00:03:46.439
Ryba Babel z "Autostopem przez galaktykę",

00:03:46.439 --> 00:03:49.726
nie jest maszyną, ale stworzonkiem,

00:03:49.726 --> 00:03:54.210
które tłumaczy fale mózgowe 
i sygnały nerwowe czujących istot

00:03:54.210 --> 00:03:57.005
za pomocą telepatii.

00:03:57.005 --> 00:03:59.726
Na razie nauka języków 
w tradycyjny sposób

00:03:59.726 --> 00:04:05.106
wciąż da nam lepsze wyniki 
niż jakikolwiek dostępny program.

00:04:05.106 --> 00:04:06.749
To niełatwe zadanie,

00:04:06.749 --> 00:04:09.014
a ogromna ilość języków na świecie

00:04:09.014 --> 00:04:12.989
i coraz więcej interakcji
między ich użytkownikami

00:04:12.989 --> 00:04:18.004
pozostanie bodźcem do dalszego rozwoju
tłumaczenia automatycznego.

00:04:18.004 --> 00:04:21.409
Być może do czasu, gdy spotkamy
obcych z innych galaktyk,

00:04:21.409 --> 00:04:24.660
będziemy mogli porozmawiać z nimi
za pomocą maleńkiego gadżetu,

00:04:24.660 --> 00:04:29.026
a może będziemy musieli
i tak sporządzić słownik.