WEBVTT 00:00:06.677 --> 00:00:11.306 Jak to możliwe, że w telewizji tak wiele międzygalaktycznych ras 00:00:11.306 --> 00:00:14.483 mówi doskonale po angielsku? 00:00:14.483 --> 00:00:17.886 Po prostu nikt nie chce oglądać załogi statku kosmicznego 00:00:17.886 --> 00:00:21.774 tworzącej latami słownik języka kosmitów. 00:00:21.774 --> 00:00:23.392 Dla porządku trzeba wspomnieć, 00:00:23.392 --> 00:00:26.789 że twórcy Star Treka i innych światów science-fiction, 00:00:26.789 --> 00:00:30.514 wprowadzili ideę uniwersalnego translatora, 00:00:30.514 --> 00:00:35.012 przenośnego urządzenia tłumaczącego na dowolny język. 00:00:35.012 --> 00:00:38.539 Czy taki wynalazek jest w ogóle realny? 00:00:38.539 --> 00:00:42.137 Istnieje wiele programów, które mają to właśnie robić: 00:00:42.137 --> 00:00:45.954 wziąć z jednego języka słowo, zdanie, a nawet całą książkę 00:00:45.954 --> 00:00:49.004 i przełożyć na niemal każdy inny język, 00:00:49.004 --> 00:00:52.337 zarówno współczesny angielski, jak i starożytny sanskryt. 00:00:52.337 --> 00:00:55.913 Gdyby tłumaczenie polegało jedynie na wyszukiwaniu słów w słowniku, 00:00:55.913 --> 00:00:59.825 programy te byłyby lepsze od tłumacza-człowieka. 00:00:59.825 --> 00:01:03.299 W rzeczywistości jest to bardziej skomplikowane. 00:01:03.299 --> 00:01:07.349 Program o systemie regułowym korzysta z leksykalnej bazy danych 00:01:07.349 --> 00:01:10.302 zawierającej wszystkie słowa ze słownika, 00:01:10.302 --> 00:01:13.283 ich wszystkie formy gramatyczne 00:01:13.283 --> 00:01:18.925 oraz zbiór zasad gramatycznych do rozpoznawania elementów języka. 00:01:18.925 --> 00:01:22.396 W pozornie prostym zdaniu: "Dzieci jedzą muffinki", 00:01:22.396 --> 00:01:27.050 program najpierw analizuje składnię albo strukturę gramatyczną, 00:01:27.050 --> 00:01:29.587 rozpoznając "dzieci" jako podmiot, 00:01:29.587 --> 00:01:32.317 a resztę zdania jako orzeczenie, 00:01:32.317 --> 00:01:34.368 składające się z czasownika "jeść", 00:01:34.368 --> 00:01:37.422 oraz dopełnienia bliższego "muffinki". 00:01:37.422 --> 00:01:40.249 Potem musi rozpoznać angielską morfologię, 00:01:40.249 --> 00:01:44.681 czyli jak można rozbić język na najmniejsze elementy znaczeniowe, 00:01:44.681 --> 00:01:46.124 takie jak słowo muffinka 00:01:46.124 --> 00:01:49.755 i "s", angielski sufiks liczby mnogiej. 00:01:49.755 --> 00:01:52.449 Wreszcie musi zrozumieć semantykę, 00:01:52.449 --> 00:01:56.178 czyli co właściwie znaczą poszczególne części zdania. 00:01:56.178 --> 00:01:58.124 Żeby przetłumaczyć to zdanie prawidłowo, 00:01:58.124 --> 00:02:01.982 program odniesie się do innego słownictwa oraz zasad gramatycznych 00:02:01.982 --> 00:02:05.166 dla każdego elementu w języku docelowym. 00:02:05.166 --> 00:02:07.020 Tutaj sprawy zaczynają się komplikować. 00:02:07.020 --> 00:02:11.820 Składnia niektórych języków pozwala dowolnie zmieniać szyk zdania, 00:02:11.820 --> 00:02:16.954 a w innych po zmianie szyku okazałoby się, że muffinki jedzą dzieci. 00:02:16.954 --> 00:02:19.647 Morfologia też może stanowić problem. 00:02:19.647 --> 00:02:23.243 Słoweński rozróżnia między dwójką a trójką i więcej dzieci 00:02:23.243 --> 00:02:27.097 za pomocą sufiksu liczby podwójnej, nieobecnej w wielu językach. 00:02:27.097 --> 00:02:30.532 W rosyjskim brak przedimków określonych 00:02:30.532 --> 00:02:33.575 powoduje, że nie wiemy, czy dzieci jedzą konkretne muffinki, 00:02:33.575 --> 00:02:36.719 czy jadają je w ogóle. 00:02:36.719 --> 00:02:39.708 Wreszcie, nawet gdy znaczenie jest technicznie poprawne, 00:02:39.708 --> 00:02:42.757 program może przeoczyć drobne różnice znaczeniowe, 00:02:42.757 --> 00:02:45.809 jak to, czy dzieci "jedzą" muffinki, 00:02:45.809 --> 00:02:47.794 czy je "pożerają". 00:02:47.794 --> 00:02:51.558 Inną metodą jest statystyczne tłumaczenie maszynowe, 00:02:51.558 --> 00:02:55.762 czyli analiza bazy danych z książkami, artykułami i dokumentami, 00:02:55.762 --> 00:02:59.488 które wcześniej zostały przetłumaczone przez człowieka. 00:02:59.488 --> 00:03:02.959 Wyszukując dopasowania między źródłem a przetłumaczonym tekstem, 00:03:02.959 --> 00:03:05.393 które raczej nie pojawiają się przez przypadek, 00:03:05.393 --> 00:03:09.345 program może rozpoznać odpowiadające sobie frazy i wzory 00:03:09.345 --> 00:03:12.429 i wykorzystać je potem w tłumaczeniach. 00:03:12.429 --> 00:03:14.969 Jednak jakość takiego tłumaczenia 00:03:14.969 --> 00:03:17.690 zależy od wielkości bazy danych 00:03:17.690 --> 00:03:21.357 oraz dostępności próbek dla poszczególnych języków 00:03:21.357 --> 00:03:23.383 lub stylów pisania. 00:03:23.383 --> 00:03:27.140 Problemy, jakie komputery mają z wyjątkami, nieregularnościami 00:03:27.140 --> 00:03:30.994 i odcieniami znaczeniowymi zrozumiałymi tylko dla człowieka, 00:03:30.994 --> 00:03:35.045 doprowadziły pewnych badaczy do wniosku, że rozumienie przez nas języka 00:03:35.045 --> 00:03:39.251 jest wytworem biologicznej struktury naszego mózgu. 00:03:39.251 --> 00:03:43.101 Jeden z najbardziej znanych fikcyjnych uniwersalnych translatorów, 00:03:43.101 --> 00:03:46.439 Ryba Babel z "Autostopem przez galaktykę", 00:03:46.439 --> 00:03:49.726 nie jest maszyną, ale stworzonkiem, 00:03:49.726 --> 00:03:54.210 które tłumaczy fale mózgowe i sygnały nerwowe czujących istot 00:03:54.210 --> 00:03:57.005 za pomocą telepatii. 00:03:57.005 --> 00:03:59.726 Na razie nauka języków w tradycyjny sposób 00:03:59.726 --> 00:04:05.106 wciąż da nam lepsze wyniki niż jakikolwiek dostępny program. 00:04:05.106 --> 00:04:06.749 To niełatwe zadanie, 00:04:06.749 --> 00:04:09.014 a ogromna ilość języków na świecie 00:04:09.014 --> 00:04:12.989 i coraz więcej interakcji między ich użytkownikami 00:04:12.989 --> 00:04:18.004 pozostanie bodźcem do dalszego rozwoju tłumaczenia automatycznego. 00:04:18.004 --> 00:04:21.409 Być może do czasu, gdy spotkamy obcych z innych galaktyk, 00:04:21.409 --> 00:04:24.660 będziemy mogli porozmawiać z nimi za pomocą maleńkiego gadżetu, 00:04:24.660 --> 00:04:29.026 a może będziemy musieli i tak sporządzić słownik.