1 00:00:06,677 --> 00:00:11,306 Как така всички междугалактични видове във филмите и по телевизията 2 00:00:11,306 --> 00:00:14,483 говорят перфектен английски език? 3 00:00:14,483 --> 00:00:17,886 Накратко, никой не иска да гледа как екипаж на космически кораб 4 00:00:17,886 --> 00:00:21,774 прекарва години да съставя речник за извънземни. 5 00:00:21,774 --> 00:00:23,392 За да е достоверно, 6 00:00:23,392 --> 00:00:26,789 създателите на "Стар Трек", и на други научнофантастични светове, 7 00:00:26,789 --> 00:00:30,514 въвеждат концепцията за универсален преводач, 8 00:00:30,514 --> 00:00:35,012 преносимо устройство, което превежда от всеки език на момента. 9 00:00:35,012 --> 00:00:38,539 Може ли реално да съществува такъв универсален преводач? 10 00:00:38,539 --> 00:00:42,137 Вече имаме много програми, които претендират, че правят това - 11 00:00:42,137 --> 00:00:45,954 вземат дума, изречение или цяла книга на един език 12 00:00:45,954 --> 00:00:49,004 и я превеждат на почти всеки друг език, 13 00:00:49,004 --> 00:00:52,337 независимо дали е на съвременен английски, или на древен санскрит. 14 00:00:52,337 --> 00:00:55,913 Ако преводът беше просто проверка на думи в речника, 15 00:00:55,913 --> 00:00:59,825 тези програми със сигурност ще надминат хората. 16 00:00:59,825 --> 00:01:03,299 Реалността обаче е малко по-сложна. 17 00:01:03,299 --> 00:01:07,349 Програмата за машинен превод, базиран на правила, ползва база с лексика, 18 00:01:07,349 --> 00:01:10,302 която включва всички думи, които бихте намерили в речник, 19 00:01:10,302 --> 00:01:13,283 и всичките им възможни граматични форми, 20 00:01:13,283 --> 00:01:18,925 плюс редица от правила за разпознаване на базови езикови елементи в изходния език. 21 00:01:18,925 --> 00:01:22,396 За на пръв поглед просто изречение като: "Децата ядат кексчетата", 22 00:01:22,396 --> 00:01:27,050 програмата първо анализира синтаксиса, или граматическата структура, 23 00:01:27,050 --> 00:01:29,587 като разпознава "децата" като подлога, 24 00:01:29,587 --> 00:01:32,317 а останалата част от изречението като сказуемото, 25 00:01:32,317 --> 00:01:34,368 състоящо се от глагола "ядат" 26 00:01:34,368 --> 00:01:37,422 и прякото допълнение "кексчетата". 27 00:01:37,422 --> 00:01:40,249 След това разпознава морфологията на английския език - 28 00:01:40,249 --> 00:01:44,681 тоест как езикът се разбива на най-малките си смислови частици. 29 00:01:44,681 --> 00:01:46,124 Например, при думата "кекс", 30 00:01:46,124 --> 00:01:49,755 където наставката "и" показва множественото число. 31 00:01:49,755 --> 00:01:52,449 Най-накрая, трябва да разбере семантиката, 32 00:01:52,449 --> 00:01:56,178 тоест какво означават различните части на изречението. 33 00:01:56,178 --> 00:01:58,074 За да преведе правилно това изречение, 34 00:01:58,074 --> 00:02:01,982 програмата ще използва набор от думи и правила 35 00:02:01,982 --> 00:02:05,166 за всеки един елемент от целевия език. 36 00:02:05,166 --> 00:02:07,020 Точно тук става сложно. 37 00:02:07,020 --> 00:02:11,820 Синтаксисът на някои езици позволява думите да местят мястото си в изречението. 38 00:02:11,820 --> 00:02:16,954 При други езици, разместването ще доведе до това, че кексчето ще изяде детето. 39 00:02:16,954 --> 00:02:19,647 Морфологията също може да е проблем. 40 00:02:19,647 --> 00:02:23,243 Словенският език разграничава думи за две, три или повече деца, 41 00:02:23,243 --> 00:02:27,097 използвайки наставка за двойствено число, която липсва в много други езици. 42 00:02:27,097 --> 00:02:30,532 Руският език няма определителен член, което ще ви накара да се чудите 43 00:02:30,532 --> 00:02:33,575 дали децата ядат точно определени кексчета, 44 00:02:33,575 --> 00:02:36,719 или по принцип обичат да ядат кексчета. 45 00:02:36,719 --> 00:02:39,708 Накрая, дори семантиката да е технически правилна, 46 00:02:39,708 --> 00:02:42,757 програмата може да пропусне по-фините моменти, 47 00:02:42,757 --> 00:02:45,809 като например дали децата "ядат" кексчетата, 48 00:02:45,809 --> 00:02:47,794 или ги "поглъщат" лакомо. 49 00:02:47,794 --> 00:02:51,558 Друг метод е статистическият машинен превод, 50 00:02:51,558 --> 00:02:55,762 при който се анализира база от книги, статии и документи, 51 00:02:55,762 --> 00:02:59,488 които вече са били преведени от хора. 52 00:02:59,488 --> 00:03:02,959 Като намира съвпадения между изходния и преведения текст, 53 00:03:02,959 --> 00:03:05,393 които трудно биха се комбинирали случайно, 54 00:03:05,393 --> 00:03:09,345 програмата идентифицира съответните фрази и модели 55 00:03:09,345 --> 00:03:12,429 и ги използва при бъдещи преводи. 56 00:03:12,429 --> 00:03:14,969 Качеството на този вид преводи 57 00:03:14,969 --> 00:03:17,690 зависи от големината на първоначалната база данни, 58 00:03:17,690 --> 00:03:21,357 от количеството модели за всеки език, 59 00:03:21,357 --> 00:03:23,383 както и от стиловете на писане. 60 00:03:23,383 --> 00:03:27,140 Трудностите, които компютрите изпитват с изключенията, неправилните форми 61 00:03:27,140 --> 00:03:30,994 и нюансите в значението, хората долавят несъзнателно. 62 00:03:30,994 --> 00:03:35,045 Това кара учените да вярват, че начинът, по който разбираме езика, 63 00:03:35,045 --> 00:03:39,251 е уникален продукт на биологичната структура на мозъка. 64 00:03:39,251 --> 00:03:43,101 Всъщност, един от най-известните универсални преводачи - 65 00:03:43,101 --> 00:03:46,439 Вавилонската рибка от "Пътеводител на галактическия стопаджия" 66 00:03:46,439 --> 00:03:49,726 изобщо не е машина, а малко същество, 67 00:03:49,726 --> 00:03:54,210 което "превежда" мисловните вълни и сигналите от нервите на мислещите видове 68 00:03:54,210 --> 00:03:57,005 чрез форма на телепатия. 69 00:03:57,005 --> 00:03:59,726 Засега ученето на език по старомодния начин 70 00:03:59,726 --> 00:04:05,106 ще ви даде по-добри резултати от наличните компютърни програми. 71 00:04:05,106 --> 00:04:06,749 Но това не е лесна работа, 72 00:04:06,749 --> 00:04:09,014 а неясното количество езици по света, 73 00:04:09,014 --> 00:04:12,989 както и нарастващото взаимодействие между хората, които ги говорят, 74 00:04:12,989 --> 00:04:18,004 продължава да стимулира напредването на автоматичния превод. 75 00:04:18,004 --> 00:04:21,409 Може би, докато открием междугалактически форми на живот, 76 00:04:21,409 --> 00:04:24,660 вече ще можем да общуваме с тях чрез малки уреди 77 00:04:24,660 --> 00:04:29,026 или все пак може да се наложи да съставяме извънземен речник.