Return to Video

Как компютрите превеждат човешкия език? - Йоанис Папахимонас

  • 0:07 - 0:11
    Как така всички междугалактични видове
    във филмите и по телевизията
  • 0:11 - 0:14
    говорят перфектен английски език?
  • 0:14 - 0:18
    Накратко, никой не иска да гледа
    как екипаж на космически кораб
  • 0:18 - 0:22
    прекарва години да съставя
    речник за извънземни.
  • 0:22 - 0:23
    За да е достоверно,
  • 0:23 - 0:27
    създателите на "Стар Трек",
    и на други научнофантастични светове,
  • 0:27 - 0:31
    въвеждат концепцията
    за универсален преводач,
  • 0:31 - 0:35
    преносимо устройство,
    което превежда от всеки език на момента.
  • 0:35 - 0:39
    Може ли реално да съществува
    такъв универсален преводач?
  • 0:39 - 0:42
    Вече имаме много програми,
    които претендират, че правят това -
  • 0:42 - 0:46
    вземат дума, изречение или цяла книга
    на един език
  • 0:46 - 0:49
    и я превеждат на почти всеки друг език,
  • 0:49 - 0:52
    независимо дали е на съвременен английски,
    или на древен санскрит.
  • 0:52 - 0:56
    Ако преводът беше просто
    проверка на думи в речника,
  • 0:56 - 1:00
    тези програми със сигурност
    ще надминат хората.
  • 1:00 - 1:03
    Реалността обаче е малко по-сложна.
  • 1:03 - 1:07
    Програмата за машинен превод,
    базиран на правила, ползва база с лексика,
  • 1:07 - 1:10
    която включва всички думи,
    които бихте намерили в речник,
  • 1:10 - 1:13
    и всичките им възможни граматични форми,
  • 1:13 - 1:19
    плюс редица от правила за разпознаване на
    базови езикови елементи в изходния език.
  • 1:19 - 1:22
    За на пръв поглед просто изречение като:
    "Децата ядат кексчетата",
  • 1:22 - 1:27
    програмата първо анализира синтаксиса,
    или граматическата структура,
  • 1:27 - 1:30
    като разпознава "децата" като подлога,
  • 1:30 - 1:32
    а останалата част от изречението
    като сказуемото,
  • 1:32 - 1:34
    състоящо се от глагола "ядат"
  • 1:34 - 1:37
    и прякото допълнение "кексчетата".
  • 1:37 - 1:40
    След това разпознава морфологията
    на английския език -
  • 1:40 - 1:45
    тоест как езикът се разбива
    на най-малките си смислови частици.
  • 1:45 - 1:46
    Например, при думата "кекс",
  • 1:46 - 1:50
    където наставката "и"
    показва множественото число.
  • 1:50 - 1:52
    Най-накрая, трябва да разбере семантиката,
  • 1:52 - 1:56
    тоест какво означават
    различните части на изречението.
  • 1:56 - 1:58
    За да преведе правилно това изречение,
  • 1:58 - 2:02
    програмата ще използва
    набор от думи и правила
  • 2:02 - 2:05
    за всеки един елемент от целевия език.
  • 2:05 - 2:07
    Точно тук става сложно.
  • 2:07 - 2:12
    Синтаксисът на някои езици позволява
    думите да местят мястото си в изречението.
  • 2:12 - 2:17
    При други езици, разместването ще доведе
    до това, че кексчето ще изяде детето.
  • 2:17 - 2:20
    Морфологията също може да е проблем.
  • 2:20 - 2:23
    Словенският език разграничава думи
    за две, три или повече деца,
  • 2:23 - 2:27
    използвайки наставка за двойствено число,
    която липсва в много други езици.
  • 2:27 - 2:31
    Руският език няма определителен член,
    което ще ви накара да се чудите
  • 2:31 - 2:34
    дали децата ядат точно определени кексчета,
  • 2:34 - 2:37
    или по принцип обичат да ядат кексчета.
  • 2:37 - 2:40
    Накрая, дори семантиката
    да е технически правилна,
  • 2:40 - 2:43
    програмата може да пропусне
    по-фините моменти,
  • 2:43 - 2:46
    като например дали децата
    "ядат" кексчетата,
  • 2:46 - 2:48
    или ги "поглъщат" лакомо.
  • 2:48 - 2:52
    Друг метод е
    статистическият машинен превод,
  • 2:52 - 2:56
    при който се анализира
    база от книги, статии и документи,
  • 2:56 - 2:59
    които вече са били преведени от хора.
  • 2:59 - 3:03
    Като намира съвпадения между
    изходния и преведения текст,
  • 3:03 - 3:05
    които трудно биха се комбинирали случайно,
  • 3:05 - 3:09
    програмата идентифицира
    съответните фрази и модели
  • 3:09 - 3:12
    и ги използва при бъдещи преводи.
  • 3:12 - 3:15
    Качеството на този вид преводи
  • 3:15 - 3:18
    зависи от големината на
    първоначалната база данни,
  • 3:18 - 3:21
    от количеството модели за всеки език,
  • 3:21 - 3:23
    както и от стиловете на писане.
  • 3:23 - 3:27
    Трудностите, които компютрите изпитват с
    изключенията, неправилните форми
  • 3:27 - 3:31
    и нюансите в значението,
    хората долавят несъзнателно.
  • 3:31 - 3:35
    Това кара учените да вярват,
    че начинът, по който разбираме езика,
  • 3:35 - 3:39
    е уникален продукт на
    биологичната структура на мозъка.
  • 3:39 - 3:43
    Всъщност, един от най-известните
    универсални преводачи -
  • 3:43 - 3:46
    Вавилонската рибка от
    "Пътеводител на галактическия стопаджия"
  • 3:46 - 3:50
    изобщо не е машина, а малко същество,
  • 3:50 - 3:54
    което "превежда" мисловните вълни
    и сигналите от нервите на мислещите видове
  • 3:54 - 3:57
    чрез форма на телепатия.
  • 3:57 - 4:00
    Засега ученето на език
    по старомодния начин
  • 4:00 - 4:05
    ще ви даде по-добри резултати
    от наличните компютърни програми.
  • 4:05 - 4:07
    Но това не е лесна работа,
  • 4:07 - 4:09
    а неясното количество езици по света,
  • 4:09 - 4:13
    както и нарастващото взаимодействие
    между хората, които ги говорят,
  • 4:13 - 4:18
    продължава да стимулира
    напредването на автоматичния превод.
  • 4:18 - 4:21
    Може би, докато открием
    междугалактически форми на живот,
  • 4:21 - 4:25
    вече ще можем да общуваме с тях
    чрез малки уреди
  • 4:25 - 4:29
    или все пак може да се наложи
    да съставяме извънземен речник.
Title:
Как компютрите превеждат човешкия език? - Йоанис Папахимонас
Speaker:
Ioannis Papachimonas
Description:

Вижте пълната версия на урока тук: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Възможен ли е реално универсалният преводач? Вече разполагаме с много програми, които претендират, че могат да вземат дума, изречение или цяла книга и да ги преведат на почти всеки друг език. Реалността обаче е малко по-сложна. Йоанис Папахимонас ни показва как работи машинният превод и обяснява защо той често е пълен с грешки.

Урок от Йоанис Папахимонас, анимация: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Bulgarian subtitles

Revisions