Return to Video

Як комп'ютери перекладають людську мову - Іоанніс Папахімонас

  • 0:07 - 0:11
    Як так сталося, що більшість
    прибульців у кіно та на телебаченні
  • 0:11 - 0:14
    чудово розмовляють англійською?
  • 0:14 - 0:17
    Кажучи відверто, ніхто не
    захоче дивитися,
  • 0:17 - 0:21
    як екіпаж космічного корабля
    роками складає словник інопланетної мови.
  • 0:21 - 0:23
    Але, щоб усе було логічно,
  • 0:23 - 0:27
    творці серіалу "Зоряний шлях"
    та багатьох інших вигаданих світів
  • 0:27 - 0:31
    запропонували концепцію
    універсального перекладача:
  • 0:31 - 0:34
    портативного пристрою, котрий
    може миттєво здійснювати переклад.
  • 0:34 - 0:38
    Та чи насправді можливе існування
    універсального перекладача?
  • 0:38 - 0:42
    У нас вже є багато програм,
    котрі ніби можуть це робити:
  • 0:42 - 0:46
    перекладати слово, речення
    чи цілу книгу з однієї мови
  • 0:46 - 0:49
    майже на будь яку іншу,
    незважаючи на те,
  • 0:49 - 0:52
    чи це сучасна англійська мова,
    чи давній санскрит.
  • 0:52 - 0:56
    Якби переклад полягав лише у пошуку
    відповідного слова у словнику,
  • 0:56 - 1:00
    то ці програми вже давно перевершили б
    перекладачів - людей.
  • 1:00 - 1:03
    Насправді ж, все дещо складніше.
  • 1:03 - 1:07
    Перекладацька програма, базована на
    правилах, використовує лексичну базу даних,
  • 1:07 - 1:10
    до якої включено усі слова,
    котрі можна знайти у словнику
  • 1:10 - 1:13
    і усі варіанти граматичних форм,
    котрих вони можуть набувати,
  • 1:13 - 1:19
    а також ряд правил, аби розпізнати основні
    лінгвістичні елементи вихідної мови.
  • 1:19 - 1:22
    Для, здавалося б, простого речення як
    "Діти їдять кекси"
  • 1:22 - 1:27
    программа спершу аналізує його
    синтаксичну або граматичну структуру,
  • 1:27 - 1:30
    визначаючи, що "діти" - це підмет,
  • 1:30 - 1:32
    а решта речення - предикат,
  • 1:32 - 1:34
    що складається з дієслова "їдять",
  • 1:34 - 1:37
    та прямого додатка "кекси".
  • 1:37 - 1:40
    Далі необхідно врахувати
    морфологію англійської мови,
  • 1:40 - 1:45
    тобто те, як мова поділяється на найменші
    значимі одиниці,
  • 1:45 - 1:46
    такі як корінь "кекс"
  • 1:46 - 1:50
    та закінчення "-и", котре вказує
    на множину.
  • 1:50 - 1:52
    І нарешті, програмі потрібно
    зрозуміти семантику:
  • 1:52 - 1:56
    що саме означають різні
    частини речення.
  • 1:56 - 1:58
    Аби правильно перекласти це речення,
  • 1:58 - 2:02
    програма має проаналізувати
    ряд лексики та правил
  • 2:02 - 2:05
    для кожного елемента мови перекладу.
  • 2:05 - 2:07
    Але ось де собаку зарито.
  • 2:07 - 2:12
    Синтаксична структура деяких мов
    не вимагає чіткого порядку слів у реченні,
  • 2:12 - 2:17
    у той час як у інших, його порушення може
    призвести до того, що кекс з'їсть дитину.
  • 2:17 - 2:20
    Морфологія також може становити проблему.
  • 2:20 - 2:22
    Зокрема у словенській мові
    різниця між 2, 3 чи більше дітьми
  • 2:22 - 2:26
    виражається додаванням подвійного суфіксу,
    що відсутнє у більшості інших мов,
  • 2:26 - 2:31
    а в російській відсутність артиклів
    змусить замислитися,
  • 2:31 - 2:33
    чи діти їдять якісь конкретні кекси,
  • 2:33 - 2:36
    чи взагалі їх їдять.
  • 2:37 - 2:39
    Насамкінець, навіть якщо семантика вірна,
  • 2:39 - 2:42
    програма може не зрозуміти
    декотрих особливостей
  • 2:42 - 2:45
    як, наприклад, використати слово
    "mangiano" чи "divorano",
  • 2:45 - 2:47
    аби позначити дію дітей.
  • 2:47 - 2:51
    Інший метод - це статистичний
    машинний переклад,
  • 2:51 - 2:55
    при якому аналізується база даних
    з книжок, статей та документів
  • 2:55 - 2:58
    вже перекладених людиною.
  • 2:58 - 3:03
    Знаходячи співвідношення між
    текстом оригіналу та перекладу,
  • 3:03 - 3:05
    котрі рідко виникають випадково,
  • 3:05 - 3:09
    програма може виокремити відповідні
    фрази та моделі,
  • 3:09 - 3:12
    котрі будуть використані
    для подальшого перекладу.
  • 3:12 - 3:15
    Тим не менш, якість такого перекладу
  • 3:15 - 3:17
    залежить від вихідної бази даних
  • 3:17 - 3:21
    та наявності зразків для конкретної мови
  • 3:21 - 3:23
    чи стилю мовлення.
  • 3:23 - 3:27
    Складнощі для комп'ютера складають
    виключення, порушення норм
  • 3:27 - 3:31
    та відтінки значень, котрі для людини
    зрозумілі на інстинктивному рівні.
  • 3:31 - 3:35
    Саме це змусило деяких вчених припустити,
    що розуміння мови -
  • 3:35 - 3:39
    це унікальне явище, зумовлене
    біологічною будовою нашого мозку.
  • 3:39 - 3:43
    Насправді, один із найвідоміших
    вигаданих універсальних перекладачів,
  • 3:43 - 3:46
    Вавілонська риба із роману
    "Путівник Галактикою",
  • 3:46 - 3:50
    зовсім не машина, а невеличка істота,
  • 3:50 - 3:54
    котра перекладає мозкові хвилі
    та нервові сигнали розумних істот
  • 3:54 - 3:56
    за допомогою телепатії.
  • 3:56 - 4:00
    На сьогодні, звичне нам
    просте вивчення мови
  • 4:00 - 4:05
    буде більш ефективним, аніж
    будь-яка доступна зараз програма.
  • 4:05 - 4:07
    Але це не просте завдання.
  • 4:07 - 4:09
    А безліч мов у світі
  • 4:09 - 4:13
    та зростання кількості контактів
    між людьми, що ними спілкуються,
  • 4:13 - 4:17
    лише сприятимуть розвитку
    машинного перекладу.
  • 4:17 - 4:21
    Можливо, до того часу, коли ми нарешті
    встановимо контакт із прибульцями
  • 4:22 - 4:25
    ми матимемо змогу спілкуватися із ними
    за допомогою маленьких приладів,
  • 4:25 - 4:29
    або нам все ж доведеться
    складати словник.
Title:
Як комп'ютери перекладають людську мову - Іоанніс Папахімонас
Speaker:
Ioannis Papachimonas
Description:

Переглянути повний урок: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Чи може насправді існувати універсальний перекладач? У нас вже є багато програм, які нібито можуть перекласти слово, речення або цілу книгу із однієї мови на будь-яку іншу. Насправді ж, усе трохи складніше. Папахімонас розповідає про те, як саме працюють такі машинні перекладачі та пояснює, чому вони часто роблять помилки.

Урок Іоанніса Папахімонаса, анімація NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Ukrainian subtitles

Revisions