Return to Video

Как компьютеры переводят язык людей — Иоаннис Папахимонас

  • 0:07 - 0:11
    Почему это в любом кино или по телевизору
    пришельцы-инопланетяне
  • 0:11 - 0:14
    всегда так хорошо
    владеют английским языком?
  • 0:14 - 0:18
    Если коротко, то потому, что зрителям
    не интересно, как экипаж корабля
  • 0:18 - 0:22
    будет годами
    составлять словарь пришельцев.
  • 0:22 - 0:23
    Но чтобы всё было логично,
  • 0:23 - 0:27
    создатели «Звёздного пути»
    и других фантастических миров
  • 0:27 - 0:31
    придумали понятие
    «универсального переводчика»:
  • 0:31 - 0:35
    переносного устройства, которое может
    мгновенно переводить на разные языки.
  • 0:35 - 0:39
    Возможен ли
    универсальный переводчик в реальности?
  • 0:39 - 0:42
    На сегодняшний день есть много программ,
    чьи создатели утверждают,
  • 0:42 - 0:46
    что можно взять на одном языке
    слово, предложение, целую книгу
  • 0:46 - 0:49
    и перевести на почти любой язык,
  • 0:49 - 0:52
    будь то современный английский
    или древний санскрит.
  • 0:52 - 0:56
    Если бы при переводе нужно было
    просто отыскивать слова в словаре,
  • 0:56 - 1:00
    то эти программы давно бы
    за пояс заткнули живых переводчиков.
  • 1:00 - 1:03
    Однако в реальности всё намного сложнее.
  • 1:03 - 1:07
    Обычная компьютерная программа-переводчик
    использует базу данных лексических единиц,
  • 1:07 - 1:10
    которая включает все слова,
    содержащиеся в словаре,
  • 1:10 - 1:13
    и все грамматические формы,
    которые они могут принимать,
  • 1:13 - 1:19
    а также набор правил, которые определяют
    базовые языковые элементы исходного языка.
  • 1:19 - 1:22
    Казалось бы, в таком простом предложении,
    например: «Дети едят маффины»,
  • 1:22 - 1:27
    программа вначале анализирует синтаксис
    или грамматическую структуру предложения,
  • 1:27 - 1:30
    она определяет, что «дети» — это субъект,
  • 1:30 - 1:32
    а остаток предложения — его предикат,
  • 1:32 - 1:34
    который состоит из глагола «едят»
  • 1:34 - 1:37
    и прямого дополнения «маффины».
  • 1:37 - 1:41
    Затем ей необходимо вникнуть
    в английскую морфологическую структуру,
  • 1:41 - 1:45
    или как язык можно разбить
    на небольшие значимые единицы,
  • 1:45 - 1:46
    например, корень «маффин»
  • 1:46 - 1:50
    и окончание «ы», указывающее на форму
    множественного числа.
  • 1:50 - 1:52
    Наконец, программа
    должна понять семантику,
  • 1:52 - 1:56
    что на самом деле означают
    различные части предложения.
  • 1:56 - 1:58
    Чтобы правильно
    перевести это предложение,
  • 1:58 - 2:02
    программа должна обладать
    определённым запасом словаря и правил
  • 2:02 - 2:05
    для каждого элемента языка перевода.
  • 2:05 - 2:07
    А вот здесь-то и кроется подвох.
  • 2:07 - 2:12
    Синтаксис некоторых языков допускает
    свободный порядок слов в предложении,
  • 2:12 - 2:17
    зато в других языках подобные перестановки
    могут означать, что маффины едят детей.
  • 2:17 - 2:20
    С морфологией всё тоже не так просто.
  • 2:20 - 2:23
    В словенском языке есть различия,
    едят ли двое детей, трое или более,
  • 2:23 - 2:27
    это показывает суффикс парности,
    отсутствующий во многих других языках.
  • 2:27 - 2:31
    В русском языке не существует
    определённого артикля, отчего непонятно,
  • 2:31 - 2:34
    едят ли дети какие-то
    конкретные маффины в данный момент
  • 2:34 - 2:37
    или просто едят маффины вообще.
  • 2:37 - 2:40
    Наконец, даже если
    с семантикой и всё хорошо,
  • 2:40 - 2:43
    программа может
    не понять некоторых тонкостей,
  • 2:43 - 2:46
    например, едят ли дети
    маффины в смысле «mangiano»
  • 2:46 - 2:48
    или они их «divorano».
  • 2:48 - 2:52
    Вторым методом является
    статистический машинный перевод,
  • 2:52 - 2:56
    который представляет собой анализ
    баз данных книг, статей, документов,
  • 2:56 - 2:59
    которые уже переводились людьми.
  • 2:59 - 3:01
    Благодаря тому,
    что находятся соответствия между
  • 3:01 - 3:03
    текстами на исходном языке
    и языке перевода,
  • 3:03 - 3:06
    такие совпадения
    вряд ли бывают случайными,
  • 3:06 - 3:09
    это означает, что программа может
    выявлять фразы и конструкции
  • 3:09 - 3:12
    и использовать их для будущих переводов.
  • 3:12 - 3:15
    Однако качество такого типа переводов
  • 3:15 - 3:18
    зависит от объёма исходной базы банных
  • 3:18 - 3:21
    и наличия образцов
    для определённых языков
  • 3:21 - 3:23
    или стилей письма.
  • 3:23 - 3:26
    Трудности, с которыми
    сталкивается компьютер,
  • 3:26 - 3:28
    когда ему попадаются
    исключения, нарушения норм
  • 3:28 - 3:31
    или оттенки значений,
    которые люди интерпретируют интуитивно,
  • 3:31 - 3:35
    заставило некоторых учёных предполагать,
    что понимание языка людьми —
  • 3:35 - 3:39
    это уникальное явление, свойственное
    биологической структуре нашего мозга.
  • 3:39 - 3:43
    Собственно, самый знаменитый
    фантастический универсальный переводчик
  • 3:43 - 3:46
    Вавилонская рыбка из романа
    «Автостопом по галактике»
  • 3:46 - 3:50
    и вовсе не прибор,
    а крошечное создание,
  • 3:50 - 3:54
    переводившее биотоки мозга
    и нервные сигналы разумных существ
  • 3:54 - 3:57
    путём телепатии.
  • 3:57 - 4:00
    На сегодняшний день
    старое доброе изучение другого языка
  • 4:00 - 4:05
    по-прежнему результативнее
    любой из доступных программ-переводчиков.
  • 4:05 - 4:07
    Но это не самый лёгкий путь,
  • 4:07 - 4:09
    а само число существующих в мире языков,
  • 4:09 - 4:13
    а также всё возрастающее число контактов
    между говорящими на разных языках людьми
  • 4:13 - 4:18
    будут только способствовать дальнейшему
    улучшению машинного перевода.
  • 4:18 - 4:20
    Возможно, что к моменту встречи
  • 4:20 - 4:22
    с представителями
    межгалактических цивилизаций
  • 4:22 - 4:25
    мы сможем общаться
    с ними посредством крохотных девайсов,
  • 4:25 - 4:29
    или же нам придётся по старинке
    садиться за составление словаря.
Title:
Как компьютеры переводят язык людей — Иоаннис Папахимонас
Speaker:
Ioannis Papachimonas
Description:

Урок полностью: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Возможен ли в реальной жизни универсальный переводчик? На сегодняшний день существует немало программ, чьи создатели утверждают, что программы способны взять слово, предложение, целую книгу на одном языке и перевести их на почти любой другой язык. В реальности, однако, всё не так просто. Иоаннис Папахимонас расскажет, как работают эти программы машинного перевода, и заодно объяснит, почему в них иногда получается путаница.

Урок — Иоаннис Папахимонас, мультипликация — NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Russian subtitles

Revisions