Return to Video

Голос для неуслышанных | Рабеа Зюод | TEDxJerusalem

  • 0:08 - 0:09
    Привет.
  • 0:11 - 0:14
    Мы живём в удивительное время,
  • 0:14 - 0:19
    когда новаторство и технология
    способны сделать невозможное
  • 0:19 - 0:23
    или даже просто немыслимое,
  • 0:23 - 0:27
    если говорить о стирании граней
    между немощью и мощью.
  • 0:28 - 0:31
    15% населения Земли —
  • 0:33 - 0:35
    миллиард человек во всём мире —
  • 0:35 - 0:37
    живёт с инвалидностью,
  • 0:37 - 0:42
    что делает таких людей
    самым большим меньшинством в мире.
  • 0:43 - 0:45
    И живут они не на другой планете.
  • 0:45 - 0:50
    Они могут быть частью нашей семьи,
    круга друзей или коллег.
  • 0:51 - 0:56
    Сегодня я расскажу о том,
    как люди с речевыми дефектами
  • 0:56 - 0:59
    скоро смогут общаться.
  • 0:59 - 1:03
    Мне было 7 лет,
    когда родилась моя сестра Амал.
  • 1:03 - 1:06
    Я был слишком мал,
    чтобы осознавать проблемы,
  • 1:06 - 1:09
    с которыми наша семья
    сталкивалась ежедневно,
  • 1:09 - 1:14
    но я видел, что Амал не могла
    ползать, есть или говорить,
  • 1:14 - 1:17
    как другие малыши её возраста.
  • 1:17 - 1:22
    Со временем мы приспособились
    к ребёнку с церебральным параличом,
  • 1:22 - 1:27
    научились понимать её способ
    общения и её нужды.
  • 1:28 - 1:30
    Спустя девять лет
  • 1:30 - 1:33
    в нашей семье родился
    ещё один малыш, Ахмад.
  • 1:34 - 1:38
    Ахмад решил расти так же,
    как и его сестра Амал:
  • 1:38 - 1:43
    такой же умный, сообразительный,
    любопытный до всего вокруг,
  • 1:43 - 1:47
    он также предпочёл свою
    собственную систему речи
  • 1:47 - 1:49
    для общения с нами,
  • 1:50 - 1:53
    а для людей, которые его не понимали,
  • 1:53 - 1:55
    мы выступали в роли переводчиков.
  • 1:55 - 2:00
    Амал и Ахмад говорят «нам»,
    когда они голодны,
  • 2:00 - 2:05
    звук «аа» заменяет
    имя моей сестры Норы.
  • 2:05 - 2:09
    А чтобы позвать меня
    по имени, они говорят «абейя».
  • 2:09 - 2:13
    Если им надо пойти в туалет,
    они произносят «ккхх».
  • 2:13 - 2:17
    Мы понимаем большинство
    их особенных речевых сигналов,
  • 2:17 - 2:21
    но это только мы, их близкие.
  • 2:21 - 2:25
    И так обычно происходит со всеми,
    кто обделён внятной речью.
  • 2:26 - 2:29
    Одна из таких людей — Урит.
  • 2:29 - 2:34
    Урит — 34-летняя женщина
    с церебральным параличом.
  • 2:34 - 2:36
    Она живёт самостоятельно.
  • 2:36 - 2:41
    Она может водить машину, ходить
    в спортзал и делать массу других вещей.
  • 2:43 - 2:48
    Однако, когда дело доходит
    до использования собственного голоса,
  • 2:48 - 2:51
    то ей порой бывает труднее,
    чем на занятиях фитнесом,
  • 2:51 - 2:53
    её переполняет чувство досады,
  • 2:53 - 2:59
    когда ей приходится повторять
    одно и то же слово снова и снова,
  • 2:59 - 3:01
    чтобы её поняли.
  • 3:01 - 3:05
    Мы попросили Урит произнести
    несколько слов по-английски.
  • 3:06 - 3:08
    Давайте вместе её послушаем
  • 3:08 - 3:11
    и посмотрим, сможете ли вы понять,
    что она пытается сказать.
  • 3:12 - 3:16
    (неразборчивая речь)
  • 3:17 - 3:22
    Не знаю, скольким из вас удалось
    разобрать её слова с первого раза,
  • 3:22 - 3:23
    но давайте прослушаем ещё раз,
  • 3:23 - 3:28
    по-настоящему стараясь понять,
    что она пытается сказать.
  • 3:28 - 3:32
    (неразборчивая речь)
  • 3:33 - 3:37
    Попробуйте запомнить, что вы услышали;
    мы вернёмся к этому позже.
  • 3:39 - 3:42
    Мои брат и сестра, Урит
    и другие знакомые мне люди
  • 3:42 - 3:46
    дали мне возможность наблюдать
    за миром, полным проблем —
  • 3:46 - 3:49
    миром особенных и нуждающихся людей.
  • 3:50 - 3:54
    И это позволило мне проанализировать
    существующие технологии
  • 3:54 - 3:58
    в поиске решения, необходимого
    моей сестре и моему брату.
  • 3:59 - 4:02
    К сожалению, существующие
    вспомогательные технологии,
  • 4:02 - 4:07
    включая программы распознавания
    речи, были не способны помочь.
  • 4:08 - 4:14
    На сегодняшний день все вспомогательные
    технологии полностью отказались от голоса,
  • 4:14 - 4:17
    сделав ставку на использование
    других способов общения,
  • 4:18 - 4:22
    при которых голос заменяется
    символами, картинками
  • 4:22 - 4:26
    или движениями тела, головы или глаз.
  • 4:27 - 4:32
    Теперь поговорим о более щадящей
    альтернативе, использующей голос, —
  • 4:33 - 4:36
    о приложениях распознавания речи.
  • 4:36 - 4:39
    Эта технология развивается
    в двух направлениях.
  • 4:40 - 4:45
    Первый подход — попытки определить,
    какое слово было произнесено.
  • 4:46 - 4:49
    Второй подход основан
    на распознавании фонем.
  • 4:49 - 4:55
    Фонемы — это все звуки,
    производимые нами с помощью рта и носа.
  • 4:56 - 5:00
    Оба подхода основаны
    на статистических моделях
  • 5:00 - 5:03
    из огромной базы данных
    речевых стандартов.
  • 5:03 - 5:06
    Но если речь нестандартная —
  • 5:06 - 5:10
    достаточно просто наличия акцента,
  • 5:10 - 5:12
    как у большинства из нас здесь, —
  • 5:12 - 5:14
    то программа не работает.
  • 5:14 - 5:20
    Мои коллеги и я разработали
    новый метод для подобных технологий,
  • 5:20 - 5:22
    при котором используется
    голос самого человека,
  • 5:22 - 5:26
    а также учитываются
    нестандартные особенности речи,
  • 5:26 - 5:32
    что помогает людям с речевыми
    дефектами вновь обрести голос.
  • 5:33 - 5:36
    Итак, чью жизнь это изменит?
  • 5:36 - 5:39
    Людей с церебральным параличом,
  • 5:39 - 5:42
    людей с болезнью Паркинсона
    и с тяжёлой миастенией,
  • 5:42 - 5:44
    со множеством других
    неврологических расстройств,
  • 5:44 - 5:47
    людей, родившихся с дефектом слуха,
  • 5:47 - 5:52
    или тех, кто внезапно пережил
    инсульт, перевернувший их жизнь,
  • 5:52 - 5:55
    но не только их.
  • 5:55 - 5:59
    Не только тех, кто с трудом
    может себя выразить,
  • 5:59 - 6:03
    но и всех тех, кто имеет
    с ними дело день за днём.
  • 6:03 - 6:09
    Это облегчит им путь в общество,
  • 6:09 - 6:13
    потому что каждому из нас
    хочется быть частью общества.
  • 6:13 - 6:18
    Вы, наверное, спрашиваете себя
    сейчас: «Как же этот метод работает?»
  • 6:18 - 6:22
    «Почему другие технологии распознавания
    речи не смогли сделать то же самое?»
  • 6:25 - 6:28
    Дело в том, что наша технология
    действует иначе.
  • 6:29 - 6:32
    Каждый человек должен
    пройти через две фазы.
  • 6:32 - 6:35
    Первая фаза называется
    фазой калибрации,
  • 6:35 - 6:41
    когда человек обучает устройство
    и приложение своим речевым моделям,
  • 6:41 - 6:44
    заводя их в систему и создавая
    свой собственный словарь.
  • 6:44 - 6:46
    Как правило, во время этой фазы
  • 6:46 - 6:49
    помогает тот, кто лучше всех
    понимает пациента.
  • 6:49 - 6:51
    Они составляют словарь вместе.
  • 6:51 - 6:55
    Обычно на это уходит всего
    от одного до трёх часов
  • 6:55 - 6:58
    в зависимости от речевых
    способностей говорящего.
  • 6:58 - 7:00
    После составления словаря
  • 7:00 - 7:04
    мы переходим ко второй фазе,
    называемой фазой распознавания.
  • 7:04 - 7:08
    Приложение способно распознать
    в неразборчивой речи
  • 7:08 - 7:11
    модели из уже готового словаря
  • 7:11 - 7:14
    и перевести их в чёткую речь
    в реальном времени.
  • 7:16 - 7:20
    Наш подход зависит от пользователя,
    но не от языка,
  • 7:20 - 7:23
    что делает его подходящим
    для любого языка в мире,
  • 7:24 - 7:26
    даже для выдуманного.
  • 7:26 - 7:30
    Главным понятием здесь
    является «сопоставление фрагментов».
  • 7:30 - 7:35
    Как только собственный словарь готов
    и произнесено существующее в нём слово,
  • 7:35 - 7:37
    происходит сопоставление фрагментов
  • 7:37 - 7:40
    между тем, что произнесено,
    и тем, что находится в словаре.
  • 7:40 - 7:42
    Но с этим у нас возникла проблема.
  • 7:42 - 7:45
    Мы обнаружили, что люди
    с речевыми дефектами
  • 7:45 - 7:48
    произносят разные слова очень похоже.
  • 7:50 - 7:54
    И нашей задачей было
    научить систему их различать.
  • 7:54 - 7:57
    Так мы создали технологию
    под названием Adaptive Framing.
  • 7:58 - 8:04
    Технологию Adaptive Framing можно
    подогнать к ширине звука во фрагменте.
  • 8:04 - 8:10
    В известных технологиях «Л» и «А»
    занимают один и тот же отсек.
  • 8:10 - 8:15
    В нашей же технологии «Л» и «А»
    занимают разные отсеки,
  • 8:15 - 8:18
    что увеличивает точность
    при сопоставлении фрагментов.
  • 8:19 - 8:23
    Поэтому наш алгоритм сопоставления
    фрагментов работает лучше.
  • 8:23 - 8:26
    Полагаю, вы ещё не забыли Урит?
  • 8:26 - 8:31
    Давайте послушаем её снова,
    но на этот раз вместе с Talkitt:
  • 8:34 - 8:35
    (неразборчивая речь)
  • 8:35 - 8:36
    Теперь я могу...
  • 8:36 - 8:37
    (неразборчивая речь)
  • 8:37 - 8:38
    начать ...
  • 8:38 - 8:40
    (неразборчивая речь)
  • 8:40 - 8:42
    говорить свободно.
  • 8:43 - 8:45
    (Аплодисменты)
  • 8:56 - 8:58
    Talkitt — это лишь один из шагов
  • 8:58 - 9:02
    на пути сужения пропасти
    между немощью и мощью,
  • 9:02 - 9:05
    позволяющий людям
    выразить свой потенциал.
  • 9:05 - 9:07
    Чем больше мы озадачим свой разум,
  • 9:07 - 9:12
    тем меньше препятствий будет
    у всех нас на пути к нормальной жизни.
  • 9:12 - 9:13
    Спасибо.
  • 9:13 - 9:14
    (Аплодисменты)
Title:
Голос для неуслышанных | Рабеа Зюод | TEDxJerusalem
Description:

Talkitt предлагает новаторское решение для людей, страдающих от моторных, речевых или языковых нарушений, которое облегчит общение с помощью их собственного голоса путём перевода неразборчивого набора звуков в понятную речь.

Это выступление записано на мероприятии TEDx, независимо организованном местным сообществом с использованием формата конференций TED. Узнайте больше на http://ted.com/tedx

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDxTalks
Duration:
09:21

Russian subtitles

Revisions