Привет. Мы живём в удивительное время, когда новаторство и технология способны сделать невозможное или даже просто немыслимое, если говорить о стирании граней между немощью и мощью. 15% населения Земли — миллиард человек во всём мире — живёт с инвалидностью, что делает таких людей самым большим меньшинством в мире. И живут они не на другой планете. Они могут быть частью нашей семьи, круга друзей или коллег. Сегодня я расскажу о том, как люди с речевыми дефектами скоро смогут общаться. Мне было 7 лет, когда родилась моя сестра Амал. Я был слишком мал, чтобы осознавать проблемы, с которыми наша семья сталкивалась ежедневно, но я видел, что Амал не могла ползать, есть или говорить, как другие малыши её возраста. Со временем мы приспособились к ребёнку с церебральным параличом, научились понимать её способ общения и её нужды. Спустя девять лет в нашей семье родился ещё один малыш, Ахмад. Ахмад решил расти так же, как и его сестра Амал: такой же умный, сообразительный, любопытный до всего вокруг, он также предпочёл свою собственную систему речи для общения с нами, а для людей, которые его не понимали, мы выступали в роли переводчиков. Амал и Ахмад говорят «нам», когда они голодны, звук «аа» заменяет имя моей сестры Норы. А чтобы позвать меня по имени, они говорят «абейя». Если им надо пойти в туалет, они произносят «ккхх». Мы понимаем большинство их особенных речевых сигналов, но это только мы, их близкие. И так обычно происходит со всеми, кто обделён внятной речью. Одна из таких людей — Урит. Урит — 34-летняя женщина с церебральным параличом. Она живёт самостоятельно. Она может водить машину, ходить в спортзал и делать массу других вещей. Однако, когда дело доходит до использования собственного голоса, то ей порой бывает труднее, чем на занятиях фитнесом, её переполняет чувство досады, когда ей приходится повторять одно и то же слово снова и снова, чтобы её поняли. Мы попросили Урит произнести несколько слов по-английски. Давайте вместе её послушаем и посмотрим, сможете ли вы понять, что она пытается сказать. (неразборчивая речь) Не знаю, скольким из вас удалось разобрать её слова с первого раза, но давайте прослушаем ещё раз, по-настоящему стараясь понять, что она пытается сказать. (неразборчивая речь) Попробуйте запомнить, что вы услышали; мы вернёмся к этому позже. Мои брат и сестра, Урит и другие знакомые мне люди дали мне возможность наблюдать за миром, полным проблем — миром особенных и нуждающихся людей. И это позволило мне проанализировать существующие технологии в поиске решения, необходимого моей сестре и моему брату. К сожалению, существующие вспомогательные технологии, включая программы распознавания речи, были не способны помочь. На сегодняшний день все вспомогательные технологии полностью отказались от голоса, сделав ставку на использование других способов общения, при которых голос заменяется символами, картинками или движениями тела, головы или глаз. Теперь поговорим о более щадящей альтернативе, использующей голос, — о приложениях распознавания речи. Эта технология развивается в двух направлениях. Первый подход — попытки определить, какое слово было произнесено. Второй подход основан на распознавании фонем. Фонемы — это все звуки, производимые нами с помощью рта и носа. Оба подхода основаны на статистических моделях из огромной базы данных речевых стандартов. Но если речь нестандартная — достаточно просто наличия акцента, как у большинства из нас здесь, — то программа не работает. Мои коллеги и я разработали новый метод для подобных технологий, при котором используется голос самого человека, а также учитываются нестандартные особенности речи, что помогает людям с речевыми дефектами вновь обрести голос. Итак, чью жизнь это изменит? Людей с церебральным параличом, людей с болезнью Паркинсона и с тяжёлой миастенией, со множеством других неврологических расстройств, людей, родившихся с дефектом слуха, или тех, кто внезапно пережил инсульт, перевернувший их жизнь, но не только их. Не только тех, кто с трудом может себя выразить, но и всех тех, кто имеет с ними дело день за днём. Это облегчит им путь в общество, потому что каждому из нас хочется быть частью общества. Вы, наверное, спрашиваете себя сейчас: «Как же этот метод работает?» «Почему другие технологии распознавания речи не смогли сделать то же самое?» Дело в том, что наша технология действует иначе. Каждый человек должен пройти через две фазы. Первая фаза называется фазой калибрации, когда человек обучает устройство и приложение своим речевым моделям, заводя их в систему и создавая свой собственный словарь. Как правило, во время этой фазы помогает тот, кто лучше всех понимает пациента. Они составляют словарь вместе. Обычно на это уходит всего от одного до трёх часов в зависимости от речевых способностей говорящего. После составления словаря мы переходим ко второй фазе, называемой фазой распознавания. Приложение способно распознать в неразборчивой речи модели из уже готового словаря и перевести их в чёткую речь в реальном времени. Наш подход зависит от пользователя, но не от языка, что делает его подходящим для любого языка в мире, даже для выдуманного. Главным понятием здесь является «сопоставление фрагментов». Как только собственный словарь готов и произнесено существующее в нём слово, происходит сопоставление фрагментов между тем, что произнесено, и тем, что находится в словаре. Но с этим у нас возникла проблема. Мы обнаружили, что люди с речевыми дефектами произносят разные слова очень похоже. И нашей задачей было научить систему их различать. Так мы создали технологию под названием Adaptive Framing. Технологию Adaptive Framing можно подогнать к ширине звука во фрагменте. В известных технологиях «Л» и «А» занимают один и тот же отсек. В нашей же технологии «Л» и «А» занимают разные отсеки, что увеличивает точность при сопоставлении фрагментов. Поэтому наш алгоритм сопоставления фрагментов работает лучше. Полагаю, вы ещё не забыли Урит? Давайте послушаем её снова, но на этот раз вместе с Talkitt: (неразборчивая речь) Теперь я могу... (неразборчивая речь) начать ... (неразборчивая речь) говорить свободно. (Аплодисменты) Talkitt — это лишь один из шагов на пути сужения пропасти между немощью и мощью, позволяющий людям выразить свой потенциал. Чем больше мы озадачим свой разум, тем меньше препятствий будет у всех нас на пути к нормальной жизни. Спасибо. (Аплодисменты)