Return to Video

Как компьютеры учатся творчеству

  • 0:01 - 0:04
    Я возглавляю команду в Google,
    работающую над машинным интеллектом,
  • 0:04 - 0:09
    другими словами, занимающуюся инженерией,
    созданием компьютеров и устройств,
  • 0:09 - 0:11
    способных делать то, что делает наш мозг.
  • 0:11 - 0:15
    Мы не можем не интересоваться
    настоящей мозговой деятельностью,
  • 0:15 - 0:16
    а также неврологией.
  • 0:16 - 0:20
    И особенно нас интересуют действия
    нашего мозга,
  • 0:20 - 0:24
    в которых он до сих пор превосходит
    возможности компьютеров.
  • 0:25 - 0:29
    Исторически одной из этих областей
    было восприятие —
  • 0:29 - 0:32
    процесс, благодаря которому всё в мире,
  • 0:32 - 0:33
    все звуки и изображения
  • 0:34 - 0:36
    в нашем сознании превращаются в понятия.
  • 0:36 - 0:39
    Это совершенно необходимо
    для нашего разума,
  • 0:39 - 0:41
    однако полезно и для компьютера.
  • 0:42 - 0:45
    Например, наша команда создаёт
    машинные алгоритмы восприятия,
  • 0:45 - 0:49
    которые позволяют вам находить
    картинки на Google Photos по тому,
  • 0:49 - 0:50
    что на них изображено.
  • 0:52 - 0:55
    Обратная сторона восприятия — творчество:
  • 0:55 - 0:58
    превращение задумки во что-то реальное.
  • 0:58 - 1:02
    Таким образом, за прошедший год
    наша работа над компьютерным восприятием
  • 1:02 - 1:07
    также неожиданно стала связана
    с миром компьютерного творчества
  • 1:07 - 1:08
    и машинного искусства.
  • 1:09 - 1:12
    Я считаю, что у Микеланджело
    было точное понимание
  • 1:12 - 1:16
    двойственного отношения
    между восприятием и творчеством.
  • 1:16 - 1:18
    Вот его известная цитата:
  • 1:18 - 1:21
    «Внутри каждого камня скрыта статуя,
  • 1:22 - 1:25
    задача скульптора — её обнаружить».
  • 1:26 - 1:29
    Я думаю, что Микеланджело говорит о том,
  • 1:29 - 1:32
    что мы создаём посредством восприятия,
  • 1:32 - 1:35
    а само восприятие — это акт воображения
  • 1:36 - 1:38
    и материал для творчества.
  • 1:39 - 1:43
    Орган, который думает,
    воспринимает и представляет, —
  • 1:43 - 1:44
    это, конечно же, мозг.
  • 1:45 - 1:48
    Я хотел бы начать
    с небольшого экскурса в историю
  • 1:48 - 1:50
    исследования нашего мозга.
  • 1:50 - 1:53
    Потому что, в отличие
    от сердца или кишечника,
  • 1:53 - 1:56
    нельзя много сказать о мозге,
    просто посмотрев на него
  • 1:56 - 1:58
    невооружённым глазом.
  • 1:58 - 2:00
    Первые анатомы, которые смотрели на мозги,
  • 2:00 - 2:04
    давали поверхностной структуре
    этого óргана причудливые имена,
  • 2:04 - 2:07
    например, гиппокамп,
    что означает «креветка».
  • 2:07 - 2:09
    Но, конечно, такого рода наблюдения
    мало говорят нам
  • 2:09 - 2:12
    о происходящем внутри мозга.
  • 2:13 - 2:16
    Первый человек, у которого действительно
    было некоторое понимание того,
  • 2:16 - 2:18
    что происходит в мозге,
  • 2:18 - 2:22
    был великий испанский нейрофизиолог
    Сантьяго Рамон-и-Кахаль,
  • 2:22 - 2:24
    живший в XIX веке.
  • 2:24 - 2:28
    Он использовал микроскоп
    и специальный краситель,
  • 2:28 - 2:32
    который мог выборочно заполнить
    отдельные клетки мозга
  • 2:32 - 2:34
    или придать им контрастность,
  • 2:34 - 2:37
    чтобы понять их морфологию.
  • 2:38 - 2:41
    А вот изображения нейронов,
    которые он нарисовал
  • 2:41 - 2:42
    в XIX веке.
  • 2:42 - 2:44
    Это нейроны мозга птицы.
  • 2:44 - 2:47
    Вы видите здесь невероятное разнообразие
    различных видов клеток,
  • 2:47 - 2:51
    даже клеточная теория сама по себе
    была в то время довольно нова.
  • 2:51 - 2:52
    И эти структуры,
  • 2:52 - 2:54
    эти клетки, которые имеют разветвления
  • 2:54 - 2:57
    и эти очень длинные ответвления, —
  • 2:57 - 2:58
    всё это было тогда очень ново.
  • 2:59 - 3:02
    Они напоминают провода.
  • 3:02 - 3:05
    Это могло быть очевидным
    для некоторых людей в XIX веке:
  • 3:05 - 3:10
    как раз начиналась электрификация.
  • 3:10 - 3:11
    Но во многом
  • 3:11 - 3:14
    такие микроанатомические зарисовки
    Рамона-и-Кахаля
  • 3:15 - 3:17
    всё ещё остаются непревзойдёнными.
  • 3:17 - 3:19
    Мы до сих пор, более ста лет спустя,
  • 3:19 - 3:22
    пытаемся закончить работу,
    начатую Рамоном-и-Кахалем.
  • 3:22 - 3:25
    Это необработанные данные
    от наших коллег
  • 3:25 - 3:28
    из Института Неврологии Макса Планка.
  • 3:28 - 3:29
    Наши коллеги
  • 3:29 - 3:34
    изобразили маленькие кусочки
    ткани головного мозга.
  • 3:34 - 3:38
    Весь образец составляет примерно
    один кубический миллиметр,
  • 3:38 - 3:40
    а я показываю вам
    очень маленький его кусочек.
  • 3:40 - 3:43
    Та риска слева равна одному микрону.
  • 3:43 - 3:45
    Структуры, которые вы видите, —
    это митохондрии,
  • 3:45 - 3:47
    они размером с бактерию.
  • 3:47 - 3:49
    А это последовательные срезы
  • 3:49 - 3:52
    этого очень маленького кусочка ткани.
  • 3:52 - 3:55
    Просто для сравнения:
  • 3:55 - 3:58
    диаметр волоса в среднем составляет
    около 100 микрон.
  • 3:58 - 4:01
    Мы здесь видим нечто гораздо меньшее,
  • 4:01 - 4:02
    чем человеческий волос.
  • 4:02 - 4:06
    Из этой серии микроскопических срезов
  • 4:06 - 4:11
    можно начать делать 3D реконструкции
    нейронов, похожие на эти.
  • 4:11 - 4:14
    По стилю они похожи
    на рисунки Рамона-и-Кахаля.
  • 4:14 - 4:16
    Отдельные нейроны подсвечены,
  • 4:16 - 4:19
    иначе мы бы здесь ничего не увидели.
  • 4:19 - 4:20
    Тут было бы полно́ всего,
  • 4:20 - 4:21
    сплошные структуры
  • 4:21 - 4:24
    и провода, соединяющие
    один нейрон с другим.
  • 4:25 - 4:28
    Итак, Рамон-и-Кахаль немного опережал
    своё время,
  • 4:28 - 4:31
    и прогресс в понимании мозга
    продвигался медленно
  • 4:31 - 4:33
    в течение следующих десятилетий.
  • 4:33 - 4:36
    Но мы знали,
    что нейроны используют электричество,
  • 4:36 - 4:39
    и ко Второй мировой войне
    технологии были развиты достаточно,
  • 4:39 - 4:42
    чтобы начать электрические
    эксперименты на живых нейронах,
  • 4:42 - 4:44
    чтобы лучше понимать, как они работают.
  • 4:45 - 4:49
    Именно тогда изобрели компьютеры,
  • 4:49 - 4:52
    во многом основанные на идее
    моделирования мозга,
  • 4:52 - 4:55
    или «искусственного интеллекта»,
    как называл его Алан Тьюринг,
  • 4:55 - 4:57
    один из отцов информатики.
  • 4:58 - 5:03
    Уоррен Мак-Каллок и Уолтер Питтс
    посмотрели на рисунки Рамона-и-Кахаля.
  • 5:03 - 5:04
    Сейчас я показываю вам
  • 5:04 - 5:05
    это изображение зрительной коры.
  • 5:06 - 5:10
    Эта кора головного мозга обрабатывает
    образы, поступающие от органов зрения.
  • 5:10 - 5:14
    По их мнению это выглядело,
    как замкнутая схема.
  • 5:14 - 5:18
    В схеме Мак-Каллока и Питтса
    многие детали
  • 5:18 - 5:20
    не совсем точны,
  • 5:20 - 5:21
    но основная идея,
  • 5:21 - 5:25
    что зрительная кора работает
    как серия вычислительных элементов,
  • 5:25 - 5:28
    которые каскадом передают
    друг другу информацию,
  • 5:28 - 5:29
    по сути верна.
  • 5:29 - 5:32
    Давайте немного поговорим о том,
  • 5:32 - 5:36
    что должна делать модель обработки
    визуальной информации.
  • 5:36 - 5:39
    Основная задача распознавания —
  • 5:39 - 5:43
    это взять картинку,
    такую как эта, и сказать:
  • 5:43 - 5:44
    «Это птица».
  • 5:44 - 5:47
    Для нашего мозга это простая задача,
  • 5:47 - 5:51
    но вы должны понимать,
    что для компьютера
  • 5:51 - 5:54
    всего несколько лет назад
    подобное было почти невозможно.
  • 5:54 - 5:56
    Согласно классической парадигме расчётов,
  • 5:56 - 5:58
    это не то задание,
    которое можно выполнить легко.
  • 5:59 - 6:02
    Так что же происходит между пикселями,
  • 6:02 - 6:06
    между изображением птицы и словом «птица»?
  • 6:06 - 6:09
    По сути, группа нейронов
    связана друг с другом
  • 6:09 - 6:10
    в нейронной сети,
  • 6:10 - 6:11
    как я показываю здесь.
  • 6:11 - 6:15
    Эта нейронная сеть в коре головного мозга
    могла быть биологической,
  • 6:15 - 6:17
    а в наше время мы можем
  • 6:17 - 6:19
    смоделировать такую нейронную сеть
    на компьютере.
  • 6:20 - 6:22
    И я вам покажу, как это выглядит.
  • 6:22 - 6:26
    Поэтому о пикселях можно думать
    как о первом слое нейронов —
  • 6:26 - 6:28
    именно так происходит в глазу —
  • 6:28 - 6:30
    это нейроны в сетчатке.
  • 6:30 - 6:31
    А остальные нейроны
  • 6:31 - 6:35
    связаны по цепи слой за слоем,
  • 6:35 - 6:38
    их соединяют между собой
    синапсы различных весов.
  • 6:38 - 6:39
    Поведение этой сети
  • 6:39 - 6:42
    характеризуется силой этих синапсов.
  • 6:42 - 6:46
    Они характеризуют вычислительные
    свойства этой сети.
  • 6:46 - 6:47
    В конце концов
  • 6:47 - 6:50
    один или несколько нейронов
  • 6:50 - 6:51
    загораются, говоря: «птица».
  • 6:52 - 6:55
    Теперь я собираюсь представить
    эти три вещи —
  • 6:55 - 7:00
    входные пиксели и синапсы
    в нейронной сети
  • 7:00 - 7:01
    и, как результат, птицу
  • 7:01 - 7:04
    при помощи трёх переменных: Х, W и Y.
  • 7:05 - 7:07
    Существует миллион или около того X —
  • 7:07 - 7:09
    миллион пикселей в изображении.
  • 7:09 - 7:11
    Миллиарды или триллионы W —
  • 7:11 - 7:15
    представляющих весá всех этих синапсов
    в нейронной сети.
  • 7:15 - 7:16
    И очень маленькое количество Y —
  • 7:16 - 7:18
    значений на выходе сети.
  • 7:18 - 7:20
    «Птица» же состоит всего из 5 букв.
  • 7:21 - 7:25
    Давайте представим,
    что это простая формула:
  • 7:25 - 7:27
    X «х» W = Y.
  • 7:27 - 7:29
    Я ставлю умножение в кавычки,
  • 7:29 - 7:31
    потому что на самом деле
    там просисходит
  • 7:31 - 7:34
    очень сложная серия
    математических расчётов.
  • 7:35 - 7:36
    Это одно уравнение
  • 7:36 - 7:38
    с тремя переменными.
  • 7:38 - 7:41
    И всем известно,
    что если у нас есть уравнение,
  • 7:41 - 7:45
    то мы можем найти одну переменную,
    зная две другие.
  • 7:45 - 7:49
    Таким образом, задача
  • 7:49 - 7:51
    по распознаванию птицы
    в изображении птицы
  • 7:51 - 7:53
    заключается в следующем:
  • 7:53 - 7:56
    Y неизвестен,
    а W и X известны.
  • 7:56 - 7:59
    Вы знаете нейронную сеть,
    вы знаете пиксели.
  • 7:59 - 8:02
    И как видите, это относительно
    простая задача.
  • 8:02 - 8:04
    Вы умножаете два на три, и всё готово.
  • 8:05 - 8:07
    Я покажу вам искусственную нейронную сеть,
  • 8:07 - 8:09
    которую мы построили недавно,
    делая то же самое.
  • 8:10 - 8:12
    Она работает в реальном времени
    на мобильном телефоне.
  • 8:13 - 8:16
    Удивительно уже само по себе то,
  • 8:16 - 8:19
    что мобильные телефоны могут выполнять
    миллиарды и триллионы операций
  • 8:19 - 8:21
    в секунду.
  • 8:21 - 8:22
    Мы видим телефон,
  • 8:22 - 8:26
    который смотрит на изображение птиц
    одно за другим
  • 8:26 - 8:29
    и не только говорит: «Да, это птица»,
  • 8:29 - 8:32
    но также через такую же сеть
    определяет вид этой птицы.
  • 8:33 - 8:35
    На этой картинке
  • 8:35 - 8:39
    X и W известны,
    а Y неизвестен.
  • 8:39 - 8:41
    Я, конечно, пропускаю
    самую сложную часть —
  • 8:41 - 8:45
    то, каким непостижимым образом
    мы находим W —
  • 8:45 - 8:47
    мозг, который может это сделать.
  • 8:47 - 8:49
    Сможем ли мы сделать такую модель?
  • 8:49 - 8:53
    Этот процесс нахождения W,
  • 8:53 - 8:55
    будь это простым уравнением,
  • 8:55 - 8:57
    где мы думаем о неизвестных,
    как о числах,
  • 8:57 - 9:00
    мы бы знали, как именно это сделать:
    6 = 2 * W,
  • 9:00 - 9:03
    делим на 2, и готово.
  • 9:04 - 9:06
    Но проблема именно в этом преобразовании,
  • 9:07 - 9:08
    в делении.
  • 9:08 - 9:11
    Мы использовали его здесь,
    так как оно обратно умножению,
  • 9:11 - 9:13
    но, как я сказал,
  • 9:13 - 9:15
    умножение здесь — это фикция.
  • 9:15 - 9:18
    Это чрезвычайно сложная
    нелинейная операция,
  • 9:18 - 9:20
    она не имеет обратного действия.
  • 9:20 - 9:23
    Мы должны найти способ
    решить это уравнение
  • 9:23 - 9:25
    без деления.
  • 9:25 - 9:28
    И способ довольно простой.
  • 9:28 - 9:30
    Давайте проделаем маленький
    математический трюк
  • 9:30 - 9:33
    и перенесём 6 в правую часть уравнения.
  • 9:33 - 9:35
    Сейчас мы используем умножение.
  • 9:36 - 9:39
    И этот ноль,
    давайте примем его за отклонение.
  • 9:39 - 9:42
    Другими словами,
    если мы посчитаем W правильно,
  • 9:42 - 9:43
    то отклонение будет равно нулю.
  • 9:43 - 9:45
    А если мы посчитали неверно,
  • 9:45 - 9:47
    то отклонение будет больше нуля.
  • 9:47 - 9:51
    Теперь мы можем подбирать числа,
    чтобы минимизировать отклонение,
  • 9:51 - 9:53
    а это как раз то,
    в чём компьютеры очень хороши.
  • 9:53 - 9:55
    Сначала мы предположили:
  • 9:55 - 9:56
    что если W = 0?
  • 9:56 - 9:57
    Тогда отклонение равно 6.
  • 9:57 - 9:59
    Если W = 1, то отклонение — 4.
  • 9:59 - 10:01
    И потом компьютер начинает играть
    в «угадайку»
  • 10:01 - 10:04
    и приближает отклонение к нулю.
  • 10:04 - 10:07
    Так он приближается к верному значению W.
  • 10:07 - 10:11
    Обычно он не находит точного решения,
    но сделав с десяток шагов,
  • 10:11 - 10:15
    мы приближаемся к W = 2,999,
    что достаточно близко к истине.
  • 10:16 - 10:18
    Это и есть процесс обучения.
  • 10:18 - 10:21
    Напомню, что именно мы делаем:
  • 10:21 - 10:25
    мы берём много известных X и Y
  • 10:25 - 10:29
    и посредством процесса повторения
    находим W.
  • 10:29 - 10:32
    Мы сами учимся точно так же.
  • 10:32 - 10:35
    В детстве мы встречаем множество образов,
  • 10:35 - 10:37
    и нам говорят:
    «Это птица, а это не птица».
  • 10:38 - 10:40
    Со временем через повторение
  • 10:40 - 10:43
    мы находим W, то есть нейронные связи.
  • 10:43 - 10:48
    Теперь у нас есть готовые X и W
    для нахождения Y
  • 10:48 - 10:49
    и быстрого повседневного восприятия.
  • 10:49 - 10:51
    Мы узнаём, как найти W, —
  • 10:51 - 10:53
    это обучение, и оно сложно,
  • 10:53 - 10:55
    так как надо минимизировать погрешности
  • 10:55 - 10:57
    методом проб и ошибок.
  • 10:57 - 11:00
    Около года назад Алекс Мордвинцев
    из нашей команды
  • 11:00 - 11:04
    решил попробовать, что будет,
    если попытаться найти X,
  • 11:04 - 11:06
    зная W и Y.
  • 11:06 - 11:07
    Другими словами,
  • 11:07 - 11:09
    вы знаете, что это птица,
  • 11:09 - 11:12
    и вашей нейронной сети тоже это известно.
  • 11:12 - 11:14
    Но как же выглядит птица?
  • 11:15 - 11:20
    Оказывается, что используя ту же самую
    процедуру минимизации погрешностей,
  • 11:20 - 11:24
    можно проделать это c нейронной сетью,
    обученной распознавать птиц,
  • 11:24 - 11:27
    и в результате получается
  • 11:30 - 11:32
    изображение птицы.
  • 11:33 - 11:37
    Это изображение птиц
    создано нейронной сетью,
  • 11:37 - 11:38
    обученной распознавать птиц,
  • 11:38 - 11:42
    просто находя X, а не Y,
  • 11:42 - 11:43
    через множество повторений.
  • 11:44 - 11:46
    Вот другой интересный пример.
  • 11:46 - 11:49
    Это работа, сделанная Майком Тайком
    из нашей команды.
  • 11:49 - 11:51
    Он назвал её «Парад зверей».
  • 11:51 - 11:54
    Она немного напоминает мне работы
    Уильяма Кентриджа,
  • 11:54 - 11:57
    в которых он делает эскизы,
    потом их стирает,
  • 11:57 - 11:58
    снова рисует и стирает,
  • 11:58 - 12:00
    и так создаёт фильм.
  • 12:00 - 12:01
    В данном случае
  • 12:01 - 12:04
    Майк меняет Y различных видов животных
  • 12:04 - 12:07
    в сети, созданной для распознавания
  • 12:07 - 12:08
    разных видов животных.
  • 12:08 - 12:12
    Получается парадоксальное, в стиле Эшера,
    изображение животных.
  • 12:14 - 12:19
    Здесь он и Алекс попытались упростить Y
  • 12:19 - 12:22
    до двухмерного пространства,
  • 12:22 - 12:25
    тем самым создавая карту
    из пространства всех объектов,
  • 12:25 - 12:27
    распознаваемых данной сетью.
  • 12:27 - 12:29
    Выполняя такого рода синтез
  • 12:29 - 12:31
    или создавая изображения
    на всей поверхности,
  • 12:31 - 12:34
    изменяя в ней Y,
    вы делаете подобие карты —
  • 12:34 - 12:37
    визуальную карту всех вещей,
    которые может распознать сеть.
  • 12:37 - 12:40
    Здесь есть все животные.
    Вот «броненосец».
  • 12:41 - 12:43
    То же можно проделать с другими
    типами сетей.
  • 12:43 - 12:46
    Эта сеть создана, чтобы распознавать лица
  • 12:46 - 12:48
    и отличать одно лицо от другого.
  • 12:48 - 12:52
    Здесь мы добавляем Y,
    который значит «я»,
  • 12:52 - 12:53
    мои параметры лица.
  • 12:53 - 12:55
    И когда эта сеть находит X,
  • 12:55 - 12:58
    то создаёт это довольно сумасшедшее,
  • 12:58 - 13:02
    кубическое, сюрреалистическое,
    психоделическое изображение меня
  • 13:02 - 13:04
    с разных сторон одновременно.
  • 13:04 - 13:07
    И причина, по которой изображение
    так выглядит,
  • 13:07 - 13:10
    в том, что сеть стремится избавиться
    от неопределённости,
  • 13:10 - 13:13
    возникающей из-за разных положений головы
  • 13:13 - 13:16
    или разных углов освещения.
  • 13:16 - 13:18
    При такого рода преобразованиях,
  • 13:18 - 13:21
    если нет опорного изображения
  • 13:21 - 13:22
    или опорных данных,
  • 13:22 - 13:26
    то вы получите мешанину изображений,
    сделанных с разных сторон,
  • 13:26 - 13:27
    из-за неопределённости.
  • 13:28 - 13:32
    Вот что происходит, если Алекс использует
    своё лицо как опорное изображение
  • 13:32 - 13:35
    во время оптимизации программы
    по воссозданию моего лица.
  • 13:36 - 13:39
    Как видите, не всё идеально.
  • 13:39 - 13:41
    Нам предстоит ещё много работы
  • 13:41 - 13:43
    по оптимизации процесса оптимизации.
  • 13:43 - 13:46
    Но полученное лицо становится чётче,
  • 13:46 - 13:48
    при его создании опорным было моё лицо.
  • 13:49 - 13:51
    Вам не нужно начинать с чистого листа
  • 13:51 - 13:53
    или белого шума.
  • 13:53 - 13:54
    Когда вы ищете X,
  • 13:54 - 13:58
    вы можете начать с X, который сам по себе
    является другим изображением.
  • 13:58 - 14:00
    Вот о чём эта маленькая демонстрация.
  • 14:00 - 14:05
    Эта сеть которая разработана,
    чтобы категоризировать
  • 14:05 - 14:08
    самые различные объекты —
    искусственные сооружения, животных...
  • 14:08 - 14:10
    Здесь мы начинаем
    с простого изображения облаков,
  • 14:10 - 14:12
    и по мере оптимизации
  • 14:12 - 14:17
    эта сеть определяет,
    что именно она видит в облаках.
  • 14:17 - 14:19
    И чем дольше вы смотрите,
  • 14:19 - 14:22
    тем больше сможете увидеть в облаках.
  • 14:23 - 14:26
    Можно использовать сеть распознавания лиц,
    чтобы вызвать галюцинации
  • 14:26 - 14:28
    и получить довольно сумасшедшие вещи.
  • 14:28 - 14:29
    (Смех)
  • 14:30 - 14:33
    Майк провёл и другой эксперимент,
  • 14:33 - 14:37
    в котором он берёт изображение óблака,
  • 14:37 - 14:41
    галлюцинирует, приближает,
    галлюцинирует, приближает.
  • 14:41 - 14:42
    И таким образом
  • 14:42 - 14:45
    получается что-то типа состояния
    диссоциативной фуги сети
  • 14:46 - 14:49
    или подобие свободных ассоциаций,
  • 14:49 - 14:51
    в которых сеть ловит свой хвост.
  • 14:51 - 14:55
    Каждое изображение становится основой
    для ответа на вопрос:
  • 14:55 - 14:56
    «Что же я увижу дальше?
  • 14:56 - 14:59
    Что же я увижу дальше?
    Что же я увижу дальше?»
  • 14:59 - 15:02
    Первый раз я показал это группе
  • 15:02 - 15:08
    в Сиэттле на лекции «Высшее образование».
  • 15:08 - 15:10
    Это было как раз после
    легализации марихуаны.
  • 15:10 - 15:13
    (Смех)
  • 15:15 - 15:17
    Я хотел бы быстро подвести итог
  • 15:17 - 15:21
    и отметить, что возможности
    этой технологии безграничны.
  • 15:21 - 15:25
    Я показал вам лишь визуальные примеры,
    потому что на них интересно смотреть.
  • 15:25 - 15:27
    Но это не только визуальная технология.
  • 15:27 - 15:29
    Наш сотрудник, художник Росс Гудвин,
  • 15:29 - 15:33
    провёл эксперимент с камерой,
    на которую делал снимок,
  • 15:33 - 15:37
    а в рюкзаке у него был компьютер,
    пишущий стихи посредством нейронных сетей,
  • 15:37 - 15:39
    которые брали за основу фотографию.
  • 15:39 - 15:42
    И эта поэтическая нейронная сеть
    была «натренирована»
  • 15:42 - 15:44
    на обширном корпусе поэзии XX века.
  • 15:44 - 15:46
    И знаете, получившиеся стихи,
  • 15:46 - 15:48
    по-моему, не не так уж и плохи.
  • 15:48 - 15:49
    (Смех)
  • 15:49 - 15:50
    В завершение скажу,
  • 15:50 - 15:53
    что считаю,
  • 15:53 - 15:54
    Микаленджело был прав:
  • 15:54 - 15:57
    восприятие и творчество
    очень тесно связаны между собой.
  • 15:58 - 16:00
    Мы только что увидели нейронные сети,
  • 16:00 - 16:03
    полностью обученные различать
  • 16:03 - 16:05
    и распознавать разные физические объекты,
  • 16:05 - 16:08
    а также работать в обратном направлении,
    воспроизводя их.
  • 16:08 - 16:10
    На эту мысль меня наводит не то,
  • 16:10 - 16:12
    что Микеланджело действительно видел
  • 16:12 - 16:15
    скульптуру в глыбе камня,
  • 16:15 - 16:18
    а то, что любое существо,
    даже инопланетное,
  • 16:18 - 16:22
    способное к такому восприятию,
  • 16:22 - 16:23
    также способно творить,
  • 16:23 - 16:27
    потому что действия в обоих случаях
    одинаковые.
  • 16:27 - 16:31
    Кроме того, я думаю,
    что восприятие и творчество присущи
  • 16:31 - 16:33
    не только человеку.
  • 16:33 - 16:36
    У нас начинают появляться компьютеры,
    которые могут делать то же самое.
  • 16:36 - 16:40
    И это неудивительно,
    ведь мозг — своего рода компьютер.
  • 16:40 - 16:41
    И наконец,
  • 16:41 - 16:46
    информатика зарождалась в попытках
    создания искусственного интеллекта.
  • 16:46 - 16:48
    Её во многом сформировала концепция о том,
  • 16:48 - 16:51
    как можно сделать машины умнее.
  • 16:52 - 16:54
    И сейчас мы начинаем выполнять
  • 16:54 - 16:56
    некоторые обещания тех первопроходцев,
  • 16:56 - 16:58
    Тьюринга и фон Неймана,
  • 16:58 - 17:00
    Мак-Каллока и Питтса.
  • 17:00 - 17:04
    Я считаю, что компьютеры —
    это не только расчёты,
  • 17:04 - 17:06
    пасьянс «Косынка» или что-то подобное.
  • 17:06 - 17:09
    Мы изначально делали компьютеры
    похожими на свой мозг.
  • 17:09 - 17:12
    И они дали нам возможность
    лучше понять собственный мозг
  • 17:12 - 17:14
    и развивать его.
  • 17:15 - 17:16
    Большое спасибо.
  • 17:16 - 17:22
    (Аплодисменты)
Title:
Как компьютеры учатся творчеству
Speaker:
Блез Агюера и Аркас
Description:

Мы находимся на пороге новых открытий в искусстве и творчестве — но не благодаря человеку. Блез Агюера и Аркас, главный научный сотрудник Google, работает с нейронными сетями, служащими для машинного восприятия и распределённого обучения. В этой интересной демонстрации, он показывает, как нейронные сети, обученные распознавать изображения, могут быть запущены в обратном направлении, чтобы создавать их. Результатами являются впечатляющие, галлюцинаторные изображения (и стихи!), которые бросают вызов любой классификации. «Восприятие и творчество очень тесно связаны», — говорит Блез Агюера и Аркас. «Любое существо или создание, способное воспринимать, также способно и создавать».

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34

Russian subtitles

Revisions Compare revisions