1 00:00:00,285 --> 00:00:03,178 Это изображение планеты Земля. 2 00:00:03,178 --> 00:00:06,271 Оно очень похоже на известные всем снимки, 3 00:00:06,271 --> 00:00:07,882 сделанные в рамках космической программы Аполлон. 4 00:00:07,882 --> 00:00:09,952 Но есть отличие — 5 00:00:09,952 --> 00:00:11,399 по данному изображению можно щёлкнуть, 6 00:00:11,399 --> 00:00:12,597 и, если вы сделаете, 7 00:00:12,597 --> 00:00:15,669 то сможете рассмотреть практически любое место на Земле. 8 00:00:15,669 --> 00:00:17,668 Например, это вид с высоты птичьего полёта 9 00:00:17,668 --> 00:00:20,334 на кампус Федеральной политехнической школы в Лозанне (ФПШЛ). 10 00:00:20,334 --> 00:00:22,442 В большинстве случаев вы также можете увидеть, 11 00:00:22,442 --> 00:00:26,182 как выглядит здание с соседней улицы. 12 00:00:26,182 --> 00:00:27,604 Весьма впечатляюще. 13 00:00:27,604 --> 00:00:31,031 Но чего-то не хватает в этой замечательной экскурсии: 14 00:00:31,031 --> 00:00:33,219 указания времени. 15 00:00:33,219 --> 00:00:36,289 Я, на самом деле, не уверен, когда была сделана эта фотография. 16 00:00:36,289 --> 00:00:37,701 Я даже не уверен соответствует 17 00:00:37,701 --> 00:00:43,784 ли эта фотография действительности. 18 00:00:43,784 --> 00:00:45,993 В моей лаборатории мы разрабатываем инструменты 19 00:00:45,993 --> 00:00:47,757 для путешествий не только в пространстве, 20 00:00:47,757 --> 00:00:50,315 но также и во времени. 21 00:00:50,315 --> 00:00:52,185 Вопрос, который нас интересует: 22 00:00:52,185 --> 00:00:53,578 Возможно ли сконструировать нечто, 23 00:00:53,578 --> 00:00:55,756 похожее на Карты Гугл прошлого? 24 00:00:55,756 --> 00:00:59,066 Могу ли я добавить бегунок к Картам Гугл 25 00:00:59,066 --> 00:01:00,869 и просто поменять год, 26 00:01:00,869 --> 00:01:02,660 чтобы посмотреть, как выглядела местность 100 лет назад, 27 00:01:02,660 --> 00:01:04,329 1000 лет назад? 28 00:01:04,329 --> 00:01:06,452 Возможно ли это? 29 00:01:06,452 --> 00:01:08,704 Могу ли я воспроизвести социальную сеть прошлого? 30 00:01:08,704 --> 00:01:11,753 Могу ли сделать Фейсбук Средневековья? 31 00:01:11,753 --> 00:01:15,529 Могу ли построить машину времени? 32 00:01:15,529 --> 00:01:18,094 Может быть, проще сказать: «Нет, это невозможно». 33 00:01:18,094 --> 00:01:21,904 Или же мы можем подумать об этом с информационной точки зрения. 34 00:01:21,904 --> 00:01:25,094 Это то, что я называю «информационный гриб». 35 00:01:25,094 --> 00:01:26,677 На вертикальной оси задано время. 36 00:01:26,677 --> 00:01:29,417 На горизонтальной — объём доступной цифровой информации. 37 00:01:29,417 --> 00:01:32,899 Очевидно, что последние 10 лет мы владеем большим объёмом информации. 38 00:01:32,899 --> 00:01:36,447 И так же очевидно, что чем больше мы уходим в прошлое, тем меньше информации доступно. 39 00:01:36,447 --> 00:01:38,765 Если мы хотим создать что-то вроде Карты Гугл прошлого 40 00:01:38,765 --> 00:01:40,259 или Фейсбук прошлого, 41 00:01:40,259 --> 00:01:41,833 нам нужно расширить эту область, 42 00:01:41,833 --> 00:01:43,771 задать ей форму вроде прямоугольника. 43 00:01:43,771 --> 00:01:45,281 Как это сделать? 44 00:01:45,281 --> 00:01:47,379 Один из способов — оцифровывание. 45 00:01:47,395 --> 00:01:49,174 Существует множество материалов — 46 00:01:49,190 --> 00:01:55,460 газеты, печатные книги, тысячи печатных книг. 47 00:01:55,460 --> 00:01:57,228 Я всё это могу перевести в цифровой формат 48 00:01:57,228 --> 00:01:59,965 Я могу извлечь из этих источников информацию. 49 00:01:59,965 --> 00:02:03,508 Конечно, чем дальше мы будем заглядывать в прошлое, тем меньше информации будет доступно. 50 00:02:03,508 --> 00:02:06,154 Таким образом, этих действий может быть недостаточно. 51 00:02:06,154 --> 00:02:08,562 Я могу поступить так, как поступают историки. 52 00:02:08,562 --> 00:02:10,086 Я могу экстраполировать. 53 00:02:10,086 --> 00:02:14,556 Это то, что в информатике мы называем «моделированием». 54 00:02:14,556 --> 00:02:16,307 Если взять журнал, 55 00:02:16,307 --> 00:02:18,711 то можно предположить, что это не просто журнал путевых заметок 56 00:02:18,711 --> 00:02:21,683 некоего венецианского капитана, отправившегося в конкретное путешествие. 57 00:02:21,683 --> 00:02:23,326 Я могу предположить, что это журнал, 58 00:02:23,326 --> 00:02:25,908 описывающий типичное путешествие тех времён. 59 00:02:25,908 --> 00:02:28,153 Я экстраполирую. 60 00:02:28,153 --> 00:02:30,191 Если у меня есть картина фасада, 61 00:02:30,191 --> 00:02:32,942 я могу предположить, что она содержит изображение не только одного конкретного здания, 62 00:02:32,942 --> 00:02:36,874 но, скорее всего, она включает в себя элементы зданий, 63 00:02:36,874 --> 00:02:40,915 информация о которых утеряна. 64 00:02:40,915 --> 00:02:43,773 Таким образом, если мы хотим создать машину времени, 65 00:02:43,773 --> 00:02:45,112 нам нужны две вещи. 66 00:02:45,112 --> 00:02:47,346 Нам нужны весьма большие архивы 67 00:02:47,346 --> 00:02:50,088 и отличные специалисты. 68 00:02:50,088 --> 00:02:51,962 Венецианская Машина Времени — 69 00:02:51,962 --> 00:02:53,767 проект, о котором я собираюсь вам рассказать — 70 00:02:53,767 --> 00:02:56,787 это совместный проект ФПШЛ 71 00:02:56,787 --> 00:02:59,765 и Венецианского Университета Ка' Фоскари. 72 00:02:59,765 --> 00:03:01,930 У Венеции есть одна особенность — 73 00:03:01,930 --> 00:03:04,604 её система управления 74 00:03:04,604 --> 00:03:06,798 очень и очень бюрократична. 75 00:03:06,798 --> 00:03:08,991 Они отслеживают абсолютно всё, 76 00:03:08,991 --> 00:03:11,906 почти как Гугл сегодня. 77 00:03:11,906 --> 00:03:13,420 Государственный Архив представляет собой 78 00:03:13,420 --> 00:03:15,184 80 километров полок с документами, 79 00:03:15,184 --> 00:03:17,193 содержащими информацию обо всех аспектах 80 00:03:17,193 --> 00:03:19,439 жизни Венеции более чем за 1000 лет. 81 00:03:19,439 --> 00:03:21,359 Здесь учтено каждое отшвартовавшееся 82 00:03:21,359 --> 00:03:22,435 и каждое вошедшее в порт судно. 83 00:03:22,435 --> 00:03:25,232 Записано каждое изменение, произведённое в городе. 84 00:03:25,232 --> 00:03:28,523 Вся эта информация содержится в Архиве. 85 00:03:28,523 --> 00:03:32,431 Мы начинаем 10-летнюю программу по оцифровыванию, 86 00:03:32,431 --> 00:03:34,108 цель которой — трансформация 87 00:03:34,108 --> 00:03:35,492 этого необъятного архива 88 00:03:35,492 --> 00:03:37,918 в гигантскую информационную систему. 89 00:03:37,918 --> 00:03:39,775 Результат, к которому мы стремимся, — 90 00:03:39,775 --> 00:03:44,501 это 450 оцифрованных книг в день. 91 00:03:44,501 --> 00:03:46,748 Конечно, когда занимаешься оцифровкой, этого недостаточно, 92 00:03:46,748 --> 00:03:48,035 потому большинство документов написаны 93 00:03:48,035 --> 00:03:50,674 на латинском, тосканском, 94 00:03:50,689 --> 00:03:52,204 венецианском диалектах. 95 00:03:52,204 --> 00:03:53,879 То есть нужно их транскрибировать, 96 00:03:53,879 --> 00:03:55,560 в некоторых случаях — перевести, 97 00:03:55,560 --> 00:03:56,680 занести в алфавитный указатель, 98 00:03:56,680 --> 00:03:58,844 а это, очевидно, непросто. 99 00:03:58,844 --> 00:04:02,688 В частности, традиционный метод оптического распознавания текста, 100 00:04:02,688 --> 00:04:04,112 который может применяться для печатных манускриптов, 101 00:04:04,112 --> 00:04:08,116 не так хорошо работает для рукописных документов. 102 00:04:08,116 --> 00:04:10,246 И тогда решением будет воспользоваться методами 103 00:04:10,246 --> 00:04:13,147 из другой области: распознавания речи. 104 00:04:13,147 --> 00:04:15,202 Учитывая специфику данной области используемые в ней методы кажутся неприменимыми 105 00:04:15,202 --> 00:04:17,739 но, на самом деле, всё разрешается 106 00:04:17,739 --> 00:04:19,933 путём введения дополнительных ограничений. 107 00:04:19,933 --> 00:04:21,519 Если у вас есть очень хорошая модель 108 00:04:21,519 --> 00:04:23,045 используемого языка, 109 00:04:23,045 --> 00:04:25,131 есть очень хороший образец документа, 110 00:04:25,131 --> 00:04:26,563 как хорошо они структурированы. 111 00:04:26,563 --> 00:04:27,916 И это все административные документы. 112 00:04:27,931 --> 00:04:30,063 Они хорошо структурированы в большинстве случаев. 113 00:04:30,063 --> 00:04:33,371 Если разделить этот огромный архив на меньшие «подархивы», 114 00:04:33,371 --> 00:04:36,248 где меньшая подгруппа несёт те же характерные черты, 115 00:04:36,248 --> 00:04:40,279 тогда есть шанс на успех. 116 00:04:42,761 --> 00:04:45,196 Если мы дойдём до этого этапа, то появится возможность сделать ещё одну вещь: 117 00:04:45,196 --> 00:04:48,718 извлечь из такого документа события. 118 00:04:48,718 --> 00:04:51,016 Фактически, около 10 миллиардов событий 119 00:04:51,016 --> 00:04:52,947 могут быть извлечены из такого архива. 120 00:04:52,947 --> 00:04:54,671 Поиск по этой огромной информационной системе 121 00:04:54,671 --> 00:04:56,487 можно проводить различными методами. 122 00:04:56,487 --> 00:04:57,855 Можно задавать такие вопросы как: 123 00:04:57,855 --> 00:05:00,615 «Кто жил в этом палаццо в 1323 году?» 124 00:05:00,615 --> 00:05:02,837 «Сколько стоил морской лещ на рынке Реальто 125 00:05:02,837 --> 00:05:04,561 в 1434 году?» 126 00:05:04,561 --> 00:05:06,021 «Каково было жалованье 127 00:05:06,021 --> 00:05:08,066 стекловара в Мурано, 128 00:05:08,066 --> 00:05:09,472 например, за последние десять лет?» 129 00:05:09,472 --> 00:05:10,894 Можно даже задавать более открытые вопросы, 130 00:05:10,894 --> 00:05:13,632 потому как они будут семантически закодированы. 131 00:05:13,632 --> 00:05:15,772 Далее — можно согласовать информацию в пространстве, 132 00:05:15,772 --> 00:05:17,945 так как большая её часть является пространственной. 133 00:05:17,945 --> 00:05:19,880 Затем можно предпринимать такие действия, как 134 00:05:19,880 --> 00:05:21,993 воссоздание необыкновенного пути развития 135 00:05:21,993 --> 00:05:25,349 города, которому удалось поддерживать устойчивое развитие 136 00:05:25,349 --> 00:05:27,475 на протяжении более 1000 лет, 137 00:05:27,475 --> 00:05:29,095 оставаясь при этом 138 00:05:29,095 --> 00:05:31,956 в постоянной гармонии с окружающей средой. 139 00:05:31,956 --> 00:05:33,204 Вы можете воссоздать этот путь развития, 140 00:05:33,204 --> 00:05:36,100 представить различные его варианты. 141 00:05:36,100 --> 00:05:38,799 Хотя, конечно, нельзя понять Венецию, просто взглянув на город. 142 00:05:38,799 --> 00:05:41,195 Необходимо рассматривать его в более широком европейском контексте. 143 00:05:41,195 --> 00:05:44,016 Таким образом, идея заключается в документировании всего, 144 00:05:44,016 --> 00:05:46,439 что происходило на европейском уровне. 145 00:05:46,439 --> 00:05:48,403 Можно также воссоздать развитие 146 00:05:48,403 --> 00:05:50,393 Венецианской морской империи — 147 00:05:50,393 --> 00:05:53,559 то как она постепенно взяла под контроль Адриатическое море, 148 00:05:53,559 --> 00:05:57,305 как стала самой мощной средневековой империей 149 00:05:57,305 --> 00:05:58,866 средневековой империей, 150 00:05:58,866 --> 00:06:01,038 контролируя большинство морских путей 151 00:06:01,038 --> 00:06:03,971 от востока на юг. 152 00:06:05,305 --> 00:06:07,621 Также можно делать и другие вещи, 153 00:06:07,621 --> 00:06:09,898 потому что на этих морских путях 154 00:06:09,898 --> 00:06:11,873 есть свои закономерности. 155 00:06:11,889 --> 00:06:14,382 Можно пойти ещё дальше 156 00:06:14,382 --> 00:06:16,502 и создать систему моделирования, 157 00:06:16,502 --> 00:06:19,317 Средиземноморский симулятор, 158 00:06:19,317 --> 00:06:21,910 который способен воссоздать 159 00:06:21,910 --> 00:06:24,112 даже ту информацию, которой не хватает, 160 00:06:24,112 --> 00:06:27,100 что даёт нам возможность задавать такие вопросы, 161 00:06:27,100 --> 00:06:30,088 как если бы мы воспользовались планировщиком маршрута. 162 00:06:30,088 --> 00:06:33,159 «Если я сейчас на Корфу в июне 1323 года 163 00:06:33,159 --> 00:06:35,685 и хочу отправиться в Константинополь, 164 00:06:35,685 --> 00:06:37,828 где я могу взять лодку?» 165 00:06:37,828 --> 00:06:39,195 Мы можем ответить на этот вопрос, вероятно, 166 00:06:39,195 --> 00:06:43,668 с точностью в день-два-три. 167 00:06:43,668 --> 00:06:45,275 «Сколько это будет стоить?» 168 00:06:45,275 --> 00:06:48,867 «Какова вероятность столкнуться с пиратами?» 169 00:06:48,867 --> 00:06:50,678 Вы, конечно, понимаете, 170 00:06:50,678 --> 00:06:53,287 что главная научная трудность подобного проекта, — 171 00:06:53,287 --> 00:06:57,016 это качественная и количественная оценка информации и учёт 172 00:06:57,016 --> 00:07:00,346 неопределённости и непостоянства на каждом этапе данного процесса. 173 00:07:00,346 --> 00:07:03,058 Ошибки встречаются повсюду — 174 00:07:03,058 --> 00:07:05,547 в документах, например, неверное имя капитана, 175 00:07:05,547 --> 00:07:08,760 некоторые судна, на самом деле, никогда не уходили в море. 176 00:07:08,760 --> 00:07:13,617 Ошибки в переводе, предвзятость толкований, — 177 00:07:13,624 --> 00:07:17,090 более того, если добавить алгоритмические процессы, — 178 00:07:17,090 --> 00:07:20,039 появятся ошибки, связанные с распознаванием, 179 00:07:20,039 --> 00:07:22,000 извлечением информации. 180 00:07:22,000 --> 00:07:26,481 То есть полученные нами данные будут весьма и весьма сомнительными. 181 00:07:26,481 --> 00:07:30,238 Каким же образом можно обнаружить и скорректировать такие неточности? 182 00:07:30,238 --> 00:07:33,898 Каким образом можно обозначить этот вид неопределённости? 183 00:07:33,898 --> 00:07:35,995 Задача не из лёгких. Самое очевидное, что можно сделать, — 184 00:07:35,995 --> 00:07:38,221 это задокументировать каждый шаг процесса, 185 00:07:38,221 --> 00:07:40,669 не только закодировав историческую информацию, 186 00:07:40,669 --> 00:07:43,348 но и так называемую «метаисторическую» информацию — 187 00:07:43,348 --> 00:07:46,011 то, на чем построены исторические знания — 188 00:07:46,011 --> 00:07:48,009 задокументировать каждый шаг. 189 00:07:48,009 --> 00:07:49,654 Это не даст гарантии, что мы приблизимся 190 00:07:49,654 --> 00:07:52,104 к единой истории Венеции, 191 00:07:52,104 --> 00:07:54,242 но мы, вероятно, сможем воссоздать 192 00:07:54,242 --> 00:07:57,290 полностью задокументированную потенциальную историю Венеции. 193 00:07:57,290 --> 00:07:58,749 Может быть, не будет единой карты. 194 00:07:58,749 --> 00:08:00,869 Может быть, их будет несколько. 195 00:08:00,869 --> 00:08:03,085 Система должна это учитывать, 196 00:08:03,085 --> 00:08:05,944 потому что нам приходиться работать с новой формой неизвестности, 197 00:08:05,944 --> 00:08:10,585 которая является абсолютным новшеством для такого типа гигантских баз данных. 198 00:08:10,585 --> 00:08:12,775 Каким образом мы должны представить 199 00:08:12,790 --> 00:08:16,769 это новое исследование большой аудитории? 200 00:08:16,769 --> 00:08:19,432 И вновь, Венеция — исключительна в этом смысле. 201 00:08:19,432 --> 00:08:21,603 Учитывая миллионы туристов, приезжающих каждый год, 202 00:08:21,603 --> 00:08:23,366 она является одним из лучших мест, 203 00:08:23,366 --> 00:08:26,354 где можно попытаться изобрести музей будущего. 204 00:08:26,354 --> 00:08:29,658 Представьте, в горизонтальной плоскости вы видите реконструированную карту 205 00:08:29,658 --> 00:08:30,944 заданного года, 206 00:08:30,944 --> 00:08:33,902 а в вертикальной — документ, 207 00:08:33,902 --> 00:08:35,413 на основе которого сделана реконструкция, 208 00:08:35,413 --> 00:08:38,813 например, картины. 209 00:08:38,813 --> 00:08:41,393 Представьте систему с «эффектом присутствия», которая позволяет 210 00:08:41,393 --> 00:08:44,895 воссоздать и окунуться в Венецию заданного года — 211 00:08:44,895 --> 00:08:47,610 опыт, которым можно поделиться с группой. 212 00:08:47,610 --> 00:08:49,856 И наоборот, представьте, что вы начали 213 00:08:49,856 --> 00:08:52,063 с документа, венецианского манускрипта, 214 00:08:52,063 --> 00:08:55,112 и вы смотрите, что можно воспроизвести на его основе, 215 00:08:55,112 --> 00:08:56,884 как он расшифрован, 216 00:08:56,884 --> 00:08:59,299 каким образом можно воссоздать его содержание. 217 00:08:59,299 --> 00:09:01,184 Это фотография с выставки, 218 00:09:01,184 --> 00:09:03,460 которая в настоящее время проходит в Женеве, 219 00:09:03,460 --> 00:09:05,814 с такой вот системой. 220 00:09:05,814 --> 00:09:07,989 В заключении можно сказать, что 221 00:09:07,989 --> 00:09:11,068 исследования в области гуманитарных наук стоят на пороге 222 00:09:11,068 --> 00:09:12,870 эволюции, возможно, схожей с той, 223 00:09:12,870 --> 00:09:17,452 что произошла с бионауками 30 лет назад. 224 00:09:17,452 --> 00:09:22,128 Действительно, это вопрос масштаба. 225 00:09:22,130 --> 00:09:25,433 Мы рассматриваем проекты, которые 226 00:09:25,433 --> 00:09:29,276 ещё не были под силу ни одной исследовательской команде 227 00:09:29,276 --> 00:09:31,519 это абсолютно ново для гуманитарных наук, 228 00:09:31,519 --> 00:09:35,388 где традицией является работать 229 00:09:35,388 --> 00:09:39,396 небольшими группами или в паре. 230 00:09:39,396 --> 00:09:41,514 Посещая Государственный Архив, 231 00:09:41,514 --> 00:09:44,336 понимаешь, что это не по силам какой-то одной команде, 232 00:09:44,336 --> 00:09:48,170 необходимо сотрудничество. 233 00:09:48,170 --> 00:09:51,276 Для смены парадигмы мы должны 234 00:09:51,276 --> 00:09:53,178 фактически воспитать новое поколение 235 00:09:53,178 --> 00:09:54,715 «цифровых гуманитарных наук», 236 00:09:54,715 --> 00:09:56,805 готовых к подобной смене. 237 00:09:56,805 --> 00:09:58,764 Спасибо большое. 238 00:09:58,764 --> 00:10:02,764 (Аплодисменты)