0:00:00.711,0:00:03.531 Десять тысяч километров дорог, 0:00:03.531,0:00:05.734 тысяча километров метро, 0:00:05.734,0:00:07.378 600 километров велодорожек 0:00:07.378,0:00:09.199 и почти километр трамвайных путей, 0:00:09.199,0:00:11.152 если вы бывали на острове Рузвельта. 0:00:11.152,0:00:14.486 Это цифры, из которых состоит[br]инфраструктура Нью-Йорка. 0:00:14.486,0:00:17.105 Это статистические данные[br]нашей инфраструктуры. 0:00:17.105,0:00:20.811 Именно эти данные вы можете[br]увидеть в отчётах городских служб. 0:00:20.811,0:00:24.010 К примеру, в Департаменте[br]транспорта вам наверняка скажут, 0:00:24.010,0:00:25.791 сколько километров дорог[br]они обслуживают. 0:00:25.791,0:00:28.612 MTA похвастается, как много[br]километров подземки в городе. 0:00:28.612,0:00:30.419 Многие службы делятся статистикой. 0:00:30.419,0:00:31.902 Из отчёта этого года 0:00:31.902,0:00:33.794 от Комиссии по такси и лимузинам 0:00:33.794,0:00:37.070 мы узнаём, что в Нью-Йорке[br]около 13 500 такси. 0:00:37.070,0:00:38.360 Интересно, не так ли? 0:00:38.360,0:00:41.144 А вы не задумывались, [br]откуда берутся эти цифры? 0:00:41.144,0:00:44.047 Ведь чтобы их опубликовать,[br]кто-то должен был подумать: 0:00:44.047,0:00:47.927 «Хм, а вот это может быть[br]кому-то интересно. 0:00:47.927,0:00:50.177 Это цифры, которые могут[br]понадобиться горожанам». 0:00:50.177,0:00:52.007 А потом вернуться к исходным данным, 0:00:52.007,0:00:53.804 посчитать, сложить, подвести итог 0:00:53.804,0:00:55.271 и выложить отчёт, 0:00:55.271,0:00:57.448 один из многих отчётов[br]с подобной статистикой. 0:00:57.448,0:00:59.988 Проблема вот в чём:[br]откуда им знать все наши вопросы? 0:00:59.988,0:01:01.231 А у нас много вопросов. 0:01:01.231,0:01:04.571 На самом деле, у нас буквально[br]бесконечное количество вопросов, 0:01:04.571,0:01:05.980 связанных с городом. 0:01:05.980,0:01:07.695 Городским службам не угадать их все. 0:01:07.695,0:01:11.751 Этот подход не работает и, я полагаю,[br]должностные лица это понимают, 0:01:11.751,0:01:15.710 поскольку в 2012 году мэр Блумберг[br]утвердил закон, который он назвал 0:01:15.710,0:01:19.547 самым амбициозным и исчерпывающим[br]законопроектом об открытых данных в стране. 0:01:19.547,0:01:21.120 Во многом он прав. 0:01:21.120,0:01:23.981 За последние два года город разместил[br]1 000 массивов данных 0:01:23.981,0:01:25.591 на портале открытых данных, 0:01:25.591,0:01:27.285 и это очень круто. 0:01:27.285,0:01:29.323 Вы заходите и смотрите на эти данные, 0:01:29.323,0:01:31.612 и вместо того, чтобы просто считать такси, 0:01:31.612,0:01:33.555 вы можете задавать самые разные вопросы. 0:01:33.555,0:01:34.755 У меня был такой вопрос. 0:01:34.755,0:01:36.456 Когда в Нью-Йорке час пик? 0:01:36.456,0:01:39.037 Ведь пробки всех достают.[br]Так когда наступает час пик? 0:01:39.037,0:01:41.662 И я подумал, ведь такси —[br]это не просто циферки, 0:01:41.662,0:01:44.373 это GPS-устройства,[br]которые разъежают по улицам города 0:01:44.373,0:01:46.286 и записывают каждую поездку. 0:01:46.286,0:01:48.608 Эти данные доступны,[br]я их проанализировал 0:01:48.608,0:01:52.569 и нарисовал диаграмму средней скорости[br]такси в Нью-Йорке в течение дня. 0:01:52.569,0:01:55.981 Вы видите, что где-то[br]с полуночи до 5:18 утра 0:01:55.981,0:01:59.544 скорость растёт, а потом — наоборот, 0:01:59.544,0:02:03.506 движение всё замедляется и замедляется,[br]вплоть до 8:35 утра, 0:02:03.506,0:02:06.199 когда скорость падает до 18,5 км/ч. 0:02:06.199,0:02:09.761 Среднестатистическое такси ездит по городу[br]со скоростью 18,5 км/ч, 0:02:09.761,0:02:11.748 и выясняется, что эта скорость держится 0:02:11.748,0:02:15.116 на протяжении всего дня. 0:02:15.116,0:02:16.489 (Смех) 0:02:16.489,0:02:19.669 И я подумал:[br]«Кажется, в Нью-Йорке нет часа пик. 0:02:19.669,0:02:21.206 Есть только день пик». 0:02:21.206,0:02:24.056 Так и есть. И это важно по ряду причин. 0:02:24.056,0:02:27.673 Если вы занимаетесь схемой уличного [br]движения, это должно быть вам интересно. 0:02:27.673,0:02:29.728 Но если вы хотите быстро[br]куда-то добраться, 0:02:29.728,0:02:33.136 заводите будильник на 4:45 и вперёд. 0:02:33.136,0:02:34.080 Это же Нью-Йорк. 0:02:34.080,0:02:35.842 С этими данными связана одна история. 0:02:35.842,0:02:38.027 Их было не так просто получить. 0:02:38.027,0:02:41.646 Для этого пришлось сделать запрос[br]в рамках Закона о свободе информации, 0:02:41.646,0:02:42.522 запрос FOIL. 0:02:42.522,0:02:45.988 Бланк можно найти на сайте[br]Комиссии по такси и лимузинам. 0:02:45.988,0:02:49.014 Чтобы получить доступ к данным,[br]вам надо получить этот бланк, 0:02:49.014,0:02:50.860 заполнить его и ждать ответа; 0:02:50.860,0:02:52.990 и один парень, Крис Вонг,[br]всё это сделал. 0:02:52.990,0:02:54.980 Крис связался с ними, и они ответили: 0:02:54.980,0:02:57.677 «Принóсите новый жёсткий диск, 0:02:57.677,0:03:01.231 оставляете его на 5 часов, мы копируем[br]туда все данные и отдаём диск вам». 0:03:01.231,0:03:03.263 Вот откуда вся эта информация. 0:03:03.263,0:03:06.268 Крис — из тех, кто стремится сделать[br]информацию публичной, 0:03:06.268,0:03:10.052 поэтому данные оказались в общем доступе[br]в Интернете, и появился этот график. 0:03:10.052,0:03:13.570 И то, что он существует, — круто.[br]Эти GPS-устройства — классная вещь. 0:03:13.570,0:03:16.688 Но то, что горожанам приходится[br]ходить с жёсткими дисками 0:03:16.688,0:03:19.270 и собирать данные из агентств,[br]чтобы опубликовать их — 0:03:19.270,0:03:21.660 хотя они уже «публичны» —[br]их же можно получить, 0:03:21.660,0:03:23.472 на деле это лишь видимость открытости. 0:03:23.472,0:03:25.434 Наш город способен на большее. 0:03:25.434,0:03:28.190 Нельзя заставлять людей расхаживать[br]с жёсткими дисками. 0:03:28.190,0:03:30.527 Не все данные спрятаны за формой FOIL. 0:03:30.527,0:03:34.329 Я сделал карту самых опасных[br]перекрёстков в Нью-Йорке 0:03:34.329,0:03:36.207 по количеству ДТП с велосипедистами. 0:03:36.207,0:03:38.146 Красные зоны — самые опасные. 0:03:38.146,0:03:40.699 В первую очередь, на востоке Манхэттена, 0:03:40.699,0:03:44.310 а в особенности — в нижней его части,[br]множество ДТП с велосипедистами. 0:03:44.310,0:03:45.329 Кажется, это логично, 0:03:45.329,0:03:48.225 ведь там больше велосипедистов[br]спускаются с мостов. 0:03:48.225,0:03:50.239 Но есть и другие интересные места. 0:03:50.239,0:03:52.908 Уильямсбург. Рузвельт-авеню в Куинсе. 0:03:52.908,0:03:55.760 Именно такие данные нужны нам[br]в рамках программы Vision Zero. 0:03:55.760,0:03:57.750 Это как раз то, что мы искали. 0:03:57.750,0:03:59.885 Но и у этих данных есть своя история. 0:03:59.885,0:04:01.952 Эти данные появились не просто так. 0:04:01.952,0:04:04.343 Кто из вас узнаёт этот логотип? 0:04:04.343,0:04:05.695 Вижу, кто-то кивает. 0:04:05.695,0:04:08.280 Вы когда-нибудь пытались[br]скопировать данные из PDF так, 0:04:08.280,0:04:09.817 чтобы они не стали бессмыслицей? 0:04:09.817,0:04:10.667 Мотаете головой. 0:04:10.667,0:04:14.012 Многие знают, что такое копировать данные[br]из PDF, но не узнают логотип. 0:04:14.012,0:04:17.622 Так вот, данные, которые вы[br]только что видели, были в формате PDF. 0:04:17.622,0:04:20.637 Сотни и сотни страниц PDF-файлов, 0:04:20.637,0:04:22.886 опубликованных Департаментом[br]полиции Нью-Йорка, 0:04:22.886,0:04:26.188 и чтобы получить доступ к данным,[br]вам нужно или копировать их вручную 0:04:26.188,0:04:27.764 на протяжении сотен часов, 0:04:27.764,0:04:29.108 или быть Джоном Крауссом. 0:04:29.108,0:04:30.151 Джон Краусс подумал: 0:04:30.151,0:04:33.564 «Не буду я копировать данные вручную.[br]Лучше я напишу программу». 0:04:33.564,0:04:35.812 Он назвал её NYPD Crash Data Band-Aid, 0:04:35.812,0:04:38.884 она заходила на сайт Департамента полиции[br]и скачивала PDF-файлы. 0:04:38.884,0:04:42.010 Каждый день она искала PDF-файлы[br]и, если находила, скачивала их, 0:04:42.010,0:04:44.260 а затем запускала программу разбора PDF, 0:04:44.260,0:04:45.596 извлекала текст, 0:04:45.596,0:04:49.161 загружала данные в Интернет, и в итоге[br]люди могли делать подобные карты. 0:04:49.161,0:04:52.590 И то, что у нас есть эти данные,[br]что мы можем работать с ними... 0:04:52.590,0:04:55.040 Кстати, каждое ДТП —[br]строка в этой таблице. 0:04:55.040,0:04:56.876 Представьте, сколько это PDF-файлов. 0:04:56.876,0:04:59.083 У нас есть доступ к данным —[br]это отлично, 0:04:59.083,0:05:01.193 но не нужно публиковать их в формате PDF 0:05:01.193,0:05:03.932 и заставлять горожан писать[br]программы разбора PDF-файлов. 0:05:03.932,0:05:06.008 Это не лучший способ[br]задействовать горожан, 0:05:06.008,0:05:08.012 и мы, как город,[br]можем улучшить ситуацию. 0:05:08.012,0:05:10.598 Есть и хорошая новость —[br]администрация де Блазио 0:05:10.598,0:05:13.280 недавно опубликовала эти данные,[br]несколько месяцев назад, 0:05:13.280,0:05:15.438 и теперь у нас есть[br]нормальный доступ к ним, 0:05:15.438,0:05:17.974 но множество данных по-прежнему[br]сокрыто в PDF-файлах. 0:05:17.974,0:05:21.171 Например, данные по преступности [br]доступны только в формате PDF. 0:05:21.171,0:05:24.926 И не только. Даже бюджет города. 0:05:24.926,0:05:28.275 Бюджет города доступен[br]только в формате PDF. 0:05:28.275,0:05:30.796 И не только мы с вами не можем[br]проанализировать его, 0:05:30.796,0:05:33.751 но и сами законодатели,[br]которые голосуют за бюджет, 0:05:33.751,0:05:35.694 тоже получают его только в формате PDF. 0:05:35.694,0:05:39.538 Законодатели не могут проанализировать[br]бюджет, за который голосуют. 0:05:39.538,0:05:43.146 И я думаю, что мы можем[br]организовать всё гораздо лучше. 0:05:43.146,0:05:45.634 Есть множество данных,[br]не похороненных в PDF-файлах. 0:05:45.634,0:05:47.334 Вот ещё одна из таких карт — 0:05:47.334,0:05:50.180 самая грязная вода в Нью-Йорке. 0:05:50.180,0:05:51.769 Как измерить загрязнённость воды? 0:05:51.769,0:05:53.626 Это покажется немного странным, 0:05:53.626,0:05:55.739 но я смотрел на уровень[br]фекальных бактерий, 0:05:55.739,0:05:59.245 который по сути отражает[br]количество экскрементов в воде. 0:05:59.245,0:06:02.519 Чем больше круг, тем грязнее вода, 0:06:02.519,0:06:05.876 большие круги — грязная вода,[br]маленькие — вода почище. 0:06:05.876,0:06:07.520 Вы видите, что каналы на суше — 0:06:07.520,0:06:10.924 эти данные собирались в течение[br]последних пяти лет — 0:06:10.924,0:06:13.618 каналы на суше, в общем случае, грязнее. 0:06:13.618,0:06:14.836 Логично, не так ли? 0:06:14.836,0:06:18.070 Больше круг — грязнее вода.[br]Из этой карты я сделал несколько выводов. 0:06:18.070,0:06:21.374 Первое: никогда не купаться в том,[br]что называется «сток» или «канал». 0:06:21.374,0:06:25.692 Второе: я также нашёл грязнейший[br]водосток в Нью-Йорке. 0:06:25.692,0:06:27.526 Но только по этому параметру. 0:06:27.526,0:06:31.174 В Кони-Айленд Крик — это не тот[br]Кони-Айленд, где вы купаетесь, к счастью. 0:06:31.174,0:06:32.332 Это с другой стороны. 0:06:32.332,0:06:36.210 Но в Кони-Айленд Крик[br]в 94% образцов, взятых за пять лет, 0:06:36.210,0:06:38.367 был настолько повышенный[br]уровень экскрементов, 0:06:38.367,0:06:41.460 что плавать там было просто незаконно. 0:06:41.460,0:06:44.189 Подобными вещами не хвалятся 0:06:44.189,0:06:45.726 в городских отчётах, верно? 0:06:45.726,0:06:47.976 Этого не будет на домашней[br]странице nyc.gov. 0:06:47.976,0:06:49.456 Там вы этого не увидите, 0:06:49.456,0:06:52.074 но то, что мы можем получить[br]эти данные,— это очень круто. 0:06:52.074,0:06:53.747 Но опять же это было непросто, 0:06:53.747,0:06:56.205 потому что этого не было[br]на портале открытых данных. 0:06:56.205,0:06:58.218 Если бы вы зашли[br]на портал открытых данных, 0:06:58.218,0:07:00.831 вы бы увидели данные[br]за год или за пару месяцев. 0:07:00.831,0:07:04.221 Полный массив находился на сайте[br]Департамента охраны окружающей среды. 0:07:04.221,0:07:08.019 И каждая из этих ссылок — лист Excel,[br]все эти листы Excel — разные. 0:07:08.019,0:07:10.909 Разные заголовки, их приходится[br]копировать, всё переделывать. 0:07:10.909,0:07:13.681 В итоге вы можете рисовать[br]такие карты, и это хорошо, 0:07:13.681,0:07:16.650 но можно организовать это получше,[br]стандартизировать форму. 0:07:16.650,0:07:19.974 И мы движемся в этом направлении,[br]есть один сайт от Socrata, 0:07:19.974,0:07:21.575 «Портал открытых данных Нью-Йорка». 0:07:21.575,0:07:24.072 Это около 1 100 массивов данных[br]без тех недостатков, 0:07:24.072,0:07:25.613 о которых я говорил. 0:07:25.613,0:07:27.761 Сайт постоянно растёт,[br]и это прекрасно. 0:07:27.761,0:07:31.143 Вы можете скачать данные в любом формате,[br]будь то CSV, PDF или Excel. 0:07:31.143,0:07:33.720 Вы можете скачать всё, что захотите,[br]в удобном формате. 0:07:33.720,0:07:35.302 Но даже тут есть одна проблема: 0:07:35.302,0:07:38.758 каждое агенство по-разному[br]кодирует адреса. 0:07:38.758,0:07:40.899 Где-то есть названия[br]пересекающихся улиц, 0:07:40.899,0:07:43.340 улица, боро, адрес,[br]номер дома, адрес дома. 0:07:43.340,0:07:46.570 И вы снова вынуждены тратить своё время,[br]даже используя этот портал, 0:07:46.570,0:07:49.176 вы тратите время, нормализуя[br]данные в адресных полях. 0:07:49.176,0:07:51.599 Это не лучший способ[br]использовать время горожан. 0:07:51.599,0:07:53.395 Мы можем улучшить ситуацию. 0:07:53.395,0:07:55.040 Мы можем стандартизировать адреса, 0:07:55.040,0:07:57.225 и сделав это, мы получим[br]больше таких карт. 0:07:57.225,0:07:59.510 Это карта пожарных гидрантов Нью-Йорка, 0:07:59.510,0:08:01.041 но не всех подряд. 0:08:01.041,0:08:05.767 Это 250 гидрантов, лидирующих по прибыли[br]за счёт штрафов за неправильную парковку. 0:08:05.767,0:08:07.753 (Смех) 0:08:07.753,0:08:11.111 Я кое-что узнал благодаря этой карте, [br]мне она очень нравится. 0:08:11.111,0:08:13.513 Первое: не паркуйтесь в Верхнем Ист-Сайде. 0:08:13.513,0:08:17.140 Просто не надо. Не важно, где вы встали,[br]вы заплатите за парковку у гидранта. 0:08:17.140,0:08:21.253 Второе: есть два самых прибыльных[br]гидранта во всем Нью-Йорке, 0:08:21.253,0:08:23.139 они находятся в Нижнем Ист-Сайде 0:08:23.139,0:08:28.237 и собирают более 55 000 долларов[br]в год в виде штрафов за парковку. 0:08:28.237,0:08:30.975 Мне это показалось немного странным, 0:08:30.975,0:08:34.244 я копнул глубже и увидел вот что:[br]гидрант на краю тротуара, 0:08:34.244,0:08:36.240 потом расширение тротуара, что-то вроде 0:08:36.240,0:08:38.299 двухметровой полосы для пешеходов, 0:08:38.299,0:08:39.605 а затем парковочные места. 0:08:39.605,0:08:41.649 Люди приезжали, видели гидрант... Думали: 0:08:41.649,0:08:43.620 «Гидрант далеко, вон там, всё в порядке». 0:08:43.620,0:08:47.094 И плюс ко всему, там была разметка,[br]обозначающая парковочное место. 0:08:47.094,0:08:50.539 Люди парковались там, а полиция[br]Нью-Йорка не соглашалась с этой разметкой 0:08:50.539,0:08:51.307 и штрафовала их. 0:08:51.307,0:08:53.651 И не только я видел[br]эти штрафы за парковку. 0:08:53.651,0:08:55.797 Вот машина Google Street[br]View проезжает там 0:08:55.797,0:08:57.414 и снимает тот же самый штраф. 0:08:57.414,0:09:01.918 Я написал об этом в своём блоге I Quant NY,[br]и мне ответили из Департамента транспорта, 0:09:01.918,0:09:02.938 они написали: 0:09:02.938,0:09:06.348 «Хотя Департамент транспорта и не получал[br]жалоб по поводу этого места, 0:09:06.348,0:09:10.890 мы пересмотрим разметку[br]и внесём необходимые изменения». 0:09:10.890,0:09:13.849 Я подумал:[br]«Типичная государственная отписка». 0:09:13.849,0:09:15.730 Ну и ладно, и забыл об этом. 0:09:15.730,0:09:19.700 Но спустя несколько недель[br]случилось кое-что невообразимое. 0:09:19.700,0:09:22.220 Они переделали разметку, 0:09:22.220,0:09:24.910 и в тот момент я увидел будущее,[br]эпоху открытых данных. 0:09:24.910,0:09:26.910 Только подумайте, что произошло. 0:09:26.910,0:09:32.010 На протяжении пяти лет тут выписывали[br]штрафы, разметка была неоднозначной, 0:09:32.010,0:09:36.316 а потом горожанин заметил это, сообщил[br]городу, и в течение нескольких недель 0:09:36.316,0:09:37.610 проблема была решена. 0:09:37.610,0:09:41.000 Потрясающе. Многие смотрят на открытые[br]данные как на механизм контроля. 0:09:41.000,0:09:42.582 Это не так, суть в партнёрстве. 0:09:42.582,0:09:45.720 Мы даём гражданам возможность[br]работать рука об руку с государством, 0:09:45.720,0:09:47.491 и это не так уж сложно. 0:09:47.491,0:09:49.060 Всё, что нужно, — пара изменений. 0:09:49.060,0:09:50.167 Если вы предоставляете 0:09:50.167,0:09:53.124 данные по запросу FOIL и видите,[br]что их запрашивают постоянно, 0:09:53.124,0:09:56.608 просто выложите их в общий доступ,[br]вы ведь видите, что они востребованы. 0:09:56.608,0:09:59.090 Если вы агентство,[br]которое публикует PDF-файлы, 0:09:59.090,0:10:02.739 нужен закон, обязующий вас публиковать[br]данные, лежащие в основе PDF-файлов, 0:10:02.739,0:10:04.767 ведь вы получаете их каким-то образом. 0:10:04.767,0:10:07.199 Я не знаю откуда,[br]но где-то вы их берёте, а значит, 0:10:07.199,0:10:08.984 можете опубликовать вместе с PDF-ками. 0:10:08.984,0:10:11.385 Давайте примем и внедрим[br]стандарты открытых данных. 0:10:11.385,0:10:13.866 Начнём с адресов в Нью-Йорке. 0:10:13.866,0:10:15.940 Стандартизируем формат адреса. 0:10:15.940,0:10:18.002 Нью-Йорк — лидер в области[br]открытых данных. 0:10:18.002,0:10:20.761 Несмотря на всё это, мы лидеры[br]в области открытых данных, 0:10:20.761,0:10:23.912 и если мы займёмся нормализацией,[br]стандартизацией открытых данных, 0:10:23.912,0:10:27.546 нашему примеру последует и штат,[br]и, может быть, федеральное правительство. 0:10:27.546,0:10:29.031 За нами пойдут и другие страны, 0:10:29.031,0:10:32.402 мы не так далеко от момента, когда кто-то[br]сможет написать программу, 0:10:32.402,0:10:34.292 наносящую на карту данные из 100 стран. 0:10:34.292,0:10:36.779 Это не научная фантастика.[br]Мы довольно-таки близко. 0:10:36.779,0:10:39.019 Кстати, а кто всем этим занимается? 0:10:39.019,0:10:42.024 Это не только Джон Краусс и Крис Вонг. 0:10:42.024,0:10:44.939 В Нью-Йорке проходят сотни встреч, 0:10:44.939,0:10:45.844 оживлённых встреч. 0:10:45.844,0:10:48.416 Тысячи людей приходят на эти собрания. 0:10:48.416,0:10:50.784 Люди приходят после работы,[br]на выходных, 0:10:50.784,0:10:53.420 они собираются, чтобы взглянуть[br]на открытые данные 0:10:53.420,0:10:55.060 и сделать наш город лучше. 0:10:55.060,0:10:59.433 Есть группы вроде BetaNYC, которая[br]недавно создала сайт www.citygram.nyc, 0:10:59.433,0:11:01.580 где вы можете подписаться[br]на жалобы в службу «3-1-1» 0:11:01.580,0:11:03.648 рядом с домом или местом работы. 0:11:03.648,0:11:06.075 Ввóдите свой адрес и видите[br]жалобы в окрестностях. 0:11:06.075,0:11:09.259 Этим занимаются не только технари. 0:11:09.259,0:11:12.071 Градостроители, студенты,[br]которых я учу в Институте Пратта. 0:11:12.071,0:11:13.990 Правозащитники — да все подряд, 0:11:13.990,0:11:16.553 горожане с самым разным опытом. 0:11:16.553,0:11:19.339 Путём небольших,[br]постепенных изменений 0:11:19.339,0:11:22.564 мы можем разбудить страсть[br]и дать горожанам возможность 0:11:22.564,0:11:25.720 использовать открытые данные[br]и улучшать наш город, 0:11:25.720,0:11:29.346 не важно, идёт речь о целом массиве данных[br]или об одном парковочном месте. 0:11:29.346,0:11:31.668 Спасибо. 0:11:31.668,0:11:34.973 (Аплодисменты)