Пусть данные рассказывают больше | Бен Уэллингтон | TEDxBroadway
-
0:07 - 0:09Здравствуйте всем. Как уже сказали,
-
0:09 - 0:12я Бен Уэллингтон,
и я рассказываю истории на данных. -
0:12 - 0:13Истории на данных.
-
0:13 - 0:17Если бы год назад меня спросили,
что это значит, -
0:17 - 0:19я бы скорее всего сказал,
что не имею ни малейшего понятия. -
0:19 - 0:23Сегодня я расскажу о том,
что делал весь прошлый год, -
0:23 - 0:26когда я случайно стал рассказывать
истории с помощью данных. -
0:26 - 0:28Я расскажу о том, что понял в процессе,
-
0:28 - 0:31и, может быть, смогу убедить
кого-нибудь из вас заняться тем же. -
0:31 - 0:33Если вы любопытны, если вам захочется.
-
0:35 - 0:37Немного о моём прошлом.
-
0:37 - 0:40Во-первых, я работаю в инвестиционной
компании Two Sigma, -
0:40 - 0:41занимаюсь анализом данных.
-
0:41 - 0:43Это одна часть моего мира.
-
0:43 - 0:46А ещё я женат на городском планировщике,
-
0:46 - 0:49и у меня есть мир программирования
и мир планирования города, -
0:49 - 0:50и большую часть времени
-
0:50 - 0:53эти две части моей жизни
были обособлены друг от друга, -
0:53 - 0:55и так оно и шло.
-
0:55 - 0:58Так было, а потом здесь,
в Нью-Йорке, в 2011 году -
0:58 - 1:00мэр Блумберг подписал закон
-
1:00 - 1:02об открытых данных города Нью-Йорка.
-
1:02 - 1:06Это невероятно важно для таких, как я,
потому что это открывает нам данные -
1:06 - 1:10городского управления,
и теперь любой может в них заглянуть. -
1:10 - 1:13Поскольку раньше правительство делало
анализ и говорило нам: -
1:13 - 1:15«Эй, в этом районе столько-то аварий»,
-
1:15 - 1:19теперь мы можем просматривать точку
за точкой, на самом детальном уровне. -
1:20 - 1:23Когда это произошло, всё закончилось...
-
1:23 - 1:27Кстати, это открытый портал данных,
туда может зайти каждый, -
1:27 - 1:29это открытые данные Нью-Йорка,
-
1:29 - 1:31и там собраны данные о самых разных вещах.
-
1:31 - 1:33Например, есть размеры телевизоров
-
1:33 - 1:36на Таймс-сквер и их расположение.
-
1:36 - 1:38Не знаю, зачем, но это правда классно.
-
1:38 - 1:40Есть самые разные данные,
-
1:40 - 1:42сейчас — порядка 1 200 разных наборов.
-
1:42 - 1:44И их число всё время растёт.
-
1:44 - 1:47Я занялся чем-то вроде анализа данных,
-
1:47 - 1:50заинтересовавшись планированием города
после разговоров с женой, -
1:50 - 1:53и стал публиковать всё
в своём блоге «Я СЧИТАЮ НЬЮ-ЙОРК». -
1:56 - 1:57Круто, знаю.
-
1:57 - 2:00Первым делом я нарисовал эту карту.
-
2:00 - 2:03Это карта травм велосипедистов
в Нью-Йорке. -
2:03 - 2:04(Смех)
-
2:06 - 2:07Презабавнейшие травмы.
-
2:09 - 2:12Красным обозначены места,
где аварий с велосипедистами больше. -
2:12 - 2:16Потом я нашёл больше в открытых данных
и нанёс всё на карту. -
2:16 - 2:19Я заметил несколько вещей: во-первых,
на Ист-Сайде Манхэттена -
2:19 - 2:21было больше аварий и больше травм,
-
2:21 - 2:24потому что именно там большинство
велосипедистов съезжают с мостов. -
2:24 - 2:26Но есть и другие горячие точки:
-
2:26 - 2:30Вильямсбург в Бруклине
или Рузвельт-авеню в Квинсе. -
2:30 - 2:34Я написал об этом в блоге —
-
2:34 - 2:36для меня это было скорее упражнением
по построению карт — -
2:36 - 2:40я пытался разобраться с бесплатной
программой под названием QGIS — -
2:40 - 2:42но после того поста
произошло кое-что интересное: -
2:42 - 2:44люди начали писать об этом.
-
2:44 - 2:46Об этом написали в блоге Gothamist,
-
2:46 - 2:50а в Brokelyn заявили, что это
«смертельная ловушка», — -
2:50 - 2:52не совсем то, что я написал.
-
2:52 - 2:54(Смех)
-
2:54 - 2:58Об этом писали в Streets Blog,
а потом в самом The Atlantic. -
2:58 - 3:01Это был просто мой блог на тумблере,
-
3:01 - 3:04у него не было подписчиков,
и всё это было очень интересно. -
3:04 - 3:08Прошло время, и мне стало интересно:
«Почему люди писали об этом?» -
3:08 - 3:11Я не первый, кто проанализировал аварии
с велосипедистами или нанёс их на карту. -
3:11 - 3:15Я сделал достаточно простую вещь,
почему про неё начали говорить? -
3:15 - 3:18Я подумал об этом,
написал ещё несколько постов, -
3:18 - 3:20чтобы понять, что происходит,
-
3:20 - 3:24и я понял, что была третья составляющая —
очень и очень важная, -
3:24 - 3:28та, которую вы, наверное, не ожидаете:
комедийная импровизация. -
3:28 - 3:29Да, импровизация.
-
3:29 - 3:32Я занялся ей
после летнего лагеря «Френч Вудс» — -
3:32 - 3:34привет тем, кто ещё там был, —
-
3:34 - 3:36на севере от Нью-Йорка.
-
3:36 - 3:39Я занимаюсь импровизациями c 13 лет,
никогда не переставал это делать. -
3:39 - 3:43Многое из того, что я узнал
об импровизации, я использовал в блоге, -
3:43 - 3:47чтобы сделать анализ данных
интересным для большего числа людей. -
3:47 - 3:50Я думаю, чтобы сделать науку популярной,
вам нужно рассказывать истории, -
3:50 - 3:54поэтому я расскажу, как импровизация
связана с анализом данных -
3:54 - 3:56и как вместе они сделают
истории интереснее. -
3:56 - 3:59То, что я называю историями на данных.
-
4:00 - 4:04Во-первых, в историях вам нужно
опираться на опыт людей. -
4:04 - 4:05Когда вы импровизируете,
-
4:05 - 4:09вы понимаете, что если вы
чистите зубы рядом с женой, — -
4:09 - 4:12это что-то, что люди знают по себе,
-
4:12 - 4:14как они выглядят, когда чистят зубы, —
-
4:14 - 4:15вы можете обыграть это в сценке.
-
4:15 - 4:18Люди поймут, потому что
у них есть нужный опыт. -
4:18 - 4:21Я пытался писать о том,
что знает любой житель Нью-Йорка, -
4:21 - 4:24а что любой ньюйоркец видит чаще,
чем аптеки Duane Reade? -
4:24 - 4:26(Смех)
-
4:26 - 4:27Верно?
-
4:28 - 4:30Я подумал, что это может быть интересно,
и я был прав. -
4:30 - 4:34Я нанёс на карту каждое здание Нью-Йорка
и отметил его цветом -
4:34 - 4:35ближайшей к нему аптеки.
-
4:35 - 4:39Оранжевым Duane Reade, красным CVS,
синим Walgreens, жёлтым Rite Aid. -
4:39 - 4:42Во-первых, этот район —
царство Duane Reade. -
4:42 - 4:43Вопросов нет.
-
4:43 - 4:47Я заметил, что CVS и Rite Aid
наступают с воды. -
4:47 - 4:49(Смех)
-
4:49 - 4:51Отличная стратегия, CVS,
заходите с Гудзона, -
4:51 - 4:53Duane Reade вас не заметит.
-
4:53 - 4:55(Смех)
-
4:55 - 4:58Я подумал, а вообще Duane Reade
доминирует во всём Нью-Йорке? -
4:58 - 5:00Оказалось, нет, только на Манхэттене.
-
5:00 - 5:03Если посмотреть глобальнее,
в Бронксе царствует Rite Aid. -
5:03 - 5:05Бруклин и Квинс — лоскутное одеяло.
-
5:05 - 5:09Если вы работаете на одну из этих компаний,
вам это может быть интересно. -
5:09 - 5:12Для меня это интересно
как наш повседневный опыт, -
5:12 - 5:15как мы можем превратить его в цифры
и рассказать истории. -
5:15 - 5:17Это то, с чем все мы сталкиваемся,
-
5:17 - 5:19и это часть историй,
даже в анализе данных. -
5:19 - 5:22Я заметил, что лучше выбрать одну идею.
-
5:22 - 5:23При импровизации
-
5:23 - 5:26можно попробовать объединить несколько
идей, но суть быстро потеряется. -
5:26 - 5:30Я сосредотачиваюсь на одной идее,
и я взял данные Citi Bike. -
5:30 - 5:33Интересно, что люди уезжают
и приезжают на станции, -
5:33 - 5:35есть много данных.
-
5:35 - 5:37Что, если посмотреть на одну переменную —
пол велосипедистов? -
5:37 - 5:42Здесь я отметил процент мужчин и женщин
велосипедистов в Нью-Йорке. -
5:42 - 5:46Видите, в этом районе
больше 80% велосипедистов — мужчины. -
5:46 - 5:49Это очень мужской район
по данным Citi Bike. -
5:49 - 5:50О чём это говорит нам?
-
5:50 - 5:53Возможно, о нашем транспорте.
-
5:53 - 5:56Или о гендерном вопросе в нашем городе.
-
5:56 - 5:58А ещё, если вы хотите подцепить
девушку на велосиеде Citi Bike, -
5:58 - 6:00идите в Бруклин, что важно.
-
6:00 - 6:02(Смех)
-
6:02 - 6:05Важно то, что здесь исследуется
только один аспект, только пол. -
6:05 - 6:08Здесь много признаков, ведь это большие
данные — но изучайте только один. -
6:08 - 6:10Ещё важно сохранять простоту.
-
6:10 - 6:12Не просто одна идея, а одна простая идея.
-
6:12 - 6:16Идея может быть очень сложной,
и при импровизации вы поймёте: -
6:16 - 6:20«Это встречается тут, здесь и там»,
и это быстро станет никому не интересно. -
6:20 - 6:21Так что я сохраняю простоту.
-
6:21 - 6:25Люди слышат, что я занимаюсь
расчётами, и представляют что-то такое. -
6:25 - 6:26На самом деле это, скорее, такое.
-
6:26 - 6:27(Смех)
-
6:27 - 6:29Понимаете, я просто считаю.
-
6:29 - 6:31Суммирую, иногда вычисляю доли.
-
6:31 - 6:35Это просто математика старших классов,
а не высшая математика. -
6:35 - 6:38Все люди так смогут, если остановятся
и начнут задавать вопросы. -
6:38 - 6:42Например, я посмотрел на долю
штрафов за неправильную парковку -
6:42 - 6:44машин из других штатов
в каждом районе Нью-Йорка. -
6:44 - 6:47В этом районе выше доля людей
-
6:47 - 6:50из других штатов, которые получили штраф.
-
6:50 - 6:53Это говорит о том, что люди чаще
приезжают в Мидтаун. -
6:53 - 6:55По мере того, как мы идём вглубь района,
-
6:55 - 6:57путешественников становится меньше,
что логично. -
6:57 - 7:00Я проанализировал их штаты.
Начал с Нью-Джерси. -
7:00 - 7:03Мидтаун, да — по данным видно,
-
7:03 - 7:05что люди из Нью-Джерси
приезжают в Мидтаун. -
7:05 - 7:07С Коннектикутом совсем другая история.
-
7:07 - 7:10Они приезжают с севера, как видите.
-
7:10 - 7:12Они направляются
в Ботанический сад в Бронксе. -
7:12 - 7:16И мои любимчики, калифорнийцы,
как думаете, где они зависают? -
7:16 - 7:21В самых хипстерских частях Бруклина:
Вильямсбурге, Бушвике, Гринпойнте, -
7:21 - 7:24вот где жители Калифорнии
получают штрафы. -
7:24 - 7:27Данные могут столько рассказать
о нашем городе. -
7:27 - 7:30Исследуйте вещи, которые вы хорошо знаете.
-
7:30 - 7:31У вас всех разные профессии.
-
7:31 - 7:33Вы знаете разные вещи.
-
7:33 - 7:36Вы хорошо знаете тот район,
где учитесь, где работаете. -
7:36 - 7:39Я изучаю Нью-Йорк,
я прожил здесь больше десяти лет, -
7:39 - 7:40так что я сосредоточился на нём.
-
7:40 - 7:44Ваша импровизация про адвоката,
если вы сами адвокат, -
7:44 - 7:47будет удачной, потому что
вы знаете терминологию. -
7:47 - 7:50Вы можете сыграть её на высшем уровне
и попасть в самую точку. -
7:50 - 7:54Я пытался исследовать другие города,
но это трудно: у меня нет контекста. -
7:54 - 7:58Для сегодняшнего выступления
я проанализировал Таймс-сквер. -
7:58 - 8:00«Что мы все там делали?»
Может быть, ловили такси. -
8:00 - 8:04Я заинтересовался, где люди
в районе Таймс-сквер ловят такси. -
8:04 - 8:08Это Восьмая авеню,
как видите, в целом люди -
8:08 - 8:11ловят такси здесь,
когда выезжают из района. -
8:11 - 8:14Их меньше к югу, у Седьмой авеню.
-
8:14 - 8:18Большое жёлтое пятно
внизу слева — терминал Порт-Аторити, -
8:18 - 8:19всё логично.
-
8:19 - 8:22Люди действительно отправляются
к этим улицам. -
8:22 - 8:25Что интересно, так это то,
где они ловят такси. -
8:25 - 8:27Как вы думаете,
где они выходят из такси? -
8:27 - 8:30Больше — на поперечных улицах.
Это очень похоже на решётку. -
8:30 - 8:33Если вы ловите такси,
особенно если вы турист, -
8:33 - 8:36вы называете адрес и вас туда везут.
-
8:36 - 8:39Они не высаживают вас на углу
с пожеланием всего хорошего, -
8:39 - 8:40это так не работает.
-
8:40 - 8:42Что мне в этом очень-очень нравится:
-
8:42 - 8:46в зависимости от направления движения,
люди выходят из такси по-разному. -
8:46 - 8:49Это Седьмая авеню; вы садитесь
на Сорок шестой, едете с запада на восток, -
8:49 - 8:52вы скорее всего выйдете
на её западной стороне. -
8:52 - 8:53Почему?
-
8:53 - 8:55Если такси застряло в пробке,
вы выходите из него. -
8:55 - 8:58Это видно в данных;
если вы садитесь на другой стороне, -
8:58 - 9:01видите, люди выходят
на той стороне авеню. -
9:01 - 9:05В зависимости от направления движения,
люди выходят из такси, -
9:05 - 9:07которые встали на перекрёстках.
-
9:07 - 9:08Это интересно, правда?
-
9:08 - 9:11Если вы занимаетесь рекламой,
вам может быть интересно, -
9:11 - 9:14где её разместить,
где люди выходят чаще всего. -
9:14 - 9:16Мы можем понять это
с нашими открытыми данными. -
9:16 - 9:19С ними же вы можете что-то изменить.
-
9:19 - 9:22Я попытался что-то изменить
в управлении города. -
9:22 - 9:25Каждый из вас по-своему
может что-то изменить. -
9:25 - 9:28В частности, я нашёл доказательство,
математическое доказательство, -
9:28 - 9:33что неважно, сколько раз вы ездите
на метро, пополняя билет в их автоматах, -
9:33 - 9:34вы не сведёте баланс в ноль.
-
9:34 - 9:35(Смех)
-
9:35 - 9:37И дело совсем не в вас самих.
-
9:37 - 9:41Вы в принципе не получите нулевой баланс,
используя их интерфейс. -
9:41 - 9:44Есть хитрость, вы можете
выбрать $19.05 и увидеть баланс. -
9:44 - 9:46Из управления метрополитена
мне ответили. -
9:46 - 9:48Я бы сказал, я что-то изменил.
-
9:48 - 9:51Они ответили: «Количество сдачи
в автоматах ограничено, -
9:51 - 9:55и значения предлагаются так,
чтобы сдача гарантирована была -
9:55 - 9:57для тех, кто платит наличными.
-
9:57 - 10:01Тем не менее, мы, разумеется,
включим это в процесс улучшений, -
10:01 - 10:04включающий последующее увеличение
тарифов (намечено на следующий год)». -
10:04 - 10:07(Смех)
-
10:07 - 10:09В общем, плату за проезд скоро увеличат.
-
10:09 - 10:12Представьте, что в марте,
когда вы говорите: -
10:12 - 10:15«Положу $20 на карточку метро»,
вы кладёте $20. -
10:15 - 10:18«Сколько это будет стоить?» — «$18.43» —
и вы платите. -
10:18 - 10:20А сейчас это выглядит так:
«Я плачу $20» — -
10:20 - 10:23«Мы вам положим случайное
количество денег». -
10:23 - 10:25Если бы мы могли менять
такие вещи, город стал бы лучше. -
10:25 - 10:29Посмотрим, что сделает управление
метрополитена, я бы хотел изменений. -
10:29 - 10:32Ещё я обнаружил странность:
в половине городских такси -
10:32 - 10:35чаевые рассчитываются
по тарифу с доплатой. -
10:35 - 10:38Поэтому, если вы в такси через Verifon
нажимаете кнопку «20%», -
10:38 - 10:40на самом деле вы платите 20%
от тарифа такси -
10:40 - 10:42и ещё немного сверху.
-
10:42 - 10:46Вторая половина такси работает
через Creative Mobile Technology, -
10:46 - 10:50и когда вы нажимаете кнопку «20%»,
вы их платите от всех тарифов и сборов. -
10:50 - 10:52Итак, две разные системы,
-
10:52 - 10:55вы платите больше в одной,
-
10:55 - 10:58потому что чаевые рассчитываются
от всех сборов. -
10:58 - 10:59Важно ли это?
-
10:59 - 11:03Ну, водители зарабатывают
больше $250 в год -
11:03 - 11:05на этом маленьком округлении.
-
11:05 - 11:08В половине такси мы все
платим чуть больше, -
11:08 - 11:11водители тоже, что не плохо само по себе,
но немного нечестно. -
11:11 - 11:14Когда я сообщил об этом TLC,
они ответили: -
11:14 - 11:17«Мы высоко ценим работу,
стоящую за этим анализом, -
11:17 - 11:18и мы его внимательно прочитали».
-
11:18 - 11:20(Смех)
-
11:20 - 11:21Результат.
-
11:21 - 11:23(Смех)
-
11:23 - 11:25Я работаю над ним.
-
11:25 - 11:29А это моё любимое: я отметил
на карте гидранты Нью-Йорка. -
11:29 - 11:30Это не случайные пожарные гидранты.
-
11:30 - 11:32Это гидранты вместе со штрафами,
-
11:32 - 11:35полученными при парковке рядом с ними.
-
11:35 - 11:37Вот эти 250 язв Нью-Йорка.
-
11:37 - 11:40Во-первых, будьте внимательнее
в Верхнем Ист-Сайде, -
11:40 - 11:4419-й участок оштрафует вас в любом случае.
-
11:44 - 11:48Ещё интереснее эти два гидранта
в Нижнем Ист-Сайде, -
11:48 - 11:52которые за год собирают
штрафов на $55 000. -
11:52 - 11:54Два гидранта,
и по $55 000 за 5–6 лет. -
11:54 - 11:56Но наконец данные открыты,
-
11:56 - 11:59я попытался разобраться,
что происходит, -
11:59 - 12:02и обнаружил, что на самом деле там
гидрант, потом велодорожка, -
12:02 - 12:04а потом парковочное место.
-
12:04 - 12:08Вы думаете, что вы припарковались
не на обочине у гидранта, -
12:08 - 12:09между ним и вами велосипедная дорожка.
-
12:09 - 12:13Но, хотя управление транспорта
нарисовало парковку, полиция не согласна. -
12:13 - 12:15Так что они годами
выписывают там штрафы. -
12:15 - 12:19Вот снимок из Просмотра улиц Google,
-
12:19 - 12:22здесь машина, и заметьте,
на ней штрафная квитанция. -
12:22 - 12:25Я написал об этом
и получил ответ от города: -
12:25 - 12:28«Хотя управление транспорта
не получало каких-либо жалоб, -
12:28 - 12:32мы проверим разметку и внесём
необходимые исправления». -
12:32 - 12:34Уже лучше, это уже обещание действий.
-
12:34 - 12:38Я подумал: «Окей, правительство,
они всегда пытаются». -
12:38 - 12:41А потом они внезапно изменили разметку.
-
12:41 - 12:44Да! Результат!
-
12:44 - 12:46(Аплодисменты)
-
12:46 - 12:49Кто-то прислушался, это великолепно.
-
12:49 - 12:51Вы можете посмотреть на данные
и что-то изменить. -
12:51 - 12:53Иногда ваше сообщение затеряется,
-
12:53 - 12:56но когда я сообщал о своих результатах,
-
12:56 - 12:59я знаю, что хоть что-то там,
в управлениях, изменилось, -
12:59 - 13:00что кто-то об этом думает.
-
13:00 - 13:03Я думаю, это тоже результат.
-
13:03 - 13:04Для этого, снова и снова,
-
13:04 - 13:07вам действительно нужно
думать об истории, -
13:07 - 13:10связанной с людьми и построенной
на одной простой идее о том, -
13:10 - 13:12что вы знаете лучше всего.
-
13:12 - 13:15А если вы думаете, что
вся эта статистика слишком сложная, -
13:15 - 13:19что это для гиков, —
портал открытых данных легко использовать. -
13:19 - 13:22Я учу статистике городских
планировщиков в Пратте, -
13:22 - 13:25и на второй урок один из моих учеников
пришёл с этим — -
13:25 - 13:28это список аварий
в соседних от Пратта районах, -
13:28 - 13:33анализ травм в разбивке
по типу транспортного средства. -
13:33 - 13:35Для этого хватило всего
одного или двух уроков Excel, -
13:35 - 13:38никакого чудовищного программирования.
-
13:38 - 13:39Если вам страшно,
-
13:39 - 13:43вот набор данных,
содержащий 311 жалоб на граффити. -
13:43 - 13:45Студентка курса «Время города» —
-
13:45 - 13:47в нём студенты изучают город,
-
13:47 - 13:51это полугодовой курс в старшей школе —
-
13:51 - 13:54студентка по имени Эбби
нарисовала эту карту. -
13:54 - 13:56Так что если вы боитесь компьютеров,
это не беда. -
13:56 - 13:59Понять, где находятся граффити
в Нью-Йорке, — -
13:59 - 14:02это не только для гиков,
это для любого, у кого есть данные, -
14:02 - 14:05нужно знать только то, какие вопросы
задать, чтобы рассказать свою историю. -
14:05 - 14:08Я надеюсь, каждый поймёт,
что может рассказывать истории на данных. -
14:08 - 14:09Спасибо.
-
14:09 - 14:11(Аплодисменты)
- Title:
- Пусть данные рассказывают больше | Бен Уэллингтон | TEDxBroadway
- Description:
-
Бен Уэллингтон использует данные, чтобы рассказывать истории. Используя ключевые понятия, лежащие далеко за пределами IT-технологий и анализа данных, он превращает свои наблюдения за Нью-Йорком в нечто невероятное. Никогда раньше пожарный гидрант не был таким интересным предметом.
Это выступление записано на мероприятии TEDx, организованном независимо от TED Conferences.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDxTalks
- Duration:
- 14:19
Anna Kotova approved Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova accepted Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Anna Kotova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway | ||
Tatiana Efremova edited Russian subtitles for Making data mean more through storytelling | Ben Wellington | TEDxBroadway |