1 00:00:00,984 --> 00:00:02,275 Моя задача в Твиттере — 2 00:00:02,275 --> 00:00:04,253 обеспечивать доверие пользователей, 3 00:00:04,253 --> 00:00:07,090 защищать их права и оберегать их 4 00:00:07,090 --> 00:00:08,350 как друг от друга, 5 00:00:08,350 --> 00:00:12,249 так и иногда от самих себя. 6 00:00:12,249 --> 00:00:16,524 Давайте обсудим масштаб Твиттера. 7 00:00:16,524 --> 00:00:19,394 В январе 2009 года 8 00:00:19,394 --> 00:00:22,725 в день появлялось 9 00:00:22,725 --> 00:00:24,489 более 2 миллионов твитов. 10 00:00:24,489 --> 00:00:30,397 В январе 2014 года — более 500 миллионов. 11 00:00:30,397 --> 00:00:32,889 То есть 2 миллиона твитов 12 00:00:32,889 --> 00:00:35,065 меньше, чем за 6 минут. 13 00:00:35,065 --> 00:00:42,049 Это увеличение на 24900%. 14 00:00:42,049 --> 00:00:45,302 Большая часть активности в Твиттере 15 00:00:45,302 --> 00:00:46,805 никому не угрожает. 16 00:00:46,805 --> 00:00:48,740 Нет никакого риска. 17 00:00:48,740 --> 00:00:54,493 Моя задача — предотвратить и искоренить то, что может представлять угрозу. 18 00:00:54,493 --> 00:00:56,466 Звучит довольно конкретно, так ведь? 19 00:00:56,466 --> 00:00:57,618 Может, вы даже думаете, что это просто, 20 00:00:57,618 --> 00:00:59,788 поскольку я только что сказала, что, по большей части, 21 00:00:59,788 --> 00:01:03,598 активность в Твиттере безопасна. 22 00:01:03,598 --> 00:01:05,767 Зачем тратить время 23 00:01:05,767 --> 00:01:08,510 в поисках потенциальной катастрофы 24 00:01:08,510 --> 00:01:11,410 среди безобидных твитов? 25 00:01:11,410 --> 00:01:14,350 Учитывая масштаб Твиттера, 26 00:01:14,350 --> 00:01:16,707 один шанс на миллион 27 00:01:16,707 --> 00:01:21,583 случается 500 раз в день. 28 00:01:21,583 --> 00:01:23,028 То же относится и к другим компаниям, 29 00:01:23,028 --> 00:01:24,499 работающим с таким масштабом. 30 00:01:24,499 --> 00:01:26,207 Для нас, особенные случаи, 31 00:01:26,207 --> 00:01:29,832 подобные редкие, маловероятные ситуации — 32 00:01:29,832 --> 00:01:32,454 скорее, норма. 33 00:01:32,454 --> 00:01:36,396 Допустим, 99,999% твитов 34 00:01:36,396 --> 00:01:38,284 безобидны для всех. 35 00:01:38,284 --> 00:01:39,350 Нет никакой опасности. 36 00:01:39,350 --> 00:01:42,304 Может быть, пользователи пишут о своих путешествиях, 37 00:01:42,304 --> 00:01:44,267 например, на риф в форме сердца в Австралии 38 00:01:44,267 --> 00:01:47,188 или твитят о концерте, на который они сходили, 39 00:01:47,188 --> 00:01:51,935 или постят картинки милых детёнышей животных. 40 00:01:51,935 --> 00:01:56,444 Если вычесть эти 99,999%, 41 00:01:56,444 --> 00:01:59,973 то оставшаяся доля процента эквивалентна, 42 00:01:59,973 --> 00:02:02,362 грубо говоря, 43 00:02:02,362 --> 00:02:05,837 150 000 твитов в месяц. 44 00:02:05,837 --> 00:02:08,293 Сам масштаб нашей работы 45 00:02:08,293 --> 00:02:10,605 является испытанием. 46 00:02:10,605 --> 00:02:11,783 Знаете, почему ещё моя работа 47 00:02:11,783 --> 00:02:14,890 особенно сложная? 48 00:02:14,890 --> 00:02:20,013 Люди ведут себя странно. 49 00:02:20,013 --> 00:02:21,842 (Смех) 50 00:02:21,842 --> 00:02:24,233 И мне приходится разбираться в том, что они делают, 51 00:02:24,233 --> 00:02:26,482 зачем, и несёт ли это риск, 52 00:02:26,482 --> 00:02:28,650 при этом часто вне контекста 53 00:02:28,650 --> 00:02:30,497 либо без дополнительных сведений. 54 00:02:30,497 --> 00:02:32,574 Я покажу вам несколько примеров того, 55 00:02:32,574 --> 00:02:34,579 с чем мне пришлось столкнуться за время работы в Твиттере. 56 00:02:34,579 --> 00:02:36,199 Это взятые из реальной жизни 57 00:02:36,199 --> 00:02:38,852 ситуации, которые поначалу казались стандартными, 58 00:02:38,852 --> 00:02:40,495 однако, на самом деле, 59 00:02:40,495 --> 00:02:42,045 имели совсем другую подоплёку. 60 00:02:42,045 --> 00:02:44,022 Детали изменены, 61 00:02:44,022 --> 00:02:45,279 чтобы защитить невиновных 62 00:02:45,279 --> 00:02:48,512 а в некоторых случаях тех, кто виноват. 63 00:02:48,512 --> 00:02:51,517 Начнём с простого. 64 00:02:51,517 --> 00:02:53,310 [«Эй, сучка»] 65 00:02:53,310 --> 00:02:56,538 Если увидеть такой твит, 66 00:02:56,538 --> 00:02:58,232 то можно подумать: 67 00:02:58,232 --> 00:02:59,885 «Похоже на оскорбление». 68 00:02:59,885 --> 00:03:02,992 С какой стати вам захочется получать сообщение 69 00:03:02,992 --> 00:03:05,210 «Эй, сучка»? 70 00:03:05,210 --> 00:03:09,873 Я, конечно, пытаюсь быть в курсе 71 00:03:09,873 --> 00:03:12,385 последних тенденций и мемов, 72 00:03:12,385 --> 00:03:15,089 поэтому знаю, что «Эй, сучка» — 73 00:03:15,089 --> 00:03:18,243 это часто используемое приветствие между друзьями, 74 00:03:18,243 --> 00:03:22,505 а также известная фраза из сериала «Во все тяжкие». 75 00:03:22,505 --> 00:03:24,992 Признаюсь, я не ожидала 76 00:03:24,992 --> 00:03:27,833 найти ещё одно значение. 77 00:03:27,833 --> 00:03:30,937 Оказывается, эту фразу также используют в Твиттере 78 00:03:30,937 --> 00:03:33,999 люди, изображающие собак в ролевых играх. 79 00:03:33,999 --> 00:03:39,278 (Смех) 80 00:03:39,278 --> 00:03:40,944 В этом случае 81 00:03:40,944 --> 00:03:42,553 это не только не оскорбление, 82 00:03:42,553 --> 00:03:45,692 но и, фактически, предельно чёткое приветствие. 83 00:03:45,692 --> 00:03:48,581 (Смех) 84 00:03:48,581 --> 00:03:50,652 Из этого примера понятно, что определить 85 00:03:50,652 --> 00:03:52,500 наличие в твите оскорбления вне контекста 86 00:03:52,500 --> 00:03:54,092 действительно сложно. 87 00:03:54,092 --> 00:03:56,809 Давайте рассмотрим пример спама. 88 00:03:56,809 --> 00:03:58,769 Вот образец аккаунта, 89 00:03:58,769 --> 00:04:00,437 представляющего классическое поведение спамера: 90 00:04:00,437 --> 00:04:01,996 он рассылает одно и то же сообщение 91 00:04:01,996 --> 00:04:03,800 тысячам людей. 92 00:04:03,800 --> 00:04:06,593 Это модель, которую я создала в своём аккаунте, 93 00:04:06,593 --> 00:04:09,594 но на деле мы видим такие примеры регулярно. 94 00:04:09,594 --> 00:04:11,573 Казалось бы, понятно, что с этим делать: 95 00:04:11,573 --> 00:04:13,626 нужно просто автоматически приостанавливать действие аккаунтов, 96 00:04:13,626 --> 00:04:16,933 демонстрирующих такое поведение. 97 00:04:16,933 --> 00:04:20,143 Однако из этого правила есть исключения. 98 00:04:20,143 --> 00:04:23,026 Оказывается, это сообщение может также быть уведомлением 99 00:04:23,026 --> 00:04:26,915 о пролетающей над вами Международной космической станции, 100 00:04:26,915 --> 00:04:28,761 на которое вы подписались, потому что хотели 101 00:04:28,761 --> 00:04:30,709 выйти из дома и попробовать её разглядеть. 102 00:04:30,709 --> 00:04:31,934 Если мы по ошибке 103 00:04:31,934 --> 00:04:33,781 приостановим данный аккаунт, приняв его за спам, 104 00:04:33,781 --> 00:04:36,047 у вас не будет такой возможности. 105 00:04:36,047 --> 00:04:39,573 Давайте рассмотрим ещё более показательные примеры. 106 00:04:39,573 --> 00:04:41,489 Снова посмотрим через мой аккаунт 107 00:04:41,489 --> 00:04:44,994 на образец типичного поведения. 108 00:04:44,994 --> 00:04:47,637 Теперь он рассылает одно и то же сообщение и ссылку. 109 00:04:47,637 --> 00:04:50,411 Часто это показатель так называемого «фишинга», 110 00:04:50,411 --> 00:04:53,589 когда пытаются завладеть информацией с аккаунта другого человека, 111 00:04:53,589 --> 00:04:55,792 направив его на другой вебсайт. 112 00:04:55,792 --> 00:04:59,986 Разумеется, в этом нет ничего хорошего. 113 00:04:59,986 --> 00:05:01,916 Мы стремимся приостанавливать аккаунты, 114 00:05:01,916 --> 00:05:04,540 показывающие такое поведение, и делаем это. 115 00:05:04,540 --> 00:05:07,787 Так почему же в этом примере высока вероятность ошибки? 116 00:05:07,787 --> 00:05:10,786 Например, это может быть очевидец на митинге, 117 00:05:10,786 --> 00:05:12,696 который записал на видео, 118 00:05:12,696 --> 00:05:15,966 как офицер полиции применяет силу к мирно протестующему гражданину, 119 00:05:15,966 --> 00:05:18,941 и пытается сообщить миру о происходящем. 120 00:05:18,941 --> 00:05:20,584 Мы бы не хотели рисковать 121 00:05:20,584 --> 00:05:23,101 и заглушать такие важные сообщения, 122 00:05:23,101 --> 00:05:26,030 приняв их за спам и приостановив действие аккаунта. 123 00:05:26,030 --> 00:05:28,909 Поэтому мы анализируем сотни разных параметров, 124 00:05:28,909 --> 00:05:30,597 изучая поведение аккаунтов, 125 00:05:30,597 --> 00:05:32,613 и всё равно можем ошибиться, 126 00:05:32,613 --> 00:05:34,849 и придётся проводить оценку заново. 127 00:05:34,849 --> 00:05:38,557 Учитывая все трудности, с какими мне приходится сталкиваться, 128 00:05:38,557 --> 00:05:41,253 мне важно не только предупредить опасность, 129 00:05:41,253 --> 00:05:45,037 но и разработать защиту от неожиданностей. 130 00:05:45,037 --> 00:05:47,379 Это важно не только для меня 131 00:05:47,379 --> 00:05:49,466 или для Твиттера — это важно для вас. 132 00:05:49,466 --> 00:05:51,872 Это важно для любого, кто создаёт нечто, 133 00:05:51,872 --> 00:05:53,797 как вам кажется, невероятное 134 00:05:53,797 --> 00:05:56,586 и позволяющее людям делать замечательные вещи. 135 00:05:56,586 --> 00:05:59,452 Что же мне делать? 136 00:05:59,452 --> 00:06:02,770 Я задумываюсь: 137 00:06:02,770 --> 00:06:04,865 как же может произойти 138 00:06:04,865 --> 00:06:08,658 ужасная ошибка? 139 00:06:08,658 --> 00:06:13,111 Я представляю себе катастрофу. 140 00:06:13,111 --> 00:06:15,574 Это сложно. 141 00:06:15,574 --> 00:06:18,422 Возникает неотъемлемый когнитивный диссонанс, 142 00:06:18,422 --> 00:06:20,234 как когда приходится 143 00:06:20,234 --> 00:06:22,880 одновременно сочинять свадебные клятвы и брачный договор. 144 00:06:22,880 --> 00:06:24,576 (Смех) 145 00:06:24,576 --> 00:06:26,949 Но всё равно приходится это делать, 146 00:06:26,949 --> 00:06:31,395 особенно если связываешь себя с 500 миллионами твитов в день. 147 00:06:31,395 --> 00:06:34,492 Что я имею в виду под «представляю себе катастрофу»? 148 00:06:34,492 --> 00:06:37,254 Я пытаюсь представить, как что-то 149 00:06:37,254 --> 00:06:40,482 милое и безвредное, например, изображение кошки, 150 00:06:40,482 --> 00:06:41,586 может привести к смертельному случаю, 151 00:06:41,586 --> 00:06:43,912 и думаю, как это предотвратить. 152 00:06:43,912 --> 00:06:46,295 Покажу это на следующем примере. 153 00:06:46,295 --> 00:06:49,405 Это моя кошка Эли. 154 00:06:49,405 --> 00:06:51,386 Мы хотели дать пользователям возможность 155 00:06:51,386 --> 00:06:53,459 добавлять картинки к твитам. 156 00:06:53,459 --> 00:06:55,056 Картинка может выразить тысячу слов, 157 00:06:55,056 --> 00:06:57,065 а у вас в распоряжении всего лишь 140 знаков. 158 00:06:57,065 --> 00:06:58,265 Стоит добавить фото к твиту — 159 00:06:58,265 --> 00:07:01,303 и он становится значительно богаче по содержанию. 160 00:07:01,303 --> 00:07:02,980 Добавление фото к твиту 161 00:07:02,980 --> 00:07:04,987 даёт много возможностей. 162 00:07:04,987 --> 00:07:07,267 Однако моя задача — думать не об этом, 163 00:07:07,267 --> 00:07:10,014 а о том, что может пойти не так. 164 00:07:10,014 --> 00:07:11,906 Как эта картинка может 165 00:07:11,906 --> 00:07:15,445 стать причиной моей смерти? 166 00:07:15,445 --> 00:07:18,605 Вот, например, один способ. 167 00:07:18,605 --> 00:07:21,691 Это не просто изображение кошки. 168 00:07:21,691 --> 00:07:23,783 Это ещё и данные о местоположении. 169 00:07:23,783 --> 00:07:25,995 Когда вы снимаете что-то на смартфон 170 00:07:25,995 --> 00:07:27,294 или на цифровую камеру, 171 00:07:27,294 --> 00:07:28,948 в полученном изображении сохраняется 172 00:07:28,948 --> 00:07:30,564 много дополнительной информации. 173 00:07:30,564 --> 00:07:32,496 В действительности, эта картинка также содержит 174 00:07:32,496 --> 00:07:34,301 эквивалент вот этого, 175 00:07:34,301 --> 00:07:37,380 а, если быть точнее, вот этого. 176 00:07:37,380 --> 00:07:39,336 Конечно, маловероятно, что кто-то попытается 177 00:07:39,336 --> 00:07:41,621 отследить меня и сделать что-то со мной, 178 00:07:41,621 --> 00:07:43,405 основываясь на данных, 179 00:07:43,405 --> 00:07:45,353 связанных с фотографией моей кошки, 180 00:07:45,353 --> 00:07:49,004 но я начинаю думать о худшем варианте развития событий. 181 00:07:49,004 --> 00:07:51,342 Поэтому, когда мы запустили фотосервис в Твиттере, 182 00:07:51,342 --> 00:07:55,163 мы решили отказаться от отображения данных о местоположении. 183 00:07:55,163 --> 00:08:01,010 (Аплодисменты) 184 00:08:01,010 --> 00:08:03,623 Если я буду думать о худшем варианте 185 00:08:03,623 --> 00:08:04,570 и отталкиваться от него, 186 00:08:04,570 --> 00:08:07,123 я могу быть уверенной, что защита, которую мы разрабатываем, 187 00:08:07,123 --> 00:08:08,891 подойдёт как для типичных, 188 00:08:08,891 --> 00:08:10,969 так и для нетипичных случаев. 189 00:08:10,969 --> 00:08:13,914 Учитывая, что я день и ночь только и делаю, 190 00:08:13,914 --> 00:08:16,455 что воображаю себе худший из возможных исходов, 191 00:08:16,455 --> 00:08:20,712 никого бы не удивило, если бы у меня был мрачный взгляд на мир. 192 00:08:20,712 --> 00:08:22,495 (Смех) 193 00:08:22,495 --> 00:08:23,912 Это не так. 194 00:08:23,912 --> 00:08:27,788 Большая часть того, что я вижу, — 195 00:08:27,788 --> 00:08:31,689 а я вижу много, уж поверьте, — это позитивное общение, 196 00:08:31,689 --> 00:08:33,613 когда люди помогают друг другу, 197 00:08:33,613 --> 00:08:37,061 или хотят стать ближе друг другу, или поделиться информацией. 198 00:08:37,061 --> 00:08:40,384 Дело в том, что работая с масштабом, 199 00:08:40,384 --> 00:08:44,184 когда необходимо заботиться о безопасности пользователей, 200 00:08:44,184 --> 00:08:46,730 нам приходится думать о худшем варианте, 201 00:08:46,730 --> 00:08:50,957 потому что в нашем случае шанс один на миллион — 202 00:08:50,957 --> 00:08:53,706 это довольно высокий шанс. 203 00:08:53,706 --> 00:08:55,570 Спасибо. 204 00:08:55,570 --> 00:08:59,570 (Аплодисменты)