WEBVTT 00:00:00.984 --> 00:00:02.275 Моя задача в Твиттере — 00:00:02.275 --> 00:00:04.253 обеспечивать доверие пользователей, 00:00:04.253 --> 00:00:07.090 защищать их права и оберегать их 00:00:07.090 --> 00:00:08.350 как друг от друга, 00:00:08.350 --> 00:00:12.249 так и иногда от самих себя. 00:00:12.249 --> 00:00:16.524 Давайте обсудим масштаб Твиттера. 00:00:16.524 --> 00:00:19.394 В январе 2009 года 00:00:19.394 --> 00:00:22.725 в день появлялось 00:00:22.725 --> 00:00:24.489 более 2 миллионов твитов. 00:00:24.489 --> 00:00:30.397 В январе 2014 года — более 500 миллионов. 00:00:30.397 --> 00:00:32.889 То есть 2 миллиона твитов 00:00:32.889 --> 00:00:35.065 меньше, чем за 6 минут. 00:00:35.065 --> 00:00:42.049 Это увеличение на 24900%. NOTE Paragraph 00:00:42.049 --> 00:00:45.302 Большая часть активности в Твиттере 00:00:45.302 --> 00:00:46.805 никому не угрожает. 00:00:46.805 --> 00:00:48.740 Нет никакого риска. 00:00:48.740 --> 00:00:54.493 Моя задача — предотвратить и искоренить то, что может представлять угрозу. 00:00:54.493 --> 00:00:56.466 Звучит довольно конкретно, так ведь? 00:00:56.466 --> 00:00:57.618 Может, вы даже думаете, что это просто, 00:00:57.618 --> 00:00:59.788 поскольку я только что сказала, что, по большей части, 00:00:59.788 --> 00:01:03.598 активность в Твиттере безопасна. 00:01:03.598 --> 00:01:05.767 Зачем тратить время 00:01:05.767 --> 00:01:08.510 в поисках потенциальной катастрофы 00:01:08.510 --> 00:01:11.410 среди безобидных твитов? 00:01:11.410 --> 00:01:14.350 Учитывая масштаб Твиттера, 00:01:14.350 --> 00:01:16.707 один шанс на миллион 00:01:16.707 --> 00:01:21.583 случается 500 раз в день. 00:01:21.583 --> 00:01:23.028 То же относится и к другим компаниям, 00:01:23.028 --> 00:01:24.499 работающим с таким масштабом. 00:01:24.499 --> 00:01:26.207 Для нас, особенные случаи, 00:01:26.207 --> 00:01:29.832 подобные редкие, маловероятные ситуации — 00:01:29.832 --> 00:01:32.454 скорее, норма. 00:01:32.454 --> 00:01:36.396 Допустим, 99,999% твитов 00:01:36.396 --> 00:01:38.284 безобидны для всех. 00:01:38.284 --> 00:01:39.350 Нет никакой опасности. 00:01:39.350 --> 00:01:42.304 Может быть, пользователи пишут о своих путешествиях, 00:01:42.304 --> 00:01:44.267 например, на риф в форме сердца в Австралии 00:01:44.267 --> 00:01:47.188 или твитят о концерте, на который они сходили, 00:01:47.188 --> 00:01:51.935 или постят картинки милых детёнышей животных. 00:01:51.935 --> 00:01:56.444 Если вычесть эти 99,999%, 00:01:56.444 --> 00:01:59.973 то оставшаяся доля процента эквивалентна, 00:01:59.973 --> 00:02:02.362 грубо говоря, 00:02:02.362 --> 00:02:05.837 150 000 твитов в месяц. 00:02:05.837 --> 00:02:08.293 Сам масштаб нашей работы 00:02:08.293 --> 00:02:10.605 является испытанием. NOTE Paragraph 00:02:10.605 --> 00:02:11.783 Знаете, почему ещё моя работа 00:02:11.783 --> 00:02:14.890 особенно сложная? 00:02:14.890 --> 00:02:20.013 Люди ведут себя странно. 00:02:20.013 --> 00:02:21.842 (Смех) 00:02:21.842 --> 00:02:24.233 И мне приходится разбираться в том, что они делают, 00:02:24.233 --> 00:02:26.482 зачем, и несёт ли это риск, 00:02:26.482 --> 00:02:28.650 при этом часто вне контекста 00:02:28.650 --> 00:02:30.497 либо без дополнительных сведений. 00:02:30.497 --> 00:02:32.574 Я покажу вам несколько примеров того, 00:02:32.574 --> 00:02:34.579 с чем мне пришлось столкнуться за время работы в Твиттере. 00:02:34.579 --> 00:02:36.199 Это взятые из реальной жизни 00:02:36.199 --> 00:02:38.852 ситуации, которые поначалу казались стандартными, 00:02:38.852 --> 00:02:40.495 однако, на самом деле, 00:02:40.495 --> 00:02:42.045 имели совсем другую подоплёку. 00:02:42.045 --> 00:02:44.022 Детали изменены, 00:02:44.022 --> 00:02:45.279 чтобы защитить невиновных 00:02:45.279 --> 00:02:48.512 а в некоторых случаях тех, кто виноват. 00:02:48.512 --> 00:02:51.517 Начнём с простого. NOTE Paragraph 00:02:51.517 --> 00:02:53.310 [«Эй, сучка»] NOTE Paragraph 00:02:53.310 --> 00:02:56.538 Если увидеть такой твит, 00:02:56.538 --> 00:02:58.232 то можно подумать: 00:02:58.232 --> 00:02:59.885 «Похоже на оскорбление». 00:02:59.885 --> 00:03:02.992 С какой стати вам захочется получать сообщение 00:03:02.992 --> 00:03:05.210 «Эй, сучка»? 00:03:05.210 --> 00:03:09.873 Я, конечно, пытаюсь быть в курсе 00:03:09.873 --> 00:03:12.385 последних тенденций и мемов, 00:03:12.385 --> 00:03:15.089 поэтому знаю, что «Эй, сучка» — 00:03:15.089 --> 00:03:18.243 это часто используемое приветствие между друзьями, 00:03:18.243 --> 00:03:22.505 а также известная фраза из сериала «Во все тяжкие». 00:03:22.505 --> 00:03:24.992 Признаюсь, я не ожидала 00:03:24.992 --> 00:03:27.833 найти ещё одно значение. 00:03:27.833 --> 00:03:30.937 Оказывается, эту фразу также используют в Твиттере 00:03:30.937 --> 00:03:33.999 люди, изображающие собак в ролевых играх. 00:03:33.999 --> 00:03:39.278 (Смех) 00:03:39.278 --> 00:03:40.944 В этом случае 00:03:40.944 --> 00:03:42.553 это не только не оскорбление, 00:03:42.553 --> 00:03:45.692 но и, фактически, предельно чёткое приветствие. 00:03:45.692 --> 00:03:48.581 (Смех) NOTE Paragraph 00:03:48.581 --> 00:03:50.652 Из этого примера понятно, что определить 00:03:50.652 --> 00:03:52.500 наличие в твите оскорбления вне контекста 00:03:52.500 --> 00:03:54.092 действительно сложно. NOTE Paragraph 00:03:54.092 --> 00:03:56.809 Давайте рассмотрим пример спама. 00:03:56.809 --> 00:03:58.769 Вот образец аккаунта, 00:03:58.769 --> 00:04:00.437 представляющего классическое поведение спамера: 00:04:00.437 --> 00:04:01.996 он рассылает одно и то же сообщение 00:04:01.996 --> 00:04:03.800 тысячам людей. 00:04:03.800 --> 00:04:06.593 Это модель, которую я создала в своём аккаунте, 00:04:06.593 --> 00:04:09.594 но на деле мы видим такие примеры регулярно. 00:04:09.594 --> 00:04:11.573 Казалось бы, понятно, что с этим делать: 00:04:11.573 --> 00:04:13.626 нужно просто автоматически приостанавливать действие аккаунтов, 00:04:13.626 --> 00:04:16.933 демонстрирующих такое поведение. 00:04:16.933 --> 00:04:20.143 Однако из этого правила есть исключения. 00:04:20.143 --> 00:04:23.026 Оказывается, это сообщение может также быть уведомлением 00:04:23.026 --> 00:04:26.915 о пролетающей над вами Международной космической станции, 00:04:26.915 --> 00:04:28.761 на которое вы подписались, потому что хотели 00:04:28.761 --> 00:04:30.709 выйти из дома и попробовать её разглядеть. 00:04:30.709 --> 00:04:31.934 Если мы по ошибке 00:04:31.934 --> 00:04:33.781 приостановим данный аккаунт, приняв его за спам, 00:04:33.781 --> 00:04:36.047 у вас не будет такой возможности. NOTE Paragraph 00:04:36.047 --> 00:04:39.573 Давайте рассмотрим ещё более показательные примеры. 00:04:39.573 --> 00:04:41.489 Снова посмотрим через мой аккаунт 00:04:41.489 --> 00:04:44.994 на образец типичного поведения. 00:04:44.994 --> 00:04:47.637 Теперь он рассылает одно и то же сообщение и ссылку. 00:04:47.637 --> 00:04:50.411 Часто это показатель так называемого «фишинга», 00:04:50.411 --> 00:04:53.589 когда пытаются завладеть информацией с аккаунта другого человека, 00:04:53.589 --> 00:04:55.792 направив его на другой вебсайт. 00:04:55.792 --> 00:04:59.986 Разумеется, в этом нет ничего хорошего. 00:04:59.986 --> 00:05:01.916 Мы стремимся приостанавливать аккаунты, 00:05:01.916 --> 00:05:04.540 показывающие такое поведение, и делаем это. 00:05:04.540 --> 00:05:07.787 Так почему же в этом примере высока вероятность ошибки? 00:05:07.787 --> 00:05:10.786 Например, это может быть очевидец на митинге, 00:05:10.786 --> 00:05:12.696 который записал на видео, 00:05:12.696 --> 00:05:15.966 как офицер полиции применяет силу к мирно протестующему гражданину, 00:05:15.966 --> 00:05:18.941 и пытается сообщить миру о происходящем. 00:05:18.941 --> 00:05:20.584 Мы бы не хотели рисковать 00:05:20.584 --> 00:05:23.101 и заглушать такие важные сообщения, 00:05:23.101 --> 00:05:26.030 приняв их за спам и приостановив действие аккаунта. 00:05:26.030 --> 00:05:28.909 Поэтому мы анализируем сотни разных параметров, 00:05:28.909 --> 00:05:30.597 изучая поведение аккаунтов, 00:05:30.597 --> 00:05:32.613 и всё равно можем ошибиться, 00:05:32.613 --> 00:05:34.849 и придётся проводить оценку заново. NOTE Paragraph 00:05:34.849 --> 00:05:38.557 Учитывая все трудности, с какими мне приходится сталкиваться, 00:05:38.557 --> 00:05:41.253 мне важно не только предупредить опасность, 00:05:41.253 --> 00:05:45.037 но и разработать защиту от неожиданностей. 00:05:45.037 --> 00:05:47.379 Это важно не только для меня 00:05:47.379 --> 00:05:49.466 или для Твиттера — это важно для вас. 00:05:49.466 --> 00:05:51.872 Это важно для любого, кто создаёт нечто, 00:05:51.872 --> 00:05:53.797 как вам кажется, невероятное 00:05:53.797 --> 00:05:56.586 и позволяющее людям делать замечательные вещи. 00:05:56.586 --> 00:05:59.452 Что же мне делать? 00:05:59.452 --> 00:06:02.770 Я задумываюсь: 00:06:02.770 --> 00:06:04.865 как же может произойти 00:06:04.865 --> 00:06:08.658 ужасная ошибка? 00:06:08.658 --> 00:06:13.111 Я представляю себе катастрофу. 00:06:13.111 --> 00:06:15.574 Это сложно. 00:06:15.574 --> 00:06:18.422 Возникает неотъемлемый когнитивный диссонанс, 00:06:18.422 --> 00:06:20.234 как когда приходится 00:06:20.234 --> 00:06:22.880 одновременно сочинять свадебные клятвы и брачный договор. 00:06:22.880 --> 00:06:24.576 (Смех) 00:06:24.576 --> 00:06:26.949 Но всё равно приходится это делать, 00:06:26.949 --> 00:06:31.395 особенно если связываешь себя с 500 миллионами твитов в день. 00:06:31.395 --> 00:06:34.492 Что я имею в виду под «представляю себе катастрофу»? 00:06:34.492 --> 00:06:37.254 Я пытаюсь представить, как что-то 00:06:37.254 --> 00:06:40.482 милое и безвредное, например, изображение кошки, 00:06:40.482 --> 00:06:41.586 может привести к смертельному случаю, 00:06:41.586 --> 00:06:43.912 и думаю, как это предотвратить. 00:06:43.912 --> 00:06:46.295 Покажу это на следующем примере. 00:06:46.295 --> 00:06:49.405 Это моя кошка Эли. 00:06:49.405 --> 00:06:51.386 Мы хотели дать пользователям возможность 00:06:51.386 --> 00:06:53.459 добавлять картинки к твитам. 00:06:53.459 --> 00:06:55.056 Картинка может выразить тысячу слов, 00:06:55.056 --> 00:06:57.065 а у вас в распоряжении всего лишь 140 знаков. 00:06:57.065 --> 00:06:58.265 Стоит добавить фото к твиту — 00:06:58.265 --> 00:07:01.303 и он становится значительно богаче по содержанию. 00:07:01.303 --> 00:07:02.980 Добавление фото к твиту 00:07:02.980 --> 00:07:04.987 даёт много возможностей. 00:07:04.987 --> 00:07:07.267 Однако моя задача — думать не об этом, 00:07:07.267 --> 00:07:10.014 а о том, что может пойти не так. NOTE Paragraph 00:07:10.014 --> 00:07:11.906 Как эта картинка может 00:07:11.906 --> 00:07:15.445 стать причиной моей смерти? 00:07:15.445 --> 00:07:18.605 Вот, например, один способ. 00:07:18.605 --> 00:07:21.691 Это не просто изображение кошки. 00:07:21.691 --> 00:07:23.783 Это ещё и данные о местоположении. 00:07:23.783 --> 00:07:25.995 Когда вы снимаете что-то на смартфон 00:07:25.995 --> 00:07:27.294 или на цифровую камеру, 00:07:27.294 --> 00:07:28.948 в полученном изображении сохраняется 00:07:28.948 --> 00:07:30.564 много дополнительной информации. 00:07:30.564 --> 00:07:32.496 В действительности, эта картинка также содержит 00:07:32.496 --> 00:07:34.301 эквивалент вот этого, 00:07:34.301 --> 00:07:37.380 а, если быть точнее, вот этого. 00:07:37.380 --> 00:07:39.336 Конечно, маловероятно, что кто-то попытается 00:07:39.336 --> 00:07:41.621 отследить меня и сделать что-то со мной, 00:07:41.621 --> 00:07:43.405 основываясь на данных, 00:07:43.405 --> 00:07:45.353 связанных с фотографией моей кошки, 00:07:45.353 --> 00:07:49.004 но я начинаю думать о худшем варианте развития событий. 00:07:49.004 --> 00:07:51.342 Поэтому, когда мы запустили фотосервис в Твиттере, 00:07:51.342 --> 00:07:55.163 мы решили отказаться от отображения данных о местоположении. 00:07:55.163 --> 00:08:01.010 (Аплодисменты) 00:08:01.010 --> 00:08:03.623 Если я буду думать о худшем варианте 00:08:03.623 --> 00:08:04.570 и отталкиваться от него, 00:08:04.570 --> 00:08:07.123 я могу быть уверенной, что защита, которую мы разрабатываем, 00:08:07.123 --> 00:08:08.891 подойдёт как для типичных, 00:08:08.891 --> 00:08:10.969 так и для нетипичных случаев. NOTE Paragraph 00:08:10.969 --> 00:08:13.914 Учитывая, что я день и ночь только и делаю, 00:08:13.914 --> 00:08:16.455 что воображаю себе худший из возможных исходов, 00:08:16.455 --> 00:08:20.712 никого бы не удивило, если бы у меня был мрачный взгляд на мир. 00:08:20.712 --> 00:08:22.495 (Смех) 00:08:22.495 --> 00:08:23.912 Это не так. 00:08:23.912 --> 00:08:27.788 Большая часть того, что я вижу, — 00:08:27.788 --> 00:08:31.689 а я вижу много, уж поверьте, — это позитивное общение, 00:08:31.689 --> 00:08:33.613 когда люди помогают друг другу, 00:08:33.613 --> 00:08:37.061 или хотят стать ближе друг другу, или поделиться информацией. 00:08:37.061 --> 00:08:40.384 Дело в том, что работая с масштабом, 00:08:40.384 --> 00:08:44.184 когда необходимо заботиться о безопасности пользователей, 00:08:44.184 --> 00:08:46.730 нам приходится думать о худшем варианте, 00:08:46.730 --> 00:08:50.957 потому что в нашем случае шанс один на миллион — 00:08:50.957 --> 00:08:53.706 это довольно высокий шанс. NOTE Paragraph 00:08:53.706 --> 00:08:55.570 Спасибо. NOTE Paragraph 00:08:55.570 --> 00:08:59.570 (Аплодисменты)