1
00:00:00,984 --> 00:00:02,275
Моя задача в Твиттере —

2
00:00:02,275 --> 00:00:04,253
обеспечивать доверие пользователей,

3
00:00:04,253 --> 00:00:07,090
защищать их права и оберегать их

4
00:00:07,090 --> 00:00:08,350
как друг от друга,

5
00:00:08,350 --> 00:00:12,249
так и иногда от самих себя.

6
00:00:12,249 --> 00:00:16,524
Давайте обсудим масштаб Твиттера.

7
00:00:16,524 --> 00:00:19,394
В январе 2009 года

8
00:00:19,394 --> 00:00:22,725
в день появлялось

9
00:00:22,725 --> 00:00:24,489
более 2 миллионов твитов.

10
00:00:24,489 --> 00:00:30,397
В январе 2014 года —
более 500 миллионов.

11
00:00:30,397 --> 00:00:32,889
То есть 2 миллиона твитов

12
00:00:32,889 --> 00:00:35,065
меньше, чем за 6 минут.

13
00:00:35,065 --> 00:00:42,049
Это увеличение на 24900%.

14
00:00:42,049 --> 00:00:45,302
Большая часть активности в Твиттере

15
00:00:45,302 --> 00:00:46,805
никому не угрожает.

16
00:00:46,805 --> 00:00:48,740
Нет никакого риска.

17
00:00:48,740 --> 00:00:54,493
Моя задача — предотвратить и искоренить
то, что может представлять угрозу.

18
00:00:54,493 --> 00:00:56,466
Звучит довольно конкретно, так ведь?

19
00:00:56,466 --> 00:00:57,618
Может, вы даже думаете,
что это просто,

20
00:00:57,618 --> 00:00:59,788
поскольку я только что сказала,
что, по большей части,

21
00:00:59,788 --> 00:01:03,598
активность в Твиттере безопасна.

22
00:01:03,598 --> 00:01:05,767
Зачем тратить время

23
00:01:05,767 --> 00:01:08,510
в поисках потенциальной катастрофы

24
00:01:08,510 --> 00:01:11,410
среди безобидных твитов?

25
00:01:11,410 --> 00:01:14,350
Учитывая масштаб Твиттера,

26
00:01:14,350 --> 00:01:16,707
один шанс на миллион

27
00:01:16,707 --> 00:01:21,583
случается 500 раз в день.

28
00:01:21,583 --> 00:01:23,028
То же относится и к другим компаниям,

29
00:01:23,028 --> 00:01:24,499
работающим с таким масштабом.

30
00:01:24,499 --> 00:01:26,207
Для нас, особенные случаи,

31
00:01:26,207 --> 00:01:29,832
подобные редкие,
маловероятные ситуации —

32
00:01:29,832 --> 00:01:32,454
скорее, норма.

33
00:01:32,454 --> 00:01:36,396
Допустим, 99,999% твитов

34
00:01:36,396 --> 00:01:38,284
безобидны для всех.

35
00:01:38,284 --> 00:01:39,350
Нет никакой опасности.

36
00:01:39,350 --> 00:01:42,304
Может быть, пользователи пишут
о своих путешествиях,

37
00:01:42,304 --> 00:01:44,267
например, на риф
в форме сердца в Австралии

38
00:01:44,267 --> 00:01:47,188
или твитят о концерте,
на который они сходили,

39
00:01:47,188 --> 00:01:51,935
или постят картинки
милых детёнышей животных.

40
00:01:51,935 --> 00:01:56,444
Если вычесть эти 99,999%,

41
00:01:56,444 --> 00:01:59,973
то оставшаяся доля процента
эквивалентна,

42
00:01:59,973 --> 00:02:02,362
грубо говоря,

43
00:02:02,362 --> 00:02:05,837
150 000 твитов в месяц.

44
00:02:05,837 --> 00:02:08,293
Сам масштаб нашей работы

45
00:02:08,293 --> 00:02:10,605
является испытанием.

46
00:02:10,605 --> 00:02:11,783
Знаете, почему ещё моя работа

47
00:02:11,783 --> 00:02:14,890
особенно сложная?

48
00:02:14,890 --> 00:02:20,013
Люди ведут себя странно.

49
00:02:20,013 --> 00:02:21,842
(Смех)

50
00:02:21,842 --> 00:02:24,233
И мне приходится
разбираться в том, что они делают,

51
00:02:24,233 --> 00:02:26,482
зачем, и несёт ли это риск,

52
00:02:26,482 --> 00:02:28,650
при этом часто вне контекста

53
00:02:28,650 --> 00:02:30,497
либо без дополнительных сведений.

54
00:02:30,497 --> 00:02:32,574
Я покажу вам
несколько примеров того,

55
00:02:32,574 --> 00:02:34,579
с чем мне пришлось столкнуться
за время работы в Твиттере.

56
00:02:34,579 --> 00:02:36,199
Это взятые из реальной жизни

57
00:02:36,199 --> 00:02:38,852
ситуации, которые поначалу
казались стандартными,

58
00:02:38,852 --> 00:02:40,495
однако, на самом деле,

59
00:02:40,495 --> 00:02:42,045
имели совсем другую подоплёку.

60
00:02:42,045 --> 00:02:44,022
Детали изменены,

61
00:02:44,022 --> 00:02:45,279
чтобы защитить невиновных

62
00:02:45,279 --> 00:02:48,512
а в некоторых случаях тех,
кто виноват.

63
00:02:48,512 --> 00:02:51,517
Начнём с простого.

64
00:02:51,517 --> 00:02:53,310
[«Эй, сучка»]

65
00:02:53,310 --> 00:02:56,538
Если увидеть такой твит,

66
00:02:56,538 --> 00:02:58,232
то можно подумать:

67
00:02:58,232 --> 00:02:59,885
«Похоже на оскорбление».

68
00:02:59,885 --> 00:03:02,992
С какой стати вам захочется
получать сообщение

69
00:03:02,992 --> 00:03:05,210
«Эй, сучка»?

70
00:03:05,210 --> 00:03:09,873
Я, конечно, пытаюсь быть в курсе

71
00:03:09,873 --> 00:03:12,385
последних тенденций и мемов,

72
00:03:12,385 --> 00:03:15,089
поэтому знаю, что «Эй, сучка» —

73
00:03:15,089 --> 00:03:18,243
это часто используемое
приветствие между друзьями,

74
00:03:18,243 --> 00:03:22,505
а также известная фраза
из сериала «Во все тяжкие».

75
00:03:22,505 --> 00:03:24,992
Признаюсь, я не ожидала

76
00:03:24,992 --> 00:03:27,833
найти ещё одно значение.

77
00:03:27,833 --> 00:03:30,937
Оказывается, эту фразу
также используют в Твиттере

78
00:03:30,937 --> 00:03:33,999
люди, изображающие собак
в ролевых играх.

79
00:03:33,999 --> 00:03:39,278
(Смех)

80
00:03:39,278 --> 00:03:40,944
В этом случае

81
00:03:40,944 --> 00:03:42,553
это не только не оскорбление,

82
00:03:42,553 --> 00:03:45,692
но и, фактически,
предельно чёткое приветствие.

83
00:03:45,692 --> 00:03:48,581
(Смех)

84
00:03:48,581 --> 00:03:50,652
Из этого примера понятно,
что определить

85
00:03:50,652 --> 00:03:52,500
наличие в твите
оскорбления вне контекста

86
00:03:52,500 --> 00:03:54,092
действительно сложно.

87
00:03:54,092 --> 00:03:56,809
Давайте рассмотрим пример спама.

88
00:03:56,809 --> 00:03:58,769
Вот образец аккаунта,

89
00:03:58,769 --> 00:04:00,437
представляющего классическое
поведение спамера:

90
00:04:00,437 --> 00:04:01,996
он рассылает
одно и то же сообщение

91
00:04:01,996 --> 00:04:03,800
тысячам людей.

92
00:04:03,800 --> 00:04:06,593
Это модель, которую
я создала в своём аккаунте,

93
00:04:06,593 --> 00:04:09,594
но на деле мы видим
такие примеры регулярно.

94
00:04:09,594 --> 00:04:11,573
Казалось бы, понятно,
что с этим делать:

95
00:04:11,573 --> 00:04:13,626
нужно просто автоматически
приостанавливать действие аккаунтов,

96
00:04:13,626 --> 00:04:16,933
демонстрирующих такое поведение.

97
00:04:16,933 --> 00:04:20,143
Однако из этого правила
есть исключения.

98
00:04:20,143 --> 00:04:23,026
Оказывается, это сообщение
может также быть уведомлением

99
00:04:23,026 --> 00:04:26,915
о пролетающей над вами
Международной космической станции,

100
00:04:26,915 --> 00:04:28,761
на которое вы подписались,
потому что хотели

101
00:04:28,761 --> 00:04:30,709
выйти из дома
и попробовать её разглядеть.

102
00:04:30,709 --> 00:04:31,934
Если мы по ошибке

103
00:04:31,934 --> 00:04:33,781
приостановим данный аккаунт,
приняв его за спам,

104
00:04:33,781 --> 00:04:36,047
у вас не будет такой возможности.

105
00:04:36,047 --> 00:04:39,573
Давайте рассмотрим
ещё более показательные примеры.

106
00:04:39,573 --> 00:04:41,489
Снова посмотрим через мой аккаунт

107
00:04:41,489 --> 00:04:44,994
на образец типичного поведения.

108
00:04:44,994 --> 00:04:47,637
Теперь он рассылает
одно и то же сообщение и ссылку.

109
00:04:47,637 --> 00:04:50,411
Часто это показатель
так называемого «фишинга»,

110
00:04:50,411 --> 00:04:53,589
когда пытаются завладеть
информацией с аккаунта другого человека,

111
00:04:53,589 --> 00:04:55,792
направив его на другой вебсайт.

112
00:04:55,792 --> 00:04:59,986
Разумеется,
в этом нет ничего хорошего.

113
00:04:59,986 --> 00:05:01,916
Мы стремимся
приостанавливать аккаунты,

114
00:05:01,916 --> 00:05:04,540
показывающие такое поведение,
и делаем это.

115
00:05:04,540 --> 00:05:07,787
Так почему же в этом примере
высока вероятность ошибки?

116
00:05:07,787 --> 00:05:10,786
Например, это может быть
очевидец на митинге,

117
00:05:10,786 --> 00:05:12,696
который записал на видео,

118
00:05:12,696 --> 00:05:15,966
как офицер полиции применяет силу
к мирно протестующему гражданину,

119
00:05:15,966 --> 00:05:18,941
и пытается сообщить миру
о происходящем.

120
00:05:18,941 --> 00:05:20,584
Мы бы не хотели рисковать

121
00:05:20,584 --> 00:05:23,101
и заглушать такие важные сообщения,

122
00:05:23,101 --> 00:05:26,030
приняв их за спам
и приостановив действие аккаунта.

123
00:05:26,030 --> 00:05:28,909
Поэтому мы анализируем
сотни разных параметров,

124
00:05:28,909 --> 00:05:30,597
изучая поведение аккаунтов,

125
00:05:30,597 --> 00:05:32,613
и всё равно можем ошибиться,

126
00:05:32,613 --> 00:05:34,849
и придётся проводить оценку заново.

127
00:05:34,849 --> 00:05:38,557
Учитывая все трудности,
с какими мне приходится сталкиваться,

128
00:05:38,557 --> 00:05:41,253
мне важно не только
предупредить опасность,

129
00:05:41,253 --> 00:05:45,037
но и разработать защиту
от неожиданностей.

130
00:05:45,037 --> 00:05:47,379
Это важно не только для меня

131
00:05:47,379 --> 00:05:49,466
или для Твиттера —
это важно для вас.

132
00:05:49,466 --> 00:05:51,872
Это важно для любого,
кто создаёт нечто,

133
00:05:51,872 --> 00:05:53,797
как вам кажется, невероятное

134
00:05:53,797 --> 00:05:56,586
и позволяющее людям
делать замечательные вещи.

135
00:05:56,586 --> 00:05:59,452
Что же мне делать?

136
00:05:59,452 --> 00:06:02,770
Я задумываюсь:

137
00:06:02,770 --> 00:06:04,865
как же может произойти

138
00:06:04,865 --> 00:06:08,658
ужасная ошибка?

139
00:06:08,658 --> 00:06:13,111
Я представляю себе катастрофу.

140
00:06:13,111 --> 00:06:15,574
Это сложно.

141
00:06:15,574 --> 00:06:18,422
Возникает неотъемлемый
когнитивный диссонанс,

142
00:06:18,422 --> 00:06:20,234
как когда приходится

143
00:06:20,234 --> 00:06:22,880
одновременно сочинять
свадебные клятвы и брачный договор.

144
00:06:22,880 --> 00:06:24,576
(Смех)

145
00:06:24,576 --> 00:06:26,949
Но всё равно приходится это делать,

146
00:06:26,949 --> 00:06:31,395
особенно если связываешь себя
с 500 миллионами твитов в день.

147
00:06:31,395 --> 00:06:34,492
Что я имею в виду под
«представляю себе катастрофу»?

148
00:06:34,492 --> 00:06:37,254
Я пытаюсь представить, как что-то

149
00:06:37,254 --> 00:06:40,482
милое и безвредное,
например, изображение кошки,

150
00:06:40,482 --> 00:06:41,586
может привести
к смертельному случаю,

151
00:06:41,586 --> 00:06:43,912
и думаю, как это предотвратить.

152
00:06:43,912 --> 00:06:46,295
Покажу это на следующем примере.

153
00:06:46,295 --> 00:06:49,405
Это моя кошка Эли.

154
00:06:49,405 --> 00:06:51,386
Мы хотели дать
пользователям возможность

155
00:06:51,386 --> 00:06:53,459
добавлять картинки к твитам.

156
00:06:53,459 --> 00:06:55,056
Картинка может выразить тысячу слов,

157
00:06:55,056 --> 00:06:57,065
а у вас в распоряжении
всего лишь 140 знаков.

158
00:06:57,065 --> 00:06:58,265
Стоит добавить фото к твиту —

159
00:06:58,265 --> 00:07:01,303
и он становится значительно
богаче по содержанию.

160
00:07:01,303 --> 00:07:02,980
Добавление фото к твиту

161
00:07:02,980 --> 00:07:04,987
даёт много возможностей.

162
00:07:04,987 --> 00:07:07,267
Однако моя задача —
думать не об этом,

163
00:07:07,267 --> 00:07:10,014
а о том, что может пойти не так.

164
00:07:10,014 --> 00:07:11,906
Как эта картинка может

165
00:07:11,906 --> 00:07:15,445
стать причиной моей смерти?

166
00:07:15,445 --> 00:07:18,605
Вот, например, один способ.

167
00:07:18,605 --> 00:07:21,691
Это не просто изображение кошки.

168
00:07:21,691 --> 00:07:23,783
Это ещё и данные о местоположении.

169
00:07:23,783 --> 00:07:25,995
Когда вы снимаете что-то на смартфон

170
00:07:25,995 --> 00:07:27,294
или на цифровую камеру,

171
00:07:27,294 --> 00:07:28,948
в полученном изображении сохраняется

172
00:07:28,948 --> 00:07:30,564
много дополнительной информации.

173
00:07:30,564 --> 00:07:32,496
В действительности,
эта картинка также содержит

174
00:07:32,496 --> 00:07:34,301
эквивалент вот этого,

175
00:07:34,301 --> 00:07:37,380
а, если быть точнее, вот этого.

176
00:07:37,380 --> 00:07:39,336
Конечно, маловероятно,
что кто-то попытается

177
00:07:39,336 --> 00:07:41,621
отследить меня
и сделать что-то со мной,

178
00:07:41,621 --> 00:07:43,405
основываясь на данных,

179
00:07:43,405 --> 00:07:45,353
связанных с фотографией моей кошки,

180
00:07:45,353 --> 00:07:49,004
но я начинаю думать
о худшем варианте развития событий.

181
00:07:49,004 --> 00:07:51,342
Поэтому, когда мы запустили
фотосервис в Твиттере,

182
00:07:51,342 --> 00:07:55,163
мы решили отказаться
от отображения данных о местоположении.

183
00:07:55,163 --> 00:08:01,010
(Аплодисменты)

184
00:08:01,010 --> 00:08:03,623
Если я буду думать о худшем варианте

185
00:08:03,623 --> 00:08:04,570
и отталкиваться от него,

186
00:08:04,570 --> 00:08:07,123
я могу быть уверенной,
что защита, которую мы разрабатываем,

187
00:08:07,123 --> 00:08:08,891
подойдёт как для типичных,

188
00:08:08,891 --> 00:08:10,969
так и для нетипичных случаев.

189
00:08:10,969 --> 00:08:13,914
Учитывая, что я день и ночь
только и делаю,

190
00:08:13,914 --> 00:08:16,455
что воображаю себе
худший из возможных исходов,

191
00:08:16,455 --> 00:08:20,712
никого бы не удивило, если бы у меня
был мрачный взгляд на мир.

192
00:08:20,712 --> 00:08:22,495
(Смех)

193
00:08:22,495 --> 00:08:23,912
Это не так.

194
00:08:23,912 --> 00:08:27,788
Большая часть того, что я вижу, —

195
00:08:27,788 --> 00:08:31,689
а я вижу много, уж поверьте, —
это позитивное общение,

196
00:08:31,689 --> 00:08:33,613
когда люди помогают друг другу,

197
00:08:33,613 --> 00:08:37,061
или хотят стать ближе друг другу,
или поделиться информацией.

198
00:08:37,061 --> 00:08:40,384
Дело в том, что работая с масштабом,

199
00:08:40,384 --> 00:08:44,184
когда необходимо заботиться
о безопасности пользователей,

200
00:08:44,184 --> 00:08:46,730
нам приходится думать
о худшем варианте,

201
00:08:46,730 --> 00:08:50,957
потому что в нашем случае
шанс один на миллион —

202
00:08:50,957 --> 00:08:53,706
это довольно высокий шанс.

203
00:08:53,706 --> 00:08:55,570
Спасибо.

204
00:08:55,570 --> 00:08:59,570
(Аплодисменты)