1 00:00:01,354 --> 00:00:04,489 科学技術は多くをもたらしてくれました 2 00:00:04,489 --> 00:00:06,508 月面着陸 インターネット 3 00:00:06,508 --> 00:00:09,133 ヒトゲノム配列の解析などです 4 00:00:09,133 --> 00:00:12,857 ですが 私たちの奥深くにある 恐怖の多くにも それは入り込んでいます 5 00:00:12,857 --> 00:00:14,713 およそ30年ほど前 6 00:00:14,713 --> 00:00:17,266 文化批評家のニール・ポストマンは 7 00:00:17,266 --> 00:00:19,381 "Amusing Ourselves to Death" という著作で 8 00:00:19,381 --> 00:00:22,140 このことを的確に述べました 9 00:00:22,140 --> 00:00:23,790 彼はこの著作において 10 00:00:23,790 --> 00:00:26,053 ジョージ・オーウェルとオルダス・ハクスリーの 11 00:00:26,053 --> 00:00:29,626 ディストピア (反ユートピア) 思想を比べて こう書きました 12 00:00:29,626 --> 00:00:32,752 「オーウェルは私たちが 13 00:00:32,752 --> 00:00:35,000 囚われの身になる文化を恐れた 14 00:00:35,000 --> 00:00:38,752 ハクスリーは私たちが 取るに足らないことに耽溺する文化を恐れた 15 00:00:38,752 --> 00:00:40,897 オーウェルは真実が 16 00:00:40,897 --> 00:00:42,820 私たちから隠蔽されることを恐れ 17 00:00:42,820 --> 00:00:45,010 ハクスリーは私たちが無関心の海で 18 00:00:45,010 --> 00:00:47,703 溺れ死ぬことを恐れた」 19 00:00:47,703 --> 00:00:49,873 要するに 20 00:00:49,873 --> 00:00:52,473 「ビッグ・ブラザー」 に監視されるか 21 00:00:52,473 --> 00:00:54,969 「ビッグ・ブラザー」を監視するかの どちらかということです 22 00:00:54,969 --> 00:00:56,900 (笑) 23 00:00:56,900 --> 00:00:58,634 でも そうでなくともよいのです 24 00:00:58,634 --> 00:01:01,970 私たちはデータや技術を 受け身で消費するだけではありません 25 00:01:01,970 --> 00:01:04,373 生活において データや技術が果たす役割や 26 00:01:04,373 --> 00:01:06,503 その意味を見出す方法を 私たちが形作るのです 27 00:01:06,503 --> 00:01:08,106 しかし そのためには 28 00:01:08,106 --> 00:01:11,619 コード化の方法と同じくらいに 29 00:01:11,619 --> 00:01:13,649 考え方にも注意を向けねばなりません 30 00:01:13,649 --> 00:01:16,747 物を数えるだけでなく さらにそれを理解するために 31 00:01:16,747 --> 00:01:18,616 難解な問いを 32 00:01:18,616 --> 00:01:21,218 投げかけねばなりません 33 00:01:21,218 --> 00:01:23,664 私たちは世界に どれ位のデータがあるか 34 00:01:23,664 --> 00:01:26,140 常に聞かされていますが 35 00:01:26,140 --> 00:01:27,720 ビッグデータや 36 00:01:27,720 --> 00:01:30,316 それを読み解く難解さとなると 37 00:01:30,316 --> 00:01:32,404 量だけがすべてではありません 38 00:01:32,404 --> 00:01:35,307 データが動く速さも問題になりますし 39 00:01:35,307 --> 00:01:37,003 データには様々な種類があります 40 00:01:37,003 --> 00:01:39,501 ごくわずかな例を挙げると 41 00:01:39,501 --> 00:01:41,699 画像 42 00:01:41,699 --> 00:01:45,706 文章 43 00:01:45,706 --> 00:01:47,801 映像 44 00:01:47,801 --> 00:01:49,631 音声などです 45 00:01:49,631 --> 00:01:52,673 これら別々の種類のデータに 共通しているのは 46 00:01:52,673 --> 00:01:54,894 これらは人の手で作られ 47 00:01:54,894 --> 00:01:57,669 文脈を必要としているということです 48 00:01:57,669 --> 00:02:00,114 さて イリノイ大学シカゴ校出身の 49 00:02:00,114 --> 00:02:02,419 データ科学者のグループがあります 50 00:02:02,419 --> 00:02:04,973 このグループは ヘルス・メディア・コラボラトリーと呼ばれ 51 00:02:04,973 --> 00:02:07,560 米国疾病管理センターと一緒に仕事をし 52 00:02:07,560 --> 00:02:09,065 人々が 53 00:02:09,065 --> 00:02:11,913 禁煙についての言い表し方や 54 00:02:11,913 --> 00:02:14,593 電子タバコについての言い表し方 55 00:02:14,593 --> 00:02:16,578 禁煙を促すために協力しあえることを 56 00:02:16,578 --> 00:02:18,562 より良く理解するよう努めました 57 00:02:18,562 --> 00:02:20,575 興味深いことに 人がどのように 58 00:02:20,575 --> 00:02:22,791 喫煙について話しているかを 理解するにはまず 59 00:02:22,791 --> 00:02:24,692 「smoking (吸う)」という語で 60 00:02:24,692 --> 00:02:27,257 どんな意味が表されているかを 理解せねばなりません 61 00:02:27,257 --> 00:02:31,183 ツイッター上には 4つの主なカテゴリーがあります 62 00:02:31,183 --> 00:02:34,180 1つ目 タバコを「吸う」 63 00:02:34,180 --> 00:02:36,987 2つ目 マリファナを「吸入する」 64 00:02:36,987 --> 00:02:39,630 3つ目 リブ肉を「いぶす」 65 00:02:39,630 --> 00:02:43,183 4つ目 「煙が出るほどホットな」イケてる女 66 00:02:43,183 --> 00:02:46,176 (笑) 67 00:02:46,176 --> 00:02:48,602 電子タバコについて どのように話されているかは 68 00:02:48,602 --> 00:02:50,742 その上で考えてみなければなりません 69 00:02:50,742 --> 00:02:52,767 これには 非常に様々な例が見られます 70 00:02:52,767 --> 00:02:55,366 スライドからもおわかりのように 71 00:02:55,366 --> 00:02:57,976 これは複雑な問いなのです 72 00:02:57,976 --> 00:03:01,200 このことで思い出すのは 73 00:03:01,200 --> 00:03:03,611 言語は人々によって作られたものであり 74 00:03:03,611 --> 00:03:05,951 人間は厄介かつ複雑なもので 75 00:03:05,951 --> 00:03:08,718 比喩やスラングや隠語を 使うものだということ 76 00:03:08,718 --> 00:03:11,997 そしてそれを人間は毎日24時間 多くの言語で行い続けており 77 00:03:11,997 --> 00:03:15,221 理解するやいなや その言葉自体を変えてしまうことです 78 00:03:15,221 --> 00:03:20,339 では 米国疾病管理センターが出した 79 00:03:20,339 --> 00:03:22,769 喉に穴が開いた女性を 映し出すこのテレビ広告は 80 00:03:22,769 --> 00:03:24,790 非常に描写が露骨で 81 00:03:24,790 --> 00:03:26,694 気持ちの良いものではありませんが 82 00:03:26,694 --> 00:03:28,579 この広告は実際に禁煙するように 83 00:03:28,579 --> 00:03:31,250 人々を促したのでしょうか? 84 00:03:31,250 --> 00:03:34,557 ヘルス・メディア・コラボラトリーは データの限界を認めてはいますが 85 00:03:34,557 --> 00:03:36,562 その結論によると 86 00:03:36,562 --> 00:03:39,874 あなた方も見たことがあるかもしれない これらの広告によって 87 00:03:39,874 --> 00:03:42,465 将来の行動が 88 00:03:42,465 --> 00:03:44,287 影響されるかもしれないような 89 00:03:44,287 --> 00:03:47,954 思考プロセスに 人々を導いたのだそうです 90 00:03:47,954 --> 00:03:51,845 私がこのプロジェクトについて 感心し 評価するのは 91 00:03:51,845 --> 00:03:53,334 人間の現実的な必要性に 基づいている などの事実面はさておき 92 00:03:53,334 --> 00:03:57,391 人間の現実的な必要性に 基づいている などの事実面はさておき 93 00:03:57,391 --> 00:04:00,237 これが無関心の海に真っ向から 立ち向かう勇気を示す 94 00:04:00,237 --> 00:04:04,680 素晴らしい例であるということです 95 00:04:04,680 --> 00:04:07,985 一方 理解が難しいのは ビッグデータだけではないのです 96 00:04:07,985 --> 00:04:10,586 なぜなら 考えてもみてください 97 00:04:10,586 --> 00:04:13,180 私たち人間は データの大小にかかわらず 98 00:04:13,180 --> 00:04:15,873 それを台無しにしてしまった 豊かな歴史を 99 00:04:15,873 --> 00:04:17,490 有しているではありませんか 100 00:04:17,490 --> 00:04:21,227 何年も前に ロナルド・レーガン元大統領が 101 00:04:21,227 --> 00:04:23,500 このように述べて厳しく批判されたことを 102 00:04:23,500 --> 00:04:25,491 皆さんも覚えているかもしれません 103 00:04:25,491 --> 00:04:28,501 「事実とは馬鹿げたものである」と 104 00:04:28,501 --> 00:04:31,295 これは言い間違いでした 公平を期すなら ですが 105 00:04:31,295 --> 00:04:33,725 彼はジョン・アダムズが 106 00:04:33,725 --> 00:04:36,476 ボストン虐殺事件裁判において イギリス人兵士の弁護で述べた 107 00:04:36,476 --> 00:04:39,626 「事実とは確固たるものである」を 引用したつもりだったのです 108 00:04:39,626 --> 00:04:42,250 しかし このレーガンの言い間違いは 109 00:04:42,250 --> 00:04:45,668 偶然ながらも 一理あると私は思います 110 00:04:45,668 --> 00:04:48,444 なぜなら 事実は確固たるものですが 111 00:04:48,444 --> 00:04:51,367 時に 馬鹿げてもいるからです 112 00:04:51,367 --> 00:04:53,255 これが 私にとってなぜ重要なのか 113 00:04:53,255 --> 00:04:56,803 個人的なお話をしたいと思います 114 00:04:56,803 --> 00:04:59,240 ひと息つかせてください 115 00:04:59,240 --> 00:05:01,994 息子のアイザックは 2歳の時に 116 00:05:01,994 --> 00:05:04,411 自閉症の診断を受けました 117 00:05:04,411 --> 00:05:06,572 彼はにこにこして 愉快で 118 00:05:06,572 --> 00:05:08,607 愛情深く 優しい男の子でしたが 119 00:05:08,607 --> 00:05:11,509 彼の発育評価についての測定基準が 120 00:05:11,509 --> 00:05:13,579 着目したのは 話せる言葉の数や― 121 00:05:13,579 --> 00:05:17,236 これは当時 ゼロでした― 122 00:05:17,236 --> 00:05:21,176 意思疎通を図る身振り アイコンタクトなどであったため 123 00:05:21,176 --> 00:05:23,179 彼の発育レベルは 124 00:05:23,179 --> 00:05:27,140 9か月の赤ちゃん程度でした 125 00:05:27,140 --> 00:05:30,100 この診断は事実からすれば 正しいものでしたが 126 00:05:30,100 --> 00:05:33,309 全体像を語ってはいませんでした 127 00:05:33,309 --> 00:05:34,710 およそ1年半後 128 00:05:34,710 --> 00:05:36,812 アイザックがもうすぐ4歳になる頃 129 00:05:36,812 --> 00:05:39,175 私は ある日 彼がコンピュータの前で 130 00:05:39,175 --> 00:05:44,628 グーグル画像検索で 女性を検索しているのを見つけました 131 00:05:44,628 --> 00:05:48,244 「w-i-m-e-n」というつづりで です 132 00:05:48,244 --> 00:05:50,984 過干渉な親がそうするように 私も 133 00:05:50,984 --> 00:05:52,885 「前のページに戻る」ボタンをクリックし 134 00:05:52,885 --> 00:05:56,248 他に何を検索していたのか知ろうとしました 135 00:05:56,248 --> 00:05:58,419 他の検索は 順番に「男性」 136 00:05:58,419 --> 00:06:05,686 「学校」 「バス」 そして「コンピュータ」でした 137 00:06:05,686 --> 00:06:07,756 私は呆気にとられました 138 00:06:07,756 --> 00:06:09,758 アイザックがスペルを知っているとも 139 00:06:09,758 --> 00:06:11,524 ましてや読めるとも知らなかったのです 140 00:06:11,524 --> 00:06:13,717 そこで息子に訊きました 「どうやったの?」 141 00:06:13,717 --> 00:06:16,395 アイザックは私を真剣に見て 言いました 142 00:06:16,395 --> 00:06:19,747 「ボックスに文字をタイプしたんだ」 143 00:06:19,747 --> 00:06:23,481 彼は自分で意思疎通の仕方を 学んでいたのに 144 00:06:23,481 --> 00:06:26,485 私たちは誤った部分に 目を向けていたのです 145 00:06:26,485 --> 00:06:28,780 そして こういったことが起こるのは 146 00:06:28,780 --> 00:06:31,176 査定や分析が ある測定基準― 147 00:06:31,176 --> 00:06:33,785 ここでは 言語による意思疎通― を過大評価して 148 00:06:33,785 --> 00:06:39,488 創造的問題解決能力のような 他の基準を過小評価する場合です 149 00:06:39,488 --> 00:06:41,795 アイザックにとって 他者との意思疎通は難しいので 150 00:06:41,795 --> 00:06:43,707 彼は自分に必要なことを知るための 151 00:06:43,707 --> 00:06:46,564 別の方法を見つけたのです 152 00:06:46,564 --> 00:06:48,454 考えてみれば 合点がいきますね 153 00:06:48,454 --> 00:06:50,535 質問文を構成するのは 154 00:06:50,535 --> 00:06:53,100 実に複雑なプロセスですが 155 00:06:53,100 --> 00:06:55,622 アイザックは検索ボックスに 単語を入れるだけで 156 00:06:55,622 --> 00:06:59,714 自力で答えにたどり着けるのです 157 00:06:59,714 --> 00:07:02,650 この些細な瞬間が 158 00:07:02,650 --> 00:07:05,486 私と家族に 159 00:07:05,486 --> 00:07:06,795 大きな影響を与えました 160 00:07:06,795 --> 00:07:09,936 なぜなら これが アイザックに何が起こっているのかを 161 00:07:09,936 --> 00:07:12,144 把握する方法を変えてくれたからです 162 00:07:12,144 --> 00:07:15,120 心配もほんの少し和らぎ 163 00:07:15,120 --> 00:07:17,302 彼の能力を より理解できるようになりました 164 00:07:17,302 --> 00:07:20,163 事実とは馬鹿げたものなのです 165 00:07:20,163 --> 00:07:22,560 また事実は意図的 あるいは無意図的に 166 00:07:22,560 --> 00:07:24,213 誤用されやすいものです 167 00:07:24,213 --> 00:07:27,239 私には エミリー・ウィリンガムという 科学者の友人がいますが 168 00:07:27,239 --> 00:07:30,040 彼女は最近フォーブス誌に 169 00:07:30,040 --> 00:07:32,020 「自閉症と関連付けられてきた 10のおかしな事」 170 00:07:32,020 --> 00:07:33,830 という記事を書きました 171 00:07:33,830 --> 00:07:36,835 これは 結構なリストです 172 00:07:36,835 --> 00:07:40,367 何でもインターネットのせいにされます ねえ? 173 00:07:40,367 --> 00:07:44,124 もちろん 母親も入っています 174 00:07:44,124 --> 00:07:45,711 実は もっとあります 175 00:07:45,711 --> 00:07:49,141 この「母親」のカテゴリーの中に 色々とあるのです 176 00:07:49,141 --> 00:07:53,956 色々な要素の入った 興味深いリストでしょう? 177 00:07:53,956 --> 00:07:56,149 私が好きなのは 178 00:07:56,149 --> 00:07:59,853 「妊娠中 高速道路のそばで 暮らしていた」ですね 179 00:07:59,853 --> 00:08:01,392 最後のも興味深いです 180 00:08:01,392 --> 00:08:04,395 「冷蔵庫のような母親」という言葉は 181 00:08:04,395 --> 00:08:07,000 自閉症の原因に関する 182 00:08:07,000 --> 00:08:08,431 元々の仮説からきており 183 00:08:08,431 --> 00:08:11,166 冷徹で愛情が薄い人という意味でした 184 00:08:11,166 --> 00:08:12,728 ここで こう考えるかもしれませんね 185 00:08:12,728 --> 00:08:14,385 「わかった データを測定してしまえば 186 00:08:14,385 --> 00:08:16,167 どんな意味づけも可能と言うんだろう」 187 00:08:16,167 --> 00:08:20,870 確かに 全くその通りですが 188 00:08:20,870 --> 00:08:26,480 難しいのは 189 00:08:26,480 --> 00:08:28,928 私たちは その意味を作り出す機会を 190 00:08:28,928 --> 00:08:31,212 自らに与えられていることです 191 00:08:31,212 --> 00:08:36,564 データ自身ではなく 私たちが意味を作るのです 192 00:08:36,564 --> 00:08:39,820 ビジネスパーソンとして 消費者として 193 00:08:39,820 --> 00:08:42,359 患者として 市民として 194 00:08:42,359 --> 00:08:44,755 私たちには より多くの時間を使って 195 00:08:44,755 --> 00:08:46,949 批判的に考える能力を 196 00:08:46,949 --> 00:08:49,819 鍛える責任があります 197 00:08:49,819 --> 00:08:50,897 なぜかって? 198 00:08:50,897 --> 00:08:54,075 なぜなら 何度も耳にしてきたように 199 00:08:54,075 --> 00:08:55,781 有史以来 今やものすごい速さで 200 00:08:55,781 --> 00:08:57,762 何エクサバイトものデータを 201 00:08:57,762 --> 00:08:59,915 私たちは処理することができるからです 202 00:08:59,915 --> 00:09:03,430 そして 間違った判断を 203 00:09:03,430 --> 00:09:05,264 より速く 効率的に下し 204 00:09:05,264 --> 00:09:10,292 これまでにないほどの影響を及ぼす 可能性があるからです 205 00:09:10,292 --> 00:09:11,680 すごいと思いませんか? 206 00:09:11,680 --> 00:09:14,710 ですから 私たちがすべきなのは 207 00:09:14,710 --> 00:09:17,040 時間をもう少し 208 00:09:17,040 --> 00:09:19,786 人文学や 209 00:09:19,786 --> 00:09:23,250 社会学 社会科学― 210 00:09:23,250 --> 00:09:25,558 修辞学や哲学 倫理学などに費やすことです 211 00:09:25,558 --> 00:09:28,414 これらがビッグデータに 重要な文脈を与えてくれ 212 00:09:28,414 --> 00:09:30,990 より批判的な考え方が 213 00:09:30,990 --> 00:09:33,408 できるようにしてくれるからです 214 00:09:33,408 --> 00:09:37,615 結局のところ 特定の議論の中に存在する問題を 215 00:09:37,615 --> 00:09:40,101 見つけることができれば 216 00:09:40,101 --> 00:09:42,860 それが言葉で表されようと 数字で表されようと関係ないのですから 217 00:09:42,860 --> 00:09:45,579 つまり 218 00:09:45,579 --> 00:09:50,000 確証バイアスや誤った相関関係を 219 00:09:50,000 --> 00:09:51,822 自ら見つけ出し 220 00:09:51,822 --> 00:09:53,960 感情に露骨に訴えるようなやり方を 221 00:09:53,960 --> 00:09:55,622 30m手前で見抜けるようにするのです 222 00:09:55,622 --> 00:09:58,144 なぜなら 何かがある出来事の後に 起こったからといって 223 00:09:58,144 --> 00:10:01,226 必ずしも関連があるとは限らないからです 224 00:10:01,226 --> 00:10:03,345 ちょっと 小難しいことを言えば 225 00:10:03,345 --> 00:10:07,642 ローマ人はこう言い表しました 「post hoc ergo propter hoc」 226 00:10:07,642 --> 00:10:10,938 「後に起きた ゆえにそれが原因なり」 という前後即因果の誤謬です 227 00:10:10,938 --> 00:10:14,695 つまり 人口統計学のような 学問を疑問に付すことになります 228 00:10:14,695 --> 00:10:17,215 なぜかって? なぜなら 人口統計学は 229 00:10:17,215 --> 00:10:19,521 私たちの実際の考えや行動ではなく 230 00:10:19,521 --> 00:10:20,983 性別や年齢 231 00:10:20,983 --> 00:10:24,461 住む場所による推定に基づいているからです 232 00:10:24,461 --> 00:10:26,124 それから データを取得した以上は 233 00:10:26,124 --> 00:10:29,263 適切な個人情報保護や 234 00:10:29,263 --> 00:10:32,839 消費者の意思を汲んで これを扱わねばなりません 235 00:10:32,839 --> 00:10:35,832 さらには 私たちは 236 00:10:35,832 --> 00:10:37,935 自身の仮説や用いる方法論 237 00:10:37,935 --> 00:10:40,531 そして結果の確実性について 238 00:10:40,531 --> 00:10:43,335 明確でなければなりません 239 00:10:43,335 --> 00:10:45,809 私の高校の代数の先生は よくこう言っていました 240 00:10:45,809 --> 00:10:47,340 「計算過程を明らかにしなさい 241 00:10:47,340 --> 00:10:50,781 君が踏んだ過程がわからなければ 242 00:10:50,781 --> 00:10:52,772 どの手順を 踏まなかったのかわからないし 243 00:10:52,772 --> 00:10:55,210 君がどんな問いを立てたのかが わからなければ 244 00:10:55,210 --> 00:10:58,407 どんな問いを 立てなかったかがわからないからね」 245 00:10:58,407 --> 00:10:59,930 それは最も難しい問いを 246 00:10:59,930 --> 00:11:01,409 自らに投げかけることなのです 247 00:11:01,409 --> 00:11:04,909 このデータは本当に このことを示しているのか? 248 00:11:04,909 --> 00:11:07,220 それともこの結果が 私たちをもっと 249 00:11:07,220 --> 00:11:11,098 成功しているとか 心地よく 感じさせてくれるだけなのか? と 250 00:11:11,098 --> 00:11:13,682 ヘルス・メディア・コラボラトリーは 251 00:11:13,682 --> 00:11:15,381 プロジェクトの終わりに 252 00:11:15,381 --> 00:11:18,789 あの非常に露骨で不快な 禁煙推奨広告に関する 253 00:11:18,789 --> 00:11:20,933 ツイートの87パーセントが 254 00:11:20,933 --> 00:11:24,971 恐れを表していたことが わかったといいます 255 00:11:24,971 --> 00:11:26,827 しかし 彼らは 256 00:11:26,827 --> 00:11:29,988 「広告が実際に人々を禁煙に導いた」 と結論付けていましたか? 257 00:11:29,988 --> 00:11:32,530 答えはノーです これは科学であり 魔法ではないのです 258 00:11:32,530 --> 00:11:35,720 ですから データの力を 259 00:11:35,720 --> 00:11:38,582 解き放つのであれば 260 00:11:38,582 --> 00:11:42,030 私たちは必ずしも オーウェルの思い描いたような 261 00:11:42,030 --> 00:11:45,466 全体主義的な未来や 262 00:11:45,466 --> 00:11:48,583 ハクスリーの描いたような 些末な事柄に溺れる未来 あるいは 263 00:11:48,583 --> 00:11:51,603 両者を折衷したおぞましい未来に 盲目的に突き進まずに済むのです 264 00:11:51,603 --> 00:11:53,982 私たちがすべきなのは 265 00:11:53,982 --> 00:11:56,700 批判的な思考に敬意を払い 266 00:11:56,700 --> 00:11:58,729 ヘルス・メディア・コラボラトリーのような 前例からインスピレーションを得ることです 267 00:11:58,729 --> 00:12:01,339 ヘルス・メディア・コラボラトリーのような 前例からインスピレーションを得ることです 268 00:12:01,339 --> 00:12:03,667 そして ヒーローものの映画に よくあるように 269 00:12:03,667 --> 00:12:05,489 私たちの力を善きものに使いましょう 270 00:12:05,489 --> 00:12:07,840 ありがとうございました 271 00:12:07,840 --> 00:12:10,174 (拍手)