ビックデータはより良いデータ
-
0:01 - 0:05アメリカで人気のパイと言えば?
-
0:05 - 0:08聴衆:「アップルパイ」
もちろん アップルパイですよね -
0:08 - 0:09どうして分かるのでしょうか?
-
0:09 - 0:12データがあるからです
-
0:12 - 0:14スーパーの売上げを考えてみましょう
-
0:14 - 0:1730cmの冷凍パイの売上げについてです
-
0:17 - 0:21アップルパイが断トツ1位です
-
0:21 - 0:26売上げの大部分がアップルパイです
-
0:26 - 0:29ところが スーパーが小さな
-
0:29 - 0:3211cmセンチのパイを売り始めると
-
0:32 - 0:36突然 アップルパイは
4、5番目に転落しまいました -
0:36 - 0:39なぜでしょうか?
何が起こったのでしょうか? -
0:39 - 0:42考えてみてください
-
0:42 - 0:4630cmのパイを買う時は
-
0:46 - 0:48家族全員の希望に沿うパイを選びます
-
0:48 - 0:52アップルパイは家族の第二希望なのです
-
0:52 - 0:54(笑)
-
0:54 - 0:57でも 個人用の11cmのパイを買う時は
-
0:57 - 1:01自分が欲しいパイを買います
-
1:01 - 1:05自分の第一希望を買えるのです
-
1:05 - 1:07データがたくさんあると
-
1:07 - 1:08データが少ない時には
-
1:08 - 1:09分からなかったことが
-
1:09 - 1:13分かってくるのです
-
1:13 - 1:16つまり より多くのデータがあると
-
1:16 - 1:18多くが見えるだけでなく
-
1:18 - 1:20見ていたことからも多くが分かるのです
-
1:20 - 1:23データが多いほど
新しいことが分かってきます -
1:23 - 1:27より良い見方や
-
1:27 - 1:30違う見方ができるようになります
-
1:30 - 1:33この例で 分かることは
-
1:33 - 1:36「アメリカで人気のパイは
-
1:36 - 1:39アップルパイではない」ということです
-
1:39 - 1:42皆さんは「ビッグデータ」という言葉を
お聞きになられたことがあるでしょう -
1:42 - 1:44もしかしたら 耳にタコがでくるくらい
-
1:44 - 1:46お聞きになっているかもしれません
-
1:46 - 1:49ビッグデータは
誇大宣伝されている部分もあり -
1:49 - 1:52非常に残念なことです
-
1:52 - 1:55なぜなら ビッグデータは
社会の進歩に欠かせない -
1:55 - 1:59非常に重要なツールだからです
-
1:59 - 2:02昔は 少ないデータから
-
2:02 - 2:04世界を理解しようと
-
2:04 - 2:05考えてきました
-
2:05 - 2:07現在は 以前では考えられなかった程の
-
2:07 - 2:10大量のデータがあるのです
-
2:10 - 2:12大量のデータがあると
-
2:12 - 2:15データ量が少なかった時に
不可能だったことが -
2:15 - 2:18根本的に可能になる
ということが分かってきました -
2:18 - 2:21ビッグデータは重要で 新しいものです
-
2:21 - 2:22ビックデータについて考えてみると
-
2:22 - 2:25地球規模の課題について-
-
2:25 - 2:26食糧問題や医療の供給
-
2:26 - 2:30エネルギーや電力の供給などに
-
2:30 - 2:33対処する唯一の方法であり
-
2:33 - 2:34地球温暖化の影響で
-
2:34 - 2:36カリカリに焼けることがないように
-
2:36 - 2:40データを効率的に使うことが必要なのです
-
2:40 - 2:44ビッグデータの新しいモノとは何で
重大事とは何でしょうか? -
2:44 - 2:46その問いに答えるために
-
2:46 - 2:48情報がどのようなもので
-
2:48 - 2:51過去には 物理的にどう映っていたのかを
考えてみましょう -
2:51 - 2:551908年 クレタ島で
-
2:55 - 3:00考古学者が粘土の円盤を発見しました
-
3:00 - 3:044.000年前の紀元前2,000年のものです
-
3:04 - 3:06この円盤には文字が書かれていますが
-
3:06 - 3:07実質的には 解読できません
-
3:07 - 3:09完全に謎なのですが
-
3:09 - 3:114,000年前の情報がどんなもの
-
3:11 - 3:13だったのかを言いたいのです
-
3:13 - 3:16これが 社会が情報を保管して
-
3:16 - 3:19伝えたやり方です
-
3:19 - 3:23さて 社会はそれほど進歩しませんでした
-
3:23 - 3:27今でもディスクに情報を保管しています
-
3:27 - 3:30でも 以前よりもずっと大量の情報を
-
3:30 - 3:31保管できるのです
-
3:31 - 3:34検索やコピーも より簡単です
-
3:34 - 3:38共有や処理も より簡単です
-
3:38 - 3:41情報を収集する時
-
3:41 - 3:42かつては想像だにしなかった
-
3:42 - 3:46情報の再利用もできるのです
-
3:46 - 3:48この点において データは
-
3:48 - 3:51固定的なモノから流動的なモノへ
-
3:51 - 3:55変化のない静的なモノから
-
3:55 - 3:59変わりやすくダイナミックスなモノへと
変化しているのです -
3:59 - 4:03いうなれば
情報には流動性があります -
4:03 - 4:06クレタ島で発見された
-
4:06 - 4:104,000年前の円盤は重く
-
4:10 - 4:12情報はたくさん書かれていませんし
-
4:12 - 4:15書き変えることはできないのです
-
4:15 - 4:19対照的に エドワード・スノーデンが
-
4:19 - 4:21アメリカの国家安全保障局から
-
4:21 - 4:24持ち出したファイルはすべて
-
4:24 - 4:26指の爪サイズの
-
4:26 - 4:29USBに保存でき
-
4:29 - 4:34光速で共有できるのです
-
4:34 - 4:39データは膨れ上がっています
-
4:39 - 4:41さて 今日の世界に大量のデータがあるのは
-
4:41 - 4:43常時 情報を集めているモノを
-
4:43 - 4:46収集しているからです
-
4:46 - 4:49別の理由は 常に情報を含みつつも
-
4:49 - 4:51データ形式にレンダレングされていない
-
4:51 - 4:54ものを集めているからです
-
4:54 - 4:56そしてデータに置き換えます
-
4:56 - 5:00例として 場所について考えてみましょう
-
5:00 - 5:02マーティン・ルターを例に挙げます
-
5:02 - 5:031,500年代に
-
5:03 - 5:06マーティン・ルターの居場所を知りたいのなら
-
5:06 - 5:08常に彼の後をついて行き
-
5:08 - 5:10羽ペンとインク入れを持ち運び
-
5:10 - 5:12居場所を記録しなければなりません
-
5:12 - 5:14でも 今日ではどうでしょうか
-
5:14 - 5:16電気通信業者のデータペースにより
-
5:16 - 5:19居場所が分かります
-
5:19 - 5:22常に あなたの居場所に関する情報を
-
5:22 - 5:24記録するスプレッドシートや
-
5:24 - 5:26データベースへの登録などがあります
-
5:26 - 5:27携帯電話を持っているなら
-
5:27 - 5:30GPS機能があります
GPS機能のない機種でも -
5:30 - 5:33あなたの情報を記録できるのです
-
5:33 - 5:37つまり 場所はデータ化されるのです
-
5:37 - 5:41別の例として 姿勢について考えてみましょう
-
5:41 - 5:42今皆さん全員座っておられますが
-
5:42 - 5:45あなたの座り方
-
5:45 - 5:47あなたの座り方 あなたの座り方
-
5:47 - 5:49全て異なります
足の長さや -
5:49 - 5:51背中や背中の曲線などが違います
-
5:51 - 5:54今皆さんが座られている椅子に
-
5:54 - 5:56100個のセンサーを付けるなら
-
5:56 - 5:59あなた独自の座り方の特徴を
-
5:59 - 6:04指ではないですが 指紋のように
分類できるのです -
6:04 - 6:07これで何ができるのでしょうか?
-
6:07 - 6:09東京の研究者は
-
6:09 - 6:14これを車の盗難防止装置
として使えると考えています -
6:14 - 6:16運転席に車泥棒が座るという発想により
-
6:16 - 6:19防犯につなげようとしています
-
6:19 - 6:21認証されていないドライバーが
運転席に座ると -
6:21 - 6:23「自分は認証されたドライバーである」
-
6:23 - 6:26と伝えるために
ダッシュボードにパスワードを入力しないと -
6:26 - 6:31エンジンが始動しないかもしれません
素晴らしいですね -
6:31 - 6:33ヨーロッパで全ての車が
この技術を搭載すると -
6:33 - 6:35どうなるのでしょうか?
-
6:35 - 6:38その時 何ができるのでしょうか?
-
6:38 - 6:40おそらく データを収集すると
-
6:40 - 6:44車の事故が 次の5秒で起こることを
-
6:44 - 6:47ピタリと言い当てることが
-
6:47 - 6:53できるかもしれません
-
6:53 - 6:55そして ドライバーの疲労を
-
6:55 - 6:57データ化し
-
6:57 - 6:59車がドライバーの姿勢が悪くなってきたと
-
6:59 - 7:03感じたら 自動的に
内部アラームを設定します -
7:03 - 7:07ハンドルを振動させたり
-
7:07 - 7:09「起きてください
-
7:09 - 7:11道路にもっと注意を向けましょう」と
-
7:11 - 7:12言葉で教えてくれます
-
7:12 - 7:14暮らしの様々な側面をデータ化すると
-
7:14 - 7:17私たちのできることを分類できます
-
7:17 - 7:21つまり ビックデータの価値とは
何でしょうか? -
7:21 - 7:23考えてみてください
-
7:23 - 7:25あなたは より多くの情報を持っており
-
7:25 - 7:29以前にはできなかったことが
できるのです -
7:29 - 7:30このコンセプトが生じる
-
7:30 - 7:32最も印象的な領域の1つが
-
7:32 - 7:35機械学習の領域です
-
7:35 - 7:39機械学習とは 人口知能に含まれ
-
7:39 - 7:42コンピュータ・サイエンスの1つです
-
7:42 - 7:43その概念は コンピュータに
-
7:43 - 7:46何をするかを教える代わりに
-
7:46 - 7:48単純に問題となるデータを投げると
-
7:48 - 7:51コンピュータが独自に解明してくれるのです
-
7:51 - 7:53その起源を辿ると
-
7:53 - 7:57分かりやすいでしょう
-
7:57 - 7:591950年代 アーサー・サミュエルという
-
7:59 - 8:03IBMのコンピュータ科学者は
チェッカーが好きでした -
8:03 - 8:04コンピュータ・プログラムを書き
-
8:04 - 8:07彼はコンピュータと対戦しました
-
8:07 - 8:10彼は対戦して 勝ちました
-
8:10 - 8:12彼は対戦して 勝ちました
-
8:12 - 8:15彼は対戦して 勝ちました
-
8:15 - 8:17コンピュータが正式なルールしか
-
8:17 - 8:19知らなかったからです
-
8:19 - 8:21アーサー・サミュエルは
すごいことを知っていました -
8:21 - 8:26彼は 戦略を知っていました
-
8:26 - 8:28彼はサブプログラムを作成して
-
8:28 - 8:30バックグラウンドで走らせました
-
8:30 - 8:32サブプログラムは 一手ごとに
-
8:32 - 8:34その盤面の配置から
-
8:34 - 8:37勝つ確率と負ける確率を
-
8:37 - 8:40記録したのです
-
8:40 - 8:43彼はコンピュータと対戦して 勝ちました
-
8:43 - 8:45彼はコンピュータと対戦して 勝ちました
-
8:45 - 8:49彼はコンピュータと対戦して 勝ちました
-
8:49 - 8:51そして アーサー・サミュエルは
-
8:51 - 8:54コンピュータ自体が
ゲームをするようにしました -
8:54 - 8:57コンピュータは独自にゲームをし
より多くのデータを集めました -
8:57 - 9:01より多くのデータを集めると
予測の精度も上がります -
9:01 - 9:03そしてアーサー・サミュエルは
-
9:03 - 9:06コンピュータの所へ戻り
対戦して 負けました -
9:06 - 9:08彼は対戦して 負けました
-
9:08 - 9:10彼は対戦して 負けました
-
9:10 - 9:13アーサー・サミュエルは
教えたタスクで -
9:13 - 9:19彼の能力を凌ぐ
コンピュータを作りあげました -
9:19 - 9:21機械学習という発想は
-
9:21 - 9:25どこにでもあります
-
9:25 - 9:28自動運転車はどのように
作られたと思いますか? -
9:28 - 9:31ソフトウェアに
全道路法規を記入すると -
9:31 - 9:34より豊かな社会なのでしょうか?
-
9:34 - 9:36いいえ 記憶装置は安価?
いいえ -
9:36 - 9:40アルゴリズムがより速い? いいえ
プロセッサがより良い? いいえ -
9:40 - 9:43それらはすべて重要ですが
それが理由ではありません -
9:43 - 9:46問題の性質を変えているからです
-
9:46 - 9:48私たちの言わんとすることを-
-
9:48 - 9:50例えば
「自動車の周辺には多くの情報があり -
9:50 - 9:53皆さんは それを理解しています
-
9:53 - 9:54信号機についても理解しています
-
9:54 - 9:56信号機は赤で青ではないので
-
9:56 - 9:57停止する必要があり
-
9:57 - 9:59前進できません」ということを
-
9:59 - 10:01コンピュータに明確に
-
10:01 - 10:03説明しようと試みていた
-
10:03 - 10:06問題の性質を変えてしまいました
-
10:06 - 10:08機械学習は 私たちが
-
10:08 - 10:10ネット上で行う多くの事の
根底となっています -
10:10 - 10:12例えば 検索エンジン
-
10:12 - 10:16Amazonのパーソナライズ・アルゴリズム
-
10:16 - 10:18自動翻訳
-
10:18 - 10:22音声認識などです
-
10:22 - 10:25最近 研究者は生検や
-
10:25 - 10:28ガンの生検について
-
10:28 - 10:31研究しており
-
10:31 - 10:33細胞が実際ガンに冒されているか
-
10:33 - 10:36どうかを調べるために
-
10:36 - 10:40データや生存率を使って
-
10:40 - 10:43コンピュータに
特定させようとしています -
10:43 - 10:45案の定 データを入力すると
-
10:45 - 10:47機会学習のアルゴリズム経由で
-
10:47 - 10:49コンピュータは12個の兆候を
-
10:49 - 10:51特定することで
-
10:51 - 10:54乳ガン細胞の生検結果はガンであると
-
10:54 - 10:57ビタリと予測します
-
10:57 - 11:00問題は 医学文献が
-
11:00 - 11:039個しか兆候を知らなかったことです
-
11:03 - 11:04特性のうち 3個は
-
11:04 - 11:07探す必要がないものでしたが
-
11:07 - 11:13コンピュータは見つけました
-
11:13 - 11:19さて ビックデータにも負の側面があります
-
11:19 - 11:21私たちの暮らしを向上させますが
-
11:21 - 11:24意識しなければならない
問題もあります -
11:24 - 11:26最初の問題は
-
11:26 - 11:29『マイノリティ・リポート』のように
-
11:29 - 11:33警察が目的のためにビックデータを使って
-
11:33 - 11:35予測に基づいて
罰するかもしれないということです -
11:35 - 11:38さて 予測警備とか
-
11:38 - 11:40アルゴリズム的犯罪学
という用語です -
11:40 - 11:42例えば 過去の犯罪がどこで起こったか
-
11:42 - 11:44というデータがたくさんあると
-
11:44 - 11:47パトロールすべき所が分かる
という考え方です -
11:47 - 11:49その通りですが もちろん問題もあります
-
11:49 - 11:53場所のデータだけで止まらず
-
11:53 - 11:56個人レベルにまで下りていってしまうことです
-
11:56 - 11:59個人の高校の成績証明書のデータを
-
11:59 - 12:01使うのはどうでしょうか?
-
12:01 - 12:02失業しているのかどうか
-
12:02 - 12:04信用情報
ネットサーフィンの行動パターン -
12:04 - 12:06夜更かしするのかどうか などを
-
12:06 - 12:08使うかもしれません
-
12:08 - 12:11Fitbit による生化学情報を得れば
-
12:11 - 12:15使用者が積極的な考え方をしていることさえ分かります
-
12:15 - 12:17私たちの行動を予測し得る
-
12:17 - 12:19アルゴリズムがあり
-
12:19 - 12:20実際に私たちが行動する前に
-
12:20 - 12:23責任を負うことになるかもしれません
-
12:23 - 12:25スモールデータの時代では
-
12:25 - 12:28プライバシーが中心的な課題でしたが
-
12:28 - 12:30ビックデータの時代では
-
12:30 - 12:34課題は 自由意思や道徳基準の選択
-
12:34 - 12:38人間の決断力や行為主体性などを
-
12:38 - 12:41保護することです
-
12:43 - 12:45ビックデータに職を奪われるという
-
12:45 - 12:48別の問題もあります
-
12:48 - 12:52ビックデータやアルゴリズムは
-
12:52 - 12:5520世紀に 工場の自動化や
-
12:55 - 12:57組立ラインが
-
12:57 - 12:59ブルーカラーに対抗したように
-
12:59 - 13:0121世紀には
ホワイトカラーや専門職に -
13:01 - 13:04対抗することになるでしょう
-
13:04 - 13:06顕微鏡を使って
-
13:06 - 13:08ガン生検を調べて
-
13:08 - 13:09ガンであるかどうかを決める
-
13:09 - 13:12検査技師について考えてみましょう
-
13:12 - 13:14その検査技師は大学教育を受けました
-
13:14 - 13:15不動産物件を買ったり
-
13:15 - 13:17投票したり
-
13:17 - 13:21社会への出資者でもあります
-
13:21 - 13:22そして 検査技師の仕事とは
-
13:22 - 13:24同じような専門職の一群と同様に
-
13:24 - 13:26同じような専門職の一群と同様に
-
13:26 - 13:29仕事内容が根本的に変わったり
-
13:29 - 13:31完全に無くなったりします
-
13:31 - 13:33短い一時的な混乱の後
-
13:33 - 13:36長年に渡って
テクノロジーが仕事を作ってきた -
13:36 - 13:39ことについて考えてください
-
13:39 - 13:41私たちが暮らす枠組み
-
13:41 - 13:43産業革命-は真実で
-
13:43 - 13:46まさに起こったことです
-
13:46 - 13:48しかし その分析で
忘れていることがあります -
13:48 - 13:50それはなくなり
二度と戻ってこなかった -
13:50 - 13:53職種があるということです
-
13:53 - 13:55産業革命は あまり有難くないものでした
-
13:55 - 13:59あなたが馬であれば
-
13:59 - 14:01ですから 注意深く ビックデータを取扱い
-
14:01 - 14:05私たちのニーズ
非常に人間的なニーズのために -
14:05 - 14:08調整していく必要があります
-
14:08 - 14:10私たちは この技術の召使ではなく
-
14:10 - 14:12所有者にならなければなりません
-
14:12 - 14:15ビックデータの時代は
始まったばかりなので -
14:15 - 14:18正直言って 今集められた全データに
-
14:18 - 14:22私たちは あまりうまく対処できていません
-
14:22 - 14:25国家安全保障局だけの
問題ではありません -
14:25 - 14:28企業も多くのデータを集め
乱用しています -
14:28 - 14:32うまく使えるようになるには 時間がかかります
-
14:32 - 14:34原始人と火が直面していた課題に
-
14:34 - 14:36ちょっと似ています
-
14:36 - 14:38これはツールですが
-
14:38 - 14:42注意しないと
私たちを焼いてしまうツールなのです -
14:44 - 14:47ビックデータは
生き方や働き方や考え方を -
14:47 - 14:50変えていくことでしょう
-
14:50 - 14:52私たちのキャリアを管理して
-
14:52 - 14:55満足して希望が持て
幸福で健康な暮らしに -
14:55 - 14:58導くことでしょう
-
14:58 - 15:02しかし 過去に
情報技術でよくあったように -
15:02 - 15:04物理的なものであるT-
-
15:04 - 15:06技術やハードウェアに
-
15:06 - 15:08目が行きがちになります
-
15:08 - 15:11明確でない部分があるものの
-
15:11 - 15:12いくつかの点において
-
15:12 - 15:14かなり重要である I-
-
15:14 - 15:18情報に再び着目する必要があります
-
15:18 - 15:21世界や私たちの居場所を理解するために
-
15:21 - 15:24時代を超えた冒険の一端として
-
15:24 - 15:26集めた情報から
-
15:26 - 15:29人間性がついに学べるのです
-
15:29 - 15:34そのことがビックデータが
重大事な理由なのです -
15:34 - 15:38(拍手)
- Title:
- ビックデータはより良いデータ
- Speaker:
- ケネス・ツーケル
- Description:
-
自動運転車は始まったばかりです。ビックデータが牽引する技術やデザインの未来はどうなるのでしょうか?ワクワクする科学的なトークで、ケネス・ツーケルは機械学習や人間の知識などの今後を検証します。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Natsuhiko Mizutani approved Japanese subtitles for Big data is better data | ||
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data | ||
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data | ||
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data | ||
Masako Kigami accepted Japanese subtitles for Big data is better data | ||
Masako Kigami edited Japanese subtitles for Big data is better data | ||
Masako Kigami edited Japanese subtitles for Big data is better data | ||
Masako Kigami declined Japanese subtitles for Big data is better data |
Natsuhiko Mizutani
LC 水谷です。
レビューの担当は決まっていますので、このタスクは取らないでくださいますよう、ご協力お願いします。