Return to Video

ビックデータはより良いデータ

  • 0:01 - 0:05
    アメリカで人気のパイと言えば?
  • 0:05 - 0:08
    聴衆:「アップルパイ」
    もちろん アップルパイですよね
  • 0:08 - 0:09
    どうして分かるのでしょうか?
  • 0:09 - 0:12
    データがあるからです
  • 0:12 - 0:14
    スーパーの売上げを考えてみましょう
  • 0:14 - 0:17
    30cmの冷凍パイの売上げについてです
  • 0:17 - 0:21
    アップルパイが断トツ1位です
  • 0:21 - 0:26
    売上げの大部分がアップルパイです
  • 0:26 - 0:29
    ところが スーパーが小さな
  • 0:29 - 0:32
    11cmセンチのパイを売り始めると
  • 0:32 - 0:36
    突然 アップルパイは
    4、5番目に転落しまいました
  • 0:36 - 0:39
    なぜでしょうか?
    何が起こったのでしょうか?
  • 0:39 - 0:42
    考えてみてください
  • 0:42 - 0:46
    30cmのパイを買う時は
  • 0:46 - 0:48
    家族全員の希望に沿うパイを選びます
  • 0:48 - 0:52
    アップルパイは家族の第二希望なのです
  • 0:52 - 0:54
    (笑)
  • 0:54 - 0:57
    でも 個人用の11cmのパイを買う時は
  • 0:57 - 1:01
    自分が欲しいパイを買います
  • 1:01 - 1:05
    自分の第一希望を買えるのです
  • 1:05 - 1:07
    データがたくさんあると
  • 1:07 - 1:08
    データが少ない時には
  • 1:08 - 1:09
    分からなかったことが
  • 1:09 - 1:13
    分かってくるのです
  • 1:13 - 1:16
    つまり より多くのデータがあると
  • 1:16 - 1:18
    多くが見えるだけでなく
  • 1:18 - 1:20
    見ていたことからも多くが分かるのです
  • 1:20 - 1:23
    データが多いほど
    新しいことが分かってきます
  • 1:23 - 1:27
    より良い見方や
  • 1:27 - 1:30
    違う見方ができるようになります
  • 1:30 - 1:33
    この例で 分かることは
  • 1:33 - 1:36
    「アメリカで人気のパイは
  • 1:36 - 1:39
    アップルパイではない」ということです
  • 1:39 - 1:42
    皆さんは「ビッグデータ」という言葉を
    お聞きになられたことがあるでしょう
  • 1:42 - 1:44
    もしかしたら 耳にタコがでくるくらい
  • 1:44 - 1:46
    お聞きになっているかもしれません
  • 1:46 - 1:49
    ビッグデータは
    誇大宣伝されている部分もあり
  • 1:49 - 1:52
    非常に残念なことです
  • 1:52 - 1:55
    なぜなら ビッグデータは
    社会の進歩に欠かせない
  • 1:55 - 1:59
    非常に重要なツールだからです
  • 1:59 - 2:02
    昔は 少ないデータから
  • 2:02 - 2:04
    世界を理解しようと
  • 2:04 - 2:05
    考えてきました
  • 2:05 - 2:07
    現在は 以前では考えられなかった程の
  • 2:07 - 2:10
    大量のデータがあるのです
  • 2:10 - 2:12
    大量のデータがあると
  • 2:12 - 2:15
    データ量が少なかった時に
    不可能だったことが
  • 2:15 - 2:18
    根本的に可能になる
    ということが分かってきました
  • 2:18 - 2:21
    ビッグデータは重要で 新しいものです
  • 2:21 - 2:22
    ビックデータについて考えてみると
  • 2:22 - 2:25
    地球規模の課題について-
  • 2:25 - 2:26
    食糧問題や医療の供給
  • 2:26 - 2:30
    エネルギーや電力の供給などに
  • 2:30 - 2:33
    対処する唯一の方法であり
  • 2:33 - 2:34
    地球温暖化の影響で
  • 2:34 - 2:36
    カリカリに焼けることがないように
  • 2:36 - 2:40
    データを効率的に使うことが必要なのです
  • 2:40 - 2:44
    ビッグデータの新しいモノとは何で
    重大事とは何でしょうか?
  • 2:44 - 2:46
    その問いに答えるために
  • 2:46 - 2:48
    情報がどのようなもので
  • 2:48 - 2:51
    過去には 物理的にどう映っていたのかを
    考えてみましょう
  • 2:51 - 2:55
    1908年 クレタ島で
  • 2:55 - 3:00
    考古学者が粘土の円盤を発見しました
  • 3:00 - 3:04
    4.000年前の紀元前2,000年のものです
  • 3:04 - 3:06
    この円盤には文字が書かれていますが
  • 3:06 - 3:07
    実質的には 解読できません
  • 3:07 - 3:09
    完全に謎なのですが
  • 3:09 - 3:11
    4,000年前の情報がどんなもの
  • 3:11 - 3:13
    だったのかを言いたいのです
  • 3:13 - 3:16
    これが 社会が情報を保管して
  • 3:16 - 3:19
    伝えたやり方です
  • 3:19 - 3:23
    さて 社会はそれほど進歩しませんでした
  • 3:23 - 3:27
    今でもディスクに情報を保管しています
  • 3:27 - 3:30
    でも 以前よりもずっと大量の情報を
  • 3:30 - 3:31
    保管できるのです
  • 3:31 - 3:34
    検索やコピーも より簡単です
  • 3:34 - 3:38
    共有や処理も より簡単です
  • 3:38 - 3:41
    情報を収集する時
  • 3:41 - 3:42
    かつては想像だにしなかった
  • 3:42 - 3:46
    情報の再利用もできるのです
  • 3:46 - 3:48
    この点において データは
  • 3:48 - 3:51
    固定的なモノから流動的なモノへ
  • 3:51 - 3:55
    変化のない静的なモノから
  • 3:55 - 3:59
    変わりやすくダイナミックスなモノへと
    変化しているのです
  • 3:59 - 4:03
    いうなれば
    情報には流動性があります
  • 4:03 - 4:06
    クレタ島で発見された
  • 4:06 - 4:10
    4,000年前の円盤は重く
  • 4:10 - 4:12
    情報はたくさん書かれていませんし
  • 4:12 - 4:15
    書き変えることはできないのです
  • 4:15 - 4:19
    対照的に エドワード・スノーデンが
  • 4:19 - 4:21
    アメリカの国家安全保障局から
  • 4:21 - 4:24
    持ち出したファイルはすべて
  • 4:24 - 4:26
    指の爪サイズの
  • 4:26 - 4:29
    USBに保存でき
  • 4:29 - 4:34
    光速で共有できるのです
  • 4:34 - 4:39
    データは膨れ上がっています
  • 4:39 - 4:41
    さて 今日の世界に大量のデータがあるのは
  • 4:41 - 4:43
    常時 情報を集めているモノを
  • 4:43 - 4:46
    収集しているからです
  • 4:46 - 4:49
    別の理由は 常に情報を含みつつも
  • 4:49 - 4:51
    データ形式にレンダレングされていない
  • 4:51 - 4:54
    ものを集めているからです
  • 4:54 - 4:56
    そしてデータに置き換えます
  • 4:56 - 5:00
    例として 場所について考えてみましょう
  • 5:00 - 5:02
    マーティン・ルターを例に挙げます
  • 5:02 - 5:03
    1,500年代に
  • 5:03 - 5:06
    マーティン・ルターの居場所を知りたいのなら
  • 5:06 - 5:08
    常に彼の後をついて行き
  • 5:08 - 5:10
    羽ペンとインク入れを持ち運び
  • 5:10 - 5:12
    居場所を記録しなければなりません
  • 5:12 - 5:14
    でも 今日ではどうでしょうか
  • 5:14 - 5:16
    電気通信業者のデータペースにより
  • 5:16 - 5:19
    居場所が分かります
  • 5:19 - 5:22
    常に あなたの居場所に関する情報を
  • 5:22 - 5:24
    記録するスプレッドシートや
  • 5:24 - 5:26
    データベースへの登録などがあります
  • 5:26 - 5:27
    携帯電話を持っているなら
  • 5:27 - 5:30
    GPS機能があります
    GPS機能のない機種でも
  • 5:30 - 5:33
    あなたの情報を記録できるのです
  • 5:33 - 5:37
    つまり 場所はデータ化されるのです
  • 5:37 - 5:41
    別の例として 姿勢について考えてみましょう
  • 5:41 - 5:42
    今皆さん全員座っておられますが
  • 5:42 - 5:45
    あなたの座り方
  • 5:45 - 5:47
    あなたの座り方 あなたの座り方
  • 5:47 - 5:49
    全て異なります
    足の長さや
  • 5:49 - 5:51
    背中や背中の曲線などが違います
  • 5:51 - 5:54
    今皆さんが座られている椅子に
  • 5:54 - 5:56
    100個のセンサーを付けるなら
  • 5:56 - 5:59
    あなた独自の座り方の特徴を
  • 5:59 - 6:04
    指ではないですが 指紋のように
    分類できるのです
  • 6:04 - 6:07
    これで何ができるのでしょうか?
  • 6:07 - 6:09
    東京の研究者は
  • 6:09 - 6:14
    これを車の盗難防止装置
    として使えると考えています
  • 6:14 - 6:16
    運転席に車泥棒が座るという発想により
  • 6:16 - 6:19
    防犯につなげようとしています
  • 6:19 - 6:21
    認証されていないドライバーが
    運転席に座ると
  • 6:21 - 6:23
    「自分は認証されたドライバーである」
  • 6:23 - 6:26
    と伝えるために
    ダッシュボードにパスワードを入力しないと
  • 6:26 - 6:31
    エンジンが始動しないかもしれません
    素晴らしいですね
  • 6:31 - 6:33
    ヨーロッパで全ての車が
    この技術を搭載すると
  • 6:33 - 6:35
    どうなるのでしょうか?
  • 6:35 - 6:38
    その時 何ができるのでしょうか?
  • 6:38 - 6:40
    おそらく データを収集すると
  • 6:40 - 6:44
    車の事故が 次の5秒で起こることを
  • 6:44 - 6:47
    ピタリと言い当てることが
  • 6:47 - 6:53
    できるかもしれません
  • 6:53 - 6:55
    そして ドライバーの疲労を
  • 6:55 - 6:57
    データ化し
  • 6:57 - 6:59
    車がドライバーの姿勢が悪くなってきたと
  • 6:59 - 7:03
    感じたら 自動的に
    内部アラームを設定します
  • 7:03 - 7:07
    ハンドルを振動させたり
  • 7:07 - 7:09
    「起きてください
  • 7:09 - 7:11
    道路にもっと注意を向けましょう」と
  • 7:11 - 7:12
    言葉で教えてくれます
  • 7:12 - 7:14
    暮らしの様々な側面をデータ化すると
  • 7:14 - 7:17
    私たちのできることを分類できます
  • 7:17 - 7:21
    つまり ビックデータの価値とは
    何でしょうか?
  • 7:21 - 7:23
    考えてみてください
  • 7:23 - 7:25
    あなたは より多くの情報を持っており
  • 7:25 - 7:29
    以前にはできなかったことが
    できるのです
  • 7:29 - 7:30
    このコンセプトが生じる
  • 7:30 - 7:32
    最も印象的な領域の1つが
  • 7:32 - 7:35
    機械学習の領域です
  • 7:35 - 7:39
    機械学習とは 人口知能に含まれ
  • 7:39 - 7:42
    コンピュータ・サイエンスの1つです
  • 7:42 - 7:43
    その概念は コンピュータに
  • 7:43 - 7:46
    何をするかを教える代わりに
  • 7:46 - 7:48
    単純に問題となるデータを投げると
  • 7:48 - 7:51
    コンピュータが独自に解明してくれるのです
  • 7:51 - 7:53
    その起源を辿ると
  • 7:53 - 7:57
    分かりやすいでしょう
  • 7:57 - 7:59
    1950年代 アーサー・サミュエルという
  • 7:59 - 8:03
    IBMのコンピュータ科学者は
    チェッカーが好きでした
  • 8:03 - 8:04
    コンピュータ・プログラムを書き
  • 8:04 - 8:07
    彼はコンピュータと対戦しました
  • 8:07 - 8:10
    彼は対戦して 勝ちました
  • 8:10 - 8:12
    彼は対戦して 勝ちました
  • 8:12 - 8:15
    彼は対戦して 勝ちました
  • 8:15 - 8:17
    コンピュータが正式なルールしか
  • 8:17 - 8:19
    知らなかったからです
  • 8:19 - 8:21
    アーサー・サミュエルは
    すごいことを知っていました
  • 8:21 - 8:26
    彼は 戦略を知っていました
  • 8:26 - 8:28
    彼はサブプログラムを作成して
  • 8:28 - 8:30
    バックグラウンドで走らせました
  • 8:30 - 8:32
    サブプログラムは 一手ごとに
  • 8:32 - 8:34
    その盤面の配置から
  • 8:34 - 8:37
    勝つ確率と負ける確率を
  • 8:37 - 8:40
    記録したのです
  • 8:40 - 8:43
    彼はコンピュータと対戦して 勝ちました
  • 8:43 - 8:45
    彼はコンピュータと対戦して 勝ちました
  • 8:45 - 8:49
    彼はコンピュータと対戦して 勝ちました
  • 8:49 - 8:51
    そして アーサー・サミュエルは
  • 8:51 - 8:54
    コンピュータ自体が
    ゲームをするようにしました
  • 8:54 - 8:57
    コンピュータは独自にゲームをし
    より多くのデータを集めました
  • 8:57 - 9:01
    より多くのデータを集めると
    予測の精度も上がります
  • 9:01 - 9:03
    そしてアーサー・サミュエルは
  • 9:03 - 9:06
    コンピュータの所へ戻り
    対戦して 負けました
  • 9:06 - 9:08
    彼は対戦して 負けました
  • 9:08 - 9:10
    彼は対戦して 負けました
  • 9:10 - 9:13
    アーサー・サミュエルは
    教えたタスクで
  • 9:13 - 9:19
    彼の能力を凌ぐ
    コンピュータを作りあげました
  • 9:19 - 9:21
    機械学習という発想は
  • 9:21 - 9:25
    どこにでもあります
  • 9:25 - 9:28
    自動運転車はどのように
    作られたと思いますか?
  • 9:28 - 9:31
    ソフトウェアに
    全道路法規を記入すると
  • 9:31 - 9:34
    より豊かな社会なのでしょうか?
  • 9:34 - 9:36
    いいえ  記憶装置は安価?
    いいえ
  • 9:36 - 9:40
    アルゴリズムがより速い? いいえ
    プロセッサがより良い? いいえ
  • 9:40 - 9:43
    それらはすべて重要ですが
    それが理由ではありません
  • 9:43 - 9:46
    問題の性質を変えているからです
  • 9:46 - 9:48
    私たちの言わんとすることを-
  • 9:48 - 9:50
    例えば
    「自動車の周辺には多くの情報があり
  • 9:50 - 9:53
    皆さんは それを理解しています
  • 9:53 - 9:54
    信号機についても理解しています
  • 9:54 - 9:56
    信号機は赤で青ではないので
  • 9:56 - 9:57
    停止する必要があり
  • 9:57 - 9:59
    前進できません」ということを
  • 9:59 - 10:01
    コンピュータに明確に
  • 10:01 - 10:03
    説明しようと試みていた
  • 10:03 - 10:06
    問題の性質を変えてしまいました
  • 10:06 - 10:08
    機械学習は 私たちが
  • 10:08 - 10:10
    ネット上で行う多くの事の
    根底となっています
  • 10:10 - 10:12
    例えば 検索エンジン
  • 10:12 - 10:16
    Amazonのパーソナライズ・アルゴリズム
  • 10:16 - 10:18
    自動翻訳
  • 10:18 - 10:22
    音声認識などです
  • 10:22 - 10:25
    最近 研究者は生検や
  • 10:25 - 10:28
    ガンの生検について
  • 10:28 - 10:31
    研究しており
  • 10:31 - 10:33
    細胞が実際ガンに冒されているか
  • 10:33 - 10:36
    どうかを調べるために
  • 10:36 - 10:40
    データや生存率を使って
  • 10:40 - 10:43
    コンピュータに
    特定させようとしています
  • 10:43 - 10:45
    案の定 データを入力すると
  • 10:45 - 10:47
    機会学習のアルゴリズム経由で
  • 10:47 - 10:49
    コンピュータは12個の兆候を
  • 10:49 - 10:51
    特定することで
  • 10:51 - 10:54
    乳ガン細胞の生検結果はガンであると
  • 10:54 - 10:57
    ビタリと予測します
  • 10:57 - 11:00
    問題は 医学文献が
  • 11:00 - 11:03
    9個しか兆候を知らなかったことです
  • 11:03 - 11:04
    特性のうち 3個は
  • 11:04 - 11:07
    探す必要がないものでしたが
  • 11:07 - 11:13
    コンピュータは見つけました
  • 11:13 - 11:19
    さて ビックデータにも負の側面があります
  • 11:19 - 11:21
    私たちの暮らしを向上させますが
  • 11:21 - 11:24
    意識しなければならない
    問題もあります
  • 11:24 - 11:26
    最初の問題は
  • 11:26 - 11:29
    『マイノリティ・リポート』のように
  • 11:29 - 11:33
    警察が目的のためにビックデータを使って
  • 11:33 - 11:35
    予測に基づいて
    罰するかもしれないということです
  • 11:35 - 11:38
    さて 予測警備とか
  • 11:38 - 11:40
    アルゴリズム的犯罪学
    という用語です
  • 11:40 - 11:42
    例えば 過去の犯罪がどこで起こったか
  • 11:42 - 11:44
    というデータがたくさんあると
  • 11:44 - 11:47
    パトロールすべき所が分かる
    という考え方です
  • 11:47 - 11:49
    その通りですが もちろん問題もあります
  • 11:49 - 11:53
    場所のデータだけで止まらず
  • 11:53 - 11:56
    個人レベルにまで下りていってしまうことです
  • 11:56 - 11:59
    個人の高校の成績証明書のデータを
  • 11:59 - 12:01
    使うのはどうでしょうか?
  • 12:01 - 12:02
    失業しているのかどうか
  • 12:02 - 12:04
    信用情報
    ネットサーフィンの行動パターン
  • 12:04 - 12:06
    夜更かしするのかどうか などを
  • 12:06 - 12:08
    使うかもしれません
  • 12:08 - 12:11
    Fitbit による生化学情報を得れば
  • 12:11 - 12:15
    使用者が積極的な考え方をしていることさえ分かります
  • 12:15 - 12:17
    私たちの行動を予測し得る
  • 12:17 - 12:19
    アルゴリズムがあり
  • 12:19 - 12:20
    実際に私たちが行動する前に
  • 12:20 - 12:23
    責任を負うことになるかもしれません
  • 12:23 - 12:25
    スモールデータの時代では
  • 12:25 - 12:28
    プライバシーが中心的な課題でしたが
  • 12:28 - 12:30
    ビックデータの時代では
  • 12:30 - 12:34
    課題は 自由意思や道徳基準の選択
  • 12:34 - 12:38
    人間の決断力や行為主体性などを
  • 12:38 - 12:41
    保護することです
  • 12:43 - 12:45
    ビックデータに職を奪われるという
  • 12:45 - 12:48
    別の問題もあります
  • 12:48 - 12:52
    ビックデータやアルゴリズムは
  • 12:52 - 12:55
    20世紀に 工場の自動化や
  • 12:55 - 12:57
    組立ラインが
  • 12:57 - 12:59
    ブルーカラーに対抗したように
  • 12:59 - 13:01
    21世紀には
    ホワイトカラーや専門職に
  • 13:01 - 13:04
    対抗することになるでしょう
  • 13:04 - 13:06
    顕微鏡を使って
  • 13:06 - 13:08
    ガン生検を調べて
  • 13:08 - 13:09
    ガンであるかどうかを決める
  • 13:09 - 13:12
    検査技師について考えてみましょう
  • 13:12 - 13:14
    その検査技師は大学教育を受けました
  • 13:14 - 13:15
    不動産物件を買ったり
  • 13:15 - 13:17
    投票したり
  • 13:17 - 13:21
    社会への出資者でもあります
  • 13:21 - 13:22
    そして 検査技師の仕事とは
  • 13:22 - 13:24
    同じような専門職の一群と同様に
  • 13:24 - 13:26
    同じような専門職の一群と同様に
  • 13:26 - 13:29
    仕事内容が根本的に変わったり
  • 13:29 - 13:31
    完全に無くなったりします
  • 13:31 - 13:33
    短い一時的な混乱の後
  • 13:33 - 13:36
    長年に渡って
    テクノロジーが仕事を作ってきた
  • 13:36 - 13:39
    ことについて考えてください
  • 13:39 - 13:41
    私たちが暮らす枠組み
  • 13:41 - 13:43
    産業革命-は真実で
  • 13:43 - 13:46
    まさに起こったことです
  • 13:46 - 13:48
    しかし その分析で
    忘れていることがあります
  • 13:48 - 13:50
    それはなくなり  
    二度と戻ってこなかった
  • 13:50 - 13:53
    職種があるということです
  • 13:53 - 13:55
    産業革命は あまり有難くないものでした
  • 13:55 - 13:59
    あなたが馬であれば
  • 13:59 - 14:01
    ですから 注意深く ビックデータを取扱い
  • 14:01 - 14:05
    私たちのニーズ
    非常に人間的なニーズのために
  • 14:05 - 14:08
    調整していく必要があります
  • 14:08 - 14:10
    私たちは この技術の召使ではなく
  • 14:10 - 14:12
    所有者にならなければなりません
  • 14:12 - 14:15
    ビックデータの時代は
    始まったばかりなので
  • 14:15 - 14:18
    正直言って 今集められた全データに
  • 14:18 - 14:22
    私たちは あまりうまく対処できていません
  • 14:22 - 14:25
    国家安全保障局だけの
    問題ではありません
  • 14:25 - 14:28
    企業も多くのデータを集め
    乱用しています
  • 14:28 - 14:32
    うまく使えるようになるには 時間がかかります
  • 14:32 - 14:34
    原始人と火が直面していた課題に
  • 14:34 - 14:36
    ちょっと似ています
  • 14:36 - 14:38
    これはツールですが
  • 14:38 - 14:42
    注意しないと
    私たちを焼いてしまうツールなのです
  • 14:44 - 14:47
    ビックデータは
    生き方や働き方や考え方を
  • 14:47 - 14:50
    変えていくことでしょう
  • 14:50 - 14:52
    私たちのキャリアを管理して
  • 14:52 - 14:55
    満足して希望が持て
    幸福で健康な暮らしに
  • 14:55 - 14:58
    導くことでしょう
  • 14:58 - 15:02
    しかし 過去に
    情報技術でよくあったように
  • 15:02 - 15:04
    物理的なものであるT-
  • 15:04 - 15:06
    技術やハードウェアに
  • 15:06 - 15:08
    目が行きがちになります
  • 15:08 - 15:11
    明確でない部分があるものの
  • 15:11 - 15:12
    いくつかの点において
  • 15:12 - 15:14
    かなり重要である I-
  • 15:14 - 15:18
    情報に再び着目する必要があります
  • 15:18 - 15:21
    世界や私たちの居場所を理解するために
  • 15:21 - 15:24
    時代を超えた冒険の一端として
  • 15:24 - 15:26
    集めた情報から
  • 15:26 - 15:29
    人間性がついに学べるのです
  • 15:29 - 15:34
    そのことがビックデータが
    重大事な理由なのです
  • 15:34 - 15:38
    (拍手)
Title:
ビックデータはより良いデータ
Speaker:
ケネス・ツーケル
Description:

自動運転車は始まったばかりです。ビックデータが牽引する技術やデザインの未来はどうなるのでしょうか?ワクワクする科学的なトークで、ケネス・ツーケルは機械学習や人間の知識などの今後を検証します。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
15:51
Natsuhiko Mizutani approved Japanese subtitles for Big data is better data
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data
Natsuhiko Mizutani edited Japanese subtitles for Big data is better data
Masako Kigami accepted Japanese subtitles for Big data is better data
Masako Kigami edited Japanese subtitles for Big data is better data
Masako Kigami edited Japanese subtitles for Big data is better data
Masako Kigami declined Japanese subtitles for Big data is better data
Show all
  • LC 水谷です。

    レビューの担当は決まっていますので、このタスクは取らないでくださいますよう、ご協力お願いします。

Japanese subtitles

Revisions