Return to Video

コンピューターはこうしてクリエイティブになる

  • 0:01 - 0:04
    私はGoogleで 機械知能に取り組む
    開発チームを率いています
  • 0:04 - 0:07
    機械知能とは コンピューターや
    いろいろな種類の端末に
  • 0:07 - 0:11
    人間の脳のような機能を
    持たせるための技術です
  • 0:11 - 0:14
    仕事上 私たちは
    人間の脳の働きや
  • 0:14 - 0:16
    神経科学に関心があり
  • 0:16 - 0:20
    脳が未だコンピューターより
    はるかに優れている領域に
  • 0:20 - 0:24
    特に興味を持っています
  • 0:25 - 0:29
    そのような領域として
    古くから認識されていたのは 知覚です
  • 0:29 - 0:32
    知覚とは 外界に存在するもの―
  • 0:32 - 0:33
    つまり 音や映像のようなものを
  • 0:34 - 0:36
    心の中の概念に 変えるプロセスです
  • 0:36 - 0:39
    これは 人間の脳に
    本質的に備わっている能力ですが
  • 0:39 - 0:41
    コンピューターにも 有用なものです
  • 0:41 - 0:45
    例えば 私の部署で作っている
    機械知覚アルゴリズムは
  • 0:45 - 0:47
    Googleフォトの画像を
  • 0:47 - 0:51
    写っているものに基づいて
    検索できるようにする技術です
  • 0:52 - 0:55
    一方 知覚と対照的なものに
    創造性があります
  • 0:55 - 0:58
    創造性とは 概念を
    何かの形で世に生み出すことです
  • 0:58 - 1:02
    この1年の我々の
    機械知覚への取り組みの中で
  • 1:02 - 1:06
    コンピューターによる創造
    「機械芸術」の世界との
  • 1:06 - 1:09
    意外な接点を見ました
  • 1:09 - 1:12
    ミケランジェロには
    先見の明があり
  • 1:12 - 1:16
    この「知覚と創造の二重の関係」を
    見ていたのだと思います
  • 1:16 - 1:18
    彼は 有名な言葉を残しています
  • 1:18 - 1:22
    「どんな石の塊にも 彫像が隠れており
  • 1:22 - 1:26
    彫刻家の仕事は
    その像を見出すことである」
  • 1:26 - 1:29
    ミケランジェロが気づいていたのは
  • 1:29 - 1:32
    我々は 知覚によって
    創造しているということで
  • 1:32 - 1:35
    知覚自体が 想像する行為であり
  • 1:36 - 1:39
    創造的なものだということです
  • 1:39 - 1:43
    人体の中で 思考 知覚 想像を行う器官は
  • 1:43 - 1:45
    言うまでもなく 脳です
  • 1:45 - 1:48
    そこで 脳科学の歩みについて
  • 1:48 - 1:50
    簡単に振り返りましょう
  • 1:50 - 1:53
    心臓や腸などとは違い
  • 1:53 - 1:56
    脳については 外観からは
    分からないことが多いからです
  • 1:56 - 1:58
    少なくとも 肉眼で見た場合には
  • 1:58 - 2:01
    脳に注目した 昔の解剖学者たちは
  • 2:01 - 2:04
    脳の外部構造を見て
    しゃれた名前を付けました
  • 2:04 - 2:07
    例えば「海馬」
    これは タツノオトシゴのことです
  • 2:07 - 2:09
    しかし そのように付けられた名前は
  • 2:09 - 2:12
    その働きについて
    ほとんど何も示していません
  • 2:13 - 2:16
    脳内で起きていることについて
    本当の知見を初めて得たのは
  • 2:16 - 2:20
    19世紀の 偉大な
    スペイン人神経解剖学者
  • 2:20 - 2:22
    サンティアゴ・ラモン・イ・カハールだと
  • 2:22 - 2:24
    私は思います
  • 2:24 - 2:28
    彼は顕微鏡と
    選択的に染める特殊な染料を使って
  • 2:28 - 2:32
    脳内の個々の細胞を
    非常にはっきりした形で
  • 2:32 - 2:34
    見られるようにし
  • 2:34 - 2:37
    そこから 形態学的理解が
    進むようになりました
  • 2:38 - 2:41
    19世紀に 彼が描いた
    神経のイメージは
  • 2:41 - 2:42
    このようなものでした
  • 2:42 - 2:44
    これは 鳥の脳です
  • 2:44 - 2:47
    このように 驚くほど
    多様な細胞があります
  • 2:47 - 2:51
    当時は 細胞説自体が
    ごく新しいものでした
  • 2:51 - 2:52
    この構造 この細胞には
  • 2:52 - 2:54
    樹状突起があります
  • 2:54 - 2:57
    この突起は
    非常に長く伸びうるのですが
  • 2:57 - 2:59
    これも 当時は目新しいことでした
  • 2:59 - 3:02
    樹状突起は 配線のようにも見えます
  • 3:02 - 3:05
    このことは 19世紀の一部の人には
    一目瞭然だったかもしれません
  • 3:05 - 3:10
    電気による革命が進み
    配線が普及し始めた時代だったからです
  • 3:10 - 3:11
    しかし いろいろな面で
  • 3:11 - 3:15
    ラモン・イ・カハールが提示した
    微細解剖学的な図は
  • 3:15 - 3:17
    ある意味 今なお越えられていません
  • 3:17 - 3:18
    1世紀を経た今も 我々は
  • 3:18 - 3:22
    ラモン・イ・カハールが始めた仕事を
    完成させようと試み続けています
  • 3:22 - 3:24
    これは 我々が提携している
  • 3:24 - 3:28
    マックス・プランク神経科学研究所による
    生のデータです
  • 3:28 - 3:29
    彼らが行ったのは
  • 3:29 - 3:34
    脳の組織の小さな断片を
    可視化するということです
  • 3:34 - 3:38
    この試料全体の大きさは
    1立方ミリメートルで
  • 3:38 - 3:40
    今 お見せしているのは
    そのごく一部です
  • 3:40 - 3:43
    左の棒の長さが
    1ミクロンです
  • 3:43 - 3:45
    ご覧の構造は ミトコンドリアで
  • 3:45 - 3:47
    大きさとしては
    バクテリアと同程度です
  • 3:47 - 3:49
    ごく小さな組織片の
  • 3:49 - 3:52
    連続的断面を映しています
  • 3:52 - 3:54
    比較のために言うと
  • 3:54 - 3:58
    髪の毛の直径は
    平均約100ミクロンです
  • 3:58 - 4:01
    ご覧のものは
    髪の毛の直径よりも
  • 4:01 - 4:02
    はるかに小さいんです
  • 4:02 - 4:06
    このような 電子顕微鏡による
    連続断面像から
  • 4:06 - 4:11
    ニューロンの3次元像を
    再構成できます
  • 4:11 - 4:14
    ここでは ラモン・イ・カハールが
    したのと同じように
  • 4:14 - 4:16
    ごく一部のニューロンだけを示しています
  • 4:16 - 4:18
    そうしなければ
    あまりに密集していて
  • 4:18 - 4:20
    わけが分からなくなってしまいます
  • 4:20 - 4:22
    ニューロンは 互いに結合し合った —
  • 4:22 - 4:24
    非常に複雑な構造をしているためです
  • 4:25 - 4:28
    ラモン・イ・カハールは
    時代の先を行っていて
  • 4:28 - 4:30
    脳に対する理解は
  • 4:30 - 4:33
    その後の数十年で
    ゆっくりと進んでいきました
  • 4:33 - 4:36
    やがて ニューロンは
    電気を使っていることが発見され
  • 4:36 - 4:38
    第二次世界大戦の頃には
  • 4:38 - 4:41
    仕組みの解明のため
    生きたニューロンを使って
  • 4:41 - 4:45
    電気的な実験ができるくらいに
    技術が進歩しました
  • 4:45 - 4:49
    ほぼ同時期に
    コンピューターも発明されましたが
  • 4:49 - 4:52
    これは 人間の脳をモデル化するという
    アイデアに基づいていました
  • 4:52 - 4:55
    コンピュータ科学の父の1人である
    アラン・チューリングは
  • 4:55 - 4:58
    これを「知的機械」と呼びました
  • 4:58 - 5:01
    そしてウォーレン・マカロックと
    ウォルター・ピッツが
  • 5:01 - 5:04
    ラモン・イ・カハールの
    視覚野の図に 目を向けました
  • 5:04 - 5:06
    今 ここでお見せしているものです
  • 5:06 - 5:10
    これは 目から受け取ったイメージを
    処理する皮質です
  • 5:10 - 5:14
    2人には これが
    回路図のように見えました
  • 5:14 - 5:18
    マカロックとピッツの回路図の
    細かい部分には
  • 5:18 - 5:20
    間違いが たくさんありますが
  • 5:20 - 5:21
    その基本的な概念
  • 5:21 - 5:25
    つまり 視覚野は一連の
    計算要素のように働き
  • 5:25 - 5:28
    段階的に情報を
    受け渡していくという概念は
  • 5:28 - 5:29
    本質的に正しいものでした
  • 5:29 - 5:32
    ここで 少し時間を取って
  • 5:32 - 5:36
    視覚情報処理が どんなことをするのか
    説明しようと思います
  • 5:36 - 5:39
    知覚の基本的な仕事は
  • 5:39 - 5:43
    このような画像を見て 識別をすることです
  • 5:43 - 5:44
    「あれは鳥だ」と
  • 5:44 - 5:47
    人間の脳は
    この処理を簡単にやってのけますが
  • 5:47 - 5:51
    コンピューターにとっては難問で
  • 5:51 - 5:54
    数年前までは ほとんど不可能でした
  • 5:54 - 5:56
    従来の コンピューターの構造は
  • 5:56 - 5:59
    こういうタスクには不向きなんです
  • 5:59 - 6:02
    鳥のピクセル画像と
  • 6:02 - 6:06
    「鳥」という言葉の間にあるのは
  • 6:06 - 6:08
    ニューラルネットワークの中の
  • 6:08 - 6:10
    結合しあった 一連のニューロンです
  • 6:10 - 6:11
    図示すると こうなります
  • 6:11 - 6:15
    このニューラルネットワークは
    視覚野内に生物学的なものとして存在し
  • 6:15 - 6:17
    また最近では コンピューター上に
  • 6:17 - 6:20
    モデル化できるようになりました
  • 6:20 - 6:22
    どのように動作するか お見せしましょう
  • 6:22 - 6:26
    画像は ニューロンの
    第1層を示しています
  • 6:26 - 6:28
    これは目で言うと
  • 6:28 - 6:30
    網膜内のニューロンに相当します
  • 6:30 - 6:31
    情報は
  • 6:31 - 6:35
    ニューロンの1つの層から別の層へと
    次々と受け渡され
  • 6:35 - 6:38
    ニューロン同士は 重みの異なる
    シナプスでつながれています
  • 6:38 - 6:39
    このネットワークの動作は
  • 6:39 - 6:42
    シナプス結合の
    強さによって変わり
  • 6:42 - 6:46
    それが ネットワークの
    計算的特徴を決めます
  • 6:46 - 6:47
    そうして最終的には
  • 6:47 - 6:50
    少数のニューロン群が反応し
  • 6:50 - 6:52
    「鳥」だと認識されます
  • 6:52 - 6:55
    ここで3つの対象物 ―
  • 6:55 - 7:00
    入力されたピクセル
    ニューラルネットワーク内のシナプス
  • 7:00 - 7:01
    出力である「鳥」
  • 7:01 - 7:05
    この3つを
    「x」「w」「y」と置きましょう
  • 7:05 - 7:07
    xは 画像中のピクセルなので
  • 7:07 - 7:09
    100万個くらいあり
  • 7:09 - 7:11
    wは数十億から数兆個
  • 7:11 - 7:15
    ニューラルネット内の全シナプスの
    結合強度を表します
  • 7:15 - 7:16
    このネットワークからの
    出力である
  • 7:16 - 7:18
    yの個数はごくわずかです
  • 7:18 - 7:20
    「bird」は たった4文字ですよね?
  • 7:21 - 7:25
    ここで 次の簡単な式が
    成立すると仮定します
  • 7:25 - 7:27
    x “×” w =y
  • 7:27 - 7:29
    「かける」に引用符を付けたのは
  • 7:29 - 7:31
    この場面で実行される演算は
  • 7:31 - 7:35
    実際には 非常に複雑な
    数学的な計算だからです
  • 7:35 - 7:36
    1つの方程式があって
  • 7:36 - 7:38
    3個の変数があります
  • 7:38 - 7:42
    ご存じのように
    3つの変数のうち 2つの値が分かれば
  • 7:42 - 7:45
    残りの変数の値も求められます
  • 7:45 - 7:47
    ここでの問題は
  • 7:47 - 7:49
    鳥の画像から
  • 7:49 - 7:53
    それが鳥だと推論する
    ということでした
  • 7:53 - 7:56
    つまり y が未知で
    xとwが分かっています
  • 7:56 - 7:59
    画像 x と ネットワーク w は
    与えられています
  • 7:59 - 8:02
    ご覧のように
    比較的単純な問題です
  • 8:02 - 8:05
    2と3を掛け合わせれば
    答えは出ます
  • 8:05 - 8:08
    我々が最近構築した
    ニューラルネットワークでは
  • 8:08 - 8:10
    まさに これを実行しています
  • 8:10 - 8:12
    携帯電話上で
    リアルタイムで処理をしています
  • 8:13 - 8:16
    こんなに すごいことができるのも
  • 8:16 - 8:19
    現在の携帯電話では 1秒当たり
    数十億~数兆の命令を
  • 8:19 - 8:21
    実行できるからです
  • 8:21 - 8:22
    ご覧いただいているのは
  • 8:22 - 8:26
    携帯電話で次々に出す
    鳥の画像に対し
  • 8:26 - 8:29
    ニューラルネットが
    「これは鳥だ」と言うだけでなく
  • 8:29 - 8:32
    鳥の種類まで
    特定しているところです
  • 8:33 - 8:35
    この式で言うと
  • 8:35 - 8:39
    xとwが既知で yが未知の場合です
  • 8:39 - 8:41
    ここで 難しい部分を はしょっていました
  • 8:41 - 8:45
    wは そもそも
    どうやって求めたらいいのか
  • 8:45 - 8:47
    脳がやっているようなことですが
  • 8:47 - 8:49
    人間は どうやって学ぶのでしょう?
  • 8:49 - 8:53
    この学習プロセス
    wを解くという問題は
  • 8:53 - 8:55
    変数が数値の 簡単な式であれば
  • 8:55 - 8:57
    どうすればよいか分かります
  • 8:57 - 9:00
    6=2×w を解くには
  • 9:00 - 9:03
    両辺を2で割れば済みます
  • 9:04 - 9:07
    ここで問題になるのは
    この演算子です
  • 9:07 - 9:08
    今 割り算をしましたが
  • 9:08 - 9:11
    それは割り算が
    掛け算の逆演算だからです
  • 9:11 - 9:13
    しかし 先ほど言ったとおり
  • 9:13 - 9:15
    掛け算と見るのには ウソがあり
  • 9:15 - 9:18
    実際には とても複雑な非線形演算で
  • 9:18 - 9:20
    逆演算が存在しません
  • 9:20 - 9:23
    だから 除算演算子を使わずに
  • 9:23 - 9:25
    これを解かなければなりません
  • 9:25 - 9:28
    でも そのやり方はそう難しくありません
  • 9:28 - 9:30
    代数学的な ちょっとしたワザを使うんです
  • 9:30 - 9:33
    まず「6」を式の右辺に移します
  • 9:33 - 9:36
    依然として乗算を使っています
  • 9:36 - 9:39
    そして 左辺の「0」を誤差と考えます
  • 9:39 - 9:42
    つまり wを正しく求められれば
  • 9:42 - 9:43
    誤差の値は0になります
  • 9:43 - 9:45
    wの値が 正しくない場合
  • 9:45 - 9:47
    誤差は0より大きくなります
  • 9:47 - 9:50
    誤差の値が最小になるよう
    推量をします
  • 9:50 - 9:53
    こういう処理なら
    コンピューターは大得意です
  • 9:53 - 9:54
    最初の推測値として
  • 9:54 - 9:55
    w=0では どうでしょう?
  • 9:55 - 9:57
    誤差は6です
  • 9:57 - 9:58
    w=1の場合 誤差は4
  • 9:58 - 10:01
    マルコ・ポーロ式鬼ごっこのような調子で
  • 10:01 - 10:04
    誤差を0に近づけていき
  • 10:04 - 10:07
    そうやってwの近似値を求めます
  • 10:07 - 10:11
    通常 正解そのものにたどり着くことは
    ありませんが
  • 10:11 - 10:16
    数十回繰り返すと w=2.999のような
    十分近い値が求まります
  • 10:16 - 10:18
    これが 学習プロセスです
  • 10:18 - 10:21
    ここで改めて 思い出してください
  • 10:21 - 10:25
    私たちがやっていたのは
    既知の xとyに対し
  • 10:25 - 10:29
    反復的プロセスによって
    真ん中の wの値を求めるということです
  • 10:29 - 10:32
    これは人間がものごとを学習するのと
    同じやり方です
  • 10:32 - 10:35
    赤ちゃんのとき
    たくさんの絵を見せられ
  • 10:35 - 10:38
    「これは鳥 これは鳥じゃない」と
    教わります
  • 10:38 - 10:40
    この学習を反復することで
  • 10:40 - 10:43
    wを解いて
    神経結合を作り出すんです
  • 10:43 - 10:47
    xと w に対して
    y を求めるというのは
  • 10:47 - 10:49
    高速な日常的「知覚」です
  • 10:49 - 10:51
    w を求める方法を
    先ほど考えましたが
  • 10:51 - 10:53
    これは「学習」であり
    ずっと難しいことです
  • 10:53 - 10:55
    なぜなら 多くの訓練例を使って
  • 10:55 - 10:57
    誤差を最小化する必要が
    あるからです
  • 10:57 - 11:00
    1年ほど前 私のチームの
    アレックス・モードヴィンツェフは
  • 11:00 - 11:04
    既知の w と y に対して
    x の値を求めるとどうなるか
  • 11:04 - 11:06
    実験してみることにしました
  • 11:06 - 11:07
    言い換えると
  • 11:07 - 11:10
    鳥に対してトレーニングされた
    ニューラルネットが
  • 11:10 - 11:12
    鳥だと答えを出す
  • 11:12 - 11:15
    「鳥の絵」はどんなものか
    ということです
  • 11:15 - 11:20
    鳥を認識するネットワークを訓練するのと
    同じ誤差最小化の手順が
  • 11:20 - 11:24
    この場合も使えることが
    分かりました
  • 11:24 - 11:27
    結果として出てきたのは —
  • 11:30 - 11:32
    一種の鳥の絵です
  • 11:33 - 11:36
    これは「鳥」を認識するように訓練した
    ニューラルネットワークによって
  • 11:36 - 11:38
    生成された鳥のイメージです
  • 11:38 - 11:41
    yの値を求めるかわりに
  • 11:41 - 11:44
    反復によって xを求めたんです
  • 11:44 - 11:46
    別の面白い例を 紹介しましょう
  • 11:46 - 11:49
    私のグループのマイク・タイカが
    作ってくれたものです
  • 11:49 - 11:51
    マイクは「動物のパレード」と呼んでました
  • 11:51 - 11:54
    ウィリアム・ケントリッジの作品を
    思わせます
  • 11:54 - 11:57
    ケントリッジは
    スケッチを描いては消し
  • 11:57 - 11:58
    また 描いては消しして
  • 11:58 - 12:00
    アニメーションを作り出します
  • 12:00 - 12:01
    この場合
  • 12:01 - 12:04
    マイクは 動物種の集合の中で
    yの値を変えていて
  • 12:04 - 12:07
    動物の種類を識別するよう
    設計された
  • 12:07 - 12:08
    ネットワークを使っています
  • 12:08 - 12:13
    エッシャーのだまし絵のように
    動物が別の動物へと変形していきます
  • 12:14 - 12:18
    次は マイクとアレックスが
    協力して作ったもので
  • 12:18 - 12:22
    y を二次元空間に
    収めようと試みていて
  • 12:22 - 12:25
    ネットワークが認識するもの
    全てを含む空間の
  • 12:25 - 12:27
    地図を作っています
  • 12:27 - 12:29
    この画像合成・画像生成を
  • 12:29 - 12:32
    yの値を変化させながら
    画面全体にわたって行うことで
  • 12:32 - 12:34
    このような地図が できあがります
  • 12:34 - 12:37
    ネットワークが認識するものすべての
    視覚地図です
  • 12:37 - 12:41
    いろんな動物が現れます
    あそこにアルマジロがいますね
  • 12:41 - 12:43
    他のネットワークでも
    同様の処理が実行できます
  • 12:43 - 12:46
    これは 人物の顔を見分ける―
  • 12:46 - 12:49
    顔認識のために設計された
    ネットワークです
  • 12:49 - 12:52
    ここで yは「私」です
  • 12:52 - 12:53
    私の顔をパラメータにして
  • 12:53 - 12:55
    このネットワークを使い
    xの値を求めると
  • 12:55 - 12:58
    かなり ぶっ飛んだ
    画像が作られます
  • 12:58 - 13:02
    キュービズムというか シュールというか
    サイケな感じの 私の絵です
  • 13:02 - 13:04
    複数の視点を
    1つにまとめています
  • 13:04 - 13:06
    このように 複数の視点が
    1つになっている理由は
  • 13:06 - 13:10
    このネットワークが あいまいさを除去する
    設計になっているためです
  • 13:10 - 13:13
    人の顔の見え方は
    見る角度によって変わり
  • 13:13 - 13:16
    光の当たり方によっても
    変わります
  • 13:16 - 13:18
    だから このような再構成を行う場合
  • 13:18 - 13:22
    ガイドとなる画像や
    統計値がないと
  • 13:22 - 13:24
    視点に関して
  • 13:24 - 13:25
    混乱が生じるんです
  • 13:25 - 13:27
    あいまいさがあるためです
  • 13:28 - 13:32
    ここでは 私の顔を再構成する
    最適化プロセスで
  • 13:32 - 13:36
    アレックスの顔の映像を
    ガイドとして使っています
  • 13:36 - 13:39
    完璧とは言えず
  • 13:39 - 13:41
    この最適化プロセスを
    改善するために
  • 13:41 - 13:43
    やることは まだまだありますが
  • 13:43 - 13:46
    とりあえず
    顔をガイドとして使うことで
  • 13:46 - 13:49
    統一感のあるイメージが
    できるようになります
  • 13:49 - 13:50
    別に 真っ白なキャンバスや
  • 13:50 - 13:53
    ホワイトノイズから
    始める必要はありません
  • 13:53 - 13:54
    xを求めるという場合
  • 13:54 - 13:58
    xとして 何か別の画像から
    出発してもいいんです
  • 13:58 - 14:00
    それを説明するデモを
    お見せしましょう
  • 14:00 - 14:05
    これは 人工物であれ 動物であれ
  • 14:05 - 14:08
    あらゆるものを分類するよう
    設計されたネットワークです
  • 14:08 - 14:10
    この雲の写真からスタートします
  • 14:10 - 14:12
    これを最適化すると
  • 14:12 - 14:17
    このネットワークは
    「雲の中に何が見えるか」を探します
  • 14:17 - 14:19
    画面をじっと見ているうちに
  • 14:19 - 14:22
    雲の中に いろんなものが
    見えてきます
  • 14:23 - 14:26
    これに顔認識ネットワークを使うと
    幻覚っぽい映像になります
  • 14:26 - 14:28
    ちょっと頭がおかしくなりそうな
  • 14:28 - 14:29
    (笑)
  • 14:30 - 14:33
    マイクはまた
  • 14:33 - 14:37
    この雲の画像で 別の実験もしています
  • 14:37 - 14:41
    幻視とズームを繰り返していくと
  • 14:41 - 14:42
    こんな感じに
  • 14:42 - 14:46
    フーガのような 自由連想のような映像を
  • 14:46 - 14:49
    このネットワークから 作り出せます
  • 14:49 - 14:52
    ネットワークが
    自分の尻尾を食べています
  • 14:52 - 14:55
    それそれのイメージが
    次のイメージのベースになっています
  • 14:55 - 14:56
    「次に 何が見える?
  • 14:56 - 14:59
    次に 何が見える?
    次に 何が見える?」という風に
  • 14:59 - 15:02
    ちなみに
    このデモを 最初に披露したのは
  • 15:02 - 15:08
    シアトルで開かれた
    「高等教育」と題した講演会で
  • 15:08 - 15:10
    マリファナが合法化された
    直後のことでした
  • 15:10 - 15:13
    (笑)
  • 15:15 - 15:16
    最後にまとめとして
  • 15:16 - 15:21
    この技術は お見せしたようなものに
    限定されないことを指摘しておきます
  • 15:21 - 15:25
    今回は視覚的にちょっと面白い例を
    紹介しましたが
  • 15:25 - 15:27
    別に 視覚のテクノロジー
    というわけではないんです
  • 15:27 - 15:31
    我々の協力者でアーティストの
    ロス・グッドウィンによる実験ですが
  • 15:31 - 15:33
    彼がカメラで写真を撮ると
  • 15:33 - 15:37
    その写真の中身を元に
    背負っているコンピューターが
  • 15:37 - 15:39
    ニューラルネットワークで
    詩を書きます
  • 15:39 - 15:41
    詩のニューラルネットワークは
  • 15:41 - 15:44
    20世紀の詩の 膨大なコーパスで
    トレーニングされています
  • 15:44 - 15:46
    そうやって書かれた詩は
  • 15:46 - 15:48
    どうして そう悪くないと思います
  • 15:48 - 15:49
    (笑)
  • 15:49 - 15:50
    まとめになりますが
  • 15:50 - 15:53
    ミケランジェロは正しかったと
  • 15:53 - 15:54
    つくづく思います
  • 15:54 - 15:58
    知覚と創造性とは
    密接に結びついているんです
  • 15:58 - 16:00
    先ほどお見せした
    ニューラルネットワークは
  • 16:00 - 16:03
    世の中の さまざまなものを区別するよう
  • 16:03 - 16:05
    学習させたものですが
  • 16:05 - 16:08
    処理を逆転させて
    新しいものを作り出すこともできます
  • 16:08 - 16:10
    そこで気づかされるのは
  • 16:10 - 16:12
    石の塊の中に 彫刻を見ることができるのは
  • 16:12 - 16:15
    ミケランジェロだけではないということ
  • 16:15 - 16:19
    どんな生物であれ どんな存在
    地球外生命体だろうと
  • 16:19 - 16:22
    知覚を行う能力のあるものは
  • 16:22 - 16:23
    創造もできるということです
  • 16:23 - 16:27
    どちらも同じメカニズムで
    できることだからです
  • 16:27 - 16:29
    そして 知覚と創造は
  • 16:29 - 16:32
    決して 人間に限られたものではありません
  • 16:32 - 16:36
    私たちは そのようなことができる
    コンピューターモデルを作り始めています
  • 16:36 - 16:40
    驚くことではありません
    脳もまた計算機械だからです
  • 16:40 - 16:41
    最後に
  • 16:41 - 16:46
    コンピューティングは
    知的機械の設計から始まり
  • 16:46 - 16:49
    機械はいかに知的になれるか
    という発想から
  • 16:49 - 16:51
    モデル化されましたが
  • 16:51 - 16:54
    今や我々は 昔の先駆者が
    夢見た世界を
  • 16:54 - 16:56
    ようやく実現させつつあります
  • 16:56 - 16:58
    チューリングやフォン・ノイマンの夢
  • 16:58 - 17:00
    マカロックやピッツの夢を
  • 17:00 - 17:03
    コンピューティングは 会計処理だとか
  • 17:03 - 17:06
    キャンディークラッシュで
    遊ぶだけのものではありません
  • 17:06 - 17:10
    コンピューターはそもそも
    人間の脳をモデルとしたものでしたが
  • 17:10 - 17:12
    それは 人間の知性を
    よりよく理解するためにも
  • 17:12 - 17:15
    人間の知性を拡張するためにも
    使えるのです
  • 17:15 - 17:16
    ありがとうございました
  • 17:16 - 17:22
    (拍手)
Title:
コンピューターはこうしてクリエイティブになる
Speaker:
ブレイス・アグエラ・ヤルカス
Description:

我々はアートと創造性の新時代の入り口におり、その主人公は人間ではない—そう語るGoogle社の主席サイエンティストのブレイス・アグエラ・ヤルカスは、深層学習を行うニューラルネットワークで機械知覚と分散学習を実現する取り組みを進めています。画像認識用にトレーニングしたニューラルネットワークを逆に使って非常に斬新な映像を生み出すという、目を奪われるようなデモを彼は披露してくれます。コンピューターが作り出すその映像は、幻想的ですばらしく、既成のジャンル分けには当てはまらないコラージュ作品です。そればかりか、コンピューターは今や詩まで作れるといいます。彼はこう言います。「知覚と創造性の間には非常に密接な結び付きがあり、知覚行為を行う能力を有するものは創造力も兼ね備えている」

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34

Japanese subtitles

Revisions