これからの16分で
人類最大の夢への旅に
お連れします
生命の暗号を
理解するということです
私にとって ことの始まりは
何年も前
はじめて3Dプリンタに
出会ったときです
魅惑的なコンセプトだと
思いました
3Dプリンタは
3つの要素を必要とします
少しばかりの情報と
原料と エネルギーです
そして それまで存在しなかった物を
何でも作れてしまうんです
私は物理をやっていましたが
家に帰ってきて
3Dプリンタならずっと前から
知っていたことに気付きました
誰もが知っています
それは母親です
(笑)
母は3つの要素を
取り込みます
少しばかりの情報 —
今の場合 父と母が提供します
原料とエネルギーは同じもの
食べ物から得ます
そして数ヶ月の後に
私が製造されます
それ以前に
私は存在しませんでした
自分が3Dプリンタであることを知った
母の衝撃はさておき
私はすぐに
最初の要素である
情報に強く惹かれました
人間を組み立てるために
どれほどの情報が
必要なのか?
多いのか? 少ないのか?
USBメモリ何本分になるのか?
私は当初
物理を勉強していたので
人間を巨大なレゴブロックとして
近似してみました
個々のブロックは
小さな原子です
ここに水素があり ここに炭素があり
ここに窒素がある
最初の近似としては
人間の体を構成する個々の原子を
すべて特定できれば
それで作り上げる
ことができます
計算してみると
驚くような結果になります
私がUSBメモリに
収めようとしているファイル
小さな赤ん坊を組み立てるための
原子のデータは
タイタニック号いっぱいの
USBメモリの
2千倍になるんです
これこそ 生命の奇跡です
今後 妊婦を見かけたら
その人は 皆さんが
出会うであろう
最大の情報を
組み上げているのです
ビッグデータなんて
目じゃありません
これは存在する
最大の情報なのです
(笑)
幸い自然界は
この駆け出しの物理学者よりずっと賢く
40億年の間に
この情報を
DNAと呼ばれる小さな結晶に
詰め込みました
私たちがこれに出会ったのは
1950年
素晴らしい女性科学者
ロザリンド・フランクリンが
写真に収めた時です
しかし人類が
ヒトの細胞の中をつついて
この結晶を取り出し
広げて 読むようになるまでには
40年以上かかりました
その暗号は4種の単純な
アルファベットで書かれています
A - T - C - G
そして人間を作るには
30億文字必要です
30億というのは
どんな数でしょう?
見当が付かないような数字です
この暗号がどれほど巨大かを
どうしたら説明できるか
考えました
そして 人の助けを
借りることにしました
この暗号を説明する
手助けとして
ゲノム解読の先駆者 クレイグ・
ヴェンター以上の人はいないでしょう
ご紹介します
クレイグ・ヴェンター博士です
(拍手)
その人物そのものではなく
歴史上初めて
特定の人間のゲノムを
本に印刷したものです
1ページ1ページ
1文字1文字
26万2千ページの情報です
450キログラムあります
アメリカからカナダに運んできました
ブルーノ・ボウデンと ベンチャーのLulu.comが
すべてやってくれました
大した偉業です
これが生命の暗号を
視覚化したものです
今や ちょっと面白い
ことができます
中を覗いて
読むことができるんです
面白そうな本を見てみましょう
たとえばこれ
付箋を付けておきました
すごく大きな本なので
生命の暗号がどんなものか
お見せしましょう
何千 何万 何億という
文字があります
ここには何か意味があるはずです
特定の部分を見てみます
読んで差し上げましょう
(笑)
AAG AAT ATA
黙字のように聞こえますが
この配列はクレイグの目の色を
指定しています
別の巻を見てみましょう
こちらは もう少し複雑です
染色体14 第132巻
(笑)
お察しの通り
(笑)
ATT CTT GATT
この人は幸運です
この部分の2文字が
欠けただけで —
30億文字中の たった2文字が
欠けているだけで
恐ろしい病気を
運命付けられてしまいます
嚢胞性線維症です
治す方法も救う方法も
わかっていません
それがたった2文字の違いで
引き起こされるのです
素晴らしい本 強力な本
この本は ある極めて驚くべきことを
教えてくれます
お見せしましょう
どんな人であれ 私を私
皆さんを皆さんたらしめているのは
このうちの たったの5百万字
1冊の半分たらずで
残りの部分は
まったく同一なんです
500ページが 皆さんという
生命の奇跡を作り出し
残りはみんなと共通です
人は皆違うと思った時
そのことを考えてみてください
私たちが共有している量を
少し興味を持って
いただけたと思うので
次の疑問ですが
どうやってこれを読むのか?
どうすれば
意味を取れるのか?
どんなにスウェーデン家具の組み立てが
得意だろうと
この組み立て手順書は
一生かかっても解読できないでしょう
(笑)
そのため 2014年に
著名な2人のTED講演者
ピーター・ディアマンディスと
クレイグ・ヴェンターその人が
新会社を作ることにしました
ヒューマン・ロンジェビティ社の
ミッションは1つ
この本について
学べることをすべて学び
試せることをすべて試して
個別化医療の夢の実現を目指し
より良い健康のために
何をしなければならないか
この本の秘密は何なのか
解明するということです
40名のデータ科学者をはじめ
様々な人の素晴らしいチームで
共に働けるのは喜びです
概念的には
とてもシンプルです
機械学習という
技術を使います
一方には何千という
ゲノムがあります
他方には人間に関する
最大級のデータベースがあります
表現型 3Dスキャン NMR
思いつく限りあらゆるものが入っています
この二者の間には
未知の変換過程があります
私たちは中間に機械を構築し
トレーニングしています
1台だけでなく
沢山の機械があって
ゲノムから表現型への変換を
理解しようと試みています
この文字列は何であり
何をするのか?
これは何にでも使える
アプローチですが
ゲノミクスにおいては
特に複雑です
少しずつ拡大して
違う挑戦へと手を広げてきました
最初はありふれた形質から
始めました
ありふれた形質がいいのは
ありふれていて
誰でも持っていることです
そして こんなことを
問い始めました
この本を読んで
身長は予測できるか?
実際可能です
5センチの精度で
予測できます
体重は生活習慣に
大きく依存していますが
それでも おおよその予測はできます
8キロの精度です
目の色は
予測できるか?
できます
80パーセントの正確さです
肌の色は予測できるか?
できます
80パーセントの正確さです
年齢は予測できるか?
できます 生きている間に
塩基配列は変化していくからです
短くなり 欠落や挿入が起きます
いろいろな特徴から
モデルを作れます
興味深い課題は
人の顔は予想できるか
ということです
これはちょっと難しいです
人の顔を決める情報は
何百万という塩基配列に分散しているし
人の顔というのは
あまり綺麗に定義できません
それを学ぶために
まるまる階層を構築し
機械に顔とは何か教え
埋め込み圧縮する
必要がありました
機械学習に馴染みがある人なら
難しさが分かると思います
私たちが最初の配列を読んで以来
15年が過ぎましたが
去年10月に有意な結果を
目にするようになりました
とても感情的に高揚する瞬間でした
ご覧いただいているのは
実験室に来た被験者です
この顔を使います
被験者の顔のデータを取り
複雑さを減らします
顔のすべてが遺伝子で
決まるわけではなく
様々な特徴や欠陥や非対称性が
生きている中で生じるからです
顔を対称化し
アルゴリズムにかけます
次にご覧いただくのが
血液から予測した顔です
(拍手)
ちょっとお待ちを
この瞬間 皆さんの目は
左の顔と右の顔を見比べ
脳が 顔を同一視しようと
してしまいます
だから1つ課題を
出しましょう
違いを探してください
たくさんあります
最大の特徴は
性別から来ます
それから年齢 BMI 人種
そこから先は
ずっと複雑になります
2つの顔に
違いはあるにしても
概ね合っているのが
お分かりいただけると思います
どんどん近くなっていて
感動すら覚えます
これは別の被験者です
こちらが予測です
実際の顔は若干小さく
頭蓋の形が完全に合ってはいませんが
大きくは外していません
これが被験者の顔
これが予測した顔
マシンのトレーニングの時点では
これらの顔は見せていません
ホールドアウト・セットと呼ばれる
評価用データです
これだけでは信じない
かもしれませんが
すべて科学論文として
発表しているので
お読みいただけます
クリスが私にステージでやる
挑戦を持ちかけました
真剣勝負をして
皆さんが認識できる顔の
予測をすべきだろうと
このバイアル瓶の中の血液には —
この血液を手に入れる苦労は
想像もつかないでしょうが
このバイアル瓶の中の血液には
全ゲノム塩基配列同定のために
十分な情報があります
これだけでいいのです
この塩基配列を調べたので
皆さんと一緒に見ていきましょう
分かったことをすべて
積み上げていきます
この血液から男性と
予想しましたが
被験者は男性です
身長は176cmと
予想しましたが
実際は177cmです
予想は76キロで
実際は82キロ
予想年齢は38歳
実際は35歳
予想した目の色は —
少し濃すぎました
肌の色の予想は
大体合っています
これが予想した顔です
種明かしの瞬間です
これが被験者の顔です
(笑)
意図的にやりました
私はごく特殊な妙な民族です
南欧はイタリア人で
モデルには決して合いません
この人種は我々のモデルでは
複雑な特殊ケースに当たります
しかし もう1つあります
人を見分ける時に
よく使われるものの1つは
遺伝子に書かれていません
どういうルックスになるか
自由意志によるところがあります
ここでは髪型ではなく
髭です
髭を移してみましょう
モデリングではなく
単なる画像加工です
被験者の髭をコピーします
すると ずっと
似た感じになります
なぜ こんなことを
しているのか?
身長を予測するためでも
血液から綺麗な写真を
作るためでもありません
同じ技術 同じアプローチを使った
遺伝暗号の機械学習が
体について理解する
助けになるからです
体はどのように働くのか
体はどう老化するのか
病気はどのように
発生するのか
ガンはどのように
成長するのか
薬はどう働くのか
自分の体には効くのか
これは大きな挑戦です
世界中の何千という研究者が
追いかけている挑戦で
「個別化医療」と呼ばれています
人が海の中の点にすぎない
統計的アプローチから
この遺伝子の本を
すべて読んで
その人のことを
正確に理解してあたる
個別化アプローチへと
進むことができます
とても複雑な課題です
というのも すべての本のうち
現在のところ ほんの2パーセントしか
分かっていないからです
175冊中の4冊です
これは私の話の範囲外です
私たちは学んでいくでしょう
このテーマについては
世界最高の頭脳が挑んでいるからです
予測はより良く
モデルはより正確に
なっていきます
学べば学ぶほど
以前には直面する
必要のなかった決断に
直面することになるでしょう
生や
死や
子育てについて
私たちは生命の仕組みの
ごく内的な詳細に触れようとしています
この革命は
科学や技術の領域に
留まる話ではありません
世界的な対話が
必要になるでしょう
人類として築きつつある未来について
考え始めなければなりません
創作者 芸術家
哲学者 政治家とも
話す必要があります
全員にかかわることです
人類の未来の話なんですから
恐れずに — ただし
理解する必要があります
私たちが近い将来にする決断が
人類史の進む方向を
永久に変えることになるのだと
ありがとうございました
(拍手)