0:00:00.612,0:00:03.484 接下来的一刻钟,我要带大家踏上一段旅程 0:00:03.484,0:00:06.574 这大概是全人类的终极梦想—— 0:00:06.574,0:00:09.208 解读生命的密码! 0:00:09.208,0:00:11.426 我的经历开始于很多很多年以前, 0:00:11.426,0:00:14.219 那时我遇到了第一台3D打印机。 0:00:14.219,0:00:16.572 3D打印真是个非常赞的概念 0:00:16.572,0:00:18.110 它需要三个要素: 0:00:18.110,0:00:22.176 少量的信息,一些原材料,再加上点能量 0:00:22.176,0:00:25.838 就能制造出以前从没存在过的任何东西。 0:00:25.838,0:00:28.077 当时我正在研究物理学 0:00:28.077,0:00:31.917 有天我回到家,突然意识到我家里就有台3D打印机 0:00:31.917,0:00:33.454 而且每人家里都有一台 0:00:33.454,0:00:35.327 就是我妈妈。 0:00:35.327,0:00:38.121 我妈妈用这三个要素: 0:00:38.145,0:00:39.495 少量的信息—— 0:00:39.495,0:00:42.142 来自我爸和我妈的共同投入 0:00:42.142,0:00:46.299 原材料和能量的共同来源——食物 0:00:46.323,0:00:48.831 历时几个月,制造出了我 0:00:48.855,0:00:50.667 而我以前从来没有存在过! 0:00:50.691,0:00:54.453 除了震惊的发现我妈其实是台3D打印机 0:00:54.477,0:00:59.215 我还立即被另一个部分吸引了 0:00:59.239,0:01:00.956 第一个要素,信息—— 0:01:00.980,0:01:03.231 到底需要多少信息 0:01:03.255,0:01:05.191 才能制造和组装一个人呢? 0:01:05.215,0:01:06.789 是要很多?还是很少? 0:01:06.813,0:01:08.993 要用多少个U盘去储存? 0:01:09.017,0:01:11.641 我最开始是学物理的, 0:01:11.665,0:01:17.262 我想如果把人看成是一个巨型的乐高玩具 0:01:17.286,0:01:21.071 小的乐高模块就像是原子—— 0:01:21.095,0:01:25.748 这里有氢原子,这边有碳原子,上面这有氮原子。 0:01:25.772,0:01:27.343 按照最初的这个设定 0:01:27.367,0:01:31.710 如果能够列出组成人类的所有原子 0:01:31.734,0:01:33.121 应该就能组装出一个人。 0:01:33.145,0:01:35.174 大致计算一下 0:01:35.198,0:01:38.475 得到的结果非常惊人。 0:01:38.499,0:01:41.256 所需要的原子的总数, 0:01:41.304,0:01:46.059 全部存到U盘里面——即便是组装一个小婴儿 0:01:46.059,0:01:50.726 用掉的U盘就能装满整个泰坦尼克号 0:01:50.750,0:01:53.468 再乘以2000倍... 0:01:53.957,0:01:57.358 这就是生命的奇迹。 0:01:57.382,0:02:00.022 现在你再看到一个孕妇 0:02:00.022,0:02:04.294 她正在组装你能见到的最大量的信息 0:02:04.478,0:02:07.428 不要谈大数据,不要谈以前听说过的数字 0:02:07.452,0:02:10.913 这就是现存的,最最大量的信息。 0:02:10.913,0:02:12.207 (掌声) 0:02:12.207,0:02:13.494 但是...... 0:02:14.214,0:02:18.858 好在大自然比一个年轻的物理学家要聪明多了。 0:02:18.882,0:02:20.822 在四十亿年的进化过程中 0:02:20.822,0:02:25.187 这些信息被压缩在叫做DNA的小晶体当中。 0:02:25.605,0:02:28.461 在1950年代我们第一次知道了DNA 0:02:28.461,0:02:31.497 那时一位杰出的女科学家Rosalind Franklin 0:02:31.521,0:02:32.910 给DNA拍了张照 0:02:32.934,0:02:35.636 但我们花了超过40年的时间, 0:02:35.636,0:02:39.206 才最终能够从人类细胞中提取这种晶体, 0:02:39.206,0:02:42.848 展开来,第一次去阅读它。 0:02:43.615,0:02:46.906 这个遗传密码由简单的字母表组成, 0:02:46.906,0:02:50.652 四个字母,A,T,C和G (碱基)。 0:02:50.652,0:02:54.192 要组装一个人,需要30亿个字母。 0:02:54.933,0:02:57.602 30亿....30亿是多少? 0:02:57.739,0:03:00.501 光这么说大家可能都没概念, 0:03:00.525,0:03:04.610 我在想怎么表达才能让人更清楚, 0:03:04.634,0:03:07.684 这些遗传密码的数量到底有多庞大。 0:03:07.708,0:03:10.762 所以...我需要点帮助... 0:03:10.786,0:03:14.013 最合适来帮我介绍遗传密码的人, 0:03:14.037,0:03:16.353 就是第一位进行人类基因组测序的人, 0:03:16.353,0:03:17.937 Craig Venter 博士。 0:03:17.937,0:03:21.918 我们欢迎Craig Venter博士到台上来—— 0:03:21.918,0:03:26.598 (掌声) 0:03:27.952,0:03:30.208 不是他本人—— 0:03:31.448,0:03:36.813 但这是史上第一次,一个人的基因组 0:03:36.813,0:03:41.079 被一页一页,一个字母一个字母的打印在纸上—— 0:03:41.087,0:03:47.253 总共26万2千页,450千克, 0:03:47.253,0:03:49.781 从美国运到加拿大 0:03:49.781,0:03:52.592 感谢Bruno Bowden还有 Lulu.com—— 0:03:52.592,0:03:55.782 他们负责完成了这一切,一项壮举。 0:03:55.782,0:04:00.336 这些就是生命密码给人最直观的视觉感受。 0:04:00.336,0:04:02.648 现在我可以来玩点有趣的—— 0:04:02.672,0:04:05.219 从这里面挑一段来读一读。 0:04:05.243,0:04:09.868 我来找一本有意思的...比如这一本... 0:04:13.077,0:04:15.611 我放了书签在里面,这书太厚了... 0:04:15.635,0:04:19.362 给你们看一下,生命的密码长什么样子 0:04:20.566,0:04:26.237 成百上千...成千上万...上百万的字母... 0:04:26.675,0:04:29.071 它们当然都有意义。 0:04:29.095,0:04:30.852 让我来找一段特殊的 0:04:31.571,0:04:33.113 读给你们听... 0:04:34.002,0:04:38.008 "AAG, AAT, ATA" 0:04:38.965,0:04:41.302 你们可能觉得像是听天书, 0:04:41.302,0:04:45.097 但这段序列决定了Craig眼睛的颜色。 0:04:45.633,0:04:47.565 在看看另外一段... 0:04:47.589,0:04:49.683 这一段稍微复杂一些... 0:04:50.983,0:04:53.630 第14号染色体,书本编号132... 0:04:53.654,0:04:55.744 (笑声) 0:04:55.768,0:04:57.235 你们想象到了哦... 0:04:57.235,0:05:00.535 (笑声) 0:05:02.857,0:05:07.364 "ATT, CTT, GATT" 0:05:08.329,0:05:10.016 这个人很幸运, 0:05:10.040,0:05:14.557 因为如果他在这个位点上少了2个字母, 0:05:14.581,0:05:16.458 30亿中的2个... 0:05:16.482,0:05:18.501 他就会患上一种非常可怕的疾病—— 0:05:18.525,0:05:20.015 囊肿性纤维化(cystic fibrosis) 0:05:20.015,0:05:23.402 目前没有治疗的方法,这是绝症, 0:05:23.426,0:05:27.181 仅仅是2个字母的区别。 0:05:27.585,0:05:30.290 这是一部鸿篇巨著, 0:05:31.115,0:05:34.487 它帮助我理解,也能让你们看到 0:05:34.487,0:05:36.649 一件更加另人叹为观止的事。 0:05:36.649,0:05:38.489 我们中的每一个人, 0:05:38.489,0:05:41.337 是什么让我成为我,让你成为你... 0:05:41.337,0:05:44.305 大概只占这其中的500万... 0:05:44.305,0:05:46.422 只有半本书... 0:05:46.422,0:05:50.264 所有剩下的,我们完全一模一样。 0:05:51.008,0:05:55.026 500页,涵盖了你的生命奇迹; 0:05:55.050,0:05:57.581 余下的,我们全都一样。 0:05:57.605,0:06:00.514 讨论人与人差异的时候反思一下, 0:06:00.538,0:06:02.759 我们有这么多共通的东西。 0:06:03.441,0:06:06.870 现在我已经引起了你们的兴趣, 0:06:06.894,0:06:08.253 下一步就是: 0:06:08.277,0:06:09.428 怎么去读取这些信息? 0:06:09.452,0:06:11.191 怎么理解和运用它们? 0:06:11.409,0:06:15.649 不管你在组装宜家家居上有多在行... 0:06:15.673,0:06:19.236 这么长的说明书...基本是不可能完成的任务 0:06:20.207,0:06:23.999 2014年,两位著名的TED参加者 0:06:24.023,0:06:26.563 Peter Diamandis 和 Craig Venter 0:06:26.587,0:06:28.514 决定成立一个新公司 0:06:28.538,0:06:29.950 人类长寿公司(Human Longevity, Inc.)诞生了。 0:06:29.974,0:06:31.344 唯一的任务—— 0:06:31.368,0:06:35.949 竭尽全力,穷尽其学的研究这些书目 0:06:36.036,0:06:37.741 只为达到一个目的: 0:06:38.862,0:06:41.663 让个人化医疗成为现实。 0:06:41.687,0:06:45.454 怎么做才能提高人类健康水平 0:06:45.478,0:06:47.761 了解这些书目背后的秘密。 0:06:48.329,0:06:50.913 一个强大的团队,拥有40位数据分析人员 0:06:50.913,0:06:52.603 还有很多其他的人力支持 0:06:52.603,0:06:53.953 和他们一起工作十分愉快。 0:06:53.977,0:06:56.230 实际上工作流程不很复杂 0:06:56.254,0:06:59.412 我们用一种叫做机器学习的方法。 0:06:59.436,0:07:03.975 一方面,我们有几千个基因组; 0:07:03.999,0:07:07.996 另一边我们建立一个超大的人类信息数据库: 0:07:08.020,0:07:12.316 性状,3D扫描,核磁共振,所有能想到的 0:07:12.340,0:07:15.239 在这两个端点之间, 0:07:15.263,0:07:17.705 有神秘的翻译在进行。 0:07:17.729,0:07:20.201 我们在中间建了一个机器, 0:07:20.801,0:07:23.186 建好之后训练这台机器—— 0:07:23.210,0:07:26.420 实际上不只一台机器,而是很多台... 0:07:26.444,0:07:30.988 试图去理解基因组并把它翻译成性状。 0:07:31.362,0:07:34.702 有哪些字母——它们控制什么性状—— 0:07:34.726,0:07:37.473 这是普适的方法,可以用在所有问题上, 0:07:37.497,0:07:40.490 但用在基因组学上异常的复杂。 0:07:40.514,0:07:43.790 一点一点有了进展,我们再尝试更有挑战性的东西 0:07:43.814,0:07:46.546 最开始我们从常见的特征下手, 0:07:46.570,0:07:49.173 常见特征最容易因为它们太常见了, 0:07:49.197,0:07:50.381 每个人都有。 0:07:50.405,0:07:52.899 我们开始提出如下问题: 0:07:52.923,0:07:54.303 能预测身高吗? 0:07:54.985,0:07:57.162 能不能根据这些信息预测身高? 0:07:57.186,0:08:00.067 可以,在5厘米的误差范围以内。 0:08:00.178,0:08:03.313 BMI 主要跟生活习惯有关, 0:08:03.337,0:08:07.201 但我们仍然能预测得差不多,8千克上下的误差。 0:08:07.225,0:08:08.596 眼睛的颜色能不能预测? 0:08:08.596,0:08:11.128 可以,80%准确率。 0:08:11.466,0:08:13.324 皮肤颜色? 0:08:13.348,0:08:15.789 可以,80%准确。 0:08:15.813,0:08:18.123 年龄? 0:08:18.123,0:08:21.860 可以,因为很明显基因随着年龄产生变化。 0:08:21.884,0:08:25.166 DNA 会变短,缺失一些片段,插入另外一些片段 0:08:25.190,0:08:27.745 我们读取这些信号,然后建立模型。 0:08:28.438,0:08:29.913 现在来个有意思点的挑战: 0:08:29.937,0:08:31.666 我们能不能预测人的面孔? 0:08:33.014,0:08:34.292 这个略有点复杂, 0:08:34.316,0:08:37.507 因为有几百万个碱基都对人脸产生影响。 0:08:37.531,0:08:40.160 而且人脸并不是一个构造十分精准的物体。 0:08:40.184,0:08:42.235 所以必须要建立一整个单独的模块, 0:08:42.259,0:08:44.969 给机器去训练和学习人脸是什么, 0:08:44.993,0:08:47.030 再把这个模块压缩整合进去。 0:08:47.054,0:08:49.302 如果你对机器学习有点概念的话, 0:08:49.326,0:08:51.610 就能够想象这个挑战是有多大。 0:08:52.108,0:08:58.099 现在15年过去了——15年前我们读取第一条序列 0:08:58.123,0:09:01.025 ——今年10月,我们总算有了些进展, 0:09:01.049,0:09:03.504 当时还是很激动人心的。 0:09:03.528,0:09:09.363 这是我们的一个测试对象,一张人的脸—— 0:09:09.571,0:09:13.202 我们要对测试对象的面孔进行简化, 0:09:13.226,0:09:15.196 因为并不是所有的特征都是面孔的一部分—— 0:09:15.220,0:09:19.006 很多特点、缺陷和不对称是生活的痕迹。 0:09:19.030,0:09:22.639 把面孔调整对称之后,跟我们运算的结果比较。 0:09:23.245,0:09:29.063 现在给你们看,我们根据血液样本生成的预测。 0:09:29.596,0:09:31.120 (掌声) 0:09:31.144,0:09:32.579 等一下—— 0:09:32.603,0:09:37.295 你们的眼睛正在左右两边交替看, 0:09:37.319,0:09:41.249 大脑希望两幅图是一模一样的。 0:09:41.273,0:09:43.719 我其实想请大家反过来, 0:09:43.743,0:09:46.030 找找两幅图的不同点, 0:09:46.054,0:09:47.415 其实非常多。 0:09:47.439,0:09:50.042 性别提供最多的信息, 0:09:50.066,0:09:55.267 接下来是年龄,BMI(体质指数),种族; 0:09:55.291,0:09:59.002 再考虑更多因素会变得更加复杂。 0:09:59.026,0:10:02.276 但是这样的结果,即便有很多不同, 0:10:02.300,0:10:05.895 表示我们已经接近了, 0:10:05.919,0:10:09.637 正在逐渐靠得更近——而且这已经能够鼓舞人心了 0:10:09.664,0:10:12.367 这是另外一个测试对象, 0:10:12.391,0:10:13.800 这边是预测结果。 0:10:13.824,0:10:18.420 脸小了一点,完整的颅骨结构没预测到。 0:10:18.444,0:10:21.095 但至少像那么回事。 0:10:21.634,0:10:23.858 这是又一个测试对象, 0:10:23.882,0:10:25.325 这是预测结果。 0:10:26.056,0:10:30.732 这些面孔在训练机器的时候是没有用过的, 0:10:30.756,0:10:33.593 就是所谓的随机测试组。 0:10:33.617,0:10:37.357 并且你们不认识这些人,可能说服力不太够。 0:10:37.381,0:10:40.057 我们在学术期刊上发表了这些结果, 0:10:40.081,0:10:41.232 你们可以去读一下。 0:10:41.256,0:10:43.600 但既然我们在台上,Chris 给我出了个点子, 0:10:43.624,0:10:50.130 我可以挑战一下,尝试预测一个你们都认识的人。 0:10:50.470,0:10:54.895 这里有管血液——你们很难想象 0:10:54.919,0:10:57.799 我们为了带一管血液到这里花了多少工夫... 0:10:57.823,0:11:03.824 这支试管里的血液足够完成一次全基因组测序 0:11:04.049,0:11:06.119 只需要这么多。 0:11:06.528,0:11:09.733 完成了测序,下面我们一条条来看—— 0:11:09.757,0:11:13.736 我们综合了所有已知的信息—— 0:11:13.760,0:11:17.110 从血液测试的结果,我们预测这是一名男性, 0:11:17.134,0:11:18.498 被试是男性。 0:11:18.996,0:11:21.434 预测他身高1米76, 0:11:21.458,0:11:23.850 被试身高1米77。 0:11:23.874,0:11:27.984 预测他体重76kg,被试是82kg; 0:11:28.701,0:11:31.333 我们还预测了年龄,38岁 0:11:31.357,0:11:33.261 被试实际是35岁。 0:11:33.851,0:11:38.015 预测了眼睛的颜色,有点偏深了; 0:11:38.059,0:11:39.614 预测他的皮肤颜色, 0:11:40.026,0:11:41.436 基本上准确。 0:11:41.899,0:11:43.752 这是他的面孔... 0:11:45.172,0:11:48.441 现在到了揭晓的时刻: 0:11:48.465,0:11:50.235 被试对象是这个人。 0:11:50.259,0:11:52.194 (笑声) 0:11:52.218,0:11:54.276 我是有意拿自己做测试的, 0:11:54.300,0:11:57.992 我属于一个特别又特殊的种族, 0:11:58.016,0:12:00.966 南欧人,意大利人——从来都不符合模型预测。 0:12:00.990,0:12:06.120 而且这一种族在模型里是一个复杂的边界情况。 0:12:06.144,0:12:07.653 但还有另一个重点—— 0:12:07.677,0:12:11.154 最常用的来辨识人的方法, 0:12:11.178,0:12:12.900 不是由基因组编译的。 0:12:12.924,0:12:15.241 是人们的自由意志——我想让自己看起来怎么样, 0:12:15.265,0:12:18.494 虽然我的发型不是我自己决定的,但胡子是的。 0:12:18.518,0:12:22.071 下面我们来看一下—— 0:12:22.095,0:12:24.860 单纯的用photoshop,不用建模—— 0:12:24.884,0:12:26.597 把胡子加上去。 0:12:26.621,0:12:30.093 是不是立即觉得变得很相像了。 0:12:30.955,0:12:34.394 那么,我们为什么要研究这些? 0:12:35.938,0:12:41.078 当然不是为了预测身高, 0:12:41.102,0:12:44.104 或者是根据血液样本得到一张美照; 0:12:44.390,0:12:48.408 我们研究是因为同样的技术和手段—— 0:12:48.432,0:12:50.952 对基因组的机器学习, 0:12:50.976,0:12:54.113 能帮助我们了解人类自身, 0:12:54.137,0:12:57.003 你的身体怎么运作,身体如何老化, 0:12:57.246,0:13:00.105 疾病是如何产生的, 0:13:00.129,0:13:03.101 癌症是怎么出现和恶化的; 0:13:03.125,0:13:04.908 药物如何起作用—— 0:13:04.932,0:13:07.246 药物是不是能够对你有效。 0:13:07.633,0:13:09.650 这是一个巨大的挑战, 0:13:09.894,0:13:13.692 而且是一个全球的科学家都面临的挑战 0:13:14.159,0:13:16.381 ——个性化医疗。 0:13:17.125,0:13:20.585 从只能借助统计学方法—— 0:13:20.609,0:13:22.641 每个人都只是沧海一粟—— 0:13:22.665,0:13:24.478 到能够实现有针对性的治疗, 0:13:24.502,0:13:26.687 通过解码这些基因信息, 0:13:26.711,0:13:29.575 我们能够彻底了解每一个人。 0:13:30.260,0:13:33.622 但这是一项异常复杂的挑战, 0:13:33.646,0:13:37.644 因为到目前为止在这么庞大的基因组信息中, 0:13:37.668,0:13:40.310 我们大概只了解2%: 0:13:41.027,0:13:44.680 175本书里的4本... 0:13:46.021,0:13:49.227 当然这不是我今天演讲的主题, 0:13:50.145,0:13:52.743 因为我们会进步,会了解更多—— 0:13:53.378,0:13:56.047 有很多顶尖的人才在从事这项工作。 0:13:57.048,0:14:00.982 预测能力会提升,模型会更准确。 0:14:01.183,0:14:03.041 随着了解的逐渐深入, 0:14:03.065,0:14:07.895 我们需要做的决定会越来越多, 0:14:07.919,0:14:10.940 而且是一些从前没有想象过的决定—— 0:14:10.964,0:14:16.089 关于生,关于死,关于子孙后代... 0:14:17.716,0:14:26.102 所以我们在此的讨论,涉及生命最本质的东西, 0:14:26.118,0:14:32.036 这些改变不只是在科学和技术层面。 0:14:32.426,0:14:35.540 我们必须要有全球性的对话, 0:14:35.540,0:14:40.884 必须要为全人类的未来设想。 0:14:40.884,0:14:45.485 我们需要和创新人才、艺术家、哲学家交流, 0:14:45.485,0:14:46.753 还需要政治家的参与。 0:14:46.777,0:14:51.207 每个人都身在其中,因为这关乎人类的未来。 0:14:51.273,0:14:53.645 不需要惊慌—— 0:14:53.645,0:14:59.136 但必须了解我们现在做出的每一项决定, 0:14:59.160,0:15:02.949 都会彻底改变历史。 0:15:03.732,0:15:04.892 谢谢。 0:15:04.916,0:15:15.075 (持久的掌声)