WEBVTT 00:00:00.612 --> 00:00:03.484 接下来的一刻钟,我要带大家踏上一段旅程 00:00:03.484 --> 00:00:06.574 这大概是全人类的终极梦想—— 00:00:06.574 --> 00:00:09.208 解读生命的密码! NOTE Paragraph 00:00:09.208 --> 00:00:11.426 我的经历开始于很多很多年以前, 00:00:11.426 --> 00:00:14.219 那时我遇到了第一台3D打印机。 00:00:14.219 --> 00:00:16.572 3D打印真是个非常赞的概念 00:00:16.572 --> 00:00:18.110 它需要三个要素: 00:00:18.110 --> 00:00:22.176 少量的信息,一些原材料,再加上点能量 NOTE Paragraph 00:00:22.176 --> 00:00:25.838 就能制造出以前从没存在过的任何东西。 00:00:25.838 --> 00:00:28.077 当时我正在研究物理学 00:00:28.077 --> 00:00:31.917 有天我回到家,突然意识到我家里就有台3D打印机 NOTE Paragraph 00:00:31.917 --> 00:00:33.454 而且每人家里都有一台 00:00:33.454 --> 00:00:35.327 就是我妈妈。 NOTE Paragraph 00:00:35.327 --> 00:00:38.121 我妈妈用这三个要素: 00:00:38.145 --> 00:00:39.495 少量的信息—— 00:00:39.495 --> 00:00:42.142 来自我爸和我妈的共同投入 00:00:42.142 --> 00:00:46.299 原材料和能量的共同来源——食物 00:00:46.323 --> 00:00:48.831 历时几个月,制造出了我 00:00:48.855 --> 00:00:50.667 而我以前从来没有存在过! NOTE Paragraph 00:00:50.691 --> 00:00:54.453 除了震惊的发现我妈其实是台3D打印机 00:00:54.477 --> 00:00:59.215 我还立即被另一个部分吸引了 00:00:59.239 --> 00:01:00.956 第一个要素,信息—— 00:01:00.980 --> 00:01:03.231 到底需要多少信息 00:01:03.255 --> 00:01:05.191 才能制造和组装一个人呢? 00:01:05.215 --> 00:01:06.789 是要很多?还是很少? 00:01:06.813 --> 00:01:08.993 要用多少个U盘去储存? NOTE Paragraph 00:01:09.017 --> 00:01:11.641 我最开始是学物理的, 00:01:11.665 --> 00:01:17.262 我想如果把人看成是一个巨型的乐高玩具 00:01:17.286 --> 00:01:21.071 小的乐高模块就像是原子—— 00:01:21.095 --> 00:01:25.748 这里有氢原子,这边有碳原子,上面这有氮原子。 00:01:25.772 --> 00:01:27.343 按照最初的这个设定 00:01:27.367 --> 00:01:31.710 如果能够列出组成人类的所有原子 00:01:31.734 --> 00:01:33.121 应该就能组装出一个人。 00:01:33.145 --> 00:01:35.174 大致计算一下 00:01:35.198 --> 00:01:38.475 得到的结果非常惊人。 00:01:38.499 --> 00:01:41.256 所需要的原子的总数, 00:01:41.304 --> 00:01:46.059 全部存到U盘里面——即便是组装一个小婴儿 00:01:46.059 --> 00:01:50.726 用掉的U盘就能装满整个泰坦尼克号 00:01:50.750 --> 00:01:53.468 再乘以2000倍... 00:01:53.957 --> 00:01:57.358 这就是生命的奇迹。 00:01:57.382 --> 00:02:00.022 现在你再看到一个孕妇 00:02:00.022 --> 00:02:04.294 她正在组装你能见到的最大量的信息 NOTE Paragraph 00:02:04.478 --> 00:02:07.428 不要谈大数据,不要谈以前听说过的数字 00:02:07.452 --> 00:02:10.913 这就是现存的,最最大量的信息。 NOTE Paragraph 00:02:10.913 --> 00:02:12.207 (掌声) 00:02:12.207 --> 00:02:13.494 但是...... NOTE Paragraph 00:02:14.214 --> 00:02:18.858 好在大自然比一个年轻的物理学家要聪明多了。 00:02:18.882 --> 00:02:20.822 在四十亿年的进化过程中 00:02:20.822 --> 00:02:25.187 这些信息被压缩在叫做DNA的小晶体当中。 00:02:25.605 --> 00:02:28.461 在1950年代我们第一次知道了DNA 00:02:28.461 --> 00:02:31.497 那时一位杰出的女科学家Rosalind Franklin 00:02:31.521 --> 00:02:32.910 给DNA拍了张照 00:02:32.934 --> 00:02:35.636 但我们花了超过40年的时间, 00:02:35.636 --> 00:02:39.206 才最终能够从人类细胞中提取这种晶体, 00:02:39.206 --> 00:02:42.848 展开来,第一次去阅读它。 00:02:43.615 --> 00:02:46.906 这个遗传密码由简单的字母表组成, 00:02:46.906 --> 00:02:50.652 四个字母,A,T,C和G (碱基)。 00:02:50.652 --> 00:02:54.192 要组装一个人,需要30亿个字母。 00:02:54.933 --> 00:02:57.602 30亿....30亿是多少? 00:02:57.739 --> 00:03:00.501 光这么说大家可能都没概念, 00:03:00.525 --> 00:03:04.610 我在想怎么表达才能让人更清楚, 00:03:04.634 --> 00:03:07.684 这些遗传密码的数量到底有多庞大。 00:03:07.708 --> 00:03:10.762 所以...我需要点帮助... 00:03:10.786 --> 00:03:14.013 最合适来帮我介绍遗传密码的人, 00:03:14.037 --> 00:03:16.353 就是第一位进行人类基因组测序的人, 00:03:16.353 --> 00:03:17.937 Craig Venter 博士。 NOTE Paragraph 00:03:17.937 --> 00:03:21.918 我们欢迎Craig Venter博士到台上来—— 00:03:21.918 --> 00:03:26.598 (掌声) 00:03:27.952 --> 00:03:30.208 不是他本人—— 00:03:31.448 --> 00:03:36.813 但这是史上第一次,一个人的基因组 00:03:36.813 --> 00:03:41.079 被一页一页,一个字母一个字母的打印在纸上—— 00:03:41.087 --> 00:03:47.253 总共26万2千页,450千克, 00:03:47.253 --> 00:03:49.781 从美国运到加拿大 00:03:49.781 --> 00:03:52.592 感谢Bruno Bowden还有 Lulu.com—— 00:03:52.592 --> 00:03:55.782 他们负责完成了这一切,一项壮举。 NOTE Paragraph 00:03:55.782 --> 00:04:00.336 这些就是生命密码给人最直观的视觉感受。 00:04:00.336 --> 00:04:02.648 现在我可以来玩点有趣的—— 00:04:02.672 --> 00:04:05.219 从这里面挑一段来读一读。 00:04:05.243 --> 00:04:09.868 我来找一本有意思的...比如这一本... 00:04:13.077 --> 00:04:15.611 我放了书签在里面,这书太厚了... 00:04:15.635 --> 00:04:19.362 给你们看一下,生命的密码长什么样子 00:04:20.566 --> 00:04:26.237 成百上千...成千上万...上百万的字母... 00:04:26.675 --> 00:04:29.071 它们当然都有意义。 00:04:29.095 --> 00:04:30.852 让我来找一段特殊的 00:04:31.571 --> 00:04:33.113 读给你们听... NOTE Paragraph 00:04:34.002 --> 00:04:38.008 "AAG, AAT, ATA" NOTE Paragraph 00:04:38.965 --> 00:04:41.302 你们可能觉得像是听天书, 00:04:41.302 --> 00:04:45.097 但这段序列决定了Craig眼睛的颜色。 00:04:45.633 --> 00:04:47.565 在看看另外一段... 00:04:47.589 --> 00:04:49.683 这一段稍微复杂一些... NOTE Paragraph 00:04:50.983 --> 00:04:53.630 第14号染色体,书本编号132... NOTE Paragraph 00:04:53.654 --> 00:04:55.744 (笑声) NOTE Paragraph 00:04:55.768 --> 00:04:57.235 你们想象到了哦... NOTE Paragraph 00:04:57.235 --> 00:05:00.535 (笑声) NOTE Paragraph 00:05:02.857 --> 00:05:07.364 "ATT, CTT, GATT" NOTE Paragraph 00:05:08.329 --> 00:05:10.016 这个人很幸运, 00:05:10.040 --> 00:05:14.557 因为如果他在这个位点上少了2个字母, 00:05:14.581 --> 00:05:16.458 30亿中的2个... 00:05:16.482 --> 00:05:18.501 他就会患上一种非常可怕的疾病—— 00:05:18.525 --> 00:05:20.015 囊肿性纤维化(cystic fibrosis) 00:05:20.015 --> 00:05:23.402 目前没有治疗的方法,这是绝症, 00:05:23.426 --> 00:05:27.181 仅仅是2个字母的区别。 NOTE Paragraph 00:05:27.585 --> 00:05:30.290 这是一部鸿篇巨著, 00:05:31.115 --> 00:05:34.487 它帮助我理解,也能让你们看到 00:05:34.487 --> 00:05:36.649 一件更加另人叹为观止的事。 00:05:36.649 --> 00:05:38.489 我们中的每一个人, 00:05:38.489 --> 00:05:41.337 是什么让我成为我,让你成为你... 00:05:41.337 --> 00:05:44.305 大概只占这其中的500万... 00:05:44.305 --> 00:05:46.422 只有半本书... 00:05:46.422 --> 00:05:50.264 所有剩下的,我们完全一模一样。 00:05:51.008 --> 00:05:55.026 500页,涵盖了你的生命奇迹; 00:05:55.050 --> 00:05:57.581 余下的,我们全都一样。 00:05:57.605 --> 00:06:00.514 讨论人与人差异的时候反思一下, 00:06:00.538 --> 00:06:02.759 我们有这么多共通的东西。 NOTE Paragraph 00:06:03.441 --> 00:06:06.870 现在我已经引起了你们的兴趣, 00:06:06.894 --> 00:06:08.253 下一步就是: 00:06:08.277 --> 00:06:09.428 怎么去读取这些信息? 00:06:09.452 --> 00:06:11.191 怎么理解和运用它们? 00:06:11.409 --> 00:06:15.649 不管你在组装宜家家居上有多在行... 00:06:15.673 --> 00:06:19.236 这么长的说明书...基本是不可能完成的任务 NOTE Paragraph 00:06:20.207 --> 00:06:23.999 2014年,两位著名的TED参加者 00:06:24.023 --> 00:06:26.563 Peter Diamandis 和 Craig Venter 00:06:26.587 --> 00:06:28.514 决定成立一个新公司 00:06:28.538 --> 00:06:29.950 人类长寿公司(Human Longevity, Inc.)诞生了。 00:06:29.974 --> 00:06:31.344 唯一的任务—— 00:06:31.368 --> 00:06:35.949 竭尽全力,穷尽其学的研究这些书目 00:06:36.036 --> 00:06:37.741 只为达到一个目的: 00:06:38.862 --> 00:06:41.663 让个人化医疗成为现实。 00:06:41.687 --> 00:06:45.454 怎么做才能提高人类健康水平 00:06:45.478 --> 00:06:47.761 了解这些书目背后的秘密。 NOTE Paragraph 00:06:48.329 --> 00:06:50.913 一个强大的团队,拥有40位数据分析人员 00:06:50.913 --> 00:06:52.603 还有很多其他的人力支持 00:06:52.603 --> 00:06:53.953 和他们一起工作十分愉快。 00:06:53.977 --> 00:06:56.230 实际上工作流程不很复杂 00:06:56.254 --> 00:06:59.412 我们用一种叫做机器学习的方法。 00:06:59.436 --> 00:07:03.975 一方面,我们有几千个基因组; 00:07:03.999 --> 00:07:07.996 另一边我们建立一个超大的人类信息数据库: 00:07:08.020 --> 00:07:12.316 性状,3D扫描,核磁共振,所有能想到的 00:07:12.340 --> 00:07:15.239 在这两个端点之间, 00:07:15.263 --> 00:07:17.705 有神秘的翻译在进行。 00:07:17.729 --> 00:07:20.201 我们在中间建了一个机器, 00:07:20.801 --> 00:07:23.186 建好之后训练这台机器—— 00:07:23.210 --> 00:07:26.420 实际上不只一台机器,而是很多台... 00:07:26.444 --> 00:07:30.988 试图去理解基因组并把它翻译成性状。 00:07:31.362 --> 00:07:34.702 有哪些字母——它们控制什么性状—— 00:07:34.726 --> 00:07:37.473 这是普适的方法,可以用在所有问题上, 00:07:37.497 --> 00:07:40.490 但用在基因组学上异常的复杂。 00:07:40.514 --> 00:07:43.790 一点一点有了进展,我们再尝试更有挑战性的东西 00:07:43.814 --> 00:07:46.546 最开始我们从常见的特征下手, 00:07:46.570 --> 00:07:49.173 常见特征最容易因为它们太常见了, 00:07:49.197 --> 00:07:50.381 每个人都有。 NOTE Paragraph 00:07:50.405 --> 00:07:52.899 我们开始提出如下问题: 00:07:52.923 --> 00:07:54.303 能预测身高吗? 00:07:54.985 --> 00:07:57.162 能不能根据这些信息预测身高? 00:07:57.186 --> 00:08:00.067 可以,在5厘米的误差范围以内。 00:08:00.178 --> 00:08:03.313 BMI 主要跟生活习惯有关, 00:08:03.337 --> 00:08:07.201 但我们仍然能预测得差不多,8千克上下的误差。 00:08:07.225 --> 00:08:08.596 眼睛的颜色能不能预测? 00:08:08.596 --> 00:08:11.128 可以,80%准确率。 00:08:11.466 --> 00:08:13.324 皮肤颜色? 00:08:13.348 --> 00:08:15.789 可以,80%准确。 00:08:15.813 --> 00:08:18.123 年龄? 00:08:18.123 --> 00:08:21.860 可以,因为很明显基因随着年龄产生变化。 00:08:21.884 --> 00:08:25.166 DNA 会变短,缺失一些片段,插入另外一些片段 00:08:25.190 --> 00:08:27.745 我们读取这些信号,然后建立模型。 NOTE Paragraph 00:08:28.438 --> 00:08:29.913 现在来个有意思点的挑战: 00:08:29.937 --> 00:08:31.666 我们能不能预测人的面孔? 00:08:33.014 --> 00:08:34.292 这个略有点复杂, 00:08:34.316 --> 00:08:37.507 因为有几百万个碱基都对人脸产生影响。 00:08:37.531 --> 00:08:40.160 而且人脸并不是一个构造十分精准的物体。 00:08:40.184 --> 00:08:42.235 所以必须要建立一整个单独的模块, 00:08:42.259 --> 00:08:44.969 给机器去训练和学习人脸是什么, 00:08:44.993 --> 00:08:47.030 再把这个模块压缩整合进去。 00:08:47.054 --> 00:08:49.302 如果你对机器学习有点概念的话, 00:08:49.326 --> 00:08:51.610 就能够想象这个挑战是有多大。 NOTE Paragraph 00:08:52.108 --> 00:08:58.099 现在15年过去了——15年前我们读取第一条序列 00:08:58.123 --> 00:09:01.025 ——今年10月,我们总算有了些进展, 00:09:01.049 --> 00:09:03.504 当时还是很激动人心的。 00:09:03.528 --> 00:09:09.363 这是我们的一个测试对象,一张人的脸—— 00:09:09.571 --> 00:09:13.202 我们要对测试对象的面孔进行简化, 00:09:13.226 --> 00:09:15.196 因为并不是所有的特征都是面孔的一部分—— 00:09:15.220 --> 00:09:19.006 很多特点、缺陷和不对称是生活的痕迹。 00:09:19.030 --> 00:09:22.639 把面孔调整对称之后,跟我们运算的结果比较。 00:09:23.245 --> 00:09:29.063 现在给你们看,我们根据血液样本生成的预测。 NOTE Paragraph 00:09:29.596 --> 00:09:31.120 (掌声) NOTE Paragraph 00:09:31.144 --> 00:09:32.579 等一下—— 00:09:32.603 --> 00:09:37.295 你们的眼睛正在左右两边交替看, 00:09:37.319 --> 00:09:41.249 大脑希望两幅图是一模一样的。 00:09:41.273 --> 00:09:43.719 我其实想请大家反过来, 00:09:43.743 --> 00:09:46.030 找找两幅图的不同点, 00:09:46.054 --> 00:09:47.415 其实非常多。 00:09:47.439 --> 00:09:50.042 性别提供最多的信息, 00:09:50.066 --> 00:09:55.267 接下来是年龄,BMI(体质指数),种族; 00:09:55.291 --> 00:09:59.002 再考虑更多因素会变得更加复杂。 00:09:59.026 --> 00:10:02.276 但是这样的结果,即便有很多不同, 00:10:02.300 --> 00:10:05.895 表示我们已经接近了, 00:10:05.919 --> 00:10:09.637 正在逐渐靠得更近——而且这已经能够鼓舞人心了 NOTE Paragraph 00:10:09.664 --> 00:10:12.367 这是另外一个测试对象, 00:10:12.391 --> 00:10:13.800 这边是预测结果。 00:10:13.824 --> 00:10:18.420 脸小了一点,完整的颅骨结构没预测到。 00:10:18.444 --> 00:10:21.095 但至少像那么回事。 00:10:21.634 --> 00:10:23.858 这是又一个测试对象, 00:10:23.882 --> 00:10:25.325 这是预测结果。 00:10:26.056 --> 00:10:30.732 这些面孔在训练机器的时候是没有用过的, 00:10:30.756 --> 00:10:33.593 就是所谓的随机测试组。 00:10:33.617 --> 00:10:37.357 并且你们不认识这些人,可能说服力不太够。 00:10:37.381 --> 00:10:40.057 我们在学术期刊上发表了这些结果, 00:10:40.081 --> 00:10:41.232 你们可以去读一下。 NOTE Paragraph 00:10:41.256 --> 00:10:43.600 但既然我们在台上,Chris 给我出了个点子, 00:10:43.624 --> 00:10:50.130 我可以挑战一下,尝试预测一个你们都认识的人。 00:10:50.470 --> 00:10:54.895 这里有管血液——你们很难想象 00:10:54.919 --> 00:10:57.799 我们为了带一管血液到这里花了多少工夫... 00:10:57.823 --> 00:11:03.824 这支试管里的血液足够完成一次全基因组测序 00:11:04.049 --> 00:11:06.119 只需要这么多。 00:11:06.528 --> 00:11:09.733 完成了测序,下面我们一条条来看—— 00:11:09.757 --> 00:11:13.736 我们综合了所有已知的信息—— 00:11:13.760 --> 00:11:17.110 从血液测试的结果,我们预测这是一名男性, 00:11:17.134 --> 00:11:18.498 被试是男性。 00:11:18.996 --> 00:11:21.434 预测他身高1米76, 00:11:21.458 --> 00:11:23.850 被试身高1米77。 00:11:23.874 --> 00:11:27.984 预测他体重76kg,被试是82kg; 00:11:28.701 --> 00:11:31.333 我们还预测了年龄,38岁 00:11:31.357 --> 00:11:33.261 被试实际是35岁。 00:11:33.851 --> 00:11:38.015 预测了眼睛的颜色,有点偏深了; 00:11:38.059 --> 00:11:39.614 预测他的皮肤颜色, 00:11:40.026 --> 00:11:41.436 基本上准确。 00:11:41.899 --> 00:11:43.752 这是他的面孔... NOTE Paragraph 00:11:45.172 --> 00:11:48.441 现在到了揭晓的时刻: 00:11:48.465 --> 00:11:50.235 被试对象是这个人。 NOTE Paragraph 00:11:50.259 --> 00:11:52.194 (笑声) NOTE Paragraph 00:11:52.218 --> 00:11:54.276 我是有意拿自己做测试的, 00:11:54.300 --> 00:11:57.992 我属于一个特别又特殊的种族, 00:11:58.016 --> 00:12:00.966 南欧人,意大利人——从来都不符合模型预测。 00:12:00.990 --> 00:12:06.120 而且这一种族在模型里是一个复杂的边界情况。 00:12:06.144 --> 00:12:07.653 但还有另一个重点—— 00:12:07.677 --> 00:12:11.154 最常用的来辨识人的方法, 00:12:11.178 --> 00:12:12.900 不是由基因组编译的。 00:12:12.924 --> 00:12:15.241 是人们的自由意志——我想让自己看起来怎么样, 00:12:15.265 --> 00:12:18.494 虽然我的发型不是我自己决定的,但胡子是的。 00:12:18.518 --> 00:12:22.071 下面我们来看一下—— 00:12:22.095 --> 00:12:24.860 单纯的用photoshop,不用建模—— 00:12:24.884 --> 00:12:26.597 把胡子加上去。 00:12:26.621 --> 00:12:30.093 是不是立即觉得变得很相像了。 NOTE Paragraph 00:12:30.955 --> 00:12:34.394 那么,我们为什么要研究这些? 00:12:35.938 --> 00:12:41.078 当然不是为了预测身高, 00:12:41.102 --> 00:12:44.104 或者是根据血液样本得到一张美照; 00:12:44.390 --> 00:12:48.408 我们研究是因为同样的技术和手段—— 00:12:48.432 --> 00:12:50.952 对基因组的机器学习, 00:12:50.976 --> 00:12:54.113 能帮助我们了解人类自身, 00:12:54.137 --> 00:12:57.003 你的身体怎么运作,身体如何老化, 00:12:57.246 --> 00:13:00.105 疾病是如何产生的, 00:13:00.129 --> 00:13:03.101 癌症是怎么出现和恶化的; 00:13:03.125 --> 00:13:04.908 药物如何起作用—— 00:13:04.932 --> 00:13:07.246 药物是不是能够对你有效。 NOTE Paragraph 00:13:07.633 --> 00:13:09.650 这是一个巨大的挑战, 00:13:09.894 --> 00:13:13.692 而且是一个全球的科学家都面临的挑战 00:13:14.159 --> 00:13:16.381 ——个性化医疗。 00:13:17.125 --> 00:13:20.585 从只能借助统计学方法—— 00:13:20.609 --> 00:13:22.641 每个人都只是沧海一粟—— 00:13:22.665 --> 00:13:24.478 到能够实现有针对性的治疗, 00:13:24.502 --> 00:13:26.687 通过解码这些基因信息, 00:13:26.711 --> 00:13:29.575 我们能够彻底了解每一个人。 00:13:30.260 --> 00:13:33.622 但这是一项异常复杂的挑战, 00:13:33.646 --> 00:13:37.644 因为到目前为止在这么庞大的基因组信息中, 00:13:37.668 --> 00:13:40.310 我们大概只了解2%: 00:13:41.027 --> 00:13:44.680 175本书里的4本... NOTE Paragraph 00:13:46.021 --> 00:13:49.227 当然这不是我今天演讲的主题, 00:13:50.145 --> 00:13:52.743 因为我们会进步,会了解更多—— 00:13:53.378 --> 00:13:56.047 有很多顶尖的人才在从事这项工作。 00:13:57.048 --> 00:14:00.982 预测能力会提升,模型会更准确。 00:14:01.183 --> 00:14:03.041 随着了解的逐渐深入, 00:14:03.065 --> 00:14:07.895 我们需要做的决定会越来越多, 00:14:07.919 --> 00:14:10.940 而且是一些从前没有想象过的决定—— 00:14:10.964 --> 00:14:16.089 关于生,关于死,关于子孙后代... 00:14:17.716 --> 00:14:26.102 所以我们在此的讨论,涉及生命最本质的东西, 00:14:26.118 --> 00:14:32.036 这些改变不只是在科学和技术层面。 00:14:32.426 --> 00:14:35.540 我们必须要有全球性的对话, 00:14:35.540 --> 00:14:40.884 必须要为全人类的未来设想。 00:14:40.884 --> 00:14:45.485 我们需要和创新人才、艺术家、哲学家交流, 00:14:45.485 --> 00:14:46.753 还需要政治家的参与。 00:14:46.777 --> 00:14:51.207 每个人都身在其中,因为这关乎人类的未来。 00:14:51.273 --> 00:14:53.645 不需要惊慌—— 00:14:53.645 --> 00:14:59.136 但必须了解我们现在做出的每一项决定, 00:14:59.160 --> 00:15:02.949 都会彻底改变历史。 NOTE Paragraph 00:15:03.732 --> 00:15:04.892 谢谢。 NOTE Paragraph 00:15:04.916 --> 00:15:15.075 (持久的掌声)