WEBVTT 00:00:01.114 --> 00:00:08.606 过去的几个世纪,显微镜改变了世界。 00:00:09.036 --> 00:00:14.252 它揭示了肉眼难以看到的 00:00:14.252 --> 00:00:17.158 物体,生命和结构的微观世界。 00:00:17.158 --> 00:00:20.177 它对科技进步做出了巨大的贡献。 00:00:20.177 --> 00:00:23.404 今天我要向您介绍一类新型显微镜, 00:00:23.404 --> 00:00:25.982 观察变化的显微镜。 00:00:25.982 --> 00:00:28.884 它不是通常所说的光学显微镜 00:00:28.884 --> 00:00:30.881 可以放大微小物体, 00:00:30.881 --> 00:00:35.257 它利用视频摄像机和图像处理 00:00:35.257 --> 00:00:40.513 来揭示物体和人的微小的颜色和运动变化, 00:00:40.513 --> 00:00:44.355 这些变化是光凭肉眼难以分辨的。 00:00:44.355 --> 00:00:48.475 它可以让我们以全新角度看世界。 00:00:48.475 --> 00:00:50.055 我所说的颜色变化是什么意思呢? 00:00:51.635 --> 00:00:53.217 举例来说,我们的皮肤,当血液流动时 00:00:53.217 --> 00:00:55.214 皮肤表面的颜色有微弱变化。 00:00:55.214 --> 00:00:57.611 变化十分微小, 00:00:57.611 --> 00:00:59.674 小到当你观察坐在 00:00:59.674 --> 00:01:01.925 你身边的人的时候, 00:01:01.925 --> 00:01:05.500 你不能看到他脸上皮肤的颜色变化。 00:01:05.500 --> 00:01:09.860 我们看看史蒂夫的这段视频,看上去好像是静态图片, 00:01:09.860 --> 00:01:13.720 但是一旦我们通过我们新的、特别的显微镜看这段视频, 00:01:13.720 --> 00:01:16.320 我们会看到完全不同的影像。 00:01:16.320 --> 00:01:20.250 您在这里看到的是史蒂夫皮肤颜色微小变化 00:01:20.250 --> 00:01:24.686 放大100倍之后的肉眼可见的效果。 00:01:24.686 --> 00:01:27.953 我们可以明确的看到人体的脉搏。 00:01:27.953 --> 00:01:31.180 我们可以看到史蒂夫心脏跳动得多快, 00:01:31.180 --> 00:01:36.535 我们还可以明确地看到血液是如何流经史蒂夫脸部的。 00:01:36.544 --> 00:01:39.175 我们不仅可以看到脉搏, 00:01:39.175 --> 00:01:42.646 还可以推测心跳速率, 00:01:42.646 --> 00:01:44.439 得到我们心跳速率。 00:01:44.439 --> 00:01:48.892 我们可以通过常用摄像机,不需碰触病人就可以实现。 00:01:48.892 --> 00:01:54.509 这里您可以看到我们提取的新生儿宝宝的脉搏和心跳速率 00:01:54.509 --> 00:01:57.390 这是从常规数码单反相机视频中提取的, 00:01:57.390 --> 00:01:59.206 我们测出的心率 00:01:59.206 --> 00:02:04.017 和医院监测器测出的一样精确。 00:02:04.017 --> 00:02:06.659 而且我们的软件甚至不需要我们自己专门拍摄的视频。 00:02:06.659 --> 00:02:09.654 我们可以对其他视频作同样处理。 00:02:09.654 --> 00:02:13.555 这是我截取《蝙蝠侠:侠影之谜》(Batman Begins)的一小段片断 00:02:13.555 --> 00:02:15.459 显示演员克里斯蒂安·贝尔(Christian Bale)的脉搏。 00:02:15.459 --> 00:02:17.281 (笑声) 00:02:17.281 --> 00:02:19.404 你知道,他应该是化了妆了, 00:02:19.404 --> 00:02:21.357 灯光也是挑战, 00:02:21.357 --> 00:02:24.308 但是我们同样从这段视频中提取到了他的脉搏 00:02:24.308 --> 00:02:26.326 演示效果不错。 00:02:26.326 --> 00:02:28.246 我们是如何做到的呢? 00:02:28.246 --> 00:02:32.844 首先我们分析了录像中每个像素 00:02:32.844 --> 00:02:35.115 的光线随时间发生的变化, 00:02:35.115 --> 00:02:36.913 我们放大这些变化。 00:02:36.913 --> 00:02:39.075 经过放大使我们肉眼可以看见这些变化。 00:02:39.075 --> 00:02:40.977 棘手的部分是,那些信号, 00:02:40.977 --> 00:02:43.910 那些我们要放大的信号十分微小, 00:02:43.910 --> 00:02:46.689 所以我们必须把它们和视频中存在的噪音 00:02:46.689 --> 00:02:50.520 区分出来。 00:02:50.520 --> 00:02:53.515 所以我们应用了一些聪明的影像处理技巧 00:02:53.515 --> 00:02:57.509 精确的测量每个像素中的颜色, 00:02:57.509 --> 00:03:00.179 然后得出颜色随时间的变化, 00:03:00.179 --> 00:03:02.872 再然后我们放大这些变化。 00:03:02.872 --> 00:03:06.852 我们可以放大这些变化,增强视频、或放大视频, 00:03:06.852 --> 00:03:09.024 这样就可以演示出变化。 NOTE Paragraph 00:03:09.024 --> 00:03:13.262 事实上,我们不仅可以展示颜色的细小变化, 00:03:13.262 --> 00:03:15.503 同样也可以展示微小的运动, 00:03:15.503 --> 00:03:19.079 这是因为我们的摄像机 00:03:19.079 --> 00:03:21.889 不仅记录物体的颜色变化, 00:03:21.889 --> 00:03:24.257 同样也记录了物体的运动。 00:03:24.257 --> 00:03:27.893 这是我女儿,那时她才两个月大。 00:03:27.893 --> 00:03:30.892 这是我三年前拍的。 00:03:30.892 --> 00:03:34.100 作为初为人父母,我们要确保孩子的健康, 00:03:34.100 --> 00:03:36.642 当然是,确保呼吸,确保活着。 00:03:36.642 --> 00:03:38.784 所以我也买了个婴儿监控器 00:03:38.784 --> 00:03:41.253 这也我可以在她睡着时看到她。 00:03:41.253 --> 00:03:44.780 这是标准婴儿监控器所看到的。 00:03:44.780 --> 00:03:48.462 您可以看到孩子睡着了,但没有其他信息了。 00:03:48.474 --> 00:03:50.078 我们看不到更多东西。 00:03:50.078 --> 00:03:52.902 可不可以更好点儿,有更多信息,更有用, 00:03:52.902 --> 00:03:55.892 就像这样。 00:03:55.892 --> 00:04:02.248 这里我放大了运动30倍, 00:04:02.248 --> 00:04:06.074 这样我就可以真切地看到我女儿还活着,在呼吸。 00:04:06.074 --> 00:04:08.327 (笑声) 00:04:08.327 --> 00:04:10.249 这是效果对比。 00:04:10.249 --> 00:04:12.732 同样,在原始视频上, 00:04:12.732 --> 00:04:14.368 我们看不到什么, 00:04:14.368 --> 00:04:18.075 但是一旦我放大了运动,呼吸变得肉眼可见了 。 00:04:18.075 --> 00:04:20.145 事实上,我们用我们的“运动显微镜” 00:04:20.145 --> 00:04:23.768 可以揭示很多现象。 00:04:23.768 --> 00:04:28.332 我们可以看到体内静脉和动脉的脉动。 00:04:28.332 --> 00:04:30.960 我们可以看到我们的眼睛在不断运动 00:04:30.960 --> 00:04:32.847 在晃动中。 00:04:32.847 --> 00:04:34.356 这实际上是我的眼睛, 00:04:34.356 --> 00:04:37.421 同样,这段视频拍摄于我女儿出生不久之后, 00:04:37.421 --> 00:04:41.623 所以你可以看到我睡得不多。(血丝)(笑声) 00:04:41.623 --> 00:04:44.339 即使当人在静止坐着, 00:04:44.339 --> 00:04:46.383 我们也可以提取许多信息 00:04:46.383 --> 00:04:49.912 如呼吸节律,面部表情微小变化。 00:04:49.912 --> 00:04:51.537 也许这可以 00:04:51.537 --> 00:04:54.691 告诉我们,我们的想法或情绪。 00:04:54.691 --> 00:04:57.946 我们同样也可以方法微小的机械运动, 00:04:57.946 --> 00:04:59.501 如引擎的震动, 00:04:59.501 --> 00:05:03.193 这可以帮助工程师诊断机械问题, 00:05:03.193 --> 00:05:07.931 或者看到建筑或结构的随风摇动。 00:05:07.931 --> 00:05:12.512 我们知道这些变化可以通过其他方法测量, 00:05:12.512 --> 00:05:14.965 但是测量是一回事, 00:05:14.965 --> 00:05:17.241 肉眼看到的又是 00:05:17.241 --> 00:05:19.795 另一回事。 NOTE Paragraph 00:05:19.795 --> 00:05:22.836 自从我们开发者这项新技术, 00:05:22.836 --> 00:05:26.789 我们便把代码放到了网上,这样其他人可以使用试验它。 00:05:26.789 --> 00:05:28.664 用起来很简单。 00:05:28.664 --> 00:05:30.708 可以处理你自己拍的视频。 00:05:30.708 --> 00:05:33.901 我们的合作伙伴,量研科技(Quanta Research),甚至建了个网站 00:05:33.901 --> 00:05:36.579 这里可以上传视频并在线处理, 00:05:36.579 --> 00:05:40.395 这样即使你没有计算机科学或编程经验 00:05:40.395 --> 00:05:43.331 也可以试验这种新型“显微镜”。 00:05:43.331 --> 00:05:45.735 我要演示几个其他的例子 00:05:45.735 --> 00:05:48.470 别人用它做了什么。 NOTE Paragraph 00:05:48.470 --> 00:05:53.787 这段视频是一个叫Tamez85的YouTube用户作的 00:05:53.787 --> 00:05:55.250 我不知道他是谁, 00:05:55.250 --> 00:05:57.595 但是他(她)用我们的代码 00:05:57.595 --> 00:06:01.310 方法了孕妇腹部的运动。 00:06:01.310 --> 00:06:02.912 令人毛骨悚然。 00:06:02.912 --> 00:06:04.525 (笑声) 00:06:04.525 --> 00:06:09.486 人们用它放在自己的腕部脉搏。 00:06:09.486 --> 00:06:13.268 你知道要能被称为科学必须用到豚鼠, 00:06:13.268 --> 00:06:16.658 显然这只豚鼠叫蒂芙妮, 00:06:16.658 --> 00:06:19.607 这位YouTube用户声称 00:06:19.607 --> 00:06:22.295 这是地球上首个运动被放大的啮齿类动物。 NOTE Paragraph 00:06:22.295 --> 00:06:24.483 你也可以用它进行艺术创作。 00:06:24.483 --> 00:06:27.501 这是耶鲁大学设计系学生发给我的视频。 00:06:27.501 --> 00:06:29.638 她想看看 00:06:29.638 --> 00:06:31.160 她同学运动的方式有何不同。 00:06:31.160 --> 00:06:35.369 她让他们静止站立然后放大他们的运动。 00:06:35.369 --> 00:06:38.747 者看上去像是图片有了生命。 00:06:38.747 --> 00:06:41.180 这些例子的有意思的地方是 00:06:41.180 --> 00:06:43.476 我们没有进行干预。 00:06:43.476 --> 00:06:47.330 我们只是提供了新工具,一种看世界的新方法, 00:06:47.330 --> 00:06:52.462 然后人们就找到其他有意思、新的创造性地方法使用这个工具。 NOTE Paragraph 00:06:52.462 --> 00:06:54.226 我们不满足于此。 00:06:54.226 --> 00:06:57.477 这个工具不仅使我们有了看世界的新方法, 00:06:57.477 --> 00:06:59.845 同样它还重新定义了 00:06:59.845 --> 00:07:03.026 摄像机的功能限制。 00:07:03.026 --> 00:07:05.255 作为科学家,我们开始思考, 00:07:05.255 --> 00:07:09.040 其他物理现象造成的微小振动 00:07:09.040 --> 00:07:11.943 现在我们可以用摄像机来测量? 00:07:11.943 --> 00:07:15.944 其中一种现象就是,声音。 00:07:15.944 --> 00:07:18.049 声音,我们知道 00:07:18.049 --> 00:07:20.232 声音是一种压力波,依靠空气的压缩变化在空气中传播。 00:07:20.232 --> 00:07:23.853 压力波碰到物体,就会引起物体本身的微小震动。 00:07:23.853 --> 00:07:26.385 这就是我们听到了录音的原理。 00:07:26.385 --> 00:07:30.053 这样,声音也会造成物体的视觉运动。 00:07:30.053 --> 00:07:32.886 这些运动,肉眼难于分辨 00:07:32.886 --> 00:07:35.887 但是通过处理摄像机却可见。 00:07:35.887 --> 00:07:37.460 这里有两个例子。 00:07:37.460 --> 00:07:40.074 这里我展示我伟大的歌唱技巧。 00:07:41.064 --> 00:07:42.698 (歌唱) 00:07:42.698 --> 00:07:44.134 (笑声) 00:07:44.134 --> 00:07:47.120 我哼唱时,我录了一段高速视频。 00:07:47.120 --> 00:07:48.884 如果您盯着视频看的话, 00:07:48.884 --> 00:07:50.960 仅凭肉眼您是看不出什么端倪的, 00:07:50.960 --> 00:07:55.292 但是当我把运动方法100倍后我们就可以看到颈部的运动和波纹 00:07:55.292 --> 00:07:58.566 这是由于声音震动造成的。 00:07:58.566 --> 00:08:01.306 信号就藏在这段视频中。 NOTE Paragraph 00:08:01.306 --> 00:08:03.976 我们知道,歌唱家可以震碎酒杯 00:08:03.976 --> 00:08:05.439 如果他们发出正确的音符。 00:08:05.439 --> 00:08:07.204 我们播放一个音符 00:08:07.204 --> 00:08:09.730 玻璃杯旁边音箱发出 00:08:09.730 --> 00:08:11.778 的共振频率。 00:08:11.778 --> 00:08:16.197 我们播放音符,然后方法运动250倍, 00:08:16.197 --> 00:08:18.535 我们可以清楚的看到 00:08:18.535 --> 00:08:22.105 玻璃杯是如何响应声音共振的振动的。 00:08:22.105 --> 00:08:24.525 这是我们日常见不到的。 00:08:24.525 --> 00:08:28.054 但是这激发了我们思考。给我们一个疯狂的主意。 00:08:28.054 --> 00:08:33.662 我们能不能通过分析声音在物体上造成的微小振动 00:08:33.662 --> 00:08:37.697 从视频中逆向重构出声音来呢, 00:08:37.697 --> 00:08:42.474 重构出原来的声音呢? 00:08:42.474 --> 00:08:46.931 依靠这种方法,我们可以把任何物体变成麦克风。 NOTE Paragraph 00:08:46.931 --> 00:08:49.163 我们真的照做了。 00:08:49.163 --> 00:08:51.979 这是一个空薯片袋,放在桌上, 00:08:51.979 --> 00:08:54.804 我们要把这个薯片袋变为一个麦克风 00:08:54.804 --> 00:08:56.395 用摄像机拍摄视频 00:08:56.395 --> 00:08:59.623 然后分析视频中声音造成的微小振动。 00:08:59.623 --> 00:09:02.419 这是我们在房间中播放的声音。 NOTE Paragraph 00:09:02.419 --> 00:09:06.853 (音乐:“Mary Had a Little Lamb”) NOTE Paragraph 00:09:10.007 --> 00:09:13.032 这是我们摄制的薯片袋的高速视频。 00:09:13.032 --> 00:09:14.306 同样, 00:09:14.306 --> 00:09:17.648 您凭肉眼 00:09:17.648 --> 00:09:18.706 是看不出来什么的, 00:09:18.706 --> 00:09:21.690 但是我们可以通过分析视频中微小的振动 00:09:21.690 --> 00:09:23.873 恢复出原有的声音。 NOTE Paragraph 00:09:23.873 --> 00:09:26.682 (音乐:“Mary Had a Little Lamb”) NOTE Paragraph 00:09:40.985 --> 00:09:42.471 我叫它 —— 谢谢。 00:09:42.471 --> 00:09:47.696 (掌声) 00:09:49.878 --> 00:09:52.223 我叫它视觉麦克风。 00:09:52.223 --> 00:09:55.613 实际上我们从视频信号中提取了音频信号。 00:09:55.613 --> 00:09:58.794 为了让您了解运动的大小, 00:09:58.799 --> 00:10:04.135 一个特别大的声音可以导致薯片袋一微米的变化。 00:10:04.135 --> 00:10:06.874 也就是千分之一毫米。 00:10:06.874 --> 00:10:10.435 这就是我们能够提取出来的微小运动 00:10:10.435 --> 00:10:13.678 仅仅是通过摄像机录制的视频 00:10:13.678 --> 00:10:15.814 观察光线在物体上的变化。 NOTE Paragraph 00:10:15.814 --> 00:10:19.064 我们可以从物体上重构出原声音,如植物。 NOTE Paragraph 00:10:19.064 --> 00:10:25.380 (音乐:“Mary Had a Little Lamb”) NOTE Paragraph 00:10:27.214 --> 00:10:29.211 我们也可以重构出讲话。 00:10:29.211 --> 00:10:31.788 这是一个人在房间中讲话。 NOTE Paragraph 00:10:31.788 --> 00:10:35.991 (声音:Mary had a little lamb whose fleece was white as snow,) 00:10:35.991 --> 00:10:40.221 and everywhere that Mary went, that lamb was sure to go. NOTE Paragraph 00:10:40.221 --> 00:10:42.980 迈克尔·鲁宾斯坦:这是一个讲话 00:10:42.980 --> 00:10:46.254 这段视频同样是由那个薯片袋重构出声音。 NOTE Paragraph 00:10:46.254 --> 00:10:51.085 声音:Mary had a little lamb whose fleece was white as snow, 00:10:51.085 --> 00:10:55.944 and everywhere that Mary went, that lamb was sure to go. NOTE Paragraph 00:10:55.944 --> 00:10:58.290 迈克尔·鲁宾斯坦:我们用儿歌“Mary Had a Little Lamb” 00:10:58.290 --> 00:11:00.413 因为托马斯 爱迪生在1877年 00:11:00.413 --> 00:11:04.574 第一次录制在留声机上的也是这首儿歌。 00:11:04.574 --> 00:11:07.802 这是历史上第一个录音设备。 00:11:07.802 --> 00:11:11.129 原理是把声音录在薄膜上 00:11:11.129 --> 00:11:15.208 声音通过振动的针头刻录在锡箔上 00:11:15.208 --> 00:11:17.483 锡箔被包裹在圆柱体上。 NOTE Paragraph 00:11:17.483 --> 00:11:23.426 这是演示爱迪生留声机的录制和回放。 NOTE Paragraph 00:11:23.426 --> 00:11:26.446 (视频)声音:Testing, testing, one two three. 00:11:26.446 --> 00:11:29.859 Mary had a little lamb whose fleece was white as snow, 00:11:29.859 --> 00:11:33.528 and everywhere that Mary went, the lamb was sure to go. 00:11:33.528 --> 00:11:36.268 Testing, testing, one two three. 00:11:36.268 --> 00:11:40.424 Mary had a little lamb whose fleece was white as snow, 00:11:40.424 --> 00:11:45.648 and everywhere that Mary went, the lamb was sure to go. NOTE Paragraph 00:11:45.648 --> 00:11:49.665 迈克尔·鲁宾斯坦:137年过去了, 00:11:49.665 --> 00:11:53.752 我们可以重构出同样质量的声音 00:11:53.752 --> 00:11:57.831 却是通过观察摄像机拍摄的物体振动实现的, 00:11:57.831 --> 00:11:59.765 我们甚至可以把摄像机 00:11:59.765 --> 00:12:03.999 放到15英尺外隔音玻璃后边。 NOTE Paragraph 00:12:03.999 --> 00:12:07.219 这是我们在这种情况下还原的声音。 NOTE Paragraph 00:12:07.219 --> 00:12:12.513 声音:Mary had a little lamb whose fleece was white as snow, 00:12:12.513 --> 00:12:17.272 and everywhere that Mary went, the lamb was sure to go. NOTE Paragraph 00:12:17.404 --> 00:12:21.034 迈克尔·鲁宾斯坦:当然,监控是我们想到的第一个应用。 00:12:21.034 --> 00:12:24.029 (笑声) 00:12:24.029 --> 00:12:28.085 但是它应该还有其他用处。 00:12:28.085 --> 00:12:30.925 可能,未来我们可以用它 00:12:30.925 --> 00:12:33.177 太空中还原声音, 00:12:33.177 --> 00:12:36.753 因为声音不可以在太空中传播,但光可以。 NOTE Paragraph 00:12:36.753 --> 00:12:39.157 我们仅仅是刚刚开始探索 00:12:39.157 --> 00:12:42.176 这项新技术的可能用途。 00:12:42.176 --> 00:12:45.008 这让我们熟知的物理过程 00:12:45.008 --> 00:12:48.564 变得肉眼可见了。 NOTE Paragraph 00:12:48.564 --> 00:12:49.768 这是我们的团队。 00:12:49.768 --> 00:12:52.647 今天我展示的一切 00:12:52.647 --> 00:12:54.838 都是这群伟大的人的协作成果。 00:12:54.838 --> 00:12:58.005 我鼓励您,欢迎您访问我们的网站, 00:12:58.005 --> 00:12:59.451 亲身体验, 00:12:59.451 --> 00:13:02.423 加入我们,一同探索微小振动的世界。 NOTE Paragraph 00:13:02.423 --> 00:13:04.048 谢谢。 NOTE Paragraph 00:13:04.048 --> 00:13:05.302 (掌声)