[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:01.37,0:00:04.72,Default,,0000,0000,0000,,大部分人认为\N动作是明显可见的。 Dialogue: 0,0:00:05.89,0:00:10.98,Default,,0000,0000,0000,,比如我走过这个舞台,\N或者边做手势边说话, Dialogue: 0,0:00:10.98,0:00:13.24,Default,,0000,0000,0000,,这些动作都能被大家看到。 Dialogue: 0,0:00:14.26,0:00:19.74,Default,,0000,0000,0000,,但还有很多重要的动作\N肉眼很难察觉到, Dialogue: 0,0:00:19.74,0:00:21.78,Default,,0000,0000,0000,,在过去几年中, Dialogue: 0,0:00:21.78,0:00:23.78,Default,,0000,0000,0000,,我们致力于寻找某种摄像机 Dialogue: 0,0:00:23.78,0:00:27.18,Default,,0000,0000,0000,,可以捕捉到人眼看不到的运动。 Dialogue: 0,0:00:28.30,0:00:29.86,Default,,0000,0000,0000,,请看大屏幕。 Dialogue: 0,0:00:30.72,0:00:34.34,Default,,0000,0000,0000,,左边是一个人的手腕, Dialogue: 0,0:00:34.34,0:00:37.49,Default,,0000,0000,0000,,右边是一个熟睡的婴儿, Dialogue: 0,0:00:37.49,0:00:40.53,Default,,0000,0000,0000,,但是如果我不告诉你们这是一段视频, Dialogue: 0,0:00:40.53,0:00:44.28,Default,,0000,0000,0000,,你们可能会认为\N这只是两张普通的图片, Dialogue: 0,0:00:44.28,0:00:45.82,Default,,0000,0000,0000,,因为乍一看, Dialogue: 0,0:00:45.82,0:00:49.11,Default,,0000,0000,0000,,这两段视频几乎是完全静止的。 Dialogue: 0,0:00:50.18,0:00:54.06,Default,,0000,0000,0000,,但实际上,画面中\N有许多细微的运动变化, Dialogue: 0,0:00:54.06,0:00:56.45,Default,,0000,0000,0000,,如果你能碰到左边的那个手腕, Dialogue: 0,0:00:56.45,0:00:58.45,Default,,0000,0000,0000,,你会感受到脉搏的跳动, Dialogue: 0,0:00:58.45,0:01:00.93,Default,,0000,0000,0000,,如果你抱起右边的婴儿, Dialogue: 0,0:01:00.93,0:01:03.32,Default,,0000,0000,0000,,你能感受到她胸腔的起伏, Dialogue: 0,0:01:03.32,0:01:04.95,Default,,0000,0000,0000,,感受到她的每一次呼吸。 Dialogue: 0,0:01:05.76,0:01:09.34,Default,,0000,0000,0000,,这些动作都很重要, Dialogue: 0,0:01:09.34,0:01:12.68,Default,,0000,0000,0000,,但由于过于细微,\N很难被我们察觉, Dialogue: 0,0:01:12.68,0:01:14.96,Default,,0000,0000,0000,,要想感受到这些动作的存在 Dialogue: 0,0:01:14.96,0:01:17.86,Default,,0000,0000,0000,,只能通过直接接触。 Dialogue: 0,0:01:18.100,0:01:20.26,Default,,0000,0000,0000,,然而几年前, Dialogue: 0,0:01:20.26,0:01:24.67,Default,,0000,0000,0000,,我在麻省理工学院的同事们\N开发出了一种被称为“动作显微镜”的软件, Dialogue: 0,0:01:24.67,0:01:29.05,Default,,0000,0000,0000,,能够发现视频中细微的运动, Dialogue: 0,0:01:29.05,0:01:32.61,Default,,0000,0000,0000,,并将其放大到肉眼可见的级别。 Dialogue: 0,0:01:33.42,0:01:36.90,Default,,0000,0000,0000,,如果我们运用这一软件分析左边的视频, Dialogue: 0,0:01:36.90,0:01:40.15,Default,,0000,0000,0000,,我们就能看到手腕上的脉搏跳动, Dialogue: 0,0:01:40.15,0:01:41.84,Default,,0000,0000,0000,,通过计算脉搏数量, Dialogue: 0,0:01:41.84,0:01:44.20,Default,,0000,0000,0000,,就能得知这个人的心率。 Dialogue: 0,0:01:45.10,0:01:48.16,Default,,0000,0000,0000,,而用这一软件分析右边的视频, Dialogue: 0,0:01:48.16,0:01:51.39,Default,,0000,0000,0000,,我们就能看清婴儿的每一次呼吸, Dialogue: 0,0:01:51.39,0:01:55.52,Default,,0000,0000,0000,,不需要触碰就能监控她的呼吸。 Dialogue: 0,0:01:56.88,0:02:02.23,Default,,0000,0000,0000,,这项技术非常强大,\N因为它能帮助我们看到 Dialogue: 0,0:02:02.23,0:02:04.60,Default,,0000,0000,0000,,原本要靠触觉才能感受到的东西, Dialogue: 0,0:02:04.60,0:02:07.56,Default,,0000,0000,0000,,并且这一过程是可见和无创的。 Dialogue: 0,0:02:09.10,0:02:13.52,Default,,0000,0000,0000,,因此在几年前,我开始\N与这个软件的编写者们一起工作, Dialogue: 0,0:02:13.52,0:02:16.88,Default,,0000,0000,0000,,我们产生了一个疯狂的想法。 Dialogue: 0,0:02:16.88,0:02:19.58,Default,,0000,0000,0000,,我们觉得,运用软件将细微的动作 Dialogue: 0,0:02:19.58,0:02:22.71,Default,,0000,0000,0000,,可视化的这个点子非常酷, Dialogue: 0,0:02:22.71,0:02:27.17,Default,,0000,0000,0000,,你甚至可以把它当做拓展\N人类触觉感官的好方法。 Dialogue: 0,0:02:27.17,0:02:31.23,Default,,0000,0000,0000,,那如果我们能用相同的方法\N来增强我们的听觉呢? Dialogue: 0,0:02:32.51,0:02:37.17,Default,,0000,0000,0000,,如果我们能通过视频捕捉到声音的振动, Dialogue: 0,0:02:37.17,0:02:40.00,Default,,0000,0000,0000,,声音的振动实际上也是一种运动, Dialogue: 0,0:02:40.00,0:02:43.35,Default,,0000,0000,0000,,将“看到”的东西录入麦克风呢? Dialogue: 0,0:02:44.24,0:02:46.21,Default,,0000,0000,0000,,也许听起来有点不太好理解, Dialogue: 0,0:02:46.21,0:02:48.79,Default,,0000,0000,0000,,我试着为大家解释一下。 Dialogue: 0,0:02:49.52,0:02:53.01,Default,,0000,0000,0000,,传统麦克风的工作原理 Dialogue: 0,0:02:53.01,0:02:56.61,Default,,0000,0000,0000,,是将其内部薄膜的振动转换成电信号, Dialogue: 0,0:02:56.61,0:03:00.93,Default,,0000,0000,0000,,这个薄膜极易随声音振动, Dialogue: 0,0:03:00.93,0:03:05.74,Default,,0000,0000,0000,,这个振动可以被记录下来\N并还原成声音。 Dialogue: 0,0:03:05.74,0:03:09.40,Default,,0000,0000,0000,,而声音事实上可以\N引起任何物体的振动。 Dialogue: 0,0:03:09.40,0:03:14.88,Default,,0000,0000,0000,,只不过这种振动对我们而言\N通常很细微而且转瞬即逝。 Dialogue: 0,0:03:14.88,0:03:18.62,Default,,0000,0000,0000,,但如果我们用高速摄影机\N将这种振动录下来, Dialogue: 0,0:03:18.62,0:03:22.20,Default,,0000,0000,0000,,并通过软件从这些高速视频中 Dialogue: 0,0:03:22.20,0:03:24.29,Default,,0000,0000,0000,,提取出这些细小的振动, Dialogue: 0,0:03:24.29,0:03:28.56,Default,,0000,0000,0000,,然后分析这些振动来\N弄清声音的来源,会怎么样呢? Dialogue: 0,0:03:29.86,0:03:35.31,Default,,0000,0000,0000,,这样一来我们可以将远处的\N可见物体转化为可视化麦克风。 Dialogue: 0,0:03:37.08,0:03:39.26,Default,,0000,0000,0000,,我们进行了各种尝试, Dialogue: 0,0:03:39.26,0:03:41.03,Default,,0000,0000,0000,,以下是我们的试验之一, Dialogue: 0,0:03:41.03,0:03:44.14,Default,,0000,0000,0000,,右边是一株盆栽植物, Dialogue: 0,0:03:44.14,0:03:46.58,Default,,0000,0000,0000,,我们用高速摄影机拍下它, Dialogue: 0,0:03:46.58,0:03:50.11,Default,,0000,0000,0000,,同时旁边的音箱在播放这个声音。 Dialogue: 0,0:03:50.28,0:03:58.46,Default,,0000,0000,0000,,(音乐:玛丽有一只小羊羔) Dialogue: 0,0:03:59.82,0:04:02.64,Default,,0000,0000,0000,,这是我们录下的视频, Dialogue: 0,0:04:02.64,0:04:06.57,Default,,0000,0000,0000,,用的是每秒数千帧的速度, Dialogue: 0,0:04:06.57,0:04:08.89,Default,,0000,0000,0000,,但即使你凑得非常近, Dialogue: 0,0:04:08.89,0:04:10.84,Default,,0000,0000,0000,,也只能看到一些叶子 Dialogue: 0,0:04:10.84,0:04:13.91,Default,,0000,0000,0000,,静静地呆在那儿,一动不动, Dialogue: 0,0:04:13.91,0:04:18.71,Default,,0000,0000,0000,,因为刚才的音乐\N只能让叶子移动一微米, Dialogue: 0,0:04:19.10,0:04:23.38,Default,,0000,0000,0000,,也就是一厘米的万分之一, Dialogue: 0,0:04:23.38,0:04:27.54,Default,,0000,0000,0000,,只占这幅图像中一个像素的 Dialogue: 0,0:04:27.54,0:04:29.83,Default,,0000,0000,0000,,百分之一到千分之一。 Dialogue: 0,0:04:29.88,0:04:32.77,Default,,0000,0000,0000,,你大可以眯着眼使劲儿看, Dialogue: 0,0:04:32.77,0:04:36.50,Default,,0000,0000,0000,,但如此细微的运动\N从感官上来说是不可见的。 Dialogue: 0,0:04:37.67,0:04:41.82,Default,,0000,0000,0000,,但事实证明感官上不可见的东西 Dialogue: 0,0:04:41.82,0:04:44.63,Default,,0000,0000,0000,,在数值上可能很惊人, Dialogue: 0,0:04:44.63,0:04:46.64,Default,,0000,0000,0000,,因为通过正确的算法, Dialogue: 0,0:04:46.64,0:04:50.32,Default,,0000,0000,0000,,我们就可以从这段无声的\N看似静止的视频中 Dialogue: 0,0:04:50.32,0:04:51.85,Default,,0000,0000,0000,,还原出这段声音。 Dialogue: 0,0:04:52.69,0:05:00.07,Default,,0000,0000,0000,,(音乐:玛丽有一只小羊羔) Dialogue: 0,0:05:00.07,0:05:08.93,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:05:10.06,0:05:11.100,Default,,0000,0000,0000,,这怎么可能呢? Dialogue: 0,0:05:11.100,0:05:16.34,Default,,0000,0000,0000,,我们怎么能从如此细小的运动中\N得到如此丰富的信息? Dialogue: 0,0:05:16.34,0:05:21.70,Default,,0000,0000,0000,,我们必须承认这些叶子\N只移动了一微米, Dialogue: 0,0:05:21.70,0:05:26.01,Default,,0000,0000,0000,,只改变了图像中一个像素的千分之一。 Dialogue: 0,0:05:27.27,0:05:29.84,Default,,0000,0000,0000,,看起来很微不足道, Dialogue: 0,0:05:29.84,0:05:31.84,Default,,0000,0000,0000,,但是视频中的每一帧 Dialogue: 0,0:05:31.84,0:05:35.09,Default,,0000,0000,0000,,都包含数以万计的像素, Dialogue: 0,0:05:35.09,0:05:38.55,Default,,0000,0000,0000,,当我们将整幅画面中\N所有细微的运动 Dialogue: 0,0:05:38.55,0:05:40.85,Default,,0000,0000,0000,,组合在一起来看的时候, Dialogue: 0,0:05:40.85,0:05:43.47,Default,,0000,0000,0000,,无数个千分之一像素聚在一起 Dialogue: 0,0:05:43.47,0:05:46.24,Default,,0000,0000,0000,,就能组合出有十分意义的信息。 Dialogue: 0,0:05:46.87,0:05:50.50,Default,,0000,0000,0000,,老实说,当我们想通\N这一点的时候真是乐疯了。 Dialogue: 0,0:05:50.50,0:05:52.82,Default,,0000,0000,0000,,(笑声) Dialogue: 0,0:05:52.82,0:05:56.08,Default,,0000,0000,0000,,但是,即便运用正确的算法 Dialogue: 0,0:05:56.08,0:05:59.70,Default,,0000,0000,0000,,我们还是会丢失掉很多重要的信息。 Dialogue: 0,0:05:59.70,0:06:03.30,Default,,0000,0000,0000,,这项技术能否成功 Dialogue: 0,0:06:03.30,0:06:05.30,Default,,0000,0000,0000,,取决于很多因素。 Dialogue: 0,0:06:05.30,0:06:08.50,Default,,0000,0000,0000,,比如目标物体的距离; Dialogue: 0,0:06:08.50,0:06:10.89,Default,,0000,0000,0000,,摄影机和镜头的选用; Dialogue: 0,0:06:10.89,0:06:14.98,Default,,0000,0000,0000,,光线是否充足,\N声音是否够大等等。 Dialogue: 0,0:06:15.94,0:06:19.32,Default,,0000,0000,0000,,因此,即便我们的算法正确, Dialogue: 0,0:06:19.32,0:06:22.71,Default,,0000,0000,0000,,在早期试验中\N我们还是得万分谨慎, Dialogue: 0,0:06:22.71,0:06:25.10,Default,,0000,0000,0000,,因为一着不慎,满盘皆输, Dialogue: 0,0:06:25.10,0:06:27.47,Default,,0000,0000,0000,,得不到有用的信息,\N也查不出原因。 Dialogue: 0,0:06:27.47,0:06:30.12,Default,,0000,0000,0000,,还原出来的只有噪音。 Dialogue: 0,0:06:30.12,0:06:33.44,Default,,0000,0000,0000,,初期的试验场景是这样的。 Dialogue: 0,0:06:33.44,0:06:35.64,Default,,0000,0000,0000,,左边的是我, Dialogue: 0,0:06:35.64,0:06:39.68,Default,,0000,0000,0000,,左下角是我们的高速摄影机, Dialogue: 0,0:06:39.68,0:06:41.87,Default,,0000,0000,0000,,正对着一袋薯片, Dialogue: 0,0:06:41.87,0:06:44.82,Default,,0000,0000,0000,,薯片被一盏明亮的灯照着。 Dialogue: 0,0:06:44.82,0:06:49.18,Default,,0000,0000,0000,,就像刚才我说的,\N在初期试验中我们需要十分小心, Dialogue: 0,0:06:49.18,0:06:51.69,Default,,0000,0000,0000,,得有多小心呢?请看。 Dialogue: 0,0:06:51.69,0:06:55.45,Default,,0000,0000,0000,,(视频:三、二、一,开始) Dialogue: 0,0:06:55.45,0:07:00.84,Default,,0000,0000,0000,,(视频:玛丽有一只小羊羔!\N小羊羔!小羊羔!) Dialogue: 0,0:07:00.84,0:07:05.34,Default,,0000,0000,0000,,(笑声) Dialogue: 0,0:07:05.34,0:07:08.15,Default,,0000,0000,0000,,这试验看起来真是弱爆了。 Dialogue: 0,0:07:08.15,0:07:09.94,Default,,0000,0000,0000,,(笑声) Dialogue: 0,0:07:09.94,0:07:12.28,Default,,0000,0000,0000,,我可是对着一袋薯片在咆哮—— Dialogue: 0,0:07:12.28,0:07:13.83,Default,,0000,0000,0000,,(笑声) Dialogue: 0,0:07:13.83,0:07:15.95,Default,,0000,0000,0000,,而且我们用的灯功率太大, Dialogue: 0,0:07:15.95,0:07:20.48,Default,,0000,0000,0000,,差点把第一袋薯片点着了。\N(笑声) Dialogue: 0,0:07:20.48,0:07:23.80,Default,,0000,0000,0000,,虽然看起来很不靠谱, Dialogue: 0,0:07:23.80,0:07:25.59,Default,,0000,0000,0000,,但结果还是不错的, Dialogue: 0,0:07:25.59,0:07:28.51,Default,,0000,0000,0000,,因为我们最终还原出了这段声音。 Dialogue: 0,0:07:28.51,0:07:33.22,Default,,0000,0000,0000,,(音频:玛丽有一只小羊羔!\N小羊羔!小羊羔!) Dialogue: 0,0:07:33.22,0:07:37.31,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:07:37.31,0:07:39.19,Default,,0000,0000,0000,,这绝对是一个里程碑, Dialogue: 0,0:07:39.19,0:07:43.43,Default,,0000,0000,0000,,因为这是我们第一次\N从一段无声录像中 Dialogue: 0,0:07:43.43,0:07:45.76,Default,,0000,0000,0000,,还原出具有意义的人声。 Dialogue: 0,0:07:45.76,0:07:48.16,Default,,0000,0000,0000,,因此我们以此为出发点 Dialogue: 0,0:07:48.16,0:07:52.10,Default,,0000,0000,0000,,不断修正我们的试验, Dialogue: 0,0:07:52.11,0:07:55.91,Default,,0000,0000,0000,,更换试验对象,调整距离, Dialogue: 0,0:07:55.91,0:07:58.68,Default,,0000,0000,0000,,减小光线强度,降低声音等等。 Dialogue: 0,0:07:59.89,0:08:02.76,Default,,0000,0000,0000,,我们不断分析试验结果, Dialogue: 0,0:08:02.76,0:08:06.38,Default,,0000,0000,0000,,直到发现这一技术的局限性, Dialogue: 0,0:08:06.38,0:08:08.33,Default,,0000,0000,0000,,因为只有搞清楚局限在哪儿 Dialogue: 0,0:08:08.33,0:08:10.68,Default,,0000,0000,0000,,我们才能不断取得突破。 Dialogue: 0,0:08:10.68,0:08:13.86,Default,,0000,0000,0000,,于是,就有了下面这个试验, Dialogue: 0,0:08:13.86,0:08:16.60,Default,,0000,0000,0000,,这一次,我还是对着一袋薯片说话, Dialogue: 0,0:08:16.60,0:08:21.43,Default,,0000,0000,0000,,但将摄影机后退到了15英尺\N(4.572米)远的室外, Dialogue: 0,0:08:21.43,0:08:24.26,Default,,0000,0000,0000,,隔着一层隔音玻璃, Dialogue: 0,0:08:24.26,0:08:27.06,Default,,0000,0000,0000,,只借助自然光线。 Dialogue: 0,0:08:28.53,0:08:30.68,Default,,0000,0000,0000,,这是我们拍下的视频。 Dialogue: 0,0:08:32.45,0:08:37.01,Default,,0000,0000,0000,,这是在室内,\N在薯片旁说话的原声。 Dialogue: 0,0:08:37.01,0:08:42.05,Default,,0000,0000,0000,,(音频:玛丽有一只小羊羔,\N身上羊毛白又好, Dialogue: 0,0:08:42.05,0:08:47.67,Default,,0000,0000,0000,,无论玛丽走到哪,\N小羊都会跟着跑。) Dialogue: 0,0:08:47.67,0:08:51.68,Default,,0000,0000,0000,,这是通过我们从室外\N隔音玻璃后采集的无声影像 Dialogue: 0,0:08:51.68,0:08:54.03,Default,,0000,0000,0000,,还原出来的声音。 Dialogue: 0,0:08:54.03,0:08:58.46,Default,,0000,0000,0000,,(音频:玛丽有一只小羊羔,\N身上羊毛白又好, Dialogue: 0,0:08:58.46,0:09:03.92,Default,,0000,0000,0000,,无论玛丽走到哪,\N小羊都会跟着跑。) Dialogue: 0,0:09:03.92,0:09:10.42,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:09:10.42,0:09:13.96,Default,,0000,0000,0000,,我们还调整了其它参数。 Dialogue: 0,0:09:13.96,0:09:15.76,Default,,0000,0000,0000,,比如说降低音量, Dialogue: 0,0:09:15.76,0:09:19.87,Default,,0000,0000,0000,,这有一副耳机,插在笔记本电脑上, Dialogue: 0,0:09:19.87,0:09:23.98,Default,,0000,0000,0000,,在这个实验中,我们想仅通过拍摄下\N这对塑料耳机的 Dialogue: 0,0:09:23.98,0:09:26.28,Default,,0000,0000,0000,,无声视频来还原 Dialogue: 0,0:09:26.28,0:09:28.79,Default,,0000,0000,0000,,笔记本里播放的音乐, Dialogue: 0,0:09:28.79,0:09:30.97,Default,,0000,0000,0000,,结果很理想, Dialogue: 0,0:09:30.97,0:09:33.43,Default,,0000,0000,0000,,我甚至能用Shazam\N来识别出这段音乐。 Dialogue: 0,0:09:33.43,0:09:35.84,Default,,0000,0000,0000,,(笑声) Dialogue: 0,0:09:37.19,0:09:49.62,Default,,0000,0000,0000,,(音乐:“皇后乐队”的《重压之下》) Dialogue: 0,0:09:49.62,0:09:54.58,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:09:54.58,0:09:59.14,Default,,0000,0000,0000,,我们还尝试了更换试验设备\N来完善我们的成果。 Dialogue: 0,0:09:59.14,0:10:01.60,Default,,0000,0000,0000,,因为前面我给大家展示的试验 Dialogue: 0,0:10:01.60,0:10:03.92,Default,,0000,0000,0000,,都是通过高速摄影机完成的, Dialogue: 0,0:10:03.92,0:10:06.80,Default,,0000,0000,0000,,它的拍摄速度比大多数手机摄像头 Dialogue: 0,0:10:06.80,0:10:08.72,Default,,0000,0000,0000,,快100倍, Dialogue: 0,0:10:08.72,0:10:11.53,Default,,0000,0000,0000,,但是我们也找到了用普通摄影机 Dialogue: 0,0:10:11.53,0:10:13.76,Default,,0000,0000,0000,,来完成试验的方法, Dialogue: 0,0:10:13.76,0:10:17.83,Default,,0000,0000,0000,,我们利用了叫做“滚动快门”的技术。 Dialogue: 0,0:10:17.83,0:10:22.63,Default,,0000,0000,0000,,大部分摄像头是逐行拍摄影像的, Dialogue: 0,0:10:22.63,0:10:28.33,Default,,0000,0000,0000,,因此如果在拍摄单张照片时\N物体发生了移动, Dialogue: 0,0:10:28.34,0:10:31.06,Default,,0000,0000,0000,,每一行影像间就会出现少许延迟, Dialogue: 0,0:10:31.06,0:10:34.22,Default,,0000,0000,0000,,这种延迟使得视频的每一帧 Dialogue: 0,0:10:34.22,0:10:37.70,Default,,0000,0000,0000,,都会产生轻微的变形。 Dialogue: 0,0:10:37.70,0:10:41.51,Default,,0000,0000,0000,,通过分析这种变形, Dialogue: 0,0:10:41.51,0:10:46.12,Default,,0000,0000,0000,,运用调整过的算法\N我们还是可以还原声音。 Dialogue: 0,0:10:46.12,0:10:48.03,Default,,0000,0000,0000,,在接下来这个试验里, Dialogue: 0,0:10:48.03,0:10:49.73,Default,,0000,0000,0000,,我们拍摄的是一袋糖果, Dialogue: 0,0:10:49.73,0:10:51.47,Default,,0000,0000,0000,,旁边的喇叭里播放的 Dialogue: 0,0:10:51.47,0:10:54.44,Default,,0000,0000,0000,,还是之前那首“玛丽有一只小羊羔”, Dialogue: 0,0:10:54.44,0:10:58.64,Default,,0000,0000,0000,,但这一次我们使用的是\N能在店里买到的普通摄影机, Dialogue: 0,0:10:58.64,0:11:01.63,Default,,0000,0000,0000,,下面请听我们还原出来的声音, Dialogue: 0,0:11:01.63,0:11:03.87,Default,,0000,0000,0000,,这次的声音有些失真, Dialogue: 0,0:11:03.87,0:11:07.56,Default,,0000,0000,0000,,但仔细听一下,\N看你能否分辨出来这段音乐。 Dialogue: 0,0:11:07.72,0:11:24.19,Default,,0000,0000,0000,,(音频:玛丽有一只小羊羔) Dialogue: 0,0:11:25.53,0:11:28.99,Default,,0000,0000,0000,,就是这样,听起来有点失真, Dialogue: 0,0:11:28.99,0:11:33.38,Default,,0000,0000,0000,,但别忘了\N我们这次用的是普通摄影机, Dialogue: 0,0:11:33.38,0:11:36.00,Default,,0000,0000,0000,,你随便到一家百思买\N这样的电器商店 Dialogue: 0,0:11:36.00,0:11:37.45,Default,,0000,0000,0000,,就可以买到。 Dialogue: 0,0:11:39.12,0:11:40.48,Default,,0000,0000,0000,,那么目前为止, Dialogue: 0,0:11:40.48,0:11:42.46,Default,,0000,0000,0000,,相信许多人看到这儿 Dialogue: 0,0:11:42.46,0:11:45.87,Default,,0000,0000,0000,,立刻想到了监听。 Dialogue: 0,0:11:45.87,0:11:48.29,Default,,0000,0000,0000,,说实话, Dialogue: 0,0:11:48.29,0:11:52.42,Default,,0000,0000,0000,,用这个技术去监听\N还真不是什么难事。 Dialogue: 0,0:11:52.42,0:11:56.37,Default,,0000,0000,0000,,但请大家注意,\N早就有很多成熟的技术 Dialogue: 0,0:11:56.37,0:11:57.95,Default,,0000,0000,0000,,被用于监听了。 Dialogue: 0,0:11:57.95,0:12:00.04,Default,,0000,0000,0000,,实际上,将激光投射在物体上 Dialogue: 0,0:12:00.04,0:12:02.84,Default,,0000,0000,0000,,进行远距离监听的技术\N已经出现几十年了。 Dialogue: 0,0:12:03.98,0:12:06.00,Default,,0000,0000,0000,,但我们这项技术的创新之处, Dialogue: 0,0:12:06.00,0:12:07.44,Default,,0000,0000,0000,,与众不同之处 Dialogue: 0,0:12:07.44,0:12:11.74,Default,,0000,0000,0000,,在于我们掌握了一种\N描绘物体振动的方法, Dialogue: 0,0:12:11.74,0:12:15.15,Default,,0000,0000,0000,,使我们能通过一种全新的镜头\N去看这个世界。 Dialogue: 0,0:12:15.15,0:12:16.66,Default,,0000,0000,0000,,通过这个镜头, Dialogue: 0,0:12:16.66,0:12:21.56,Default,,0000,0000,0000,,不仅能看清使物体产生振动的外力,\N比如声音, Dialogue: 0,0:12:21.56,0:12:23.85,Default,,0000,0000,0000,,还能了解物体本身的性质。 Dialogue: 0,0:12:24.98,0:12:26.67,Default,,0000,0000,0000,,因此我想换个角度 Dialogue: 0,0:12:26.67,0:12:30.92,Default,,0000,0000,0000,,思考这将如何改变\N我们使用视频的方式, Dialogue: 0,0:12:30.92,0:12:34.47,Default,,0000,0000,0000,,我们通常用视频来“看”东西, Dialogue: 0,0:12:34.47,0:12:36.79,Default,,0000,0000,0000,,而我刚刚给大家展示的是如何用视频 Dialogue: 0,0:12:36.79,0:12:38.65,Default,,0000,0000,0000,,来“听”东西。 Dialogue: 0,0:12:38.65,0:12:42.62,Default,,0000,0000,0000,,但是还有一种认识世界的重要方式, Dialogue: 0,0:12:42.62,0:12:44.90,Default,,0000,0000,0000,,就是与世界互动。 Dialogue: 0,0:12:44.90,0:12:48.01,Default,,0000,0000,0000,,我们可以移动或触碰某个物体。 Dialogue: 0,0:12:48.01,0:12:51.19,Default,,0000,0000,0000,,或者摇晃它,看它会发生什么变化。 Dialogue: 0,0:12:51.19,0:12:55.46,Default,,0000,0000,0000,,但这一变化(可能太过微小)\N视频没法捕捉, Dialogue: 0,0:12:55.46,0:12:57.60,Default,,0000,0000,0000,,至少用传统的方式实现不了。 Dialogue: 0,0:12:57.60,0:12:59.55,Default,,0000,0000,0000,,因此我想向大家展示一项新的成果, Dialogue: 0,0:12:59.55,0:13:02.21,Default,,0000,0000,0000,,这项成果基于我几个月前的一个想法, Dialogue: 0,0:13:02.21,0:13:05.51,Default,,0000,0000,0000,,今天其实是我第一次将它公之于众。 Dialogue: 0,0:13:05.51,0:13:10.88,Default,,0000,0000,0000,,简而言之就是,\N我们会利用视频里的振动 Dialogue: 0,0:13:10.88,0:13:15.36,Default,,0000,0000,0000,,来与物体进行互动, Dialogue: 0,0:13:15.36,0:13:18.05,Default,,0000,0000,0000,,然后看物体如何反应。 Dialogue: 0,0:13:19.12,0:13:20.88,Default,,0000,0000,0000,,这是我们的试验对象, Dialogue: 0,0:13:20.88,0:13:24.72,Default,,0000,0000,0000,,一个用铁丝做成的小人, Dialogue: 0,0:13:24.72,0:13:27.80,Default,,0000,0000,0000,,我们使用的是一台普通的摄影机。 Dialogue: 0,0:13:27.80,0:13:29.93,Default,,0000,0000,0000,,没有任何特别之处。 Dialogue: 0,0:13:29.93,0:13:32.89,Default,,0000,0000,0000,,实际上,我用手机也能做到。 Dialogue: 0,0:13:32.89,0:13:35.14,Default,,0000,0000,0000,,但如果我们想让这个小人振动, Dialogue: 0,0:13:35.14,0:13:36.27,Default,,0000,0000,0000,,要怎么做呢, Dialogue: 0,0:13:36.27,0:13:39.62,Default,,0000,0000,0000,,我们仅仅在放置小人的\N台子上敲了几下, Dialogue: 0,0:13:39.62,0:13:41.76,Default,,0000,0000,0000,,并把过程拍了下来。 Dialogue: 0,0:13:47.40,0:13:51.07,Default,,0000,0000,0000,,就这样,我们得到了一段\N五秒钟的普通视频, Dialogue: 0,0:13:51.07,0:13:53.20,Default,,0000,0000,0000,,敲了几下台子, Dialogue: 0,0:13:53.20,0:13:56.72,Default,,0000,0000,0000,,我们将利用视频里的振动 Dialogue: 0,0:13:56.72,0:14:01.26,Default,,0000,0000,0000,,来研究这个小人的\N结构特征和材料特征, Dialogue: 0,0:14:01.26,0:14:06.10,Default,,0000,0000,0000,,并利用这些信息\N创造出一种新的具有互动性的东西。 Dialogue: 0,0:14:12.87,0:14:15.52,Default,,0000,0000,0000,,这就是我们的成果 Dialogue: 0,0:14:15.52,0:14:17.75,Default,,0000,0000,0000,,看起来像一张普通的图片, Dialogue: 0,0:14:17.75,0:14:20.86,Default,,0000,0000,0000,,但这不是图片,\N也不是视频, Dialogue: 0,0:14:20.86,0:14:23.23,Default,,0000,0000,0000,,因为我可以移动鼠标 Dialogue: 0,0:14:23.23,0:14:26.09,Default,,0000,0000,0000,,与这个小人进行互动。 Dialogue: 0,0:14:32.94,0:14:35.46,Default,,0000,0000,0000,,现在大家看到的 Dialogue: 0,0:14:35.46,0:14:37.62,Default,,0000,0000,0000,,是模拟小人在受到外力时 Dialogue: 0,0:14:37.62,0:14:42.07,Default,,0000,0000,0000,,会如何反应,\N即使这种外力是初次施加的, Dialogue: 0,0:14:42.07,0:14:45.71,Default,,0000,0000,0000,,而这都来源于那\N短短五秒钟的普通视频。 Dialogue: 0,0:14:47.25,0:14:55.56,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:14:57.42,0:15:00.65,Default,,0000,0000,0000,,这的确是一种审视世界的有效方法, Dialogue: 0,0:15:00.65,0:15:03.62,Default,,0000,0000,0000,,让我们可以预测物体在新的条件下 Dialogue: 0,0:15:03.62,0:15:05.44,Default,,0000,0000,0000,,会作何反应, Dialogue: 0,0:15:05.44,0:15:08.92,Default,,0000,0000,0000,,想象一下,前面有一座很旧的桥, Dialogue: 0,0:15:08.92,0:15:12.44,Default,,0000,0000,0000,,我们不知道它是否足够结实, Dialogue: 0,0:15:12.44,0:15:15.28,Default,,0000,0000,0000,,我们能不能把车开过去。 Dialogue: 0,0:15:15.28,0:15:18.05,Default,,0000,0000,0000,,而这种问题\N最好在你开车上桥之前 Dialogue: 0,0:15:18.05,0:15:20.61,Default,,0000,0000,0000,,就搞清楚答案。 Dialogue: 0,0:15:21.99,0:15:25.26,Default,,0000,0000,0000,,当然,这项技术有它的局限, Dialogue: 0,0:15:25.26,0:15:27.72,Default,,0000,0000,0000,,就像之前的视觉麦克风试验一样, Dialogue: 0,0:15:27.72,0:15:30.90,Default,,0000,0000,0000,,但我们也发现\N它能在许多场景下发挥作用, Dialogue: 0,0:15:30.90,0:15:32.78,Default,,0000,0000,0000,,有时甚至出乎你的意料, Dialogue: 0,0:15:32.78,0:15:35.55,Default,,0000,0000,0000,,特别是当视频时间足够长的时候。 Dialogue: 0,0:15:35.55,0:15:38.05,Default,,0000,0000,0000,,举个例子,这段视频 Dialogue: 0,0:15:38.05,0:15:40.35,Default,,0000,0000,0000,,拍的是我公寓外的灌木丛, Dialogue: 0,0:15:40.35,0:15:43.44,Default,,0000,0000,0000,,我没有动过它, Dialogue: 0,0:15:43.44,0:15:46.15,Default,,0000,0000,0000,,只是拍了一段1分钟长的视频, Dialogue: 0,0:15:46.15,0:15:49.52,Default,,0000,0000,0000,,微风不断吹动灌木, Dialogue: 0,0:15:49.52,0:15:53.11,Default,,0000,0000,0000,,让我能够收集到足够的信息\N来完成这段模拟。 Dialogue: 0,0:15:55.27,0:16:01.41,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:16:01.41,0:16:04.38,Default,,0000,0000,0000,,想象一下,\N如果电影导演掌握了这项技术, Dialogue: 0,0:16:04.38,0:16:06.10,Default,,0000,0000,0000,,他就可以在后期制作时 Dialogue: 0,0:16:06.10,0:16:11.02,Default,,0000,0000,0000,,随心所欲地控制风的大小和方向。 Dialogue: 0,0:16:12.81,0:16:17.34,Default,,0000,0000,0000,,来看另一个例子,\N我们拍摄了一副挂起来的窗帘, Dialogue: 0,0:16:17.34,0:16:21.47,Default,,0000,0000,0000,,在这段视频里\N你甚至看不出来窗帘在动, Dialogue: 0,0:16:21.47,0:16:24.40,Default,,0000,0000,0000,,但是利用2分钟长的一段视频, Dialogue: 0,0:16:24.40,0:16:26.84,Default,,0000,0000,0000,,仅仅靠房间里的自然空气流动 Dialogue: 0,0:16:26.84,0:16:31.25,Default,,0000,0000,0000,,引发的无法察觉的动作和振动, Dialogue: 0,0:16:31.25,0:16:36.24,Default,,0000,0000,0000,,就能使我们提取出足够多的\N信息来完成这段模拟。 Dialogue: 0,0:16:36.24,0:16:38.61,Default,,0000,0000,0000,,神奇的是, Dialogue: 0,0:16:38.61,0:16:41.70,Default,,0000,0000,0000,,以往我们都是针对虚拟物体, Dialogue: 0,0:16:41.70,0:16:44.34,Default,,0000,0000,0000,,针对游戏和3D模型 Dialogue: 0,0:16:44.34,0:16:47.64,Default,,0000,0000,0000,,来实现这种互动, Dialogue: 0,0:16:47.64,0:16:52.04,Default,,0000,0000,0000,,而这项技术仅仅是利用\N普通的视频 Dialogue: 0,0:16:52.04,0:16:54.86,Default,,0000,0000,0000,,对现实世界中的\N真实物体进行采样, Dialogue: 0,0:16:54.86,0:16:58.42,Default,,0000,0000,0000,,它极富新意,\N具有广阔的应用前景。 Dialogue: 0,0:16:58.42,0:17:04.06,Default,,0000,0000,0000,,这些是跟我共同研究\N这项技术的优秀的同事。 Dialogue: 0,0:17:04.06,0:17:11.80,Default,,0000,0000,0000,,(掌声) Dialogue: 0,0:17:12.82,0:17:15.88,Default,,0000,0000,0000,,今天向大家展示的\N只是一个技术雏形。 Dialogue: 0,0:17:15.88,0:17:17.99,Default,,0000,0000,0000,,关于如何使用这种新型图像, Dialogue: 0,0:17:17.99,0:17:20.96,Default,,0000,0000,0000,,我们才刚刚入门, Dialogue: 0,0:17:20.96,0:17:23.34,Default,,0000,0000,0000,,它为我们提供了一种 Dialogue: 0,0:17:23.34,0:17:28.07,Default,,0000,0000,0000,,运用已有的普通技术\N来记录周围事物的新方法。 Dialogue: 0,0:17:28.07,0:17:29.100,Default,,0000,0000,0000,,展望一下未来, Dialogue: 0,0:17:29.100,0:17:32.03,Default,,0000,0000,0000,,我们迫不及待地想要看到如何 Dialogue: 0,0:17:32.03,0:17:34.44,Default,,0000,0000,0000,,利用这项技术去更好地了解世界。 Dialogue: 0,0:17:34.44,0:17:35.66,Default,,0000,0000,0000,,谢谢大家。 Dialogue: 0,0:17:35.66,0:17:41.72,Default,,0000,0000,0000,,(掌声)