1 00:00:01,373 --> 00:00:04,722 사람들은 보통 움직임을 시각적인 것으로 생각합니다. 2 00:00:05,889 --> 00:00:10,977 만약 제가 지금 말하는 도중 무대를 가로질러 걷거나 손동작을 취하면 3 00:00:10,977 --> 00:00:13,238 여러분은 그 움직임을 볼 수 있습니다. 4 00:00:14,255 --> 00:00:16,737 하지만 중요한 의미를 갖는 움직임들 중 5 00:00:16,737 --> 00:00:20,057 그 크기가 매우 미세해서 우리 눈에 분별하기 어려운 것들도 있습니다. 6 00:00:20,057 --> 00:00:24,508 우리는 지난 몇 년에 걸쳐 인간이 보지 못하는 이 움직임을 7 00:00:24,508 --> 00:00:27,865 카메라로는 식별 할 수 있다는 사실을 알아냈습니다. 8 00:00:28,305 --> 00:00:29,856 어떤 것인지 직접 보여드리죠. 9 00:00:30,717 --> 00:00:34,339 왼쪽 화면은 사람 손목의 동영상입니다. 10 00:00:34,339 --> 00:00:37,486 오른편에는 잠자는 아기 동영상이 있어요. 11 00:00:37,486 --> 00:00:40,632 하지만 이것들이 동영상이라고 말씀드리지 않았다면 12 00:00:40,632 --> 00:00:44,393 여러분들은 두 개의 보통 사진을 보고 있다고 생각하실 수 있습니다. 13 00:00:44,393 --> 00:00:46,065 왜냐하면 두 영상 모두 14 00:00:46,065 --> 00:00:49,112 정지해 있는 것처럼 보이거든요. 15 00:00:50,175 --> 00:00:54,060 하지만 여기에는 아주 미세한 움직임이 일어나고 있습니다. 16 00:00:54,060 --> 00:00:56,452 만약 여러분이 왼쪽 사진의 손목을 만질 수 있다면 17 00:00:56,452 --> 00:00:58,448 맥박을 느낄 수 있을 것입니다. 18 00:00:58,448 --> 00:01:00,933 또 만약 오른쪽의 아이를 안아 본다면 19 00:01:00,933 --> 00:01:03,324 아이가 숨을 쉴 때마다 가슴이 오르락 내리락 20 00:01:03,324 --> 00:01:04,714 하는 것을 느낄 수 있을 것입니다. 21 00:01:05,762 --> 00:01:09,338 보시는 것과 같은 움직임들은 우리에게 중요한 정보를 제공합니다. 22 00:01:09,338 --> 00:01:12,681 하지만 대부분은 육안으로 식별하기에 매우 미세합니다. 23 00:01:12,681 --> 00:01:14,957 그래서 육안으로 관찰하는 대신 24 00:01:14,957 --> 00:01:17,857 촉각을 통해 직접 만져보고 느낍니다. 25 00:01:18,997 --> 00:01:20,262 하지만 몇 년 전 26 00:01:20,262 --> 00:01:24,667 MIT의 제 동료들이 "모션 마이크로 스콥" 이라는 걸 개발했습니다. 27 00:01:24,667 --> 00:01:29,051 이 소프트웨어는 영상의 미세한 움직임을 찾아내 28 00:01:29,051 --> 00:01:32,613 우리가 볼 수 있을 만큼의 크기로 그 움직임을 증폭시켜줍니다. 29 00:01:33,416 --> 00:01:36,899 왼쪽 영상에 이 소프트웨어를 적용해 보면 30 00:01:36,899 --> 00:01:40,149 손목의 맥박을 눈으로 볼 수 있습니다. 31 00:01:40,149 --> 00:01:41,844 우리가 만약 이 맥박을 센다면 32 00:01:41,844 --> 00:01:44,199 이 사람의 심박수를 알아낼 수 있습니다. 33 00:01:45,095 --> 00:01:48,160 같은 소프트웨어를 오른쪽 영상에 사용해 보았습니다. 34 00:01:48,160 --> 00:01:51,387 아이가 숨쉬는 것을 눈으로 볼 수 있게 해주고, 35 00:01:51,387 --> 00:01:55,524 직접 만지지 않고도 아기의 호흡을 관찰할 수 있습니다. 36 00:01:56,884 --> 00:01:59,962 이러한 기술은 그 영향력이 매우 엄청납니다. 37 00:01:59,962 --> 00:02:03,539 보통 우리가 촉각을 통해 느끼는 현상들을 38 00:02:03,539 --> 00:02:08,076 우회적인 방법인 시각적으로 경험하게 해주기 때문입니다. 39 00:02:08,864 --> 00:02:13,275 몇 년전 저는 이 소프트웨어 개발자들과 함께 일하기 시작했습니다. 40 00:02:13,275 --> 00:02:16,632 그리고 미친 것처럼 들리는 일을 시도해 보기로 했습니다. 41 00:02:16,632 --> 00:02:17,912 "우리가 생각하기에, 42 00:02:17,922 --> 00:02:22,935 이 소프트웨어를 통해 미동을 시각화하는 것은 매우 멋진 일이며 43 00:02:22,935 --> 00:02:27,160 이는 다시말해 촉각의 역할을 연장한 것이라 할 수 있지 않은가. 44 00:02:27,170 --> 00:02:32,018 그렇다면 이와 같은 기술을 통해 듣는 능력을 확장해보면 어떨까?" 45 00:02:32,018 --> 00:02:37,173 만약 이 영상 증폭 기술을 이용해 소리의 진동을 촬영 할 수 있다면요? 46 00:02:37,173 --> 00:02:40,000 소리의 진동 역시 아주 미세한 움직임이라고 할 수 있잖아요. 47 00:02:40,000 --> 00:02:43,796 그리고 우리가 눈으로 볼 수 있는 것을 소리로 변환해 본다면요? 48 00:02:44,056 --> 00:02:46,207 다소 이상한 생각처럼 보이겠네요. 49 00:02:46,207 --> 00:02:48,793 여러분을 위해 다른 관점으로 설명해 드리겠습니다. 50 00:02:49,523 --> 00:02:51,171 일반적인 마이크의 원리는 51 00:02:51,191 --> 00:02:56,220 내부의 진동판의 움직임을 전기신호로 변환하도록 되어있는데 52 00:02:56,220 --> 00:03:00,358 진동판은 소리에 반응하여 움직이도록 설계되었습니다. 53 00:03:00,358 --> 00:03:05,065 이 움직임은 기록할 수도 있고 소리로 변환되어 읽히기도 합니다. 54 00:03:05,065 --> 00:03:09,403 소리는 사물을 진동시킬 수 있지만, 55 00:03:09,403 --> 00:03:14,883 우리 눈으로는 이 진동이 매우 미묘하고 빨라서 확인하기 어렵죠. 56 00:03:14,883 --> 00:03:18,341 그렇다면 우리가 고속 카메라로 영상을 기록하고 57 00:03:18,341 --> 00:03:23,477 이 소프트웨어를 이용해 카메라로 찍은 아주 작은 미동을 추출해 낸뒤 58 00:03:23,487 --> 00:03:28,561 어떤 소리가 그 진동을 만들었는지 분석하면 어떨까요? 59 00:03:29,249 --> 00:03:35,308 먼거리의 사물을 보는 것 만으로도 소리를 알아낼 수 있도록 해주지 않을까. 60 00:03:37,080 --> 00:03:39,263 그래서 저희가 시도해 보았습니다. 61 00:03:39,263 --> 00:03:41,190 이것이 저희가 한 실험 중 하나인데요, 62 00:03:41,190 --> 00:03:44,139 화면 오른쪽에 화분을 갖다 놓고 63 00:03:44,139 --> 00:03:46,577 근처의 스피커에 음악을 크게 틀어논 뒤 64 00:03:46,577 --> 00:03:50,106 고속카메라로 촬영해 보았습니다. 65 00:03:50,275 --> 00:03:58,465 (음악 : 떴다떴다 비행기) -스피커를 통해 음악이 나옴- 66 00:03:59,820 --> 00:04:02,644 이것이 저희가 촬영한 영상입니다. 67 00:04:02,644 --> 00:04:06,568 이 영상은 초당 수천 프레임의 속도로 기록되었지만, 68 00:04:06,568 --> 00:04:08,890 여러분이 아주 가까이서 본다 해도 69 00:04:08,890 --> 00:04:10,841 그냥 가만히 있는 70 00:04:10,841 --> 00:04:13,906 나뭇잎들만 보이실 겁니다. 71 00:04:13,906 --> 00:04:19,173 왜냐하면 이 나뭇잎들의 움직인 거리는 마이크로미터 정도로 72 00:04:19,173 --> 00:04:23,379 1 센티미터의 천분의 일 입니다. 73 00:04:23,379 --> 00:04:29,215 화면의 1 화소를 백분의 일에서 천분의 일로 나눈 정도입니다. 74 00:04:29,231 --> 00:04:32,768 그러니 여러분 마음껏 째려보세요. 75 00:04:32,768 --> 00:04:36,103 그런다해도 이렇게 미세한 움직임은 눈으로 분별하기 어렵습니다. 76 00:04:37,667 --> 00:04:41,824 하지만 이 작은 움직임은 육안으로는 자각하기 어려운 것이지만 77 00:04:41,824 --> 00:04:44,633 숫자적으로는 그 의미가 충분히 있는 것으로 드러났어요. 78 00:04:44,633 --> 00:04:46,635 왜냐하면 제대로 된 알고리듬을 통해 79 00:04:46,635 --> 00:04:49,752 무음의 정지해 있는 듯한 동영상을 찍은 뒤 80 00:04:49,752 --> 00:04:52,769 그 영상으로부터 들으시는 소리를 복원해 낼 수 있었기 때문입니다. 81 00:04:52,769 --> 00:05:00,074 (음악: 떴다떴다 비행기) 82 00:05:00,074 --> 00:05:05,902 (박수) 83 00:05:10,058 --> 00:05:11,997 이것이 어떻게 가능하냐고요? 84 00:05:11,997 --> 00:05:16,341 이 미세한 움직임을 통해 이렇게나 방대한 정보를 얻을 수 있냐고요? 85 00:05:16,341 --> 00:05:21,702 이 나뭇잎이 1 마이크로미터만큼 움직인다고 합시다. 86 00:05:21,702 --> 00:05:26,010 그리고 그것이 천만분의 1 화소만큼의 이미지가 이동했다고 합시다. 87 00:05:27,269 --> 00:05:29,841 그리 큰 숫자 같지는 않아보입니다. 88 00:05:29,841 --> 00:05:31,837 하지만 단일 프레임의 비디오는 89 00:05:31,837 --> 00:05:35,094 백만개에 가까운 화소로 이루어져있고 90 00:05:35,094 --> 00:05:38,548 전체 영상에 걸쳐 이를 모두 합치면 우리가 볼 수 있는 91 00:05:38,548 --> 00:05:40,846 아주 작은 움직임이 됩니다. 92 00:05:40,846 --> 00:05:43,469 그런후엔 이 천분의 1 화소가 93 00:05:43,469 --> 00:05:46,244 점층적으로 더해져 어떤 의미있는 움직임으로 바뀝니다. 94 00:05:46,870 --> 00:05:50,505 개인적으로는, 우리가 밝혀낸 이 사실에 대해 몹시 흥분했습니다. 95 00:05:50,505 --> 00:05:52,825 (웃음) 96 00:05:52,825 --> 00:05:56,078 하지만 제대로 된 알고리듬을 적용했어도 97 00:05:56,078 --> 00:05:59,695 아직까지 이 퍼즐의 매우 중요한 조각이 없었습니다. 98 00:05:59,695 --> 00:06:03,299 보시다 시피 많은 요소들이 언제, 어떻게 이 기술이 99 00:06:03,299 --> 00:06:05,296 잘 작동할 것인가에 대해 영향을 끼칩니다. 100 00:06:05,296 --> 00:06:08,500 측정하려는 사물과 그 거리, 101 00:06:08,500 --> 00:06:10,894 어떤 카메라와 렌즈를 사용 할 지, 102 00:06:10,894 --> 00:06:15,835 얼만큼의 빛을 사물에 노출해야 할 지 음향은 얼마나 커야 하는지 말이죠 103 00:06:15,945 --> 00:06:19,320 그리고 제대로 된 알고리즘을 이용할지라도 104 00:06:19,320 --> 00:06:22,710 초기에 실행된 실험에서는 깊은 주의를 기울여야 했습니다. 105 00:06:22,710 --> 00:06:25,102 만약 이 중 하나라도 잘못된 가정이 있었다면 106 00:06:25,102 --> 00:06:27,470 무엇이 문제인지 알아낼 방법이 없었기 때문입니다. 107 00:06:27,470 --> 00:06:30,117 아마도 그냥 시끄러운 소음만 결과물로 얻었겠죠. 108 00:06:30,117 --> 00:06:33,437 그래서 많은 초기의 실험들은 다음과 같습니다. 109 00:06:33,437 --> 00:06:35,643 여기 제가 있습니다. 110 00:06:35,643 --> 00:06:39,683 화면아래 왼쪽에 초고속 카메라가 언뜻 보이시죠 111 00:06:39,683 --> 00:06:41,866 감자칩 과자봉지를 비추고 있습니다. 112 00:06:41,866 --> 00:06:44,815 이 모든 것을 비추는 것이 밝은 이 램프 빛입니다. 113 00:06:44,815 --> 00:06:49,180 제가 말씀드렸듯이 초기 실험에서는 모든 것에 대해 매우 조심스러웠습니다. 114 00:06:49,180 --> 00:06:51,688 어떻게 진행되었는지 보여드릴게요. 115 00:06:51,688 --> 00:06:55,449 셋, 둘, 하나, 시작 116 00:06:55,449 --> 00:07:00,836 "떴다 떴다 비행기! 날아라, 날아라! " 117 00:07:00,836 --> 00:07:05,336 (웃음) 118 00:07:05,336 --> 00:07:08,150 맞아요 이 실험은 정말이지 우스꽝스러워 보입니다. 119 00:07:08,150 --> 00:07:09,938 (웃음) 120 00:07:09,938 --> 00:07:12,283 그러니까 저는 과자봉지에다 대고 소리를 지르고 121 00:07:12,283 --> 00:07:13,834 (웃음) 122 00:07:13,834 --> 00:07:15,951 엄청나게 밝은 조명을 쏘아대서 123 00:07:15,951 --> 00:07:20,560 말 그대로 첫번째 실험한 과자봉지를 녹여버릴 정도였습니다. (웃음) 124 00:07:20,560 --> 00:07:23,799 하지만 우스꽝스럽게 보이는 만큼 125 00:07:23,799 --> 00:07:25,587 그것은 매우 중요한 실험이었어요. 126 00:07:25,587 --> 00:07:28,513 왜냐하면 저희는 음향복원에 성공했기 때문입니다. 127 00:07:28,513 --> 00:07:33,225 (오디오) 떳다떳다 비행기! 날아라 날아라! 128 00:07:33,225 --> 00:07:36,993 (박수) 129 00:07:36,993 --> 00:07:40,024 그리고 이는 정말이지 막대한 중요성을 띕니다. 130 00:07:40,024 --> 00:07:43,304 왜냐하면 이 실험이 최초로 무음의 동영상에서 131 00:07:43,304 --> 00:07:45,765 인간이 말하는 소리를 복원해 낸 사례이기 때문입니다. 132 00:07:45,765 --> 00:07:48,156 이 실험을 기반으로 133 00:07:48,156 --> 00:07:52,027 우리는 점차 실험에 변형을 시도했습니다. 134 00:07:52,106 --> 00:07:55,911 다양한 사물을 이용하거나 촬영 거리를 더 멀리 조정하고 135 00:07:55,911 --> 00:07:59,191 더 적은 양의 빛과 더 작은 소리를 이용하기도 했습니다. 136 00:07:59,887 --> 00:08:02,761 이 다양한 실험결과들을 분석하며 137 00:08:02,761 --> 00:08:06,103 이 기법의 허용 한도를 이해하게 되었습니다. 138 00:08:06,103 --> 00:08:08,333 왜냐하면 우리가 이 한도를 이해한 뒤에는 139 00:08:08,333 --> 00:08:10,679 그 허용 한도를 초월해 볼 수 있기 때문입니다. 140 00:08:10,679 --> 00:08:13,510 그래서 다음과 같은 실험을 하게 되었습니다. 141 00:08:13,510 --> 00:08:16,599 또 다시 저는 과자봉지에다 대고 이야기를 합니다. 142 00:08:16,599 --> 00:08:21,429 하지만 이번에는 카메라를 4.5 미터 정도의 거리로 옮기고 143 00:08:21,429 --> 00:08:24,262 방음이 되는 유리창 뒤에 설치하였습니다. 144 00:08:24,262 --> 00:08:27,065 빛이라고는 자연광이 전부입니다. 145 00:08:28,529 --> 00:08:31,324 자 이것이 저희가 찍은 동영상 입니다. 146 00:08:32,450 --> 00:08:37,009 방음창 안에 있는 과자봉지 옆에서 들리는 소리는 다음과 같습니다. 147 00:08:37,009 --> 00:08:42,047 (오디오) 떳다 떳다 비행기 날아라 날아라 148 00:08:42,047 --> 00:08:47,666 높이높이 날아라 우리비행기 149 00:08:47,666 --> 00:08:51,683 그리고 이것이 우리가 방음창 밖에서 찍은 150 00:08:51,683 --> 00:08:54,028 동영상에서 복원해 낸 음향입니다. 151 00:08:54,028 --> 00:08:58,463 (음성) 떴다 떴다 비행기 날아라 날아라 152 00:08:58,463 --> 00:09:03,920 높이높이 날아라 우리비행기 153 00:09:03,920 --> 00:09:10,421 (박수) 154 00:09:10,421 --> 00:09:13,963 이 허용 한도를 추월해보고자 여러가지 다른 방법들도 시도했습니다. 155 00:09:13,963 --> 00:09:16,251 다음은 좀 더 작은 소리를 이용한 실험입니다. 156 00:09:16,251 --> 00:09:19,871 노트북 컴퓨터에 연결한 이어폰을 촬영한 것으로 157 00:09:19,871 --> 00:09:23,981 저희의 목표는 이어폰에서 흘러나오는 음악을 복원해 내는 것이었습니다. 158 00:09:23,981 --> 00:09:26,280 물론 플라스틱 이어폰이 찍힌 159 00:09:26,280 --> 00:09:28,787 이 동영상은 무음입니다. 160 00:09:28,787 --> 00:09:30,970 이 실험의 결과는 정확도가 매우 높아 161 00:09:30,970 --> 00:09:33,951 샤잼(Shazam)어플을 통해 음악찾기를 할 수 있을 정도였어요. 162 00:09:33,951 --> 00:09:35,842 (웃음) 163 00:09:37,191 --> 00:09:47,225 (음악: "언더 프레셔" - 퀸) 164 00:09:49,615 --> 00:09:54,584 (박수) 165 00:09:54,584 --> 00:09:59,135 다음은 다른 종류의 장비를 사용해서 허용 한도를 시험해 보기도 했습니다. 166 00:09:59,135 --> 00:10:01,596 지금까지 제가 보여드린 실험결과들은 167 00:10:01,596 --> 00:10:03,918 초고속 카메라를 사용한 것인데 168 00:10:03,918 --> 00:10:06,797 이 카메라는 우리가 가진 핸드폰 카메라보다 169 00:10:06,797 --> 00:10:08,724 100 배나 빠른 녹화가 가능합니다. 170 00:10:08,724 --> 00:10:11,533 하지만 저희는 보통의 카메라를 가지고도 171 00:10:11,533 --> 00:10:13,763 이를 구현할 수 있는 테크닉을 알아냈습니다. 172 00:10:13,763 --> 00:10:17,832 이른바 "롤링셔터"라 불리우는 효과를 이용한 것인데요 173 00:10:17,832 --> 00:10:22,630 많은 카메라들이 영상을 한 번에 한 줄씩 기록합니다. 174 00:10:22,630 --> 00:10:28,332 만약 한 장면 촬영시 사물이 움직이면 175 00:10:28,344 --> 00:10:31,061 각 줄 사이 시간차가 생기게 됩니다. 176 00:10:31,061 --> 00:10:34,218 이 때문에 약간의 인위적 변형이 일어나게 되고 177 00:10:34,218 --> 00:10:37,701 이것이 동영상 각 프레임에 남아 기록됩니다. 178 00:10:37,701 --> 00:10:41,887 우리는 알고리듬을 변형하여 이 인위적 변형을 분석한 결과 179 00:10:41,887 --> 00:10:46,122 이 동영상으로부터 음향을 복원해낼 수 있었습니다. 180 00:10:46,122 --> 00:10:48,034 이것이 저희가 한 실험입니다. 181 00:10:48,034 --> 00:10:49,729 보시는 것은 사탕봉지이고요 182 00:10:49,729 --> 00:10:51,470 주변에 있는 스피커에서 큰 소리로 183 00:10:51,470 --> 00:10:54,442 종전과 같은 "떳다 떳다 비행기" 음악이 흘러나옵니다. 184 00:10:54,442 --> 00:10:58,645 하지만 이번에는 시중에서 구입한 일반 카메라를 사용했습니다. 185 00:10:58,645 --> 00:11:01,819 잠시 후 저희가 복원한 소리를 들려드릴텐데요 186 00:11:01,819 --> 00:11:03,869 이번에는 약간 뒤틀린 듯한 소리를 들으실 것입니다. 187 00:11:03,869 --> 00:11:06,705 하지만 한 번 들어보시고 무슨 음악인지 알 수 있는 지 보세요. 188 00:11:07,723 --> 00:11:23,406 (오디오: "떳다떳다 비행기") 189 00:11:25,527 --> 00:11:28,992 소리는 뒤틀린 듯하지만 주목하실 점은 190 00:11:28,992 --> 00:11:33,378 우리가 밖에 나가 하이마트 같은 데서 191 00:11:33,378 --> 00:11:36,004 손쉽게 구할 수 있는 것들로 192 00:11:36,004 --> 00:11:39,128 이러한 기술의 구현이 가능하다는 것입니다. 193 00:11:39,128 --> 00:11:40,485 그럼 이제 194 00:11:40,485 --> 00:11:42,459 많은 사람들이 이 실험결과를 보고는 195 00:11:42,459 --> 00:11:45,872 즉각적으로 "감시카메라"를 떠올립니다. 196 00:11:45,872 --> 00:11:48,287 네 맞아요. 누군가를 감시하기 위해 197 00:11:48,287 --> 00:11:52,420 이 기술을 사용한 다는 것을 상상하기란 그리 어렵지 않습니다. 198 00:11:52,420 --> 00:11:56,367 하지만 현재에도 꽤 수준높은 감시카메라와 장비들이 199 00:11:56,367 --> 00:11:57,946 많이 있다는 것을 염두에 두십시요. 200 00:11:57,946 --> 00:12:00,036 사실, 많은 사람들이 레이저를 이용한 201 00:12:00,036 --> 00:12:02,835 원거리 도청을 수십년간이나 해왔습니다. 202 00:12:03,978 --> 00:12:06,003 하지만 여기서 새로운 점 203 00:12:06,003 --> 00:12:07,443 정말로 다른 점은 204 00:12:07,448 --> 00:12:11,538 우리는 이제 사물의 진동을 시각화 할 수 있는 방법이 생겼고 205 00:12:11,538 --> 00:12:15,071 그 기술이 세상을 다른 눈으로 볼 수 있게 해준다는 겁니다. 206 00:12:15,071 --> 00:12:20,551 또한 소리를 제어하여 진동을 일으키는 요소가 무엇인지 뿐 아니라 207 00:12:20,551 --> 00:12:24,480 사물 그 자체의 성질에 대해서도 알 수 있게 해줍니다. 208 00:12:24,480 --> 00:12:26,548 그래서 저는 한발짝 물러나 209 00:12:26,548 --> 00:12:28,558 우리가 동영상을 이용하는 용도가 210 00:12:28,558 --> 00:12:31,017 어떻게 달라질 수 있는지에 대해 생각해 보고 싶어요. 211 00:12:31,017 --> 00:12:34,470 왜냐하면 우리는 주로 어떤 것들을 보기 위해 동영상을 이용하는데 212 00:12:34,470 --> 00:12:36,792 제가 보여드린 것 처럼 영상을 통해 213 00:12:36,792 --> 00:12:38,649 그것이 내는 소리를 들을 수도 있기 때문입니다. 214 00:12:38,649 --> 00:12:42,620 하지만 사물의 성질에 대해 알 수 있는 다른 방법이 있습니다. 215 00:12:42,620 --> 00:12:44,895 바로 직접 작동해 보는 것입니다. 216 00:12:44,895 --> 00:12:48,436 우리는 사물을 밀기도 붙잡기고 하고 찌르거나 당겨보기도 합니다. 217 00:12:48,436 --> 00:12:51,187 흔들어보고 어떻게 반응하는지 살피기도 합니다. 218 00:12:51,187 --> 00:12:55,460 이것은 아직까지도 우리가 동영상으로 할 수 없는 것입니다. 219 00:12:55,460 --> 00:12:57,596 적어도 지금까지 알 던 바로는 말이죠. 220 00:12:57,596 --> 00:12:59,546 자 그럼 새로운 프로젝트를 보여드리겠습니다. 221 00:12:59,546 --> 00:13:02,213 이는 몇달전에 나온 아이디어를 기반으로 한 것인데, 222 00:13:02,213 --> 00:13:05,514 실제로 오늘 처음으로 대중에게 공개하는 것입니다. 223 00:13:05,514 --> 00:13:10,877 동영상의 미동을 이용한 기본이론을 전제로 224 00:13:10,877 --> 00:13:15,358 사물이 우리와 상호 작용 하는 방식을 포착한 것인데요, 225 00:13:15,358 --> 00:13:18,132 이들이 우리에게 어떻게 반응 하는지 알 수 있습니다. 226 00:13:19,120 --> 00:13:20,884 이것이 사물입니다. 227 00:13:20,884 --> 00:13:24,716 이 실험의 경우 사람모양의 철사로 만든 인형입니다. 228 00:13:24,716 --> 00:13:27,804 일반 카메라로 이 사물을 촬영합니다. 229 00:13:27,804 --> 00:13:29,928 카메라 자체는 별로 특이할 것이 없습니다. 230 00:13:29,928 --> 00:13:32,889 사실 이전에 제 핸드폰 카메라로 실험하기도 했습니다. 231 00:13:32,889 --> 00:13:35,141 우리는 사물의 진동을 관찰해 보고자 하는데 232 00:13:35,141 --> 00:13:36,274 그러기 위해서 233 00:13:36,274 --> 00:13:39,620 사물이 놓여진 표면을 세게 두들겨 봅니다. 234 00:13:39,620 --> 00:13:41,758 촬영하는 동안 말입니다. 235 00:13:47,398 --> 00:13:50,839 그렇습니다. 우리가 표면을 두들기는 동안 찍은 236 00:13:50,839 --> 00:13:53,205 5초 길이의 일반적인 동영상 입니다. 237 00:13:53,205 --> 00:13:56,718 진동이 포착된 이 영상을 이용해 238 00:13:56,718 --> 00:14:01,262 이 사물의 구조와 물질적 특징이 어떤 것인지 239 00:14:01,262 --> 00:14:06,096 그 정보를 이용하여 직접 사물을 조작해 볼 수 있습니다. 240 00:14:12,866 --> 00:14:15,519 자 이것이 우리가 만든 것입니다. 241 00:14:15,519 --> 00:14:17,748 보시기에는 평범한 사진 같습니다. 242 00:14:17,748 --> 00:14:20,859 하지만 이것은 사진도 동영상도 아닙니다. 243 00:14:20,859 --> 00:14:23,227 왜냐하면 지금 제가 마우스를 갖다대서 244 00:14:23,227 --> 00:14:26,086 이 사물을 움직여 볼 수 있기 때문입니다. 245 00:14:32,936 --> 00:14:34,579 보시는 것은 246 00:14:34,579 --> 00:14:37,875 이전에는 보지 못했던 힘을 가할때 이 사물이 247 00:14:37,875 --> 00:14:42,073 어떻게 반응하는 지를 보여주는 시뮬레이션입니다. 248 00:14:42,073 --> 00:14:45,706 오직 5초짜리 일반 동영상을 가지고 만들어낸 것 입니다. 249 00:14:47,249 --> 00:14:51,964 (박수) 250 00:14:57,421 --> 00:15:00,648 이것은 엄청난 영향력을 지닌 세상을 보는 방법입니다. 251 00:15:00,648 --> 00:15:02,660 왜냐하면 이로써 사물이 새로운 상황에 대해 252 00:15:02,660 --> 00:15:05,443 어떻게 반응할지 예측할 수 있게 해주기 때문입니다. 253 00:15:05,443 --> 00:15:08,916 예를들어 보죠. 여러분이 낡은 다리를 보고 254 00:15:08,916 --> 00:15:12,443 자동차로 그 다리를 건널 때에 255 00:15:12,443 --> 00:15:15,276 그 다리가 잘 버틸지를 궁금해 할 수 있습니다. 256 00:15:15,276 --> 00:15:18,480 이러한 질문은 누구라도 그 답을 알고 싶어 하는 것입니다. 257 00:15:18,480 --> 00:15:21,980 실제로 운전해서 다리를 건너기 전에 말입니다. 258 00:15:21,988 --> 00:15:25,260 물론 앞서 소개해드린 음원복원 기술처럼 259 00:15:25,260 --> 00:15:27,722 이 기술에도 한계점이 있겠지만 260 00:15:27,722 --> 00:15:30,903 우리가 예상치 못한 많은 상황에서도 261 00:15:30,903 --> 00:15:32,778 이 기술이 작동한다는 것을 확인하였습니다. 262 00:15:32,778 --> 00:15:35,546 특히 더 긴 길이의 동영상을 이용하면 말입니다. 263 00:15:35,546 --> 00:15:38,054 보시는 동영상은 제 아파트 앞 264 00:15:38,054 --> 00:15:40,353 화단을 촬영한 것입니다. 265 00:15:40,353 --> 00:15:43,441 이 나뭇가지에 그 어떤 것도 하지 않았습니다. 266 00:15:43,441 --> 00:15:46,146 1 분정도 길이의 촬영만으로도 267 00:15:46,146 --> 00:15:49,524 약한 바람에 의한 진동이 포착되었고 268 00:15:49,524 --> 00:15:53,111 이 화단에 대해 충분한 정보를 얻어 시뮬레이션을 만들어 볼 수 있었습니다. 269 00:15:55,270 --> 00:16:01,412 (박수) 270 00:16:01,412 --> 00:16:04,384 영화감독에게 이 이미지를 준다고 상상해 보세요. 271 00:16:04,384 --> 00:16:06,103 이 장면이 찍히고 난 후에 272 00:16:06,103 --> 00:16:11,025 바람의 강도와 방향을 조정할 수 있겠죠. 273 00:16:12,810 --> 00:16:17,345 보시는 것은 걸려 있는 커튼을 촬영한 것 입니다. 274 00:16:17,345 --> 00:16:21,474 동영상에는 눈으로 볼 수 있는 큰 움직임이 없습니다. 275 00:16:21,474 --> 00:16:24,399 하지만 2분짜리 영상을 촬영함으로써 276 00:16:24,399 --> 00:16:26,837 방안의 자연풍이 만들어내는 277 00:16:26,837 --> 00:16:31,249 아주 미세한 움직임과 진동을 통해 278 00:16:31,249 --> 00:16:33,814 다음과 같은 시뮬레이션을 만들 수 있습니다. 279 00:16:36,243 --> 00:16:38,609 아이러니하게도 280 00:16:38,609 --> 00:16:41,697 우리는 이미 가상현실 그래픽을 통해 이런식으로 281 00:16:41,697 --> 00:16:44,344 직접 조작해 보는 것에 대해 익숙해져있습니다. 282 00:16:44,344 --> 00:16:47,641 비디오 게임이나 3D 모델 같은것이요. 283 00:16:47,641 --> 00:16:52,045 하지만 현실세계의 실제 사물을 284 00:16:52,045 --> 00:16:54,862 단순한 동영상을 통해 이러한 정보를 얻어내느 것은 285 00:16:54,862 --> 00:16:57,705 이전에는 없었던 것으로 매우 큰 잠재력을 지니고 있습니다. 286 00:16:58,410 --> 00:17:03,314 자, 여기 이분들은 이 프로젝트에 애써주신 훌륭한 분들입니다. 287 00:17:04,057 --> 00:17:09,653 (박수) 288 00:17:12,819 --> 00:17:15,876 제가 오늘 보여드린 것은 단지 시작에 불과합니다. 289 00:17:15,876 --> 00:17:18,099 이러한 영상으로 할 수 있는 일 중 290 00:17:18,099 --> 00:17:20,961 극히 일부분에 근접했을 뿐입니다. 291 00:17:20,961 --> 00:17:23,937 이 기술을 통해 우리 주변의 것들을 292 00:17:23,937 --> 00:17:28,066 새롭게 모색할 수 있는 좀 더 보편적인 방법을 개발할 것입니다. 293 00:17:28,066 --> 00:17:29,995 미래에는 294 00:17:29,995 --> 00:17:32,032 이 기술이 가능케 할 295 00:17:32,032 --> 00:17:34,418 신나는 모험이 기다리고 있습니다. 296 00:17:34,418 --> 00:17:35,585 감사합니다. 297 00:17:35,610 --> 00:17:41,717 (박수)