WEBVTT 00:00:00.285 --> 00:00:03.178 이것은 지구의 이미지입니다. 00:00:03.178 --> 00:00:06.271 널리 알려진 아폴로 우주선에서 00:00:06.271 --> 00:00:07.882 촬영한 사진과 매우 흡사합니다. 00:00:07.882 --> 00:00:09.952 하지만 다른 점이 있는데, 00:00:09.952 --> 00:00:11.399 여러분이 클릭하실 수 있습니다. 00:00:11.399 --> 00:00:12.597 클릭해 보시면 00:00:12.597 --> 00:00:15.669 지구상의 거의 모든 곳을 확대해서 볼 수 있습니다. 00:00:15.669 --> 00:00:17.668 예를 들어 이것은 00:00:17.668 --> 00:00:20.334 EPFL 캠퍼스의 조망도입니다. 00:00:20.334 --> 00:00:22.442 많은 경우 가까운 곳들로부터 00:00:22.442 --> 00:00:26.182 건물들이 어떻게 보이는지도 볼 수 있습니다. 00:00:26.182 --> 00:00:27.604 매우 놀랍지요. 00:00:27.604 --> 00:00:31.031 하지만 이 멋진 구경에 빠진 점이 있습니다. 00:00:31.031 --> 00:00:33.219 바로 시간이지요. 00:00:33.219 --> 00:00:36.289 이 사진이 언제 촬영되었는지 잘 모르겠습니다. 00:00:36.289 --> 00:00:37.701 조망도와 같은 시간에 00:00:37.701 --> 00:00:43.784 촬영되었는지도 확실하지 않습니다. 00:00:43.784 --> 00:00:45.993 제 연구소에서는 00:00:45.993 --> 00:00:47.757 공간뿐만 아니라 00:00:47.757 --> 00:00:50.315 시간도 여행할 수 있는 도구를 개발하고 있습니다. 00:00:50.315 --> 00:00:52.185 우리가 연구하는 것은 00:00:52.185 --> 00:00:53.578 과거의 구글 지도 같은 것을 00:00:53.578 --> 00:00:55.756 만들 수 있을까요? 00:00:55.756 --> 00:00:59.066 구글 지도 위에 슬라이더를 더하고 00:00:59.066 --> 00:01:00.869 연도를 바꿔 00:01:00.869 --> 00:01:02.660 100 년 전에는 어땠는지, 00:01:02.660 --> 00:01:04.329 1,000 년 전에는 어땠는지 볼 수 있을까요? 00:01:04.329 --> 00:01:06.452 과연 가능할까요? 00:01:06.452 --> 00:01:08.704 과거의 사회 연결망을 다시 만들 수 있을까요? 00:01:08.704 --> 00:01:11.753 중세시대의 페이스북을 만들 수 있을까요? 00:01:11.753 --> 00:01:15.529 그렇다면 타임머신을 만들 수 있을까요? 00:01:15.529 --> 00:01:18.094 아마도 우리는 "아니, 그건 불가능해."라고 말하거나 00:01:18.094 --> 00:01:21.904 어쩌면 그것을 정보의 관점에서 생각할 수 있겠지요. 00:01:21.904 --> 00:01:25.094 이것이 제가 정보 버섯이라고 부르는 것입니다. 00:01:25.094 --> 00:01:26.677 수직축에 시간을 놓고, 00:01:26.677 --> 00:01:29.417 수평축에 가능한 디지털 정보의 양을 놓습니다. 00:01:29.417 --> 00:01:32.899 지난 10 년간의 많은 정보를 가지고 있는 것이 분명하지만 00:01:32.899 --> 00:01:36.447 과거로 갈수록 적은 정보를 가지고 있는 것도 분명하지요. 00:01:36.447 --> 00:01:38.765 과거의 구글 지도나, 00:01:38.765 --> 00:01:40.259 과거의 페이스북 같은 것을 만드려면 00:01:40.259 --> 00:01:41.833 이 공간을 확장해야 하고, 00:01:41.833 --> 00:01:43.771 그것을 사각형 같이 만들어야 합니다. 00:01:43.771 --> 00:01:45.281 어떻게 하면 될까요? 00:01:45.281 --> 00:01:47.379 한가지 방법은 디지털화를 시키는 겁니다. 00:01:47.395 --> 00:01:49.174 신문이나 수천 권의 책들과 같은 00:01:49.190 --> 00:01:55.460 수많은 자료들이 가능하지요. 00:01:55.460 --> 00:01:57.228 이것들을 디지털화 할 수 있습니다. 00:01:57.228 --> 00:01:59.965 이것들로부터 정보를 추출할 수 있습니다. 00:01:59.965 --> 00:02:03.508 물론 과거로 갈수록 더 적은 정보를 갖게 되겠지요. 00:02:03.508 --> 00:02:06.154 그래서 아마도 충분치 않을 것이고, 00:02:06.154 --> 00:02:08.562 그래서 역사학자들이 하는 방식대로 00:02:08.562 --> 00:02:10.086 기존의 자료를 바탕으로 추정할 수 있습니다. 00:02:10.086 --> 00:02:14.556 이것이 컴퓨터 과학에서 말하는 시물레이션입니다. 00:02:14.556 --> 00:02:16.307 항해일지를 보고서 00:02:16.307 --> 00:02:18.711 단순히 한 베니치아 선장의 특정한 항해일지가 00:02:18.711 --> 00:02:21.683 아닌 걸로 여길 수 있습니다. 00:02:21.683 --> 00:02:23.326 그 일지가 당시의 많은 여행을 00:02:23.326 --> 00:02:25.908 대표하는 것으로 볼 수 있겠지요. 00:02:25.908 --> 00:02:28.153 이것이 가능한 자료를 가지고 추정하는 방법입니다. 00:02:28.153 --> 00:02:30.191 한 건물을 그린 그림이 있다면 00:02:30.191 --> 00:02:32.942 그것을 어떤 특정한 건물이라고 여기는 것이 아니라 00:02:32.942 --> 00:02:36.874 정보를 갖고 있지 못한 다른 건물들에 00:02:36.874 --> 00:02:40.915 공통적으로 적용되는 규칙을 가지고 있다고 보는거죠. NOTE Paragraph 00:02:40.915 --> 00:02:43.773 타임머신을 만들고 싶다면 00:02:43.773 --> 00:02:45.112 두 가지가 필요합니다. 00:02:45.112 --> 00:02:47.346 아주 거대한 기록물 보관소와 00:02:47.346 --> 00:02:50.088 뛰어난 전문가들이지요. 00:02:50.088 --> 00:02:51.962 '베니스 타임머신'이 00:02:51.962 --> 00:02:53.767 여러분께 말씀드리고자 하는 프로젝트로, 00:02:53.767 --> 00:02:56.787 EPFL(로잔연방공과대학교)과 00:02:56.787 --> 00:02:59.765 베니스의 카포스카리대학교와의 합작 프로젝트입니다. NOTE Paragraph 00:02:59.765 --> 00:03:01.930 베니스에는 아주 특별한 점이 있는데, 00:03:01.930 --> 00:03:04.604 행정이 매우 매우 00:03:04.604 --> 00:03:06.798 관료주의적이었다는 것입니다. 00:03:06.798 --> 00:03:08.991 그들은 오늘날의 구글처럼 00:03:08.991 --> 00:03:11.906 모든 것을 기록했습니다. 00:03:11.906 --> 00:03:13.420 베니스 시 기록관의 00:03:13.420 --> 00:03:15.184 80km 분량의 기록물에는 00:03:15.184 --> 00:03:17.193 천 년 이상되는 00:03:17.193 --> 00:03:19.439 모든 베니스의 삶이 기록되어 있습니다. 00:03:19.439 --> 00:03:21.359 모든 선박들의 00:03:21.359 --> 00:03:22.435 출항과 입항 기록이 있고 00:03:22.435 --> 00:03:25.232 도시 내의 모든 변화의 기록이 있습니다. 00:03:25.232 --> 00:03:28.523 모든 것이 그 안에 있지요. 00:03:28.523 --> 00:03:32.431 이 어마어마한 기록물을 00:03:32.431 --> 00:03:34.108 거대한 정보 시스템으로 옮길 목적으로 00:03:34.108 --> 00:03:35.492 10 년간의 디지털화 프로그램을 00:03:35.492 --> 00:03:37.918 수립하였습니다. 00:03:37.918 --> 00:03:39.775 하루에 450 권의 책을 00:03:39.775 --> 00:03:44.501 디지털화하고자 했지요. 00:03:44.501 --> 00:03:46.748 물론 디지털화만으로 충분하지 않습니다. 00:03:46.748 --> 00:03:48.035 왜냐하면 이 문서들은 00:03:48.035 --> 00:03:50.674 대부분이 라틴어, 투스칸어, 00:03:50.689 --> 00:03:52.204 베니스 방언 등으로 기록되어 00:03:52.204 --> 00:03:53.879 이들을 문자화하고 00:03:53.879 --> 00:03:55.560 어떤 경우는 번역도 해야 하고 00:03:55.560 --> 00:03:56.680 분류해야 했기에 00:03:56.680 --> 00:03:58.844 확실히 쉬운 일은 아니었습니다. 00:03:58.844 --> 00:04:02.688 특히 기존의 광학 문자 인식 도구는 00:04:02.688 --> 00:04:04.112 인쇄 문서에는 사용이 가능하지만 00:04:04.112 --> 00:04:08.116 수기 문서에는 잘 작동하지 않습니다. 00:04:08.116 --> 00:04:10.246 그래서 다른 영역에서 영감을 얻어 00:04:10.246 --> 00:04:13.147 해결 방법을 찾았죠. 바로 음성 인식입니다. 00:04:13.147 --> 00:04:15.202 이는 불가능처럼 보이지만 00:04:15.202 --> 00:04:17.739 실제로는 추가적인 제한 사항을 적용하는 것만으로도 00:04:17.739 --> 00:04:19.933 충분히 가능하게 할 수 있습니다. 00:04:19.933 --> 00:04:21.519 사용된 언어의 00:04:21.519 --> 00:04:23.045 매우 좋은 표본을 가지고 있거나 00:04:23.045 --> 00:04:25.131 잘 구성된 문서의 00:04:25.131 --> 00:04:26.563 매우 좋은 표본을 가지고 있다면 말이죠. 00:04:26.563 --> 00:04:27.916 행정 관련 서류들이 바로 이에 해당합니다. 00:04:27.931 --> 00:04:30.063 그런 서류들은 대부분 구성이 잘 되어있죠. 00:04:30.063 --> 00:04:33.371 거대한 기록물을 비슷한 특징을 지닌 00:04:33.371 --> 00:04:36.248 작은 부분으로 나눈다면 00:04:36.248 --> 00:04:40.279 음성 인식은 성공할 여지가 있습니다. NOTE Paragraph 00:04:42.761 --> 00:04:45.196 이 단계에 도달하면 다른 것이 기다리고 있습니다. 00:04:45.196 --> 00:04:48.718 이 문서에서 사건들을 추출할 수 있지요. 00:04:48.718 --> 00:04:51.016 실제로 이 기록물에서 거의 100억 건의 00:04:51.016 --> 00:04:52.947 사건을 찾을 수 있을겁니다. 00:04:52.947 --> 00:04:54.671 그리고 이 거대한 정보 시스템 속을 00:04:54.671 --> 00:04:56.487 뒤지는 방법은 여러가지가 있겠죠. 00:04:56.487 --> 00:04:57.855 예를 들자면, 00:04:57.855 --> 00:05:00.615 "1323년에 이 저택에는 누가 살았지?" 00:05:00.615 --> 00:05:02.837 "1434년에 리알토 시장에서 참돔은 00:05:02.837 --> 00:05:04.561 얼마였지?" 00:05:04.561 --> 00:05:06.021 "대략 십년 동안 00:05:06.021 --> 00:05:08.066 한 무라노의 유리 제조자가 00:05:08.066 --> 00:05:09.472 번 돈은 얼마였을까?"같은 질문들입니다. 00:05:09.472 --> 00:05:10.894 이 프로그램은 '시맨틱 웹 기술'(컴퓨터가 정보 제공을 위해 자체적으로 정보를 수집하여 추론하는 처리기능)을 00:05:10.894 --> 00:05:13.632 기반으로 코딩될 것이기 때문에 더 광범위한 질문도 할 수 있습니다. 00:05:13.632 --> 00:05:15.772 그렇게 얻은 답은 4차원 공간에 둘 수 있는데, 00:05:15.772 --> 00:05:17.945 이것은 이 정보 자체가 4차원이기 때문입니다. 00:05:17.945 --> 00:05:19.880 그러면 천 년이 넘는 시간 동안 00:05:19.880 --> 00:05:21.993 환경 파괴 없이 발전을 해오며 00:05:21.993 --> 00:05:25.349 줄곧 주변 환경과 평형을 유지한 00:05:25.349 --> 00:05:27.475 이 도시로의 00:05:27.475 --> 00:05:29.095 특별한 여행을 00:05:29.095 --> 00:05:31.956 재구성하는 것이 가능해집니다. 00:05:31.956 --> 00:05:33.204 그 여정을 재구성하고 00:05:33.204 --> 00:05:36.100 여러가지 방법으로 시각화할 수 있습니다. 00:05:36.100 --> 00:05:38.799 그러나 물론 베니스를 바라보기만 한다고 이해할 수 있는 것은 아닙니다. 00:05:38.799 --> 00:05:41.195 이 도시를 범(汎)유럽적 맥락에서도 바라보아야 합니다. 00:05:41.195 --> 00:05:44.016 그래서 이 기획은 유럽 전체를 대상으로 00:05:44.016 --> 00:05:46.439 모든 것을 기록하고자 합니다. 00:05:46.439 --> 00:05:48.403 또한 베니스 해상 왕국이 00:05:48.403 --> 00:05:50.393 어떻게 서서히 아드리아해를 장악하고 00:05:50.393 --> 00:05:53.559 어떻게 당시 최강의 00:05:53.559 --> 00:05:57.305 중세 왕국이 되어 00:05:57.305 --> 00:05:58.866 동에서 남에 이르는 00:05:58.866 --> 00:06:01.038 대부분의 항로를 좌지우지 했는지 볼 수 있는 00:06:01.038 --> 00:06:03.971 여행을 재구성할 수도 있습니다. NOTE Paragraph 00:06:05.305 --> 00:06:07.621 물론 다른 일들도 가능합니다. 00:06:07.621 --> 00:06:09.898 이 항해로에는 00:06:09.898 --> 00:06:11.873 일정한 규칙이 있기 때문이지요. 00:06:11.889 --> 00:06:14.382 한 단계 더 들어가 00:06:14.382 --> 00:06:16.502 실제로 시뮬레이션 시스템, 00:06:16.502 --> 00:06:19.317 지중해 시뮬레이터를 만들 수 있습니다. 00:06:19.317 --> 00:06:21.910 심지어 우리가 놓친 정보까지 00:06:21.910 --> 00:06:24.112 실제로 재구성이 가능한 시뮬레이터로 00:06:24.112 --> 00:06:27.100 여행 일정표를 짜는 프로그램처럼 00:06:27.100 --> 00:06:30.088 여러분의 질문에 답할 수도 있습니다. NOTE Paragraph 00:06:30.088 --> 00:06:33.159 "1323년 6월에 그리스 코르푸에 있는데 00:06:33.159 --> 00:06:35.685 콘스탄티노플에 가고 싶다면 00:06:35.685 --> 00:06:37.828 어디서 배를 타야 하나요?" NOTE Paragraph 00:06:37.828 --> 00:06:39.195 아마도 이 질문에 대해서 00:06:39.195 --> 00:06:43.668 하루 내지 사흘 안의 정확도 내에서 답할 수 있을 겁니다. NOTE Paragraph 00:06:43.668 --> 00:06:45.275 "비용은 얼마나 드나요?" NOTE Paragraph 00:06:45.275 --> 00:06:48.867 "해적을 만날 확률은 얼마나 되나요?" NOTE Paragraph 00:06:48.867 --> 00:06:50.678 물론 이해하셔야 할 것은 00:06:50.678 --> 00:06:53.287 이런 프로젝트에서 가장 중요한 과학적 도전은 00:06:53.287 --> 00:06:57.016 기준에 맞게 수정하고 수량화하고 또한 이 과정의 각 단계마다 00:06:57.016 --> 00:07:00.346 불확실성과 불연속성을 반영하는 것입니다. 00:07:00.346 --> 00:07:03.058 도처에 오류가 있습니다. 00:07:03.058 --> 00:07:05.547 선장의 이름이 틀렸다던가, 00:07:05.547 --> 00:07:08.760 어떤 배들은 항해에 한 번도 나간 적이 없다는 것 등이죠. 00:07:08.760 --> 00:07:13.617 번역에도 실수가, 추론에도 편견이 있고 00:07:13.624 --> 00:07:17.090 거기에 알고리듬적 과정을 더하면 00:07:17.090 --> 00:07:20.039 인식의 오류나 00:07:20.039 --> 00:07:22.000 인용의 오류마저 있을 수 있기에 00:07:22.000 --> 00:07:26.481 매우 불확실한 자료를 갖고 있는 것이죠. NOTE Paragraph 00:07:26.481 --> 00:07:30.238 그렇다면 어떻게 이런 오류들을 찾아내고 고칠 수 있을까요? 00:07:30.238 --> 00:07:33.898 어떻게 불확실성을 반영할 수 있을까요? 00:07:33.898 --> 00:07:35.995 어려운 일이죠. 한가지 방법은 00:07:35.995 --> 00:07:38.221 프로그램에 역사적 정보를 기록하는 것뿐만 아니라 00:07:38.221 --> 00:07:40.669 어떻게 역사적 지식이 구성되었는지를 알려주는 00:07:40.669 --> 00:07:43.348 우리가 메타-역사 정보라고 00:07:43.348 --> 00:07:46.011 부르는 정보의 단계별 과정을 00:07:46.011 --> 00:07:48.009 일일이 기록하는 것입니다. 00:07:48.009 --> 00:07:49.654 이것이 베니스에서 있었던 특정 이야기의 00:07:49.654 --> 00:07:52.104 진실을 찾는다고 보장할 수는 없지만 00:07:52.104 --> 00:07:54.242 실제로 기록되어 있을만한 베니스의 잠재적인 이야기를 00:07:54.242 --> 00:07:57.290 재구성할 수는 있을 것입니다. 00:07:57.290 --> 00:07:58.749 지도는 아예 없을 수도 있고 00:07:58.749 --> 00:08:00.869 어쩌면 여러 개의 지도가 있을 수도 있습니다. 00:08:00.869 --> 00:08:03.085 이런 류의 방대한 데이터베이스에서는 전무했던 00:08:03.085 --> 00:08:05.944 불확실성의 새로운 형태를 다뤄야 하기 때문에 00:08:05.944 --> 00:08:10.585 이 시스템은 그런 상황도 받아들일 수 있어야합니다. NOTE Paragraph 00:08:10.585 --> 00:08:12.775 어떻게 이 새로운 연구를 대중과 00:08:12.790 --> 00:08:16.769 소통하게 할 수 있을까요? 00:08:16.769 --> 00:08:19.432 다시 강조하자면, 베니스는 그 점에서 특별합니다. 00:08:19.432 --> 00:08:21.603 매년 수백만의 방문객들이 찾는 곳이기에 00:08:21.603 --> 00:08:23.366 미래의 박물관에 투자해 볼만한 00:08:23.366 --> 00:08:26.354 최고의 장소 중 하나입니다. 00:08:26.354 --> 00:08:29.658 상상해 보세요. 특정한 연도에 수평적으로 00:08:29.658 --> 00:08:30.944 재현된 지도를 보고 00:08:30.944 --> 00:08:33.902 수직적으로는 그 재현을 도운 00:08:33.902 --> 00:08:35.413 기록물, 예를 들자면 미술품을 00:08:35.413 --> 00:08:38.813 볼 수 있게 되는겁니다. 00:08:38.813 --> 00:08:41.393 특정한 연도의 베니스를 재현하고 탐험할 수 있는 00:08:41.393 --> 00:08:44.895 몰입도가 높은 시스템을 상상해보세요. 00:08:44.895 --> 00:08:47.610 일부는 단체로 공유할 수도 있는 경험들 말이에요. 00:08:47.610 --> 00:08:49.856 반대로 한 문서, 베니스의 00:08:49.856 --> 00:08:52.063 한 서류로부터 시작해서 00:08:52.063 --> 00:08:55.112 그것으로 부터 재현할 수 있는 것을 보여주고 00:08:55.112 --> 00:08:56.884 어떻게 해석되고 00:08:56.884 --> 00:08:59.299 어떻게 그 문서의 문맥들이 재현될 수 있는지를 상상해보세요. 00:08:59.299 --> 00:09:01.184 지금 보여드리는 영상은 00:09:01.184 --> 00:09:03.460 제가 말씀드린 시스템을 사용해서 00:09:03.460 --> 00:09:05.814 제네바에서 진행되고 있는 한 전시회의 모습입니다. NOTE Paragraph 00:09:05.814 --> 00:09:07.989 결론을 말씀드리면 00:09:07.989 --> 00:09:11.068 지금 인문학계에서의 연구는 00:09:11.068 --> 00:09:12.870 생명 과학이 30년 전에 겪었던 것과 00:09:12.870 --> 00:09:17.452 비슷한 종류의 진화를 거치기 직전입니다. 00:09:17.452 --> 00:09:22.128 이것은 정말 규모의 문제입니다. 00:09:22.130 --> 00:09:25.433 우리가 관장하는 프로젝트들은 00:09:25.433 --> 00:09:29.276 하나의 연구팀 혼자서 하기에는 벅찬 일입니다. 00:09:29.276 --> 00:09:31.519 그리고 이것은 소규모 모임이나 00:09:31.519 --> 00:09:35.388 고작 한두 명의 연구원끼리 00:09:35.388 --> 00:09:39.396 일하는 습관을 가진 인문학계에게는 새로운 도전입니다. 00:09:39.396 --> 00:09:41.514 베니스시 기록관을 방문하시면 00:09:41.514 --> 00:09:44.336 어떤 한 팀이 할 수 있는 것 이상이고 00:09:44.336 --> 00:09:48.170 학계 공동의 노력이 필요하다는 것을 느끼실 겁니다. 00:09:48.170 --> 00:09:51.276 그래서 우리가 이 패러다임의 변화를 위해서는 00:09:51.276 --> 00:09:53.178 이 변화에 준비된 00:09:53.178 --> 00:09:54.715 "디지털 인문학자"인 00:09:54.715 --> 00:09:56.805 새로운 세대를 육성해야 합니다. NOTE Paragraph 00:09:56.805 --> 00:09:58.764 대단히 고맙습니다. NOTE Paragraph 00:09:58.764 --> 00:10:02.764 (박수)