Return to Video

어떻게 정보 타임머신을 만들었는가

  • 0:00 - 0:03
    이것은 지구의 이미지입니다.
  • 0:03 - 0:06
    널리 알려진 아폴로 우주선에서
  • 0:06 - 0:08
    촬영한 사진과 매우 흡사합니다.
  • 0:08 - 0:10
    하지만 다른 점이 있는데,
  • 0:10 - 0:11
    여러분이 클릭하실 수 있습니다.
  • 0:11 - 0:13
    클릭해 보시면
  • 0:13 - 0:16
    지구상의 거의 모든 곳을
    확대해서 볼 수 있습니다.
  • 0:16 - 0:18
    예를 들어 이것은
  • 0:18 - 0:20
    EPFL 캠퍼스의 조망도입니다.
  • 0:20 - 0:22
    많은 경우 가까운 곳들로부터
  • 0:22 - 0:26
    건물들이 어떻게 보이는지도 볼 수 있습니다.
  • 0:26 - 0:28
    매우 놀랍지요.
  • 0:28 - 0:31
    하지만 이 멋진 구경에 빠진 점이 있습니다.
  • 0:31 - 0:33
    바로 시간이지요.
  • 0:33 - 0:36
    이 사진이 언제 촬영되었는지
    잘 모르겠습니다.
  • 0:36 - 0:38
    조망도와 같은 시간에
  • 0:38 - 0:44
    촬영되었는지도 확실하지 않습니다.
  • 0:44 - 0:46
    제 연구소에서는
  • 0:46 - 0:48
    공간뿐만 아니라
  • 0:48 - 0:50
    시간도 여행할 수 있는 도구를
    개발하고 있습니다.
  • 0:50 - 0:52
    우리가 연구하는 것은
  • 0:52 - 0:54
    과거의 구글 지도 같은 것을
  • 0:54 - 0:56
    만들 수 있을까요?
  • 0:56 - 0:59
    구글 지도 위에 슬라이더를 더하고
  • 0:59 - 1:01
    연도를 바꿔
  • 1:01 - 1:03
    100 년 전에는 어땠는지,
  • 1:03 - 1:04
    1,000 년 전에는 어땠는지 볼 수 있을까요?
  • 1:04 - 1:06
    과연 가능할까요?
  • 1:06 - 1:09
    과거의 사회 연결망을 다시 만들 수 있을까요?
  • 1:09 - 1:12
    중세시대의 페이스북을 만들 수 있을까요?
  • 1:12 - 1:16
    그렇다면 타임머신을 만들 수 있을까요?
  • 1:16 - 1:18
    아마도 우리는
    "아니, 그건 불가능해."라고 말하거나
  • 1:18 - 1:22
    어쩌면 그것을 정보의 관점에서
    생각할 수 있겠지요.
  • 1:22 - 1:25
    이것이 제가 정보 버섯이라고
    부르는 것입니다.
  • 1:25 - 1:27
    수직축에 시간을 놓고,
  • 1:27 - 1:29
    수평축에 가능한 디지털 정보의 양을
    놓습니다.
  • 1:29 - 1:33
    지난 10 년간의 많은 정보를
    가지고 있는 것이 분명하지만
  • 1:33 - 1:36
    과거로 갈수록 적은 정보를
    가지고 있는 것도 분명하지요.
  • 1:36 - 1:39
    과거의 구글 지도나,
  • 1:39 - 1:40
    과거의 페이스북 같은 것을 만드려면
  • 1:40 - 1:42
    이 공간을 확장해야 하고,
  • 1:42 - 1:44
    그것을 사각형 같이 만들어야 합니다.
  • 1:44 - 1:45
    어떻게 하면 될까요?
  • 1:45 - 1:47
    한가지 방법은 디지털화를 시키는 겁니다.
  • 1:47 - 1:49
    신문이나 수천 권의 책들과 같은
  • 1:49 - 1:55
    수많은 자료들이 가능하지요.
  • 1:55 - 1:57
    이것들을 디지털화 할 수 있습니다.
  • 1:57 - 2:00
    이것들로부터 정보를 추출할 수 있습니다.
  • 2:00 - 2:04
    물론 과거로 갈수록
    더 적은 정보를 갖게 되겠지요.
  • 2:04 - 2:06
    그래서 아마도 충분치 않을 것이고,
  • 2:06 - 2:09
    그래서 역사학자들이 하는 방식대로
  • 2:09 - 2:10
    기존의 자료를 바탕으로
    추정할 수 있습니다.
  • 2:10 - 2:15
    이것이 컴퓨터 과학에서 말하는
    시물레이션입니다.
  • 2:15 - 2:16
    항해일지를 보고서
  • 2:16 - 2:19
    단순히 한 베니치아 선장의 특정한 항해일지가
  • 2:19 - 2:22
    아닌 걸로 여길 수 있습니다.
  • 2:22 - 2:23
    그 일지가 당시의 많은 여행을
  • 2:23 - 2:26
    대표하는 것으로 볼 수 있겠지요.
  • 2:26 - 2:28
    이것이 가능한 자료를 가지고
    추정하는 방법입니다.
  • 2:28 - 2:30
    한 건물을 그린 그림이 있다면
  • 2:30 - 2:33
    그것을 어떤 특정한 건물이라고
    여기는 것이 아니라
  • 2:33 - 2:37
    정보를 갖고 있지 못한 다른 건물들에
  • 2:37 - 2:41
    공통적으로 적용되는 규칙을
    가지고 있다고 보는거죠.
  • 2:41 - 2:44
    타임머신을 만들고 싶다면
  • 2:44 - 2:45
    두 가지가 필요합니다.
  • 2:45 - 2:47
    아주 거대한 기록물 보관소와
  • 2:47 - 2:50
    뛰어난 전문가들이지요.
  • 2:50 - 2:52
    '베니스 타임머신'이
  • 2:52 - 2:54
    여러분께 말씀드리고자 하는 프로젝트로,
  • 2:54 - 2:57
    EPFL(로잔연방공과대학교)과
  • 2:57 - 3:00
    베니스의 카포스카리대학교와의
    합작 프로젝트입니다.
  • 3:00 - 3:02
    베니스에는 아주 특별한 점이 있는데,
  • 3:02 - 3:05
    행정이 매우 매우
  • 3:05 - 3:07
    관료주의적이었다는 것입니다.
  • 3:07 - 3:09
    그들은 오늘날의 구글처럼
  • 3:09 - 3:12
    모든 것을 기록했습니다.
  • 3:12 - 3:13
    베니스 시 기록관의
  • 3:13 - 3:15
    80km 분량의 기록물에는
  • 3:15 - 3:17
    천 년 이상되는
  • 3:17 - 3:19
    모든 베니스의 삶이 기록되어 있습니다.
  • 3:19 - 3:21
    모든 선박들의
  • 3:21 - 3:22
    출항과 입항 기록이 있고
  • 3:22 - 3:25
    도시 내의 모든 변화의 기록이 있습니다.
  • 3:25 - 3:29
    모든 것이 그 안에 있지요.
  • 3:29 - 3:32
    이 어마어마한 기록물을
  • 3:32 - 3:34
    거대한 정보 시스템으로 옮길 목적으로
  • 3:34 - 3:35
    10 년간의 디지털화 프로그램을
  • 3:35 - 3:38
    수립하였습니다.
  • 3:38 - 3:40
    하루에 450 권의 책을
  • 3:40 - 3:45
    디지털화하고자 했지요.
  • 3:45 - 3:47
    물론 디지털화만으로 충분하지 않습니다.
  • 3:47 - 3:48
    왜냐하면 이 문서들은
  • 3:48 - 3:51
    대부분이 라틴어, 투스칸어,
  • 3:51 - 3:52
    베니스 방언 등으로 기록되어
  • 3:52 - 3:54
    이들을 문자화하고
  • 3:54 - 3:56
    어떤 경우는 번역도 해야 하고
  • 3:56 - 3:57
    분류해야 했기에
  • 3:57 - 3:59
    확실히 쉬운 일은 아니었습니다.
  • 3:59 - 4:03
    특히 기존의 광학 문자 인식 도구는
  • 4:03 - 4:04
    인쇄 문서에는 사용이 가능하지만
  • 4:04 - 4:08
    수기 문서에는 잘 작동하지 않습니다.
  • 4:08 - 4:10
    그래서 다른 영역에서 영감을 얻어
  • 4:10 - 4:13
    해결 방법을 찾았죠.
    바로 음성 인식입니다.
  • 4:13 - 4:15
    이는 불가능처럼 보이지만
  • 4:15 - 4:18
    실제로는 추가적인 제한 사항을
    적용하는 것만으로도
  • 4:18 - 4:20
    충분히 가능하게 할 수 있습니다.
  • 4:20 - 4:22
    사용된 언어의
  • 4:22 - 4:23
    매우 좋은 표본을 가지고 있거나
  • 4:23 - 4:25
    잘 구성된 문서의
  • 4:25 - 4:27
    매우 좋은 표본을 가지고 있다면 말이죠.
  • 4:27 - 4:28
    행정 관련 서류들이 바로 이에 해당합니다.
  • 4:28 - 4:30
    그런 서류들은 대부분 구성이 잘 되어있죠.
  • 4:30 - 4:33
    거대한 기록물을 비슷한 특징을 지닌
  • 4:33 - 4:36
    작은 부분으로 나눈다면
  • 4:36 - 4:40
    음성 인식은 성공할 여지가 있습니다.
  • 4:43 - 4:45
    이 단계에 도달하면
    다른 것이 기다리고 있습니다.
  • 4:45 - 4:49
    이 문서에서
    사건들을 추출할 수 있지요.
  • 4:49 - 4:51
    실제로 이 기록물에서 거의 100억 건의
  • 4:51 - 4:53
    사건을 찾을 수 있을겁니다.
  • 4:53 - 4:55
    그리고 이 거대한 정보 시스템 속을
  • 4:55 - 4:56
    뒤지는 방법은 여러가지가 있겠죠.
  • 4:56 - 4:58
    예를 들자면,
  • 4:58 - 5:01
    "1323년에 이 저택에는 누가 살았지?"
  • 5:01 - 5:03
    "1434년에 리알토 시장에서 참돔은
  • 5:03 - 5:05
    얼마였지?"
  • 5:05 - 5:06
    "대략 십년 동안
  • 5:06 - 5:08
    한 무라노의 유리 제조자가
  • 5:08 - 5:09
    번 돈은 얼마였을까?"같은 질문들입니다.
  • 5:09 - 5:11
    이 프로그램은 '시맨틱 웹 기술'(컴퓨터가 정보 제공을 위해 자체적으로 정보를 수집하여 추론하는 처리기능)을
  • 5:11 - 5:14
    기반으로 코딩될 것이기 때문에
    더 광범위한 질문도 할 수 있습니다.
  • 5:14 - 5:16
    그렇게 얻은 답은 4차원 공간에 둘 수 있는데,
  • 5:16 - 5:18
    이것은 이 정보 자체가 4차원이기 때문입니다.
  • 5:18 - 5:20
    그러면 천 년이 넘는 시간 동안
  • 5:20 - 5:22
    환경 파괴 없이 발전을 해오며
  • 5:22 - 5:25
    줄곧 주변 환경과 평형을 유지한
  • 5:25 - 5:27
    이 도시로의
  • 5:27 - 5:29
    특별한 여행을
  • 5:29 - 5:32
    재구성하는 것이 가능해집니다.
  • 5:32 - 5:33
    그 여정을 재구성하고
  • 5:33 - 5:36
    여러가지 방법으로 시각화할 수 있습니다.
  • 5:36 - 5:39
    그러나 물론 베니스를 바라보기만 한다고
    이해할 수 있는 것은 아닙니다.
  • 5:39 - 5:41
    이 도시를 범(汎)유럽적 맥락에서도
    바라보아야 합니다.
  • 5:41 - 5:44
    그래서 이 기획은 유럽 전체를 대상으로
  • 5:44 - 5:46
    모든 것을 기록하고자 합니다.
  • 5:46 - 5:48
    또한 베니스 해상 왕국이
  • 5:48 - 5:50
    어떻게 서서히 아드리아해를 장악하고
  • 5:50 - 5:54
    어떻게 당시 최강의
  • 5:54 - 5:57
    중세 왕국이 되어
  • 5:57 - 5:59
    동에서 남에 이르는
  • 5:59 - 6:01
    대부분의 항로를 좌지우지 했는지 볼 수 있는
  • 6:01 - 6:04
    여행을 재구성할 수도 있습니다.
  • 6:05 - 6:08
    물론 다른 일들도 가능합니다.
  • 6:08 - 6:10
    이 항해로에는
  • 6:10 - 6:12
    일정한 규칙이 있기 때문이지요.
  • 6:12 - 6:14
    한 단계 더 들어가
  • 6:14 - 6:17
    실제로 시뮬레이션 시스템,
  • 6:17 - 6:19
    지중해 시뮬레이터를 만들 수 있습니다.
  • 6:19 - 6:22
    심지어 우리가 놓친 정보까지
  • 6:22 - 6:24
    실제로 재구성이 가능한 시뮬레이터로
  • 6:24 - 6:27
    여행 일정표를 짜는 프로그램처럼
  • 6:27 - 6:30
    여러분의 질문에 답할 수도 있습니다.
  • 6:30 - 6:33
    "1323년 6월에 그리스 코르푸에 있는데
  • 6:33 - 6:36
    콘스탄티노플에 가고 싶다면
  • 6:36 - 6:38
    어디서 배를 타야 하나요?"
  • 6:38 - 6:39
    아마도 이 질문에 대해서
  • 6:39 - 6:44
    하루 내지 사흘 안의 정확도 내에서
    답할 수 있을 겁니다.
  • 6:44 - 6:45
    "비용은 얼마나 드나요?"
  • 6:45 - 6:49
    "해적을 만날 확률은 얼마나 되나요?"
  • 6:49 - 6:51
    물론 이해하셔야 할 것은
  • 6:51 - 6:53
    이런 프로젝트에서
    가장 중요한 과학적 도전은
  • 6:53 - 6:57
    기준에 맞게 수정하고 수량화하고
    또한 이 과정의 각 단계마다
  • 6:57 - 7:00
    불확실성과 불연속성을
    반영하는 것입니다.
  • 7:00 - 7:03
    도처에 오류가 있습니다.
  • 7:03 - 7:06
    선장의 이름이 틀렸다던가,
  • 7:06 - 7:09
    어떤 배들은 항해에 한 번도
    나간 적이 없다는 것 등이죠.
  • 7:09 - 7:14
    번역에도 실수가, 추론에도 편견이 있고
  • 7:14 - 7:17
    거기에 알고리듬적 과정을 더하면
  • 7:17 - 7:20
    인식의 오류나
  • 7:20 - 7:22
    인용의 오류마저 있을 수 있기에
  • 7:22 - 7:26
    매우 불확실한 자료를 갖고 있는 것이죠.
  • 7:26 - 7:30
    그렇다면 어떻게 이런 오류들을
    찾아내고 고칠 수 있을까요?
  • 7:30 - 7:34
    어떻게 불확실성을 반영할 수 있을까요?
  • 7:34 - 7:36
    어려운 일이죠. 한가지 방법은
  • 7:36 - 7:38
    프로그램에 역사적 정보를
    기록하는 것뿐만 아니라
  • 7:38 - 7:41
    어떻게 역사적 지식이
    구성되었는지를 알려주는
  • 7:41 - 7:43
    우리가 메타-역사 정보라고
  • 7:43 - 7:46
    부르는 정보의 단계별 과정을
  • 7:46 - 7:48
    일일이 기록하는 것입니다.
  • 7:48 - 7:50
    이것이 베니스에서 있었던 특정 이야기의
  • 7:50 - 7:52
    진실을 찾는다고 보장할 수는 없지만
  • 7:52 - 7:54
    실제로 기록되어 있을만한
    베니스의 잠재적인 이야기를
  • 7:54 - 7:57
    재구성할 수는 있을 것입니다.
  • 7:57 - 7:59
    지도는 아예 없을 수도 있고
  • 7:59 - 8:01
    어쩌면 여러 개의 지도가
    있을 수도 있습니다.
  • 8:01 - 8:03
    이런 류의 방대한 데이터베이스에서는 전무했던
  • 8:03 - 8:06
    불확실성의 새로운 형태를 다뤄야 하기 때문에
  • 8:06 - 8:11
    이 시스템은 그런 상황도
    받아들일 수 있어야합니다.
  • 8:11 - 8:13
    어떻게 이 새로운 연구를 대중과
  • 8:13 - 8:17
    소통하게 할 수 있을까요?
  • 8:17 - 8:19
    다시 강조하자면,
    베니스는 그 점에서 특별합니다.
  • 8:19 - 8:22
    매년 수백만의 방문객들이 찾는 곳이기에
  • 8:22 - 8:23
    미래의 박물관에 투자해 볼만한
  • 8:23 - 8:26
    최고의 장소 중 하나입니다.
  • 8:26 - 8:30
    상상해 보세요.
    특정한 연도에 수평적으로
  • 8:30 - 8:31
    재현된 지도를 보고
  • 8:31 - 8:34
    수직적으로는 그 재현을 도운
  • 8:34 - 8:35
    기록물,
    예를 들자면 미술품을
  • 8:35 - 8:39
    볼 수 있게 되는겁니다.
  • 8:39 - 8:41
    특정한 연도의 베니스를
    재현하고 탐험할 수 있는
  • 8:41 - 8:45
    몰입도가 높은 시스템을 상상해보세요.
  • 8:45 - 8:48
    일부는 단체로 공유할 수도 있는
    경험들 말이에요.
  • 8:48 - 8:50
    반대로 한 문서, 베니스의
  • 8:50 - 8:52
    한 서류로부터 시작해서
  • 8:52 - 8:55
    그것으로 부터 재현할 수 있는 것을
    보여주고
  • 8:55 - 8:57
    어떻게 해석되고
  • 8:57 - 8:59
    어떻게 그 문서의 문맥들이
    재현될 수 있는지를 상상해보세요.
  • 8:59 - 9:01
    지금 보여드리는 영상은
  • 9:01 - 9:03
    제가 말씀드린 시스템을 사용해서
  • 9:03 - 9:06
    제네바에서 진행되고 있는
    한 전시회의 모습입니다.
  • 9:06 - 9:08
    결론을 말씀드리면
  • 9:08 - 9:11
    지금 인문학계에서의 연구는
  • 9:11 - 9:13
    생명 과학이 30년 전에 겪었던 것과
  • 9:13 - 9:17
    비슷한 종류의 진화를 거치기 직전입니다.
  • 9:17 - 9:22
    이것은 정말 규모의 문제입니다.
  • 9:22 - 9:25
    우리가 관장하는 프로젝트들은
  • 9:25 - 9:29
    하나의 연구팀 혼자서 하기에는
    벅찬 일입니다.
  • 9:29 - 9:32
    그리고 이것은 소규모 모임이나
  • 9:32 - 9:35
    고작 한두 명의 연구원끼리
  • 9:35 - 9:39
    일하는 습관을 가진 인문학계에게는
    새로운 도전입니다.
  • 9:39 - 9:42
    베니스시 기록관을 방문하시면
  • 9:42 - 9:44
    어떤 한 팀이 할 수 있는 것 이상이고
  • 9:44 - 9:48
    학계 공동의 노력이 필요하다는 것을
    느끼실 겁니다.
  • 9:48 - 9:51
    그래서 우리가 이 패러다임의 변화를 위해서는
  • 9:51 - 9:53
    이 변화에 준비된
  • 9:53 - 9:55
    "디지털 인문학자"인
  • 9:55 - 9:57
    새로운 세대를 육성해야 합니다.
  • 9:57 - 9:59
    대단히 고맙습니다.
  • 9:59 - 10:03
    (박수)
Title:
어떻게 정보 타임머신을 만들었는가
Speaker:
프레드릭 카플란 (Frederic Kaplan)
Description:

중세 시대의 페이스북을 둘러볼 수 있다고 상상해보세요. 글쎄요, 들리는 것처럼 그리 멀리 있지 않을 수 있습니다. 이 재미있고 흥미로운 강연에서 연구자이자 엔지니어인 프레드릭 카플란은 80km에 달하는 책을 디지털화해서 1,000 년에 걸친 베니스의 역사적이고 지리적인 시뮬레이션을 만드는 베니스 타임머신을 자랑합니다.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20
  • There were A LOT of errors: minor typos as well as major mistranslations. The first half of OK, but the previous translation misinterpreted a lot of technical terms and sentences that referred to 'digital humanities.' For example, "semantically coded" was translated literally when it actually was talking about a specific type of computer program coding called 'semantic code' or 'semantic web.' There's actually a lecture presentation about this by Frederic Kaplan. Another example would be the previous translator translating "humanities" as "인류," which means "mankind" in Korean. Here, humanities meant 'the study of classical literature and languages.' There were also a lot of 'literal' translations which made no sense in context. I had to change most of the latter half, and my translation may be a bit crude but content-wise, most of it is sound.

  • 안녕하세요? 멋진 번역입니다. 중간에 맵은 지도로 수정했습니다. 5:09.472 에서 역주는 가독성을 위해서 두 줄로 축약했고 8:05.944 의 친정한 설명은 삭제했습니다. 그 밖에 일부 조사와 줄바꿈 정도의 수정을 했습니다. 그런데 5:13.632 의 in space 혹은 spatial 에서 공간이 굳이 4차원 공간이어야 하는 이유는 무엇인지 잘 모르겠네요. 그냥 "공간"으로 표현하면 충분하지 않을까요? 설령 코드가 4차원 공간 구조로 되어있다고 해도 이 강연에서는 그런 언급이 없으니까요. 이 부분은 번역 철학과도 관련이 있어서 일단 현재대로 publish 하고 나중에 다른 의견이 있으시면 그때 수정하기로 하겠습니다. 수고 많이 하셨습니다.

  • 적절한 수정 감사합니다. "공간"으로도 충분한 것 같습니다. 문맥 상 뭔가 어색해서 4차원이라고 표현했는데 없어도 무방할 것 같습니다. 제가 처음부터 한 번역이 아니라 흐름이 어색한 부분이 많았을텐데 고쳐주셔서 감사합니다.

  • 안녕하세요?

    5:13.632 의 in space 혹은 spatial 을 공간으로 바꿔봤더니 말씀하신대로 문맥상 상당히 허전한 느낌이 들더군요. 그래서 현재처럼 4차원 공간으로 유지하기로 했습니다. 앞에서 공간에 시간을 더한 상황으로 설명한 것을 고려하면 4차원 공간으로 간주해도 잘못은 없을 것으로 생각해서 이 같이 결론지었습니다.

    감사합니다.

Korean subtitles

Revisions