Return to Video

如何建造一台資訊時光機

  • 0:00 - 0:03
    這是地球的照片
  • 0:03 - 0:06
    看起來和廣為人知的阿波羅計劃中
    拍到的照片很像
  • 0:06 - 0:08
    看起來和廣為人知的阿波羅計劃中
    拍到的照片很像
  • 0:08 - 0:10
    但其中有些差異
  • 0:10 - 0:11
    你可以點擊它
  • 0:11 - 0:13
    如果你點擊它
  • 0:13 - 0:16
    你就可以放大地球上的幾乎每個地方
  • 0:16 - 0:18
    舉例來說,這是洛桑聯邦理工學院的鳥瞰圖
  • 0:18 - 0:20
    舉例來說,這是洛桑聯邦理工學院的鳥瞰圖
  • 0:20 - 0:23
    很多時候你也可以從旁邊的街上
  • 0:23 - 0:26
    看到某棟建築物的的長相
  • 0:26 - 0:28
    這真的很神奇
  • 0:28 - 0:31
    但這趟美妙的旅程還少了一樣東西:
  • 0:31 - 0:33
    時間
  • 0:33 - 0:36
    我不確定這張照片是什麼時候拍的
  • 0:36 - 0:38
    我甚至無法確定這是在鳥瞰圖的當下拍的
  • 0:38 - 0:41
    我甚至無法確定這是在鳥瞰圖的當下拍的
  • 0:44 - 0:46
    在我的實驗室的研發工具
  • 0:46 - 0:48
    不止用在空間的旅行
  • 0:48 - 0:50
    也用在時間的旅行
  • 0:50 - 0:52
    我們想問的問題是
  • 0:52 - 0:56
    有辦法做出過往時間的Google Maps嗎?
  • 0:56 - 0:59
    有辦法在Google Maps上增加一個滑桿
  • 0:59 - 1:01
    只要改變年份
  • 1:01 - 1:03
    就可以看到100年前
  • 1:03 - 1:04
    1000年前的樣子嗎?
  • 1:04 - 1:06
    這可能嗎?
  • 1:06 - 1:09
    我能夠重建過去的社群網路嗎?
  • 1:09 - 1:12
    我可以建立中世紀時的Facebook嗎?
  • 1:12 - 1:16
    我能夠建造時光機嗎?
  • 1:16 - 1:18
    我們可以說:「不,這不可能。」
  • 1:18 - 1:22
    或者,我們可以從資訊的角度來看
  • 1:22 - 1:25
    我把這個稱之為資訊蘑菇
  • 1:25 - 1:27
    縱軸是時間
  • 1:27 - 1:29
    橫軸是我們擁有的數位資訊
  • 1:29 - 1:33
    很明顯的,在過去的10年中
    我們擁有很大量的資訊
  • 1:33 - 1:36
    也看得出來,越早以前資訊就越少
  • 1:36 - 1:39
    如果我們想建立過去的Google Maps
  • 1:39 - 1:40
    或是過去的Facebook
  • 1:40 - 1:42
    我們就必須擴大這個空間
  • 1:42 - 1:44
    像是一個長方形
  • 1:44 - 1:45
    這要如何做到呢?
  • 1:45 - 1:47
    一個辦法是數位化
  • 1:47 - 1:49
    有很多的材料可以用--
  • 1:49 - 1:52
    報紙、印刷書本
  • 1:52 - 1:55
    好幾千本印刷書本
  • 1:55 - 1:57
    我可以把它們全部數位化
  • 1:57 - 2:00
    我可以從當中截取資訊
  • 2:00 - 2:04
    當然,當時間越往前
    你擁有的資訊就越少
  • 2:04 - 2:06
    所以,這可能不夠
  • 2:06 - 2:09
    因此,我可以做史學家們做的事
  • 2:09 - 2:10
    我可以推論
  • 2:10 - 2:14
    這就是我們在電腦科學中所稱的模擬
  • 2:15 - 2:16
    如果我有一本航海日誌
  • 2:16 - 2:22
    我可以不只把它看成是一位威尼斯船長
    特定的航程
  • 2:22 - 2:26
    我可以把它看成是當時許多航程的代表
  • 2:26 - 2:28
    我就是在推論
  • 2:28 - 2:30
    如果我有一幅建築外觀的繪畫
  • 2:30 - 2:33
    我可以不只把它看作特定的一棟建築
  • 2:33 - 2:40
    這棟建築可能和其它遺失了資訊的
    建築有著相同的風格
  • 2:42 - 2:44
    如果我們想要打造一台時光機
  • 2:44 - 2:45
    我們需要兩樣東西
  • 2:45 - 2:47
    大量的檔案
  • 2:47 - 2:50
    也需要很厲害的專家
  • 2:50 - 2:52
    威尼斯時光機 (The Venice Time Machine)
  • 2:52 - 2:54
    也就是我接下來要跟你們談論的計劃
  • 2:54 - 3:00
    這個計劃是由洛桑聯邦理工學院和
    威尼斯大學所合作
  • 3:00 - 3:02
    威尼斯有個特點
  • 3:02 - 3:07
    它的管理非常非常的官僚
  • 3:07 - 3:09
    他們持續紀錄了每一件事情
  • 3:09 - 3:11
    就像Google一樣
  • 3:12 - 3:13
    在政府典藏中心 (Archivio di Stato)
  • 3:13 - 3:15
    有長達80公里的檔案
  • 3:15 - 3:19
    記錄了超過1000年來
    威尼斯生活的每個面相
  • 3:19 - 3:21
    每一艘出海的船
  • 3:21 - 3:22
    每一艘返航的船
  • 3:22 - 3:26
    在這城市裡面的每一個變化
  • 3:26 - 3:29
    都記錄得一清二楚
  • 3:29 - 3:32
    我們正建立一個10年的數位化計劃
  • 3:32 - 3:38
    要把這個龐大的檔案
    轉換成一個巨大的數位系統
  • 3:38 - 3:40
    我們想達成的目標是
  • 3:40 - 3:44
    每天可以數位化450本書
  • 3:45 - 3:47
    當然,只有數位化是不夠的
  • 3:47 - 3:53
    因為這些文件大部份都是用拉丁、
    托斯卡納、威尼斯方言寫的
  • 3:53 - 3:57
    所以有時必須轉錄、翻譯它們
    並編成索引
  • 3:57 - 3:59
    而這理所當然並不容易
  • 3:59 - 4:04
    特別是當傳統的光學字符識別法
    運用在手寫稿上
  • 4:04 - 4:08
    效果不若列印稿的時候
  • 4:08 - 4:13
    解決辦法是借助另外一個方法:語音識別
  • 4:13 - 4:18
    這個方法看似不可能
    但卻是可行的
  • 4:18 - 4:20
    只需要加入額外的條件
  • 4:20 - 4:23
    如果你有一個很好的語言模型
    曾經被使用過
  • 4:23 - 4:27
    如果你有一個很好的文件模型
    那它們就已經很完整了
  • 4:27 - 4:30
    而這些是官方文件
    很多都非常完整
  • 4:30 - 4:33
    當你把這巨大的檔案分成許多小子集
  • 4:33 - 4:36
    而每個子集都有共同的特徵的話
  • 4:37 - 4:39
    成功的機會就很大
  • 4:43 - 4:45
    如果我們達到這個階段
    就能夠做其他事情:
  • 4:45 - 4:49
    汲取這個文件中的資訊
  • 4:49 - 4:53
    事實上這個檔案中大約可以汲取出100億個事件
  • 4:53 - 4:56
    這個巨型資訊系統可以用多種方法搜尋
  • 4:56 - 4:58
    例如,你可以問這樣的問題
  • 4:58 - 5:01
    「誰在1323年住在這座皇宮裡面?」
  • 5:01 - 5:05
    「1434年時Realto市場裡一條鯛魚多少錢?」
  • 5:05 - 5:09
    「在十年中Murano玻璃工匠的薪水多高?」
  • 5:09 - 5:11
    你也可以問更大的問題
  • 5:11 - 5:14
    因為它是用語意編碼的
  • 5:14 - 5:16
    然後你就可以把它放在空間中
  • 5:16 - 5:18
    因為大部份的資訊都是空間性的
  • 5:18 - 5:22
    接下來就可以重建這座城市非凡的旅程
  • 5:22 - 5:27
    這座城市設法永續發展超過1000年
  • 5:27 - 5:32
    設法讓時間和環境取得平衡
  • 5:32 - 5:33
    你可以重建這趟旅程
  • 5:33 - 5:36
    用不同方法看到它
  • 5:36 - 5:39
    但是當然,如果只是用看的
    你無法了解威尼斯
  • 5:39 - 5:41
    你要把它放到一個更廣大、
    歐洲的概念裡面
  • 5:41 - 5:46
    所以這個想法同時也要把檔案
    放在歐洲的層級中
  • 5:47 - 5:50
    我們也可以重建威尼斯這個海上帝國的旅程
  • 5:50 - 5:54
    了解它是如何積極地控制亞德里亞海的
  • 5:54 - 6:05
    如何成為中世紀控制了大部分
    東方以及南方航線的最強大的帝國
  • 6:05 - 6:08
    你甚至可以做到其它事
  • 6:08 - 6:12
    因為這些航線有相似之處
  • 6:12 - 6:16
    可以更進一步建立模擬系統
  • 6:16 - 6:19
    建立地中海模擬器
  • 6:19 - 6:24
    它可以重建我們遺失的資訊
  • 6:24 - 6:30
    讓你在用路線規劃時的
    問題可以得到解答
  • 6:30 - 6:38
    「如果我在1323年的科孚,想去康士坦丁堡
    我要去哪裡搭船?」
  • 6:38 - 6:44
    我們或許可以在一天,兩天或三天的
    準確度之內回答這個問題
  • 6:44 - 6:45
    「要花多少錢?」
  • 6:45 - 6:49
    「有多大的機率遇到海盜?」
  • 6:49 - 6:53
    當然,你懂的,這種計劃最大的挑戰
    在於修飾、量化
  • 6:53 - 7:00
    並在每一步驟重現不確定以及不一致的資料
  • 7:00 - 7:03
    這份文件裡到處都有錯誤
  • 7:03 - 7:09
    文件裡的錯誤包括把
    船長的名字搞錯了,而有些船根本沒下過水
  • 7:09 - 7:14
    也有翻譯的錯誤,翻譯時的誤解
  • 7:14 - 7:20
    此外,在用演算法的時候會有辨認上的錯誤
  • 7:20 - 7:22
    汲取上的錯誤
  • 7:22 - 7:26
    所以你會得到相當相當不確定的數據
  • 7:26 - 7:30
    那我們要如何找到並修正這些不一致之處呢?
  • 7:30 - 7:34
    我們如何重現不確定性?
  • 7:34 - 7:38
    很困難。你可以做的一件事是把每一個步驟建檔
  • 7:38 - 7:41
    不只是把歷史訊息編碼
  • 7:41 - 7:44
    也把所謂的元歷史(meta-history)訊息
  • 7:44 - 7:48
    也就是建立歷史知識的根基的每一步都建檔
  • 7:48 - 7:52
    這沒辦法保證我們確實涵蓋到
    威尼斯的每一個故事
  • 7:52 - 7:57
    但我們確實根據完整文件重建了威尼斯
    每一個可能發生過的故事
  • 7:57 - 7:59
    也許地圖不止一幅
  • 7:59 - 8:01
    可能有好幾幅地圖
  • 8:01 - 8:03
    系統應該要可以到這樣子
  • 8:03 - 8:06
    因為我們得面對一個新型態的不確定性
  • 8:06 - 8:10
    包含這樣龐大且新穎的資料庫
  • 8:12 - 8:17
    那我們要如何把這個新研究告訴大眾呢?
  • 8:17 - 8:19
    威尼斯是個絕佳的地方
  • 8:19 - 8:22
    由於每年有好幾百萬的遊客
  • 8:22 - 8:26
    這裡是試著創造未來博物館最好的地點之一
  • 8:26 - 8:31
    想想,平躺的是建立出的特定年份的地圖
  • 8:31 - 8:38
    立著的是用來重建這幅地圖的文件
    例如,圖畫
  • 8:39 - 8:45
    想像一個讓你彷彿置身於特定年份的
    威尼斯的沈浸式系統
  • 8:45 - 8:48
    一種讓你能和別人分享的經驗
  • 8:48 - 8:52
    相反的,想像你能夠從一份
    威尼斯手稿開始
  • 8:52 - 8:56
    看看你到底能夠從當中建立什麼
  • 8:56 - 9:00
    它是如何被解碼、當中所蘊含的概念是如何重建
  • 9:00 - 9:03
    這張圖片是現在在日內瓦的展覽當中展出
  • 9:03 - 9:06
    它就是用這類系統所建立的
  • 9:06 - 9:08
    總而言之
  • 9:08 - 9:11
    人文研究正走向一場
  • 9:11 - 9:16
    像是生命科學30年前所經歷的革命
  • 9:17 - 9:21
    事實上,問題在於它的規模
  • 9:22 - 9:24
    我們看到
  • 9:24 - 9:29
    這些計劃遠超出任何一個
    小型研究團隊所能夠做的
  • 9:29 - 9:32
    這在人文領域也很新穎
  • 9:32 - 9:40
    人文領域習慣小團隊或是只和數個研究員合作
  • 9:40 - 9:42
    當你造訪政府典藏中心時
  • 9:42 - 9:44
    你會感覺到這超過任何一個團隊做得到的
  • 9:44 - 9:48
    這必須依賴團隊合作
  • 9:48 - 9:52
    在這個典範轉移中
  • 9:52 - 9:54
    我們必須培養一些新一代
  • 9:54 - 9:57
    準備好迎接這個進步的
    「數位」人文學家
  • 9:57 - 9:58
    謝謝
  • 9:58 - 10:01
    (掌聲)
Title:
如何建造一台資訊時光機
Speaker:
佛德瑞克.卡普蘭 (Frederic Kaplan)
Description:

想像你能瀏覽中世紀的 Facebook... 這可能不再聽起來那麼遙不可及了。在這段有趣的演說當中,佛德瑞克.卡普蘭 (Frederic Kaplan) 研究員兼工程師展示了威尼斯時光機。這個計劃將數位化長達 80 公里的書本來模擬 1000 年來威尼斯的史地景象。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20
  • "Archivio di Stato" 翻成 "政府典藏中心"
    "Kaplan" 用維基的中文譯名 "卡普蘭"

Chinese, Traditional subtitles

Revisions