WEBVTT 00:00:00.285 --> 00:00:03.178 這是地球的照片 00:00:03.178 --> 00:00:06.271 看起來和廣為人知的阿波羅計劃中 拍到的照片很像 00:00:06.271 --> 00:00:07.882 看起來和廣為人知的阿波羅計劃中 拍到的照片很像 00:00:07.882 --> 00:00:09.952 但其中有些差異 00:00:09.952 --> 00:00:11.399 你可以點擊它 00:00:11.399 --> 00:00:12.597 如果你點擊它 00:00:12.597 --> 00:00:15.669 你就可以放大地球上的幾乎每個地方 00:00:15.669 --> 00:00:17.668 舉例來說,這是洛桑聯邦理工學院的鳥瞰圖 00:00:17.668 --> 00:00:20.334 舉例來說,這是洛桑聯邦理工學院的鳥瞰圖 00:00:20.334 --> 00:00:23.442 很多時候你也可以從旁邊的街上 00:00:23.442 --> 00:00:26.182 看到某棟建築物的的長相 00:00:26.182 --> 00:00:27.604 這真的很神奇 00:00:27.604 --> 00:00:31.031 但這趟美妙的旅程還少了一樣東西: 00:00:31.031 --> 00:00:32.972 時間 00:00:33.219 --> 00:00:36.289 我不確定這張照片是什麼時候拍的 00:00:36.289 --> 00:00:37.701 我甚至無法確定這是在鳥瞰圖的當下拍的 00:00:37.701 --> 00:00:41.430 我甚至無法確定這是在鳥瞰圖的當下拍的 00:00:43.784 --> 00:00:45.993 在我的實驗室的研發工具 00:00:45.993 --> 00:00:47.757 不止用在空間的旅行 00:00:47.757 --> 00:00:50.315 也用在時間的旅行 00:00:50.315 --> 00:00:52.315 我們想問的問題是 00:00:52.315 --> 00:00:55.756 有辦法做出過往時間的Google Maps嗎? 00:00:55.756 --> 00:00:59.066 有辦法在Google Maps上增加一個滑桿 00:00:59.066 --> 00:01:00.869 只要改變年份 00:01:00.869 --> 00:01:02.660 就可以看到100年前 00:01:02.660 --> 00:01:04.329 1000年前的樣子嗎? 00:01:04.329 --> 00:01:06.098 這可能嗎? 00:01:06.452 --> 00:01:08.704 我能夠重建過去的社群網路嗎? 00:01:08.704 --> 00:01:11.753 我可以建立中世紀時的Facebook嗎? 00:01:11.753 --> 00:01:15.529 我能夠建造時光機嗎? 00:01:15.529 --> 00:01:18.094 我們可以說:「不,這不可能。」 00:01:18.094 --> 00:01:21.534 或者,我們可以從資訊的角度來看 00:01:21.904 --> 00:01:25.094 我把這個稱之為資訊蘑菇 00:01:25.094 --> 00:01:26.677 縱軸是時間 00:01:26.677 --> 00:01:29.417 橫軸是我們擁有的數位資訊 00:01:29.417 --> 00:01:32.899 很明顯的,在過去的10年中 我們擁有很大量的資訊 00:01:32.899 --> 00:01:36.447 也看得出來,越早以前資訊就越少 00:01:36.447 --> 00:01:38.765 如果我們想建立過去的Google Maps 00:01:38.765 --> 00:01:40.259 或是過去的Facebook 00:01:40.259 --> 00:01:41.833 我們就必須擴大這個空間 00:01:41.833 --> 00:01:43.771 像是一個長方形 00:01:43.771 --> 00:01:45.281 這要如何做到呢? 00:01:45.281 --> 00:01:47.379 一個辦法是數位化 00:01:47.395 --> 00:01:49.174 有很多的材料可以用-- 00:01:49.190 --> 00:01:51.619 報紙、印刷書本 00:01:52.269 --> 00:01:54.548 好幾千本印刷書本 00:01:54.871 --> 00:01:57.228 我可以把它們全部數位化 00:01:57.228 --> 00:01:59.965 我可以從當中截取資訊 00:01:59.965 --> 00:02:03.508 當然,當時間越往前 你擁有的資訊就越少 00:02:03.508 --> 00:02:06.154 所以,這可能不夠 00:02:06.154 --> 00:02:08.562 因此,我可以做史學家們做的事 00:02:08.562 --> 00:02:10.086 我可以推論 00:02:10.086 --> 00:02:14.078 這就是我們在電腦科學中所稱的模擬 00:02:14.556 --> 00:02:16.307 如果我有一本航海日誌 00:02:16.307 --> 00:02:21.511 我可以不只把它看成是一位威尼斯船長 特定的航程 00:02:21.683 --> 00:02:25.726 我可以把它看成是當時許多航程的代表 00:02:25.908 --> 00:02:28.153 我就是在推論 00:02:28.153 --> 00:02:30.191 如果我有一幅建築外觀的繪畫 00:02:30.191 --> 00:02:32.942 我可以不只把它看作特定的一棟建築 00:02:32.942 --> 00:02:40.320 這棟建築可能和其它遺失了資訊的 建築有著相同的風格 NOTE Paragraph 00:02:42.484 --> 00:02:43.773 如果我們想要打造一台時光機 00:02:43.773 --> 00:02:45.419 我們需要兩樣東西 00:02:45.419 --> 00:02:47.346 大量的檔案 00:02:47.346 --> 00:02:50.088 也需要很厲害的專家 00:02:50.088 --> 00:02:51.962 威尼斯時光機 (The Venice Time Machine) 00:02:51.962 --> 00:02:53.767 也就是我接下來要跟你們談論的計劃 00:02:53.767 --> 00:02:59.571 這個計劃是由洛桑聯邦理工學院和 威尼斯大學所合作 NOTE Paragraph 00:02:59.765 --> 00:03:01.930 威尼斯有個特點 00:03:01.930 --> 00:03:06.788 它的管理非常非常的官僚 00:03:06.798 --> 00:03:08.991 他們持續紀錄了每一件事情 00:03:08.991 --> 00:03:11.413 就像Google一樣 00:03:11.906 --> 00:03:13.420 在政府典藏中心 (Archivio di Stato) 00:03:13.420 --> 00:03:15.184 有長達80公里的檔案 00:03:15.184 --> 00:03:19.439 記錄了超過1000年來 威尼斯生活的每個面相 00:03:19.439 --> 00:03:21.359 每一艘出海的船 00:03:21.359 --> 00:03:22.435 每一艘返航的船 00:03:22.435 --> 00:03:25.801 在這城市裡面的每一個變化 00:03:25.801 --> 00:03:28.523 都記錄得一清二楚 00:03:28.523 --> 00:03:32.431 我們正建立一個10年的數位化計劃 00:03:32.431 --> 00:03:37.908 要把這個龐大的檔案 轉換成一個巨大的數位系統 00:03:37.918 --> 00:03:39.775 我們想達成的目標是 00:03:39.775 --> 00:03:44.085 每天可以數位化450本書 NOTE Paragraph 00:03:44.501 --> 00:03:46.748 當然,只有數位化是不夠的 00:03:46.748 --> 00:03:52.555 因為這些文件大部份都是用拉丁、 托斯卡納、威尼斯方言寫的 00:03:52.555 --> 00:03:56.683 所以有時必須轉錄、翻譯它們 並編成索引 00:03:56.683 --> 00:03:58.844 而這理所當然並不容易 00:03:58.844 --> 00:04:04.195 特別是當傳統的光學字符識別法 運用在手寫稿上 00:04:04.195 --> 00:04:08.116 效果不若列印稿的時候 00:04:08.116 --> 00:04:13.122 解決辦法是借助另外一個方法:語音識別 00:04:13.147 --> 00:04:17.725 這個方法看似不可能 但卻是可行的 00:04:17.739 --> 00:04:19.933 只需要加入額外的條件 00:04:19.933 --> 00:04:23.057 如果你有一個很好的語言模型 曾經被使用過 00:04:23.057 --> 00:04:26.577 如果你有一個很好的文件模型 那它們就已經很完整了 00:04:26.577 --> 00:04:30.063 而這些是官方文件 很多都非常完整 00:04:30.063 --> 00:04:33.371 當你把這巨大的檔案分成許多小子集 00:04:33.371 --> 00:04:36.248 而每個子集都有共同的特徵的話 00:04:36.648 --> 00:04:39.324 成功的機會就很大 NOTE Paragraph 00:04:42.761 --> 00:04:45.196 如果我們達到這個階段 就能夠做其他事情: 00:04:45.196 --> 00:04:48.718 汲取這個文件中的資訊 00:04:48.718 --> 00:04:52.855 事實上這個檔案中大約可以汲取出100億個事件 00:04:52.855 --> 00:04:56.487 這個巨型資訊系統可以用多種方法搜尋 00:04:56.487 --> 00:04:57.855 例如,你可以問這樣的問題 00:04:57.855 --> 00:05:00.615 「誰在1323年住在這座皇宮裡面?」 00:05:00.615 --> 00:05:04.544 「1434年時Realto市場裡一條鯛魚多少錢?」 00:05:04.574 --> 00:05:09.481 「在十年中Murano玻璃工匠的薪水多高?」 00:05:09.481 --> 00:05:10.894 你也可以問更大的問題 00:05:10.894 --> 00:05:13.632 因為它是用語意編碼的 00:05:13.632 --> 00:05:15.772 然後你就可以把它放在空間中 00:05:15.772 --> 00:05:17.945 因為大部份的資訊都是空間性的 00:05:17.945 --> 00:05:21.972 接下來就可以重建這座城市非凡的旅程 00:05:22.018 --> 00:05:27.441 這座城市設法永續發展超過1000年 00:05:27.464 --> 00:05:31.956 設法讓時間和環境取得平衡 00:05:31.956 --> 00:05:33.204 你可以重建這趟旅程 00:05:33.204 --> 00:05:36.100 用不同方法看到它 00:05:36.100 --> 00:05:38.799 但是當然,如果只是用看的 你無法了解威尼斯 00:05:38.799 --> 00:05:41.195 你要把它放到一個更廣大、 歐洲的概念裡面 00:05:41.195 --> 00:05:46.431 所以這個想法同時也要把檔案 放在歐洲的層級中 00:05:47.192 --> 00:05:50.372 我們也可以重建威尼斯這個海上帝國的旅程 00:05:50.393 --> 00:05:53.559 了解它是如何積極地控制亞德里亞海的 00:05:53.559 --> 00:06:04.735 如何成為中世紀控制了大部分 東方以及南方航線的最強大的帝國 NOTE Paragraph 00:06:05.305 --> 00:06:07.621 你甚至可以做到其它事 00:06:07.621 --> 00:06:11.851 因為這些航線有相似之處 00:06:11.851 --> 00:06:15.993 可以更進一步建立模擬系統 00:06:15.993 --> 00:06:19.317 建立地中海模擬器 00:06:19.317 --> 00:06:24.188 它可以重建我們遺失的資訊 00:06:24.188 --> 00:06:30.115 讓你在用路線規劃時的 問題可以得到解答 NOTE Paragraph 00:06:30.115 --> 00:06:37.820 「如果我在1323年的科孚,想去康士坦丁堡 我要去哪裡搭船?」 NOTE Paragraph 00:06:37.828 --> 00:06:43.655 我們或許可以在一天,兩天或三天的 準確度之內回答這個問題 NOTE Paragraph 00:06:43.668 --> 00:06:45.275 「要花多少錢?」 NOTE Paragraph 00:06:45.275 --> 00:06:48.867 「有多大的機率遇到海盜?」 NOTE Paragraph 00:06:48.867 --> 00:06:53.308 當然,你懂的,這種計劃最大的挑戰 在於修飾、量化 00:06:53.308 --> 00:07:00.354 並在每一步驟重現不確定以及不一致的資料 00:07:00.354 --> 00:07:03.058 這份文件裡到處都有錯誤 00:07:03.058 --> 00:07:08.747 文件裡的錯誤包括把 船長的名字搞錯了,而有些船根本沒下過水 00:07:08.760 --> 00:07:13.617 也有翻譯的錯誤,翻譯時的誤解 00:07:13.624 --> 00:07:19.889 此外,在用演算法的時候會有辨認上的錯誤 00:07:19.889 --> 00:07:22.000 汲取上的錯誤 00:07:22.000 --> 00:07:26.481 所以你會得到相當相當不確定的數據 NOTE Paragraph 00:07:26.481 --> 00:07:30.238 那我們要如何找到並修正這些不一致之處呢? NOTE Paragraph 00:07:30.441 --> 00:07:33.898 我們如何重現不確定性? 00:07:33.898 --> 00:07:38.256 很困難。你可以做的一件事是把每一個步驟建檔 00:07:38.256 --> 00:07:40.669 不只是把歷史訊息編碼 00:07:40.669 --> 00:07:43.886 也把所謂的元歷史(meta-history)訊息 00:07:43.886 --> 00:07:48.072 也就是建立歷史知識的根基的每一步都建檔 00:07:48.072 --> 00:07:52.115 這沒辦法保證我們確實涵蓋到 威尼斯的每一個故事 00:07:52.115 --> 00:07:57.288 但我們確實根據完整文件重建了威尼斯 每一個可能發生過的故事 00:07:57.290 --> 00:07:58.749 也許地圖不止一幅 00:07:58.749 --> 00:08:00.869 可能有好幾幅地圖 00:08:00.869 --> 00:08:03.085 系統應該要可以到這樣子 00:08:03.085 --> 00:08:05.944 因為我們得面對一個新型態的不確定性 00:08:05.944 --> 00:08:10.000 包含這樣龐大且新穎的資料庫 00:08:11.820 --> 00:08:16.769 那我們要如何把這個新研究告訴大眾呢? 00:08:16.769 --> 00:08:19.432 威尼斯是個絕佳的地方 00:08:19.432 --> 00:08:21.603 由於每年有好幾百萬的遊客 00:08:21.627 --> 00:08:26.354 這裡是試著創造未來博物館最好的地點之一 00:08:26.354 --> 00:08:30.919 想想,平躺的是建立出的特定年份的地圖 00:08:30.944 --> 00:08:38.055 立著的是用來重建這幅地圖的文件 例如,圖畫 00:08:38.813 --> 00:08:44.900 想像一個讓你彷彿置身於特定年份的 威尼斯的沈浸式系統 00:08:44.900 --> 00:08:47.610 一種讓你能和別人分享的經驗 00:08:47.610 --> 00:08:52.071 相反的,想像你能夠從一份 威尼斯手稿開始 00:08:52.071 --> 00:08:55.835 看看你到底能夠從當中建立什麼 00:08:55.835 --> 00:09:00.260 它是如何被解碼、當中所蘊含的概念是如何重建 00:09:00.260 --> 00:09:03.460 這張圖片是現在在日內瓦的展覽當中展出 00:09:03.460 --> 00:09:05.814 它就是用這類系統所建立的 00:09:05.814 --> 00:09:07.989 總而言之 00:09:07.989 --> 00:09:11.068 人文研究正走向一場 00:09:11.068 --> 00:09:16.054 像是生命科學30年前所經歷的革命 00:09:17.452 --> 00:09:21.358 事實上,問題在於它的規模 00:09:22.358 --> 00:09:23.883 我們看到 00:09:23.883 --> 00:09:29.232 這些計劃遠超出任何一個 小型研究團隊所能夠做的 00:09:29.232 --> 00:09:31.519 這在人文領域也很新穎 00:09:31.519 --> 00:09:39.986 人文領域習慣小團隊或是只和數個研究員合作 00:09:39.986 --> 00:09:41.514 當你造訪政府典藏中心時 00:09:41.514 --> 00:09:44.336 你會感覺到這超過任何一個團隊做得到的 00:09:44.336 --> 00:09:48.170 這必須依賴團隊合作 00:09:48.170 --> 00:09:51.715 在這個典範轉移中 00:09:51.715 --> 00:09:53.899 我們必須培養一些新一代 00:09:53.899 --> 00:09:56.805 準備好迎接這個進步的 「數位」人文學家 00:09:56.805 --> 00:09:58.393 謝謝 00:09:58.393 --> 00:10:00.610 (掌聲)