WEBVTT 99:59:59.999 --> 99:59:59.999 Tatoeba 是正港的多語! 99:59:59.999 --> 99:59:59.999 不是某些熱門語言做配對 (比如中韓, 日法, 等) 99:59:59.999 --> 99:59:59.999 也許你會好奇, 為什麼要用句子而不用字呢? 99:59:59.999 --> 99:59:59.999 但不是我們印象中的"那種"多語 99:59:59.999 --> 99:59:59.999 但無庸置疑的, 我們更熱愛語言! 99:59:59.999 --> 99:59:59.999 你可以搜尋關鍵字 99:59:59.999 --> 99:59:59.999 全部的語言都是互聯的 99:59:59.999 --> 99:59:59.999 句子可以教我們許多東西 99:59:59.999 --> 99:59:59.999 句子可以是滑稽的,聰明的,愚蠢的 99:59:59.999 --> 99:59:59.999 句子本身是有個性的 99:59:59.999 --> 99:59:59.999 句子讓字有更多的聯想背景 99:59:59.999 --> 99:59:59.999 因此我們真正想要的是擁有很多很多的句子 99:59:59.999 --> 99:59:59.999 在很多的語言, "任何"的語言! 99:59:59.999 --> 99:59:59.999 如果一個冰島語的句子被翻譯成英語 99:59:59.999 --> 99:59:59.999 很明顯的, 我們熱愛句子 99:59:59.999 --> 99:59:59.999 或者是傷人的 99:59:59.999 --> 99:59:59.999 所以每個人都可以餵Tatoeba新鮮的句子來表現新字和其新的用法 99:59:59.999 --> 99:59:59.999 有見地的, 感人的 99:59:59.999 --> 99:59:59.999 每個人其實都會說一種語言了 99:59:59.999 --> 99:59:59.999 比光是用"字"本身多的多 99:59:59.999 --> 99:59:59.999 然後其他的組合被忽略了 99:59:59.999 --> 99:59:59.999 然後那個英語的句子剛好也有斯瓦希裡語的翻譯 99:59:59.999 --> 99:59:59.999 而所需要的基礎建設的開端. 99:59:59.999 --> 99:59:59.999 這個是為什麼Tatoeba是多語的. 00:00:00.000 --> 00:00:04.894 Tatoeba 是一個語言字典. 00:00:16.010 --> 00:00:17.926 然後找到對應的翻譯 00:00:18.541 --> 00:00:22.570 但它並不是我們印象中一般的字典 00:00:23.277 --> 00:00:25.415 它是一個完完全全跟句子有關的字典 00:00:25.415 --> 00:00:26.717 不是單字 00:00:26.717 --> 00:00:30.191 你可以搜尋有包含某個單字的句子 00:00:30.191 --> 00:00:33.696 然後也找到這些句子在其他語言的翻譯版本 00:00:34.327 --> 00:00:37.077 也許你會好奇, 為什麼要用句子而不用單字呢? 00:00:37.077 --> 00:00:40.642 這個嘛, 因為句子對我們來說比較有趣 00:00:40.688 --> 00:00:43.345 句子它幫單字帶來了聯想的背景 00:00:43.345 --> 00:00:45.797 句子是有很多個性的 00:00:45.797 --> 00:00:48.538 句子可以是滑稽的, 聰明的, 愚蠢的 00:00:48.538 --> 00:00:50.378 有見地的, 感人的 00:00:50.378 --> 00:00:51.763 或者傷人的 00:00:54.338 --> 00:00:56.745 句子可以教我們很多東西, 比光只有單字多的多了 00:00:57.160 --> 00:00:59.628 所以我們熱愛句子 00:01:00.074 --> 00:01:03.677 不過相比之下我們更愛的是語言 00:01:03.677 --> 00:01:07.265 所以我們真正想要的是擁有許許多多的句子 00:01:07.265 --> 00:01:10.320 在很多的語言, "任何"一個語言 00:01:10.751 --> 00:01:14.218 這正是為什麼Tatoeba是多語的 00:01:14.880 --> 00:01:17.588 但不是刻板印象裡面的那種 00:01:19.618 --> 00:01:22.111 不是那種只有熱門語言的配對 00:01:22.111 --> 00:01:24.637 然後其他的配對選擇被遺漏了 00:01:25.067 --> 00:01:28.286 Tatoeba是真的多語 00:01:28.286 --> 00:01:31.726 所有的語言都是彼此相互連接的 00:01:32.188 --> 00:01:36.788 如果一個冰島語的句子有一個對應的英語翻譯 00:01:36.788 --> 00:01:40.708 而同時那個英語句子也有一個斯瓦希里語的翻譯 00:01:40.708 --> 00:01:45.114 那麼間接地它就得到了一個斯瓦希里語的翻譯句子 00:01:45.114 --> 00:01:47.452 就這個冰島語的句子來說 00:01:47.883 --> 00:01:52.959 在傳統的語言系統裡面永不見天日的語言配對 00:01:52.959 --> 00:01:56.003 也可以在Tatoeba被連接 00:01:56.003 --> 00:01:58.052 呵呵,滿屌的不是嗎:) 00:01:58.652 --> 00:02:01.717 重點來了,我們怎麼找到那些句子 00:02:01.717 --> 00:02:04.129 還有我們準備怎麼翻譯這些句子呢? 00:02:04.129 --> 00:02:08.188 很明顯地,這些事情一個人是無法獨立完成的 00:02:08.726 --> 00:02:12.452 這個也是為什麼 Tatoeba是群創的 00:02:12.575 --> 00:02:15.240 每個人都有資格貢獻 00:02:15.240 --> 00:02:19.243 而且每個人也都有能力貢獻 00:02:19.243 --> 00:02:22.148 我們的系統不需要參與者會說多種語言 00:02:22.148 --> 00:02:24.262 每個人都會說某種語言 00:02:26.037 --> 00:02:28.704 每個人都可以協助系統建立新詞和它在句子裡面的用法 00:02:28.704 --> 00:02:32.748 每個人也都可以參與確定句子聽起來是否順耳 00:02:32.748 --> 00:02:35.082 還有拼法對不對 00:02:35.082 --> 00:02:39.760 說真格的, 這個案子沒有每個人還真的不行 00:02:39.760 --> 00:02:42.728 語言不是死的,不是刻在石頭上的 00:02:42.728 --> 00:02:45.766 語言是活生生的存在你我的生命裡 00:02:45.766 --> 00:02:50.004 我們不但想捕捉每個語言的獨特性 00:02:50.004 --> 00:02:54.122 我們同時也想捕捉每個語言它的進化過程! 00:02:56.044 --> 00:03:00.520 但假使這些句子收集了以後只可以被我們使用那麼就太可惜了 00:03:00.520 --> 00:03:04.360 因為這些句子還有好多我們不知道的用途 00:03:04.360 --> 00:03:07.571 這也正是為什麼 Tatoeba是一個開放平台 00:03:07.571 --> 00:03:09.160 我們的原始碼是開放的 00:03:09.160 --> 00:03:11.983 我們的資料是開放的 00:03:13.972 --> 00:03:17.775 我們蒐集到的所有句子都自動的擁有創用CC的屬性 http://creativecommons.tw/blog 00:03:18.006 --> 00:03:22.281 簡單的說就是大家可以“免費”的“重複”使用, 無論是你要寫一本參考書 00:03:22.281 --> 00:03:23.994 還是其他應用 00:03:23.994 --> 00:03:26.252 又或者是做研究工作 00:03:26.252 --> 00:03:29.083 隨便你! 00:03:29.452 --> 00:03:31.917 這就是Tatoeba! 00:03:31.917 --> 00:03:35.019 等等, 還沒有完呢! 00:03:35.342 --> 00:03:38.923 Tatoeba不只是一個開放的,群創的,多語的 00:03:38.923 --> 00:03:42.373 句子字典 00:03:42.819 --> 00:03:46.382 它是我們想要建構的生態系統中的一環 00:03:46.382 --> 00:03:49.951 我們想要把語言學習工具帶到一個更高的層次 00:03:49.951 --> 00:03:54.153 我們樂見語言學習的這個領域有真正的創新 00:03:54.153 --> 00:03:58.671 而這一切的一切如果沒有一個開放性的語言資源的話就不可能會發生 00:03:58.671 --> 00:04:02.138 沒有一個社群的話也不可能 00:04:02.138 --> 00:04:06.231 沒有一個有效率的平台的話參與者更無法貢獻 00:04:06.877 --> 00:04:09.841 最終, 藉由 Tatoeba的成立 00:04:09.841 --> 00:04:12.960 我們正在做的是建立一個"基礎" 00:04:12.960 --> 00:04:14.444 一個可以讓網絡本身成為 00:04:14.444 --> 00:04:23.298 更好的一個語言學習環境的基礎