9:59:59.000,9:59:59.000 Tatoeba 是正港的多語! 9:59:59.000,9:59:59.000 不是某些熱門語言做配對 (比如中韓, 日法, 等) 9:59:59.000,9:59:59.000 也許你會好奇, 為什麼要用句子而不用字呢? 9:59:59.000,9:59:59.000 但不是我們印象中的"那種"多語 9:59:59.000,9:59:59.000 但無庸置疑的, 我們更熱愛語言! 9:59:59.000,9:59:59.000 你可以搜尋關鍵字 9:59:59.000,9:59:59.000 全部的語言都是互聯的 9:59:59.000,9:59:59.000 句子可以教我們許多東西 9:59:59.000,9:59:59.000 句子可以是滑稽的,聰明的,愚蠢的 9:59:59.000,9:59:59.000 句子本身是有個性的 9:59:59.000,9:59:59.000 句子讓字有更多的聯想背景 9:59:59.000,9:59:59.000 因此我們真正想要的是擁有很多很多的句子 9:59:59.000,9:59:59.000 在很多的語言, "任何"的語言! 9:59:59.000,9:59:59.000 如果一個冰島語的句子被翻譯成英語 9:59:59.000,9:59:59.000 很明顯的, 我們熱愛句子 9:59:59.000,9:59:59.000 或者是傷人的 9:59:59.000,9:59:59.000 所以每個人都可以餵Tatoeba新鮮的句子來表現新字和其新的用法 9:59:59.000,9:59:59.000 有見地的, 感人的 9:59:59.000,9:59:59.000 每個人其實都會說一種語言了 9:59:59.000,9:59:59.000 比光是用"字"本身多的多 9:59:59.000,9:59:59.000 然後其他的組合被忽略了 9:59:59.000,9:59:59.000 然後那個英語的句子剛好也有斯瓦希裡語的翻譯 9:59:59.000,9:59:59.000 而所需要的基礎建設的開端. 9:59:59.000,9:59:59.000 這個是為什麼Tatoeba是多語的. 0:00:00.000,0:00:04.894 Tatoeba 是一個語言字典. 0:00:16.010,0:00:17.926 然後找到對應的翻譯 0:00:18.541,0:00:22.570 但它並不是我們印象中一般的字典 0:00:23.277,0:00:25.415 它是一個完完全全跟句子有關的字典 0:00:25.415,0:00:26.717 不是單字 0:00:26.717,0:00:30.191 你可以搜尋有包含某個單字的句子 0:00:30.191,0:00:33.696 然後也找到這些句子在其他語言的翻譯版本 0:00:34.327,0:00:37.077 也許你會好奇, 為什麼要用句子而不用單字呢? 0:00:37.077,0:00:40.642 這個嘛, 因為句子對我們來說比較有趣 0:00:40.688,0:00:43.345 句子它幫單字帶來了聯想的背景 0:00:43.345,0:00:45.797 句子是有很多個性的 0:00:45.797,0:00:48.538 句子可以是滑稽的, 聰明的, 愚蠢的 0:00:48.538,0:00:50.378 有見地的, 感人的 0:00:50.378,0:00:51.763 或者傷人的 0:00:54.338,0:00:56.745 句子可以教我們很多東西, 比光只有單字多的多了 0:00:57.160,0:00:59.628 所以我們熱愛句子 0:01:00.074,0:01:03.677 不過相比之下我們更愛的是語言 0:01:03.677,0:01:07.265 所以我們真正想要的是擁有許許多多的句子 0:01:07.265,0:01:10.320 在很多的語言, "任何"一個語言 0:01:10.751,0:01:14.218 這正是為什麼Tatoeba是多語的 0:01:14.880,0:01:17.588 但不是刻板印象裡面的那種 0:01:19.618,0:01:22.111 不是那種只有熱門語言的配對 0:01:22.111,0:01:24.637 然後其他的配對選擇被遺漏了 0:01:25.067,0:01:28.286 Tatoeba是真的多語 0:01:28.286,0:01:31.726 所有的語言都是彼此相互連接的 0:01:32.188,0:01:36.788 如果一個冰島語的句子有一個對應的英語翻譯 0:01:36.788,0:01:40.708 而同時那個英語句子也有一個斯瓦希里語的翻譯 0:01:40.708,0:01:45.114 那麼間接地它就得到了一個斯瓦希里語的翻譯句子 0:01:45.114,0:01:47.452 就這個冰島語的句子來說 0:01:47.883,0:01:52.959 在傳統的語言系統裡面永不見天日的語言配對 0:01:52.959,0:01:56.003 也可以在Tatoeba被連接 0:01:56.003,0:01:58.052 呵呵,滿屌的不是嗎:) 0:01:58.652,0:02:01.717 重點來了,我們怎麼找到那些句子 0:02:01.717,0:02:04.129 還有我們準備怎麼翻譯這些句子呢? 0:02:04.129,0:02:08.188 很明顯地,這些事情一個人是無法獨立完成的 0:02:08.726,0:02:12.452 這個也是為什麼 Tatoeba是群創的 0:02:12.575,0:02:15.240 每個人都有資格貢獻 0:02:15.240,0:02:19.243 而且每個人也都有能力貢獻 0:02:19.243,0:02:22.148 我們的系統不需要參與者會說多種語言 0:02:22.148,0:02:24.262 每個人都會說某種語言 0:02:26.037,0:02:28.704 每個人都可以協助系統建立新詞和它在句子裡面的用法 0:02:28.704,0:02:32.748 每個人也都可以參與確定句子聽起來是否順耳 0:02:32.748,0:02:35.082 還有拼法對不對 0:02:35.082,0:02:39.760 說真格的, 這個案子沒有每個人還真的不行 0:02:39.760,0:02:42.728 語言不是死的,不是刻在石頭上的 0:02:42.728,0:02:45.766 語言是活生生的存在你我的生命裡 0:02:45.766,0:02:50.004 我們不但想捕捉每個語言的獨特性 0:02:50.004,0:02:54.122 我們同時也想捕捉每個語言它的進化過程! 0:02:56.044,0:03:00.520 但假使這些句子收集了以後只可以被我們使用那麼就太可惜了 0:03:00.520,0:03:04.360 因為這些句子還有好多我們不知道的用途 0:03:04.360,0:03:07.571 這也正是為什麼 Tatoeba是一個開放平台 0:03:07.571,0:03:09.160 我們的原始碼是開放的 0:03:09.160,0:03:11.983 我們的資料是開放的 0:03:13.972,0:03:17.775 我們蒐集到的所有句子都自動的擁有創用CC的屬性 http://creativecommons.tw/blog 0:03:18.006,0:03:22.281 簡單的說就是大家可以“免費”的“重複”使用, 無論是你要寫一本參考書 0:03:22.281,0:03:23.994 還是其他應用 0:03:23.994,0:03:26.252 又或者是做研究工作 0:03:26.252,0:03:29.083 隨便你! 0:03:29.452,0:03:31.917 這就是Tatoeba! 0:03:31.917,0:03:35.019 等等, 還沒有完呢! 0:03:35.342,0:03:38.923 Tatoeba不只是一個開放的,群創的,多語的 0:03:38.923,0:03:42.373 句子字典 0:03:42.819,0:03:46.382 它是我們想要建構的生態系統中的一環 0:03:46.382,0:03:49.951 我們想要把語言學習工具帶到一個更高的層次 0:03:49.951,0:03:54.153 我們樂見語言學習的這個領域有真正的創新 0:03:54.153,0:03:58.671 而這一切的一切如果沒有一個開放性的語言資源的話就不可能會發生 0:03:58.671,0:04:02.138 沒有一個社群的話也不可能 0:04:02.138,0:04:06.231 沒有一個有效率的平台的話參與者更無法貢獻 0:04:06.877,0:04:09.841 最終, 藉由 Tatoeba的成立 0:04:09.841,0:04:12.960 我們正在做的是建立一個"基礎" 0:04:12.960,0:04:14.444 一個可以讓網絡本身成為 0:04:14.444,0:04:23.298 更好的一個語言學習環境的基礎