Return to Video

電腦如何翻譯人類語言 - 揚尼斯.帕契莫納

  • 0:07 - 0:11
    為何電影、電視中星際間的不同物種
  • 0:11 - 0:14
    恰巧能講一口流利的英語?
  • 0:14 - 0:18
    答案是:沒人想看太空船員在影片中
  • 0:18 - 0:22
    花費數年來編撰外星人字典。
  • 0:22 - 0:23
    但為保持一致性,
  • 0:23 - 0:27
    「星際迷航」和其他科幻小說創作者
  • 0:27 - 0:31
    引進「萬能翻譯器」的概念:
  • 0:31 - 0:35
    一種攜帶式裝置,可即時翻譯任何語言。
  • 0:35 - 0:39
    那麼,「萬能翻譯器」可能存在於現實嗎?
  • 0:39 - 0:42
    已有很多個程式宣稱做得到:
  • 0:42 - 0:46
    從一種語言中選取單字、句子,或整本書,
  • 0:46 - 0:49
    幾乎可以將它們翻譯成任何語言,
  • 0:49 - 0:52
    不論是現代英語,或是古梵語。
  • 0:52 - 0:56
    如果翻譯只是在詞典中查找單字,
  • 0:56 - 1:00
    那麼,這些程式早就普及了。
  • 1:00 - 1:03
    然而,現實複雜許多。
  • 1:03 - 1:07
    基於「規則」的翻譯程式使用字彙資料庫,
  • 1:07 - 1:10
    包含字典找到的單字、
  • 1:10 - 1:13
    套用的文法型式、
  • 1:13 - 1:19
    以及「辨認基本語言元素」的規則。
  • 1:19 - 1:22
    這個看似簡單的句子為例:「孩子們吃松餅」,
  • 1:22 - 1:27
    程式首先分析「語法」或「文法結構」,
  • 1:27 - 1:30
    辨識出「孩子們」為主詞,
  • 1:30 - 1:34
    剩下的句子為「述語」-
    由動詞「吃」構成。
  • 1:34 - 1:37
    和直接受詞 「松餅」。
  • 1:37 - 1:40
    程式需要辨識出「英語構詞學」,
  • 1:40 - 1:45
    也就是將該語言拆分成
    有意義的最小單元,
  • 1:45 - 1:46
    例如單字 「松餅」
  • 1:46 - 1:50
    及字尾加「s」表示複數型。
  • 1:50 - 1:56
    最後,程式還需要理解「語意」-
    各別部份所表達的意思。
  • 1:56 - 1:58
    為了正確翻譯句子,
  • 1:58 - 2:02
    程式會參考不同語言的字彙與規則
  • 2:02 - 2:05
    來處理目標語言的每個元素。
  • 2:05 - 2:07
    這卻是棘手的地方。
  • 2:07 - 2:12
    某些語言允許單字以任何順序排列,
  • 2:12 - 2:17
    但在其它語言,這樣做會出現
    「松餅吃孩子們」的句子。
  • 2:17 - 2:20
    「構詞學」也有同樣問題。
  • 2:20 - 2:23
    「斯拉維尼亞語」可區分是
    兩個、三個、或更多孩子-
  • 2:23 - 2:27
    「雙字尾」的用法未見於其它語言中。
  • 2:27 - 2:31
    而 俄語 則缺少「定冠詞」,你可能會困惑
  • 2:31 - 2:34
    孩子們是在吃某種特定的松餅,
  • 2:34 - 2:37
    還是泛指一般松餅。
  • 2:37 - 2:40
    最後,即使「語意」技術上正確,
  • 2:40 - 2:43
    程式也可能遺失細微部分,
  • 2:43 - 2:46
    例如,孩子們是在「吃」松餅,
  • 2:46 - 2:48
    還是在「吞」松餅?
  • 2:48 - 2:52
    另一種方法是基於「統計」的機器翻譯,
  • 2:52 - 2:59
    該方法分析「已翻譯的書籍、文章、文件」
    所建立的資料庫。
  • 2:59 - 3:05
    從「原文」與「譯文」之間,
    尋找非偶然的匹配模式,
  • 3:05 - 3:09
    程式就可以辨識出對應的片語和句型,
  • 3:09 - 3:12
    以便使用在未來的翻譯上。
  • 3:12 - 3:15
    然而,這種翻譯的品質
  • 3:15 - 3:18
    決定於資料庫的大小
  • 3:18 - 3:23
    以及能否應用於特定語言或
    寫作風格的翻譯上。
  • 3:23 - 3:27
    電腦的困難:會遇到異常、非常規情況、
  • 3:27 - 3:31
    以及無法呈現人類「直覺本能」可以了解的意函-
  • 3:31 - 3:35
    這些令研究者相信「語言的理解能力」
  • 3:35 - 3:39
    是我們大腦生理結構的獨特產物。
  • 3:39 - 3:43
    實際上,小說中最著名的萬能翻譯器之一,
  • 3:43 - 3:46
    出自《星際大奇航》的 「寶貝魚」,
  • 3:46 - 3:50
    根本就不是機器,而是小生物-
  • 3:50 - 3:57
    是一隻能透過心靈感應,翻譯腦波和
    神經信號的 「有感知」的生物 。
  • 3:57 - 4:00
    目前傳統的語言學習
  • 4:00 - 4:05
    仍然會優於利用電腦程式的翻譯。
  • 4:05 - 4:07
    但這不是簡單的任務,
  • 4:07 - 4:09
    世界上語言的數量,
  • 4:09 - 4:13
    和人與人之間逐漸增加的語言互動,
  • 4:13 - 4:18
    都會繼續激發「自動翻譯」的進步。
  • 4:18 - 4:21
    也許,遇到星際間的其他生物時,
  • 4:21 - 4:25
    我們已經能夠透過小裝置來溝通,
  • 4:25 - 4:29
    也或許最終,我們還是得著手編寫那部字典。
Title:
電腦如何翻譯人類語言 - 揚尼斯.帕契莫納
Speaker:
Ioannis Papachimonas
Description:

觀看完整課程:http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas
萬能翻譯器在現實生活中可能存在嗎?現在已經有很多個程式宣稱做得到。從一種語言中選取單字、句子,甚至一整本書,都可以將它們翻譯任何其他語言。現實要比這復雜的多許。揚尼斯.帕契莫納向我們展示這些機器翻譯器是怎樣運作,並解釋為什麼它們常常「神智不清」。
課程講授: 揚尼斯.帕契莫納
動畫制作:NOWAY Video Club

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Chinese, Traditional subtitles

Revisions