1 00:00:06,677 --> 00:00:11,306 映画やテレビに出てくる宇宙人の多くが 苦もなく完璧な英語を話すのは 2 00:00:11,306 --> 00:00:14,483 一体どういうわけなんでしょうか 3 00:00:14,483 --> 00:00:17,886 端的に言えば 宇宙船の乗組員が何年もかけて 4 00:00:17,886 --> 00:00:21,774 宇宙人語の辞書を編纂している姿なんて 誰も見たくないからです 5 00:00:21,774 --> 00:00:23,392 しかし辻褄を合わせる意味で 6 00:00:23,392 --> 00:00:26,789 スタートレックなどSF業界の製作者たちは 7 00:00:26,789 --> 00:00:30,514 万能翻訳機というコンセプトを 世に送り出しました 8 00:00:30,514 --> 00:00:35,012 どんな言語間の翻訳も即座にできる 携帯機器です 9 00:00:35,012 --> 00:00:38,539 では現実の世界に万能翻訳機は 存在し得るのでしょうか 10 00:00:38,539 --> 00:00:42,137 それが可能だと言い張る プログラムはたくさんあります 11 00:00:42,137 --> 00:00:45,954 単語でも文でも 本を丸ごと1冊でも 12 00:00:45,954 --> 00:00:49,004 ある言語から 別の たいていの言語に翻訳でき 13 00:00:49,004 --> 00:00:52,337 現代英語も古代サンスクリット語も お手のものです 14 00:00:52,337 --> 00:00:55,913 もし翻訳というものが ただ単語を辞書で調べるだけのことなら 15 00:00:55,913 --> 00:00:59,825 こうしたプログラムは 人間の力を越えていると言えるでしょう 16 00:00:59,825 --> 00:01:03,299 しかし実際のところは もっと複雑です 17 00:01:03,299 --> 00:01:07,349 規則に基づくタイプの翻訳プログラムは 18 00:01:07,349 --> 00:01:10,302 辞書に載っているすべての単語や その単語が取りうる― 19 00:01:10,302 --> 00:01:13,283 文法的に正しいすべての形を含んだ 語彙のデータベースと 20 00:01:13,283 --> 00:01:18,925 入力言語の基本的な言語的要素を 認識するための一連の規則を用います 21 00:01:18,925 --> 00:01:22,396 「その子たちはマフィンを食べる」は 一見 単純そうな文ですが 22 00:01:22,396 --> 00:01:27,050 プログラムは まず構文 つまり文法的な構造を解析します 23 00:01:27,050 --> 00:01:29,587 「その子たち」が主語で 24 00:01:29,587 --> 00:01:32,317 残りの部分は述語であり 25 00:01:32,317 --> 00:01:34,368 その中には動詞の「食べる」と 26 00:01:34,368 --> 00:01:37,422 直接目的語「マフィン」があることを 割り出します 27 00:01:37,422 --> 00:01:40,249 続いて英語の形態論に沿って 識別する必要があります 28 00:01:40,249 --> 00:01:44,681 意味を持つ最小単位にまで 言語を分解するのです 29 00:01:44,681 --> 00:01:46,124 たとえば「マフィン」という語と 30 00:01:46,124 --> 00:01:49,755 複数を示す接尾辞「s」とは 別々になります 31 00:01:49,755 --> 00:01:52,449 最後に意味論の理解が必要です 32 00:01:52,449 --> 00:01:56,178 文の各部分が実際にどういう意味か 判断するのです 33 00:01:56,178 --> 00:01:58,074 この文を正しく翻訳するために 34 00:01:58,074 --> 00:02:01,982 プログラムは 翻訳後の要素1つ1つに対して 35 00:02:01,982 --> 00:02:05,166 その言語の語彙や規則を参照しますが 36 00:02:05,166 --> 00:02:07,020 ここが微妙なところです 37 00:02:07,020 --> 00:02:11,820 構文的に語順を自由に入れ替えてよい 言語もあれば 38 00:02:11,820 --> 00:02:16,954 入れ替えると「マフィンが子どもを食べる」に なってしまう言語もあります 39 00:02:16,954 --> 00:02:19,647 形態論が問題になることもあります 40 00:02:19,647 --> 00:02:23,243 スロベニア語では「2人の子ども」と 「3人以上の子ども」は区別され 41 00:02:23,243 --> 00:02:27,097 他の多くの言語にはない双数形を示す 接尾辞を使います 42 00:02:27,097 --> 00:02:30,532 ロシア語には定冠詞がないので 子どもたちが食べているのは 43 00:02:30,532 --> 00:02:33,575 ある特定のマフィンなのか 一般的なマフィンなのか 44 00:02:33,575 --> 00:02:36,719 戸惑ってしまうかもしれません 45 00:02:36,719 --> 00:02:39,708 最後に プログラムは意味論に関して 間違いではなくても 46 00:02:39,708 --> 00:02:42,757 細かいところを取りこぼす場合があります 47 00:02:42,757 --> 00:02:45,809 たとえば子どもたちがマフィンを 「普通に食べる」か 48 00:02:45,809 --> 00:02:47,794 「ガツガツむさぼる」か拾いきれません 49 00:02:47,794 --> 00:02:51,558 また別の方法として 統計的機械翻訳というのがあります 50 00:02:51,558 --> 00:02:55,762 すでに人間の手で翻訳されている 本や記事や文書の 51 00:02:55,762 --> 00:02:59,488 データベースを分析する方法です 52 00:02:59,488 --> 00:03:02,959 このプログラムでは 偶然には起こりにくいと考えられる― 53 00:03:02,959 --> 00:03:05,393 原文と翻訳が一致する箇所を探すことで 54 00:03:05,393 --> 00:03:09,345 対応する表現やパターンを特定しておき 55 00:03:09,345 --> 00:03:12,429 それを後々 翻訳に利用します 56 00:03:12,429 --> 00:03:14,969 しかし このタイプの翻訳の質は 57 00:03:14,969 --> 00:03:17,690 初期のデータベースの規模や 58 00:03:17,690 --> 00:03:21,357 目的の言語のサンプルや 文体のサンプルが 59 00:03:21,357 --> 00:03:23,383 どれだけ使えるかに かかっています 60 00:03:23,383 --> 00:03:27,140 コンピュータは例外や変則的な表現 ニュアンスの違いに苦労しますが 61 00:03:27,140 --> 00:03:30,994 これは人間なら本能的にわかるものです 62 00:03:30,994 --> 00:03:35,045 このため研究者の中には 私たちの言語理解を 63 00:03:35,045 --> 00:03:39,251 人間の脳の生物学的構造が生む 特徴だと考える人もいます 64 00:03:39,251 --> 00:03:43,101 事実 もっとも有名な架空の万能翻訳機は 65 00:03:43,101 --> 00:03:46,439 『銀河ヒッチハイク・ガイド』に登場する バベル魚ですが 66 00:03:46,439 --> 00:03:49,726 あれは機械などではなく 小さな生き物で 67 00:03:49,726 --> 00:03:54,210 知覚を持つ生物の脳波と神経信号を テレパシーという形で 68 00:03:54,210 --> 00:03:57,005 翻訳するというものでした 69 00:03:57,005 --> 00:03:59,726 今のところは まだ 昔ながらの言語学習の方が 70 00:03:59,726 --> 00:04:05,106 世の中の どのコンピュータプログラムより 良い結果を出しますが 71 00:04:05,106 --> 00:04:06,749 言語学習は簡単ではありませんし 72 00:04:06,749 --> 00:04:09,014 世界中には数多くの言語があり 73 00:04:09,014 --> 00:04:12,989 それを話す人々の間で 交流が増えていることにも後押しされて 74 00:04:12,989 --> 00:04:18,004 自動翻訳は今後 進歩していく一方でしょう 75 00:04:18,004 --> 00:04:21,409 きっと私たちが 宇宙の生命体に出会う頃には 76 00:04:21,409 --> 00:04:24,660 小型の装置を通じて コミュニケーションが可能になっているでしょう 77 00:04:24,660 --> 00:04:29,026 あるいは結局 例の辞書の編纂に 着手しているかもしれませんけどね