สิ่งมีชีวิตต่างกาแล็คซี่ในภาพยนต์และในโทรทัศน์
พูดภาษาอังกฤษได้อย่างสมบูรณ์แบบได้อย่างไร
คำตอบสั้น ๆ ก็คือ
ไม่มีใครอยากจะเห็นลูกเรือยานอวกาศ
ใช้เวลาหลายปีในการรวบรวมพจนานุกรมเอเลียน
แต่เพื่อให้สิ่งต่าง ๆ คงเส้นคงวา
ผู้สร้าง สตาร์ เทรค และนิยายวิทยาศาสตร์อื่น ๆ
ได้นำแนวคิดของผู้แปลภาษาสากล
อุปกรณ์พกพาที่สามารถแปลระหว่างภาษาใดก็ได้
ได้ในทันที
แล้วผู้แปลภาษาสากลนี้มีอยู่จริง ๆ หรือเปล่า
เรามีโปรแกรมมากมาย
ที่อ้างว่าทำอย่างนั้นได้
คือนำคำ ประโยค หรือหนังสือทั้งเล่ม
ที่เขียนด้วยภาษาหนึ่ง
และแปลมันออกมาเป็นอีกภาษาหนึ่ง
ไม่ว่ามันจะเป็นภาษาอังกฤษยุคใหม่
หรือภาษาสันสกฤตโบราณ
และถ้าการแปลเป็นเพียงแค่
การมองหาคำในพจนานุกรม
โปรแกรมเหล่านี้คงจะทำงานเป็นวงจร
ในแบบที่มนุษย์ทำ
อย่างไรก็ดี ในความจริง
มันซับซ้อนยิ่งกว่านั้น
โปรแกรมการแปล
ที่ขึ้นอยู่กับกฎการใช้ฐานข้อมูลศัพท์
ซึ่งรวมถึงคำทั้งหมดที่คุณจะพบได้
ในพจนานุกรม
และรูปแบบไวยกรณ์ทั้งหมดที่พวกมันจะถูกใช้
และชุดของกฎเพื่อจดจำ
ส่วนพื้นฐานทางภาษาของภาษาพื้นฐานที่ป้อนให้
สำหรับประโยคง่าย ๆ อย่างเช่น
"เด็ก ๆ กินมัฟฟิน"
โปรแกรมจะชำแหละคำศัพท์
หรือโครงสร้างไวยกรณ์
โดยบ่งชี้ว่า เด็ก ๆ เป็นประธาน
และที่เหลือในประโยคนั้นเป็นภาคแสดง
ที่ประกอบด้วย คำกริยา "กิน"
และกรรมตรง "มัฟฟิน"
จากนั้นมันต้องจดจำสัณฐานวิทยาของภาษาอังกฤษ
หรือว่าภาษานั้นสามารถถูกแบ่งย่อยลงมา
เป็นส่วนเล็กที่สุดที่มีความหมายได้อย่างไร
อย่างเช่นคำว่า มัฟฟิน
และส่วนต่อท้ายคำ "s"
ที่ใช้เพื่อบ่งบอกนามพหูพจน์
ท้ายที่สุด มันต้องเข้าใจอรรถศาสตร์
ว่าแต่ละส่วนของประโยชน์
มีความหมายจริง ๆ ว่าอย่างไร
เพื่อแปลประโยคนี้อย่างเหมาะสม
โปรแกรมจะอ้างอิงถึงคำศัพท์และกฎต่าง ๆ
สำหรับแต่ละส่วนของภาษาเป้าหมาย
แต่นี่คือตอนที่มันซับซ้อน
คำศัพท์ของบางภาษา
ยอมให้คำเรียงอยู่ในลำดับใดก็ได้
ในขณะที่ในบางภาษา การทำเช่นนั้นอาจทำให้
มัฟฟินกินเด็ก
สัณฐานวิทยาของภาษายังสามารถก่อปัญหาได้
ภาษาสโลวาเนียแยกระหว่าง
เด็กสองคน และสามคน หรือมากกว่า
โดยการใช้ส่วนเติมหน้าคำสองคำ
ที่ไม่มีในหลาย ๆ ภาษา
ในขณะที่ภาษารัสเซียที่ไม่มีคำนำหน้าที่แน่นอน
อาจทำให้คุณงงว่า
เด็กกำลังกินมัฟฟินจำเพาะเจาะจงอันไหนสักอัน
หรือแค่กินมัฟฟินทั่ว ๆ ไป
ท้ายที่สุด ถึงแม้ว่าอรรถศาสตร์ถูกต้องตามเทคนิค
โปรแกรมอาจพลาดในจุดที่ละเอียด
เช่น เมื่อใดที่เด็ก ๆ "แมนจิโน" มัฟฟิน
หรือ "ดิโบราโน" พวกมัน
อีกวิธีคือการใช้เครื่องแปลแบบสถิติ
ซึ่งวิเคราะห์ฐานข้อมูลหนังสือ
บทความ และเอกสาร
ที่ได้ถูกแปลเอาไว้แล้วโดยมนุษย์
โดยการหาสิ่งที่เหมือนกันระหว่างแหล่ง
กับข้อความที่ถูกแปล
ที่ไม่น่าจะเกิดขึ้นเพราะการสุ่มเดา
โปรแกรมสามารถบ่งบอกได้
ถึงวลีและรูปแบบที่เกี่ยวข้อง
และใช้พวกมันสำหรับการแปลในอนาคต
อย่าไรก็ดี คุณภาพของการแปลแบบนี้
ขึ้นอยู่กับขนาดของฐานข้อมูลภายใน
และการปรากฎอยู่ของตัวอย่าง
ของภาษานั้นๆ
หรือรูปแบบของการเขียน
อุปสรรค์ที่คอมพิวเตอร์มีต่อข้อยกเว้น
ความไม่แน่นอน
และระดับของความหมาย
ที่อาจทำให้มันแตกต่างสำหรับคนเรา
นำไปสู่งานวิจัยที่เชื่อว่า
ความเข้าในในภาษาของเรานั้น
เป็นผลลัพธ์ที่มีเอกลักษณ์
ของโครงสร้างทางชีวภาพของสมอง
อันที่จริง หนึ่งในนักแปลสากลในนิยาย
ที่เป็นที่รู้จักมากที่สุด
คือ ปลาบาเบล จาก
"เดอะ ฮิทช์ไฮเกอส์ ไกด์ ทู เดอะ กาแล็คซี"
ไม่ใช่เครื่องอะไรเลย แต่เป็นสัตว์เล็กๆ
ที่เปลี่ยนคลื่นสมอง
และสัญญาณประสาทของสัตว์ที่มีชีวิตจิตใจ
ผ่านรูปแบบของการส่งกระแสจิต
ตอนนี้ การเรียนภาษาแบบวิธีดั้งเดิม
จะยังให้ผลลัพธ์ที่มีคุณภาพดีกว่า
เมื่อเทียบโปรแกรมคอมพิวเตอร์ใด ๆ ที่มีอยู่
แต่นี่ไม่ใช่อะไรง่าย ๆ
และจำนวนคร่าว ๆ ของภาษาในโลกนี้
เช่นเดียวกันกับ การเพิ่มขึ้นของการมีปฏิสัมพันธ์
ระหว่างผู้ที่พูดภาษาเหล่านั้น
จะกระตุ้นความก้าวหน้าของการแปลอัตโนมัติ
ต่อไปอย่างต่อเนื่อง
บางที เมื่อถึงเวลา
ที่เราจะได้พบกับสิ่งมีชีวิตนอกโลก
เราจะสามารถสื่อสารกับพวกเขาผ่านอุปกรณ์เล็ก ๆ
หรือที่สุดแล้ว เราอาจต้อง
เริ่มที่จะรวบรวมพจนานุกรมดังกล่าว