1 00:00:06,677 --> 00:00:11,306 Πώς γίνεται όλα τα διαγαλαξιακά είδη στις ταινίες και στην τηλεόραση 2 00:00:11,306 --> 00:00:13,983 να μιλούν τέλεια αγγλικά; 3 00:00:13,983 --> 00:00:17,886 Μια γρήγορη απάντηση είναι πως δεν θα είχε ενδιαφέρον μια ταινία 4 00:00:17,886 --> 00:00:21,774 όπου το διαστημικό πλήρωμα θα περνούσε αιώνες συντάσσοντας εξωγήινο λεξικό. 5 00:00:21,774 --> 00:00:23,392 Αλλά για να είμαστε ακριβείς, 6 00:00:23,392 --> 00:00:26,789 οι δημιουργοί του Σταρ Τρεκ και άλλων κόσμων επιστημονικής φαντασίας 7 00:00:26,789 --> 00:00:30,224 εισήγαγαν την ιδέα ενός καθολικού μεταφραστή, 8 00:00:30,224 --> 00:00:34,632 μιας φορητής συσκευής που μπορεί στη στιγμή να μεταφράσει όλες τις γλώσσες. 9 00:00:34,632 --> 00:00:38,539 Επομένως, γίνεται να υπάρξει αληθινά ένας καθολικός μεταφραστής; 10 00:00:38,539 --> 00:00:42,137 Ήδη έχουμε πολλά προγράμματα που ισχυρίζονται ότι αυτό ακριβώς κάνουν, 11 00:00:42,137 --> 00:00:45,954 μεταφράζουν μια λέξη, μια πρόταση, ένα ολόκληρο βιβλίο από μια γλώσσα 12 00:00:45,954 --> 00:00:49,004 σχεδόν σε όλες τις υπόλοιπες, 13 00:00:49,004 --> 00:00:52,337 είτε πρόκειται για σύγχρονα αγγλικά είτε για αρχαία σανσκριτικά. 14 00:00:52,337 --> 00:00:55,913 Αν η μετάφραση αφορούσε μόνο την αναζήτηση λέξεων στο λεξικό, 15 00:00:55,913 --> 00:00:59,825 θα ήταν παιχνιδάκι για αυτά τα προγράμματα. 16 00:00:59,825 --> 00:01:02,959 Η πραγματικότητα ωστόσο, είναι λίγο πιο περίπλοκη. 17 00:01:02,959 --> 00:01:07,079 Ένα μεταφραστικό πρόγραμμα χρησιμοποιεί μια λεξικολογική βάση δεδομένων, 18 00:01:07,079 --> 00:01:10,442 που περιλαμβάνει όλες τις λέξεις που υπάρχουν σε ένα λεξικό, 19 00:01:10,442 --> 00:01:13,553 όλους τους γραμματικούς τύπους των λέξεων της γλώσσας εισαγωγής, 20 00:01:13,553 --> 00:01:18,925 και ένα σύνολο κανόνων που αναγνωρίζουν τα στοιχειώδη γλωσσικά στοιχεία της. 21 00:01:18,925 --> 00:01:22,396 Σε μια φαινομενικά απλή πρόταση όπως: «Τα παιδιά τρώνε τα μάφιν», 22 00:01:22,396 --> 00:01:27,050 το πρόγραμμα πρώτα θα εντοπίσει τη σύνταξη ή τη γραμματική δομή, 23 00:01:27,050 --> 00:01:29,587 αναγνωρίζοντας τα παιδιά ως το υποκείμενο, 24 00:01:29,587 --> 00:01:32,317 και την υπόλοιπη πρόταση ως κατηγόρημα 25 00:01:32,317 --> 00:01:34,368 που αποτελείται από το ρήμα «τρώω», 26 00:01:34,368 --> 00:01:37,422 και το άμεσο αντικείμενο «τα μάφιν». 27 00:01:37,422 --> 00:01:40,249 Έπειτα πρέπει να αναγνωρίσει την αγγλική μορφολογία, 28 00:01:40,249 --> 00:01:44,681 ή το πως η γλώσσα αναλύεται στις ελάχιστες νοηματικές ενότητές της, 29 00:01:44,681 --> 00:01:46,124 όπως τη λέξη «μάφιν» 30 00:01:46,124 --> 00:01:49,755 και την κατάληξη «-s» που δηλώνει τον πληθυντικό. 31 00:01:49,755 --> 00:01:52,449 Τέλος, επεξεργάζεται τη σημασιολογία, 32 00:01:52,449 --> 00:01:56,178 το τι πράγματι σημαίνουν τα μέρη της πρότασης. 33 00:01:56,178 --> 00:01:58,074 Για να μεταφραστεί η πρόταση σωστά, 34 00:01:58,074 --> 00:02:01,982 το πρόγραμμα θα αναζητήσει σε άλλο σύνολο λεξιλογικών όρων και κανόνων 35 00:02:01,982 --> 00:02:05,166 το κάθε στοιχείο της γλώσσας προς μετάφραση. 36 00:02:05,166 --> 00:02:07,020 Αλλά εδώ γίνεται περίπλοκο. 37 00:02:07,020 --> 00:02:11,820 Το συντακτικό ορισμένων γλωσσών επιτρέπει κάθε γλωσσικό συνδυασμό 38 00:02:11,820 --> 00:02:16,954 ενώ σε άλλες, κάποιοι συνδυασμοί θα έκαναν τα μάφιν να τρώνε τα παιδιά. 39 00:02:16,954 --> 00:02:19,647 Η μορφολογία επίσης αποτελεί πρόβλημα. 40 00:02:19,647 --> 00:02:23,243 Τα σλοβένικα διακρίνουν τα δύο από τα τρία παιδιά ή περισσότερα παιδιά 41 00:02:23,243 --> 00:02:27,097 προσθέτοντας ένα δυϊκό επίθημα που απουσιάζει από πολλές άλλες γλώσσες, 42 00:02:27,097 --> 00:02:30,532 ενώ η απουσία οριστικών άρθρων στα ρώσικα θα σας κάνει να αναρωτιέστε 43 00:02:30,532 --> 00:02:33,575 αν τα παιδιά τρώνε κάποια συγκεκριμένα μάφιν 44 00:02:33,575 --> 00:02:36,139 ή αν γενικά τρώνε μάφιν. 45 00:02:36,519 --> 00:02:39,708 Εν κατακλείδι, ακόμα και αν η σημασιολογία είναι τεχνικά ορθή, 46 00:02:39,708 --> 00:02:42,757 το πρόγραμμα ίσως σφάλει σε λεπτότερες έννοιες, 47 00:02:42,757 --> 00:02:45,809 όπως αν τα παιδιά «τρώνε» τα μάφιν 48 00:02:45,809 --> 00:02:47,794 ή αν τα «καταβροχθίζουν». 49 00:02:47,794 --> 00:02:51,558 Ένας άλλος τρόπος είναι η στατική μηχανική μετάφραση, 50 00:02:51,558 --> 00:02:55,762 η οποία αναλύει μια βάση δεδομένων από βιβλία, άρθρα και έγγραφα 51 00:02:55,762 --> 00:02:59,168 που έχουν ήδη μεταφραστεί από ανθρώπους. 52 00:02:59,488 --> 00:03:02,959 Εντοπίζοντας ζεύγη μεταξύ αρχικού και μεταφρασμένου κειμένου 53 00:03:02,959 --> 00:03:05,393 που είναι απίθανο να εμφανίστηκαν τυχαία, 54 00:03:05,393 --> 00:03:09,345 το πρόγραμμα μπορεί να αναγνωρίσει αντιστοιχίες φράσεων και δομών, 55 00:03:09,345 --> 00:03:11,939 και τα χρησιμοποιεί σε μελλοντικές μεταφράσεις. 56 00:03:12,429 --> 00:03:14,969 Όπως και να έχει, η ποιότητα αυτών των μεταφράσεων 57 00:03:14,969 --> 00:03:17,690 εξαρτάται από το μέγεθος της αρχικής βάσης δεδομένων 58 00:03:17,690 --> 00:03:21,357 και τη διαθεσιμότητα δειγμάτων μετάφρασης των διαφόρων γλωσσών 59 00:03:21,357 --> 00:03:23,383 ή του ύφους γραφής. 60 00:03:23,383 --> 00:03:27,140 Η δυσκολία που έχουν οι μηχανές να αποδώσουν εξαιρέσεις, ανωμαλίες, 61 00:03:27,140 --> 00:03:30,994 και τα αποχρώντα νοήματα που ενστικτωδώς κατανοούν οι άνθρωποι, 62 00:03:30,994 --> 00:03:35,045 έχει πείσει μερικούς ερευνητές πως η γλωσσική μας κατανόηση 63 00:03:35,045 --> 00:03:39,251 είναι μοναδικό προϊόν της βιολογικής εγκεφαλικής μας δομής. 64 00:03:39,251 --> 00:03:43,101 Ένας από τους διασημότερους φανταστικούς καθολικούς μεταφραστές, 65 00:03:43,101 --> 00:03:46,439 το «Babel Fish» της σειράς: «Γυρίστε τον γαλαξία με ωτοστόπ», 66 00:03:46,439 --> 00:03:49,726 δεν είναι καν μηχάνημα αλλά ένα πλασματάκι 67 00:03:49,726 --> 00:03:54,210 που μεταφράζει τα εγκεφαλικά κύματα και νευρικά σήματα νοήμονων ειδών 68 00:03:54,210 --> 00:03:57,005 μέσω ενός είδους τηλεπάθειας. 69 00:03:57,005 --> 00:03:59,976 Προς στιγμήν, η εκμάθηση μιας γλώσσας με τον παραδοσιακό τρόπο 70 00:03:59,976 --> 00:04:04,886 εξακολουθεί να αποδίδει καλύτερα από κάθε διαθέσιμο λογισμικό. 71 00:04:04,886 --> 00:04:06,659 Αλλά αυτό δεν είναι εύκολο, 72 00:04:06,659 --> 00:04:09,574 καθώς μόνο ο τεράστιος αριθμός των γλωσσών στον κόσμο, 73 00:04:09,574 --> 00:04:12,989 καθώς και η διαρκής αλληλεπίδραση των ομιλητών τους, 74 00:04:12,989 --> 00:04:18,004 θα επιφέρουν μεγάλες εξελίξεις στην αυτόματη μετάφραση. 75 00:04:18,004 --> 00:04:21,409 Μπορεί μέχρι να συναντήσουμε διαγαλαξιακά όντα, 76 00:04:21,409 --> 00:04:24,846 να μπορούμε να επικοινωνήσουμε μαζί τους με μια μικρή συσκευή, 77 00:04:24,846 --> 00:04:29,356 ή μπορούμε, εναλλακτικά, να αρχίσουμε να συντάσσουμε το λεξικό της γλώσσας τους.