Return to Video

Πώς οι υπολογιστές μεταφράζουν την ανθρώπινη γλώσσα - Ιωάννης Παπαχειμώνας

  • 0:07 - 0:11
    Πώς γίνεται όλα τα διαγαλαξιακά είδη
    στις ταινίες και στην τηλεόραση
  • 0:11 - 0:14
    να μιλούν τέλεια αγγλικά;
  • 0:14 - 0:18
    Μια γρήγορη απάντηση είναι
    πως δεν θα είχε ενδιαφέρον μια ταινία
  • 0:18 - 0:22
    όπου το διαστημικό πλήρωμα θα περνούσε
    αιώνες συντάσσοντας εξωγήινο λεξικό.
  • 0:22 - 0:23
    Αλλά για να είμαστε ακριβείς,
  • 0:23 - 0:27
    οι δημιουργοί του Σταρ Τρεκ και
    άλλων κόσμων επιστημονικής φαντασίας
  • 0:27 - 0:30
    εισήγαγαν την ιδέα
    ενός καθολικού μεταφραστή,
  • 0:30 - 0:35
    μιας φορητής συσκευής που μπορεί
    στη στιγμή να μεταφράσει όλες τις γλώσσες.
  • 0:35 - 0:39
    Επομένως, γίνεται να υπάρξει αληθινά
    ένας καθολικός μεταφραστής;
  • 0:39 - 0:42
    Ήδη έχουμε πολλά προγράμματα
    που ισχυρίζονται ότι αυτό ακριβώς κάνουν,
  • 0:42 - 0:46
    μεταφράζουν μια λέξη, μια πρόταση,
    ένα ολόκληρο βιβλίο από μια γλώσσα
  • 0:46 - 0:49
    σχεδόν σε όλες τις υπόλοιπες,
  • 0:49 - 0:52
    είτε πρόκειται για σύγχρονα αγγλικά
    είτε για αρχαία σανσκριτικά.
  • 0:52 - 0:56
    Αν η μετάφραση αφορούσε μόνο
    την αναζήτηση λέξεων στο λεξικό,
  • 0:56 - 1:00
    θα ήταν παιχνιδάκι
    για αυτά τα προγράμματα.
  • 1:00 - 1:03
    Η πραγματικότητα ωστόσο,
    είναι λίγο πιο περίπλοκη.
  • 1:03 - 1:07
    Ένα μεταφραστικό πρόγραμμα χρησιμοποιεί
    μια λεξικολογική βάση δεδομένων,
  • 1:07 - 1:10
    που περιλαμβάνει όλες τις λέξεις
    που υπάρχουν σε ένα λεξικό,
  • 1:10 - 1:14
    όλους τους γραμματικούς τύπους
    των λέξεων της γλώσσας εισαγωγής,
  • 1:14 - 1:19
    και ένα σύνολο κανόνων που αναγνωρίζουν
    τα στοιχειώδη γλωσσικά στοιχεία της.
  • 1:19 - 1:22
    Σε μια φαινομενικά απλή πρόταση όπως:
    «Τα παιδιά τρώνε τα μάφιν»,
  • 1:22 - 1:27
    το πρόγραμμα πρώτα θα εντοπίσει
    τη σύνταξη ή τη γραμματική δομή,
  • 1:27 - 1:30
    αναγνωρίζοντας τα παιδιά ως το υποκείμενο,
  • 1:30 - 1:32
    και την υπόλοιπη πρόταση ως κατηγόρημα
  • 1:32 - 1:34
    που αποτελείται από το ρήμα «τρώω»,
  • 1:34 - 1:37
    και το άμεσο αντικείμενο «τα μάφιν».
  • 1:37 - 1:40
    Έπειτα πρέπει να αναγνωρίσει
    την αγγλική μορφολογία,
  • 1:40 - 1:45
    ή το πως η γλώσσα αναλύεται
    στις ελάχιστες νοηματικές ενότητές της,
  • 1:45 - 1:46
    όπως τη λέξη «μάφιν»
  • 1:46 - 1:50
    και την κατάληξη «-s»
    που δηλώνει τον πληθυντικό.
  • 1:50 - 1:52
    Τέλος, επεξεργάζεται τη σημασιολογία,
  • 1:52 - 1:56
    το τι πράγματι σημαίνουν
    τα μέρη της πρότασης.
  • 1:56 - 1:58
    Για να μεταφραστεί η πρόταση σωστά,
  • 1:58 - 2:02
    το πρόγραμμα θα αναζητήσει σε άλλο σύνολο
    λεξιλογικών όρων και κανόνων
  • 2:02 - 2:05
    το κάθε στοιχείο της γλώσσας
    προς μετάφραση.
  • 2:05 - 2:07
    Αλλά εδώ γίνεται περίπλοκο.
  • 2:07 - 2:12
    Το συντακτικό ορισμένων γλωσσών
    επιτρέπει κάθε γλωσσικό συνδυασμό
  • 2:12 - 2:17
    ενώ σε άλλες, κάποιοι συνδυασμοί
    θα έκαναν τα μάφιν να τρώνε τα παιδιά.
  • 2:17 - 2:20
    Η μορφολογία επίσης αποτελεί πρόβλημα.
  • 2:20 - 2:23
    Τα σλοβένικα διακρίνουν τα δύο
    από τα τρία παιδιά ή περισσότερα παιδιά
  • 2:23 - 2:27
    προσθέτοντας ένα δυϊκό επίθημα
    που απουσιάζει από πολλές άλλες γλώσσες,
  • 2:27 - 2:31
    ενώ η απουσία οριστικών άρθρων
    στα ρώσικα θα σας κάνει να αναρωτιέστε
  • 2:31 - 2:34
    αν τα παιδιά τρώνε
    κάποια συγκεκριμένα μάφιν
  • 2:34 - 2:36
    ή αν γενικά τρώνε μάφιν.
  • 2:37 - 2:40
    Εν κατακλείδι, ακόμα και αν
    η σημασιολογία είναι τεχνικά ορθή,
  • 2:40 - 2:43
    το πρόγραμμα ίσως σφάλει
    σε λεπτότερες έννοιες,
  • 2:43 - 2:46
    όπως αν τα παιδιά «τρώνε» τα μάφιν
  • 2:46 - 2:48
    ή αν τα «καταβροχθίζουν».
  • 2:48 - 2:52
    Ένας άλλος τρόπος
    είναι η στατική μηχανική μετάφραση,
  • 2:52 - 2:56
    η οποία αναλύει μια βάση δεδομένων
    από βιβλία, άρθρα και έγγραφα
  • 2:56 - 2:59
    που έχουν ήδη μεταφραστεί από ανθρώπους.
  • 2:59 - 3:03
    Εντοπίζοντας ζεύγη μεταξύ
    αρχικού και μεταφρασμένου κειμένου
  • 3:03 - 3:05
    που είναι απίθανο να εμφανίστηκαν τυχαία,
  • 3:05 - 3:09
    το πρόγραμμα μπορεί να αναγνωρίσει
    αντιστοιχίες φράσεων και δομών,
  • 3:09 - 3:12
    και τα χρησιμοποιεί
    σε μελλοντικές μεταφράσεις.
  • 3:12 - 3:15
    Όπως και να έχει,
    η ποιότητα αυτών των μεταφράσεων
  • 3:15 - 3:18
    εξαρτάται από το μέγεθος
    της αρχικής βάσης δεδομένων
  • 3:18 - 3:21
    και τη διαθεσιμότητα δειγμάτων
    μετάφρασης των διαφόρων γλωσσών
  • 3:21 - 3:23
    ή του ύφους γραφής.
  • 3:23 - 3:27
    Η δυσκολία που έχουν οι μηχανές
    να αποδώσουν εξαιρέσεις, ανωμαλίες,
  • 3:27 - 3:31
    και τα αποχρώντα νοήματα
    που ενστικτωδώς κατανοούν οι άνθρωποι,
  • 3:31 - 3:35
    έχει πείσει μερικούς ερευνητές
    πως η γλωσσική μας κατανόηση
  • 3:35 - 3:39
    είναι μοναδικό προϊόν της βιολογικής
    εγκεφαλικής μας δομής.
  • 3:39 - 3:43
    Ένας από τους διασημότερους
    φανταστικούς καθολικούς μεταφραστές,
  • 3:43 - 3:46
    το «Babel Fish» της σειράς:
    «Γυρίστε τον γαλαξία με ωτοστόπ»,
  • 3:46 - 3:50
    δεν είναι καν μηχάνημα αλλά ένα πλασματάκι
  • 3:50 - 3:54
    που μεταφράζει τα εγκεφαλικά κύματα
    και νευρικά σήματα νοήμονων ειδών
  • 3:54 - 3:57
    μέσω ενός είδους τηλεπάθειας.
  • 3:57 - 4:00
    Προς στιγμήν, η εκμάθηση μιας γλώσσας
    με τον παραδοσιακό τρόπο
  • 4:00 - 4:05
    εξακολουθεί να αποδίδει καλύτερα
    από κάθε διαθέσιμο λογισμικό.
  • 4:05 - 4:07
    Αλλά αυτό δεν είναι εύκολο,
  • 4:07 - 4:10
    καθώς μόνο ο τεράστιος αριθμός
    των γλωσσών στον κόσμο,
  • 4:10 - 4:13
    καθώς και η διαρκής αλληλεπίδραση
    των ομιλητών τους,
  • 4:13 - 4:18
    θα επιφέρουν μεγάλες εξελίξεις
    στην αυτόματη μετάφραση.
  • 4:18 - 4:21
    Μπορεί μέχρι να συναντήσουμε
    διαγαλαξιακά όντα,
  • 4:21 - 4:25
    να μπορούμε να επικοινωνήσουμε
    μαζί τους με μια μικρή συσκευή,
  • 4:25 - 4:29
    ή μπορούμε, εναλλακτικά, να αρχίσουμε
    να συντάσσουμε το λεξικό της γλώσσας τους.
Title:
Πώς οι υπολογιστές μεταφράζουν την ανθρώπινη γλώσσα - Ιωάννης Παπαχειμώνας
Speaker:
Ioannis Papachimonas
Description:

Δείτε ολόκληρο το μάθημα εδώ: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Είναι εφικτός στην πραγματικότητα ένας καθολικός μεταφραστής; Υπάρχουν ήδη πολλά προγράμματα που που ισχυρίζονται ότι μπορούν να μεταφράσουν μια λέξη, μια πρόταση, ή ένα ολόκληρο βιβλίο από μια γλώσσα, σχεδόν σε όλες τις άλλες. Ωστόσο η πραγματικότητα είναι λίγο πιο περίπλοκη. Ο Ιωάννης Παπαχειμώνας παρουσιάζει τον τρόπο με τον οποίο λειτουργούν αυτές οι μεταφραστικές μηχανές και εξηγεί γιατί πολλές φορές μπερδεύονται.

Μάθημα: Ιωάννης Παπαχειμώνας, ψηφιακή απεικόνιση: NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Greek subtitles

Revisions