Comment se fait-il
que tant de races intergalactiques
dans les films et les séries
parlent parfaitement l'anglais ?
La réponse courte est que personne
ne veut voir l'équipage d'un vaisseau
passer des années
à compiler un dictionnaire alien.
Mais pour la cohérence
de la chose,
les créateurs de Star Trek et
d'autres mondes de science-fiction
ont introduit le concept
d'un traducteur universel,
un appareil portatif qui peut traduire
instantanément n'importe quelle langue.
Peut-on créer un traducteur universel
dans la vraie vie ?
Il existe déjà de nombreux programmes
qui prétendent pourvoir faire cela,
en prenant un mot, une phrase,
ou un livre entier dans une langue
et le traduire dans quasiment
n'importe quelle autre langue,
que ce soit l'anglais moderne ou
l'ancien sanskrit.
Et si pour traduire, il suffisait
de chercher des mots dans un dictionnaire,
ces programmes seraient partout.
La réalité est, cependant,
un peu plus compliquée.
Un programme de traduction
basé sur des règles utilise
une base de données lexicale,
qui inclut tous les mots
trouvés dans un dictionnaire
et toutes les formes grammaticales
qu'elles peuvent contenir,
et un jeu de règles
permettant de reconnaître
les bases des éléments linguistiques
de la langue source.
Pour un phrase apparemment simple
comme « les enfants mangent les muffins »,
le programme analyse la syntaxe,
ou la structure grammaticale,
en identifiant « les enfants » comme sujet
et le reste de la phrase comme prédicat
consistant du verbe « mangent »
et du complément d'objet direct
« les muffins ».
Il doit ensuite reconnaître
la morphologie anglaise,
ou la séparation de la langue dans
ses plus petites unités ayant un sens,
comme le mot « muffin »
et le suffixe « s »,
utilisé pour indiquer le pluriel.
De plus, il a besoin
de comprendre la sémantique,
ce que les différentes parties de
la phrase veulent dire.
Pour traduire
cette phrase correctement,
le programme devra consulter un jeu
de règles et de vocabulaires différents
pour chaque élément de la langue cible.
Mais c'est là que ça devient compliqué.
La syntaxe de certaines langues
permet aux mots d'être désordonnés,
alors que dans d'autres,
cela pourrait conduire
au « muffin mange l'enfant ».
La morphologie pose aussi un problème.
En slovène, on distingue entre
deux ans et plus
en utilisant d'un double suffixe
absent dans la plupart des autres langues,
lorsqu'en russe le manque d'articles
définis vous fera demander
si les enfants mangeaient
un type particulier de muffins,
ou juste des muffins en général.
Finalement, même quand la sémantique
est techniquement correcte,
le programme peut manquer
les points plus complexes,
comme si les enfants
ont « mangé » les muffins,
ou s'ils les ont « dévorés ».
L'autre méthode est
une machine de traduction statistique,
qui analyse une base de données de livres,
d'articles et de documents
qui ont déjà été traduits par des humains.
En trouvant des correspondances
entre la source et le texte traduit
qui ont peu de chance
de se produire par accident,
le programme peut identifier des
expressions et des schémas correspondants,
et les utiliser pour
des traductions futures.
Cependant, la qualité
de ce type de traduction
dépend de la taille
de la base de données initiale
et de la disponibilité d’échantillons
pour certaines langues
ou styles d'écriture.
La difficulté que les ordinateurs ont
avec les exceptions, les irrégularités
et les nuances du sens qui semblent
être instinctives pour les humains
a amené certains chercheurs à penser
que notre compréhension du langage
est un produit propre à la structure
biologique de notre cerveau.
En fait, un des traducteurs universels
fictifs les plus connus,
le poisson Babel
du « Guide du voyageur galactique »,
n'est pas du tout une machine,
mais une petite créature
qui traduit les ondes cérébrales
et les signaux nerveux de races sensibles
grâce à une forme de télépathie.
Pour l'instant, apprendre
une langue à l'ancienne
vous donnera de meilleurs résultats que
n'importe quel logiciel existant.
Mais ce n'est pas facile,
et le simple nombre
de langues dans le monde,
en plus des interactions croissantes
de personnes qui les parlent,
vont seulement continuer à stimuler des
avancées dans la traduction automatique.
Peut-être que lorsque nous rencontrerons
des formes de vie intergalactiques,
nous serons capables de communiquer
avec eux à travers un petit dispositif,
ou peut-être que nous devrons quand même
compiler ce petit dictionnaire après tout.