Como é que nos filmes e na TV
tantos seres intergalácticos
conseguem falar português perfeitamente?
A resposta é que ninguém quer assistir
à tripulação de uma nave espacial
passar anos compilando
um dicionário alienígena.
Para manter as coisas consistentes,
os criadores de "Guerra nas Estrelas"
e de outros mundos de ficção científica
introduziram o conceito
de um tradutor universal,
um aparelho portátil que pode traduzir
instantaneamente qualquer língua.
Mas é possível um tradutor
universal na vida real?
Já existem muitos programas
que dizem fazer isso,
que pegam uma palavra, sentença,
ou mesmo um livro inteiro, em uma língua
e traduzem para quase
qualquer outro idioma,
seja inglês moderno ou sânscrito antigo.
Se a tradução fosse apenas uma questão
de procurar palavras num dicionário,
esses programas dariam
um baile nos seres humanos.
A realidade, no entanto,
é um pouco mais complicada.
Um programa de tradução baseado
em regras usa uma base de dados lexical,
que inclui todas as palavras
constantes de um dicionário
e as formas gramaticais que elas podem
tomar e, assim, estabelece regras
para reconhecer os elementos linguísticos
básicos da língua de origem.
Numa sentença aparentemente simples
como: "As crianças comem os bolos",
primeiro o programa analisa a sintaxe,
ou a estrutura gramatical,
identifica "as crianças" como o sujeito,
e o resto da sentença como o predicado,
que consiste no verbo "comer"
e em um objeto direto, "os bolos".
Ele então precisa reconhecer
a morfologia do português
ou como a língua pode se dividir
em unidades menores de significado,
tais como a palavra "bolo"
e o sufixo "s" para indicar o plural.
Finalmente, é necessário
entender a semântica,
ou seja, o significado das diferentes
partes de uma sentença.
Para traduzir essa sentença adequadamente,
o programa precisa se remeter a um grupo
diferente de vocabulário e regras
para cada elemento da língua de destino.
Mas é aqui que a coisa complica.
A sintaxe de algumas línguas permite
o arranjo das palavras em qualquer ordem.
enquanto, em outras, ao se fazer isso,
poderíamos fazer "o bolo comer a criança".
A morfologia pode também ser um problema.
O esloveno distingue entre
duas crianças e três ou mais,
usando um sufixo dual, ausente
em tantas outras línguas,
enquanto a falta
do artigo definido no russo
pode nos deixar em dúvida
se as crianças estão comendo
alguns bolos em particular
ou apenas comendo bolos em geral.
Finalmente, mesmo quando a semântica
está tecnicamente correta,
o programa pode deixar
de perceber questões mais sutis,
tais como saber se as crianças
"mangiano" os bolos
ou se elas "divorano" os bolos.
Um outro método é a máquina
de tradução estatística,
que analisa uma base de dados
de livros, artigos e documentos
já traduzidos por humanos.
Ao encontrar correspondência
entre a fonte e a tradução feita,
improváveis de ocorrer por acaso,
o programa consegue identificar
frases e padrões correspondentes,
e os usa para futuras traduções.
No entanto, a qualidade
desse tipo de tradução
depende do tamanho
da base de dados inicial
e da disponibilidade de amostras
em determinadas línguas,
ou de estilos de escrita.
A dificuldade que os computadores têm
com as exceções, irregularidades
e matizes de significado,
algo que os humanos
percebem instintivamente,
tem levado alguns pesquisadores a crer
que nossa compreensão da língua
é um produto singular
da estrutura biológica do nosso cérebro.
Na verdade, um dos mais famosos
tradutores universais da ficção,
o peixe Babel de "O Guia
dos Mochileiros das Galáxias",
não é de forma alguma uma máquina,
mas uma pequena criatura
que traduz as ondas cerebrais
e os sinais nervosos de espécies sensíveis
através de uma forma de telepatia.
Por ora, aprender uma língua à moda antiga
vai dar melhor resultado do que qualquer
programa de computador disponível.
Mas isso não é uma tarefa fácil,
e o elevado número de línguas do mundo,
assim como a crescente interação
entre as pessoas que as falam,
vão apenas continuar a estimular
avanços na tradução automática.
Quem sabe, quando encontrarmos
formas de vida intergalácticas,
sejamos capazes de nos comunicar
com eles por meio de um aparelhinho
ou no fim sejamos obrigados
a começar a compilar aquele dicionário.