Return to Video

Como os computadores traduzem a linguagem humana — Ioannis Papachimonas

  • 0:07 - 0:11
    Como é que tantas espécies intergalácticas,
    nos cinemas e na TV,
  • 0:11 - 0:14
    falam um inglês tão perfeito?
  • 0:14 - 0:18
    A resposta rápida é que ninguém quer ver
    a tripulação de uma nave espacial
  • 0:18 - 0:22
    passar anos a compilar
    um dicionário extraterrestre.
  • 0:22 - 0:24
    Mas, para tornar as coisas consistentes,
  • 0:24 - 0:27
    os criadores do Star Trek
    e de outros mundos da ficção científica
  • 0:27 - 0:31
    introduziram o conceito
    dum tradutor universal,
  • 0:31 - 0:35
    um aparelho portátil que traduz
    instantaneamente qualquer língua.
  • 0:35 - 0:39
    Será então possível na vida real
    um tradutor universal?
  • 0:39 - 0:42
    Já temos muitos programas
    que afirmam fazer isso,
  • 0:42 - 0:46
    agarrando numa palavra, numa frase,
    ou num livro inteiro numa língua
  • 0:46 - 0:49
    e traduzindo-o em quase todas as outras,
  • 0:49 - 0:52
    seja em inglês moderno
    ou em sânscrito antigo.
  • 0:52 - 0:56
    Se a tradução fosse apenas uma questão
    de procurar palavras num dicionário,
  • 0:56 - 1:00
    estes programas dariam cartas
    aos seres humanos.
  • 1:00 - 1:03
    Mas a realidade
    é um pouco mais complicada.
  • 1:03 - 1:07
    Um programa de tradução com base em regras
    usa uma base de dados de vocábulos,
  • 1:07 - 1:11
    o que inclui todas as palavras
    que encontramos num dicionário
  • 1:11 - 1:13
    e todas as formas gramaticais
    que elas podem assumir,
  • 1:13 - 1:15
    e um conjunto de regras
  • 1:15 - 1:19
    para reconhecer os elementos
    linguísticos básicos na língua inicial.
  • 1:19 - 1:23
    Para uma frase aparentemente simples
    como "As crianças comem os bolos",
  • 1:23 - 1:27
    o programa analisa primeiro a sintaxe,
    ou estrutura gramatical,
  • 1:27 - 1:30
    identificando "as crianças" como o sujeito
  • 1:30 - 1:32
    e o resto da frase como o predicado
  • 1:32 - 1:35
    que é formado por um verbo "comer"
  • 1:35 - 1:37
    e por um complemento direto, "os bolos".
  • 1:37 - 1:40
    Depois precisa de reconhecer
    a sua morfologia
  • 1:40 - 1:42
    ou seja, como a língua pode ser dividida
  • 1:42 - 1:45
    nas suas unidades significativas
    mais pequenas,
  • 1:45 - 1:47
    como a palavra "bolos"
  • 1:47 - 1:49
    e o sufixo "s" usado para indicar o plural.
  • 1:50 - 1:53
    Por fim, precisa de compreender
    a semântica,
  • 1:53 - 1:56
    o que significam realmente
    as diferentes partes da frase.
  • 1:56 - 1:58
    Para traduzir esta frase devidamente,
  • 1:58 - 2:02
    o programa tem que se referir a um conjunto
    diferente de vocabulário e de regras
  • 2:02 - 2:05
    para cada elemento da língua de destino.
  • 2:05 - 2:07
    Mas é aqui que a coisa se complica.
  • 2:07 - 2:09
    A sintaxe de algumas línguas permite
  • 2:09 - 2:12
    que as palavras se arranjem
    por uma ordem qualquer
  • 2:12 - 2:17
    enquanto noutras, fazer isso pode fazer
    com que "os bolos comam as crianças".
  • 2:17 - 2:20
    A morfologia também levanta um problema,
  • 2:20 - 2:23
    o esloveno distingue
    entre duas crianças e três ou mais
  • 2:23 - 2:27
    usando um sufixo dual que não existe
    em muitas outras línguas,
  • 2:27 - 2:31
    enquanto a falta de artigos definidos,
    no russo, podem deixar-nos na incerteza
  • 2:31 - 2:34
    se as crianças estão a comer
    determinados bolos especiais
  • 2:34 - 2:37
    ou a comer quaisquer bolos em geral.
  • 2:37 - 2:40
    Por fim, mesmo que a semântica
    esteja tecnicamente correta,
  • 2:40 - 2:43
    o programa pode ignorar
    pormenores mais ténues
  • 2:43 - 2:46
    como se as crianças "mangiano" os bolos
  • 2:46 - 2:48
    ou os "divorano".
  • 2:48 - 2:52
    Outro método é a tradução
    automática por estatística,
  • 2:52 - 2:56
    que analisa uma base de dados
    de livros, artigos e documentos
  • 2:56 - 2:59
    que já foram traduzidos por pessoas.
  • 2:59 - 3:03
    Encontrando correspondências
    entre texto original e traduzido
  • 3:03 - 3:05
    que improvavelmente ocorrem por acaso,
  • 3:05 - 3:09
    o programa identifica frases
    e padrões correspondentes,
  • 3:09 - 3:12
    e usa-os para traduções posteriores.
  • 3:12 - 3:15
    Mas a qualidade deste tipo de tradução
  • 3:15 - 3:18
    depende do tamanho
    da base de dados inicial
  • 3:18 - 3:21
    e a disponibilidade de amostras
    para certas línguas
  • 3:21 - 3:23
    ou estilos de escrita.
  • 3:23 - 3:27
    A dificuldade que os computadores têm
    com as exceções, as irregularidades
  • 3:27 - 3:29
    e os cambiantes de sentido que,
  • 3:29 - 3:31
    segundo parece, são instintivos
    nos seres humanos,
  • 3:31 - 3:35
    levou alguns investigadores a crer
    que a nossa compreensão da linguagem
  • 3:35 - 3:39
    é um produto único da nossa estrutura
    cerebral biológica.
  • 3:39 - 3:43
    Na verdade, um dos tradutores
    universais de ficção, mais conhecidos,
  • 3:43 - 3:47
    o Babel fish de "À Boleia Pela Galáxia",
  • 3:47 - 3:50
    não é nenhuma máquina,
    é uma pequena criatura
  • 3:50 - 3:54
    que traduz as ondas cerebrais
    e os sinais nervosos de espécies sensíveis
  • 3:54 - 3:57
    através duma forma de telepatia.
  • 3:57 - 4:00
    Para já, aprender uma língua à moda antiga
  • 4:00 - 4:02
    ainda nos dá melhores resultados
  • 4:02 - 4:05
    do que qualquer programa
    de computador atualmente disponível.
  • 4:05 - 4:07
    Mas não é uma tarefa fácil,
  • 4:07 - 4:10
    e a considerável quantidade
    de línguas no mundo,
  • 4:10 - 4:13
    assim como a crescente interação
    entre as pessoas que as falam,
  • 4:13 - 4:18
    continuarão a estimular maiores progressos
    na tradução automática.
  • 4:18 - 4:22
    Talvez que, na altura em que encontrarmos
    formas de vida intergalácticas,
  • 4:22 - 4:25
    possamos comunicar com elas
    através dum pequeno aparelho
  • 4:25 - 4:29
    ou tenhamos que começar
    a compilar esse dicionário.
Title:
Como os computadores traduzem a linguagem humana — Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Vejam a lição completa: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Será possível um tradutor universal na vida real? Já temos muitos programas que afirmam poder agarrar numa palavra, numa frase ou num livro inteiro numa língua e traduzi-lo para quase todas as outras línguas. Mas a realidade é um pouco mais complicada. Ioannis Papachimonas mostra como estas máquinas tradutoras funcionam e explica porque é que muitas vezes apresentam uma certa misturada.

Lição de Ioannis Papachimonas, animação de NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Portuguese subtitles

Revisions