Return to Video

Como os computadores traduzem línguas humanas - Ioannis Papachimonas

  • 0:07 - 0:11
    Como é que nos filmes e na TV
    tantos seres intergalácticos
  • 0:11 - 0:14
    conseguem falar português perfeitamente?
  • 0:14 - 0:18
    A resposta é que ninguém quer assistir
    à tripulação de uma nave espacial
  • 0:18 - 0:21
    passar anos compilando
    um dicionário alienígena.
  • 0:21 - 0:25
    Para manter as coisas consistentes,
    os criadores de "Guerra nas Estrelas"
  • 0:25 - 0:27
    e de outros mundos de ficção científica
  • 0:27 - 0:31
    introduziram o conceito
    de um tradutor universal,
  • 0:31 - 0:35
    um aparelho portátil que pode traduzir
    instantaneamente qualquer língua.
  • 0:35 - 0:39
    Mas é possível um tradutor
    universal na vida real?
  • 0:39 - 0:42
    Já existem muitos programas
    que dizem fazer isso,
  • 0:42 - 0:46
    que pegam uma palavra, sentença,
    ou mesmo um livro inteiro, em uma língua
  • 0:46 - 0:49
    e traduzem para quase
    qualquer outro idioma,
  • 0:49 - 0:52
    seja inglês moderno ou sânscrito antigo.
  • 0:52 - 0:56
    Se a tradução fosse apenas uma questão
    de procurar palavras num dicionário,
  • 0:56 - 1:00
    esses programas dariam
    um baile nos seres humanos.
  • 1:00 - 1:03
    A realidade, no entanto,
    é um pouco mais complicada.
  • 1:03 - 1:07
    Um programa de tradução baseado
    em regras usa uma base de dados lexical,
  • 1:07 - 1:10
    que inclui todas as palavras
    constantes de um dicionário
  • 1:10 - 1:14
    e as formas gramaticais que elas podem
    tomar e, assim, estabelece regras
  • 1:14 - 1:19
    para reconhecer os elementos linguísticos
    básicos da língua de origem.
  • 1:19 - 1:22
    Numa sentença aparentemente simples
    como: "As crianças comem os bolos",
  • 1:22 - 1:27
    primeiro o programa analisa a sintaxe,
    ou a estrutura gramatical,
  • 1:27 - 1:30
    identifica "as crianças" como o sujeito,
  • 1:30 - 1:32
    e o resto da sentença como o predicado,
  • 1:32 - 1:34
    que consiste no verbo "comer"
  • 1:34 - 1:37
    e em um objeto direto, "os bolos".
  • 1:37 - 1:40
    Ele então precisa reconhecer
    a morfologia do português
  • 1:40 - 1:45
    ou como a língua pode se dividir
    em unidades menores de significado,
  • 1:45 - 1:46
    tais como a palavra "bolo"
  • 1:46 - 1:50
    e o sufixo "s" para indicar o plural.
  • 1:50 - 1:52
    Finalmente, é necessário
    entender a semântica,
  • 1:52 - 1:56
    ou seja, o significado das diferentes
    partes de uma sentença.
  • 1:56 - 1:58
    Para traduzir essa sentença adequadamente,
  • 1:58 - 2:02
    o programa precisa se remeter a um grupo
    diferente de vocabulário e regras
  • 2:02 - 2:05
    para cada elemento da língua de destino.
  • 2:05 - 2:07
    Mas é aqui que a coisa complica.
  • 2:07 - 2:12
    A sintaxe de algumas línguas permite
    o arranjo das palavras em qualquer ordem.
  • 2:12 - 2:17
    enquanto, em outras, ao se fazer isso,
    poderíamos fazer "o bolo comer a criança".
  • 2:17 - 2:20
    A morfologia pode também ser um problema.
  • 2:20 - 2:23
    O esloveno distingue entre
    duas crianças e três ou mais,
  • 2:23 - 2:27
    usando um sufixo dual, ausente
    em tantas outras línguas,
  • 2:27 - 2:29
    enquanto a falta
    do artigo definido no russo
  • 2:29 - 2:31
    pode nos deixar em dúvida
  • 2:31 - 2:34
    se as crianças estão comendo
    alguns bolos em particular
  • 2:34 - 2:37
    ou apenas comendo bolos em geral.
  • 2:37 - 2:40
    Finalmente, mesmo quando a semântica
    está tecnicamente correta,
  • 2:40 - 2:43
    o programa pode deixar
    de perceber questões mais sutis,
  • 2:43 - 2:46
    tais como saber se as crianças
    "mangiano" os bolos
  • 2:46 - 2:48
    ou se elas "divorano" os bolos.
  • 2:48 - 2:52
    Um outro método é a máquina
    de tradução estatística,
  • 2:52 - 2:56
    que analisa uma base de dados
    de livros, artigos e documentos
  • 2:56 - 2:59
    já traduzidos por humanos.
  • 2:59 - 3:03
    Ao encontrar correspondência
    entre a fonte e a tradução feita,
  • 3:03 - 3:05
    improváveis de ocorrer por acaso,
  • 3:05 - 3:09
    o programa consegue identificar
    frases e padrões correspondentes,
  • 3:09 - 3:12
    e os usa para futuras traduções.
  • 3:12 - 3:15
    No entanto, a qualidade
    desse tipo de tradução
  • 3:15 - 3:18
    depende do tamanho
    da base de dados inicial
  • 3:18 - 3:21
    e da disponibilidade de amostras
    em determinadas línguas,
  • 3:21 - 3:23
    ou de estilos de escrita.
  • 3:23 - 3:27
    A dificuldade que os computadores têm
    com as exceções, irregularidades
  • 3:27 - 3:29
    e matizes de significado,
  • 3:29 - 3:31
    algo que os humanos
    percebem instintivamente,
  • 3:31 - 3:35
    tem levado alguns pesquisadores a crer
    que nossa compreensão da língua
  • 3:35 - 3:39
    é um produto singular
    da estrutura biológica do nosso cérebro.
  • 3:39 - 3:43
    Na verdade, um dos mais famosos
    tradutores universais da ficção,
  • 3:43 - 3:46
    o peixe Babel de "O Guia
    dos Mochileiros das Galáxias",
  • 3:46 - 3:50
    não é de forma alguma uma máquina,
    mas uma pequena criatura
  • 3:50 - 3:54
    que traduz as ondas cerebrais
    e os sinais nervosos de espécies sensíveis
  • 3:54 - 3:57
    através de uma forma de telepatia.
  • 3:57 - 4:00
    Por ora, aprender uma língua à moda antiga
  • 4:00 - 4:05
    vai dar melhor resultado do que qualquer
    programa de computador disponível.
  • 4:05 - 4:07
    Mas isso não é uma tarefa fácil,
  • 4:07 - 4:09
    e o elevado número de línguas do mundo,
  • 4:09 - 4:13
    assim como a crescente interação
    entre as pessoas que as falam,
  • 4:13 - 4:18
    vão apenas continuar a estimular
    avanços na tradução automática.
  • 4:18 - 4:21
    Quem sabe, quando encontrarmos
    formas de vida intergalácticas,
  • 4:21 - 4:25
    sejamos capazes de nos comunicar
    com eles por meio de um aparelhinho
  • 4:25 - 4:29
    ou no fim sejamos obrigados
    a começar a compilar aquele dicionário.
Title:
Como os computadores traduzem línguas humanas - Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Assista à aula completa em: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

É possível um tradutor universal na vida real? Já existem diversos programas que se dizem capazes de pegar uma palavra, uma sentença, ou mesmo um livro inteiro, numa determinada língua e traduzir para quase qualquer outra língua. A realidade, no entanto, é um pouco mais complicada. Ioannis Papachimonas mostra como as máquinas de tradução funcionam e explica por que elas frequentemente se atrapalham um pouco.

Aula ministrada por Ioannis Papachimonas; animação de NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Portuguese, Brazilian subtitles

Revisions