0:00:00.000,0:00:04.894 Tatoeba: Uma ponte entre idiomas. 0:00:05.961,0:00:11.279 O que é Tatoeba? 0:00:11.387,0:00:14.317 Tatoeba é um dicionário de línguas 0:00:14.434,0:00:16.010 Você pode procurar palavras 0:00:16.010,0:00:17.926 e ver traduções. 0:00:18.541,0:00:22.570 Mas ele não é exatamente um dicionário típico. 0:00:23.277,0:00:25.415 É todo baseado em sentenças. 0:00:25.415,0:00:26.717 Não palavras. 0:00:26.717,0:00:30.191 Você pode procurar sentenças contendo uma certa palavra 0:00:30.191,0:00:33.696 E pegar a tadução para essas sentenças. 0:00:34.327,0:00:37.077 "Por que sentenças?" você poderia parguntar. 0:00:37.077,0:00:40.642 Bem, porque sentenças são mais interessantes. 0:00:40.688,0:00:43.345 Sentenças trazem contexto para as palavras. 0:00:43.345,0:00:45.797 Sentenças tem personalidade. 0:00:45.797,0:00:48.538 Elas podem ser engraçadas, inteligentes, bobas 0:00:48.538,0:00:50.378 perspicazes, comoventes, 0:00:50.378,0:00:51.763 dolorosas. 0:00:51.886,0:00:54.338 Sentenças podem nos ensinar bastante, 0:00:54.338,0:00:56.745 e bem mais que simples palavras. 0:00:57.160,0:00:59.628 Então nós amamos sentenças 0:01:00.074,0:01:03.677 Mas, além disso, nós amamos idiomas. 0:01:03.677,0:01:07.265 E o que nós queremos realmente é ter muitas sentenças 0:01:07.265,0:01:10.320 em muitas -- e quaisquer -- idiomas. 0:01:10.751,0:01:14.218 Este é o motivo pelo qual Tatoeba é multilíngue. 0:01:14.880,0:01:17.588 Mas não aquele tipo de multilíngue-- 0:01:17.588,0:01:19.618 não é o tipo de onde as línguas 0:01:19.618,0:01:22.111 são apenas colocadas lado a lado, 0:01:22.111,0:01:24.637 e onde alguns pares são colocados de lado. 0:01:25.067,0:01:28.286 Tatoeba é realmente multilíngue. 0:01:28.286,0:01:31.726 Todas as linguas são interconectadas. 0:01:32.188,0:01:36.788 Se uma sentença Islandeza tem uma tradução em Inglês, 0:01:36.788,0:01:40.708 e a sentença em Inglês tem uma tradução em Suaíli, 0:01:40.708,0:01:45.114 então indiretamente, isso proverá uma tradução em Suaíli 0:01:45.114,0:01:47.452 para a sentença Islandeza. 0:01:47.883,0:01:52.959 Idiomas que nunca foram vistas juntos em sistemas tradicionais 0:01:52.959,0:01:56.003 podem ser conectados no Tatoeba. 0:01:56.003,0:01:58.052 Incrível, não é? 0:01:58.652,0:02:01.717 Mas, onde nós pegamos as sentenças? 0:02:01.717,0:02:04.129 E como nós as traduzimos? 0:02:04.129,0:02:08.188 Obviamente, isto não pode ser um trabalho para uma pessoa. 0:02:08.726,0:02:12.452 Este é o motivo pelo qual Tatoeba é colaborativo. 0:02:12.575,0:02:15.240 Todos são livres para contribuir. 0:02:15.240,0:02:19.243 E todo mundo tem capacidade para contibuir. 0:02:19.243,0:02:22.148 Não é necessário ser um poliglota. 0:02:22.148,0:02:24.262 Todo mundo fala uma língua. 0:02:24.262,0:02:26.037 Todos podem alimentar a base de dados. 0:02:26.037,0:02:28.704 para exemplificar novo vocabulário. 0:02:28.704,0:02:32.748 Todos podem ajudar certificando que as sentenças soam corretamente, 0:02:32.748,0:02:35.082 e são corretamente soletradas. 0:02:35.082,0:02:39.760 E na verdade, este projeto necessita de todos. 0:02:39.760,0:02:42.728 Idiomas não são esculpidos numa pedra. 0:02:42.728,0:02:45.766 Idiomas vivem através de todos nós. 0:02:45.766,0:02:50.004 Nós queremos capturar toda as particularidades de cada linguagem. 0:02:50.004,0:02:54.122 e nós queremos capturar sua evolução através do tempo. 0:02:54.122,0:02:56.044 Mas você sabe, seria triste 0:02:56.044,0:03:00.520 colecionar todas essas sentenças e manter as mesmas para nós mesmos. 0:03:00.520,0:03:04.360 Porque há muito o que fazer com elas. 0:03:04.360,0:03:07.571 É por isso que Tatoeba é aberto. 0:03:07.571,0:03:09.160 Nosso código fonte é aberto, 0:03:09.160,0:03:11.983 Nossos dados são abertos. 0:03:11.983,0:03:13.972 Liberamos todas as sentenças que colecionarmos 0:03:13.972,0:03:17.775 sob a licença Creative Commons Attribuition. 0:03:18.006,0:03:22.281 Isso sisgnifica que você pode reusá-las livremente em um livro, 0:03:22.281,0:03:23.994 em uma aplicação, 0:03:23.994,0:03:26.252 em um projeto de pesquisa, 0:03:26.252,0:03:29.083 para qualquer propósito! 0:03:29.452,0:03:31.917 Então este é o Tatoeba, 0:03:31.917,0:03:35.019 Mas isto não é a visão total. 0:03:35.342,0:03:38.923 Tatoeba não é apenas aberto, colaborativo, 0:03:38.923,0:03:42.373 dicionário multilíngue de sentenças, 0:03:42.819,0:03:46.382 é parte de um ecosistema que queremos construir. 0:03:46.382,0:03:49.951 Nós queremos trazer ferramentas de idiomas para um próximo nível. 0:03:49.951,0:03:54.153 Nós queremos ver a inovação no campo do aprendizado de idiomas. 0:03:54.153,0:03:58.671 E isto não pode acontecer sem recursos de idiomas abertos 0:03:58.671,0:04:02.138 que não podem ser construidos sem uma comunidade, 0:04:02.138,0:04:06.231 que não pode contribuir sem plataformas eficientes. 0:04:06.877,0:04:09.841 Então pra terminar, com Tatoeba, 0:04:09.841,0:04:12.960 nós estamos apenas construindo os fundamentos 0:04:12.960,0:04:14.444 para fazer a Internet 0:04:14.444,0:04:23.298 um lugar melhor para o aprendizado de idiomas.