WEBVTT 00:00:00.000 --> 00:00:04.894 Totoeba: Uma ponte entre linguagens. 00:00:05.961 --> 00:00:11.279 O que é o Tatoeba? 00:00:11.387 --> 00:00:14.317 Tatoeba é um dicionário de linguas. 00:00:14.434 --> 00:00:16.010 Você pode procurar palavras 00:00:16.010 --> 00:00:17.926 e obter traduções. 00:00:18.541 --> 00:00:22.570 Mas não é um dicionário comum. 00:00:23.277 --> 00:00:25.415 É todo baseado em frases, 00:00:25.415 --> 00:00:26.717 não palavras. 00:00:26.717 --> 00:00:30.191 Você pode procurar frases contendo uma certa palavra 00:00:30.191 --> 00:00:33.696 e obter a tradução dessas frases. 00:00:34.327 --> 00:00:37.077 você pode se perguntar "Por que frases?" 00:00:37.077 --> 00:00:40.642 Bem, porque, frases são bem mais interessantes. 00:00:40.688 --> 00:00:43.345 Frases trazes contexto às palavras. 00:00:43.345 --> 00:00:45.797 Frases tem personalidade. 00:00:45.797 --> 00:00:48.538 Elas podem ser engraçadas, inteligentes, bobas 00:00:48.538 --> 00:00:50.378 brilhantes, tocantes, 00:00:50.378 --> 00:00:51.763 dolorosas. 00:00:51.886 --> 00:00:54.338 Frases podem nos ensinar muito, 00:00:54.338 --> 00:00:56.745 e muito mais que palavras. 00:00:57.160 --> 00:00:59.628 Por isso amamos palavras. 00:01:00.074 --> 00:01:03.677 Mas, muito mais, amamos linguagens. 00:01:03.677 --> 00:01:07.265 E o que realmente queremos é ter muitas frases 00:01:07.265 --> 00:01:10.320 em muitas e muitas linguas. 00:01:10.751 --> 00:01:14.218 É por isso que Totoeba é multilingual. 00:01:14.880 --> 00:01:17.588 Mas não aquele tipo de multilingual -- 00:01:17.588 --> 00:01:19.618 não do tipo onde as linguagens 00:01:19.618 --> 00:01:22.111 são simplesmente colocadas lado a lado em pares, 00:01:22.111 --> 00:01:24.637 e alguns pares são deixados de lado 00:01:25.067 --> 00:01:28.286 Tatoeba é multilingual de verdade. 00:01:28.286 --> 00:01:31.726 Todas as linguages são interconectadas. 00:01:32.188 --> 00:01:36.788 Se uma frase em Islandes tem uma tradução em Inglês 00:01:36.788 --> 00:01:40.708 e a frase em Inglês tem uma tradução em Swahili, 00:01:40.708 --> 00:01:45.114 então indiretamente, isto nos dá uma tração em Swahili 00:01:45.114 --> 00:01:47.452 da frase em Islandes. 00:01:47.883 --> 00:01:52.959 Linguages que nunca estariam juntas em um sistema tradicional 00:01:52.959 --> 00:01:56.003 podem estar conectadas no Tatoeba. 00:01:56.003 --> 00:01:58.052 Maravilhoso, não? 00:01:58.652 --> 00:02:01.717 Mas, onde nós obtemos as frases? 00:02:01.717 --> 00:02:04.129 E como nós traduzimos elas? 00:02:04.129 --> 00:02:08.188 Obviamente, isso não pode ser o trabalho de uma pessoa. 00:02:08.726 --> 00:02:12.452 É por isso que o Tatoeba é colaborativo. 00:02:12.575 --> 00:02:15.240 Todos são livres para contribuir. 00:02:15.240 --> 00:02:19.243 E todos tem a habilidade de contribuir. 00:02:19.243 --> 00:02:22.148 Você não precisa ser um poliglota. 00:02:22.148 --> 00:02:24.262 Todos falamos uma linguagem. 00:02:24.262 --> 00:02:26.037 Qualquer um pode alimentar o banco de dados 00:02:26.037 --> 00:02:28.704 para ilustrar um novo vocabulario. 00:02:28.704 --> 00:02:32.748 Todos podem ajudar a garantir que as frases soem corretamente, 00:02:32.748 --> 00:02:35.082 e tenham sua grafia correta. 00:02:35.082 --> 00:02:39.760 E na verdade, este projeto precisa de todo mundo. 00:02:39.760 --> 00:02:42.728 Linguas não são entalhadas na pedra. 00:02:42.728 --> 00:02:45.766 As linguas vivem através de todos nós. 00:02:45.766 --> 00:02:50.004 Nós queremos capturar as particularidades de cada linguagem. 00:02:50.004 --> 00:02:54.122 E nós queremos capturar a evolução delas através do tempo. 00:02:54.122 --> 00:02:56.044 Mas você sabe, seria triste 00:02:56.044 --> 00:03:00.520 coletar todas essas frases e guardá-las somente para nós. 00:03:00.520 --> 00:03:04.360 Porque há tantas coisas que podemos fazer com elas. 00:03:04.360 --> 00:03:07.571 Por isso Tatoeba é aberto, 00:03:07.571 --> 00:03:09.160 O nosso código fonte é aberto, 00:03:09.160 --> 00:03:11.983 Os dados são abertos, 00:03:11.983 --> 00:03:13.972 Nós disponibilizamos todas frases que obtemos 00:03:13.972 --> 00:03:17.775 sob a licensa Creative Commons Attribution 00:03:18.006 --> 00:03:22.281 Isso significa que você pode usa-las livremente em um livro, 00:03:22.281 --> 00:03:23.994 em uma aplicação, 00:03:23.994 --> 00:03:26.252 em um projeto de pesquisa, 00:03:26.252 --> 00:03:29.083 para qualquer coisa! 00:03:29.452 --> 00:03:31.917 Isso é Tatoeba, 00:03:31.917 --> 00:03:35.019 Mas não é só isso 00:03:35.342 --> 00:03:38.923 Tatoeba não é só um dicionário de frases 00:03:38.923 --> 00:03:42.373 aberto e colaborativo. 00:03:42.819 --> 00:03:46.382 É parte de um ecosistema que queremos construir. 00:03:46.382 --> 00:03:49.951 Nós queremos levar as ferramentas de linguagem um passo além. 00:03:49.951 --> 00:03:54.153 Nós queremos inovar o cenário de aprendizado de linguagem. 00:03:54.153 --> 00:03:58.671 E isso não pode ser feito sem recursos livres 00:03:58.671 --> 00:04:02.138 que não podem ser construídos sem uma comunidade, 00:04:02.138 --> 00:04:06.231 que não pode contribuir se não tiver uma plataforma eficiente. 00:04:06.877 --> 00:04:09.841 Por fim, com Tatoeba, 00:04:09.841 --> 00:04:12.960 nós esetamos construindo as fundações 00:04:12.960 --> 00:04:14.444 que farão da Web 00:04:14.444 --> 00:04:23.298 um melhor lugar para se aprender linguas.