1 00:00:00,000 --> 00:00:04,894 Totoeba: Uma ponte entre linguagens. 2 00:00:05,961 --> 00:00:11,279 O que é o Tatoeba? 3 00:00:11,387 --> 00:00:14,317 Tatoeba é um dicionário de linguas. 4 00:00:14,434 --> 00:00:16,010 Você pode procurar palavras 5 00:00:16,010 --> 00:00:17,926 e obter traduções. 6 00:00:18,541 --> 00:00:22,570 Mas não é um dicionário comum. 7 00:00:23,277 --> 00:00:25,415 É todo baseado em frases, 8 00:00:25,415 --> 00:00:26,717 não palavras. 9 00:00:26,717 --> 00:00:30,191 Você pode procurar frases contendo uma certa palavra 10 00:00:30,191 --> 00:00:33,696 e obter a tradução dessas frases. 11 00:00:34,327 --> 00:00:37,077 você pode se perguntar "Por que frases?" 12 00:00:37,077 --> 00:00:40,642 Bem, porque, frases são bem mais interessantes. 13 00:00:40,688 --> 00:00:43,345 Frases trazes contexto às palavras. 14 00:00:43,345 --> 00:00:45,797 Frases tem personalidade. 15 00:00:45,797 --> 00:00:48,538 Elas podem ser engraçadas, inteligentes, bobas 16 00:00:48,538 --> 00:00:50,378 brilhantes, tocantes, 17 00:00:50,378 --> 00:00:51,763 dolorosas. 18 00:00:51,886 --> 00:00:54,338 Frases podem nos ensinar muito, 19 00:00:54,338 --> 00:00:56,745 e muito mais que palavras. 20 00:00:57,160 --> 00:00:59,628 Por isso amamos palavras. 21 00:01:00,074 --> 00:01:03,677 Mas, muito mais, amamos linguagens. 22 00:01:03,677 --> 00:01:07,265 E o que realmente queremos é ter muitas frases 23 00:01:07,265 --> 00:01:10,320 em muitas e muitas linguas. 24 00:01:10,751 --> 00:01:14,218 É por isso que Totoeba é multilingual. 25 00:01:14,880 --> 00:01:17,588 Mas não aquele tipo de multilingual -- 26 00:01:17,588 --> 00:01:19,618 não do tipo onde as linguagens 27 00:01:19,618 --> 00:01:22,111 são simplesmente colocadas lado a lado em pares, 28 00:01:22,111 --> 00:01:24,637 e alguns pares são deixados de lado 29 00:01:25,067 --> 00:01:28,286 Tatoeba é multilingual de verdade. 30 00:01:28,286 --> 00:01:31,726 Todas as linguages são interconectadas. 31 00:01:32,188 --> 00:01:36,788 Se uma frase em Islandes tem uma tradução em Inglês 32 00:01:36,788 --> 00:01:40,708 e a frase em Inglês tem uma tradução em Swahili, 33 00:01:40,708 --> 00:01:45,114 então indiretamente, isto nos dá uma tração em Swahili 34 00:01:45,114 --> 00:01:47,452 da frase em Islandes. 35 00:01:47,883 --> 00:01:52,959 Linguages que nunca estariam juntas em um sistema tradicional 36 00:01:52,959 --> 00:01:56,003 podem estar conectadas no Tatoeba. 37 00:01:56,003 --> 00:01:58,052 Maravilhoso, não? 38 00:01:58,652 --> 00:02:01,717 Mas, onde nós obtemos as frases? 39 00:02:01,717 --> 00:02:04,129 E como nós traduzimos elas? 40 00:02:04,129 --> 00:02:08,188 Obviamente, isso não pode ser o trabalho de uma pessoa. 41 00:02:08,726 --> 00:02:12,452 É por isso que o Tatoeba é colaborativo. 42 00:02:12,575 --> 00:02:15,240 Todos são livres para contribuir. 43 00:02:15,240 --> 00:02:19,243 E todos tem a habilidade de contribuir. 44 00:02:19,243 --> 00:02:22,148 Você não precisa ser um poliglota. 45 00:02:22,148 --> 00:02:24,262 Todos falamos uma linguagem. 46 00:02:24,262 --> 00:02:26,037 Qualquer um pode alimentar o banco de dados 47 00:02:26,037 --> 00:02:28,704 para ilustrar um novo vocabulario. 48 00:02:28,704 --> 00:02:32,748 Todos podem ajudar a garantir que as frases soem corretamente, 49 00:02:32,748 --> 00:02:35,082 e tenham sua grafia correta. 50 00:02:35,082 --> 00:02:39,760 E na verdade, este projeto precisa de todo mundo. 51 00:02:39,760 --> 00:02:42,728 Linguas não são entalhadas na pedra. 52 00:02:42,728 --> 00:02:45,766 As linguas vivem através de todos nós. 53 00:02:45,766 --> 00:02:50,004 Nós queremos capturar as particularidades de cada linguagem. 54 00:02:50,004 --> 00:02:54,122 E nós queremos capturar a evolução delas através do tempo. 55 00:02:54,122 --> 00:02:56,044 Mas você sabe, seria triste 56 00:02:56,044 --> 00:03:00,520 coletar todas essas frases e guardá-las somente para nós. 57 00:03:00,520 --> 00:03:04,360 Porque há tantas coisas que podemos fazer com elas. 58 00:03:04,360 --> 00:03:07,571 Por isso Tatoeba é aberto, 59 00:03:07,571 --> 00:03:09,160 O nosso código fonte é aberto, 60 00:03:09,160 --> 00:03:11,983 Os dados são abertos, 61 00:03:11,983 --> 00:03:13,972 Nós disponibilizamos todas frases que obtemos 62 00:03:13,972 --> 00:03:17,775 sob a licensa Creative Commons Attribution 63 00:03:18,006 --> 00:03:22,281 Isso significa que você pode usa-las livremente em um livro, 64 00:03:22,281 --> 00:03:23,994 em uma aplicação, 65 00:03:23,994 --> 00:03:26,252 em um projeto de pesquisa, 66 00:03:26,252 --> 00:03:29,083 para qualquer coisa! 67 00:03:29,452 --> 00:03:31,917 Isso é Tatoeba, 68 00:03:31,917 --> 00:03:35,019 Mas não é só isso 69 00:03:35,342 --> 00:03:38,923 Tatoeba não é só um dicionário de frases 70 00:03:38,923 --> 00:03:42,373 aberto e colaborativo. 71 00:03:42,819 --> 00:03:46,382 É parte de um ecosistema que queremos construir. 72 00:03:46,382 --> 00:03:49,951 Nós queremos levar as ferramentas de linguagem um passo além. 73 00:03:49,951 --> 00:03:54,153 Nós queremos inovar o cenário de aprendizado de linguagem. 74 00:03:54,153 --> 00:03:58,671 E isso não pode ser feito sem recursos livres 75 00:03:58,671 --> 00:04:02,138 que não podem ser construídos sem uma comunidade, 76 00:04:02,138 --> 00:04:06,231 que não pode contribuir se não tiver uma plataforma eficiente. 77 00:04:06,877 --> 00:04:09,841 Por fim, com Tatoeba, 78 00:04:09,841 --> 00:04:12,960 nós esetamos construindo as fundações 79 00:04:12,960 --> 00:04:14,444 que farão da Web 80 00:04:14,444 --> 00:04:23,298 um melhor lugar para se aprender linguas.