WEBVTT 00:00:00.000 --> 00:00:01.612 Tatoeba: silta kielten välillä. 00:00:05.961 --> 00:00:08.277 Mikä Tatoeba on? 00:00:11.387 --> 00:00:13.511 Tatoeba on kielisanakirja. 00:00:14.434 --> 00:00:16.010 Voit etsiä sanoja 00:00:16.010 --> 00:00:17.926 ja saada niille käännöksiä. 00:00:18.541 --> 00:00:22.570 Mutta se ei ole tarkalleen ottaen tavanomainen sanakirja. 00:00:23.277 --> 00:00:25.415 Kyse on lauseista, 00:00:25.415 --> 00:00:26.717 ei sanoista. 00:00:26.717 --> 00:00:30.191 Voit etsiä lauseita, joissa on tietty sana 00:00:30.191 --> 00:00:33.696 ja saat käännöksiä näille lauseille. 00:00:34.327 --> 00:00:36.506 ”Miksi lauseita?” saatat kysyä. 00:00:37.077 --> 00:00:40.642 No, koska lauseet ovat mielenkiintoisempia. 00:00:40.688 --> 00:00:43.345 Lauseet antavat sanoille asiayhteyden. 00:00:43.345 --> 00:00:45.797 Lauseilla on persoonallisuus. 00:00:45.797 --> 00:00:48.538 Ne voivat olla hauskoja, fiksuja, höpsöjä 00:00:48.538 --> 00:00:50.378 oivaltavia, koskettavia, 00:00:50.378 --> 00:00:51.763 loukkaavia. 00:00:51.886 --> 00:00:54.338 Lauseet voivat opettaa meille paljon, 00:00:54.338 --> 00:00:56.745 paljon enemmän kuin pelkkiä sanoja. 00:00:57.160 --> 00:00:59.628 Joten me tykkäämme lauseista. 00:01:00.074 --> 00:01:03.272 Mutta vielä enemmän me tykkäämme kielistä. 00:01:03.677 --> 00:01:07.265 Ja se mitä me oikeasti haluamme on paljon lauseita 00:01:07.265 --> 00:01:10.320 monilla — ja millä tahansa — kielillä. 00:01:10.751 --> 00:01:14.031 Tämän takia Tatoeba on monikielinen. 00:01:14.880 --> 00:01:17.588 Mutta ei sillä tavalla monikielinen — 00:01:17.588 --> 00:01:19.618 ei niin, että kaikista kielistä 00:01:19.618 --> 00:01:22.111 on vain yksinkertaisesti muodostettu pareja, ja 00:01:22.111 --> 00:01:24.637 toiset parit jäävät muista jälkeen. 00:01:25.067 --> 00:01:28.286 Tatoeba on oikeasti monikielinen. 00:01:28.286 --> 00:01:31.726 Kaikki kielet ovat yhteydessä toisiinsa. 00:01:32.188 --> 00:01:36.788 Jos islanninkielisellä lauseella on englanninkielinen käännös, 00:01:36.788 --> 00:01:40.157 ja englanninkielisellä lauseella on käännös swahiliksi, 00:01:40.708 --> 00:01:44.315 niin silloin tästä syntyy epäsuora swahilinkielinen käännös 00:01:45.114 --> 00:01:47.452 islanninkieliselle lauseelle. 00:01:47.883 --> 00:01:52.471 Kielet, jotka eivät olisi koskaan löytäneet toisiaan perinteisessä järjestelmässä, 00:01:52.959 --> 00:01:55.136 voidaan saattaa yhteen Tatoebassa. 00:01:56.003 --> 00:01:57.314 Siistiä, vai mitä? 00:01:58.652 --> 00:02:00.801 Mutta mistä me saamme lauseet? 00:02:01.717 --> 00:02:03.468 Ja miten me käännämme ne? 00:02:04.129 --> 00:02:07.244 Se ei voi olla päivänselvästi yhden henkilön kontolla. 00:02:08.726 --> 00:02:11.445 Siksi Tatoeba perustuu yhteistyöhön. 00:02:12.575 --> 00:02:14.823 Kaikki ovat tervetulleita osallistumaan. 00:02:15.240 --> 00:02:17.233 Ja kaikilla on kyky osallistua. 00:02:19.243 --> 00:02:21.364 Sinun ei tarvitse ole olla kielitaituri. 00:02:22.148 --> 00:02:23.876 Jokainen puhuu jotain kieltä. 00:02:24.262 --> 00:02:26.037 Jokainen voi ruokkia tietokantaa 00:02:26.037 --> 00:02:28.098 ja havainnollistaa uutta sanastoa. 00:02:28.704 --> 00:02:32.748 Jokainen voi auttaa varmistamaan, että lauseet kuulostavat oikeilta 00:02:32.748 --> 00:02:34.660 ja että ne on kirjoitettu oikein. 00:02:35.082 --> 00:02:37.973 Ja itse asiassa tämä projekti tarvitsee kaikkia. 00:02:39.760 --> 00:02:42.728 Kielet eivät ole kiveen kirjoitettuja. 00:02:42.728 --> 00:02:45.766 Kielet elävät meidän kaikkien kautta. 00:02:45.766 --> 00:02:50.004 Me haluamme vangita jokaisen kielen koko ainutkertaisuudessaan. 00:02:50.004 --> 00:02:54.122 Ja me haluamme vangita niiden aikojen saatossa tapahtuvan kehityskulun. 00:02:54.122 --> 00:02:56.044 Mutta tiedätkös, olisi surullista 00:02:56.044 --> 00:02:59.540 kerätä kaikki nämä lauseet ja pitää ne itsellämme. 00:03:00.520 --> 00:03:03.822 Koska on niin paljon asioita, joita niillä voi tehdä. 00:03:04.360 --> 00:03:06.670 Sen takia Tatoeba on avoin. 00:03:07.571 --> 00:03:09.160 Meidän lähdekoodimme on avointa, 00:03:09.160 --> 00:03:11.271 datamme on avointa. 00:03:11.983 --> 00:03:13.972 Me julkaisemme kaikki keräämämme lauseet 00:03:13.972 --> 00:03:17.156 Creative Commonsin nimeä-lisenssillä. 00:03:18.006 --> 00:03:22.281 Se tarkoittaa, että lauseita voi käyttää vapaasti uudelleen tekstikirjassa, 00:03:22.281 --> 00:03:23.994 sovelluksessa, 00:03:23.994 --> 00:03:26.252 tutkimusprojektissa, 00:03:26.252 --> 00:03:28.315 missä tahansa! 00:03:29.452 --> 00:03:31.181 Sitä Tatoeba siis on. 00:03:31.917 --> 00:03:34.167 Mutta ei siinä ole kaikki. 00:03:35.342 --> 00:03:38.923 Tatoeba ei ole vain avoin, yhteistyöhön perustuva, 00:03:38.923 --> 00:03:41.594 monikielinen sanakirja lauseista. 00:03:42.819 --> 00:03:46.382 Se on osa ekosysteemiä, jonka haluamme rakentaa. 00:03:46.382 --> 00:03:49.951 Me haluamme saattaa kielityökalut aivan uudelle tasolle. 00:03:49.951 --> 00:03:53.887 Haluamme nähdä innovaatioita kieltenopiskelumaisemassa. 00:03:54.153 --> 00:03:58.178 Ja se ei voi tapahtua ilman avoimia kielimateriaaleja, 00:03:58.671 --> 00:04:01.679 joita ei voi rakentaa ilman yhteisöä, 00:04:02.138 --> 00:04:05.592 joka ei voi antaa työpanostaan ilman tehokkaita alustoja. 00:04:06.877 --> 00:04:09.841 Joten perimmiltään rakennamme vain 00:04:09.841 --> 00:04:12.960 Tatoebassa perustaa sille, 00:04:12.960 --> 00:04:14.444 että verkko olisi 00:04:14.444 --> 00:04:16.531 parempi paikka opiskella kieliä.