Tatoeba: silta kielten välillä. Mikä Tatoeba on? Tatoeba on kielisanakirja. Voit etsiä sanoja ja saada niille käännöksiä. Mutta se ei ole tarkalleen ottaen tavanomainen sanakirja. Kyse on lauseista, ei sanoista. Voit etsiä lauseita, joissa on tietty sana ja saat käännöksiä näille lauseille. ”Miksi lauseita?” saatat kysyä. No, koska lauseet ovat mielenkiintoisempia. Lauseet antavat sanoille asiayhteyden. Lauseilla on persoonallisuus. Ne voivat olla hauskoja, fiksuja, höpsöjä oivaltavia, koskettavia, loukkaavia. Lauseet voivat opettaa meille paljon, paljon enemmän kuin pelkkiä sanoja. Joten me tykkäämme lauseista. Mutta vielä enemmän me tykkäämme kielistä. Ja se mitä me oikeasti haluamme on paljon lauseita monilla — ja millä tahansa — kielillä. Tämän takia Tatoeba on monikielinen. Mutta ei sillä tavalla monikielinen — ei niin, että kaikista kielistä on vain yksinkertaisesti muodostettu pareja, ja toiset parit jäävät muista jälkeen. Tatoeba on oikeasti monikielinen. Kaikki kielet ovat yhteydessä toisiinsa. Jos islanninkielisellä lauseella on englanninkielinen käännös, ja englanninkielisellä lauseella on käännös swahiliksi, niin silloin tästä syntyy epäsuora swahilinkielinen käännös islanninkieliselle lauseelle. Kielet, jotka eivät olisi koskaan löytäneet toisiaan perinteisessä järjestelmässä, voidaan saattaa yhteen Tatoebassa. Siistiä, vai mitä? Mutta mistä me saamme lauseet? Ja miten me käännämme ne? Se ei voi olla päivänselvästi yhden henkilön kontolla. Siksi Tatoeba perustuu yhteistyöhön. Kaikki ovat tervetulleita osallistumaan. Ja kaikilla on kyky osallistua. Sinun ei tarvitse ole olla kielitaituri. Jokainen puhuu jotain kieltä. Jokainen voi ruokkia tietokantaa ja havainnollistaa uutta sanastoa. Jokainen voi auttaa varmistamaan, että lauseet kuulostavat oikeilta ja että ne on kirjoitettu oikein. Ja itse asiassa tämä projekti tarvitsee kaikkia. Kielet eivät ole kiveen kirjoitettuja. Kielet elävät meidän kaikkien kautta. Me haluamme vangita jokaisen kielen koko ainutkertaisuudessaan. Ja me haluamme vangita niiden aikojen saatossa tapahtuvan kehityskulun. Mutta tiedätkös, olisi surullista kerätä kaikki nämä lauseet ja pitää ne itsellämme. Koska on niin paljon asioita, joita niillä voi tehdä. Sen takia Tatoeba on avoin. Meidän lähdekoodimme on avointa, datamme on avointa. Me julkaisemme kaikki keräämämme lauseet Creative Commonsin nimeä-lisenssillä. Se tarkoittaa, että lauseita voi käyttää vapaasti uudelleen tekstikirjassa, sovelluksessa, tutkimusprojektissa, missä tahansa! Sitä Tatoeba siis on. Mutta ei siinä ole kaikki. Tatoeba ei ole vain avoin, yhteistyöhön perustuva, monikielinen sanakirja lauseista. Se on osa ekosysteemiä, jonka haluamme rakentaa. Me haluamme saattaa kielityökalut aivan uudelle tasolle. Haluamme nähdä innovaatioita kieltenopiskelumaisemassa. Ja se ei voi tapahtua ilman avoimia kielimateriaaleja, joita ei voi rakentaa ilman yhteisöä, joka ei voi antaa työpanostaan ilman tehokkaita alustoja. Joten perimmiltään rakennamme vain Tatoebassa perustaa sille, että verkko olisi parempi paikka opiskella kieliä.