26.11.2013

Et kasutada 90% ulatuses ära Interneti pakutavaid ärivõimalusi, on vaja osata 13 keelt: inglise, jaapani, saksa, hispaania, prantsuse, hiina, itaalia, portugali, hollandi, korea, araabia, vene ja rootsi keelt.

Sealjuures inglise keele osatähtsus väheneb – viimase kolme aastaga on see vähenenud umbes poolelt kolmandikule. Muide, kui jutt on Interneti vahendusel inimesteni, mitte rahani jõudmisest, siis 80%-ni inimestest jõuab 12 keele, 98%-ni 48 keele abil. Trend on selline, et sama hulga inimesteni jõudmiseks on vaja järjest enam keeli.

Eestis välja töötatud inglise-eesti-inglise üldvaldkonna masintõlketööriista saab katsetada aadressil http://www.tilde.ee/tolketooriist. Tegu on avaliku ja tasuta tööriistaga, mille võrdlemisel teada tuntud tõlkesüsteemidega on saadud paremaid tulemusi. Et kõik nimetatud süsteemid töötavad statistiliste algoritmidega, võib üksikute lausete tõlkekvaliteet süsteemiti erineda, anda mõnes süsteemis paremaid, mõnes kehvemaid tulemusi ning panna kasutajaid muigamagi. Ent statistilisel masintõlkel on üks hea omadus – see saab ajaga ainult paremaks minna, tõenäoliselt.


Ajaloost

Esimene ootuste ja lubaduste laine sai alguse koos elektronarvutite arenguga 1950. aastatel, motivaatoriks külm sõda. Lubadused lahendada masintõlke „probleem“ mõne aastaga jäid paraku täitmata, uuringute rahastamine külmutati ja järgnenud perioodi nimetatakse masintõlke ajaloos masintõlketalveks. Eelmise sajandi lõpp tähistab masintõlke vallas uut elavnemist, seekord keskenduti statistiliste masintõlkemeetodite arendamisele. Euroopa Liidu info- ja kommunikatsioonitehnoloogia arengukavas „Digital Agenda for Europe 2020“ on kõik masintõlkega seonduv kuum teema, sest eesmärk on luua ühtne digitaalne turg.


Milleks masintõlge ehk automaattõlge sobib, milleks mitte?

Masin ei mõista tõlgitava teksti mõtet, kujundlikku keelt, konteksti. Masinaga võib, aga pole mõtet tõlkida Shakespeare’i, turundustekste jmt. Ometi on terve rida situatsioone, mille jaoks masintõlke kvaliteet on täiesti piisav ning kus masintõlge on majanduslikult mõttekas ja mõnel juhul isegi möödapääsmatu:

1) on vaja ülevaadet, millest tekst räägib, mitte sõna-sõnalist kvaliteettõlget;

2) tõlkega on kiire. Kogenud tõlgi kiirus on 5–10 lehekülge päevas, masin teeb selle hetkega;

3) tegemist on kitsama valdkonnaga (nt infotehnoloogia, kinnisvara, õigustekstide vms). Mida standardsem on valdkonna sõnavara ja väljendusviis, seda parem on masintõlke kvaliteet. Majanduslikku efekti annab siin kombinatsioon masintõlge + inimtoimetamine, teaduslikud uuringud kinnitavad kommertsettevõtete (nt Adobe’i ja IBM-i) tulemusi: masintõlge võimaldab suurendada tõlkeprotsessis produktiivsust umbes 30%.

 

Minu ettevõtte jaoks kohandatud lahendus

Kui teid ei rahulda levinud masintõlkesüsteemide tõlkekvaliteet või te ei soovi usaldada oma tekste „suure venna“ kätte, on üks võimalikke lahendusi rätsepaülikonnana loodav masintõlkeprogramm. Mida on selleks vaja? Hea, kui ettevõtte dokumendihalduses või infosüsteemis on olemas inimtõlgitud tekste. Need on treeningmaterjaliks masinale, et õpetada talle teie ettevõtte spetsiifilist sõnavara. Masina treenimine võtab aega mõnest tunnist mõne päevani. Suurim inimtöömaht on just „infoarheoloogil“ ehk inimesel, kes kogub kokku ettevõttes olevad rööptekstid.

Masintõlkesüsteemi on võimalik majutada nii oma IT-taristus kui ka pilveteenuses. Üks võimalikke platvorme kohandatud masintõlkesüsteemi loomiseks ja käitamiseks on www.letsmt.eu

 

Tildest

1991. aastal Riias asutatud Tilde SIA on Euroopa üks juhtivaid keeletehnoloogiaarendajaid, mis tegutseb kõigis kolmes Balti riigis, Eestis alates 2000.

Tilde Eesti OÜ eesmärk keeletehnoloogia vallas on pakkuda parima kvaliteediga masintõlkesüsteeme inglise-eesti-inglise, vene-eesti-vene jt keelesuundade jaoks, seda nii üldvaldkonna kui klientide soovitud spetsiifiliste valdkondade (nt infotehnoloogia, kinnisvara, seadusandlus) tarvis. Selles aitab meid ka riikliku programmi „Eesti keeletehnoloogia (2011–2017)“ rahaline tugi inglise-eesti ja vene-eesti paralleelkorpuste kogumiseks ja masintõlkesüsteemide loomiseks. Projektide eesmärgiks on aidata kaasa sellise olukorra saavutamisele, kus mitmesugused kommerts- ja kogukondlikud masintõlkesüsteemid pakuvad kvaliteetset tõlketeenust, masintõlkesüsteemide teenused on lõppkasutajatele võimalikult väheste piirangutega (tasu, maht, kasutatavad platvormid) kättesaadavad ning sõltuvus üksikutest masintõlketeenuste kommertsteenusepakkujatest ei ole kriitiline ja on asendatav avatud ning vabavaraliste lahendustega.

7. novembril 2013 katsetas Eesti president Toomas Hendrik Ilves Leedu pealinnas Vilniuses toimuval tehnoloogiakonverentsil ICT 2013 ametlikult esimest korda Tilde masintõlketehnoloogiat.

Lisaks masintõlketehnoloogiale LetsMT kuuluvad Tilde põhiteenuste hulka ka lokaliseerimine ja tõlkimine. Oleme eestindanud enamiku Eestis levinud tarkvaradest (SAP, IBM Lotus Notes, MS Office, MS Windows, Nokia, LibreOffice jt) ning spetsialiseerinud peamiselt IT, tehnika, energeetika ja majanduse valdkonna tõlgetele.