Augmenteeritud tõlge ehk pilk tänapäeva tõlkefirma köögipoolele

Nagu paljudel muudel elualadel, on ka tõlkimises paari viimase aastakümne jooksul toimunud olulised tehnoloogilised arengud, millest rääkides on tüüpilisteks märksõnadeks "digitaliseerimine", "automatiseerimine", "tehisintellekt" ja "masinõpe". Masintõlkega Google'i moodi on arvatavasti igaüks kokku puutunud ja selle tugevatest ning nõrkadest külgedest on palju räägitud, professionaalse tõlkefirma telgitagused tööprotsessid aga nii üldtuntud ei ole, sestap üritangi need nüüd mõne sõnaga lahti rääkida.

Kõigepealt vastus küsimusele, mida on tõlkeringkondades viimasel ajal ikka küsitud: kas tõlkimine kui elukutse, kindlasti üks maailma vanimaid ameteid, kaob lähitulevikus ajaloo prügikasti? Vastus on lihtne: jah ja ei. Tehnika areng on tõlkija tööprotsessi põhjalikult muutnud ja muudab ka tulevikus, aga päriselt ära ei kao vajadus tõlkijate ja tõlkimise järele tõenäoliselt enne kui kõik inimesed taas ühte keelt räägivad, nagu siis kui kuningas Nimrod Paabeli torni ehitama hakkas.
Täiusliku, kõigile elualadele ja igasse kasutussituatsiooni sobiva masintõlkeni jõuame siis kui rääkijateks, st igasuguse algteksti koostajateks ongi robotid, mitte enam inimesed. Millal see aeg kätte jõuab, ei tahaks spekuleerida - küll aga on elukutselise tõlkija töö juba praegu ilma nendesamade robotite ja tarkvaralahenduste abita üpris võimatu, välja arvatud ehk ilukirjanduse ja mõne muu väga loomingulist lähenemist nõudva tekstitüübi puhul.

Üks õiendus veel: inglise keeles on sõnade "translator" ja "editor" asemel juba mõnda aega kasutusel neutraalsem ja laiem termin "linguist", eesti "lingvist" kui keeleteadlane selle vasteks hästi ei sobi, täpsem oleks ehk "keeletöötaja" või "keelespetsialist"; siinses tekstis on "tõlkija", "keeletoimetaja" ja "keelespetsialist" sisuliselt sünonüümid.

Erialaringkondades on kaasaegse, inimese ja masina koostööl põhineva tõlkeprotsessi hakatud nimetama "augmenteeritud tõlkeks" (augmented translation), selle sõnapaari eeskujuks on arvutitehnoloogiline augmented reality ehk liitreaalsus. Tegemist ei ole selgepiirilise, ühele kindlale mudelile vastava tööprotsessiga, erinevad tõlketeenuse pakkujad kasutavad selle komponente erinevates kombinatsioonides ja erinevate rõhuasetustega, küll aga ei ole ühelgi tõlkefirmal tänapäeval võimalik kõiki augmenteeritud tõlke komponente vältida (kui just ei ole tegemist sulepeaga luulet tõlkiva niširühmitusega). Lühidalt öeldes on tõlkeprotsessi keskmes jätkuvalt inimene (tõlkija, toimetaja, keelespetsialist), aga teda toetavad ja informeerivad, tema tööd lihtsustavad, kiirendavad ja kontrollivad erinevad tehnilised tugimehhanismid. Lihtsustatud kujul näeb augmenteeritud tõlke tööskeem välja selline:

Augmenteeritud tõlge: keerukas ja mitmeid tehnilisi komponente hõlmav tööprotsess, mille keskmes on inimene.

Vaatame neid komponente veidi lähemalt


Masintõlge

Pärast aastakümneid kestnud pusimist selle kallal, kuidas arvutile inimkeeled grammatikareeglite abiga "selgeks õpetada" toimus 21. sajandi esimesel kümnendil masintõlke alal revolutsioon, millele andis tõuke suurte andmemassiivide töötlemise võimalus mõistlike ressursikuludega ja "iseõppiva" tehisintellekti kiire areng. Närvivõrkude mudelil põhinevad masintõlkemootorid hakkasid tõlkimist õppima reaalsest keelekasutusest, mitte pelgalt sõnaraamatute ja grammatikareeglite järgi, ja tulemuseks oli täiesti uut tüüpi ja varasematest mäekõrguselt parem tõlkerobot. Täielikult usaldada sellist masintõlget kindlasti ei saa, sest näiteks eitusest jaatuse tegemine või ebamugavatest tekstiosadest üle hüppamine pole ka maailma võimsamate tõlkemootorite jaoks midagi erandlikku, aga keskmiselt on masintõlke protsessi praegu juba võimalik "toormaterjalina" kasutada. Enamik suuremaid tõlkefirmasid arendavad juba ammu oma tõlkemootoreid, ja head masintõlke järeltoimetajad on palju nõutumad spetsialistid kui head tõlkijad (tõsi, osalt ka seepärast et masintõlke järeltoimetamine on uus, viimase kümnekonna aasta jooksul sündinud elukutse).
Praktikas tähendab masintõlke tööprotsessi kaasamine seda, et vähegi sobiva tõlkemootori olemasolul töötleb tõlkefirma algteksti esmalt masintõlkega - loomulikult iseenda turvalise ja kinnise süsteemiga, mitte avaliku ja üldkasutatavaga, sest tõlgitav tekst jääb ühel või teisel kujul mootorisse alles ja kliendi konfidentsiaalsete materjalide tõlkimine näiteks Google'i masintõlkega oleks kõigi andmeturbereeglite räige rikkumine. Seejärel hinnatakse tulemust ja otsustatakse kõiki asjaolusid arvestades, kas konkreetse projekti puhul on mõistlikum jätkata masintõlke järeltoimetamise või n-ö nullist tõlkimisega. Tihti saab selle otsuse langetada keelespetsialist ise.

Tõlkemälu

Tõlkemälud on igale professionaalsele tõlkijale juba ammu asendamatud abilised. Lühidalt lahti seletades tähendab tõlkemälu seda, et iga tõlgitud lause, segment või sõna salvestatakse kakskeelsena spetsiaalsesse andmebaasi, ja järgmine kord, kui tõlkijal sarnane lause ette tuleb, kuvab tarkvara varasema tõlke ja pakub võimalust seda kas täielikult või osaliselt taaskasutada. Sajandivahetuse paiku masskasutusse jõudnud professionaalsed tõlketarkvarad (CAT tools, lühend sõnadest Computer Aided Translation) pakuvad tõlkemälude jagamise, filtreerimise, kaugkasutamise ja mitmel moel töötlemise funktsioone, mis aitavad tõsta tõlkimise kiirust ja tagada stiililist ja terminoloogilist ühtlust ka siis kui sama projekti kallal töötab rohkem kui üks tõlkija. Kokkuhoid kandub üle ka kliendile, kellelt korduste eest vähem raha küsitakse kui uue teksti esmakordse tõlkimise eest.

Kaasaegsed tõlketööriistad on enamasti pilvepõhised, seega on tihti tõlkefirma projektijuht see, kes otsustab, millised mälud projektile "külge pannakse". Paljud tõlkefirmad puhastavad, korrastavad ja töötlevad oma tõlkemälusid regulaarselt, mis võib tähendada olulist ressursside kokkuhoidu pikemas plaanis.

Terminihaldus

Terminoloogiatöö on iga tõlkeprojekti selgroog, mille ehitamisele kulub rohkem aega ja tööd kui välja paistab. Ideaaljuhul saab projekti alustada terminibaasi loomisest, mis kliendiga kooskõlastatakse ja mida töö käigus pidevalt täiustatakse, suuremate tööde puhul on kliendil pidev ligipääs terminibaasile ja võimalus seda korrigeerida või täiendada. Veelgi ideaalsemal juhul on tõlkefirmal võimalik palgal hoida täiskohaga terminolooge, kelle igapäevatöö seisnebki terminibaaside väljatöötamises, täpsustamises ja pidevas täiendamises. Hea terminibaas muudab tõlkija töö oluliselt kiiremaks ja lõppteksti kvaliteetsemaks. Nagu tõlkemälusid, on ka terminibaase võimalik kaug- ja rühmkasutada ja nende pidev täiendamine on väärt investeering nii kliendi kui ka tõlkija jaoks.

Lisaks tõlkemeeskonna enda loodud terminibaasidele võimaldab kaasaegne tõlketarkvara luua automaatühenduse ka mitmesuguste veebipõhiste terminibaasidega, mille sisusse tuleb tihti küll kriitiliselt suhtuda, aga väärtuslikku abi võib leida sealtki.

Sisu automaatne rikastamine

jah, kole ja puine otsetõlge ingliskeelsest väljendist automated content enrichment, aga kui see korralikult töötab, on tegemist tõlkija hindamatu abilisega. Spetsiaalne platvorm hoiab silma peal tõlgitaval tekstil ja on valmis pakkuma tõlkijale ühe hiireklõpsuga taustateavet, täpsustusi ja selgitusi mõistete, nimede või terminite kohta nii üldkasutavatest ressurssidest nagu Vikipeedia või õigekeelsussõnaraamat kui ka spetsiifilistest andmekogudest (näiteks EL määruste täistekstid, kohtulahendite andmebaas, automaatkäigukastide tüübiloend või ravimiregister). Siinses skeemis toodud komponentidest on ACE kõige uuem ja samas ka kõige suurema potentsiaaliga tehnoloogia, mille vallas on lähiaastatel kindlasti palju põnevat oodata.

Kvaliteedikontroll

Igal tõlkeprogrammil on olemas omad kvaliteedikontrolli süsteemid, lisaks pakuvad arendajad kümneid muid kvaliteedikontrolli lahendusi, millest igaüks on veidi erineva lähenemise ja tööpõhimõttega. Kõige lihtsamaks näiteks on nimede (mõne keele puhul suurtähestatud sõnade), numbrite ja terminibaasis leiduvate terminite kontroll, samuti tõlkimata või vales keeles segmentide otsimine, aga ka näiteks võrdlemine referentstekstidega või tõlke keerukas lingvistiline analüüs koos tagasiside automaatse saatmisega tõlkijale. Mõnel juhul viib kvaliteedikontrolli läbi ka inimene - kuigi see võib absurdselt kõlada, ei pruugi tõlke keelelise kontrolli läbiviija sihtkeelest sõnagi aru saada, ja ometi aitab tema töö kõrvaldada suure osa tõlkevigadest.

Automatiseeritud projektijuhtimine

Lights out project management on ideaal, mille suunas paljud tõlkefirmad pürgivad. Võib ju tunduda, et tõlkefirma projektijuhi igapäevatöös on lõplik, ehkki hiigelsuur arv võimalikke otsuseid ja tegevusi, mida peaks olema teoreetiliselt võimalik taandada nutikatele algoritmidele. Tegelikkuses on kõik tehisintellekt-projektijuhtimise katsetused seni siiski täielikult läbi kukkunud, sest projektijuhti kui inimestega suhtlejat ja paindlike lahenduste otsijat ei asenda ükski robot veel niipea. Küll aga on võimalik automatiseerida rutiinseid tegevusi ja analüütikat, nii et projektijuhid on aina vähem andmesisestajad ja aina rohkem loomingulised, pidevalt muutuvas keskkonnas uutele väljakutsetele reageerivad ja innovatiivselt mõtlevad inimesed, kelle eest "robotid" üha rohkem musta tööd ära teevad. Kaasaegsed projektijuhtimiskeskkonnad aitavad projektijuhil näiteks kliendilt tellimuse automaatselt vastu võtta, läbi analüüsida, registrisse sisse kanda ja tõlkeserverisse üles laadida, samuti koostada optimaalseid projektimeeskondi, tööprotsessidel silma peal hoida ja kvaliteedikontrolli läbinud faile automaatselt kliendi süsteemi edastada, kui nimetada mõnda üksikut tegevust, mis veel mõni aasta tagasi projektijuhi jaoks märksa rohkem käsitööd tähendas.

——

Nagu ülalpool jooniselt näha, on tõlketöö keskmes jätkuvalt inimene (tõlkija, masintõlke järeltoimetaja või keelespetsialist), aga teda toetab terve rida tehnilisi lahendusi, mille abita ei oleks tõlkijal lootustki tänapäeva ärikeskkonnas hakkama saada. Lisaks otsesele interaktsioonile inimese ja tehniliste süsteemide vahel kasvab järjest ka süsteemide omavaheline koostöö. Tõlkemälu ja kvaliteedikontrolli mehhanismid jälgivad pidevalt uuenevat terminibaasi, masintõlke mootor treenib end regulaarselt uuenevate tõlkemälude toel, projektijuhtimissüsteemid hindavad ja kategoriseerivad tõlkijaid kvaliteedikontrolli põhjal jne - näiteid selle kohta, kuidas tõlkijat toetavad süsteemid ka omavahel koostööd teevad ja vastastikku üksteiselt "õpivad" võiks tuua kümneid. Selliste tehniliste süsteemide põhjal moodustuva "supersüsteemi" ja inimese koostöös toimubki professionaalne tõlkimine, mida võib nimetada augmenteeritud tõlkeks.