Tietokoneiden käyttö tekstin kääntämiseen kielestä toiseen on ollut pitkään tietojenkäsittelytieteen unelma. Kuitenkin vasta viimeisten kymmenen vuoden aikana konekääntämisestä on tullut käyttökelpoinen väline, jota käytetään laajemmin. Luonnollisen kielen käsittelyn, tekoälyn ja laskentatehon kehitys ovat kaikki vaikuttaneet tähän yhä hyödyllisempään tekniikkaan.
Konekääntäminen on prosessi, jossa tekoälyä (AI) käytetään kääntämään sisältöä automaattisesti yhdeltä kieleltä (lähdekieli) toiselle kielelle (kohdekieli) ilman ihmisen panosta.
Kääntäminen oli yksi ensimmäisistä laskentatehon sovelluksista 1950-luvulta alkaen. Valitettavasti tehtävän monimutkaisuus oli paljon suurempi kuin varhaiset tietojenkäsittelytieteilijät arvioivat, ja se vaati valtavaa tietojenkäsittelytehoa ja tallennustilaa, joka ylitti ensimmäisten koneiden kyvyt.
Vasta 2000-luvun alkupuolella ohjelmistot, tiedot ja tarvittava laitteisto alkoivat soveltua peruskonekääntämiseen. Varhaiset kehittäjät käyttivät tilastollisia kielitietokantoja ”opettaakseen” tietokoneita kääntämään tekstiä. Koneiden kouluttaminen vaati paljon käsityötä, ja jokaisen uuden kielen kohdalla oli aloitettava alusta kyseisen kielen kehittäminen.
Vuonna 2016 Googlen kokeiluryhmä testasi neurooppimismallien ja tekoälyn käyttöä käännöskoneiden kouluttamisessa. Kun pienen tiimin menetelmää testattiin Googlen tärkeintä tilastollista konekäännöskonetta vastaan, se osoittautui paljon nopeammaksi ja tehokkaammaksi monilla kielillä. Lisäksi se ”oppi” käytön myötä ja paransi jatkuvasti laatua.
Neuraalinen konekääntäminen osoittautui niin tehokkaaksi, että Google muutti kurssia ja otti sen käyttöön ensisijaisena kehitysmallinaan. Muut suuret palveluntarjoajat, kuten Microsoft ja Amazon, seurasivat pian perässä, ja nykyaikaisesta konekäännöksestä tuli käyttökelpoinen lisä käännösteknologiaan. Monet käännöstenhallintajärjestelmät (TMS) sisällyttävät nykyään MT:n käyttäjiensä työnkulkuja koskeviin ratkaisuihin.
Automatisoidulla kääntämisellä tarkoitetaan perinteiseen tietokoneavusteiseen käännöstyökaluun (CAT-työkalu) tai nykyaikaiseen käännöstenhallintajärjestelmään (TMS) rakennettua automaatiota, jolla toistuvat kääntämiseen liittyvät tehtävät suoritetaan automaattisesti.
Sisältöön rakennetaan käynnistimet, jotka kertovat järjestelmälle, että se voidaan automatisoida. Tähän voi kuulua yleisesti käytetyn tekstin, kuten oikeudellisten vastuuvapauslausekkeiden, lisääminen asiakirjoihin tietokannasta, kuten sisällönhallintajärjestelmästä (CMS).
Automatisoitua kääntämistä voidaan käyttää tekstin konekääntämisen automatisointiin lokalisoinnin työnkulun yhtenä vaiheena. Automaattikääntäminen ja konekääntäminen eivät kuitenkaan ole keskenään vaihdettavissa olevia termejä, sillä ne palvelevat täysin eri toimintoja.
Kolme yleisintä konekääntämisen tyyppiä ovat:
MT:n varhaisimmalla muodolla, sääntöpohjaisella MT:llä, on useita vakavia haittoja, kuten se, että se vaatii huomattavan määrän ihmisen suorittamaa jälkikäteistä muokkausta, että kieliä on lisättävä manuaalisesti ja että sen laatu on yleisesti ottaen heikko. Sillä on joitakin käyttötarkoituksia hyvin yksinkertaisissa tilanteissa, joissa tarvitaan nopeaa merkityksen ymmärtämistä.
Tilastollisessa MT:ssä rakennetaan tilastollinen malli tekstin sanojen, lauseiden ja virkkeiden välisistä suhteista. Mallia sovelletaan toiseen kieleen näiden elementtien muuntamiseksi uudelle kielelle. Näin se parantaa sääntöpohjaista MT:tä, mutta siinä on monia samoja ongelmia.
Kuten edellä mainittiin, neuraalinen MT-malli käyttää tekoälyä kielten oppimiseen ja tämän tiedon jatkuvaan parantamiseen, aivan kuten ihmisaivojen hermoverkot. Se on tarkempi, siihen on helpompi lisätä kieliä ja se on paljon nopeampi, kun se on kerran opetettu. Neuraalisesta MT:stä on nopeasti tulossa standardi MT-moottoreiden kehittämisessä.