EmediateAd

Testaa Muljaatinta!Suomen voi nyt kääntää netissä savoksi

18.8.2010 11:42

Muljaatin on nettisovellus, joka ottaa vastaan suomenkielisen tekstin, pyrkii muuttamaan sen savonkieliseksi ja palauttaa käännetyn tekstin vastaanottajalle.

Kuka Muljaattimen on kyhännyt?

Muljaattimeen ovat syyllisiä Savon Sanomien verkkolehden entinen kehityspäällikkö Seppo Roth sekä jo liiketoimintansa lopettanut Regex Oy:n Kuopion aluepäällikkö Harri Kinnunen ja varsinaisena toteuttajana ohjelmistosuunnittelija, syntysavolainen Markku Niskanen.

Toteutustapa

Muljaatin on kirjoitettu kokonaan Java-kielellä. Javassa on jo valmiina suhteellisen kattava valikoima toimintoja merkkitiedon käsittelyyn ja Muljaattimeen se sopii hyvin. Muljaattimen voi siirtää mihin tahansa käyttöjärjestelmään, johon on saatavilla Java-ympäristö. Lienee syytä mainita, että Javalla ei tässä yhteydessä ole mitään tekemistä maineikkaan kaksitahtisen tšekkipyörän kanssa.

Yleinen rakenne

Muljaatin toimii servlettinä eli www-koneella ajettavana Java-palvelinsovelluksena. Se ottaa vastaan käyttäjän lähetettämän tekstin ja palauttaa sen takaisin vastaanottajalle savoksi käännettynä. Tätä kirjoitettaessa käyttöliittymistä on valmiina sovelma, jossa olevaan ylempään ruutuun käyttäjä voi naputella tai leikata ja liittää haluamansa tekstin, joka sitten tulostuu savoksi käännettynä alempaan ruutuun.

Miten Muljaatin sitten toimii?

Kun Muljaatin ravistellaan hereille uuninpankolta, se tarttuu oitis työhön ja ryhtyy tutkimaan saamaansa tekstiä. Sen toiminnassa on kaksi eri tasoa. Ylempi taso, "kiäntelijä" purkaa tekstin sanoiksi ja pitää hyppysissään aina kahta tai kolmea sanaa. Näistä se lähettää alemmalle tasolle, "viäntelijälle", yhden sanan kerrallaan ja saatuaan sanan takaisin kunnolliseksi "viännettynä" tutkii hiukan aiemmin tulleen, jo käsitellyn sanan ja katsoo, pitääkö siihen tehdä juuri tulleen sanan pohjalta mitään muutoksia ja panee "lähetyslaatikkoon". Näin kiäntelijä toimii kaikkien sanojen kanssa ja palauttaa lopuksi käännetyn tekstin sitä pyytäneelle.

Sanan viäntelijä

Kun viäntelijä saa hyppysiinsä uuden sanan, se tutkii aluksi sanan tyypin, pyrkien päättelemään, onko se numeroarvo, pronomini, kieltosana tai jokin olla-verbin tai jonkin muun verbin muoto ja panee muistiin, mitä löysi, tietoa näet voidaan tarvita myöhemmin.

Seuraavaksi viäntelijä tutkii, löytyykö sanalle savolainen vastine sanakirjasta ja jos löytyy, korvaa sanan löytyneellä ja muutaman tarkistuksen jälkeen palauttaa sanan ylemmälle tasolle, jossa se joutuu lauseen purkajan jatkokäsittelyyn. Tyypillinen sanastosta löytyvä sana voi olla esimerkiksi vaimo, joka muuttuu tarpeen mukaan esimerkiksi taekinahavukaksi tai pirttilinnuksi.

Jos sanalle ei löytynyt vastinetta, viäntelijä korjaa aluksi herrasväen käyttämät vieraat kirjaimet kotoisemmilla (Egyptin faaraosta tulee Ekyptin vaarao) ja muuntelee ts-kirjainyhdistelmät oikeiksi (metsästä tulee mehtä ). Seuraavaksi viäntelijä tavuttaa sanan ja ryhtyy tutkimaan sen ihmeellisyyksiä yksi tai useampi tavu kerrallaan. Tässä vaiheessa korjattavia piirteitä ovat diftongiutuminen (väärä muuttuu viäräksi), redusoituminen (koirasta tule koera), monikon ensimmäisen persoonan perfekti ja pluskvamperfekti (olemme saaneet muuttuu muotoon myö ollaan suatu). Tärkeimpiä niistä sanaan jääneistä kirjasuomen riekaleista, joita viäntelijä vielä pyrkii suutaroimaan ovat geminoituvat eli kahdentuvat konsonantit (kapeasta tulee kappee), välivokaaleja lisäillään sinne tänne (kylmästä tulee kylymä) ja liudentumat pannaan paikalleen (vesi onkin pian vesj), vielä katsotaan assimiloituvat kirjainyhdistelmät (sananjalka muuttuu sanajjalaksi). Toki viäntelijällä on vielä muutakin tehtävää, mutta jo tämä kertonee, kuinka hikinen tuo urakka on. Työnsä tehtyään viäntelijä palauttaa käsitellyn sanan kiäntelijälle.

Tilanne ja toimivuus

Muljaatin toimii kohtuullisen hyvin. Suurin osa tarvittavista muutoksista toteutuu ja ongelmia tulee lähinnä yhdyssanoissa, johdoksissa ja muutamissa sijamuodoissa, joissa viäntelijä vielä erehtyy. Suomen kieli ei ole mekaaninen, tässä hetkessä elävä järjestelmä, siinä on tuhansien vuosien historia, josta juontuvien ilmiöiden alkuperää on jopa kielitieteen asiantuntijoiden joskus hyvin vaikea selvittää.

Muljaattimen sanasto on kuitenkin varsin suppea. Koska Muljaatin on toteutustekniikaltaan kohtuullisen yksinkertainen, se osaa vain joitakin suomen todella monista taivutussäännöistä. Lisäksi Muljaatin ei ymmärrä sanojen merkitystä, ja näin se ei pysty aina kääntämään oikein. Esimerkiksi "automme" pitäisi kääntää muotoon "meijä’ aato" mutta äänteellisesti sitä hyvin lähellä oleva "autamme" pitäisikin muuttua muotoon "myö aatetaan". Tällainen käännös on mahdoton ilman sana- ja taivutusluokat ymmärtävää logiikkaa, valtaisaa sanastoa ja ainakin jonkinlaista lauserakenteen ja jopa merkityksien hallintaa.

Muljaatin on ollut projektina erittäin haastava ja mielenkiintoinen. Sen laatiminen olisi ollut täysin mahdotonta ilman kielitieteen perustaitoja, jotka laatijalla onneksi on. Se on saanut tekijänsä kaivelemaan tietoa paljon sekä suomen kielestä että siitä logiikasta, jolla luonnollista kieltä voidaan käsitellä. Ohjelmointi on ollut vaikeudestaan huolimatta erittäin hauskaa ja projektin virallisen lopun jälkeen se tulee melko varmasti muuttumaan tekijänsä elämäntehtäväksi.

Kommentoi artikkelia