Käyttämällä sivustoamme hyväksyt evästeiden käyttämisen laitteessasi ja tallentamisen siihen. Lisätietoa saat evästeitä koskevasta tietosuojaselosteesta. Lue lisää

Uusimmat blogit

Suomen kielen tekoälyratkaisut harvassa – Aleksanteri Vuoristo kehittää suomea lukevaa tekoälyä

4 min
Kesätyö Telialla tekoälyn parissa Kesätyö Telialla tekoälyn parissa

Tekoälyn aika on täällä. Vuonna 2012 alkanut ”tekoälyn renessanssiksi” kutsuttu aikakausi on tuonut mukanaan harppauksia kuvantunnistuksessa, kasvojentunnistuksessa, tekstianalyysissä sekä lukemattomissa muissa käyttökohteissa. Merkkejä kehityksestä ihmisen kaltaiseen tekoälyyn on nähtävissä; arviot sen luomisajankohdasta vaihtelevat vuodesta 2029 vuoteen 2045.

Myös Telia pyrkii pysymään tekoälyn aallonharjalla. Yksi tämän saran tärkeimmistä osa-alueista on tekstianalytiikka. Jäsentelemätön informaatio tekstimuodossa sisältää valtavan määrän arvokasta dataa, jonka voi purkaa vain ihminen tai kehittynyt tekoäly. Suurimpiin viestimassoihin ei ole realistista soveltaa ihmiskykyjä, joten niiden analysointi jää tekoälyn harteille.

Haasteena suomen kieli

Haasteita kuitenkin löytyy. Suomen kielessä on runsaasti erilaisia sijamuotoja ja liitteitä, jotka saattavat muuttaa sanojen merkitystä paljon tai vähän. Olemassa olevat kieliopilliset tekoälyratkaisut ovat painottuneet englannin kieleen, eivätkä toimi yhtä hyvin suomen kielen morfologisesti rikkaalla pelikentällä. Lisäksi kirjoitusvirheet analysoitavassa tekstissä tekevät tekstin tarkasta purkamisesta perinteisille tekoälyalgoritmeille lähes ylitsepääsemättömän haasteen.

Tämä alusta tarjoaa mielenkiintoisen haasteen tekoälyn kehittämiselle. Salaisuus suomen kielen prosessointiin piilee meissä itsessämme: mikäli voimme mallintaa omaa kielen tulkintaamme tietokoneessa, voimme opettaa tekoälyn lukemaan suomen kielellä kirjoitettua tekstiä ongelmitta. 

Tästä lähtökohdasta olemme kehittäneet suomen kieltä tulkitsevaa tekoälyä Telialla. Selviin hyötyihin kuuluu asiakaspalvelun laadun parantaminen, ongelmien nopeampi havaitseminen sekä niihin reagointi, tuotteiden ja palveluiden kehittäminen sekä moni muu säästöjä ja tehokkuutta lisäävä kohde.

Miten tekoäly lukee tekstiä?

Hyödyistä voi puhua pitkän pätkän, mutta mielenkiintoisempi puheenaihe on tekoälyn toiminta. Miten tekoäly lukee tekstiä? Neuroniverkot eivät hyväksy tekstiä samassa muodossa kuin me sen luemme; ne vaativat tekstin numeroina. On monia menetelmiä muuntaa tekstiä numeroiksi. Ehkä yleisin menetelmä on antaa jokaiselle sanalle oma numeronsa, jolla se korvataan luettavassa tekstissä. Suomen kielen kimuranttius tulee kuitenkin tässä vastaan. Kun jokainen uniikki sana, eli kirjainyhdistelmä, on oma numeronsa, tietokoneen mielestä esimerkiksi sanat ”puhelin” ja ”puhelimet” ovat kaksi täysin eri sanaa. Siksi ratkaisua on etsittävä syvempää.

Muutamana viime vuonna on yleistynyt Facebookin tutkijoiden kehittämä menetelmä, jossa sana pilkotaan palasiksi. Esimerkiksi sana ”puhelin” koostuisi palasista ”puh”, ”uhe”, ”hel”, ”eli”, ja ”lin”. Sanojen pilkkominen mahdollistaa niiden oikean tulkinnan kirjoitusvirheistä ja sanapäätteistä huolimatta.

Pilkkomisen jälkeen tekoäly opetetaan sijoittamaan sanat moniulotteiseen avaruuteen. Menetelmä on mielenkiintoinen; neuroniverkolle annetaan tehtäväksi arvata syötetystä sanasta sen lähellä olevat sanat, mutta koulutuksen jälkeen verkosta leikataan osa pois. Jäljelle jäänyt neuroniverkko on oppinut sijoittamaan syötetyt sanat moniulotteiseen sana-avaruuteen, jossa merkitykseltään samankaltaiset sanat sijaitsevat lähellä toisiaan. Nyt tekstiä lukiessa tekoäly osaa kääntää sanat niiden merkityksen perusteella koordinaatistoon, jolla se voi vetää älykkäitä johtopäätöksiä tekstistä.

Kokonaisuutena kyseessä on ilmiö, joka on hyvin lähellä omaa lukutaitoamme. Jos kirjoitan ”Soitin tänän ystävälleni puhlimella”, et välttämättä edes huomaa lauseessa olleita kirjoitusvirheitä, sillä tunnistat sanat nopeasti kontekstin ja sanoissa olevien tuttujen palasten kautta. Emme lue sanoja kirjain kirjaimelta, vaan kokoelmina eräänlaisia kuvioita, osa niistä foneettisia ja osa alfabeettisia. Nämä kuviot palauttavat mieleemme sanan ja sen merkityksen, jota käytämme muodostamaan sisäistä kuvaa lukemastamme tekstistä. Tähän pyritään myös tekstiä analysoivan tekoälyn kehityksessä.

Minne tekoäly on menossa? 

Yleistajuinen, ihmisen kaltainen tekoäly on informaatiotieteen uusi Graalin malja, josta kilpailu kiihtyy kiihtymistään. Maljaa tavoitteleva Open AI sai juuri Microsoftilta miljardin dollarin rahoituksen, ja Google syytää resursseja omaan DeepMind -tutkimusryhmäänsä. Muut suuret yhtiöt seurannevat pian perässä. 

Mikäli yleistekoälyn luomisessa onnistutaan, kyseessä ei välttämättä ole elokuvista tuttu henkilökohtainen avustaja saati myöskään pahaenteinen tuomiopäivänkone. Koneen kumuloituvan älykkyyden seurauksia on vaikea ennustaa. Varmaa on vain se, että edessä ovat mielenkiintoiset ajat.

Aleksanteri Vuoristo opiskelee Aallossa kauppatieteitä ja kehittää kesän ajan Telialla tekoälyä. Telia on patentoimassa Aleksanterin kehittämää tekoälyratkaisua, ja läpi mennessään se tulee olemaan Telia Companyn ensimmäinen tekoälypatentti.

Lisää samasta aiheesta

Lisää samalta aihealueelta

Kesätyöntekijöiden blogi
Edellinen artikkeli
Yritysaspan Tiku ja Taku kesästään – kysymyksiä tulvii niin ahtaajilta kuin öylätin tekijöiltäkin
Timi Friman ja Kristian Karadjov ovat työskennelleet jo kaksi kesää Telian yritysasiakaspalvelussa. ...
Seuraava artikkeli
"Innostus ja flow tarttuvat" – tarina Vaasan kesätiimistä