Google kertoo tulevaisuuden – netin avulla parannetaan jo muun muassa työttömyysennusteita

”Hakukonehaut ennustivat irakilaisten tulon Suomeen” toimitusjohtaja ja Turun yliopiston dosentti Mikko Wennberg otsikoi blogikirjoituksensa lokakuun alussa. Olisiko internetin avulla todella voinut ennustaa pakolaiskriisin?

– Kyllä. Jos haluaisimme, pystyisimme internethakuja seuraamalla ennustamaan tämänkin tyyppisiä ilmiöitä, Wennberg uskoo.

Wennbergin blogikirjoituksessa esittämä ajatus perustuu irakilaisten tekemiin Google-hakuihin, jotka koskivat maahanmuuttoa Suomeen. Wennberg havaitsi, että hakujen määrä lisääntyi huomattavasti alkukesällä.

Pakolaiskriisi on vain yksi esimerkki, sillä asiantuntijat uskovat, että hakukonehakujen ja sosiaalisen median avulla voi todella ennustaa. Tätä mieltä on paitsi Wennberg, myös esimerkiksi Elinkeinoelämän tutkimuslaitoksen tutkija Joonas Tuhkuri ja Helsingin yliopiston tutkija Krista Lagus.

– Esimerkiksi kansallisten konfliktien tunnistaminen voisi olla mahdollista jo ennen kuin mennään kaduille rikkomaan ikkunoita, Lagus sanoo.

Joonas Tuhkuri on hyödyntänyt Google-hakuja työttömyyden ennustamiseen Suomessa.

– Työttömyysasteen ennustettavuutta on voitu parantaa yhdistämällä Tilastokeskuksen dataa Google-hakujen tuottamaan dataan, Tuhkuri kertoo.

Työttömyyden ennustamiseen Tuhkuri käytti hakusanoja, joiden avulla uskoi työttömäksi jäävän etsivän tietoa internetistä. Sellaisia hakusanoja olivat esimerkiksi työttömyyskassa ja työttömyyskorvaus.

Yksinkertaistettuna hakukoneiden ja sosiaalisen median avulla ennustamisella tarkoitetaan sitä, että tietyn sanan esiintymistiheyttä tarkastellaan vaikkapa Googlessa, Facebookissa, blogeissa tai keskustelupalstoilla.

Hakukoneet ja sosiaalinen media tarjoavat valtavan määrän dataa. Luotettavan ennusteen tekemiseksi tarvitaan kuitenkin edelleen muutakin tietoa ja ihmistä tietoa etsimään.

– Aivan ehdottomasti, Tuhkuri vahvistaa.

– Se, että ennustaisi pelkän Googlen tai somea avulla, on silkkaa hölmöyttä. On niin paljon muitakin tapoja ennustaa asioita. Mutta lisäsignaaleja ennustemalleihin saa somen avulla varmasti, sosiaalisen median datan keräämiseen ja analysointiin erikoistuneen Futusomen toimitusjohtaja Juho Muhonen sanoo.

Ennustamisessa on yksi iso pulma. Ennusteen tekemiseksi on osattava etsiä oikeita asioita, siksi Wennbergin blogikirjoituskin on saanut kritiikkiä jälkiviisaudestaan. Olisiko joku osannut tarkastella oikeaan aikaan irakilaisten Suomea koskevia hakuja, jotta niiden kasvu olisi voitu havaita etukäteen?

– Jos olisimme katsoneet ulkomailla tehtyjä Suomea koskevia hakuja, olisimme huomanneet hakujen nousseen. Sitten olisimme selvittäneet, että mitä taustalla on ja havainneet, että juuri maahanmuuttoa koskevat haut ovat lisääntyneet ja, että ne ovat lisääntyneet juuri Irakissa. Muutoksen havaitseminen ei olisi vaatinut tietoa Irakista tai maahanmuutosta, Wennberg selittää.

Ennustamiseen liittyy muitakin ongelmia. Tietyn sanan yleistyminen ei ennakoi välttämättä ilmiön kasvua, sillä hakusana saattaa yleistyä vasta samaan aikaan ilmiön kanssa tai jopa jälkikäteen.

Hakukoneiden ja sosiaalisen median tarjoamaa dataa on tähän asti tarkasteltu lähinnä jälkikäteen ja todettu, että jonkin tietyn ilmiön nousu olisi voitu ennustaa internetiä hyödyntämällä.

– Vasta jälkikäteen huomataan, että etukäteenkin olisi voitu tarkkailla, Tuhkuri naurahtaa.

Dataa työkseen analysoiva Louhian Ville Niemijärvi käyttää esimerkkinä tällaisesta ilmiöstä karppausta.

Karppaus-sanan käyttö kasvoi yhtäkkiä räjähdysmäisesti hakukoneissa ja sosiaalisessa mediassa.

– Suosion kasvu olisi ollut havaittavissa Google-hakujen ja sosiaalisen median perusteella jo silloin, kun ilmiö kupli vasta pinnan alla, Niemijärvi sanoo.

Jos tieto ruokavalion suosiosta olisi osattu ennustaa, olisivat tiedosta voineet hyötyä esimerkiksi ruokakauppiaat.

– Harva varmaan tajusi selvittää juuri karppaus-sanan yleisyyttä hakusanana ennen kuin ilmiö oli jo täysillä päällä.

Karppauksen suosion huippu kesti noin vuoden verran. Sen jälkeen sanan esiintyminen väheni huomattavasti.

Varsinaisesta internet-ennustamisesta ei vielä ole tehty bisnestä. Kuitenkin esimerkiksi asiakaspoistuman ennakoinnista ollaan jo valmiita maksamaan.

Wennberg on havainnut jo uuden pakolaiskriisin liittyvän ilmiön, jonka hakukoneet kertovat.

– Pystymme näkemään, miten pakolaiset siirtyvät. Yhtäkkiä Saksasta tehtiin runsaasti Suomea koskevia arabiankielisiä hakuja, joita ei ennen ollut käytännössä lainkaan, Wennberg kertoo.