Tekoälyllä tehokkuutta otsikointiin –projektin tavoitteena oli kehittää tietointensiivinen ratkaisu, jonka avulla sisällöntuotantovaiheessa voidaan ennustaa uutisotsikon vaikuttavuutta kohdemediassa. VTT:n projektissa kehitettiin Otsikkokone, uutistoimittajan työkalu, jonka avulla voidaan sisällöntuotantovaiheessa arvioida otsikkoluonnoksen vaikuttavuutta artikkelin suosioon ja kiinnostavuuteen sekä optimoida uutisotsikon tehokkuus ilman ”klikkiotsikointia”.
Sähköisessä mediassa uutisotsikon merkitys korostuu yhä monipuolisemman mediavirran kilpaillessa lukijan huomiosta. Kilpailusta on tullut globaalia ja uutisten lisäksi lukijoille on tarjolla miljardeittain sähköposteja, twiittejä, blogikirjoituksia, chat-kanavia, SOME-päivityksiä, online-videoita ja muuta multimediasisältöä. Lisäksi kilpailu lukijoista korostuu erityisesti paikallisissa medioissa kilpailuna kansallisten mediasisältöjen kanssa.
Projektissa haastateltiin paikallisten uutismedioiden edustajia määritelläkseen heidän kannaltaan vaikuttavan uutisotsikon ja selvittääksemme uutisotsikon luontiin sovellettavia kriteerejä erityisesti sähköisessä mediassa. Otsikon tavoitteena haastattelujen perusteella on parantaa median brändi-imagoa, houkutella lukijoita viettämään aikaa uutissivustolla sekä vierailemaan sivustolla usein ja sitouttaa lukijat maksamaan uutispalvelusta.
Tekoälyllä tehokkuutta otsikointiin –hankkeessa valittiin tavoitteeksi mitata sekä otsikon keräämien klikkien määrää että artikkelin lukemiseen käytettyä aikaa suhteessa sisällön määrään. Näin muodostettiin metriikka, jonka avulla uutisotsikot voidaan luokitella neljään eri luokkaan tehottomasta kiinnostavaan, houkuttelevaan ja tehokkaaseen. Uutisotsikolle määriteltyjä tavoitteita ajatellen mahdollisimman suuri osa niistä pitäisi löytyä luokasta ”tehokas”.
Otsikkokone-toteutuksen tavoitteena on ennustaa uutisotsikon vaikuttavuutta sisällöntuotantoprosessin tukena. Ennen sisällön julkaisemista toimittaja voi hakea ennusteita eri otsikkovaihtoehdoille ja valita koneen avustamana sopivan otsikon sisällölle.
Otsikkokoneen testaaminen toteutettiin yhteistyössä Kaleva Median kanssa. Kaleva Median tarjoaman anonymisoidun datan avulla päästiin opettamaan Otsikkokoneen tekoälymalli todellisella sisällöllä sekä lukijakäyttäytymisellä ja arvioimaan näin kehitetyn työkalun toimivuutta uutistoimittajan tukena. Webanalytiikkatiedon lisäksi mallin kouluttamisessa käytettiin itse artikkeliin liittyvää tietoa, kuten sanamäärää, jotta webanalytiikkatiedon pohjalta pystyttiin laskemaan artikkelikohtainen keskimääräinen lukuaika ja lukuosuus.
Hankkeessa kehitetty Otsikkokone-työkalu kykenee ennustamaan uutisotsikon vaikuttavuuden yhteen neljästä luokasta 58,7% tarkkuudella. Myös työkalun tarkkuutta arvioitiin verrattuna asiantuntijoiden tekemään luokitteluun.
Viisi asiantuntijaa luokitteli 80 uutisotsikkoa Otsikkokoneen tapaan neljään eri vaikuttavuusluokkaan. Otsikot valittiin satunnaisesti hankkeessa käytetystä testiaineistosta. Asiantuntijoiden luokittelutarkkuus oli 25,8% ja Otsikkokoneen näille otsikoille 61,3%. Verrattuna asiantuntija-arvioon, Otsikkokone toimii siis merkittävästi paremmalla tarkkuudella. Näin arvioitiin, että tuloksista on merkittävää apua toimittajille, kun tulokset otetaan operatiiviseen käyttöön toimituksessa. Operatiivisessa käytössä on tärkeää, että malli opetetaan riittävän usein ajankohtaisella datalla, jotta se pystyy huomioimaan muuttuvia trendejä uutisoinnissa ja ennustamaan tarkasti ajankohtaisia uutisaiheita.
Otsikkokone otetaan testikäyttöön Kaleva Mediassa rajatulla määrällä toimittajia ja testin perusteella arvioidaan tarkemmin tarvittava jatkokehitys Otsikkokoneen prototyypille. Malli on sovitettavissa myös muiden mediatoimijoiden sisältöön ja ohjelmistototeutus tullaan julkaisemaan avoimen lähdekoodin ohjelmistona kevään 2020 aikana.
Tekoälyllä tehoa otsikointiin -raportti (PDF)
VTT Otsikkokone_raportti Tekoälyllä tehoa otsikointiin -esitys (PDF)
Lisätietoja
Sari Järvinen
sari.jarvinen_vtt.fi (laita -viivan tilalle @-merkki)
puh. 040 512 9662
Tutkimussäätiö myönsi hankkeelle tutkimusteemarahoitusta 21.11.2018.