Teollisuuden big data hankkeessa tehdään teollisuusprosessidatan avulla ennusteita tuotannon laadusta. Tähän mennessä hankkeessa on mallinnettu teollisuusprosessia ja testattu siihen soveltuvia ennustavia tekoälymalleja oikealla aineistolla yhden tuotteen koko tuotantoprosessin osalta. Näin pyritään saamaan aikaan laatua laboratoriotuloksia vastaavalla tavalla ennustavia parametreja.
Edellä mainitun tavoitteen saavuttaminen edellyttää hyvin monenlaisia työvaiheita. Käytännön työ on sisältänyt mm. seuraavanlaisia asioita:
- Kehitettyjen neuroverkkomallien arkkitehtuurien muokkaaminen paremmin prosessidatalle soveltuvaksi ja neuroverkkojen ja laskennallisten mallien optimoimista mahdollisimman hyvin juuri laboratoriomittausten kaltaisten tulosten ennustamiseen soveltuviksi.
- Tuotantoprosessiin liittyvien antureiden tuottaman datan perusteella on kehitetty uusia syötemuuttujia, sekä analysoitu niiden toimivuutta koneoppimismallien yhteydessä.
- Lopputuotteen laatua kuvaavia vastemuuttujia on puolestaan ennustettu niin kutsutuilla virtuaaliantureilla, joita on kehitetty käyttäen päätöspuihin perustuvaa ohjattua koneoppimismenetelmää (Gradient Boosting) regressio-ongelman ratkaisuun.
- Kehitystyön yhteydessä on tärkeää, että teollisuuden tuotantoprosessiin liittyvästä datasta voidaan erottaa eniten lopputulokseen vaikuttavat prosessin osatekijät. Tässä työssä on hyödynnetty mm. pääkomponenttianalyysia.