Moikka moi! Viime kerrasta on mennyt taas kuukausi eli olisi uuden postauksen aika! Työt on pyörähtänyt kivasti käyntiin ja olen tässä jopa firman kesälomakaudella päässyt kokeilemaan etätöitä! Noin kuukausihan tässä olisi vielä töitä jäljellä, mutta ei anneta sen haitata menoa.
Ja sitten varsinaisista töistä. Kuten viime kerralla mainitsin, olen työskennellyt yhdessä biotekniikkaan liittyvässä projektissa, jossa tuotetaan sienien avulla haluttua proteiinia. Biotekniikan puoli on Pixactille uusi, joten projektin tavoitteena on kartoittaa kuvaamiseen perustuvan mittalaitteiston hyödyntämistä bioprosesseissa.
Bioprosessien kuvaaminen on jo pelkästään mittalaitteiston puolesta hankalaa, mutta ei mahdotonta. Laitteisto ei esimerkiksi saa aiheuttaa kontaminaatioriskiä, sen pitää kestää vaihtelevat olosuhteet reaktorin sterilisoinnin vuoksi ja jopa kameran linssi pitää suunnitella siten, että se ei likaannu organismien tarrautumisen vuoksi. Kohdat eivät sinänsä kuulosta monimutkaisille, mutta ne ovat erittäin tärkeitä toimivan tuotteen luomisen kannalta.
Vaikka mittaaminen kuulostaa hiukan hankalalle, voi bioprosessien ohjaamisessa olla erittäin paljon mahdollisuuksia hyödyntää Pixactin mittauslaitteistoa. Kuvien avulla voi nimittäin tarkastella organismien muotoa, määrää ja kokoa. Tällöin voidaan esimerkiksi arvioida biomassan määrää ilman offline -mittauksia, mikä omasta mielestäni kuulostaa erittäin kätevälle! Biomassan määrää tai sen kasvunopeutta voidaan hyödyntää esimerkiksi kasvatusvaiheessa tai bio-organismien tarkkailussa.
Mutta mitä vasta kaksi vuotta opiskellut energiateekkari voi tällaisessa projektissa tehdä? No data-analyysiä Matlabissa tietenkin! Koska projektissa haluttiin kartoittaa mittalaitteiston toimivuutta bioprosessissa, on luonnollista, että verrataan Pixactin tuottamaa dataa asiakkaan tuottamaan dataan. Tähän astui kuvioihin minulle entuudestaan tuntematon korrelaatioanalyysi, mutta hyvien ohjeiden ja ohjelmoinnin ensimmäisen kurssin avulla pääsee pitkälle! Korrelaatioanalyysissä siis tarkastellaan eri muuttujien suhdetta toisiinsa; laskeeko jokin, kun toinen nousee vai ovatko ne ollenkaan yhteydessä toisiinsa.
Dataa oli analyysissa paljon. Pixactin tuottamaa dataa oli noin 30 muuttujan verran, kun taas asiakkaan datassa oli mitattu noin 50 arvoa. Mittaus oli kestänyt noin viikon ja mittauspisteitä otettiin noin 10 minuutin välein. Voisi siis sanoa, että dataa oli paljon. Excelillä analyysi olisi ollut vähintään epämukavaa, joten olen tyytyväinen, että käytössäni oli Matlab, jolla suurien datamäärien käsittely oli helpompaa ja sujuvampaa. Kaikkeahan minun ei tarvinnut siis itse koodata: osa koodista oli valmista aiemmista projekteista, mutta sitä piti silti muokata vaihtelevissa määrissä.
Analyysia tehdessä huomasin, että aina ei voi katsoa ainoastaan numeroita. Havaitsin mittausdatassa epäloogisia asioita, joiden vuoksi minun täytyi tarkastella kuvia ja asiakkaan muistiinpanoja. Tällöin voitiin siis havaita bioprosessien kuvaamiseen liittyvä ongelma: hiukkasten muoto muuttuu. Mittauksen aikana näin yksittäisiä hiukkasia, flokkeja ja pellettejä. Erilaiset muodot vaikeuttavat analyysiä, mutta se ei ole niin suuri ongelma, koska analyysitekniikoita on monia. Vaikka analyysia pitää vielä hioa, pystyi mittausdataa kuitenkin hyödyntämään biomassan kasvuvaiheessa.
Projektin olin useaan otteeseen yhteydessä asiakkaan kanssa, jolloin kyselin heidän kiinnostuksen kohteitaan analyysissa ja kyselin heidän mittaustuloksistaan lyhenteiden tarkoitusta. Uudenlainen asiakaskohtaaminen oli erittäin mukavaa vuosien pikaruokalakokemuksien jälkeen.
Yläpuolella olevat kuvat ovat kuvakaappauksia livekuvasta reaktorin sisältä. Itsehän en ennen projektia siis ole koskaan nähnyt tämän tyylistä kuvaa bioprosessista ja veikkaan, että en ole ainoa :D. Projekti oli itselleni mieleinen: opin uusia asioita Matlabistä, prosessien mittaamisesta ja myös datan analysoimisesta.
Vaikka ensimmäinen kuukausi suurin piirtein oli analyysia ja koneella istumista, pääsin lopulta myös kokeilemaan itse mittaamista. Kuvailin tällöin sellunäytteitä yrittäen määrittää sen laatua aivan uudella ja mielenkiintoisella tavalla. Mittaukset ja sen kohteet ovat sen verran uusia ja salaisia, että niistä en voi blogiin kirjoittaa tarkemmin.
Mittauksessa kuitenkin pääsin tutustumaan kuvauslaitteisiin, joissa tutustuin muun muassa kyvettiin (eli komponenttiin, jossa näytevirtaa) ja valon käyttäytymiseen erilaisten diffuusien pintojen yhteydessä. Usean näytteenoton ja erilaisten konfiguraatioiden kokeilemisen jälkeen löytyi toimiva tapa kuvata näytettä. Kuvien tausta kuitenkin osoittautui hiukan erilaiseksi kuin mitä aluksi oletettiin, joten minulle annettu analyysikoodi ei kykene vielä tunnistamaan näytteitä täysin.
Pystyisin kyllä kirjoittamaan mittauksista ja analyysistä enemmänkin, koska itse innostuin aiheista erittäin paljon. Tietenkään blogipostaus ei voi mahdottoman pitkä olla, joten eiköhän tässä ollut asiat jo tarpeeksi tarkasti. Ensikerralla pääsen sitten kirjoittelemaan miten näillä taidoilla voi auttaa tekoälyn luomisessa, kun kyseessä on sokerien kiteyttäminen. Näihin kuviin ja tunnelmiin!