Epäonnistunut projekti

Kahden vuoden väitöskirjamatkalleni on mahtunut paljon onnistumisia ja niistähän vain kuuluu puhua. Tosiasiassa suurin osa ideoista on joko liian epäkiinnostavia päästäkseen jatkoon, tai jatkoon päästessään osoittautuvat epätarkoiksi tai epätosiksi ja putoavat pois.

Eräs erittäin epäonnistunut projektimme liittyi tradeoff ilmiöön. Tradeoff tarkoittaa tilannetta, jossa eliön yhden ominaisuuden kehittäminen suotuisaan suuntaan johtaa toisen ominaisuuden heikkenemiseen. Oppikirjaesimerkki tällaisesta on ominaisuudet, jotka vaativat samoja resursseja: jos kasvi kykenee tuottamaan kilon siemenmassaa, se voi valita joko tuhat gramman siementä tai sata kymmenen gramman siementä. Siementen lukumäärää JA kokoa ei voi kasvattaa, mikäli resurssit eivät lisäänny.

Meidän havaitsemamme mahdollinen tradeoff oli sienitautimme itiöpesäkkeiden (EDIT 27.8.18, itiöpesäke viittaa itiökasveihin, oikea termi olisi kuromapullo (jossa syntyy kuromaitiöitä)) määrän ja koon välillä. Havaitsimme datassamme kiinnostavan negatiivisen trendin: lehdillä, joilla itiöpesäkkeiden tiheys oli pieni, niiden keskimääräinen koko oli suuri. Luonnollisesti ajatuksemme oli, että tauti saa resursseja isäntäkasvilta tietyn määrän ja voi allokoida (s.o. sijoittaa) tämän resurssin joko itiöpesäkeiden määrään tai kokoon. Molemmat strategiat voivat olla menestyksekkäitä: suuret itiöpesäkkeet tuottavat enemmän ja suurempia itiöitä kuin pienet, toistaalta lukuisat pesäkkeet tuottavat enemmän kuin muutamat. Valtavan datasarjamme (22 000 lehteä) antama vahva viite tällaisen tradeoffin olemassaolosta olisi erittäin huomattava tulos, joka kiinnostaisi ekologian tutkijoita laajalti. Ehdimme tietysti jo haaveilla suuresta huomiosta ja julkisuudesta.

Kuten kerroin aiemmin, tutkimme tautiamme automaattista kuva-analyysiä hyödyntäen. Automaattinen analyysi on mahtavaa: nopeaa, itsenäistä, luotettavaa, toistettavaa, puolueetonta jne. Se on täsmälleen niin hyvä kuin itse teemme. Mutta vain niin hyvä kuin itse teemme. Niinpä olennainen osa automaattista analyysiä on manuaalinen tarkistaminen (data truthing, datan todentaminen?), jotta voimme luottaa saamaamme dataan. Niinpä tarkistimme visuaalisesti kymmeniä lehtiä skannatuista kuvista ja tutkimme vastaako automaattisen analyysin ilmoittama itiöpesäkkeiden tiheys ja koko havaintojamme. Lopulta päädyimme laskemaan muutamia kymmeniä tuhansia itiöpesäkkeitä eri lehdistä, ja kokeilimme millä asetuksilla automaattimme tuottaa parasta dataa. Siis täsmällisesti ilmaistuna optimoimme parametreja (pesäkkeiden minimi- ja maksimikoko, tummus, pyöreys jne.). Lopulta saimme dataa, johon saatoimme luottaa pesäkkeiden määrän osalta. Ja havaitsemamme yhteys säilyi!

Prosessin aikana olin kuitenkin oppinut ymmärtämään paremmin käyttämämme automaattisen analyysin menetelmää pesäkkeiden tunnistamiseksi ja koon määrittämiseksi. Koin että siinä oli perustavaa laatua oleva ongelma: se perustui liikaa ennalta määrättyihin vakioarvoihin (tummuus, maksimikoko). Niinpä ehdotin vaihtoehtoista menetelmää, joka tunnistaa joustavammin missä pesäke päättyynja lehti alkaa. Ideana oli ”laajentaa” havaittua pesäkettä tummasta keskipisteestä pykälä kerrallaan kohti pienempää tummuutta ja löytää kohta jossa pesäkkeen havaittu koko yllättäen harppaa: tällöin mukaan tuli oletettavasti jo normaalia lehden pintaa.

Havaitsin myös toisen mahdollisen ongelman. Kyllä, erikoisalaani on heikkojen kohtien tökkiminen, epäileminen. Tämä oli, että käytimme analyysissämme keskimääräistä tiheyttä ja pesäkkeen kokoa jokaiselle lehdelle. Tästä johtuen suurissa tiheyksissä keskimääräinen koko laskettiin suuresta määrästä pesäkkeitä ja pienissä tiheyksissä toisinaan vain muutamasta. Tämä taas johti mahdollisuuteen, että pienissä tiheyksissä harvinaisenakin esiintyvät virhearviot voisivat johtaa selvästi vääristyneeseen keskiarvokokoon. Myös datamme tuki tätä ajatusta, koska yhteys näytti hieman kolmiolta: pienissä tiheyksissä keskimääräinen koko vaihteli hurjasti, mutta suurissa tiheyksissä se oli paljon rajatumpi.

Y-akselilla (pystyssä) pesäkkeiden (kuromapullo, pycnidia, pycn.) tiheys, X-akselilla (vaa’assa) pesäkkeiden koko. Sinisillä katkoviivoilla koko joukon keskiarvot. Huomaa kolmiomainen muoto: alareunassa pisteitä on vasemmalta oikealle, yläreunassa paljon rajatummalla alueella.

Vastuullisina tutkijoina käytimme aikaa näiden mahdollisten ongelmien poistamiseen: paransimme koon tunnistuksen luotettavuutta ja analysoimme datan toisella tapaa poistaen yllä kuvailemani keskiarvovääristymän. Harmi vain, että poistettuamme ongelmat poistui myös yhteys. Innostuksen, haaviden, ideoinnin ja kovan työn jälkeen olimme alkupisteessä.

Käteen ei jäänyt muuta kuin runsaasti kokemusta ja vahvempi usko siihen, että itsekritiikki kannattaa. Toisaalta tämä ei ole vähäpätöistä. Jäi myös pieni helpotus siitä, ettemme ehtineet kovin laajalti huudella mullistavasta löydöksestämme. Ei muuta kuin nokka kohti uusia ideoita, kyllä vielä onnistaakin.

Vastaa