tiistai 9. marraskuuta 2021

Rintasyöpä ja tekoälyavusteinen rintasyövän havainnointi

Kirjoittaja: Helinä Heino
Video: Antti Isosalo

                                                                                                                                                             

Roosa nauha -kampanja muistuttaa siitä, että rintasyöpä koskettaa monen ihmisen elämää. Kuva Pixabaysta.


Rintasyöpä on naisten yleisin syöpätyyppi, sillä vuosittain syöpään sairastuu Suomessa noin 5000 naista. Rintasyöpiä todetaan myös miehillä ja Suomessa miehiä sairastuu vuosittain kolmisenkymmentä. Maailmanlaajuisesti naisten uusien rintasyöpien esiintyvyyden arvioidaan olevan noin 2.3 miljoona tapausta.

Ikääntyminen lisää syövän esiintymisen todennäköisyyttä, joten Suomessa järjestetään 50-69-vuotiaille naisille ilmaisia seulontatutkimuksia. Rintojen omatoimiseen tarkkailuun on myös hyvä kiinnittää huomiota. Esimerkiksi muutokset rinnan alueen ulkonäössä tai rakenteessa on syytä tutkituttaa. Mammografiatutkimus on yksi tyypillinen tapa tutkia rinnan kudosta (tarvittaessa myös esim. ultraäänitutkimus ja kudosnäyte saattavat tulla kyseeseen). Mammografiassa rinnasta otetaan röntgenkuvat, jotka toimitetaan radiologin arvioitaviksi.    

Röntgenkuvien tulkinta ei kuitenkaan ole helppoa tai yksiselitteistä ja väestön ikääntyminen lisää terveydenhuollon ruuhkautumista. Tästä syystä rintasyöpien havainnointiin on pyritty kehittämään automaattisia menetelmiä, jotka voisivat avittaa radiologin työtä. Havainnointia varten on pyritty kehittämään tekoälypohjaisia ratkaisuja eli algoritmeja, joiden toiminta perustuu syöpään viittaavien piirteiden automaattiseen havainnointiin mammografiakuvista. Tekoälypohjaisilla menetelmillä on saatu lupaavia tuloksia, ja myös AIDMEI-projektissa tutkitaan menetelmiä rintasyövän havainnointiin.      

  

Rintasyövän kehittyminen

Kehon elimistö muodostuu soluista, joiden normaaliin toimintaan kuuluu solun jakautuminen, sillä kudosten elinkaareen kuuluu kudosten uusiutuminen. Normaalisti solujen jakautuminen on tarkoin säädeltyä ja elimistö kykenee eliminoimaan virheellisesti toimivat solut.

Jos solujen perintöainekseen eli DNA:n aiheutuu haitallisia muutoksia (esim. karsinogeenien aiheuttamat tai perinnöllinen alttius), saattaa solujen jakautuminen häiriintyä ja lopputuloksena olla syöpäsoluksi erilaistunut solu. Kun yksittäinen syöpäsolu pääsee jakautumaan tarpeeksi monta kertaa, muodostuu näistä uusista soluista soluryhmittymä eli kasvain tai tuumori.  

Hoitamaton, pahanlaatuinen kasvain lähettää etäpesäkkeitä eli lähtee leviämään muualle kehoon. Syöpä on monimutkainen prosessi, joka parantumattomassa muodossa muuttaa lopulta ihmisen aineenvaihduntaa, aiheuttaa elintoimintojen pettämisen ja kehon luontaisen puolustusjärjestelmän romahtamisen. Syöpään menehtymiseen ei ole yksiselitteistä selitystä, sillä esimerkiksi loppuvaiheen syöpää sairastava saattaa menehtyä johonkin infektioon, kuten keuhkokuumeeseen tai elimen toiminnan pettämiseen.     

Rintasyöpiä kyetään kuitenkin nykyisin hoitamaan hyvin ja esimerkiksi vuosina 2011-2013 rintasyöpään sairastuneiden naisten elossaololuku viiden vuoden sisällä Suomessa on jopa 91 prosenttia.          

 

Yleistä rintasyövästä

Rintasyöpä tai syövät yleensäkään eivät ole yksittäinen sairaus, vaan niillä on erilaisia alatyyppejä. Alatyyppien avulla voidaan arvioida syövän hoitomahdollisuutta ja syövästä selviytymisen ennustetta.

Alatyypin määrittämiseen tarvitaan tyypillisesti tieto syöpäsolujen jakautumisen nopeudesta, HER2-kasvutekijän ilmaantumisesta ja tieto siitä, että esiintykö syöpäsoluissa estrogeeni- ja/tai progesteronireseptoreita. HER2-kasvutekijän esiintyminen syöpäkudoksessa viittaa aggressiivisempaan syöpään, jolla on suurempi uusiutumisriski. Jos syöpäsoluissa esiintyy estrogeeni- ja/tai progesteronireseptoreita, voidaan syöpää hoitaa hormonaalisilla lääkehoidoilla. Hormonaalisten lääkehoitojen etuna on, että niiden tiedetään puolittavan rintasyövän uusiutumisriskiä.

 

Rintasyöpä ja tekoäly

Kun puhutaan tekoälyn soveltamisesta rintasyöpään (tai muuhun sairauteen), viitataan menetelmään, jossa saatavilla olevaan kuvadataan (tai muuhun aineistoon) pyritään sovittamaan matemaattinen funktio, joka kykenee lähtökohtaisesti erottamaan syöpää sisältävät ja syövättömät tapaukset omiksi ryhmikseen. Tällöin puhutaan tekoälyn tai neuroverkon kouluttamisesta. Käytännössä tämä tarkoittaisi sitä, että koulutuksen jälkeen analysoiva ohjelma kykenee antamaan arvion rintasyövän esiintyvyydestä myös mammografiakuvalle (aineistolle), jota se ei ole aiemmin nähnyt. 

Esimerkiksi alla olevassa videossa demonstroidaan tilannetta, jossa tekoäly merkitsee mammografiakuvaan alueen, joka vaikuttaa sen algoritmin pohjalta epäilyttävältä. Tulevaisuudessa radiologi voisi hyödyntää tällaista alustavaa analyysiä diagnoosin teossaan.


                             Video. Mammografiakuvaan on merkitty epäilyttävä alue punaisen maskin avulla. 

Jos aiheen teoreettisempi puoli kiinnostaa, voi tähän tutustua vielä tarkemmin Eeva Nevanrannan kandityössä.


maanantai 23. elokuuta 2021

Tekoälylle dataa

Kirjoittajat:
Antti Isosalo
Satu Inkinen
Jarmo Reponen
Miika Nieminen


Olemme Oulun yliopistossa keränneet yhteistyössä Oulun yliopistollisen sairaalan kanssa laajan, noin 50 000 mammografiakuva-aineiston, ja se on keräilyn yhteydessä pseudonymisoitu tutkimuskäyttöä varten. Aineiston avulla on tarkoituksena kehittää tekoälyperustaista rintasyövän havainnointia mammografiakuvista ja prosessia, jolla tulevissa yliopiston ja sairaalan rajapinnassa tapahtuvissa tekoälyhankkeissa päästään suoraviivaisesti potilasdatasta analyysivaiheeseen. Tässä artikkelissa käymme lyhyesti läpi aineistonkeruun vaiheita ja annamme muutamia esimerkkejä huomioonotettavista asioista.


Aineiston keruu ja sen eri vaiheet


Terveydenhuollon ammattilaisten ja hoitohenkilökunnan suorittamalla aineiston keruulla tarkoitetaan jatkuva-aikaista systemaattista terveydentilaa ja tutkimustuloksia koskevan aineiston keruuta, analysointia ja tulkintaa. Näitä tuloksia käytetään terveydenhuollon suunnittelun, toteutuksen ja arvioinnin apuna. 

Tutkimusaineisto voidaan jakaa keräysmenetelmän mukaan havaintoaineistoon, kokeelliseen aineistoon, simuloituun aineistoon ja johdettuun aineistoon. 

Havaintoaineisto on tyypillisesti jonkin mittalaitteen avulla kerättyä aineistoa, kuten Holter-mittaukset tai esimerkiksi kuva-aineistoa, kuten röntgenmenetelmällä kuvatut mammografiakuvat. Myös rekistereihin kerätyt potilastiedot voidaan lukea havaintoaineistoksi.

Kokeellinen aineisto syntyy, kun tutkija säätää esimerkiksi magneettikuvantamislaitteen tai sekvenssin parametrejä ja pyrkii selvittämään syy-seuraus-suhteita esimerkiksi kuvantamismenetelmän parantamiseksi. 

Simuloidulla aineistolla puolestaan pyritään mallintamaan reaalimaailman ilmiötä tiettyjen reunaehtojen ja lähtötietojen perusteella. Simuloinnissa tärkeää on hyvä malli. Useimmille meistä tuttu esimerkki reaalimaailman ilmiötä simuloivasta mallista ovat sääennusteet, joita tarkennetaan säähavaintojen avulla saatavien lähtötietojen, kuten lämpötilan, ilmanpaineen ja mm. ilmankosteuden avulla. Mammografiatutkimusten kontekstissa laajaan aineistoon perustuva malli voisi ennustaa esimerkiksi tulevaa hoidon tarvetta tai rintasyövän puhkeamista. 

Johdetulla aineistolla tarkoitetaan useammista lähteistä saatujen tietojen avulla saatua aineistoa. Johdettu aineistolla voidaan tarkoittaa esimerkiksi potilastietojen ja erilaisista tutkimuksista saatujen tietojen avulla tuotettuja annotointeja. Johdettu aineisto voi olla myös jonkin muunnoksen kautta saatua uutta aineistoa, jonka avulla lääketieteellisessä sovelluksessa pyritään saamaan aikaan esimerkiksi tarkempi diagnoosi tai ennustamaan terveydentilan kehitystä. Toisiokäyttölaki mahdollistaa rekistereihin kertyneiden potilastietojen käytön tutkimustyön tekemiseen. 


Tekoäly ja opetusaineisto


Kuten ihmisenkin oppimisessa, hyvä aineisto on keskeisessä osassa tekoälyn opettamisessa. Tekoälyn osalta aineiston merkitys on ehkä vielä keskeisempi, koska tekoälyn kyky päätellä ja pidättäytyä päätöksistä ei ole vielä ihmisen tasolla. Opetusaineistosta merkittävästi poikkeavat näytteet ovat mm. suurempi ongelma tekoälylle kuin mitä ne ovat ihmiselle. Se missä automaattiset menetelmät ovat kuitenkin ihmistä parempia on laajojen aineistojen käsittely.

Ennen kuin tekoälyä päästään opettamaan tarvitaan monia eri työvaiheita aineiston keruusta, tallennukseen, louhimiseen ja eri tietolähteiden yhdistämiseen sekä nimeämiseen eli annotoimiseen. Potilasaineistoja käytettäessä yhtenä työvaiheena on myös tietojen de-identifiointi.


Oikeanlainen aineisto tärkeää


Keskeisessä osassa tekoälyä sovelluksissa on oikeanlainen aineisto. Aineiston täytyy lisäksi olla jäsennettynä oikeaan muotoon ja sitä täytyy olla riittävä määrä. Riittävä määrä vaihtelee sovelluksen mukaan, sadoista miljooniin esimerkkeihin.

Aineiston esikäsittely on usein merkittävä ponnistus. Monia aineistoja ei ole aiottu tekoälykäyttöön ja niinpä ne eivät ole välttämättä sopivassa muodossa. Useammasta lähteestä tuleva aineisto on lisäksi siirrettävä jatkokäyttöä varten yleiseen esitysmuotoon (engl. common representational format).

Aineisto saattaa sisältää myös erilaista vaihtelua. Aineistoa on voitu esimerkiksi mitata/kuvata eri valmistajien laitteilla ja näillä valmistajilla on saattanut olla oma standardinsa, jota he ovat seuranneet esimerkiksi ohjelmistototeutuksessaan.

Aineistosta voi olla tarpeen myös suodattaa pois ne näytteet, joita ei jostain syystä haluta tutkia, muu kuin haluttu kuvantamismenetelmä ja korruptoituneet kuvat, joita niitäkin luonnollisesti on.

Aineiston hallintaan ja erityisesti aineiston tehokkaaseen ja toisaalta virheettömään tulkintaan soveltuvaa teknologian määrittely on käynnissä niin menetelmiin keskittyvän perustutkimuksen kuin esimerkiksi toimintaa ohjaavan lainsäädännön osalta. Aineiston keruu on oman aktiivisen tutkimuksensa kohteena.


Lopuksi


Useista tekoälyn sovelluksista ja erityisesti syväoppimismenetelmien viime vuosina mahdollistamista kehitysaskeleista huolimatta asenteet tekoälyn käyttöä kohtaan ovat pysyneet varauksellisina. Uskomme, että tekoälypohjaiselle kuva-analyysille on lähitulevaisuudessa olemassa tärkeä rooli tuottavuuden ja diagnostisen hoitopolun tehokkuuden kehittämisessä. Tehokkuuden kehittäminen puolestaan auttaa lievittämään elintärkeisiin toimintoihimme kohdistuvia maailmantalouden vaikutuksia, jolloin terveydenhuoltomme korkeasta laatutasosta ei tarvitse joustaa.

 

Kirjoittajat ovat AIDMEI-projektin projektiryhmän jäseniä. Projektissa tutkitaan kahta kiinnostavaa käyttötapausta alaselkäkivun havainnointia magneettikuvista ja rintasyövän tunnistamista mammografiakuvista. Projektirahoitus on Teknologiateollisuuden 100-vuotissäätiön ja Jane ja Aatos Erkon säätiön tulevaisuuden tekijät rahastosta. Tutkimusyhteistyössä tärkeinä yhteistyökumppaneina ovat Helsingin yliopisto ja Oulun yliopistollinen sairaala.

maanantai 24. toukokuuta 2021

Kuvantamisen arvoketjua muovaavat uudet teknologiat

Miika Nieminen 
professori, ylifyysikko 
Oulun yliopisto ja Oulun yliopistollinen sairaala

    

Tietokoneiden ja erityisesti näytönohjaimien laskentatehon kehittymisen myötä viime vuodet ovat olleet erittäin mielenkiintoisia teknologian ja tekoälyn vuosia. Myös lääketieteen teknologian tutkimuskentässä on eletty mielenkiintoisia vuosia. 

Uutiskynnyksen ovat ylittäneet mm. monet tutkimukset, joissa tekoäly on yltänyt tunnistustehtävässä ihmisen tasolle tai jopa päihittänyt hänet (Kuva 1).  

On myös maalailtu uhkakuvia: ketä syyttää tietokoneen tekemästä virheestä? Valmistuvat lääkärit ovat pohtineet kannattaanko radiologiaan erikoistua, jos tietokone vie työpaikat.

Kuva 1: Tekoälytutkimus on saanut viime vuosina merkittävää mediahuomiota.

Kuvantamisen arvoketju (kuva 2) koostuu kuvan tuottamisesta, kuvien analysoinnista ja tulkinnasta, lausunnon kirjoittamisesta ja potilaan hoitoon vaikuttavasta päätöksenteosta.

Seuraavassa esittelen lyhyesti käyttötapauksia omasta tutkimuksestamme, joissa tätä arvoketjua, erityisesti sen alkupäätä, voidaan parantaa, jotta kuvantamiseen liittyvä diagnostiikka olisi laadukkaampaa ja nopeampaa, ja säteilyannos pienempää.

Kuva 2: Kuvantamisen arvoketju


Tekoälystä seulojan kumppani?

Diagnostisessa kuvantamisessa tekoälyä voidaan hyödyntää mm. luokittelu-, segmentointi-, rekisteröinti- ja lokalisointitehtävissä.

Suomessa 30% diagnosoiduista syövistä ovat rintasyöpiä, ja rintasyöpään liittyviä seulontatutkimuksia tehdään meillä 300000 kpl vuodessa. Lainsäädäntö edellyttää kahden radiologin tekemää arviointia, ns. kaksoisluentaa. Radiologiresurssi ei vaan tahdo tähän aina riittää. 

Yhdessä hankkeistamme optimoimme rintasyöpäseulonnan työvirtaa kehittämällä koneoppimismenetelmiä tunnistamaan ns. helpot tapaukset, jolloin lääkärille jäisi enemmän aikaa hankalien tapausten tarkasteluun (kuva 3). Käytämme tutkimuksessa Oulussa keräämäämme n. 50000 potilaan aineistoa, jolle radiologimme ovat tehneet ison urakan tunnistamalla ja rajaamalla syövät mammografiakuvista. Haastamme nykyistä arvoketjua hypoteesillä asetelmasta jossa, toisen radiologeista voisi korvata tekoälyllä. Tekoälyn mukaanotto seulontaan tulee toki edellyttämään lainsäädännöllistä muutosta.

Kuva 3: Haastamme nykyistä mammografiatutkimusten seulontakäytäntöä ottamalla tekoäly toisen radiologin tilalle. Kuvassa oikealla tekoälyn tuottamat piirrekartat, joiden perusteella poikkeavat kudosmuutokset voidaan tunnistaa. (Isosalo, Inkinen, Ipatti, Turunen, Prostredná, Reponen, Nieminen)

Keskustelu tekoälyn paikasta laajemminkin eri arvoketjuissa käy vilkkaana; mikä on optimaalisin tapa integroida tekoäly terveydenhuoltojärjestelmään, annetaanko sille orjan, rengin vai jopa isännän rooli.


Missä kipu on? 

Alaselkäkipu on hyvin yleinen oire ja johtava liikuntakykyä rajoittava vaiva kautta maailman. Poikkeavia löydöksiä nähdään selän magneettikuvissa usein ja ne eivät välttämättä liity aina kipuun. Oulussa olemme tehneet tutkimusta Pohjois-Suomen v. 1966 syntymäkohortin selän magneettikuva-aineistolla, joissa meillä on tiedossa potilaiden kiputieto. Kiputiedolla ja kuvilla olemme kouluttaneet koneoppimisjärjestelmää etsimään ja osoittamaan ne kudosalueet, joilla kipua potevien magneettikuvat eroavat kivuttomien kuvista (kuva 4). Tällä hetkellä syväoppiva menetelmämme pystyy erottelemaan kipua potevat vapaaehtoiset kivuttomista 80%:n tarkkuudella.

Kuva 4: Kuvan mukaisilla ”lämpökartoilla” (engl. heatmap) voidaan graafisesti havainnollistaa ne kudosalueet, jotka tekoäly tunnistaa poikkeaviksi, kipuun liittyviksi kudosalueiksi. (Al-Rubaye, Ketola, Inkinen, Karppinen, Nieminen)

 

Miehittämätön röntgenkuvaus

Perinteinen röntgenkuvaus on hyvin työvoimaintensiivistä, laitteet kalliita ja useimmiten laitteet kiinteästi asennettuja. Saavutettavuus röntgentutkimukseen esim. pohjoisessa Suomessa puhumattakaan muualla maailmassa voi olla hyvinkin huono. Tutkimusyksikössämme olemme kehittäneet jalkautuvan sairaanhoidon kysyntään vastaava röntgenkuvauslaite raajojen röntgenkuvaukseen (kuva 5).

Missiona on tuoda kuvantamispalvelu lähelle potilasta jopa ilman fyysistä kuvaushenkilöstöä. Älykäs laite opastaa potilasta interaktiivisesti raajan asettelussa ja ottaa sen jälkeen kuvan automaattisesti. Näin voidaan pienentää kuvantamisen kustannuksia ja tuoda kuvantaminen lähemmäksi potilasta.

Laitteen prototyyppi on valmis, meillä on mm. STUKn ja FIMEAn luvat aloittaa testaaminen oikeilla potilailla pian.

Kuva 5: Visio miehittämättömän röntgenkuvauslaitteen ulkoasusta. (Liimatainen, Hanni, Tervonen, Nieminen)
                                                  


Magneettikuvausta nopeammin

Magneettikuvaus perustuu vesi- ja rasvamolekyylien vety-ytimien lähettämään signaaliin. Tyypillinen magneettikuvaustutkimus kestää n. 20 minuuttia ja se koostuu useista kuvasarjoista, joissa jokaisessa on kymmeniä kuvia erilaisella kuvakontrastilla. Yhdessä New Yorkin yliopiston kanssa olemme kehittäneet ja testanneet uutta magneettikuvausmenetelmää (kuva 6), ns. sormenjälkimagneettikuvausta (engl. magnetic resonance fingerprinting), minkä avulla voidaan yhdellä n. 5min kestävällä kuvauksella määrittää kuvauskohteen kudosten magneettiset ominaisuudet, ns. relaksaatioajat, jotka ovat vastuussa alkuperäisten kliinisten kuvasarjojen kontrastista. Relaksaatiokarttojen avulla on mahdollista tarkastella tiettyjä kudosmuutoksia tarkemmin ja kvantitatiivisesti. Kvantitatiivisten karttojen perusteella voidaan laskea em. kliiniset kuvasarjat ja näin toteuttaa kuvaus nykyistä huomattavasti lyhyemmässä ajassa. Teemme tutkimusta näiden synteettisten kuvien soveltuvuudesta radiologien käyttöön.

Kuva 6: Perinteinen polvinivelen magneettikuvasarja (A), Magnetic resonance fingerprinting -tekniikalla määritetyt relaksaatioaikakartat (B) ja näiden perusteella laskettu kliiniseen käyttöön soveltuva kuva (C). (Casula, Nissi, Nykänen, Nevalainen, Cloos, Lattanzi, Nieminen)


Paksuneulanäytteitä älyllä

Maailmassa diagnosoidaan vuosittain 18 miljoonaa syöpätapausta. Tyypillisesti syöpä diagnosoidaan neulanäytteestä. Tutkimuksesta riippuen jopa 30% neulanäytteistä epäonnistuu neulan puutteellisen kohdistuksen vuoksi. Olemme kehittäneet älyneulan auttamaan paksuneulanäytteen otossa (kuva 7). Uusi menetelmä auttaa radiologia ottamaan näytteen onnistuneesti kertomalla onko neula kohdekudoksessa. Itse menetelmässä hyödynnetään spektroskopiaa ja signaalianalyysissa tekoälyä. Menetelmän toimivuus on osoitettu eläinkokein ja tekoälypohjainen algoritmi tunnistaa oikean kudoksen tällä hetkellä yli 90% tarkkuudella.

 

Kuva 7: Älyneulalla paksuneulanäytteen ottaminen onnistuu aiempaa luotettavammin. (Surazynski, Lavonen, Myllylä, Mäkinen, Zhao, Nieminen, Nieminen)

 

Viipalekuvauksen tulevaisuus

Perinteisessä TT-kuvauksessa mitataan röntgensäteilyn vaimenemista potilaan eri puolilta ja tämän datan perusteella lasketaan viipalekuvia. Tämä ei ole kuitenkaan kaikissa tilanteissa tehokkain tai säteilyhygieenisin menetelmä. Vaihtoehtoisia ratkaisuja on useita. Sisätomografiassa voidaan rajoittaa kuvaus ja säteilytys tietylle vartalon mielenkiintoalueelle. On mahdollista kuvata vai rajoitettu alue (rajoitetun kulman tomografia) tai vain harvoja projektioita. Kuvista kuitenkin nähdään kuinka nämä ratkaisut heikentävät kuvalaatua koska perinteiset kuvarekonstruktioalgoritmit eivät saa kaipaamaansa dataa mielenkiintoalueen ulkopuolelta.

Otetaan avuksi tekoäly. Sama data, mutta opetetaan syväoppivalle algoritmille minkälaista anatomiaa kuva-alan ulkopuolella voi olla. Tuloksena on merkittävä parannus kuvanlaatuun kuten nähdään. Vaatii toki vielä tutkimusta mille kehon alueelle tämä menetelmä parhaiten sopii ja radiologien arviointia näkyykö kudokset ja patologiset muutokset niissä riittävän hyvin.

Kuva 8: Tietokonetomografian eri geometriat ja niiden tuottamat kuvat samalle datalle. Syväoppivan menetelmän käyttö parantaa merkittävästi kuvanlaatua. (Ketola, Heino, Juntunen, Nieminen, Siltanen, Inkinen)


Pohdinta

Usein kuulee kysyttävän: mitä vaatii se, että menetelmät saadaan klinikkaan.

Lyhyt vastaus on, että kymmenen vuotta. Suunnilleen niin kauan kestää uuden lääketieteen teknologian kehittäminen tuotantokäyttöön. Tarvitaan pitkäjänteistä tutkimus- ja kehitystyötä ja rahoitusta.

Pitkä vastaus on, että vaikka teknologian toimivuus on osoitettu, täytyy menetelmää testata toisenlaisessa aineistossa, vaikkapa muunmaalaisissa potilaissa, toisilla laitteilla, toisessa käyttöympäristössä. Lääkinnällisiin laitteisiin liittyvä regulaatio on erittäin tiukkaa.

Tekoälyalgoritmien opettaminen vaatii dataa. Suomessa potilaiden kuvantamisdatan toisiokäyttöä tulkitaan tiukimmin maailmassa ja voimme hävitä kilpailun teknologiakehityskisassa, mikä voisi tuoda euroja Suomeen. Vaikka 2019 voimaan astuneen ns. toisiolain tarkoitus oli selkeyttää lupamenettelyä ja tehostaa tietojen käyttöä tutkimuksessa vaikutus on ollut usein päinvastainen. Suomessa ei ole olemassa käyttöympäristöä mikä täyttäisi samalla lain tietoturvallisuusvaatimukset ja tarjoaisi laskennalliset työkalut esim. em. laskennallisten menetelmien kehittämiseen.

Kuvantamisdatan liikuttaminen eri maiden välillä testaus- ja kehittämistarpeisiin on hyvin hankalaa mutta se ei aina ole edes välttämätöntä – datan sijaan voidaan lähettää algoritmi testattavaksi luotettavalle yhteistyökumppanille tai jopa käyttää simuloitua dataa.

Teknologian ansiosta lääketiede on kymmenen vuoden päästä taas varmasti varsin eri näköistä. On tärkeää ymmärtää, että teknologia on ystävä eikä vihollinen. Monia sovellusalueita on varmasti vielä tunnistamatta ja niitä on syytä aktiivisesti kartoittaa tarvelähtöisesti. Luottamus tekoälyyn paranee, kun kehitämme matemaattisia menetelmiä ymmärtämään sen toimintaa eikä se ole meille enää pelkkä musta laatikko. Pystymme virtaviivaistamaan kuvantamiseen liittyviä prosesseja ja yhdistämään tekoälyn käsiteltäväksi kuvantamistiedon ohella muuta potilasinformaatiota ja hyödyntämään niitä. päätöksentekojärjestelmissä.

Tulevaisuudessa voimme ulkoistaa yhä useampia tehtäviä algoritmeille ja keskittyä niihin tehtäviin, joita kone ei osaa, ainakaan vielä.

 

Blogikirjoituksen sisältö on Miika Niemisen esitelmä Medical Research Center Oulun (Oulun yliopistollinen sairaala ja Oulun yliopisto) Kliinisen tutkimuksen päivässä 21.5.2021.

perjantai 12. maaliskuuta 2021

Mammografiakuvien segmentointi

Kirjoittaja: Mustafa Al-Rubaye

 

Kuva 1. Esimerkki mammografiakuva avoimesti saatavilla olevasta CBISDDSM aineistosta [1]. 


Segmentaatio

Segmentoinnin tarkoituksena on jaotella digitaalinen kuva eri osiin eli segmentteihin. Jokainen erillinen segmentti edustaa erityyppistä rakennetta. Kuvan segmentointi on tärkeä prosessi tietokoneen digitaalisessa kuvankäsittelyssä [2]. 

Lääketieteellisessä kuvantamisessa kuvasegmentointia käytetään poimimaan kliinisesti merkityksellistä tietoa kuvista, jolloin esimerkiksi radiologit voivat hyödyntää segmentoitua kuvaa jaottelussa eri elimiin tai kudostyyppeihin [3]. Lisäksi tietokoneiden on helpompi analysoida valmiiksi segmentoituja kuvia analysoimalla vain segmentoitu alue [4, 2, 5]. Segmentoinnin tulos voidaan esittää kuvasegmentteinä, jotka peittävät kuvan mielenkiintoalueen (Kuva 3), tai ääriviivoina, jotka ovat erotettu segmentoidusta kuvasta (Kuva 2) [4]. 

Mammografiakuvasta voidaan erotella eri segmentteihin kuvattu rinta, rintalihas, ihopoimujen ja nännin alue (Kuva 2). Segmentoitavat mielenkiintoalueet riippuvat diagnostisesta tehtävästä. 

Segmentoitua rintalihasta voidaan käyttää apuna rauhaskudoksen pinta-alaa arvioidessa [6, 7], missä rintasyöpä yleensä esiintyy [8]. Rintalihaksen segmentointi ennen mammografian analysointia automaattisesti on tärkeä prosessi, sillä rintalihaksessa on tiivistä kudosta, joka voi muistuttaa rakenteeltaan rintasyövän kaltaista massaa. Siksi segmentoinnin epäonnistuminen voi aiheuttaa enemmän vääriä positiivisia löydöksiä mammografiakuvien luennoissa [9]. 

Rinnan huono asettelu voidaan tunnistaa segmentoidun nännin paikasta mammogrammeissa [10]. Lisäksi ihopoimujen aiheuttamat kuvavääristymät voivat heikentää mammografiakuvan laatua, sillä ne voivat näyttää poikkeavuuksilta, mikä voi aiheuttaa tulkintavirheitä [11, 12]. Ihopoimujen poistomenetelmää voidaan käyttää poistamaan nämä kuvavääristymät [13].

 

Syväoppiminen

Syväoppimisen (deep learning) mallit ovat viime aikoina kehittyneet valtavasti ja uusia menetelmiä on kehitetty paljon nimenomaan digitaalisten kuvien segmentointiin [14, 15, 16, 17, 18]. Tästä on hyvä esimerkki, U-Net konvoluutioneuroverkko, joka kehitettiin biolääketieteellisten kuvien segmentointiin [14]. 

U-Net arkkitehtuurissa on useita ”kerroksia” erilaisia matemaattisia operaatioita (konvoluutio-operaatioita, ReLUaktivointifunktioita ja max-pooling-operaatioita), joiden voidaan ajatella kerros kerrokselta lisäävän kuvasta saatavia mielenkiintoisia piirteitä samalla kuin kuvan spatiaalista informaatiota (käytännössä kuvan kokoa) vähennetään. 

Tämän jälkeen tulee uusi sarja erilaisia matemaattisia operaatioita (up-konvoluutioita), joiden tarkoituksena on yhdistää (skip connection) aikaisimmista kerroksista löydetyt piirteet ja palauttaa kuvan spatiaalista informaatiota (segmentoitava kuva palautuu alkuperäiseen kokoonsa). Lopputuloksena verkosta saadaan ulos segmentoitu kuva. 

Verkkoa siis opetetaan kuvapareilla (kuva 3) ja tällaista opetusdataa mallin hyvän yleistettävyyden takaamiseksi vaaditaan suuri määrä. U-Net arkkitehtuurin avulla 512x512 -kokoisen kuvan segmentointi vie alle sekunnin nykyaikaisella näytönohjaimella [14].

 

Mammogrammien segmentointi

Mammogrammien segmentointi on tärkeä esimerkiksi rinnan erottamiseksi muista rakenteista kuten rintalihaksesta [19]. 

Segmentointi voidaan tehdä syväoppivan neuroverkon avulla, kun verkko koulutetaan annotoidulla opetusdatalla eli verkolle annetaan opetusdataksi valmiiksi segmentoituja kuvia (alkuperäisiä kuvia ja valmista segmentointia edustavia maskeja, kuva 1 ja kuva 3). Syväoppivan verkon soveltaminen edellyttää kuitenkin annotoitua opetusdataa (kuvia ja maskeja, kuva 1 ja kuva 3), jotta syväoppiva neuroverkko voidaan opettaa segmentoimaan. Usean luokan (multi-class) segmentointitekniikoiden avulla voidaan segmentoida eri luokkia eli voidaan erotella useita erilaisia rakenteita kerralla [20]. 

Opetukseen vaadittavat segmentointimaskit pitää tehdä manuaalisesti ja työhön on olemassa valmiita annotaatiotyökaluja, kuten CVAT annotaatiohjelmisto [21]. CVAT annotaatio-ohjelmisto on ilmainen ja erittäin yksinkertainen merkintätyökalu, jota voidaan käyttää maskien tuottamiseen (Kuva 2). Rinta sisältää erilaisia kudosrakenteita, joten mallin kouluttamiseksi annotoidaan yleensä useita segmentoituja maskeja (kuva 3).

Kun syväoppiva neuroverkko on opetettu, voidaan mammografiakuvassa näkyvät kudosrakenteet segmentoida eri osiin automaattisesti. Lisäksi syväoppivilla menetelmillä voidaan segmentoida tarkasti taittuneet ihoalueet sekä nännit, joiden segmentointi on erittäin haastavaa perinteisiä ei-syväoppivia menetelmiä käyttäen.

 

Kuva 2. Esimerkki CVAT-annotaatiotyökalun käytöstä. Kuvassa näkyy erilaisia käsin tehtyjä maskeja. Eri värit kuvastavat eri rintakudotyypejä. Oranssi on koko kuvattu rinta, vaaleanpunainen on rauhaskudos, sininen on rintalihas, keltainen on nänni ja vihreä on ihopoimu.


Aiheeseen liittyvä työ

Lääketieteellisten kuvien segmentointia on tutkittu paljon, sillä segmentointityötä tehdään sairaalassa ja lääketieteen tutkimuksessa laajasti [22, 23, 18]. 

Rintalihakset voidaan segmentoida mammografiakuvasta käyttämällä perinteisiä (kuvan reunantunnistusta ja kynnystämistä käyttäviä menetelmiä [24]), ei-syväoppimiseen perustuvia menetelmiä. Mutta esimerkiksi rintamassojen segmentointiin on kehitetty syväoppiva automaattinen segmentointimenetelmä (hyödyntää strukturoitua tukivektorikonetta [25]). 

Mammografiakuvien segmentoinnista kiinnostuneille suosittelemme tutustumaan julkaisuun [26]. Siinä on kartoitettu syväoppivien konvoluutioneuroverkkojen tämänhetkinen soveltuvuus muun muassa mammografiakuvien segmentointiin.

 

Kuva 3. Esimerkkikuva kuvamaskeista. Oranssi on koko kuvattu rinta, vaaleanpunainen on rauhaskudos, sininen on rintalihas, keltainen on nänni ja vihreä on ihopoimu.


Lähdeluettelo:

[1] Rebecca Sawyer Lee et al. “A curated mammography data set for use in computer-aided detection and diagnosis research”. In: Scientic Data 4 (2017), pp. 1941–1953. doi: 10.1038/sdata.2017.177.

[2] Alberto Garcia-Garcia et al. A Review on Deep Learning Techniques Applied to Semantic Segmentation. 2017. arXiv: 1704.06857 [cs.CV].

[3] Neeraj Sharma and Lalit M Aggarwal. Automated medical image segmentation techniques. 2010. doi: 10.4103/0971-6203.58777.

[4] S. S. Varshney, N. Rajpal, and R. Purwar. “Comparative study of image segmentation techniques and object matching using segmentation”. In: 2009 Proceeding of International Conference on Methods and Models in Computer Science (ICM2CS). 2009, pp. 1–6. doi: 10.1109/ICM2CS.2009. 5397985.

[5] Vairaprakash Gurusamy, Subbu Kannan, and G.Nalini. “Review on Image Segmentation Techniques”. In: Oct. 2014.

[6] N Karssemeijer. “Automated classication of parenchymal patterns in mammograms”. In: Physics in medicine and biology 43.2 (Feb. 1998), pp. 365–378. issn: 0031-9155. doi: 10.1088/0031-9155/43/2/011.

[7] T Matsubara et al. “An automated classication scheme for mammograms based on amount and distribution of broglandular breast tissue density”. In: International Congress Series 1230 (2001). Computer Assisted Radiology and Surgery, pp. 545–552. issn: 0531-5131. doi: https://doi.org/ 10.1016/S0531-5131(01)00085-1.

[8] Naza Saidin et al. “Segmentation of Breast Regions in Mammogram Based on Density: A Review”. In: arXiv preprint arXiv:1209.5494 9 (Sept. 2012).

[9] Yanfeng Li et al. “Pectoral muscle segmentation in mammograms based on homogenous texture and intensity deviation”. In: Pattern Recognition 46.3 (2013), pp. 681–691. issn: 0031-3203. doi: https://doi.org/10. 1016/j.patcog.2012.09.021.

[10] Manju Bala Popli et al. “Breast Positioning during Mammography: Mistakes to be Avoided”. In: Breast cancer : basic and clinical research 8 (2014), pp. 119–124. issn: 1178-2234. doi: 10.4137/bcbcr.s17617.

[11]  Early detection of breast cancer for health professionals course. url: http: //earlydetectionofbreastcanser.weebly.com/.

[12] Albert Gubern-M´erida et al. “Breast Segmentation and Density Estimation in Breast MRI: A Fully Automatic Framework”. In: IEEE journal of biomedical and health informatics 19 (Jan. 2015), pp. 349–57. doi: 10.1109/JBHI.2014.2311163.

[13] Mohammad Razavi et al. “Towards Accurate Segmentation of Fibroglandular Tissue in Breast MRI Using Fuzzy C-Means and Skin-Folds Removal”. In: Image Analysis and Processing — ICIAP 2015. Ed. by Vittorio Murino and Enrico Puppo. Cham: Springer International Publishing, 2015, pp. 528–536.

[14] Olaf Ronneberger, Philipp Fischer, and Thomas Brox. U-Net: Convolutional Networks for Biomedical Image Segmentation. 2015. arXiv: 1505. 04597 [cs.CV].

[15] Shervin Minaee et al. Image Segmentation Using Deep Learning: A Survey. 2020. arXiv: 2001.05566 [cs.CV].

[16] Shidan Wang et al. “Pathology Image Analysis Using Segmentation Deep Learning Algorithms”. In: The American Journal of Pathology 189.9 (2019), pp. 1686–1698. issn: 0002-9440. doi: https://doi.org/10.1016/j. ajpath.2019.05.007.

[17] Moeskops Pim et al. “Deep Learning for Multi-task Medical Image Segmentation in Multiple Modalities”. In: Medical Image Computing and Computer-Assisted Intervention – MICCAI 2016. Ed. by Ourselin Sebastien et al. Cham: Springer International Publishing, 2016, pp. 478– 486.

[18] Matthew Lai. “Deep Learning for Medical Image Segmentation”. In: CoRR abs/1505.02000 (2015). url: http://arxiv.org/abs/1505.02000.

[19] A. Bosch et al. “Modeling and Classifying Breast Tissue Density in Mammograms”. In: 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06). Vol. 2. 2006, pp. 1552–1558. doi: 10.1109/CVPR.2006.188.

[20] A. A. Novikov et al. “Fully Convolutional Architectures for Multiclass Segmentation in Chest Radiographs”. In: IEEE Transactions on Medical Imaging 37.8 (2018), pp. 1865–1876. doi: 10.1109/TMI.2018.2806086.

[21] Boris Sekachev, Nikita Manovich, and Andrey Zhavoronkov. Computer Vision Annotation Tool. Oct. 2019. doi: 10.5281/zenodo.3497106.

[22] Mohammad Hesam Hesamian et al. Deep Learning Techniques for Medical Image Segmentation: Achievements and Challenges. 2019.

[23] Intisar Rizwan I Haque and Jeremiah Neubert. “Deep learning approaches to biomedical image segmentation”. In: Informatics in Medicine Unlocked 18 (2020), p. 100297. issn: 2352-9148. doi: https://doi.org/10.1016/ j.imu.2020.100297.

[24] S. M. Kwok, R. Chandrasekhar, and Y. Attikiouzel. “Automatic pectoral muscle segmentation on mammograms by straight line estimation and cli detection”. In: The Seventh Australian and New Zealand Intelligent Information Systems Conference, 2001. 2001, pp. 67–72.

[25] N. Dhungel, G. Carneiro, and A. P. Bradley. “Deep structured learning for mass segmentation from mammograms”. In: 2015 IEEE International Conference on Image Processing (ICIP). 2015, pp. 2950–2954.

[26] Dina Abdelhaz et al. “Deep convolutional neural networks for mammography: advances, challenges and applications”. In: BMC Bioinformatics 20 (2019).

maanantai 19. lokakuuta 2020

Tekoälyn oppivuodet 2: kohennamme hermoverkon fiksummaksi

Edellisessä blogitekstissäni näytin, kuinka kahdesta ”hermosolusta” koostuvat koneaivot kykenevät erottamaan kesäpäivän talvipäivästä. Tietokoneen orastava äly se siinä pilkahti, tosin huomattavan helpon pulman tapauksessa. (Kannattaa lukea tuo aikaisempi kirjoitus ennen tätä, koska alla oleva perustuu siihen.)

Tekoälyn koulutus eteni mainiosti, kunnes tuli tämä kuva:

Kuvasta näemme, että päivän keskilämpötilaan perustuva luokittelu ei toimi kevätpäivän erottamiseksi kesäpäivästä. Viileimmät heinäkuun päivät ovat näet kylmempiä kuin huhtikuun lämpimimmät. 

Annetaanpa koneelle enemmän tietoa ja mutkikkaammat aivot. Alkaako huhtikuun ja heinäkuun ero siten valjeta tietsikalle?

Arvon tietokone, tässäpä sinulle lisätietoa


Jos pelkkä lämpötila ei riitä, otetaan lisäksi huomioon vaikka ilmanpaine. Ilmatieteen laitoksen avoin data on mitatun säätiedon aarreaitta, jota voi hyödyntää helposti ja ilmaiseksi. 

Huhtikuun 8. päivänä vuonna 2019 ilmanpaine oli 1012 hehtopascalia (hPa) ja keskilämpötila 6,5 astetta. Heinäkuun ensimmäisenä päivänä 2019 ilmanpaine puolestaan oli 995 hPa ja keskilämpötila 19 astetta. Kuvassa näet nuo tiedot tason pisteinä niin, että ilmanpaine on x-koordinaatti ja keskilämpötila y-koordinaatti.


Sijoitetaan koordinaatistoon samalla tavalla kaikki vuoden 2019 huhti- ja heinäkuun säätiedot. Huomataan, että yhtä huhtikuun päivää lukuun ottamatta kaikki nuo datapisteet jakautuvat kuvaan piirtämäni suoran molemmin puolin.



Lämpötila- ja ilmanpainetietojen yhdistämisen avulla vuoden 2019 kevät ja kesä siis erottuvat toisistaan suoraviivaisella tavalla! Tästä pääsemme eteenpäin kohentamalla aikaisemmin rakentamiamme kahden hermosolun aivoja.


Päivitetään hermosolu uuteen malliin


Edellisessä blogitekstissä saimme kahden hermosolun avulla jaoteltua tammi- ja heinäkuun päivät näin:


Muokataan noita koneaivoja niin, että ensimmäinen hermosolu ottaakin syötteeksi yhden luvun (keskilämpötila) sijasta kaksi lukua (ilmanpaine ja keskilämpötila). Vaihdetaan myös hermosolujen sisältämiä lukuja vastaamaan suoraan y = 0,8*x - 800 perustuvaa luokittelua. 

Tällaisen saamme:



Neuroni 1 toimii niin, että tarkasteltavan päivän ilmanpaine kerrotaan luvulla -0,8 ja lisätään tulokseen lämpötila (ykkösellä kerrottuna, eli siis lämpötila muuttumattomana). Tuohon komeuteen lisätään vielä 800 ja lähetetään lopputulema pakkasenpoistajan läpi toiselle neuronille. Neuroni 2 on samanlainen kuin aiemmin käsittelemämme, joskin se sisältää eri luvut. 

 Miten tämä koneaivo suoriutuu kahdesta esimerkkipäivästämme?



Huhtikuun 8. päivän 2019 säätiedot tuottavat tulokseksi ykkösen, joka saa tässä hermoverkossa olla huhtikuun tunniste. Voit halutessasi tarkistaa tuon laskun tekemällä tarvittavat kolme kertolaskua, neljä yhteenlaskua ja kaksi pakkasenpoistoa. Lasku on toki jo hiukan monimutkaisempi kuin ensimmäisessä blogissa, mutta silti periaatteessa edelleen korkeintaan yläkoulun oppimäärää vaativa. 

Entäs heinäkuu?


Vastaava lasku kuin huhtikuun tapauksessa antaa tulokseksi nollan, joka on tämän hermoverkon tapa sanoa ”heinäkuu”. Muutkin päivät vuoden 2019 huhtikuussa ja heinäkuussa tulevat oivallisesti luokitelluiksi tällä miniaivolla. Ne jakavat paine-lämpötilatason kahteen osaan niin, että suoran y = 0,8*x - 800 yläpuolelle osuvat pisteet katsotaan heinäkuun päiviksi, ja viivan alle jäävät puolestaan huhtikuun päivät. Ja koko toimitus siis tapahtuu näillä laskennallisen hermosolun osaamilla laskuilla.



Tähän väliin aivopähkinä tekoälyn ystäville. Keksitkö sellaiset syötteet hermoverkollemme, että se tuottaa nollan ja ykkösen välissä olevan luvun? Esimerkiksi puolikkaan? Vastaus tekstin lopussa. 


Miten keinoaivot pärjäävät muiden vuosien säätietojen kanssa?


Saimme piskuiseen hermoverkkomme valittua sellaiset luvut, että vuoden 2019 huhti- ja heinäkuun päivät menevät oikein. Syötetään vuoden 2017 mittaukset sisään ja katsotaan, miten niiden kanssa käy.


Pieleen menee! Monia huhtikuun päiviä joutuu virheellisesti heinäkuun puolelle. Alkeellisesti itse opetettu tekoäly ei siis suoriudu kevään ja kesän tunnistushaasteesta. 

Peli kovenee. Tarvitaan tehokkaammat työkalut, ja on annettava tietokoneen itse oppia datasta. Siitä lisää blogisarjan kolmannessa osassa. 

(Vastaus aivopähkinään. On monia syötteitä, jotka antavat muun tuloksen kuin 0 tai 1. Esimerkiksi ilmanpaine 1012 hPa ja keskilämpötila 10.1°C tuottaa puolikkaan.)

keskiviikko 23. syyskuuta 2020

Tekoälyn oppivuodet: näin koulutamme hermoverkon

Kirjoittaja: Samuli Siltanen

Jos tekoäly osaa auttaa lääkäriä löytämään syövän, kai se kykenee myös erottamaan kesän talvesta? Kokeillaan!

Poimin Ilmatieteen laitoksen ilmaisesta tietopalvelusta säämittauksia. Kuvassa näkyy vuoden 2019 tammikuussa ja heinäkuussa mitatut päivien keskilämpötilat Helsingissä Kumpulan kampuksella. 


Selvästikin kaikkina tammikuun päivinä on ollut kylmempää kuin 6 astetta ja heinäkuussa puolestaan lämpimämpää kuin 8 astetta. Saisimmeko tämän helpon säännön nuijittua tekoälyn tajuntaan? Tai digitaalisemmin muotoiltuna: osaammeko rakentaa hermoverkon, joka merkitsee tammikuussa mitatut lämpötilat ykkösellä ja heinäkuussa mitatut nollalla?


Tietokone oppii matkimalla hermosolun eli neuronin toimintaa. Laskennallinen neuroni on matemaattinen viestin välittäjä, joka vastaanottaa lukuja muilta neuroneilta, muokkaa niitä pikkuisen, ja lähettää tuloksen eteenpäin. Siinä on kaksi säädettävää asiaa: kertolaskulla toimiva vahvistus ja yhteenlaskuun perustuva lisäys. Tältä näyttää esimerkkineuroni:





Mitä luvulle tapahtuu, kun se menee neuroniin sisään vasemmalta? Ensin se kerrotaan ykkösellä, eli ei tapahdu muutosta. Seuraavaksi luvusta vähennetään kuutonen. "Kielletyn lumihiutaleen" näköistä osaa kutsun pakkasen estoksi; se korvaa miinusmerkkisen luvun nollalla mutta jättää plusmerkkiset luvut ennalleen. 


Lämpötilamittauksille tapahtuu jotakin mielenkiintoista, kun ne kulkevat tuon neuronin läpi. Muistathan, että kaikki tammikuun päivät olivat kuutta astetta kylmempiä? Koska neuroni vähentää kuutosen ja sitten vaihtaa miinusmerkkiset luvut nolliksi, kaikki tammikuun mittaukset tulevat nollana ulos. 


Mutta toiveemme oli, että hermoverkko merkitsee tammikuun ykkösellä ja heinäkuun nollalla. Laadimme sitä varten koneaivot, joissa on kaksi laskennallista neuronia yhden sijasta. Ensimmäinen niistä on sama, jota käsittelimme yllä. Toisen laitamme perään:



Kakkosneuroni siis kertoo sisään tulevaa lukua miinus puolella, lisää siihen ykkösen ja muuttaa näin mahdollisesti syntyvän negatiivisen luvun nollaksi. 


Käydään nyt läpi tuplaneuronivirityksemme toiminta. 


Jos syötämme kahden neuronin systeemiimme tammikuun lämpötilan eli kuutta astetta alhaisemman, ensimmäinen neuroni tuottaa tulokseksi nollan. Kakkosneuroni puolestaan kertoo tuota nollaa miinus puolikkaalla, mikä edelleen antaa nollan, ja lisää siihen ykkösen. Niinpä lopputulos on haluttu: tammikuulle ykkönen. 


Kun koneaivoillemme syötetään heinäkuun lämpötila eli jotakin suurempaa kuin 8, ensimmäinen neuroni vähentää siitä kuutosen ja tuottaa jotakin ainakin kakkosen kokoista. Sellaista lukua kun kertoo miinus puolikkaalla, saa tulokseksi jotakin pienempää kuin -1. Toinen neuroni lisää siihen ykkösen, jolloin tulos on edelleen pakkasen puolella. Kakkosneuronin lopussa oleva lumihiutalekielto sitten vaihtaa sen nollaksi. Saavutamme siis toisenkin tavoitteemme: heinäkuulle nolla.



Yllä kuvattu numeroleikki voi vaikuttaa oudolta, mutta tällä tavalla nykyaikainen tekoäly todella toimii. Käytännössä neuroneita vain on paljon suurempi määrä kuin kaksi, mutta ne laskevat samoin kuin yksinkertainen esimerkkimme. 


Tekoälyn “oppiminen” tarkoittaa sopivien lukujen löytämistä neuroneihin. Yleensä tietokone oppii automaattisesti itse sille annetun aineiston pohjalta, mutta tässä havainnollisessa esimerkissä opetin hermoverkon itse. Siis syöttämällä siihen luvut 1, 6, -1/2 ja 1. Nuo neljä lukua tuottavat hermoverkolle sen “osaamisen”, että tammikuun lämpötilat merkitään ykkösellä ja heinäkuun nollalla. Yksinkertaisuudestaan huolimatta tämä osaaminen on sentään jotakin: hermoverkko tunnistaa oikein myös vuoden 2017 aineiston: 



Tätä ensimmäistä kahden neuronin esimerkkiämme helpotti se, että talven ja kesän säät ovat niin erilaiset. Jos vertaamme huhti- ja heinäkuun lämpötiloja, yksinkertainen lämpötilaraja ei enää toimikaan. Tarvitsemme siis mutkikkaammat tekoaivot kevään ja kesän erotteluun! Siihen perehdymme tämän kirjoitussarjan toisessa osassa.



Lopuksi aivopähkinä tekoälyn ystäville. Kahden neuronin hermoverkkomme jaottelee onnistuneesti alle kuuden ja yli kahdeksan asteen lämpötilamittaukset. Entä jos syötämme siihen 7 asteen lämpötilan? Mitä hermoverkko silloin tulostaa ulos?


torstai 30. huhtikuuta 2020

Tekoälystä apua epidemioiden hoitoon ja hallintaan?

Kirjoittaja: Helinä Heino  

Kiinasta pandemiaksi levinnyt koronavirus on aiheuttanut terveydenhuollolle päänvaivaa, tilanteeseen haetaan ratkaisua myös tekoälyä hyödyntämällä. Kuva Pixabaysta.

Tekoälystä on haettu apua terveydenhuollon ruuhkautumiseen jo ennen koronaepidemian (COVID-19, tunnetaan myös nimellä SARS-CoV-2) ilmaantumista. Tekoälymenetelmiä on aiemmin kehitetty mm. uusien lääkkeiden löytämiseen (tosin tässä esimerkissä kyseessä on antibiootti, joka ei toimi viruksia vastaan), ja vastaavasta menetelmästä toivotaan apua koronan hoitoon. Ideana on että tekoäly pyrkii löytämään turvallisia ja käyttökelpoisia yhdisteitä aiemmin hankitun datan perusteella.

Suomessa koronatilanteeseen on reagoitu usealla eri toimenpiteellä, ja ajantasaista infoa taudista kulusta löytyy THL:nsivuilta.



Korona lyhyesti

Koronavirus on vaipallinen virus, joka aiheuttaa hengitystieinfektioita. Useimmiten korona aiheuttaa vain lieviä oireita, mutta ikävemmässä tapauksessa hengenvaarallisen keuhkokuumeen ja hapettumishäiriöitä. Tämän viruksen perimä on yksijuosteisessa RNA-ketjussa. Viruksen arvellaan pääsevän kohteeseensa eli soluun hyödyntäen ihmisen hengitysteiden pintasoluissa olevia ACE2-reseptoreita, jotka säätelevät verenpainetta. Solun sisällä virus kaappaa isäntäsolun koneiston käyttöönsä ja saa sen tuottamaan RNA-perimänsä avulla uusien viruksien tarvitsemia partikkeleita. Uudet virukset siirtyvät eteenpäin, jopa suolistoon asti. Virukset vahingoittavat soluja ja saavat ihmisen puolustusjärjestelmän aktivoitumaan. 


Koronavirus on saanut nimensä viruksen pinnalla olevien kruunumaisten proteiinipiikkien mukaan. Kuva Pixabaysta.
                                                                                                                                                                          
On arvioitu, että sairastuneista noin 80 % saa vain lieviä oireita ja loput sairastavat taudin vakavampaa muotoa (vakava tai kriittinen), jossa sairaalahoito on todennäköisesti tarpeen. Osa sairastuneista tarvitsee myös tehohoitoa. Koronavirus on erityisen ongelmallinen sen takia, että se leviää tehokkaasti, ja oireettomatkin henkilöt voivat levittää virusta. Viruksen hallintaan on käytetty paljon resursseja, sillä vaarana on että terveydenhuollon kapasiteetti loppuu kesken, jos taudin annetaan levitä vapaasti. Vaikka vain pieni osuus sairastuneista saa taudin kriittisen muodon, riittäisivät nämä potilaat pahimmillaan tukkimaan terveydenhuollon palvelut. Resurssien ylikuormittuessa vaarana on, että esimerkiksi vakavan liikenneonnettomuuden uhri tai sydänkohtauksen saanut henkilö eivät saisi riittävästi apua, kun tehohoidossa ei ole enää tilaa. Lisäksi normaalitilanteessa hoidettavissa olevat eri sairauksien oireet voisivat muuttua hengenvaarallisiksi hoitoresurssien puutteen takia.



Tekoäly epidemioiden tunnistamisessa, hallinnassa ja hoidossa

Tekoälyn soveltamista koronan hoidossa, diagnostiikassa ja levinneisyyden kartoituksessa tutkitaan ahkerasti maailmalla. Keuhkojen TT-kuvia (tietokonetomografia) on tutkittu tarkoituksena löytää koronaviruksen aiheuttama keuhkokuume. Alustavasti näyttäisi siltä, että tekoäly onnistuu löytämään koronaviruksen aiheuttamat keuhkokuumetapaukset analysoimalla kuvantamisesta saatavaa dataa. 

Kanadalainen BlueDot-yritys on kehittänyt algoritmin, joka varoitti käyttäjiään koronasta jo ennen viranomaisten ilmoitusta. Algoritmin ideana on se, että se skannaa uutisartikkeleita ja keskusteluja  erilaisilta alustoilta (päivittäin 100 000 artikkelia 65:llä kielellä) sekä virallisista että epävirallisista lähteistä. Samalla algoritmi yhdistelee keräämäänsä informaatiota ja tekee siitä päätelmiä. Koronan tapauksessa yrityksen algoritmi pystyi antamaan varoituksen uudesta leviävästä taudista viikkoa aiemmin kuin WHO. Yritys hyödynsi myös lentolippudataa, josta kyettiin analysoimaan minne sairastuneet suunnistivat levittäen tautia. Viruksen leviämisen arvioinnissa tulkitaan myös informaatiota muun muassa senhetkisistä ilmasto-olosuhteista ja paikallisista lämpötiloista. BlueDotin raportit lähetettiin usean maan terveysviranomaisille ja sairaaloille. Tulevaisuudessa vastaava toimintatapa voisi helpottaa ja nopeuttaa uusiin epidemioihin reagoimista, kun tälläiseen analyysiin osattaisiin suhtautua tilanteen vaatimalla vakavuudella. 

Tekoälyn avulla on tehty alustavia tutkimuksia siitä, millaiset oireet viittaavat vakavaksi kehittyvään tautiin. Tutkijoiden yllätykseksi koronan tunnusmerkeiksi luetut oireet, kuten nesteen kertyminen keuhkoihin tai korkea kuume, eivät olleet hyödyllisiä arvioitaessa, kelle kehittyy taudin vakava muoto. Tutkimuksessa huomattiin, että merkitseviä oireita olivat hieman koholla olevat ALT-arvot (alaniinin aminotransferaasi, maksasairauksista viestivä entsyymi), kova lihassärky ja korkea hemoglobiini. Lisäksi tutkijoita kiinnostaa geneettisen datan ja koronaan sairastuvuuden välinen yhteys. Näitä edellä mainittuja tietoja hyödyntämällä toivotaan löydettävän potilaat, joiden vointiin olisi syytä kiinnittää erityistä huomiota. 

Tekoälyä voidaan hyödyntää datamassojen analysoinnissa ja lajittelussa edellä mainitun BlueDot:n algoritmin tapaan, joka onnistui dataa analysoimalla havaitsemaan uuden taudin ilmaantumisen. Kun potentiaaliset vaaralliset taudit huomataan ajoissa, voidaan leviämistä hillitseviin toimenpiteisiin ryhtyä aiemmin. Jos taudinaiheuttajan perimä voidaan selvittää lyhyellä aikataululla, päästään nopeasti tutkimaan mahdollisia toimivia lääkeaineita. 

Rokotteiden ja lääkkeiden kehittäminen on aikaa vievää, sillä käyttöön tulevan valmisteen turvallisuus on tutkittava huolellisesti. Aluksi tehdään alustavia nonkliinisiä tutkimuksia, sitten voidaan siirtyä pienehkön ihmisistä koostuvan potilasryhmän tutkimukseen ja lopuksi useamman tuhannen henkilön lääkekokeisiin. Tälla tapaa pyritään löytämään käytetyn yhdisteen haittavaikutukset ja varmistamaan sen oikeanlainen vaikuttavuus. Tekoälyllä voidaan pyrkiä nopeuttamaan sopivan lääkeaineen löytymistä. Hyvässä tapauksessa toimiva yhdiste on jo olemassa (lääkeainetta on alunperin hyödynnetty johonkin muuhun käyttötarkoitukseen) ja varmistettu turvalliseksi (ei kohtuuttomia sivuvaikutuksia), jolloin tuotetta saadaan nopeammin markkinoille, kunhan sen toimivuus koronaa vastaan saadaan osoitetuksi.  



Kiinnostavia tekoälypohjaisia sovelluksia 

Koronasta johtuen yritysten sisäiset palvelupisteet saattavat ruuhkautua, tätä varten on kehitelty ns. koronabotti, joka pystyy vastaamaan usein toistuviin kysymyksiin (esim. karanteeni, palkanmaksu) ja näin nopeuttamaan vastausten saantia.

Suomalaisen Oura-sormuksen käyttömahdollisuuksia koronan tunnistamisessa tutkitaan myös. Vaikka tämä sormus ei olekaan lääkinnällinen laite, voisi siitä kuitenkin olla hyötyä epätavallisten oireiden ilmaantuessa. Ajatuksena on, että kun sormus on mukautunut käyttäjänsä ns. normaalitilanteen dataan (baseline), saattaisi se kyetä poimimaan datasta käyttäjälle epätavanomaista aktiivisuutta (esim. epätavalliset sykkeen ja lämpötilan vaihtelut). Analysoimalla käyttäjien dataa, saattaisi algoritmi löytää säännönmukaisuuksia, jotka ovat tyypillisiä juuri koronalle.   

Tekoälystä haetaan apua seurantaa vaativiin sairauksiin. Esimerkiksi epilepsian, unihäiriöiden ja erilaisten liikehäiriöiden diagnostiikalle ja seurannalle tästä olisi suuresti apua. Kehitteillä on monenlaisia etädiagnostiikan työkaluja, joiden avulla väestö voisi tulevaisuudessa käyttää terveydenhuollon palveluita kotisohvalta käsin. Tekoälystä on haettu apua myös kotihoidon palveluihin. Epidemioiden ja muiden poikkeusolojen vallitessa tällaiset etätyökalut olisivat erittäin käytännöllisiä, sillä näitä hyödyntäen voidaan vähentää ihmisten liikkumista. Seurannassa olevat ihmiset voivat saada nopeammin ja tehokkaammin apua kun oireista (jopa vasta kehittyvistä oireista) on olemassa dataa, eikä lääkäri ole pelkästään potilaan oman kertomuksen varassa. 

Kiinassa puolestaan on kehitetty sovellus, joka pyrkii löytämään infektoituneet potilaat seuraamalla metroasemalla olevien ihmisten lämpötiloja. Ideana on, että sovellus hyödyntää infrapunamittareita ja tekoälyä, jolloin voidaan löytää henkilöt joilla on kuumetta. 

Tällä hetkellä elämme haastavia aikoja maailmalla jylläävien pandemioiden levinneisyyden vuoksi ja joudumme kohtaamaan siitä aiheutuvia ongelmia. Samaan aikaan nykyinen tilanne on niin haaste kuin mahdollisuuskin kehittää uusia sovelluksia, joilla pyritään löytämään keinoja sairauksien tunnistamiseen, hoitoon ja ehkäisyyn. Uutisia uusista ideoista julkaistaan ripeään tahtiin ja kehitteillä olevasta älykkäästä teknologiasta toivotaankin apua koronan hoitoon ja hallintaan.