AIDMEI: 2021

tiistai 9. marraskuuta 2021

Rintasyöpä ja tekoälyavusteinen rintasyövän havainnointi

Kirjoittaja: Helinä Heino
Video: Antti Isosalo

Roosa nauha -kampanja muistuttaa siitä, että rintasyöpä koskettaa monen ihmisen elämää. Kuva Pixabaysta.

Rintasyöpä on naisten yleisin syöpätyyppi, sillä vuosittain syöpään sairastuu Suomessa noin 5000 naista. Rintasyöpiä todetaan myös miehillä ja Suomessa miehiä sairastuu vuosittain kolmisenkymmentä. Maailmanlaajuisesti naisten uusien rintasyöpien esiintyvyyden arvioidaan olevan noin 2.3 miljoona tapausta.

Ikääntyminen lisää syövän esiintymisen todennäköisyyttä, joten Suomessa järjestetään 50-69-vuotiaille naisille ilmaisia seulontatutkimuksia. Rintojen omatoimiseen tarkkailuun on myös hyvä kiinnittää huomiota. Esimerkiksi muutokset rinnan alueen ulkonäössä tai rakenteessa on syytä tutkituttaa. Mammografiatutkimus on yksi tyypillinen tapa tutkia rinnan kudosta (tarvittaessa myös esim. ultraäänitutkimus ja kudosnäyte saattavat tulla kyseeseen). Mammografiassa rinnasta otetaan röntgenkuvat, jotka toimitetaan radiologin arvioitaviksi.

Röntgenkuvien tulkinta ei kuitenkaan ole helppoa tai yksiselitteistä ja väestön ikääntyminen lisää terveydenhuollon ruuhkautumista. Tästä syystä rintasyöpien havainnointiin on pyritty kehittämään automaattisia menetelmiä, jotka voisivat avittaa radiologin työtä. Havainnointia varten on pyritty kehittämään tekoälypohjaisia ratkaisuja eli algoritmeja, joiden toiminta perustuu syöpään viittaavien piirteiden automaattiseen havainnointiin mammografiakuvista. Tekoälypohjaisilla menetelmillä on saatu lupaavia tuloksia, ja myös AIDMEI-projektissa tutkitaan menetelmiä rintasyövän havainnointiin.

Rintasyövän kehittyminen

Kehon elimistö muodostuu soluista, joiden normaaliin toimintaan kuuluu solun jakautuminen, sillä kudosten elinkaareen kuuluu kudosten uusiutuminen. Normaalisti solujen jakautuminen on tarkoin säädeltyä ja elimistö kykenee eliminoimaan virheellisesti toimivat solut.

Jos solujen perintöainekseen eli DNA:n aiheutuu haitallisia muutoksia (esim. karsinogeenien aiheuttamat tai perinnöllinen alttius), saattaa solujen jakautuminen häiriintyä ja lopputuloksena olla syöpäsoluksi erilaistunut solu. Kun yksittäinen syöpäsolu pääsee jakautumaan tarpeeksi monta kertaa, muodostuu näistä uusista soluista soluryhmittymä eli kasvain tai tuumori.

Hoitamaton, pahanlaatuinen kasvain lähettää etäpesäkkeitä eli lähtee leviämään muualle kehoon. Syöpä on monimutkainen prosessi, joka parantumattomassa muodossa muuttaa lopulta ihmisen aineenvaihduntaa, aiheuttaa elintoimintojen pettämisen ja kehon luontaisen puolustusjärjestelmän romahtamisen. Syöpään menehtymiseen ei ole yksiselitteistä selitystä, sillä esimerkiksi loppuvaiheen syöpää sairastava saattaa menehtyä johonkin infektioon, kuten keuhkokuumeeseen tai elimen toiminnan pettämiseen.

Rintasyöpiä kyetään kuitenkin nykyisin hoitamaan hyvin ja esimerkiksi vuosina 2011-2013 rintasyöpään sairastuneiden naisten elossaololuku viiden vuoden sisällä Suomessa on jopa 91 prosenttia.

Yleistä rintasyövästä

Rintasyöpä tai syövät yleensäkään eivät ole yksittäinen sairaus, vaan niillä on erilaisia alatyyppejä. Alatyyppien avulla voidaan arvioida syövän hoitomahdollisuutta ja syövästä selviytymisen ennustetta.

Alatyypin määrittämiseen tarvitaan tyypillisesti tieto syöpäsolujen jakautumisen nopeudesta, HER2-kasvutekijän ilmaantumisesta ja tieto siitä, että esiintykö syöpäsoluissa estrogeeni- ja/tai progesteronireseptoreita. HER2-kasvutekijän esiintyminen syöpäkudoksessa viittaa aggressiivisempaan syöpään, jolla on suurempi uusiutumisriski. Jos syöpäsoluissa esiintyy estrogeeni- ja/tai progesteronireseptoreita, voidaan syöpää hoitaa hormonaalisilla lääkehoidoilla. Hormonaalisten lääkehoitojen etuna on, että niiden tiedetään puolittavan rintasyövän uusiutumisriskiä.

Rintasyöpä ja tekoäly

Kun puhutaan tekoälyn soveltamisesta rintasyöpään (tai muuhun sairauteen), viitataan menetelmään, jossa saatavilla olevaan kuvadataan (tai muuhun aineistoon) pyritään sovittamaan matemaattinen funktio, joka kykenee lähtökohtaisesti erottamaan syöpää sisältävät ja syövättömät tapaukset omiksi ryhmikseen. Tällöin puhutaan tekoälyn tai neuroverkon kouluttamisesta. Käytännössä tämä tarkoittaisi sitä, että koulutuksen jälkeen analysoiva ohjelma kykenee antamaan arvion rintasyövän esiintyvyydestä myös mammografiakuvalle (aineistolle), jota se ei ole aiemmin nähnyt.

Esimerkiksi alla olevassa videossa demonstroidaan tilannetta, jossa tekoäly merkitsee mammografiakuvaan alueen, joka vaikuttaa sen algoritmin pohjalta epäilyttävältä. Tulevaisuudessa radiologi voisi hyödyntää tällaista alustavaa analyysiä diagnoosin teossaan.

Video. Mammografiakuvaan on merkitty epäilyttävä alue punaisen maskin avulla.

Jos aiheen teoreettisempi puoli kiinnostaa, voi tähän tutustua vielä tarkemmin Eeva Nevanrannan kandityössä.

maanantai 23. elokuuta 2021

Tekoälylle dataa

Kirjoittajat:

Antti Isosalo

Satu Inkinen

Jarmo Reponen

Miika Nieminen

Olemme Oulun yliopistossa keränneet yhteistyössä Oulun yliopistollisen sairaalan kanssa laajan, noin 50 000 mammografiakuva-aineiston, ja se on keräilyn yhteydessä pseudonymisoitu tutkimuskäyttöä varten. Aineiston avulla on tarkoituksena kehittää tekoälyperustaista rintasyövän havainnointia mammografiakuvista ja prosessia, jolla tulevissa yliopiston ja sairaalan rajapinnassa tapahtuvissa tekoälyhankkeissa päästään suoraviivaisesti potilasdatasta analyysivaiheeseen. Tässä artikkelissa käymme lyhyesti läpi aineistonkeruun vaiheita ja annamme muutamia esimerkkejä huomioonotettavista asioista.

Aineiston keruu ja sen eri vaiheet

Terveydenhuollon ammattilaisten ja hoitohenkilökunnan suorittamalla aineiston keruulla tarkoitetaan jatkuva-aikaista systemaattista terveydentilaa ja tutkimustuloksia koskevan aineiston keruuta, analysointia ja tulkintaa. Näitä tuloksia käytetään terveydenhuollon suunnittelun, toteutuksen ja arvioinnin apuna.

Tutkimusaineisto voidaan jakaa keräysmenetelmän mukaan havaintoaineistoon, kokeelliseen aineistoon, simuloituun aineistoon ja johdettuun aineistoon.

Havaintoaineisto on tyypillisesti jonkin mittalaitteen avulla kerättyä aineistoa, kuten Holter-mittaukset tai esimerkiksi kuva-aineistoa, kuten röntgenmenetelmällä kuvatut mammografiakuvat. Myös rekistereihin kerätyt potilastiedot voidaan lukea havaintoaineistoksi.

Kokeellinen aineisto syntyy, kun tutkija säätää esimerkiksi magneettikuvantamislaitteen tai sekvenssin parametrejä ja pyrkii selvittämään syy-seuraus-suhteita esimerkiksi kuvantamismenetelmän parantamiseksi.

Simuloidulla aineistolla puolestaan pyritään mallintamaan reaalimaailman ilmiötä tiettyjen reunaehtojen ja lähtötietojen perusteella. Simuloinnissa tärkeää on hyvä malli. Useimmille meistä tuttu esimerkki reaalimaailman ilmiötä simuloivasta mallista ovat sääennusteet, joita tarkennetaan säähavaintojen avulla saatavien lähtötietojen, kuten lämpötilan, ilmanpaineen ja mm. ilmankosteuden avulla. Mammografiatutkimusten kontekstissa laajaan aineistoon perustuva malli voisi ennustaa esimerkiksi tulevaa hoidon tarvetta tai rintasyövän puhkeamista.

Johdetulla aineistolla tarkoitetaan useammista lähteistä saatujen tietojen avulla saatua aineistoa. Johdettu aineistolla voidaan tarkoittaa esimerkiksi potilastietojen ja erilaisista tutkimuksista saatujen tietojen avulla tuotettuja annotointeja. Johdettu aineisto voi olla myös jonkin muunnoksen kautta saatua uutta aineistoa, jonka avulla lääketieteellisessä sovelluksessa pyritään saamaan aikaan esimerkiksi tarkempi diagnoosi tai ennustamaan terveydentilan kehitystä. Toisiokäyttölaki mahdollistaa rekistereihin kertyneiden potilastietojen käytön tutkimustyön tekemiseen.

Tekoäly ja opetusaineisto

Kuten ihmisenkin oppimisessa, hyvä aineisto on keskeisessä osassa tekoälyn opettamisessa. Tekoälyn osalta aineiston merkitys on ehkä vielä keskeisempi, koska tekoälyn kyky päätellä ja pidättäytyä päätöksistä ei ole vielä ihmisen tasolla. Opetusaineistosta merkittävästi poikkeavat näytteet ovat mm. suurempi ongelma tekoälylle kuin mitä ne ovat ihmiselle. Se missä automaattiset menetelmät ovat kuitenkin ihmistä parempia on laajojen aineistojen käsittely.

Ennen kuin tekoälyä päästään opettamaan tarvitaan monia eri työvaiheita aineiston keruusta, tallennukseen, louhimiseen ja eri tietolähteiden yhdistämiseen sekä nimeämiseen eli annotoimiseen. Potilasaineistoja käytettäessä yhtenä työvaiheena on myös tietojen de-identifiointi.

Oikeanlainen aineisto tärkeää

Keskeisessä osassa tekoälyä sovelluksissa on oikeanlainen aineisto. Aineiston täytyy lisäksi olla jäsennettynä oikeaan muotoon ja sitä täytyy olla riittävä määrä. Riittävä määrä vaihtelee sovelluksen mukaan, sadoista miljooniin esimerkkeihin.

Aineiston esikäsittely on usein merkittävä ponnistus. Monia aineistoja ei ole aiottu tekoälykäyttöön ja niinpä ne eivät ole välttämättä sopivassa muodossa. Useammasta lähteestä tuleva aineisto on lisäksi siirrettävä jatkokäyttöä varten yleiseen esitysmuotoon (engl. common representational format).

Aineisto saattaa sisältää myös erilaista vaihtelua. Aineistoa on voitu esimerkiksi mitata/kuvata eri valmistajien laitteilla ja näillä valmistajilla on saattanut olla oma standardinsa, jota he ovat seuranneet esimerkiksi ohjelmistototeutuksessaan.

Aineistosta voi olla tarpeen myös suodattaa pois ne näytteet, joita ei jostain syystä haluta tutkia, muu kuin haluttu kuvantamismenetelmä ja korruptoituneet kuvat, joita niitäkin luonnollisesti on.

Aineiston hallintaan ja erityisesti aineiston tehokkaaseen ja toisaalta virheettömään tulkintaan soveltuvaa teknologian määrittely on käynnissä niin menetelmiin keskittyvän perustutkimuksen kuin esimerkiksi toimintaa ohjaavan lainsäädännön osalta. Aineiston keruu on oman aktiivisen tutkimuksensa kohteena.

Lopuksi

Useista tekoälyn sovelluksista ja erityisesti syväoppimismenetelmien viime vuosina mahdollistamista kehitysaskeleista huolimatta asenteet tekoälyn käyttöä kohtaan ovat pysyneet varauksellisina. Uskomme, että tekoälypohjaiselle kuva-analyysille on lähitulevaisuudessa olemassa tärkeä rooli tuottavuuden ja diagnostisen hoitopolun tehokkuuden kehittämisessä. Tehokkuuden kehittäminen puolestaan auttaa lievittämään elintärkeisiin toimintoihimme kohdistuvia maailmantalouden vaikutuksia, jolloin terveydenhuoltomme korkeasta laatutasosta ei tarvitse joustaa.

Kirjoittajat ovat AIDMEI-projektin projektiryhmän jäseniä. Projektissa tutkitaan kahta kiinnostavaa käyttötapausta alaselkäkivun havainnointia magneettikuvista ja rintasyövän tunnistamista mammografiakuvista. Projektirahoitus on Teknologiateollisuuden 100-vuotissäätiön ja Jane ja Aatos Erkon säätiön tulevaisuuden tekijät rahastosta. Tutkimusyhteistyössä tärkeinä yhteistyökumppaneina ovat Helsingin yliopisto ja Oulun yliopistollinen sairaala.

maanantai 24. toukokuuta 2021

Kuvantamisen arvoketjua muovaavat uudet teknologiat

Miika Nieminen

professori, ylifyysikko

Oulun yliopisto ja Oulun yliopistollinen sairaala

Tietokoneiden ja erityisesti näytönohjaimien laskentatehon kehittymisen myötä viime vuodet ovat olleet erittäin mielenkiintoisia teknologian ja tekoälyn vuosia. Myös lääketieteen teknologian tutkimuskentässä on eletty mielenkiintoisia vuosia.

Uutiskynnyksen ovat ylittäneet mm. monet tutkimukset, joissa tekoäly on yltänyt tunnistustehtävässä ihmisen tasolle tai jopa päihittänyt hänet (Kuva 1).

On myös maalailtu uhkakuvia: ketä syyttää tietokoneen tekemästä virheestä? Valmistuvat lääkärit ovat pohtineet kannattaanko radiologiaan erikoistua, jos tietokone vie työpaikat.

Kuva 1: Tekoälytutkimus on saanut viime vuosina merkittävää mediahuomiota.

Kuvantamisen arvoketju (kuva 2) koostuu kuvan tuottamisesta, kuvien analysoinnista ja tulkinnasta, lausunnon kirjoittamisesta ja potilaan hoitoon vaikuttavasta päätöksenteosta.

Seuraavassa esittelen lyhyesti käyttötapauksia omasta tutkimuksestamme, joissa tätä arvoketjua, erityisesti sen alkupäätä, voidaan parantaa, jotta kuvantamiseen liittyvä diagnostiikka olisi laadukkaampaa ja nopeampaa, ja säteilyannos pienempää.

Kuva 2: Kuvantamisen arvoketju

Tekoälystä seulojan kumppani?

Diagnostisessa kuvantamisessa tekoälyä voidaan hyödyntää mm. luokittelu-, segmentointi-, rekisteröinti- ja lokalisointitehtävissä.

Suomessa 30% diagnosoiduista syövistä ovat rintasyöpiä, ja rintasyöpään liittyviä seulontatutkimuksia tehdään meillä 300000 kpl vuodessa. Lainsäädäntö edellyttää kahden radiologin tekemää arviointia, ns. kaksoisluentaa. Radiologiresurssi ei vaan tahdo tähän aina riittää.

Yhdessä hankkeistamme optimoimme rintasyöpäseulonnan työvirtaa kehittämällä koneoppimismenetelmiä tunnistamaan ns. helpot tapaukset, jolloin lääkärille jäisi enemmän aikaa hankalien tapausten tarkasteluun (kuva 3). Käytämme tutkimuksessa Oulussa keräämäämme n. 50000 potilaan aineistoa, jolle radiologimme ovat tehneet ison urakan tunnistamalla ja rajaamalla syövät mammografiakuvista. Haastamme nykyistä arvoketjua hypoteesillä asetelmasta jossa, toisen radiologeista voisi korvata tekoälyllä. Tekoälyn mukaanotto seulontaan tulee toki edellyttämään lainsäädännöllistä muutosta.

Kuva 3: Haastamme nykyistä mammografiatutkimusten seulontakäytäntöä ottamalla tekoäly toisen radiologin tilalle. Kuvassa oikealla tekoälyn tuottamat piirrekartat, joiden perusteella poikkeavat kudosmuutokset voidaan tunnistaa. (Isosalo, Inkinen, Ipatti, Turunen, Prostredná, Reponen, Nieminen)

Keskustelu tekoälyn paikasta laajemminkin eri arvoketjuissa käy vilkkaana; mikä on optimaalisin tapa integroida tekoäly terveydenhuoltojärjestelmään, annetaanko sille orjan, rengin vai jopa isännän rooli.

Missä kipu on?

Alaselkäkipu on hyvin yleinen oire ja johtava liikuntakykyä rajoittava vaiva kautta maailman. Poikkeavia löydöksiä nähdään selän magneettikuvissa usein ja ne eivät välttämättä liity aina kipuun. Oulussa olemme tehneet tutkimusta Pohjois-Suomen v. 1966 syntymäkohortin selän magneettikuva-aineistolla, joissa meillä on tiedossa potilaiden kiputieto. Kiputiedolla ja kuvilla olemme kouluttaneet koneoppimisjärjestelmää etsimään ja osoittamaan ne kudosalueet, joilla kipua potevien magneettikuvat eroavat kivuttomien kuvista (kuva 4). Tällä hetkellä syväoppiva menetelmämme pystyy erottelemaan kipua potevat vapaaehtoiset kivuttomista 80%:n tarkkuudella.

Kuva 4: Kuvan mukaisilla ”lämpökartoilla” (engl. heatmap) voidaan graafisesti havainnollistaa ne kudosalueet, jotka tekoäly tunnistaa poikkeaviksi, kipuun liittyviksi kudosalueiksi. (Al-Rubaye, Ketola, Inkinen, Karppinen, Nieminen)

Miehittämätön röntgenkuvaus

Perinteinen röntgenkuvaus on hyvin työvoimaintensiivistä, laitteet kalliita ja useimmiten laitteet kiinteästi asennettuja. Saavutettavuus röntgentutkimukseen esim. pohjoisessa Suomessa puhumattakaan muualla maailmassa voi olla hyvinkin huono. Tutkimusyksikössämme olemme kehittäneet jalkautuvan sairaanhoidon kysyntään vastaava röntgenkuvauslaite raajojen röntgenkuvaukseen (kuva 5).

Missiona on tuoda kuvantamispalvelu lähelle potilasta jopa ilman fyysistä kuvaushenkilöstöä. Älykäs laite opastaa potilasta interaktiivisesti raajan asettelussa ja ottaa sen jälkeen kuvan automaattisesti. Näin voidaan pienentää kuvantamisen kustannuksia ja tuoda kuvantaminen lähemmäksi potilasta.

Laitteen prototyyppi on valmis, meillä on mm. STUKn ja FIMEAn luvat aloittaa testaaminen oikeilla potilailla pian.

Kuva 5: Visio miehittämättömän röntgenkuvauslaitteen ulkoasusta. (Liimatainen, Hanni, Tervonen, Nieminen)

Magneettikuvausta nopeammin

Magneettikuvaus perustuu vesi- ja rasvamolekyylien vety-ytimien lähettämään signaaliin. Tyypillinen magneettikuvaustutkimus kestää n. 20 minuuttia ja se koostuu useista kuvasarjoista, joissa jokaisessa on kymmeniä kuvia erilaisella kuvakontrastilla. Yhdessä New Yorkin yliopiston kanssa olemme kehittäneet ja testanneet uutta magneettikuvausmenetelmää (kuva 6), ns. sormenjälkimagneettikuvausta (engl. magnetic resonance fingerprinting), minkä avulla voidaan yhdellä n. 5min kestävällä kuvauksella määrittää kuvauskohteen kudosten magneettiset ominaisuudet, ns. relaksaatioajat, jotka ovat vastuussa alkuperäisten kliinisten kuvasarjojen kontrastista. Relaksaatiokarttojen avulla on mahdollista tarkastella tiettyjä kudosmuutoksia tarkemmin ja kvantitatiivisesti. Kvantitatiivisten karttojen perusteella voidaan laskea em. kliiniset kuvasarjat ja näin toteuttaa kuvaus nykyistä huomattavasti lyhyemmässä ajassa. Teemme tutkimusta näiden synteettisten kuvien soveltuvuudesta radiologien käyttöön.

Kuva 6: Perinteinen polvinivelen magneettikuvasarja (A), Magnetic resonance fingerprinting -tekniikalla määritetyt relaksaatioaikakartat (B) ja näiden perusteella laskettu kliiniseen käyttöön soveltuva kuva (C). (Casula, Nissi, Nykänen, Nevalainen, Cloos, Lattanzi, Nieminen)

Paksuneulanäytteitä älyllä

Maailmassa diagnosoidaan vuosittain 18 miljoonaa syöpätapausta. Tyypillisesti syöpä diagnosoidaan neulanäytteestä. Tutkimuksesta riippuen jopa 30% neulanäytteistä epäonnistuu neulan puutteellisen kohdistuksen vuoksi. Olemme kehittäneet älyneulan auttamaan paksuneulanäytteen otossa (kuva 7). Uusi menetelmä auttaa radiologia ottamaan näytteen onnistuneesti kertomalla onko neula kohdekudoksessa. Itse menetelmässä hyödynnetään spektroskopiaa ja signaalianalyysissa tekoälyä. Menetelmän toimivuus on osoitettu eläinkokein ja tekoälypohjainen algoritmi tunnistaa oikean kudoksen tällä hetkellä yli 90% tarkkuudella.

Kuva 7: Älyneulalla paksuneulanäytteen ottaminen onnistuu aiempaa luotettavammin. (Surazynski, Lavonen, Myllylä, Mäkinen, Zhao, Nieminen, Nieminen)

Viipalekuvauksen tulevaisuus

Perinteisessä TT-kuvauksessa mitataan röntgensäteilyn vaimenemista potilaan eri puolilta ja tämän datan perusteella lasketaan viipalekuvia. Tämä ei ole kuitenkaan kaikissa tilanteissa tehokkain tai säteilyhygieenisin menetelmä. Vaihtoehtoisia ratkaisuja on useita. Sisätomografiassa voidaan rajoittaa kuvaus ja säteilytys tietylle vartalon mielenkiintoalueelle. On mahdollista kuvata vai rajoitettu alue (rajoitetun kulman tomografia) tai vain harvoja projektioita. Kuvista kuitenkin nähdään kuinka nämä ratkaisut heikentävät kuvalaatua koska perinteiset kuvarekonstruktioalgoritmit eivät saa kaipaamaansa dataa mielenkiintoalueen ulkopuolelta.

Otetaan avuksi tekoäly. Sama data, mutta opetetaan syväoppivalle algoritmille minkälaista anatomiaa kuva-alan ulkopuolella voi olla. Tuloksena on merkittävä parannus kuvanlaatuun kuten nähdään. Vaatii toki vielä tutkimusta mille kehon alueelle tämä menetelmä parhaiten sopii ja radiologien arviointia näkyykö kudokset ja patologiset muutokset niissä riittävän hyvin.

Kuva 8: Tietokonetomografian eri geometriat ja niiden tuottamat kuvat samalle datalle. Syväoppivan menetelmän käyttö parantaa merkittävästi kuvanlaatua. (Ketola, Heino, Juntunen, Nieminen, Siltanen, Inkinen)

Pohdinta

Usein kuulee kysyttävän: mitä vaatii se, että menetelmät saadaan klinikkaan.

Lyhyt vastaus on, että kymmenen vuotta. Suunnilleen niin kauan kestää uuden lääketieteen teknologian kehittäminen tuotantokäyttöön. Tarvitaan pitkäjänteistä tutkimus- ja kehitystyötä ja rahoitusta.

Pitkä vastaus on, että vaikka teknologian toimivuus on osoitettu, täytyy menetelmää testata toisenlaisessa aineistossa, vaikkapa muunmaalaisissa potilaissa, toisilla laitteilla, toisessa käyttöympäristössä. Lääkinnällisiin laitteisiin liittyvä regulaatio on erittäin tiukkaa.

Tekoälyalgoritmien opettaminen vaatii dataa. Suomessa potilaiden kuvantamisdatan toisiokäyttöä tulkitaan tiukimmin maailmassa ja voimme hävitä kilpailun teknologiakehityskisassa, mikä voisi tuoda euroja Suomeen. Vaikka 2019 voimaan astuneen ns. toisiolain tarkoitus oli selkeyttää lupamenettelyä ja tehostaa tietojen käyttöä tutkimuksessa vaikutus on ollut usein päinvastainen. Suomessa ei ole olemassa käyttöympäristöä mikä täyttäisi samalla lain tietoturvallisuusvaatimukset ja tarjoaisi laskennalliset työkalut esim. em. laskennallisten menetelmien kehittämiseen.

Kuvantamisdatan liikuttaminen eri maiden välillä testaus- ja kehittämistarpeisiin on hyvin hankalaa mutta se ei aina ole edes välttämätöntä – datan sijaan voidaan lähettää algoritmi testattavaksi luotettavalle yhteistyökumppanille tai jopa käyttää simuloitua dataa.

Teknologian ansiosta lääketiede on kymmenen vuoden päästä taas varmasti varsin eri näköistä. On tärkeää ymmärtää, että teknologia on ystävä eikä vihollinen. Monia sovellusalueita on varmasti vielä tunnistamatta ja niitä on syytä aktiivisesti kartoittaa tarvelähtöisesti. Luottamus tekoälyyn paranee, kun kehitämme matemaattisia menetelmiä ymmärtämään sen toimintaa eikä se ole meille enää pelkkä musta laatikko. Pystymme virtaviivaistamaan kuvantamiseen liittyviä prosesseja ja yhdistämään tekoälyn käsiteltäväksi kuvantamistiedon ohella muuta potilasinformaatiota ja hyödyntämään niitä. päätöksentekojärjestelmissä.

Tulevaisuudessa voimme ulkoistaa yhä useampia tehtäviä algoritmeille ja keskittyä niihin tehtäviin, joita kone ei osaa, ainakaan vielä.

Blogikirjoituksen sisältö on Miika Niemisen esitelmä Medical Research Center Oulun (Oulun yliopistollinen sairaala ja Oulun yliopisto) Kliinisen tutkimuksen päivässä 21.5.2021.

perjantai 12. maaliskuuta 2021

Mammografiakuvien segmentointi

Kirjoittaja: Mustafa Al-Rubaye

Kuva 1. Esimerkki mammografiakuva avoimesti saatavilla olevasta CBISDDSM aineistosta [1].

Segmentaatio

Segmentoinnin tarkoituksena on jaotella digitaalinen kuva eri osiin eli segmentteihin. Jokainen erillinen segmentti edustaa erityyppistä rakennetta. Kuvan segmentointi on tärkeä prosessi tietokoneen digitaalisessa kuvankäsittelyssä [2].

Lääketieteellisessä kuvantamisessa kuvasegmentointia käytetään poimimaan kliinisesti merkityksellistä tietoa kuvista, jolloin esimerkiksi radiologit voivat hyödyntää segmentoitua kuvaa jaottelussa eri elimiin tai kudostyyppeihin [3]. Lisäksi tietokoneiden on helpompi analysoida valmiiksi segmentoituja kuvia analysoimalla vain segmentoitu alue [4, 2, 5]. Segmentoinnin tulos voidaan esittää kuvasegmentteinä, jotka peittävät kuvan mielenkiintoalueen (Kuva 3), tai ääriviivoina, jotka ovat erotettu segmentoidusta kuvasta (Kuva 2) [4].

Mammograﬁakuvasta voidaan erotella eri segmentteihin kuvattu rinta, rintalihas, ihopoimujen ja nännin alue (Kuva 2). Segmentoitavat mielenkiintoalueet riippuvat diagnostisesta tehtävästä.

Segmentoitua rintalihasta voidaan käyttää apuna rauhaskudoksen pinta-alaa arvioidessa [6, 7], missä rintasyöpä yleensä esiintyy [8]. Rintalihaksen segmentointi ennen mammografian analysointia automaattisesti on tärkeä prosessi, sillä rintalihaksessa on tiivistä kudosta, joka voi muistuttaa rakenteeltaan rintasyövän kaltaista massaa. Siksi segmentoinnin epäonnistuminen voi aiheuttaa enemmän vääriä positiivisia löydöksiä mammografiakuvien luennoissa [9].

Rinnan huono asettelu voidaan tunnistaa segmentoidun nännin paikasta mammogrammeissa [10]. Lisäksi ihopoimujen aiheuttamat kuvavääristymät voivat heikentää mammografiakuvan laatua, sillä ne voivat näyttää poikkeavuuksilta, mikä voi aiheuttaa tulkintavirheitä [11, 12]. Ihopoimujen poistomenetelmää voidaan käyttää poistamaan nämä kuvavääristymät [13].

Syväoppiminen

Syväoppimisen (deep learning) mallit ovat viime aikoina kehittyneet valtavasti ja uusia menetelmiä on kehitetty paljon nimenomaan digitaalisten kuvien segmentointiin [14, 15, 16, 17, 18]. Tästä on hyvä esimerkki, U-Net konvoluutioneuroverkko, joka kehitettiin biolääketieteellisten kuvien segmentointiin [14].

U-Net arkkitehtuurissa on useita ”kerroksia” erilaisia matemaattisia operaatioita (konvoluutio-operaatioita, ReLUaktivointifunktioita ja max-pooling-operaatioita), joiden voidaan ajatella kerros kerrokselta lisäävän kuvasta saatavia mielenkiintoisia piirteitä samalla kuin kuvan spatiaalista informaatiota (käytännössä kuvan kokoa) vähennetään.

Tämän jälkeen tulee uusi sarja erilaisia matemaattisia operaatioita (up-konvoluutioita), joiden tarkoituksena on yhdistää (skip connection) aikaisimmista kerroksista löydetyt piirteet ja palauttaa kuvan spatiaalista informaatiota (segmentoitava kuva palautuu alkuperäiseen kokoonsa). Lopputuloksena verkosta saadaan ulos segmentoitu kuva.

Verkkoa siis opetetaan kuvapareilla (kuva 3) ja tällaista opetusdataa mallin hyvän yleistettävyyden takaamiseksi vaaditaan suuri määrä. U-Net arkkitehtuurin avulla 512x512 -kokoisen kuvan segmentointi vie alle sekunnin nykyaikaisella näytönohjaimella [14].

Mammogrammien segmentointi

Mammogrammien segmentointi on tärkeä esimerkiksi rinnan erottamiseksi muista rakenteista kuten rintalihaksesta [19].

Segmentointi voidaan tehdä syväoppivan neuroverkon avulla, kun verkko koulutetaan annotoidulla opetusdatalla eli verkolle annetaan opetusdataksi valmiiksi segmentoituja kuvia (alkuperäisiä kuvia ja valmista segmentointia edustavia maskeja, kuva 1 ja kuva 3). Syväoppivan verkon soveltaminen edellyttää kuitenkin annotoitua opetusdataa (kuvia ja maskeja, kuva 1 ja kuva 3), jotta syväoppiva neuroverkko voidaan opettaa segmentoimaan. Usean luokan (multi-class) segmentointitekniikoiden avulla voidaan segmentoida eri luokkia eli voidaan erotella useita erilaisia rakenteita kerralla [20].

Opetukseen vaadittavat segmentointimaskit pitää tehdä manuaalisesti ja työhön on olemassa valmiita annotaatiotyökaluja, kuten CVAT annotaatiohjelmisto [21]. CVAT annotaatio-ohjelmisto on ilmainen ja erittäin yksinkertainen merkintätyökalu, jota voidaan käyttää maskien tuottamiseen (Kuva 2). Rinta sisältää erilaisia kudosrakenteita, joten mallin kouluttamiseksi annotoidaan yleensä useita segmentoituja maskeja (kuva 3).

Kun syväoppiva neuroverkko on opetettu, voidaan mammografiakuvassa näkyvät kudosrakenteet segmentoida eri osiin automaattisesti. Lisäksi syväoppivilla menetelmillä voidaan segmentoida tarkasti taittuneet ihoalueet sekä nännit, joiden segmentointi on erittäin haastavaa perinteisiä ei-syväoppivia menetelmiä käyttäen.

Kuva 2. Esimerkki CVAT-annotaatiotyökalun käytöstä. Kuvassa näkyy erilaisia käsin tehtyjä maskeja. Eri värit kuvastavat eri rintakudotyypejä. Oranssi on koko kuvattu rinta, vaaleanpunainen on rauhaskudos, sininen on rintalihas, keltainen on nänni ja vihreä on ihopoimu.

Aiheeseen liittyvä työ

Lääketieteellisten kuvien segmentointia on tutkittu paljon, sillä segmentointityötä tehdään sairaalassa ja lääketieteen tutkimuksessa laajasti [22, 23, 18].

Rintalihakset voidaan segmentoida mammograﬁakuvasta käyttämällä perinteisiä (kuvan reunantunnistusta ja kynnystämistä käyttäviä menetelmiä [24]), ei-syväoppimiseen perustuvia menetelmiä. Mutta esimerkiksi rintamassojen segmentointiin on kehitetty syväoppiva automaattinen segmentointimenetelmä (hyödyntää strukturoitua tukivektorikonetta [25]).

Mammografiakuvien segmentoinnista kiinnostuneille suosittelemme tutustumaan julkaisuun [26]. Siinä on kartoitettu syväoppivien konvoluutioneuroverkkojen tämänhetkinen soveltuvuus muun muassa mammograﬁakuvien segmentointiin.

Kuva 3. Esimerkkikuva kuvamaskeista. Oranssi on koko kuvattu rinta, vaaleanpunainen on rauhaskudos, sininen on rintalihas, keltainen on nänni ja vihreä on ihopoimu.

Lähdeluettelo:

[1] Rebecca Sawyer Lee et al. “A curated mammography data set for use in computer-aided detection and diagnosis research”. In: Scientiﬁc Data 4 (2017), pp. 1941–1953. doi: 10.1038/sdata.2017.177.

[2] Alberto Garcia-Garcia et al. A Review on Deep Learning Techniques Applied to Semantic Segmentation. 2017. arXiv: 1704.06857 [cs.CV].

[3] Neeraj Sharma and Lalit M Aggarwal. Automated medical image segmentation techniques. 2010. doi: 10.4103/0971-6203.58777.

[4] S. S. Varshney, N. Rajpal, and R. Purwar. “Comparative study of image segmentation techniques and object matching using segmentation”. In: 2009 Proceeding of International Conference on Methods and Models in Computer Science (ICM2CS). 2009, pp. 1–6. doi: 10.1109/ICM2CS.2009. 5397985.

[5] Vairaprakash Gurusamy, Subbu Kannan, and G.Nalini. “Review on Image Segmentation Techniques”. In: Oct. 2014.

[6] N Karssemeijer. “Automated classiﬁcation of parenchymal patterns in mammograms”. In: Physics in medicine and biology 43.2 (Feb. 1998), pp. 365–378. issn: 0031-9155. doi: 10.1088/0031-9155/43/2/011.

[7] T Matsubara et al. “An automated classiﬁcation scheme for mammograms based on amount and distribution of ﬁbroglandular breast tissue density”. In: International Congress Series 1230 (2001). Computer Assisted Radiology and Surgery, pp. 545–552. issn: 0531-5131. doi: https://doi.org/ 10.1016/S0531-5131(01)00085-1.

[8] Naﬁza Saidin et al. “Segmentation of Breast Regions in Mammogram Based on Density: A Review”. In: arXiv preprint arXiv:1209.5494 9 (Sept. 2012).

[9] Yanfeng Li et al. “Pectoral muscle segmentation in mammograms based on homogenous texture and intensity deviation”. In: Pattern Recognition 46.3 (2013), pp. 681–691. issn: 0031-3203. doi: https://doi.org/10. 1016/j.patcog.2012.09.021.

[10] Manju Bala Popli et al. “Breast Positioning during Mammography: Mistakes to be Avoided”. In: Breast cancer : basic and clinical research 8 (2014), pp. 119–124. issn: 1178-2234. doi: 10.4137/bcbcr.s17617.

[11] Early detection of breast cancer for health professionals course. url: http: //earlydetectionofbreastcanser.weebly.com/.

[12] Albert Gubern-M´erida et al. “Breast Segmentation and Density Estimation in Breast MRI: A Fully Automatic Framework”. In: IEEE journal of biomedical and health informatics 19 (Jan. 2015), pp. 349–57. doi: 10.1109/JBHI.2014.2311163.

[13] Mohammad Razavi et al. “Towards Accurate Segmentation of Fibroglandular Tissue in Breast MRI Using Fuzzy C-Means and Skin-Folds Removal”. In: Image Analysis and Processing — ICIAP 2015. Ed. by Vittorio Murino and Enrico Puppo. Cham: Springer International Publishing, 2015, pp. 528–536.

[14] Olaf Ronneberger, Philipp Fischer, and Thomas Brox. U-Net: Convolutional Networks for Biomedical Image Segmentation. 2015. arXiv: 1505. 04597 [cs.CV].

[15] Shervin Minaee et al. Image Segmentation Using Deep Learning: A Survey. 2020. arXiv: 2001.05566 [cs.CV].

[16] Shidan Wang et al. “Pathology Image Analysis Using Segmentation Deep Learning Algorithms”. In: The American Journal of Pathology 189.9 (2019), pp. 1686–1698. issn: 0002-9440. doi: https://doi.org/10.1016/j. ajpath.2019.05.007.

[17] Moeskops Pim et al. “Deep Learning for Multi-task Medical Image Segmentation in Multiple Modalities”. In: Medical Image Computing and Computer-Assisted Intervention – MICCAI 2016. Ed. by Ourselin Sebastien et al. Cham: Springer International Publishing, 2016, pp. 478– 486.

[18] Matthew Lai. “Deep Learning for Medical Image Segmentation”. In: CoRR abs/1505.02000 (2015). url: http://arxiv.org/abs/1505.02000.

[19] A. Bosch et al. “Modeling and Classifying Breast Tissue Density in Mammograms”. In: 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06). Vol. 2. 2006, pp. 1552–1558. doi: 10.1109/CVPR.2006.188.

[20] A. A. Novikov et al. “Fully Convolutional Architectures for Multiclass Segmentation in Chest Radiographs”. In: IEEE Transactions on Medical Imaging 37.8 (2018), pp. 1865–1876. doi: 10.1109/TMI.2018.2806086.

[21] Boris Sekachev, Nikita Manovich, and Andrey Zhavoronkov. Computer Vision Annotation Tool. Oct. 2019. doi: 10.5281/zenodo.3497106.

[22] Mohammad Hesam Hesamian et al. Deep Learning Techniques for Medical Image Segmentation: Achievements and Challenges. 2019.

[23] Intisar Rizwan I Haque and Jeremiah Neubert. “Deep learning approaches to biomedical image segmentation”. In: Informatics in Medicine Unlocked 18 (2020), p. 100297. issn: 2352-9148. doi: https://doi.org/10.1016/ j.imu.2020.100297.

[24] S. M. Kwok, R. Chandrasekhar, and Y. Attikiouzel. “Automatic pectoral muscle segmentation on mammograms by straight line estimation and cliﬀ detection”. In: The Seventh Australian and New Zealand Intelligent Information Systems Conference, 2001. 2001, pp. 67–72.

[25] N. Dhungel, G. Carneiro, and A. P. Bradley. “Deep structured learning for mass segmentation from mammograms”. In: 2015 IEEE International Conference on Image Processing (ICIP). 2015, pp. 2950–2954.

[26] Dina Abdelhaﬁz et al. “Deep convolutional neural networks for mammography: advances, challenges and applications”. In: BMC Bioinformatics 20 (2019).