AIDMEI: AI

Kirjoittajat:

Antti Isosalo

Satu Inkinen

Jarmo Reponen

Miika Nieminen

Olemme Oulun yliopistossa keränneet yhteistyössä Oulun yliopistollisen sairaalan kanssa laajan, noin 50 000 mammografiakuva-aineiston, ja se on keräilyn yhteydessä pseudonymisoitu tutkimuskäyttöä varten. Aineiston avulla on tarkoituksena kehittää tekoälyperustaista rintasyövän havainnointia mammografiakuvista ja prosessia, jolla tulevissa yliopiston ja sairaalan rajapinnassa tapahtuvissa tekoälyhankkeissa päästään suoraviivaisesti potilasdatasta analyysivaiheeseen. Tässä artikkelissa käymme lyhyesti läpi aineistonkeruun vaiheita ja annamme muutamia esimerkkejä huomioonotettavista asioista.

Aineiston keruu ja sen eri vaiheet

Terveydenhuollon ammattilaisten ja hoitohenkilökunnan suorittamalla aineiston keruulla tarkoitetaan jatkuva-aikaista systemaattista terveydentilaa ja tutkimustuloksia koskevan aineiston keruuta, analysointia ja tulkintaa. Näitä tuloksia käytetään terveydenhuollon suunnittelun, toteutuksen ja arvioinnin apuna.

Tutkimusaineisto voidaan jakaa keräysmenetelmän mukaan havaintoaineistoon, kokeelliseen aineistoon, simuloituun aineistoon ja johdettuun aineistoon.

Havaintoaineisto on tyypillisesti jonkin mittalaitteen avulla kerättyä aineistoa, kuten Holter-mittaukset tai esimerkiksi kuva-aineistoa, kuten röntgenmenetelmällä kuvatut mammografiakuvat. Myös rekistereihin kerätyt potilastiedot voidaan lukea havaintoaineistoksi.

Kokeellinen aineisto syntyy, kun tutkija säätää esimerkiksi magneettikuvantamislaitteen tai sekvenssin parametrejä ja pyrkii selvittämään syy-seuraus-suhteita esimerkiksi kuvantamismenetelmän parantamiseksi.

Simuloidulla aineistolla puolestaan pyritään mallintamaan reaalimaailman ilmiötä tiettyjen reunaehtojen ja lähtötietojen perusteella. Simuloinnissa tärkeää on hyvä malli. Useimmille meistä tuttu esimerkki reaalimaailman ilmiötä simuloivasta mallista ovat sääennusteet, joita tarkennetaan säähavaintojen avulla saatavien lähtötietojen, kuten lämpötilan, ilmanpaineen ja mm. ilmankosteuden avulla. Mammografiatutkimusten kontekstissa laajaan aineistoon perustuva malli voisi ennustaa esimerkiksi tulevaa hoidon tarvetta tai rintasyövän puhkeamista.

Johdetulla aineistolla tarkoitetaan useammista lähteistä saatujen tietojen avulla saatua aineistoa. Johdettu aineistolla voidaan tarkoittaa esimerkiksi potilastietojen ja erilaisista tutkimuksista saatujen tietojen avulla tuotettuja annotointeja. Johdettu aineisto voi olla myös jonkin muunnoksen kautta saatua uutta aineistoa, jonka avulla lääketieteellisessä sovelluksessa pyritään saamaan aikaan esimerkiksi tarkempi diagnoosi tai ennustamaan terveydentilan kehitystä. Toisiokäyttölaki mahdollistaa rekistereihin kertyneiden potilastietojen käytön tutkimustyön tekemiseen.

Tekoäly ja opetusaineisto

Kuten ihmisenkin oppimisessa, hyvä aineisto on keskeisessä osassa tekoälyn opettamisessa. Tekoälyn osalta aineiston merkitys on ehkä vielä keskeisempi, koska tekoälyn kyky päätellä ja pidättäytyä päätöksistä ei ole vielä ihmisen tasolla. Opetusaineistosta merkittävästi poikkeavat näytteet ovat mm. suurempi ongelma tekoälylle kuin mitä ne ovat ihmiselle. Se missä automaattiset menetelmät ovat kuitenkin ihmistä parempia on laajojen aineistojen käsittely.

Ennen kuin tekoälyä päästään opettamaan tarvitaan monia eri työvaiheita aineiston keruusta, tallennukseen, louhimiseen ja eri tietolähteiden yhdistämiseen sekä nimeämiseen eli annotoimiseen. Potilasaineistoja käytettäessä yhtenä työvaiheena on myös tietojen de-identifiointi.

Oikeanlainen aineisto tärkeää

Keskeisessä osassa tekoälyä sovelluksissa on oikeanlainen aineisto. Aineiston täytyy lisäksi olla jäsennettynä oikeaan muotoon ja sitä täytyy olla riittävä määrä. Riittävä määrä vaihtelee sovelluksen mukaan, sadoista miljooniin esimerkkeihin.

Aineiston esikäsittely on usein merkittävä ponnistus. Monia aineistoja ei ole aiottu tekoälykäyttöön ja niinpä ne eivät ole välttämättä sopivassa muodossa. Useammasta lähteestä tuleva aineisto on lisäksi siirrettävä jatkokäyttöä varten yleiseen esitysmuotoon (engl. common representational format).

Aineisto saattaa sisältää myös erilaista vaihtelua. Aineistoa on voitu esimerkiksi mitata/kuvata eri valmistajien laitteilla ja näillä valmistajilla on saattanut olla oma standardinsa, jota he ovat seuranneet esimerkiksi ohjelmistototeutuksessaan.

Aineistosta voi olla tarpeen myös suodattaa pois ne näytteet, joita ei jostain syystä haluta tutkia, muu kuin haluttu kuvantamismenetelmä ja korruptoituneet kuvat, joita niitäkin luonnollisesti on.

Aineiston hallintaan ja erityisesti aineiston tehokkaaseen ja toisaalta virheettömään tulkintaan soveltuvaa teknologian määrittely on käynnissä niin menetelmiin keskittyvän perustutkimuksen kuin esimerkiksi toimintaa ohjaavan lainsäädännön osalta. Aineiston keruu on oman aktiivisen tutkimuksensa kohteena.

Lopuksi

Useista tekoälyn sovelluksista ja erityisesti syväoppimismenetelmien viime vuosina mahdollistamista kehitysaskeleista huolimatta asenteet tekoälyn käyttöä kohtaan ovat pysyneet varauksellisina. Uskomme, että tekoälypohjaiselle kuva-analyysille on lähitulevaisuudessa olemassa tärkeä rooli tuottavuuden ja diagnostisen hoitopolun tehokkuuden kehittämisessä. Tehokkuuden kehittäminen puolestaan auttaa lievittämään elintärkeisiin toimintoihimme kohdistuvia maailmantalouden vaikutuksia, jolloin terveydenhuoltomme korkeasta laatutasosta ei tarvitse joustaa.

Kirjoittajat ovat AIDMEI-projektin projektiryhmän jäseniä. Projektissa tutkitaan kahta kiinnostavaa käyttötapausta alaselkäkivun havainnointia magneettikuvista ja rintasyövän tunnistamista mammografiakuvista. Projektirahoitus on Teknologiateollisuuden 100-vuotissäätiön ja Jane ja Aatos Erkon säätiön tulevaisuuden tekijät rahastosta. Tutkimusyhteistyössä tärkeinä yhteistyökumppaneina ovat Helsingin yliopisto ja Oulun yliopistollinen sairaala.

Miika Nieminen

professori, ylifyysikko

Oulun yliopisto ja Oulun yliopistollinen sairaala

Tietokoneiden ja erityisesti näytönohjaimien laskentatehon kehittymisen myötä viime vuodet ovat olleet erittäin mielenkiintoisia teknologian ja tekoälyn vuosia. Myös lääketieteen teknologian tutkimuskentässä on eletty mielenkiintoisia vuosia.

Uutiskynnyksen ovat ylittäneet mm. monet tutkimukset, joissa tekoäly on yltänyt tunnistustehtävässä ihmisen tasolle tai jopa päihittänyt hänet (Kuva 1).

On myös maalailtu uhkakuvia: ketä syyttää tietokoneen tekemästä virheestä? Valmistuvat lääkärit ovat pohtineet kannattaanko radiologiaan erikoistua, jos tietokone vie työpaikat.

Kuva 1: Tekoälytutkimus on saanut viime vuosina merkittävää mediahuomiota.

Kuvantamisen arvoketju (kuva 2) koostuu kuvan tuottamisesta, kuvien analysoinnista ja tulkinnasta, lausunnon kirjoittamisesta ja potilaan hoitoon vaikuttavasta päätöksenteosta.

Seuraavassa esittelen lyhyesti käyttötapauksia omasta tutkimuksestamme, joissa tätä arvoketjua, erityisesti sen alkupäätä, voidaan parantaa, jotta kuvantamiseen liittyvä diagnostiikka olisi laadukkaampaa ja nopeampaa, ja säteilyannos pienempää.

Kuva 2: Kuvantamisen arvoketju

Tekoälystä seulojan kumppani?

Diagnostisessa kuvantamisessa tekoälyä voidaan hyödyntää mm. luokittelu-, segmentointi-, rekisteröinti- ja lokalisointitehtävissä.

Suomessa 30% diagnosoiduista syövistä ovat rintasyöpiä, ja rintasyöpään liittyviä seulontatutkimuksia tehdään meillä 300000 kpl vuodessa. Lainsäädäntö edellyttää kahden radiologin tekemää arviointia, ns. kaksoisluentaa. Radiologiresurssi ei vaan tahdo tähän aina riittää.

Yhdessä hankkeistamme optimoimme rintasyöpäseulonnan työvirtaa kehittämällä koneoppimismenetelmiä tunnistamaan ns. helpot tapaukset, jolloin lääkärille jäisi enemmän aikaa hankalien tapausten tarkasteluun (kuva 3). Käytämme tutkimuksessa Oulussa keräämäämme n. 50000 potilaan aineistoa, jolle radiologimme ovat tehneet ison urakan tunnistamalla ja rajaamalla syövät mammografiakuvista. Haastamme nykyistä arvoketjua hypoteesillä asetelmasta jossa, toisen radiologeista voisi korvata tekoälyllä. Tekoälyn mukaanotto seulontaan tulee toki edellyttämään lainsäädännöllistä muutosta.

Kuva 3: Haastamme nykyistä mammografiatutkimusten seulontakäytäntöä ottamalla tekoäly toisen radiologin tilalle. Kuvassa oikealla tekoälyn tuottamat piirrekartat, joiden perusteella poikkeavat kudosmuutokset voidaan tunnistaa. (Isosalo, Inkinen, Ipatti, Turunen, Prostredná, Reponen, Nieminen)

Keskustelu tekoälyn paikasta laajemminkin eri arvoketjuissa käy vilkkaana; mikä on optimaalisin tapa integroida tekoäly terveydenhuoltojärjestelmään, annetaanko sille orjan, rengin vai jopa isännän rooli.

Missä kipu on?

Alaselkäkipu on hyvin yleinen oire ja johtava liikuntakykyä rajoittava vaiva kautta maailman. Poikkeavia löydöksiä nähdään selän magneettikuvissa usein ja ne eivät välttämättä liity aina kipuun. Oulussa olemme tehneet tutkimusta Pohjois-Suomen v. 1966 syntymäkohortin selän magneettikuva-aineistolla, joissa meillä on tiedossa potilaiden kiputieto. Kiputiedolla ja kuvilla olemme kouluttaneet koneoppimisjärjestelmää etsimään ja osoittamaan ne kudosalueet, joilla kipua potevien magneettikuvat eroavat kivuttomien kuvista (kuva 4). Tällä hetkellä syväoppiva menetelmämme pystyy erottelemaan kipua potevat vapaaehtoiset kivuttomista 80%:n tarkkuudella.

Kuva 4: Kuvan mukaisilla ”lämpökartoilla” (engl. heatmap) voidaan graafisesti havainnollistaa ne kudosalueet, jotka tekoäly tunnistaa poikkeaviksi, kipuun liittyviksi kudosalueiksi. (Al-Rubaye, Ketola, Inkinen, Karppinen, Nieminen)

Miehittämätön röntgenkuvaus

Perinteinen röntgenkuvaus on hyvin työvoimaintensiivistä, laitteet kalliita ja useimmiten laitteet kiinteästi asennettuja. Saavutettavuus röntgentutkimukseen esim. pohjoisessa Suomessa puhumattakaan muualla maailmassa voi olla hyvinkin huono. Tutkimusyksikössämme olemme kehittäneet jalkautuvan sairaanhoidon kysyntään vastaava röntgenkuvauslaite raajojen röntgenkuvaukseen (kuva 5).

Missiona on tuoda kuvantamispalvelu lähelle potilasta jopa ilman fyysistä kuvaushenkilöstöä. Älykäs laite opastaa potilasta interaktiivisesti raajan asettelussa ja ottaa sen jälkeen kuvan automaattisesti. Näin voidaan pienentää kuvantamisen kustannuksia ja tuoda kuvantaminen lähemmäksi potilasta.

Laitteen prototyyppi on valmis, meillä on mm. STUKn ja FIMEAn luvat aloittaa testaaminen oikeilla potilailla pian.

Kuva 5: Visio miehittämättömän röntgenkuvauslaitteen ulkoasusta. (Liimatainen, Hanni, Tervonen, Nieminen)

Magneettikuvausta nopeammin

Magneettikuvaus perustuu vesi- ja rasvamolekyylien vety-ytimien lähettämään signaaliin. Tyypillinen magneettikuvaustutkimus kestää n. 20 minuuttia ja se koostuu useista kuvasarjoista, joissa jokaisessa on kymmeniä kuvia erilaisella kuvakontrastilla. Yhdessä New Yorkin yliopiston kanssa olemme kehittäneet ja testanneet uutta magneettikuvausmenetelmää (kuva 6), ns. sormenjälkimagneettikuvausta (engl. magnetic resonance fingerprinting), minkä avulla voidaan yhdellä n. 5min kestävällä kuvauksella määrittää kuvauskohteen kudosten magneettiset ominaisuudet, ns. relaksaatioajat, jotka ovat vastuussa alkuperäisten kliinisten kuvasarjojen kontrastista. Relaksaatiokarttojen avulla on mahdollista tarkastella tiettyjä kudosmuutoksia tarkemmin ja kvantitatiivisesti. Kvantitatiivisten karttojen perusteella voidaan laskea em. kliiniset kuvasarjat ja näin toteuttaa kuvaus nykyistä huomattavasti lyhyemmässä ajassa. Teemme tutkimusta näiden synteettisten kuvien soveltuvuudesta radiologien käyttöön.

Kuva 6: Perinteinen polvinivelen magneettikuvasarja (A), Magnetic resonance fingerprinting -tekniikalla määritetyt relaksaatioaikakartat (B) ja näiden perusteella laskettu kliiniseen käyttöön soveltuva kuva (C). (Casula, Nissi, Nykänen, Nevalainen, Cloos, Lattanzi, Nieminen)

Paksuneulanäytteitä älyllä

Maailmassa diagnosoidaan vuosittain 18 miljoonaa syöpätapausta. Tyypillisesti syöpä diagnosoidaan neulanäytteestä. Tutkimuksesta riippuen jopa 30% neulanäytteistä epäonnistuu neulan puutteellisen kohdistuksen vuoksi. Olemme kehittäneet älyneulan auttamaan paksuneulanäytteen otossa (kuva 7). Uusi menetelmä auttaa radiologia ottamaan näytteen onnistuneesti kertomalla onko neula kohdekudoksessa. Itse menetelmässä hyödynnetään spektroskopiaa ja signaalianalyysissa tekoälyä. Menetelmän toimivuus on osoitettu eläinkokein ja tekoälypohjainen algoritmi tunnistaa oikean kudoksen tällä hetkellä yli 90% tarkkuudella.

Kuva 7: Älyneulalla paksuneulanäytteen ottaminen onnistuu aiempaa luotettavammin. (Surazynski, Lavonen, Myllylä, Mäkinen, Zhao, Nieminen, Nieminen)

Viipalekuvauksen tulevaisuus

Perinteisessä TT-kuvauksessa mitataan röntgensäteilyn vaimenemista potilaan eri puolilta ja tämän datan perusteella lasketaan viipalekuvia. Tämä ei ole kuitenkaan kaikissa tilanteissa tehokkain tai säteilyhygieenisin menetelmä. Vaihtoehtoisia ratkaisuja on useita. Sisätomografiassa voidaan rajoittaa kuvaus ja säteilytys tietylle vartalon mielenkiintoalueelle. On mahdollista kuvata vai rajoitettu alue (rajoitetun kulman tomografia) tai vain harvoja projektioita. Kuvista kuitenkin nähdään kuinka nämä ratkaisut heikentävät kuvalaatua koska perinteiset kuvarekonstruktioalgoritmit eivät saa kaipaamaansa dataa mielenkiintoalueen ulkopuolelta.

Otetaan avuksi tekoäly. Sama data, mutta opetetaan syväoppivalle algoritmille minkälaista anatomiaa kuva-alan ulkopuolella voi olla. Tuloksena on merkittävä parannus kuvanlaatuun kuten nähdään. Vaatii toki vielä tutkimusta mille kehon alueelle tämä menetelmä parhaiten sopii ja radiologien arviointia näkyykö kudokset ja patologiset muutokset niissä riittävän hyvin.

Kuva 8: Tietokonetomografian eri geometriat ja niiden tuottamat kuvat samalle datalle. Syväoppivan menetelmän käyttö parantaa merkittävästi kuvanlaatua. (Ketola, Heino, Juntunen, Nieminen, Siltanen, Inkinen)

Pohdinta

Usein kuulee kysyttävän: mitä vaatii se, että menetelmät saadaan klinikkaan.

Lyhyt vastaus on, että kymmenen vuotta. Suunnilleen niin kauan kestää uuden lääketieteen teknologian kehittäminen tuotantokäyttöön. Tarvitaan pitkäjänteistä tutkimus- ja kehitystyötä ja rahoitusta.

Pitkä vastaus on, että vaikka teknologian toimivuus on osoitettu, täytyy menetelmää testata toisenlaisessa aineistossa, vaikkapa muunmaalaisissa potilaissa, toisilla laitteilla, toisessa käyttöympäristössä. Lääkinnällisiin laitteisiin liittyvä regulaatio on erittäin tiukkaa.

Tekoälyalgoritmien opettaminen vaatii dataa. Suomessa potilaiden kuvantamisdatan toisiokäyttöä tulkitaan tiukimmin maailmassa ja voimme hävitä kilpailun teknologiakehityskisassa, mikä voisi tuoda euroja Suomeen. Vaikka 2019 voimaan astuneen ns. toisiolain tarkoitus oli selkeyttää lupamenettelyä ja tehostaa tietojen käyttöä tutkimuksessa vaikutus on ollut usein päinvastainen. Suomessa ei ole olemassa käyttöympäristöä mikä täyttäisi samalla lain tietoturvallisuusvaatimukset ja tarjoaisi laskennalliset työkalut esim. em. laskennallisten menetelmien kehittämiseen.

Kuvantamisdatan liikuttaminen eri maiden välillä testaus- ja kehittämistarpeisiin on hyvin hankalaa mutta se ei aina ole edes välttämätöntä – datan sijaan voidaan lähettää algoritmi testattavaksi luotettavalle yhteistyökumppanille tai jopa käyttää simuloitua dataa.

Teknologian ansiosta lääketiede on kymmenen vuoden päästä taas varmasti varsin eri näköistä. On tärkeää ymmärtää, että teknologia on ystävä eikä vihollinen. Monia sovellusalueita on varmasti vielä tunnistamatta ja niitä on syytä aktiivisesti kartoittaa tarvelähtöisesti. Luottamus tekoälyyn paranee, kun kehitämme matemaattisia menetelmiä ymmärtämään sen toimintaa eikä se ole meille enää pelkkä musta laatikko. Pystymme virtaviivaistamaan kuvantamiseen liittyviä prosesseja ja yhdistämään tekoälyn käsiteltäväksi kuvantamistiedon ohella muuta potilasinformaatiota ja hyödyntämään niitä. päätöksentekojärjestelmissä.

Tulevaisuudessa voimme ulkoistaa yhä useampia tehtäviä algoritmeille ja keskittyä niihin tehtäviin, joita kone ei osaa, ainakaan vielä.

Blogikirjoituksen sisältö on Miika Niemisen esitelmä Medical Research Center Oulun (Oulun yliopistollinen sairaala ja Oulun yliopisto) Kliinisen tutkimuksen päivässä 21.5.2021.

AIDMEI

maanantai 23. elokuuta 2021

Tekoälylle dataa