BLOGIT

25.09.2024

Miten terveydenhuollon datat saadaan puhumaan samaa kieltä?

Kuvituskuva: Blogitekstin pohjalta tekoälyn muodostama kuva (OpenAI ChatGPT-4o)

Aiemman blogin osa 2: OMOP-tietomalli

Terveystiedon valtameressä navigointi voi olla haasteellista, kun eri organisaatiot keräävät tietoa eri järjestelmissä, formaateissa ja standardeilla. Tämä tekee vertailukelpoisen tutkimuksen tekemisestä hankalaa, kun yhteistä kieltä ei ole. OMOP-tietomalli (Observational Medical Outcomes Partnership) ratkaisee tämän ongelman luomalla yhtenäisen tavan järjestää ja käsitellä dataa.

OMOP-tietomallin käyttöönotto tehostaa tutkimusta ja helpottaa päätöksentekoa

OMOP-tietomallin käyttöönotto voi aluksi vaikuttaa tekniseltä, mutta sen hyödyt ovat merkittäviä. Yhdenmukaistamalla terveydenhuollon data OMOP-formaattiin voidaan parantaa tutkimusta ja hyödyntää Real-World Evidencen (RWE) -dataa tehokkaammin. Tämä mahdollistaa kattavamman tietojen analyysin ja tukee terveydenhuollon päätöksentekoa helpottaen hoitokäytäntöjen vertailua, parhaiden käytäntöjen tunnistamista sekä kustannustehokkaampien ratkaisujen kehittämistä potilaille.

Miten OMOP-tietomalli otetaan käyttöön ja mitä vaiheita prosessiin kuuluu?

OMOP-tietomallin käyttöönotto vaatii tarkkaa suunnittelua ja toteutusta, jotta tietojen käsittely on tehokasta ja johdonmukaista. Tämä malli standardoi terveydenhuollon tiedot yhteensopiviksi eri tutkimus- ja analyysitarkoituksiin, mikä helpottaa laajamittaisten monikeskustutkimusten toteuttamista sekä tietojen vertailua. OHDSI on antanut suosituksia OMOP-tietomallin käyttöönoton vaiheista (kuva). Käytännön kokemuksemme ovat osoittaneet näiden suositusten olevan toimivia, ja olemme täydentäneet käyttöönoton prosessia kokemustemme perusteella.

 

-- (PL_OMOP_blogi_(1).png)

Lähde: https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-024-02458-7
Käsitteet suomentanut Niina Pekkanen.


Aineistolähteiden määrittely

OMOP-tietomallin käyttöönotto alkaa aineistolähteiden valinnalla ja toteutettavan kokonaisuuden rajaamisella (1). Tätä varten täytyy selvittää, millaisia tietoja eri järjestelmistä ja tietokannoista löytyy ja kuinka ne soveltuvat OMOP-tietomallin standardeihin. Esimerkiksi potilastietojen ja laboratoriotulosten on oltava riittävän kattavia ja laadukkaita, jotta ne ovat käyttökelpoisia OMOP-tietomalliin vietynä.


Tietojen profilointi (2) ja sanastojen tunnistaminen (3)

Jotta valittuja aineistoja voidaan lähteä viemään OMOP-tietomalliin, on ymmärrettävä sekä aineiston rakenne, että sisältö. Aineiston rakenteen ymmärtämiseksi tiedot profiloidaan (2). Profiloinnilla selvitetään, minkälaisia rakenteita ja sisältöä aineistossa on. Yleensä OMOP-toteutuksissa tähän vaiheeseen käytetään OHDSI-yhteisön tuottamaa White Rabbit -työkalua. Sisällön yleisen ymmärryksen lisäksi on muodostettava käsitys siitä, millä täsmällisellä tavalla tapahtumaa kuvaava tieto on ilmaistu (3). Esimerkiksi diagnoosiaineistoissa diagnoosi kuvataan usein ICD10-sanaston koodilla. Sanastojen tunnistamisessa on hyvä konsultoida lähtöjärjestelmän asiantuntijaa.


Sanastojen kattavuusanalyysi (4) ja Sanastojen yhdenmukaistaminen (5)

Kun aineiston tapahtumia kuvaavat sanastot ovat selvillä, aloitetaan sanastojen yhdenmukaistaminen, eli sanastomuunnoksen rakentaminen, jossa lähtöaineiston termit muunnetaan OHDSI-yhteisön yhdessä sopimiksi standardikonsepteiksi (5). Standardikonseptit ovat keskeisessä roolissa OMOP-tietomallissa, koska niiden avulla sama asia esitetään yhtenäisellä koodilla, riippumatta siitä, miten tieto on alun perin esitetty lähdejärjestelmässä. OHDSI tarjoaa Usagi-työkalua sanastojen yhdenmukaistamiseen. Usagin avulla voi etsiä erilaisin rajauksin sanastomuunnokseen sopivia standardikonsepteja. Sanastomuunnoksissa suosittelemme keskittymään ensin yleisimmin käytettyihin lähtöjärjestelmän koodeihin, jotta saadaan nopeasti parannettua sanastomuunnoksen kattavuutta (80/20 sääntö). Työn edetessä on tarpeen aika ajoin tarkistaa, kuinka paljon käytetyistä lähtöaineiston sanastoista saadaan yhdenmukaistettua standardikonsepteille (4). OMOP-tietomallin lataus ei vaadi täydellisiä sanastomuunnoksia, joten seuraavia vaiheita voidaan aloittaa heti ensimmäisten versioiden valmistuttua.


Rakenteellinen yhdenmukaistaminen (6) ja ETL-prosessi (7)

Ennen kun varsinainen ETL-prosessi (Extract, Transform, Load) (7) voidaan toteuttaa, se on määriteltävä. Määrittelyjen laatimista kutsutaan tässä rakenteelliseksi yhdenmukaistamiseksi (6). Tässä vaiheessa eri alojen asiantuntijat (lähtöjärjestelmä-, kliininen- ja OMOP-tietomalli) yhdessä määrittelevät säännöt, joilla data tuodaan OMOP-tietomalliin ja mitä sanastomuunnosta millekin tiedolle käytetään. Rabbit in a Hat -työkalua voi käyttää apuna, sillä se tarjoaa määrittelijälle OMOP-tietomallin taulut kohteeksi ja profilointivaiheessa (2) White Rabbit välineellä tuotetun lähdejärjestelmän rakenteen lähteeksi.

ETL-prosessin toteutuksessa (7) tarvitaan tietokanta- ja ohjelmointitaitoja, kuten tietovarastojen latausten toteutuksessa yleensäkin. Datan transformaatio tehdään usein SQL-kielen avulla tai vaihtoehtoisesti muilla ohjelmointikielillä, kuten Pythonilla. Prosessiin voidaan käyttää eri teknologioita organisaation tarpeiden mukaan, esimerkiksi tietojen lataus voidaan tehdä erilaisilla työvälineillä, kuten Azure Data Factory tai Databricks. Myös helppokäyttöisiä työkaluja, jotka vaativat vain vähäistä ohjelmointitaitoa (esimerkiksi OHDSI yhteisön Perseus), on saatavilla, mutta niiden ongelmaksi voi muodostua helposti ilmaisuvoiman puute, mikäli lähde vaatii monimutkaisempaa käsittelylogiikkaa.

Tietojen laadun (8) ja määrän (9) analysointi

ETL-prosessin jälkeen on tärkeää analysoida tietojen laatua, jotta varmistetaan, miten hyvin tiedot on muokattu ja siirretty OMOP-mallin mukaisesti. Tämä sisältää sekä laadullisen (8) että määrällisen (9) analyysin varmistaen, että kaikki tarvittavat tiedot ovat mukana ja että ne ovat loogisia ja paikkansapitäviä. Esimerkiksi voidaan tarkistaa, onko sukupuoli uskottava suhteessa tiettyihin tapahtumiin tai onko tapahtumien ajallinen järjestys järkevä.

Tietoturva on oleellisen tärkeää varmistaa koko prosessin ajan. Tietojen käsittely ja analysointi tulisi tehdä tietoturvallisessa käyttöympäristössä, kuten suojatuilla etätyöpöytäympäristöillä, jotta arkaluontoiset terveydenhuollon tiedot pysyvät turvassa ja organisaation ja lainsäädännön vaatimusten mukaisina.


OMOP-tietomallin tekniset haasteet ja tutkimusvaihe

OMOP-tietomallin käyttöönotossa voi ilmetä teknisiä ongelmia, kuten tietokantojen suorituskykyyn liittyviä haasteita tai ohjelmistojen yhteensopivuusongelmia. Näiden ratkaiseminen vaatii usein tiivistä yhteistyötä eri sidosryhmien, kuten IT-tuen ja mahdollisesti ulkopuolisten konsulttien, kanssa. On tärkeää, että jokainen organisaatio arvioi omat tarpeensa ja valitsee toteutukseen ratkaisut, jotka parhaiten vastaavat heidän erityisiä vaatimuksiaan ja resurssejaan.

Kun tietojen harmonisointi ja laadunvarmistus on tehty, voidaan siirtyä varsinaiseen tutkimusvaiheeseen. Tämä vaihe vaatii yleensä erityisiä analyysityökaluja, kuten ATLAS, ja voi sisältää laajoja tietokantahakuja sekä tilastollisia analyyseja, jotka suoritetaan turvallisesti valvotuissa ympäristöissä.


OMOP-tietomallin sujuvaan käyttöönottoon tarvitaan perustietoa ja koulutusta

OMOP-tietomallin kehittämiseksi tarvitaan perustiedot aiheesta. OMOP:in käyttöönotto sujuu helpommin ja tuottaa parempia tuloksia, kun osallistujat tuntevat perusteet ja ymmärtävät tavoitteet jokaisessa vaiheessa. Kaikkien ei tarvitse osata kaikkea; osaava kumppani voi tukea ja kouluttaa käyttöönoton yhteydessä. Koulutusta voi saada räätälöidyistä kursseista sekä EHDEN:in ja OHDSI:n verkkomateriaaleista, kuten Book of OHDSI -julkaisusta ja YouTube-luennoista. Verkkokursseja tarjoavat myös EHDEN Academy ja Coursera (perusteet).

Käyttöönoton suunnittelu/valmistelu

Kun perustiedot ovat hallussa, on aika suunnitella infrastruktuuria, ympäristöä ja tietoturvaa. On suositeltavaa aloittaa pienemmästä osakokonaisuudesta, kuten asiakastiedoista, käynneistä tai diagnooseista, jotta saadaan nopeasti käytännön tuloksia. Kun perusasiat on saatu toimimaan, voidaan siirtyä lisäämään monimutkaisempia aineistoja.

Ylläpito

OMOP-tietokanta tarvitsee ylläpitoa, ja työn määrä riippuu sen käytöstä ja tarvittavista muutoksista. Uudet tutkimukset tuovat usein mukanaan uusia tietolähteitä. Lähtöjärjestelmien päivitykset sekä kahdesti vuodessa uudistettavat OHDSI-sanastot saattavat vaatia huomiota. Sanastojen yhtenäisyys ja muutokset on sovitettava uusiin versioihin käytön mukaan.



Yhteenveto

OMOP-tietomallin toteutus vaatii huolellista suunnittelua, teknistä taitoa ja yhteistyötä eri osapuolten välillä. Onnistuneesti toteutettuna se voi merkittävästi parantaa terveydenhuollon tiedonhallintaa ja edistää kansainvälistä lääketieteellistä tutkimusta.

OMOP-tietomalli parantaa tiedolla johtamista ja datan tehokasta hyödyntämistä terveydenhuollossa. Yhdenmukaistamalla eri lähteistä tulevan tiedon formaatit ja standardit myös tutkimusten tarkkuus paranee, mikä puolestaan mahdollistaa resurssien tehokkaamman kohdentamisen ja johtaa parempiin hoitotuloksiin sekä kustannussäästöihin. Vaikka OMOP-tietomallin käyttöönotto vaatii resursseja ja asiantuntemusta, OMOP-tietomalli luo saatujen hyötyjen kautta perustan entistä paremmalle ja tasa-arvoisemmalle terveydenhuollolle, jossa dataa käytetään täysimääräisesti potilaiden hyväksi.

Ja eikö se ole lopulta juuri se, mitä tarvitsemme?

 

Kirjoittajat: Heidi Hakala, Pasi Rikala, Mikko Kaasinen, Erika Natunen, Niina Pekkanen ja Kari Natunen