Modellen er udviklet til patienter med diffust storcellet B-cellelymfom, forkortet DLBCL. Det er en aggressiv form for lymfekræft, hvor kræften sidder i kroppens lymfesystem. Lymfesystemet er en del af immunforsvaret og består blandt andet af lymfeknuder, milt og lymfebaner.
I dag bliver patienter med DLBCL ofte vurderet ud fra forholdsvis enkle risikomodeller, som bygger på få oplysninger om patienten. Den nye danske model bruger langt flere oplysninger og kan derfor give et mere nuanceret billede af risikoen for, at behandlingen ikke virker godt nok.
Førstelinjebehandling betyder den første behandling, patienten får mod sygdommen.
Den nye model vurderer risikoen for behandlingssvigt inden for de første to år efter behandlingsstart.
Carsten Utoft Niemann, professor og overlæge ved Rigshospitalets afdeling for blodsygdomme og forsker hos Kræftens Bekæmpelse, fremhævede modellen ved sin tiltrædelsesforelæsning i begyndelsen af maj.
"Modellen har vist, at den er langt bedre til at selektere patienterne til de rigtige risikogrupper. Dermed gør den det muligt at finde de cirka 30 procent af patienterne, som ikke har tilstrækkelig effekt af den nuværende standardbehandling – og som derfor formentlig har brug for andet eller mere behandling for at undgå død eller tilbagefald af deres sygdom."
Skal hjælpe læger med at vælge rigtigt
Førsteforfatteren til artiklen er Mikkel Werling, forsker og ph.d.-studerende ved Afdeling for Blodsygdomme på Rigshospitalet. Han har udviklet modellen som en del af sit ph.d.-projekt.
"Målet med at bruge maskinlæring og lave prædiktionsmodeller i sundhedsregi er, at vi ønsker at udvikle nye værktøjer, der kan hjælpe lægerne med at træffe de rigtige beslutninger. Modellerne skal være anvendelige og adressere nogle af de problemstillinger, som lægerne oplever i klinisk praksis," siger Mikkel Werling.
I stedet for kun at se på få faste risikofaktorer kan modellen inddrage mange forskellige data om patienternes sygdom, prøvesvar, tidligere forløb og behandling.
Forskerne spurgte i begyndelsen lymfomlæger, hvilke udfordringer de oplevede som mest relevante i hverdagen. Her pegede lægerne især på behovet for bedre at kunne vurdere patienternes risiko og finde de patienter, hvor den første behandling sandsynligvis ikke er nok.
"Helt overordnet finder vi, at vores model performer bedre. Når vi sammenligner den med NCCN IPI under rimelige betingelser, er den bedre til at skelne mellem patienter med og uden behandlingssvigt. Den har en høj grad af fleksibilitet, og kan tilpasses forskellige kliniske behov," siger Mikkel Werling.
NCCN IPI er en udbredt risikomodel, som blandt andet ser på patientens alder, sygdomsstadie, niveauet af stoffet LDH i blodet, patientens almene tilstand og om sygdommen sidder uden for lymfeknuderne. LDH er et enzym, som kan være forhøjet ved blandt andet kræftsygdomme og vævsskade.
Den nye danske model bruger 87 udvalgte oplysninger. De kommer fra flere nationale datakilder og omfatter blandt andet medicinoplysninger, blodprøver, procedurer, diagnosekoder, patologisvar og kvalitetsregistre.
Alder kan fylde for meget i de gamle modeller
En vigtig pointe i arbejdet er, at de nuværende risikomodeller kan komme til at vægte alder meget højt. Det kan betyde, at ældre patienter vurderes til at have høj risiko, selv om deres kræftsygdom måske ikke i sig selv opfører sig særligt aggressivt.
Den nye model ser ud til bedre at kunne skelne mellem risiko, der skyldes alder, og risiko, der skyldes selve sygdommen eller behandlingsforløbet.
"Det interessante ved vores model er, at den ser ud til bedre at kunne skelne mellem patienter, hvor risikoen primært afspejler alder, og patienter hvor risikoen i højere grad afspejler sygdoms- og behandlingsrelaterede forhold," siger Mikkel Werling.
I studiet var NCCN IPI-scoren stærkere knyttet til alder end den nye maskinlæringsmodel. Samtidig fandt den nye model langt flere ældre patienter med lav risiko. Blandt patienter over 60 år i testsættet identificerede maskinlæringsmodellen 160 lavrisikopatienter, mens NCCN IPI kun fandt én.
Det kan få betydning for, hvem der fremover kan komme med i kliniske forsøg. Hvis ældre patienter automatisk bliver vurderet som højrisikopatienter på grund af alder, kan de blive fravalgt til studier, selv om de måske er egnede.
"Hvis man bruger NCCN IPI alene, så risikerer man at overse mange patienter, i lav risiko for behandlingssvigt efter standardbehandling. Det kan blandt andet hænge sammen med, at alder vægter tungt i den klassiske risikoscore. NCCN IPI-scoren er et almindeligt deltagelseskriterie i kliniske studier, og her risikerer mange ellers egnede patienter at blive valgt fra med de nuværende prædiktionsværktøjer."
Nye behandlinger gør præcis risikovurdering vigtigere
Standardbehandlingen ved DLBCL er ofte R-CHOP eller en behandling, der ligner. R-CHOP er en kombination af kemoterapi og antistofbehandling. Mange patienter bliver helbredt med behandlingen, men en betydelig gruppe får tilbagefald eller har for dårlig effekt.
Samtidig er lymfombehandlingen i hastig udvikling. Nye behandlinger som CAR-T-celleterapi og bispecifikke antistoffer bliver afprøvet tidligere i sygdomsforløbet. CAR-T-celleterapi er en avanceret behandling, hvor patientens egne immunceller ændres i et laboratorium, så de bedre kan genkende og angribe kræftceller. Bispecifikke antistoffer er lægemidler, der kan binde sig til både kræftceller og immunceller og på den måde bringe immunforsvaret tættere på kræften.
"Det øger relevansen af en skærpet prædiktion – for nu har vi jo faktisk begyndende adgang til behandlinger, der kan noget andet og mere end de gængse standardbehandlinger, og som kan komme de patienter til gode, som ikke har tilstrækkelig effekt af CHOP eller et CHOP-lignende regime i første linje," siger Mikkel Werling.
Flere læger har peget på, at bedre risikoværktøjer er nødvendige, hvis mere intensive behandlinger skal bruges tidligt. Årsagen er, at standardbehandlingen allerede virker godt for mange patienter, og at lægerne derfor skal være meget præcise, når de udvælger patienter til hårdere eller mere avanceret behandling.
Thomas Stauffer Larsen, professor og overlæge ved Hæmatologisk Afdeling X i Odense, har tidligere formuleret udfordringen sådan i forbindelse med et studie af CAR-T-celleterapi i første behandlingslinje:
"Dilemmaet er, at vi har en ret god førstelinjestandard som helbreder 7 ud af 10 patienter. Det betyder, at vi skal være meget præcise i vores selektion af de patienter, som har brug for en mere intensiv behandling – for ellers risikerer vi at overbehandle patienter, der havde klaret det godt på den etablerede standard."
Han pegede samtidig på begrænsningen ved de redskaber, lægerne har i dag:
"De studier, som undersøger CAR-T-celleterapi i første linje – inklusiv det nye studie her – forsøger naturligvis at risikostratificere og selektere de rigtige patienter til det intensiverede behandlingsforløb. Men problemet er, at de stratificeringsredskaber, vi har til rådighed i dag, har deres begrænsninger. IPI er det bedste værktøj vi har i dag, men dét differentierer patienterne ud fra simple kliniske parametre og fortæller reelt ikke noget om sygdommens underliggende biologi."
Kan først og fremmest bruges til bedre udvælgelse
Den nye model betyder ikke, at lægerne i morgen kan bruge den til at vælge en bestemt behandling til en bestemt patient. Mikkel Werling understreger, at modellen er prognostisk. Det betyder, at den kan sige noget om risikoen for et dårligt forløb, men den kan ikke i sig selv vise, hvilken behandling der vil være bedst for patienten.
"Det er rigtigt, at vi lige nu og her ikke har adgang til mere intensive førstelinjeregimer – og derfor kommer modellen nok ikke til at ændre klinisk praksis i morgen. Men lymfom-området er i rivende udvikling, og nogle af de nye effektive behandlingsmodaliteter afprøves aktuelt helt fremme i første linje," siger Mikkel Werling.
"En model som vores kan bidrage til, at vi tidligere i forløbet identificerer de patienter, som har høj risiko for ikke at klare sig lige så godt som majoriteten, og dermed kan den på sigt blive et værktøj til mere målrettet risikovurdering og bedre udvælgelse til kliniske studier."
Forskerne arbejder nu videre med, hvordan AI-modeller kan udnytte hele patientforløbet bedre. I den aktuelle model bliver oplysninger fra patienternes forløb samlet i faste tidsvinduer. Det er praktisk, men metoden kan miste noget af udviklingen over tid, for eksempel pludselige ændringer i blodprøver eller andre tegn på, at sygdommen ændrer sig.
"I vores model bliver de longitudinelle data samlet til aggregerede variable inden for bestemte tidsvinduer. Det er en stærk og praktisk tilgang, men den kan miste noget af dynamikken i patientforløbet, for eksempel pludselige ændringer, trends eller variation over tid. Her kan deep learning-baserede sekvensmodeller potentielt åbne nye muligheder, fordi de kan arbejde direkte med patientforløb som tidslige sekvenser og eventuelt modellere flere kliniske outcomes samtidigt," siger Mikkel Werling.
Deep learning er en mere kompleks form for kunstig intelligens, som kan finde mønstre i meget store og sammensatte datamængder. Fordelen kan være mere præcise modeller. Men der er også en ulempe:
"Jo mere komplekse modeller, vi bruger, jo sværere bliver det for os at forstå, hvorfor modellen giver en bestemt risikovurdering. Der findes metoder, der kan hjælpe med at forklare modellens vurdering, men de giver ikke nødvendigvis en simpel forklaring eller en kausal mekanisme."
"Når vi overgår til deep learning, så vil kompleksiteten af vores modeller stige. Det vil gøre det sværere for lægen at tage stilling til en models vurderinger. Ønsker vi det? Er forbedringen i nøjagtighed stor nok til, at vi vil ofre noget af forklarligheden?"
Skal testes på nye patienter
Modellen er foreløbig udviklet og testet på gamle patientdata. Retrospektive data betyder, at forskerne ser tilbage på patienter, der allerede er behandlet. Før modellen kan bruges i klinikken, skal den afprøves på nye patienter og under de datavilkår, som findes i en almindelig klinisk hverdag.
"Indtil nu har vi kun udviklet og testet modellen på retrospektive data. Før den kan komme til at spille en rolle i klinisk praksis, skal den i hvert fald afprøves i en pseudo-prospektiv setting, hvor vi kan se, om den også fungerer på nye patienter og under skiftende datavilkår, der findes i en klinisk hverdag," siger Mikkel Werling.
"Vi vil gerne undersøge, om den kan levere pålidelige risikovurderinger i en nutidig klinisk kontekst – og så vi kan se, hvordan den performer over tid. Vi er især interesserede i, hvordan den bliver påvirket af manglende eller skiftende data. Det er langt sværere at få en model til at virke i praksis, end det er at udvikle den."
Mikkel Werling giver ikke et præcist bud på, hvornår modellen kan blive en del af den kliniske hverdag. Han peger dog på erfaringerne fra CLL-TIM, en anden dansk maskinlæringsmodel, hvor der gik cirka fem år fra udvikling til klinisk afprøvning og teknisk implementering i Sundhedsplatformen.
CLL-TIM bruges til at identificere patienter med kronisk lymfatisk leukæmi, forkortet CLL, som har høj risiko for alvorlige infektioner eller behov for behandling inden for de første to år efter diagnosen. Modellen afprøves aktuelt i et randomiseret studie, hvor forskerne undersøger, om målrettet tidligere behandling kan forebygge alvorlige infektioner og tidligt behandlingsbehov.
Artiklen er en omskrevet version af artiklen Dansk AI-model forbedrer risikostratificering og forudsigelse af behandlingssvigt ved DLBCL på Hæmatologisk Tidsskrift