Brug af datavidenskab og analyser til at bekæmpe børnekræft

  • Sep 04, 2023

Akut myeloid leukæmi hos børn har en dårlig prognose og behandlingsmuligheder uændrede i årtier. Et samarbejde er at bruge dataanalyse til at bringe en frisk tilgang til at tackle sygdommen.

Akut myeloid leukæmi (AML) dræber hundredvis af børn om året. Det er den type kræft, der forårsager flest dødsfald hos børn under to og teenagere. Det har en dårlig prognose, og dets behandlinger kan være alvorligt giftige.

Forskningsinitiativet Target Pediatric AML (tpAML) blev oprettet for at ændre den måde, sygdommen diagnosticeres, overvåges og behandles på, gennem større brug af personlig medicin. I stedet for den nuværende one-size-fits-all tilgang til mange sygdomme, sigter personlig medicin mod at skræddersy en persons behandling ved at se på deres unikke omstændigheder, behov, helbred og genetik.

Big Data

  • Sådan finder du ud af, om du er involveret i et databrud (og hvad du skal gøre nu)
  • Bekæmpelse af bias i AI starter med dataene
  • Fair prognose? Hvordan 180 meteorologer leverer 'godt nok' vejrdata
  • Kræftbehandlinger afhænger af svimlende mængder af data. Sådan er det sorteret i skyen

AML er forårsaget af mange forskellige typer genetisk mutation, alene og sammen. Disse forskelle kan påvirke, hvordan kræften skal behandles og dens prognose. For bedre at forstå, hvordan man finder, sporer og behandler tilstanden, begyndte tpAML-forskere at bygge det største datasæt, der nogensinde er kompileret omkring sygdommen. Ved at sekventere genomerne fra over 2.000 mennesker, både levende og afdøde, som havde sygdommen, tpAML'er forskere håbede at finde hidtil ukendte sammenhænge mellem visse mutationer og hvordan en kræftsygdom kunne være tacklet.

SE: Big data management tips (gratis PDF) (TechRepublic)

Genomiske data er notorisk betydelige, og tpAML's sekventering havde genereret over en petabyte af det. Ud over vanskeligheder som følge af den store mængde data, der skulle analyseres, var tpAML's data også enormt komplekse: hver patients data havde 48.000 sammenkædede RNA-transskriptioner at analysere.

Tidligere i år, Joe Depa, en far, der havde mistet en datter til sygdommen og arbejdede med tpAML, gik sammen med sine kolleger hos Accenture for at arbejde på et projekt for at bygge et system, der kunne analysere det imponerende datasæt.

I forbindelse med tpAML's tilknyttede dataforskere og beregningsarbejdsgruppe håbede Depa sammen med dataforskere og genomiske ekspertkolleger at hjælpe med at omdanne dataene til information, som forskere og klinikere kunne bruge i kampen mod pædiatrisk AML ved at give dem mulighed for at korrelere, hvad der skete på et genetisk niveau med resultater i sygdom.

For at omdanne de rå data til noget, der kunne generere indsigt i pædiatrisk AML, oprettede Accenture-medarbejdere en værktøj, der indtog de rå kliniske og genomiske data og rensede dem, så analyseværktøjer kunne behandle dem mere effektivt. Ved at bruge Alteryx og Python blev dataene slået sammen til en enkelt fil, og alle ufuldstændige eller duplikerede data blev fjernet. Python blev brugt til at profilere dataene og udvikle statistiske opsummeringer til analysen - som kunne bruges til at markere gener, der kunne være interessante for forskere, siger Depa. Den harmoniserede DataFrame blev eksporteret som en flad fil for mere analyse.

"Hele idéen var 'lad os reducere tiden til dataforberedelse', hvilket er et gennemgående problem i ethvert område omkring data, men især i det kliniske rum. Der er allerede lagt et ton arbejde i spil for dette, og nu håber vi, at vi har fået det i en position, hvor lægerne forhåbentlig kan bruge mere tid på at analysere dataene i stedet for at skulle rydde op i dataene," siger Depa, administrerende direktør hos Accenture Applied Intelligens.

Kodebasen, der blev oprettet til projektet, er bygget ved hjælp af R, open source, hvilket giver forskere og læger mulighed for med lignende udfordringer, men arbejder på forskellige vilkår, at genbruge gruppens arbejde til egen forskning. Mens brugere kan have brug for en vis grad af teknisk ekspertise for at manipulere oplysningerne korrekt på nuværende tidspunkt, gruppe arbejder på en brugergrænseflade, der skal gøre den så tilgængelig som muligt for dem, der ikke har en lignende baggrund.

"Vi ville sikre os, at enhver læge i verden ved afslutningen af ​​denne analyse kan få adgang til disse data, udnytte disse data og udføre deres analyse på dem for forhåbentlig at køre til mere præcisionsmedicin," siger Depa.

SE: En lidt kendt funktion på din iPhone er ved at fuldstændig ændre, hvordan din læge taler til dig

Men kliniske forskere og læger er ikke altid begavede dataforskere, så gruppen har arbejdet på måder at visualisere informationen på ved hjælp af Unity. De værktøjer, de har skabt, giver forskere mulighed for at manipulere dataene i 3D og zoome ind og ud på anomalier i dataene for at finde datapunkter, der kan være værdige til yderligere udforskning. En initiativrig forsker har endda været i stand til at udforske disse datasæt i virtual reality ved hjælp af en Oculus.

Historisk set blev pædiatrisk og voksen AML behandlet som stort set den samme sygdom. Men ifølge Dr. Soheil Meshinchi, professor i Fred Hutchinson Cancer Research Centers kliniske forskningsafdeling og leder for tpAML's beregningsmæssige arbejdsgruppe, de to grupper stammer fra forskellige årsager. Hos voksne opstår sygdommen fra ændringer i de mindste led i DNA-kæden, kendt som enkelte basepar, mens den hos børn er drevet af ændringer i større bidder af deres kromosomer.

tpAML har gjort det muligt for forskere at finde hidtil ukendte ændringer, der forårsager sygdommen hos børn. "Vi har brugt de data, som tpAML genererede, til sandsynligvis at lave den mest robuste diagnostiske platform, der findes. Vi har identificeret genetiske ændringer, som ikke var mulige med konventionelle metoder," siger Meshinchi.

Når disse mutationer er fundet, kan dataanalyseplatformen begynde at identificere lægemidler, der potentielt kan målrette dem. Protokoller for, hvordan man behandler pædiatrisk AML, har stort set været uændret i årtier, og der er hårdt brug for nye, mere individualiserede behandlingsmuligheder.

"Vi har prøvet det i 40 år, hvor vi har behandlet alle AML ens og håbet på det bedste. Det har ikke virket – du skal virkelig tage et skridt tilbage og behandle hver delmængde mere hensigtsmæssigt baseret på det mål, der er udtrykt," siger Meshinchi.

Dataene kan hjælpe ved at identificere lægemidler, der allerede er udviklet til at behandle andre tilstande, men som kan have en rolle i bekæmpelsen af ​​pædiatrisk AML, og ved at vise det farmaceutiske virksomheder, der fremstiller disse lægemidler, er der hårde beviser for, at starte den dyre og risikable proces med at teste lægemidlernes effektivitet hos børn med sygdommen umagen værd.

SE: 3D-print tager et kæmpe spring i sundhed. Det kunne ændre alt

Brug af analyseplatformen til at finde lægemidler, der kan genbruges på denne måde, i stedet for at blive skabt fra bunden, kan reducere den tid, det tager for en ny pædiatrisk AML-behandling at blive godkendt med årevis. Et lægemiddel identificeret som et resultat er allerede blevet testet i kliniske forsøg.

Resultaterne fra teamets arbejde er begyndt at få indflydelse på pædiatriske AML-patienter. Når dataene blev brugt til at vise en undergruppe af børn med sygdommen, som havde en bestemt genetisk markør, der blev betragtet som særlig høj risiko, var behandlingsvejen for disse børn ændret.

"Disse data vil ikke kun have en løbende indflydelse, men har allerede en indflydelse lige nu," siger Julie Guillot, medstifter af tpAML.

"En kur mod leukæmi eller en kur mod AML er meget usandsynlig. Men vi leder efter skræddersyede behandlinger til specifikke grupper af børn... når [Meshinchi] og hans kammerater er i stand til at finde ud af, at akilleshælen for en specifik klynge af patienter er resultaterne dramatisk. Disse børn går fra en meget lav procentdel af helbredelse til for eksempel en gruppe, der gik til 95%. Denne tilgang kan faktisk fungere."

Innovation

Jeg prøvede Apple Vision Pro, og det er langt foran, hvad jeg havde forventet
Denne lille satellitkommunikator er fyldt med funktioner og ro i sindet
Sådan bruger du ChatGPT: Alt hvad du behøver at vide
Dette er mine 5 foretrukne AI-værktøjer til arbejde
  • Jeg prøvede Apple Vision Pro, og det er langt foran, hvad jeg havde forventet
  • Denne lille satellitkommunikator er fyldt med funktioner og ro i sindet
  • Sådan bruger du ChatGPT: Alt hvad du behøver at vide
  • Dette er mine 5 foretrukne AI-værktøjer til arbejde