I ricercatori di Genomics England, dell'Università di Trieste e del Great Ormond Street Hospital for Children dell’NHS Foundation Trust hanno sviluppato un nuovo algoritmo per rendere più accurata l'analisi del sequenziamento completo del genoma, effettuato con tecniche di Whole Genome Sequencing (WGS) in pazienti con tumori del sangue.
L’algoritmo sviluppato ha l’obiettivo di interpretare più precisamente i dati del sequenziamento nei casi in cui i campioni di cellule idealmente sane, prelevati dai pazienti, risultino invece contaminati da cellule malate.
Nei pazienti malati di cancro, il sequenziamento completo del genoma può essere utilizzato per identificare mutazioni che possono influenzare il successivo sviluppo del tumore e quindi la prognosi della malattia. Per identificarle tali mutazioni è necessario confrontare il DNA delle cellule tumorali con quello di un tessuto sano dello stesso paziente. A questo scopo vengono prelevati almeno due campioni diversi, uno direttamente dal tumore e uno attraverso un prelievo di sangue che in principio dovrebbe contenere solo cellule sane.
Una volta effettuato il sequenziamento del DNA contenuto nei due campioni, le sequenze ottenute sono analizzate tramite procedure bioinformatiche. Si tratta di processi automatizzati che tuttavia, in caso di pazienti malati di cancro, possono incontrare problemi se il campione di cellule sane è contaminato da cellule tumorali. La contaminazione può infatti influenzare negativamente l’accuratezza dei risultati generati da questa procedura. Il rischio è particolarmente rilevante nel caso di tumori del sangue, dato che le cellule tumorali si trovano proprio nel flusso sanguigno ed è dunque pressoché impossibile separarle da quelle sane in un prelievo.
Per risolvere questo problema, il gruppo di ricercatori ha sviluppato un nuovo strumento informatico, un algoritmo chiamato TINC – Tumour In Normal Contamination assessment, con cui stimare il livello di contaminazione tumorale nei campioni normali. Lo strumento si basa su algoritmi utilizzati per comprendere l'evoluzione del tumore ed i risultati ottenuti sono stati pubblicati oggi su Nature Communications.
L‘algoritmo TINC aiuta a stabilire la percentuale di cellule tumorali presenti nel campione normale, in modo che, in presenza di un elevato livello di contaminazione, si possa attivare un flusso di analisi alternativo a quello standard, in grado di fornire a scienziati e medici dati più precisi sul genoma tumorale. Il fine è arrivare a una diagnosi più accurata che permetta di scegliere le terapie più adatte da somministrare a ciascun paziente.
Il nuovo algoritmo è immediatamente entrato a far parte degli strumenti di lavoro con cui Genomics England, società britannica di proprietà del Ministero della Salute e dell'Assistenza Sociale del Regno Unito, quotidianamente fornisce le analisi di Whole Genome Sequencing agli ospedali e ai centri clinici de Servizio Sanitario Nazionale del Regno Unito.
I ricercatori hanno testato TINC utilizzando i dati di sequenziamento raccolti nell’ambito del progetto su larga scala “100.000 genomi”, che nel 2013 ha portato alla fondazione di Genomics England. Hanno quindi confrontato i dati elaborati dall’algoritmo con quelli ottenuti attraverso le tecnologie standard utilizzate per il test di malattia residua nei tumori del sangue. Si tratta di test in cui si verifica il numero di cellule tumorali rimaste nel sangue di un paziente dopo il trattamento.
“I Progetti che su larga scala utilizzano le tecnologie di sequenziamento per studiare le malattie oncologiche hanno un potenziale rivoluzionario”, sostiene Giulio Caravagna, professore di Informatica dell’Università di Trieste e responsabile del Laboratorio Cancer Data Science, sostenuto dalla Fondazione AIRC per la ricerca sul cancro. “Tuttavia – prosegue Caravagna – l‘uso di tecnologie innovative come Whole Genome Sequencing richiede strumenti di analisi altrettanto innovativi. Il nostro laboratorio è fortemente specializzato nella costruzione di tali strumenti. Lo sviluppo di TINC nasce nell’ambito di una prestigiosa collaborazione internazionale tra l'Università degli Studi di Trieste e Genomics England e la sua implementazione in un contesto clinico su tutto il territorio inglese rappresenta un traguardo eccezionale che conferma il valore della ricerca in scienza dei dati del nostro ateneo”.
“L'implementazione dell'algoritmo TINC nella pipeline di Genomics England – spiega Alona Sosinsky, direttore scientifico del settore oncologico dell’azienda pubblica britannica – ci ha permesso di migliorare l'accuratezza dei test genomici per i pazienti con tumori del sangue. Questo progetto è un esempio di successo in cui dati generati da un progetto di sequenziamento su larga scala vengono interpretati usando tecniche di analisi avanzate, al fine di ottenere strumenti maggiormente precisi da cui prendere decisioni cliniche per la cura dei pazienti”.
"Grazie al Servizio di Medicina Genomica, ora utilizziamo il sequenziamento dell'intero genoma di routine per la diagnostica in ambito clinico - afferma Jack Bartram, specialista in ematologia pediatrica del Great Ormond Street Hospital for Children, struttura gestita dal NHS Foundation Trust -. L'implementazione dell'algoritmo TINC ci consente, come clinici, una maggiore fiducia nell'analisi dei dati genomici, che in ultima analisi vengono utilizzati ogni giorno per migliorare le terapie rivolte ai nostri pazienti".
***************************
Studio pubblicato su Nature Communications, 18 gennaio 2024
‘Clinical application of tumour in normal contamination assessment from whole genome sequencing’
Jonathan Mitchell1,8, Salvatore Milite 2,3,8, Jack Bartram4, Susan Walker1, Nadezda Volkova1, Olena Yavorska1, Magdalena Zarowiecki1, Jane Chalker5, Rebecca Thomas4, Luca Vago6, Alona Sosinsky1,9 & Giulio Caravagna3,7,9
1Genomics England, London, UK.
2Computational Biology Research Centre, Human Technopole, Milan, Italy.
3Cancer Data Science Laboratory, Department of Mathematics, Informatics and Geosciences, University of Trieste, Trieste, Italy.
4Department of Haematology, Great Ormond Street Hospital for Children, London, UK.
5Specialist Integrated Haematological Malignancy Diagnostic Service - Acquired Genomics, Great Ormond Street Hospital for Children, London, UK.
6Research Unit of Immunogenetics, Leukemia Genomics and Immunobiology, IRCCS Hospital San Raffaele, Milan, Italy.
7Centre for Evolution and Cancer, The Institute of Cancer Research, London, UK.
8These authors contributed equally: Jonathan Mitchell, Salvatore Milite.
9These authors jointly supervised this work: Alona Sosinsky, Giulio Caravagna.