Nuovo metodo migliora l'analisi dei cambiamenti nei tratti
HyperTraPS-CT migliora la comprensione dei processi di accumulo in vari campi scientifici.
― 6 leggere min
Indice
In vari campi come biologia, medicina e fisica, i ricercatori studiano i processi di accumulo. Questi processi riguardano la raccolta o la perdita di certi tratti nel tempo. Si possono vedere in cose come l'evoluzione delle specie o il progresso delle malattie nei pazienti. I tratti possono essere semplici come le Mutazioni genetiche in un paziente oncologico o i sintomi specifici mostrati da qualcuno con una malattia.
Capendo come questi tratti cambiano nel tempo, gli scienziati possono scoprire di più sui meccanismi dietro a questi processi. Possono anche fare previsioni sui tratti che non sono stati misurati e stimare come i sistemi potrebbero comportarsi in futuro. Questo approccio aiuta a identificare le Caratteristiche che guidano il progresso attraverso i percorsi di accumulo o che ne sono influenzati.
Lo Studio dei Tratti Evolutivi
L'investigazione di come i tratti cambiano nel tempo in specie correlate ha una lunga storia. Tuttavia, trovare metodi generali che funzionino bene per grandi set di Dati può essere piuttosto difficile. Sono stati creati molti metodi per aiutare a visualizzare questi cambiamenti, come costruire alberi filogenetici o analizzare la dinamica dei tratti su questi alberi. Alcuni di questi metodi sono inclusi in strumenti software popolari.
D'altra parte, un'area di ricerca separata si concentra su come i tratti si accumulano nella progressione del cancro. Questi approcci di solito descrivono come le mutazioni avvengono nel tempo. Alcuni metodi classici si basano su modelli di Markov, che esaminano le Transizioni tra diversi stati di malattia basandosi su osservazioni. I ricercatori hanno anche utilizzato reti bayesiane per analizzare questi tratti negli studi sul cancro.
Nuovi Metodi per l'Analisi dei Dati
Per affrontare le sfide dell'analisi di grandi set di dati, è stato sviluppato un nuovo metodo chiamato HyperTraPS. Questo metodo non fa assunzioni rigide sugli stati dei tratti o sull'indipendenza delle loro acquisizioni. Funziona all'interno di un framework bayesiano, che consente di incorporare conoscenze pregresse e incertezze.
HyperTraPS si concentra sulle transizioni tra stati piuttosto che sulle singole osservazioni. Questo lo rende utile per lavorare con dati longitudinali, dati filogenetici o campioni trasversali. Utilizza un metodo di campionamento che analizza i percorsi che probabilmente si vedrebbero nelle transizioni reali. Questo è più efficiente rispetto ad altri metodi che potrebbero avere difficoltà con set di dati più grandi.
Oltre a HyperTraPS, sono stati sviluppati due metodi correlati chiamati inferenza del paesaggio fenotipico e HyperHMM. Questi metodi hanno ampliato i tipi di interazioni consentite tra i tratti analizzati. Mentre HyperTraPS è efficace nell'identificare nuovi percorsi nella progressione del cancro, la sua flessibilità ha permesso applicazioni anche in vari altri campi.
Collegare Dati e Tempo
Una differenza significativa tra i vari metodi sta nel modo in cui gestiscono il tempo. Alcuni approcci usano un tempo di campionamento implicito che stabilisce una scala temporale continua per le dinamiche inferite. Altri, come HyperTraPS, considerano solo l'ordine delle transizioni senza concentrarsi sul timing.
Tuttavia, in molti studi, c'è una certa quantità di informazioni temporali disponibili. Questo può essere sotto forma di lunghezze dei rami negli alberi filogenetici. Poiché i cambiamenti possono verificarsi in tempi sconosciuti, è fondamentale considerare l'incertezza attorno a questi momenti di osservazione.
Per affrontare ciò, HyperTraPS è stato esteso in HyperTraPS-CT. Questo nuovo metodo incorpora tempistiche assolute, che possono essere specificate in modo preciso o rappresentate come un intervallo di valori possibili. HyperTraPS-CT mantiene i vantaggi del metodo HyperTraPS originale aggiungendo la capacità di utilizzare informazioni temporali.
Come Funziona HyperTraPS-CT
HyperTraPS-CT analizza stati osservati descritti dalla presenza o assenza di tratti binari. Ogni tratto può essere rappresentato come parte di una stringa binaria, dove '1' indica la presenza e '0' indica l'assenza di quel tratto. Il metodo consente transizioni tra questi stati a un tasso definito.
Utilizzando dati osservati, HyperTraPS-CT può calcolare la probabilità di passare da uno stato a un altro in finestre temporali definite. Mentre può gestire la piena complessità dei percorsi in piccoli set di dati, set di dati più grandi potrebbero richiedere tecniche di campionamento per concentrarsi sulle transizioni più probabili.
L'algoritmo costruisce percorsi compatibili con lo stato finale, riducendo gli sprechi computazionali evitando percorsi che non corrispondono alle osservazioni. Questo processo efficiente consente ai ricercatori di stimare le probabilità di transizione e identificare i percorsi rilevanti di cambiamento.
Inferenza Dinamica e Previsioni
Una volta stabilita la probabilità delle transizioni, i ricercatori possono esplorare diverse strutture di parametri per comprendere meglio le dinamiche in gioco. HyperTraPS-CT può adattarsi a vari modelli che descrivono come i tratti influenzano l'uno l'altro in base alla loro struttura.
Questa flessibilità consente agli scienziati di analizzare dati provenienti da diverse fonti, come set di dati trasversali o longitudinali. Il metodo può anche incorporare informazioni pregresse per affinare i risultati dell'analisi.
Inoltre, HyperTraPS-CT include un insieme di output che forniscono approfondimenti sulle dinamiche sottostanti dei tratti studiati. Questi includono ordinamenti delle transizioni, tempi previsti e stati previsti in vari momenti nel tempo.
Applicazioni nel Mondo Reale
HyperTraPS e le sue estensioni sono stati applicati con successo in vari campi, incluso lo studio della progressione del cancro e l'evoluzione della resistenza antimicrobica nella tubercolosi.
Ad esempio, i ricercatori hanno usato HyperTraPS-CT per valutare come le mutazioni si accumulano nella leucemia mieloide acuta. I metodi identificano percorsi di acquisizione di mutazioni, rivelando intuizioni su come il cancro evolve nel tempo. I risultati hanno mostrato un'ordinazione coerente delle mutazioni e hanno identificato interazioni tra diversi percorsi di mutazione.
In un'altra applicazione, HyperTraPS-CT è stato utilizzato per analizzare l'evoluzione della resistenza ai farmaci nella tubercolosi. Utilizzando un set di dati che tiene traccia dei ceppi batterici, i ricercatori sono stati in grado di inferire i percorsi di acquisizione della resistenza ai farmaci. Considerando le informazioni temporali continue, hanno scoperto dinamiche importanti che i metodi discreti tradizionali potrebbero perdere.
Previsioni e Direzioni Future
HyperTraPS-CT non solo aiuta ad analizzare i dati esistenti, ma anche a fare previsioni sui comportamenti futuri. Ad esempio, basandosi sui dati osservati, il metodo può prevedere la prossima resistenza probabile che si svilupperà nei ceppi batterici.
I ricercatori hanno testato le capacità predittive di HyperTraPS-CT allenando modelli su sottogruppi di dati. Hanno scoperto che il modello poteva prevedere accuratamente i prossimi passi nell'acquisizione dei tratti. Inoltre, poteva inferire tratti non visti da dati parzialmente osservati, dimostrando la sua utilità in applicazioni reali.
La flessibilità di HyperTraPS-CT consente anche agli scienziati di esplorare interazioni di ordine superiore, che possono contribuire a comprendere dinamiche complesse nei processi di accumulo. Man mano che più dati diventano disponibili e i metodi evolvono, HyperTraPS-CT e approcci simili continueranno ad adattarsi, trovando applicazioni in una gamma più ampia di domande scientifiche.
Conclusione
I processi di accumulo sono fondamentali per comprendere i cambiamenti nei tratti in campi come biologia e medicina. Con metodi come HyperTraPS-CT, i ricercatori possono analizzare strutture di dati complesse e fare previsioni sulle dinamiche dei tratti nel tempo. Incorporando informazioni temporali e consentendo flessibilità nelle fonti di dati, questi nuovi metodi migliorano la nostra capacità di studiare e comprendere i meccanismi sottostanti che guidano questi processi.
Titolo: HyperTraPS-CT: Inference and prediction for accumulation pathways with flexible data and model structures
Estratto: Accumulation processes, where many potentially coupled features are acquired over time, occur throughout the sciences, from evolutionary biology to disease progression, and particularly in the study of cancer progression. Existing methods for learning the dynamics of such systems typically assume limited (often pairwise) relationships between feature subsets, cross-sectional or untimed observations, small feature sets, or discrete orderings of events. Here we introduce HyperTraPS-CT (Hypercubic Transition Path Sampling in Continuous Time) to compute posterior distributions on continuous-time dynamics of many, arbitrarily coupled, traits in unrestricted state spaces, accounting for uncertainty in observations and their timings. We demonstrate the capacity of HyperTraPS-CT to deal with cross-sectional, longitudinal, and phylogenetic data, which may have no, uncertain, or precisely specified sampling times. HyperTraPS-CT allows positive and negative interactions between arbitrary subsets of features (not limited to pairwise interactions), supporting Bayesian and maximum-likelihood inference approaches to identify these interactions, consequent pathways, and predictions of future and unobserved features. We also introduce a range of visualisations for the inferred outputs of these processes and demonstrate model selection and regularisation for feature interactions. We apply this approach to case studies on the accumulation of mutations in cancer progression and the acquisition of anti-microbial resistance genes in tuberculosis, demonstrating its flexibility and capacity to produce predictions aligned with applied priorities.
Autori: Iain Johnston, O. N. L. Aga, M. Brun, K. Giannakis, K. A. Dauda, R. Diaz-Uriarte
Ultimo aggiornamento: 2024-03-12 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.03.07.583841
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.07.583841.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.