Una piattaforma computazionale lavorare con i dati genomici

I recenti avanzamenti nel sequenziamento del DNA e dell’RNA hanno trasformato il campo della genomica, rendendo possibile l’ottenimento di grandi quantità di dati in modo rapido e a basso costo. Ora, i ricercatori finanziati dall’UE hanno sviluppato gli strumenti statistici necessari per l’analisi di centinaia di gigabyte di dati prodotti in ogni singola sequenza eseguita.

I progressi compiuti dopo la prima sequenza del genoma umano all’epoca nascente della medicina genomica sono stati resi possibili grazie al sequenziamento ad alto-rendimento (HTS). Questa tecnologia permette il rapido sequenziamento di grandi tratti di coppie di base di DNA e RNA che abbracciano interi genomi. Tuttavia, per estrarre significativi segnali biologici, l’HTS richiede strumenti statistici efficienti e potenti a livello computazionale.

Il progetto RADIANT (Rapid development and distribution of statistical tools for high-throughput sequencing data), finanziato dall’UE, è stato lanciato per migliorare gli strumenti di analisi dei dati più popolari. Il proprio obiettivo finale era quello di integrare i pacchetti software sviluppati dai ricercatori in Francia, Germania, Italia, Svizzera e Regno Unito, in un unico contesto computazionale.

Tra questi vi è la libreria Python HTSeq, che pre-elabora i dati di sequenziamento dell’RNA per l’analisi dell’espressione genica differenziale. Il pacchetto DESeq2 fornisce metodi per rilevare a livello differenziale i geni espressi mediante modelli lineari generalizzati. D’altra parte, il pacchetto BitSeqVB realizza un approccio Bayesiano per dedurre la concentrazione dei trascritti di RNA messaggero.

La ricerca nell’ambito del progetto RADIANT ha coperto tutti gli aspetti dell’analisi dei dati HTS, dal controllo della qualità alla visualizzazione dei dati. Per le serie temporali dell’espressione genetica, è stato proposto un modello bayesiano gerarchico che può attribuire dati mancanti sia in modo sistematico che casuale. Il browser per il genoma di RADIANT è il primo strumento di visualizzazione sviluppato per i dati di metilazione del DNA.

La maggior parte degli strumenti sono stati inclusi nel software Bioconductor, fornendo un quadro uniforme per l’analisi, la documentazione e la distribuzione dei dati HTS. Tuttavia, l’enorme numero di pacchetti disponibili su Bioconductor rende difficile risolvere problemi specifici per gli utenti meno esperti. Una vignetta per principianti è stata quindi creata allo scopo di fornire informazioni semplici ma complete per l’analisi dei dati relativi al sequenziamento di RNA.

Grazie alla loro capacità di fornire una comprensione illimitata del genoma umano, le tecnologie di sequenziamento hanno permeato praticamente tutti i rami della ricerca biologica e medica. Con gli strumenti di nuova concezione RADIANT, l’analisi dei dati HTS diventerà uno strumento indispensabile. Le applicazioni previste sono in grado di trasformare gli studi genomici, sbloccando informazioni mai immaginate prima.

pubblicato: 2016-07-04
Commenti


Privacy Policy