Episodio

Detección de eQTLs a partir de datos de secuenciación multidimensionales mediante el recuento2

con Kai Kammers

useR!2017: Detección de eQTLs de se...

Palabras clave: eQTLs, RNA-seq, recuento2, Efecto por lotes, gEUVADIS
Páginas web: https://jhubiostatistics.shinyapps.io/recount/, https://www.bioconductor.org/packages/recount
count2 es un recurso de varios experimentos lanzado recientemente de conjuntos de datos RNA-seq gen y exon count listos para análisis para 2041 estudios diferentes con más de 70.000 muestras de RNA-seq humanas del Archivo de lectura de secuencia (SRA), Genotype-Tissue Expression (GTEx) y The Cancer Genome Atlas (TCGA) proyectos (Collado-Torres et al. (2016)). Las lecturas de secuenciación sin procesar se procesaron con Rail-RNA como se describe en Nellore et al. (2016). Los objetos RangedSummarizedExperiment en el nivel de uniones gene, exon o exon-exon, los recuentos sin procesar, los metadatos fenotipos usados, las direcciones URL de los archivos bigWig de cobertura de muestra o el archivo bigWig de cobertura media para un estudio determinado se puede acceder a través del recuento del paquete Bioconductor o a través de una aplicación Shiny.
Usamos esta fuente de datos de expresiones RNA-seq preprocesadas para presentar nuestro protocolo de análisis desarrollado recientemente para realizar análisis eQTL extensos. El objetivo de un análisis eQTL es detectar patrones de expresión genética relacionados con variantes genéticas específicas. Mostramos cómo integrar datos de expresiones genéticas de la información de recuento2 y genotipo para realizar análisis eQTL y visualizar los resultados con trazados de interacción gen-SNP. Explicamos en detalle cómo se filtran, transforman y corrigen por lotes los datos de expresiones y genotipos. También se describen posibles problemas y artefactos que pueden producirse al analizar datos genómicos de diferentes orígenes conjuntamente. Nuestro protocolo se prueba en un conjunto de datos disponible públicamente del proyecto de secuenciación de ARN del consorcio GEUVADIS y también se aplica a los datos ómicos generados recientemente del proyecto GeneSTAR en la Universidad Johns Hopkins.
Referencias Collado-Torres, Leonardo, Abhinav Nellore, Kai Kammers, Shannon E Ellis, Margaret A Taub, Kasper D Hansen, Andrew E Jaffe, Ben Langmead y Jeffrey Leek. 2016. "Recuento: un recurso a gran escala de los datos de expresiones RNA-seq listos para el análisis". bioRxiv. doi:10.1101/068478.

Nellore, Abhinav, Leonardo Collado-Torres, Andrew E Jaffe, Jose Alquicira-Hernandez, Christopher Wilks, Jacob Pritt, James Morton, Jeffrey T Leek y Ben Langmead. 2016. "Rail-RNA: Análisis escalable de splicing y cobertura de RNA-seq." Bioinformática. doi:10.1093/bioinformática/btw575.