You are on page 1of 2

Ejercicios RNAseq

PROBLEMA 1. La librera tweeDEseqCountData contiene los datos correspondientes a una tabla


de conteos para un experimento de RNA-seq llevado a cabo por Pickrell et al. (2010). Los datos
corresponden a unas lineas celulares linfoblastoides obtenidas de 69 Nigerianos no relacionados. Esta
informacion, junto a informacion fenotpica se encuentra en un objeto de clase eSet que se obtiene
despues de ejecutar
data(pickrell)
La informacion sobre anotacion (a partir de ENSEMBL) esta en un data.frame que se puede obtener
mediante:
data(annotEnsembl63)
a) Normaliza los conteos utilizando el metodo RPKM. NOTA: puede que todos los genes no esten.
Hazlo con los que haya informacion
b) Normaliza los conteos utilizando el metodo TMM
c) Normaliza los conteos utilizando la informacion de GC-content y gene length (usa la funcion
normalizeCQN
d) Crea un MA-plot con cada normalizacion y discute si hay alguna diferencia entre cada metodo
PROBLEMA 2. En esta practica vamos a comparar el nivel de expresion entre hombres y mujeres
para una lista concreta de genes. Esta lista la podeis obtener ejecutando las siguientes instrucciones
library(tweeDEseqCountData)
data(pickrell)
data(hkGenes)
data(genderGenes)
countsNigerian <- exprs(pickrell.eset)
geneSubset <- unique(c("ENSG00000070031",
intersect(rownames(countsNigerian),
c(hkGenes, msYgenes, XiEgenes))))
Esta lista contiene algunos Housekeeping Genes (no deberan expresarse de manera diferencial entre
sexos) y una serie de genes sexo-especcos seleccionados del cromosoma X que escapan a la X-
inactivacion (Carrel and Willard, 2005) y otros genes en la region hombre-especca del cromosoma Y
(Skaletsky et al., 2003). La lista de los housekeeping genes se ha obtenido de la literatura (Eisenberg
and Levanon, 2003) usando solo aquellos genes que forman parte de la tabla inicial
a) Crea una tabla de conteos normalizada utilizando todos los genes y el metodo TMM implementado
en el paquete tweeDEseq y ltra aquellos individuos que creas oportunos
1
b) Selecciona de esta tabla de conteos normalizados los genes que se encuentran en la lista geneSubset
c) Determina aquellos genes diferencialmente expresados entre hombres y mujeres mediante edgeR
DESeq y tweeDEseq. Guarda los resultados en un archivo
d) Crea un MA-plot y resalta los genes sexo-especcos para ver si el metodo los detecta como difer-
encialmente expresados [Opcional: haz el volcano plot]
e) Existen diferencias entre los tres metodos? que metodo es mejor? (NOTA: se esperara que solo
los genes sexo-especcos fueran declarados como diferencialmente expresados)
2

You might also like