Professional Documents
Culture Documents
Genómica y medicina
Irma Silva Zolezzi*
ABSTRACT (Genomics and Medicine)
During the last 20 years the world has witnessed how scientists deciphered the human genome
sequence and developed strategies to extensively study genetic diversity, linkage disequilibrium
(LD) structure and genetic expression in human populations. These remarkable advances have
made possible the comprehensive assessment of genetic diversity in many biological relevant
scenarios, which has helped increase our understanding about the contribution of genetic factors
to complex traits and diseases. The increased knowledge in human genomics has paved the way
for the development of “genomic medicine”, a field based on the development of new diagnostic
and therapeutic approaches for common multi-factorial diseases. Nevertheless, the advancement
is still limited and a lot is yet to be discovered. Currently, new technological tools, such as next-
generation sequencing are being generated, and innovative approaches like epigenomic profiling,
are being developed to undertake the immense challenges of comprehensively characterizing the
genetic bases of complex traits and diseases; as well as studying the interaction between genetic
and environmental factors such as diet, pharmacological treatments, infectious agents and others.
Although the translation of this knowledge to the clinical practice is still minimal, the genomics
sciences are inexorably changing our understanding of the biology of a myriad of medical
conditions. This review intends to cover the key concepts and most basic technology and
experimental designs that have been instrumental to study the link between our “genome
and medicine”.
número total de genes casi se duplica, si se consideran los Los seres humanos nacemos, crecemos y morimos prácti-
genes no-codificantes a proteína, los cuales en la base de datos camente con la misma información genética en nuestras célu-
del National Center for Biotechnological Information (ncbi) las; además, heredamos 50% de esta información a nuestra
de eua (agosto, 2010), eran 42,488 en el genoma humano y progenie. Debido a su naturaleza estable y heredable, la infor-
33,086 en el de la vaca. Lo anterior refleja el alto contenido mación genética representa una fuente potencial de biomar-
de información en regiones no-codificantes del genoma. cadores de amplia aplicación clínica, por lo que existe enorme
interés en estudiar el papel de los factores genéticos en la
enfermedad humana. El pgh ha sido un motor fundamental
para la investigación biomédica y clínica, y ha permitido el acerca del papel del genoma humano en la enfermedad, ha
avance de la medicina genética, la cual se enfoca al diagnósti- sentado las bases científica y tecnológica para el desarrollo de
co y tratamiento de enfermedades causadas por defectos en la “medicina genómica”, una nueva rama de la medicina ba-
genes específicos, que conocemos como enfermedades mo- sada en la aplicación del conocimiento genético en el diag-
nogénicas (ej. hemofilia, fibrosis quística, fenilcetonuria, nóstico y tratamiento de las enfermedades complejas (Feero,
etc.). Sin embargo, este amplio desarrollo importante en Guttmacher and Collins, 2010). Adicionalmente a la medici-
medicina, ha beneficiado sólo a una pequeña proporción de na, la potencial aplicación del conocimiento derivado del ge-
la población dada la baja prevalencia de este tipo de enfer- noma humano ha sido de gran interés para la industria farma-
medades, aproximadamente 10 de cada mil nacimientos céutica y la de alimentos. Para la primera, como una fuente de
(http://www.who.int/genomics/public/geneticdiseases/en/). conocimiento e información para favorecer el desarrollo de
Es así que en la última década, se han desarrollado meto- nuevos fármacos y nuevos esquemas terapéuticos (ej. dosis
dologías y abordajes de investigación basados en el conoci- ajustadas de acuerdo con el genotipo, nuevas aplicaciones
miento genómico para intentar descubrir los factores genéti- para fármacos en uso, etc.), y para la segunda, como una opor-
cos que participan en la conformación de los rasgos y tunidad de posicionar ciertos alimentos, ingredientes específi-
enfermedades “frecuentes o comunes” a las poblaciones hu- cos o bioactivos nutricionales/nutracéuticos, de acuerdo con
manas, como la diabetes o el cáncer, que son importantes cau- su beneficio potencial en base a las características genéticas
sas de morbilidad y mortalidad, La mayoría de los rasgos y del consumidor para promover la salud y prevenir enfer
enfermedades comunes (ej. estatura, niveles de glucosa, cán- medad. Lo anterior ha impulsado el desarrollo de la Farmaco-
cer, diabetes, enfermedades cardiovasculares, etc.) son “com- genómica y la Nutrigenómica; ambas disciplinas utilizan es-
plejos o multifactoriales”; es decir, resultan de la interacción trategias “ómicas” (genómica, transcriptómica, proteómica,
de factores genéticos y ambientales. Por lo anterior, es funda- epigenómica, metabolómica, etc.), para estudiar las interac-
mental no sólo identificar a estos factores, sino también el ciones factores genéticos y factores ambientales y, en particu-
papel de las interacciones entre genes y ambiente en el desa- lar, medicamentos y dieta, respectivamente.
rrollo y la severidad de los mismos. El creciente conocimiento
haplotipo, pueden ser caracterizados selectivamente para in- mas tecnológicas que permite caracterizar 300,000 snps y
terrogar simultáneamente al resto (figura 6), a lo que se le con los resultados generar información digital sobre más de
conoce como “etiquetado o tagging” de snps (Balding, 2006). 4 millones de snps (Tian, et al., 2008; Anderson, et al., 2008).
La estructura de haplotipos es una característica poblacional; Este conocimiento ha favorecido el desarrollo de tecnolo-
por lo tanto, los snps “etiqueta o tag” pueden ser diferentes en gía para analizar desde unos cuantos hasta millones de snps y
grupos poblacionales distintos (Frazer, et al., 2009). En la úl- decenas de miles de cnvs en una muestra de adn. La plata-
tima década, densos mapas de variabilidad genómica se han forma más utilizada con este fin es una tecnología conocida
generado para algunas poblaciones, incluyendo la mexicana, como microarreglo o “chip genético”, el cual consiste en una
con el objetivo de permitir la reconstrucción de haplotipos y matriz de oligonucleótidos secuencia-específicos (sondas) or-
la selección de snps etiqueta (The International HapMap denados y unidos a una superficie sólida, que se unen especí-
Project, 2003; A haplotype map, 2005; Teo, et al., 2009; Silva- ficamente o “hibridizan” al material genético a analizar previa-
Zolezzi, et al., 2009). Los mapas de haplotipos más completos mente amplificado y marcado, generalmente con fluorescencia
disponibles hoy en día son los de poblaciones con orígenes an- (figura 7). Posteriormente la señal fluorescente se cuantifica
cestrales del noroeste de Europa (ceu), del este de Asia (chb usando algún sistema de escaneo acoplado a un programa de
y jpt) y del oeste de África (yri), todas de la fase inicial del análisis de imágenes para determinar cuáles son las variantes
Proyecto Internacional del Mapa de Haplotipos (HapMap) genéticas presentes en la muestra. Los microarreglos, inclusi-
(The International HapMap Project, 2003). Para estas pobla- ve los que evalúan millones de snps pueden procesarse por
ciones y las de estructura genética similar, existen ensayos ba- una persona, en unos cuantos días, por cientos de dólares; en
sados en snps etiqueta, así como estrategias estadísticas y contraste, generar la misma información hace menos de diez
computacionales (ej. imputación) que permiten caracterizar años, hubiese requerido de varias personas, meses de trabajo,
ampliamente la diversidad genética (McCarthy, et al., 2008). y cientos de miles de dólares (Feero, Guttmacher, and Collins,
En el caso de poblaciones de origen europeo, existen platafor- 2010).
Estudios de Asociación de Genoma Completo cias en orígenes ancestrales o diferencias demográficas (es
Los estudios de asociación de genoma completo, también co- tratificación poblacional) y no relacionadas al fenotipo en
nocidos como gwas por sus siglas en inglés, han revoluciona- estudio.
do la investigación genómica en los últimos cinco años. Este Existen factores críticos en el diseño y análisis de gwas,
abordaje ha sido posible en buena medida gracias a los mi- entre los que destacan tres: a) la selección cuidadosa de casos
croarreglos (figura 4), los cuales han facilitado la caracteriza- y controles para minimizar potenciales sesgos (ej. edad, sexo,
ción sistemática de una gran proporción de la variabilidad etnicidad, etc.), b) la selección de los marcadores a caracteri-
genética en estudios de casos y controles, estudios de cohorte zar o genotipificar (ej. snps etiqueta, snps codificantes, etc.), y
y ensayos clínicos. El diseño al que se ha acudido mayoritaria- c) el control de calidad de los datos (McCarthy, et al., 2008).
mente es el de casos y controles, el cual de manera muy gene- Para descartar efectos de estructura genética y/o de factores
ral consiste en comparar la frecuencia de los factores estudia- ambientales es necesario validar las señales de asociación ge-
dos (en este caso variantes genéticas) en un grupo de nética mediante su replicación con un alto nivel de certidum-
individuos afectados (ej. obesos) y un grupo de individuos no bre estadística (P < 5 × 10–01), en un número de individuos
afectados (ej. delgados), para determinar si existe una dife- más grande al grupo en donde se identificó, y/o en diferentes
rencia significativa en la frecuencia de una o más de estas va- poblaciones (McCarthy, et al., 2008). Adicionalmente, es de-
riantes entre ambos grupos (figura 8). Este abordaje posee seable generar evidencia del efecto funcional de la variación
fortalezas y limitaciones, que se han identificado y han sido genética identificada (ej. modificación del patrón de expre-
evaluadas por diferentes grupos en el mundo (McCarthy, sión o de la función de un arn o proteína codificada por un
et al., 2008). Una de sus principales fortalezas es que por su gen), lo que es un reto, ya que la mayoría de la asociaciones
diseño libre de hipótesis, permite a la identificar regiones ge- identificadas mediante este tipo de abordaje son indirectas, y
néticas, que nunca se habrían sospechado como relevantes son capturadas gracias al fenómeno de desequilibrio de liga-
para las enfermedades estudiadas, y que por lo tanto proba- miento, es decir a la correlación entre pares de variantes gené-
blemente no habrían sido incluidos en estudios basados en ticas dentro de una región cromosómica. Para identificar las
regiones específicas o candidato. Por otro lado, una limitación variantes genéticas verdaderamente causales del efecto bioló-
importante es la presencia de un número considerable de fal- gico relacionado al fenotipo, normalmente se recurre a estra-
sos positivos por efecto del análisis simultáneo de múltiples tegias de mapeo fino y/o re-secuenciación de las regiones
pruebas estadísticas (al menos una por snp), así como las identificadas en los gwas. El mapeo fino consiste en analizar
diferencias en frecuencias alélicas ocasionadas por diferen- las regiones candidato identificadas en los gwas utilizando
mayor densidad de marcadores, en tanto que la resecuencia- (Manolio, 2010). Lo anterior hace evidente que en el desarro-
ción se basa en analizar una a una cada base contenida en esas llo de la medicina personalizada, estamos aún lejos de contar
regiones. con perfiles genéticos predictivos, así como de contar con in-
A la fecha se han publicado más de 600 gwas, en los que formación suficiente para desarrollar políticas y lineamientos
han sido identificadas aproximadamente 800 asociaciones basados en evidencia que permitan llevar este conocimiento a
significativas (p < 5 × 10–8) entre snps y, rasgos y/o patologías la práctica clínica (Feero, Guttmacher, and Collins, 2010).
complejos a todo lo largo del genoma (figura 9) (Manolio, A pesar de la baja posibilidad de traducir de manera direc-
2010). Estos resultados han sido importantes para el estudio ta los resultados de los gwas a un beneficio clínico, estos ha-
de varias enfermedades, aunque con distinto grado de rele- llazgos han demostrado tener un valor fundamental en la
vancia, ej. en la degeneración macular relacionada a la edad identificación de nuevas vías y procesos biológicos subyacen-
(dmre), una enfermedad degenerativa que resulta en ceguera tes a la enfermedad humana. La mayor parte de este conoci-
parcial o total en adultos mayores. Se han identificado cinco miento, previo a la era de los gwas, no se había sospechado
snps que explican más del 50% del riesgo genético en familia- como de potencial relevancia. Un ejemplo es la clara asocia-
res de individuos afectados (Katta, Kaur, and Chakrabarti, ción de la vía del complemento en el desarrollo de la dmre, y
2009). Un escenario más común se ejemplifica en dos enfer- la evidencia de que la autofagia, un proceso catabólico de
medades autoinmunes: Chron y diabetes tipo 1, en las que se autodestrucción de componentes celulares, es un proceso re-
han identificado >30 snps, algunos con contribuciones impor- levante en el desarrollo de la enfermedad de Chron. La iden-
tantes al riesgo y la mayoría con efectos pequeños (Manolio, tificación de nuevos genes y vías biológicas asociados a pato-
2010). Finalmente, para muchas enfermedades no se han en- logías ha generado un gran número de candidatos para la
contrado respuestas claras, y en ocasiones para identificar al- investigación y el desarrollo de nuevos y mejores sistemas
guna señal se ha requerido analizar a decenas de miles de in- diagnóstico y tratamientos. Adicionalmente, se han identifica-
dividuos (ej. hipertensión) (Ehret, 2010), o de estrategias do asociaciones en múltiples regiones genéticas que no per-
estadísticas sofisticadas como el meta-análisis (Ioannidis, Tho- miten hacer hipótesis acerca de su relevancia funcional, y por
mas, and Daly, 2009). En casi todos los fenotipos estudiados, lo tanto subrayan la existencia de lagunas en nuestro conoci-
las asociaciones tienen contribuciones pequeñas al riesgo y miento. Por esto, es necesario desarrollar nuevas estrategias
explican porcentajes bajos (5-10%) del riesgo genético total para identificar los mecanismos biológicos subyacentes a la
enfermedad. Actualmente muchos recursos están siendo in- cadiano, etc.). Lo anterior, contrasta con lo que sucede con el
vertidos para descubrir las fuentes de riesgo heredable que genoma de un organismo, el cual es estable y se mantiene
hoy son desconocidas (Manolio, 2010), las cuales muy proba- prácticamente idéntico en casi todas las células a lo largo de
blemente residen más allá de la secuencia de las bases del su vida, con algunas excepciones como células sexuales y tu-
adn, en el complejo universo de la regulación de la expresión morales. El dinamismo del proteoma y el transcriptoma re-
genética. presenta un reto para su estudio, pero el hecho de que estos
llevan a cabo la mayoría de las funciones biológicas, los con-
El estudio de los perfiles de expresión genética vierte en un recurso invaluable de información para entender
Un gran reto en la genómica humana es la caracterización de la biología humana. Además, la identificación de biomarcado-
la compleja red estructural y funcional que se establece cuan- res proteicos es de fundamental relevancia por su alto poten-
do la información genética de una célula, en un momento y cial de utilidad clínica, gracias a la posibilidad de usar una
circunstancia particular, es transcrita a arn y es traducida a gran variedad de técnicas convencionales no invasivas para su
proteína (figura 10). Este proceso (transcripción) da lugar al determinación, más sencillas que las que se utilizan para ma-
conjunto de moléculas de arn conocido como transcriptoma, racadores genéticos.
y el conjunto de procesos coordinados de traducción de En paralelo al desarrollo de tecnología para analizar el ge-
marns a proteínas y los eventos post-traduccionales (ej. glu- noma se han desarrollado herramientas para el análisis global
cosilación, esterificación, acetilación, etc.) da lugar al proteo- del transcriptoma. Su aplicación ha resultado en generación de
ma. En un organismo, transcriptoma y proteoma son cuerpos conocimiento de mucha utilidad en investigación biomédica
moleculares dinámicos que se transforman dependiendo del y clínica, y ha revelado la importancia biológica en la regula-
tipo celular, y de las condiciones particulares en las que se ción de la expresión genética de moléculas como los arns
encuentran las células o tejidos (etapa del desarrollo, exposi- no codificantes (ncarns) (Malecova, and Morris, 2010). En
ciones a agentes endógenos y/o exógenos, etapa del ciclo cir- particular, se han identificado a los arns pequeños de inter