Professional Documents
Culture Documents
Qué Es El Genoma Humano
Qué Es El Genoma Humano
que forman una especie de hilo que tiene en un mis- bosas, y por el otro están libres para interactuar. Dos
mo lado todas las bases nitrogenadas, como en un co- hebras constituidas así y enlazadas entre sí por unio-
llar de abalorios. Las bases nitrogenadas están por un nes químicas débiles, llamadas puentes de hidrógeno,
lado unidas al armazón de grupos fosfato y desoxirri- que unen los extremos libres de las bases nitrogena-
das, constituyen una molécula de ADN
(Figura 3). La unión de las bases por me-
dio de puentes de hidrógeno se realiza de
la siguiente manera: siempre se une una
purina con una pirimidina, de modo tal
que la adenina se une siempre con la timi-
na y la guanina con la citosina (A con T y
G con C). No se pueden unir de otro mo-
do porque la adenina y la timina forman
entre sí dos puentes de hidrógeno, mien-
tras que la citosina y la guanina forman
tres (Figura 3).
Es esta característica de las bases nitro-
genadas de los nucleótidos, de unirse for-
mando parejas invariantes, lo que le da a
la molécula de ADN una propiedad muy
secuencia que se obtiene de ir “leyendo” cada nucleó- mente un metro. Esto es justamente lo que están ter-
tido de acuerdo con su lugar en la hebra —de igual minando de elaborar el Proyecto Genoma Humano y
modo que al leer nosotros una palabra vemos en qué la compañía Celera: conocer y ensamblar toda esta
lugar está cada una de las letras que la conforman— secuencia correctamente. Es como tener una oración
nos va a decir qué tipo de mensaje está codificado. gigantesca de 3 mil millones de letras. Embebidas
Por supuesto, la información que contenga una se- dentro de esta secuencia se encuentran palabras que
cuencia como GAATTC no será la misma que la que codifican para todos nuestros genes. A su vez, cada
contenga otra secuencia como TATAGC, aunque gen que poseemos puede codificar finalmente para
ambas sean del mismo tamaño y utilicen las mismas una proteína o para otro tipo de ácido nucleico, lla-
letras, de igual manera que CARO no es lo mismo mado ácido ribonucleico, o ARN, que es de cadena
que ROCA. Todo el genoma humano (el conjunto de sencilla. Estos resultados se publicaron en el otoño del
todos los genes que poseemos como especie) está co- año 2000. Finalmente tenemos los libros, volviendo a
dificado en las moléculas de ADN que poseemos nuestra metáfora de la construcción, que contienen
en cada una de nuestras células. todas las instrucciones para hacer la casa. Es decir, te-
Estas moléculas son tan largas nemos el libro que especifica a nuestra especie. Aho-
y delgadas que si ra es necesario entender e interpretar este libro.
las estiráramos y Hagamos algunas aclaraciones acerca de la sin-
taxis del idioma del ADN: la secuencia es con-
tinua, como una gargantuesca oración que nos
dejaría sin aliento muchísimo antes del final,
y dentro de ella, embebidos, y frecuentemente
segmentados, se encuentran los genes. Si hacemos una
comparación con las letras del alfabeto, podríamos
proponer que un segmento del genoma se vería así:
actdbacieghiiiiROgtfdvbgfsabnammmnuloka
huiypacCAmkolkijhjaauaaahkn
unir RO con CA para formar la palabra, y que debe- tuvo un papel muy revelante en la secuenciación
mos desechar la secuencia mk, que significaría que ése del genoma: para poder leerlo todo, se tuvo que partir
es el final de la palabra. Ésta es parte de la informa- al genoma en partes muy pequeñas, que se podían se-
ción, pero también dentro de la secuencia hay otros cuenciar, para luego almacenar la información, y fi-
mensajes: se especifica cuándo debe leerse ROCA, en nalmente, como en un rompecabezas, colocar todos
dónde debe leerse y quiénes deben leer ROCA. Es de- los fragmentos de secuencia en el lugar adecuado. Se
cir, no todas las células del cuerpo expresan todos los dice que ensamblar el genoma humano es el rompe-
genes que tenemos. Por ejemplo, una neurona no ex- cabezas más complejo que ha resuelto la especie hu-
presa el gen que codifica para la queratina, que es la mana hasta hoy día, un reto que hace empequeñecer
proteína mayoritaria del pelo, así como una célula el famoso nudo gordiano o el laberinto de Minos.
pilosa no expresa las proteínas que sirven para fabri- El 15 de febrero de 2001 se dio a conocer pública-
car los mensajeros que utilizan las neuronas para co- mente los resultados de este esfuerzo de secuenciación.
municarse entre sí. Además, los genes no necesaria- El genoma humano se compone aproximadamente de
mente se expresan todo el tiempo, sino que muchas 3 mil 200 millones de pares de bases. Según estudios
veces sólo lo hacen durante cierta etapa del desarro- de bioinformática como los esbozados antes, se cree
llo: el feto humano en desarrollo dentro de la madre que tenemos entre 30 y 40 mil genes. Sin embargo,
expresa una hemoglobina distinta de la que expresa dada la experiencia en predecir genes a partir de la se-
cuando ya ha nacido. La hemoglobina fetal es más cuencia en el genoma de la mosca de la fruta, Droso-
afín al oxígeno que la hemoglobina que se sintetiza phila melanogaster, es posible que el número total de
después, y que también produce la madre, lo que po- genes aumente entre 10 y 20%, es decir, hasta cerca
sibilita que el oxígeno pase de la hemoglobina de la de 50 mil genes; pero esto es así porque los algoritmos
madre a la del feto. Todas estas señales de control que se utilizan hoy en día para predecir genes a partir
también se encuentran embebidas en la secuencia, y de la secuencia no son perfectos, y dan una subesti-
pueden localizarse antes (por ejemplo: baci), en me- mación del número real.
dio, es decir, entre las señales gt y ac, o después, es de- Si hacemos una comparación con alguien que em-
cir después de las letras mk de nuestro ejemplo. pieza a aprender otro idioma, diríamos que sabemos
Estas señales de control se conocen de manera ya muchas palabras y que conocemos algunos de sus
parcial, de modo que aún no es posible tener el núme- usos (cuáles son algunos de los códigos de control,
ro exacto de nuestros genes porque aún no los hemos cuándo se usan, bajo qué circunstancias y por quié-
localizado a todos dentro de esta gigantesca oración. nes), pero desconocemos muchas otras, de manera
Por supuesto, lo primero que se necesita es tener la que el cuadro que tenemos ahora es parcial. Sólo
secuencia completa (oración) para poder después tenemos un dominio parcial del idioma; somos un
analizarla. Lo que estamos terminando de descubrir es alumno adelantado en la escuela de idiomas, pero el
precisamente la secuencia del genoma, la oración aprendizaje aún no termina.
completa. Tenemos el diccionario y los instructivos,
pero no conocemos todas las palabras. El siguiente
paso es someter esa secuencia a diversos algoritmos Juan R. Riesgo es licenciado en biología por la UNAM, maestro
y doctor en esa ciencia por la Universidad de Yale, y posdocto-
computacionales capaces de reconocer las palabras
rado en la Universidad de Zurich. Pertenece al Sistema Nacional
embebidas en la secuencia, así como los códigos de de Investigadores. Desde 1998 se desempeña como investigador
control, algo que ciertamente representa otro esfuer- en el Centro de Neurobiología de la UNAM, en Querétaro, cuyo
zo monumental. De hecho, una rama de la biología y tema central es el estudio de la vía de señalización de la cina-
de la informática, la bioinformática, se dedica a estu- sa de Jun y la transducción olfatoria y visual de la mosca de la
fruta, Drosophila melanogaster, en la que se emplea una mezcla
diar esos aspectos de los genes: diseñar programas de
de biología molecular, celular, genética, bioquímica, fisiología y
cómputo que sean capaces de descubrir las palabras biología conductual para identificar y caracterizar los diversos
embebidas en la oración. La bioinformática también genes que componen las cadenas transductoras.