Professional Documents
Culture Documents
Trabajo Práctico #4. Taxonomía Molecular
Trabajo Práctico #4. Taxonomía Molecular
1- Objetivos
2- Introducción
SECUENCIACIÓN
- 62 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
- 63 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
tarde, el genoma diploide de una sola persona (J. Craig Venter) fue leído mediante
secuenciación de genomas completos por perdigonazos (del inglés, “wholegenome shotgun
sequencing”), necesitando 10 años y 70 millones de dólares, usando la tecnología
optimizada de Sanger. Por su parte, el genoma de Watson fue secuenciado en sólo dos
meses y un costo de un millón de dólares, usando la maquina “454 Life Sciences”.
Otro ejemplo es la secuenciación del genoma del “ornitorrinco” ( Ornithorhynchus
anatinus), revelando marcas únicas de su evolución, con genes que aparecen en reptiles, o
aves y otros de mamíferos. Esta mezcla fascinante de características en el genoma del
“ornitorrinco” proporciona pistas sobre el rol y la evolución de los genomas de los
mamíferos.
La tercera generación (también llamada “next-next-generation”) de la secuenciación de
ADN ha sido producida en 2008, con químicas revolucionarias de una sola molécula:
1) El secuenciador HeliScope de molécula única (del inglés, “HeliScope Single Molecule
Sequencer”), de Helicos BioSciences <http://www.helicosbio.com>, fue anunciado este
año. Ofrece lecturas muy precisas de 25 a 45 bases para miles de millones (millardos) de
cadenas en un solo experimento (produciendo más que 2 Gb de datos de secuenciación por
día), y hasta un millardo de bases por hora en el futuro
<http://www.helicosbio.com/Portals/0/Vid eos/tSM S-How_It_Works.flv> Ello es debido
al uso de la verdadera secuenciación de molécula única (del inglés, “true Single Molecule
Sequencing” (tSMS), para leer hebras individuales de ADN.
2) “VisiGen Biotechnologies” <http://visigenbio.com> no ha sido producido todavía, pero
promete micromatrices masivamente paralelas (del inglés, “microarrays”) de
nanomáquinas, con una tasa de secuenciación de un Mb/s/maquina (más de 86 Gb de
secuencia de datos por día)
<http://visigenbio.com/flash/stream/visigen_movie_6mb.swf>, leyendo también moléculas
simples.
Estos avances permitirán reducir el precio de la secuenciación de uno a dos órdenes de
magnitud, lo cual propiciará el desarrollo del “la genómica personal”: hacer la
secuenciación de todo el genoma humano de cualquier persona en menos de un día, por
1.000 dólares o menos.
Por otra parte, la tercera generación de métodos de secuenciación es tan poderosa que
permite hacer estudios no solamente de genómica estructural, sino también de genómica
funcional y consenso de secuencias, incluyendo : i) ChIP-Seq, que está basado en la
inmunoprecipitación de cromatina (ChIP), para mapear in vivo las secuencias del ADN
ocupadas por proteínas de unión al ADN; ii) Sec-ARNm (del inglés, “mRNA-Seq”), para
estudiar la expresión de genes; y iii) Sec-Metil (del inglés, “Methyl-Seq”), para analizar los
patrones de metilación. Estos procedimientos se pueden aplicar también al ADN antiguo,
siempre que ADN, ADN-proteína o ARNm pueda ser aislado de tales muestras.
GENÓMICA
Un genoma es el conjunto de secuencias de ADN que caracterizan a un individuo. Por
extensión a las secuencias de ADN características de una especie se les conoce igualmente
como genoma.
La secuenciación del genoma, es un proceso de laboratorio que determina la secuencia el
- 64 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
total del ADN del genoma de un organismo de una sola vez. Esto implica la secuenciación
de todo el ADN cromosómico, así como el ADN contenido en la mitocondria y, en el caso
de las plantas, en el cloroplasto del organismo. Casi cualquier muestra biológica, incluso
una cantidad muy pequeña de ADN o de ADN antiguo, puede proporcionar el material
genético necesario para la secuenciación del genoma completo. Las muestras podrán
incluir la saliva, células epiteliales, médula ósea, el pelo (siempre y cuando el pelo
contiene un folículo del pelo), semillas, hojas de plantas, o cualquier otra parte con
células que contienen ADN. Debido a que la secuencia de datos que se produce puede ser
muy grande (por ejemplo, hay aproximadamente seis mil millones de pares de bases en
cada genoma diploide humano), los datos genómicos se almacenan electrónicamente y
requieren una gran cantidad de potencia informática y capacidad de almacenamiento. Es
por ello que la secuenciación del genoma completo habría sido casi imposible antes de la
llegada de los microprocesadores, los ordenadores y la era de la información.
A diferencia de la genética clásica que a partir de un fenotipo, generalmente por un
mutante, busca el o los genes responsables de dicho fenotipo, la genómica tiene como
objetivo predecir la función de los genes a partir de su secuencia o de sus interacciones
con otros genes. Así, la genómica tiene un enfoque distinto para responder preguntas
biológicas cuando se compara a otras ramas de la biología más tradicionales. Por lo tanto
genómica es el conjunto de ciencias y técnicas dedicadas al estudio integral del
funcionamiento, el contenido, la evolución y el origen de los genomas. Es una de las áreas
más vanguardistas de la Biología. La genómica usa conocimientos derivados de distintas
ciencias como son: biología molecular, bioquímica, informática, estadística, matemáticas,
física, etc. Muchas veces, la genómica es usada como sinónimo de otras áreas de estudio
relacionadas, como la proteómica y la transcriptómica, por ejemplo.
Las ciencias genómicas han tenido un importante auge en los últimos años, sobre todo
gracias a las tecnologías avanzadas de secuenciación de ADN, a los avances en
bioinformática, y a las técnicas cada vez más sofisticadas para realizar análisis de
genomas completos. El desarrollo de la genómica ha contribuido al avance de distintos
campos de la ciencia como la medicina, la agricultura, etc; gracias al descubrimiento de
secuencias de genes necesarias para la producción de proteínas de importancia médica y
a la comparación de secuencias genómicas de distintos organismos. Por ejemplo en varios
países como Estados Unidos, la Unión Europea y Japón se han realizado enormes
proyectos para secuenciar el genoma de diversos organismos modelo. Probablemente el
más conocido es el Proyecto Genoma Humano. En la actualidad se cuenta además con
importantes servidores de acceso público, como el del NCBI (National Center for
Biotechnology Information), que permiten que cualquier usuario con conexión a Internet
acceda a la secuencia completa del genoma de decenas de organismos y a las secuencias
de cientos de miles de genes de distintos organismos.
De acuerdo a la página web
http://www.genomenewsnetwork.org/resources/sequenced, hasta el presente se han
secuenciado el genoma completo de 189 organismos.
LA GENÓMICA EN EL FUTURO
Los genomas que han sido secuenciados han sido muy útiles para la humanidad, pero es
una mínima parte del total de genomas existentes. La secuenciación de estos genomas
- 65 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
- 66 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
- 67 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
IZ8jbAW
3. Seleccionar SeedViewer
4. Seleccionar el organismo del que se quiere analizar el genoma completo
5. Seleccionar Anopheles gambiae
6. En esta página, se abre una tabla que muestra cuantos contig (fragmentos vecinos
derivados de una fuente de secuenciación simple) hay, el número de genes que se
asignan para completar los subsistemas y las categorías de subsistemas representados
en su genoma. Ahora, copia esos datos y realiza una tabla con esta información en un
archivo word.
7. La página de la información del genoma muestra un gráfico circular de subsistemas
completos identificados en el genoma. Se puede ampliar las categorías para ver las
subcategorías y nombres de subsistema, junto con el número o las proteínas asignadas
a cada uno. La tabla (haga clic en el botón verde "Características de los subsistemas")
y ello ofrece un acceso similar, y usted puede seleccionar la categoría de
los "carbohidratos", desde la parte superior de la columna. Desde la categoría
carbohidratos, ya sea en el gráfico o tabla, puede hacer clic para abrir los
subsistemas de la glucólisis y de la Gluconeogénesis.
8. Haciendo clic en cualquiera de los genes del genoma recién anotado se abre la página
de “Información general de anotación”, por lo que se abre en una nueva ventana o
pestaña. Copia y realiza un resumen de la información de los genes que seleccionaste.
3.2. Anotación de genes mediante Programa ARTEMIS.
1. Abre la secuencia FASTA (Ava1) que te facilita el docente, utilizando el comando
File/Open. Observa que al abrir el archivo, aparecen tres ventanas, una inferior
vacía y dos superiores que muestran la secuencia nucleotídica y las secuencias
aminoacídicas correspondientes a las traducciones en los seis marcos de lectura
posibles (tres marcos de lectura por hebra) (Figura 1).
2. Utilizando la opción Create/Mark ORF (open reading frames), se establecen los
posibles ORFs, con un largo superior a 100 aminoácidos
3. El programa identifica diversas regiones de una secuencia, como unidades con un
determinado significado, a las cuales se les pueden asignar nombres y anotar datos
acerca de ellas. Estas regiones se denominan “features” (características o marcas),
y pueden ser ORFs, exones, etc.
4. Analiza los features (en este caso ORFs) obtenidos utilizando BLAST. Los features
aparecen indicados en la ventana inferior como CDS. Debes seleccionar cada uno
de los CDS y presionando el botón derecho del mouse sobre el feature, y utilizando
la opción View/Amino Acids of selection as FASTA (también se puede seleccionar
la secuencia nucleotidíca View/Bases of selection as FASTA) podrás obtener la
secuencia de cada CDS para su análisis.
5. Utilizando la información obtenida mediante BLAST, ahora puedes editar la
información contenida en los features, haciendo click con el botón derecho, y
seleccionando la opción Edit/Selected feature in editor. En la ventana que se abre
se puede modificar el nombre del feature con la opción Key, y agregar
información, colores, etc., con la opción Add Qualifiers.
6. Los features pueden estar separados de la secuencia en un archivo aparte
- 68 -
Cátedra Biología Molecular
Facultad de Ciencias Naturales e IML
-2015-
- 69 -