Professional Documents
Culture Documents
En esta pgina de bienvenida se muestran los recursos principales del NCBI. Dentro de
los mas populares aparece GENE que empezaremos a utilizar pinchando en l. En la casilla de
bsqueda de GENE podemos poner el nombre de un gen, una protena o una enfermedad, que
sea de nuestro inters. Empezaremos por estudiar el gen humano MYC.
Pinchando ahora en Search se abre una pgina de resultados. Esta contiene todos los
genes myc almacenados. El primero, en este caso, es el del gen humano cuyo nombre
completo es : v-myc (Homo sapiens). En una segunda columna aparece la localizacin
cromosmica, en otra columna los Alias etc. Asimismo se indica el nmero de registros
encontrados (6818, el 1 de febrero de 2016) y bajo cada registro un numero de identificacin
ID. Seleccionando la ficha deseada en la casilla adjunta y pinchando en el nombre podemos
acceder a ms informacin.
La nueva ventana constituye un registro completo del gen myc humano. En este
destacamos la informacin titulada Summary que entre otros datos contiene una descripcin
del gen, protena, actividades biolgicas de la protena, relacin con enfermedades causadas
por mutaciones, etc.
Nos fijaremos en la secuencia de nucletidos del mRNA codificante (1365 nt). El gen
myc tiene 3 exones, que aparecen alternando los colores negro/azul/negro. Solamente una
pequea regin del extremo 3 del primer exn es codificante. Pasando el cursor sobre la
secuencia de nucletidos observamos los tripletes y los aminocidos que codifican
iluminndose en amarillo. Pinchando en un triplete cualquiera de la secuencia de nucletidos
se puede colorear el aminocido codificado.
Bajo la ventana de la secuencia de myc pegada aparece una seccin que dice Choose
Search Set y un desplegable que nos permite elegir la base de datos frente a la que vamos a
hacer la comparacin. La opcin por defecto Non-redundant protein sequences (nr) busca en
todas las bases de datos. Esta opcin es la que elegimos. Alternativamente la bsqueda se
puede restringir a organismos, grupos taxonmicos etc.
A continuacin pinchamos en BLAST y el programa comienza a realizar la bsqueda.
Al cabo de segundos o minutos aparecern los resultados en pantalla.
La primera parte de los resultados es una barra que representa toda la secuencia de la
proteina empleada para generar la bsqueda que en la terminologa del programa se identifica
como query.
Bajo la barra aparece informacin de su estructura de dominios as como de la familia
de protenas a la que pertenece.
En la parte baja veremos como lneas de color rojo los homlogos encontrados.
Ms abajo hay una ventana denominada Alignments donde se pueden ver los
alineamientos entre los aminocidos de la protena query y cada uno de los homlogos. Se
puede observar que al ir bajando aparecen ms diferencias (cambios) indicando que la similitud
entre las secuencias alineadas es menor.
HOMOLOGENE
Otra informacin de inters puede ser la existencia de genes y protenas homologas en
otros organismos eucariotas. Desde la pgina de nuestro gen de inters (Myc) podemos entrar
ahora en la Base de Datos de HOMOLOGENE.
Observamos dos columnas, una para genes y otra para protenas de cada organismo
que contiene dicho gen. Bajo la seccin Protein Alignments es posible hacer un BLAST para
dos de estas protenas directamente poniendo en la ventana correspondiente el nmero de
identificacin sin necesidad de copiar la secuencia en el programa como hicimos antes. Es
posible as calcular y visualizar la homologa existente en porcentaje as como de otras
maneras.
SNP
Otra Base de datos accesible es SNP (Single Nucleotide Polimorfisms). Un
polimorfismo de un solo nucletido es una variacin en la secuencia de ADN que afecta a una
sola base de la secuencia de un gen. Debe darse en un 1% de la poblacin para ser
considerado como SNP. Si no se llega al 1% se considera mutacin puntual y no SNP.
Pinchando en el enlace SNP nos abre una ventana con todos los polimorfismos
encontrados para este gen. En el caso del gen Myc aparecen 341.
Esta base informa del cambio y de su localizacin as como de si se trata de un cambio
no sinnimo (missense), en un intrn o en un exn, etc.
Desde la misma pgina se pude filtrar los resultados de los SNPs para ver cules de
ellos pueden tener significado clnico o patognico (en la columna de la izquierda pinchar en
pathogenic). Aparecen cuatro.
OMIM
Desde la ventana anterior se puede ahora acceder a OMIM (Online Mendelian
Inheritance in Man) una base de datos muy importante en Medicina que incluye informacin
completa y bibliografa sobre genes implicados en enfermedades.
10
EJERCICIOS
Ejercicio 1
-Recuperar las entradas humanas relativas a protena Prin en Gene.
-Identificar el gen para la proteina prion ( PRNP).
-Nombrar la localizacin gentica para este gen en el genoma humano.
-Cual es la funcin de esta protena?
-Cuales son los smbolos genticos alternativos?
-Nombrar los fenotipos asociados con mutaciones en este gen.
-Cuntos productos genticos producidos por splicing alternativo se han anotado para este
gen?
-Para obtener informacin sobre homlogos de otros organismos eucariticos pincha en el
enlace de Homologene.
-Qu porcentaje de identidad hay entre la proteina humana y la de ratn?. Observa el
alineamiento pinchando en el enlace BLAST.
- Identifica las variaciones de este gen asociadas con clnica pinchando en SNP. Selecciona
Clinical.
-Cuantos cambios son missense ( no sinnimos)?
- Para determinar si los SNPs conocidos (en la regin codificante) estn asociados con algn
fenotipo accede al registro en OMIM. Compara los cambios missense del registro SNP con las
variantes allicas en el registro OMIM.
Ejercicio 2
-Recuperar las entradas relacionadas con colon cncer en Gene.
-Identificar el gen MLH1.
-Nombrar la localizacin gentica de este gen en el genoma humano.
-Cul es la funcin de esta proteina?
-Cules son los smbolos genticos alternativos?
-Nombrar los fenotipos asociados con mutaciones en este gen.
- Cuantos productos de splicing alternativo han sido anotados?
- Cual es el % de identidad entre las protenas humana y de ratn?
-Identificar las variaciones anotadas. Cuantos son cambios missense (no sinnimos)?
11
Existe una base de datos donde estn depositadas todas las estructuras obtenidas por
difraccin de rayos X o RMN que se resuelven. De hecho, esta prctica es obligada si esa
estructura va a ser publicada en una revista cientfica. Es la base de datos conocida como
Protein Data Bank (PDB).
(1) Lo primero que haremos ser entrar en la pgina de la base de datos del PDB en la
siguiente direccin http://www.rcsb.org/pdb/home/home.do o desde el enlace de la prctica del
aula virtual.
Podemos acceder a la estructura de cualquier molcula en el campo de bsqueda bien
mediante un identificador (PDB ID) o, si no lo sabemos, mediante una palabra clave. El
identificador PDB consta de un nmero seguido por 3 caracteres alfanumricos (generalmente
letras)
12
(2) El ejemplo que vamos a estudiar en esta prctica es el de la protena MYC y el complejo
que forma con otra protena conocida llamada MAX para poder interaccionar con el ADN. Para
acceder a esta estructura tecleamos MYC MAX o el que es el cdigo identificador de esta
estructura si lo sabemos, en este caso 1NKP, en la ventana indicada por la flecha roja y
pulsamos SEARCH.
13
14
13) Eliminaremos entonces una a una las cadenas proteicas Myc (cadena D). Pulsamos el
botn derecho y pinchamos chain hide everything.
Veremos que desaparece toda esa cadena.
(14) Repetir con las cadena de Max (cadena E) y la doble
cadena de ADN (H y J). Nos ha de quedar una imagen como
esta:
15
16
Por ltimo, vamos a dar un color diferente a los aminocidos bsicos que hemos
identificado en nuestra secuencia de unin a ADN para poder ver su situacin en la protena
Myc y en la estructura.
(24) Para ello, primero seleccionamos con el ratn las letras
R, K y H de los aminocidos sobre la secuencia de arriba
que has seleccionado como de interaccin a ADN (flechas
rojas).
Luego, pulsar sele en el men de arriba a la derecha
sele C (color) magentas magenta.
Debera de quedar parecida a la imagen de la figura.
Observa en la estructura las manchas magenta sobre la
protena azul: son los aminocidos que has marcado arriba
en la secuencia.
(25) Por ltimo, salva esta imagen y cpiala en tu hoja del
ejercicio.
(26) Finalizamos el ejercicio y las prcticas de
BIOINFORMATICA borrando todos nuestros ficheros del
escritorio (ATENCION: no borrar el icono del Pymol).
17
18