Professional Documents
Culture Documents
BIOINFORMTICA
Presentacin
El fin del siglo XX ha visto una explosin de
informacin proveniente de los seres vivos,
especialmente en biologa molecular
Secuenciacin de genomas
Secuencia y estructura de protenas
Estudios sobre la expresin simultnea de muchos
genes bajo muchas condiciones diferentes.
Las bases de datos biolgicas
Buena parte del trabajo en bioinformtica
consiste en la construccin y/o explotacin de
bases de datos de informacin biolgica
Se usan, por ejemplo para:
Aadir o buscar informacin (anotaciones)
Buscar similitudes o patrones
Hacer predicciones
De estructura o funcin en protenas
De genes en genomas
Donde se hace Bioinformtica
Centros Especializados
EBI, NCBI, EMBL.
INB / Plataforma Bioinformtica de la UAB.
Servicios Bioinformticos de centros de
investigacin,
UEB, UBB, BU
Universidades,
Laboratorios Farmacuticos,
El acceso a los recursos
La WWW ha revolucionado la provisin de
servicios en bioinformtica
Muchas cosas pueden hacerse a travs de
internet sin que sean necesarias copias locales
de las bases de datos o el software para
explotarlas
A pesar de esta globalizacin existen
organizaciones que centralizan los recursos
Centros y recursos importantes
Marcos de lectura abierta (ORF) son las regiones que no tienen codones de
terminacin. Todos los genes residen en largos marcos de lectura abiertos
El codn de iniciacin debe ser "aguas arriba" en el mismo marco de lectura del codn de parada.
Es generalmente cerca del comienzo de la ORF, pero no necesariamente el primer codn de inicio
posible. Determinacin del codn de inicio exacta no es fcil ni obvia. Pero, el codn de parada en
una primera fase de lectura abierta es siempre una suposicin razonable
Marcos de Lectura Abiertos
Los ribosomas son muy obedientes a los
codones de parada: cuando un codn de parada
es alcanzado, la protena est terminada. As,
todos los genes terminan en el codn de parada
en su primera fase de lectura.
Accesos malos son muy comunes, y que tienen e-valores : por ejemplo, 0.004 o
el 1,2
Cada genoma nuevo tiene genes que son nicos: no hay coincidencias en la
base de datos. Son genes reales? A veces hay evidencia en la forma de ARN
mensajero, pero por lo general no lo sabemos, los llaman los genes hipotticos
"Putativo" significa que creemos que sabemos la funcin del gen, pero no
estamos seguros. Putativo debe ser seguido por el nombre de la funcin.
Transferencia Gentica Horizontal y Vertical
Estamos acostumbrados a pensar que los genes se
transmiten de padres a hijos, mantenindose siempre dentro
de la especie, con la divisin muy ocasional de una especie
en dos. Esto se llama transferencia gentica vertical.
Bacteria es el Dominio
Firmicutes es el Phylum
Bacilli es la Clase
Bacillales es el Orden
Bacillaceae es la Familia
Bacillus es el Gnero.
Nuestro ejemplo
La mayora de los grandes accesos son de diversas especies de Bacillus: hay una
pequea duda de que este gen sea el resultado del flujo de gen vertical normal.
Qu pasa con "Anoxybacillus flavithermus"?
Haga clic en el nmero de acceso para obtener ms informacin, incluyendo su
filogenia.
Linaje de bacterias taxonmica => Firmicutes> Bacillales> Bacillaceae> Anoxybacillus.
La misma familia que el B. megaterium.
Secuencias alineadas
Usted puede ver las secuencias alineadas haciendo clic en los
diagramas de "alineacin locales"
Secuencia de consulta arriba, el sujeto abajo
Los aminocidos idnticos estn en el medio de la alineacin, y
otros similares tienen un signo +.
Lagunas: las regiones en donde tiene una secuencia de
aminocidos que no se encuentran en la otra secuencia, se indican
con ---.
Esta protena es muy tpica en que los mejores accesos estn en el
medio de la protena, con un menor nmero de aminocidos
idnticos cerca de los extremos.
Adems, el acceso no coincide al principio de las protenas, aunque
son casi idnticos en longitud.
El sitio activo de la mayora de enzimas est en el medio.
Los extremos de las protenas a menudo no estn bien conservadas
Resultado de Alineamiento Local
Vista Grfica
Hacer clic en Descripcin grfica (justo debajo
del casillero a la izquierda de BLAST) para
obtener una visin general de todas las
secuencias alineadas.
La extensin de la regin correspondiente se
muestra con los espacios de colores, con las
regiones que no coinciden dibujadas como una
lnea.
El color indica porcentaje de aminocidos
idnticos. Se puede ver que los diferentes
accesos se alinean a lo largo en casi toda su
longitud.
Bioinformatics services
We maintain the worlds most comprehensive range of freely available and up-to-
date molecular databases. Developed in collaboration with our colleagues
worldwide, our services let you share data, perform complex queries and analyse
the results in different ways. You can work locally by downloading our data and
software, or use our web services to access our resources programmatically.
Ensembl
Ensembl enables and advances genome science by
providing high-quality, integrated annotation on
vertebrate genomes within a consistent and
accessible infrastructure.
FASTA [nucleotide]
Similarity search tool for nucleotide sequence
databases.
STEP 1 - Select your databases NUCLEOTIDE DATABASES X Clear Selection110 Databanks Selected
EMBL-Bank
EMBL Release
EMBL Updates
EMBL Coding Sequence
Others
IMGT
Patents
STEP 2 - Enter your input sequence Enter or paste a sequence in any supported format:
or upload a file:
SUBMIT
Resultados de la bsqueda
FASTA searches a protein or DNA sequence data bank
version 3.3t09 May 18, 2001
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
@:1-: 241 nt
FASTA (3.39 May 2001) function [optimized, +5/-4 matrix (5:-4)] ktup: 6
join: 48, opt: 33, gap-pen: -16/ -4, width: 16
Scan time: 3.180
The best scores are: opt bits E(61164)
EM_FUN:CGL301988 AJ301988.1 Colletotrichum glo (1484) [f] 1184 88 5.7e-17
EM_FUN:AF090855 AF090855.1 Colletotrichum gloe ( 500) [f] 1205 88 7.3e-17
EM_FUN:CGL301986 AJ301986.1 Colletotrichum glo (1484) [f] 1166 87 1.2e-16
EM_FUN:CGL301908 AJ301908.1 Colletotrichum glo (2868) [f] 1148 87 1.3e-16
EM_FUN:CGL301909 AJ301909.1 Colletotrichum glo (2868) [f] 1148 87 1.3e-16
EM_FUN:CGL301907 AJ301907.1 Colletotrichum glo (2867) [f] 1148 87 1.3e-16
EM_FUN:CGL301919 AJ301919.1 Colletotrichum glo (1171) [f] 1166 87 1.6e-16
EM_FUN:CGL301977 AJ301977.1 Colletotrichum glo (1876) [f] 1148 86 2e-16
EM_FUN:CFR301912 AJ301912.1 Colletotrichum fra (2870) [f] 1137 86 2.1e-16
Ejemplo 2: Visualizacin de
estructuras moleculares
RASMOL es un programa para visualizar
estructuras moleculares en tres dimensiones
Matemtica Biologa
Estadistics Biologa Molecular
Bioinformatica
Ciencia
Computadoras
Informtica Medicina
Fsica
Bioinformtica, Biologa y
Biologa Computacional
Biologa Computacional
o Bioinformtica
AGAGTTCTGCTCG
AG G G TTAT G C G C G
Modelizacin de sistemas biolgicos
Bioinformtica Integrativa
74
En resumen
Recursos y herramientas
Datos bioinformticos Conocimiento