You are on page 1of 25

ALINEAMIENTO DE

SECUENCIAS
PAÚL LÓPEZ
UNIVERSIDAD POLITÉCNICA SALESIANA
Alineación por pares de una porción de
hormona Adrenocorticotrópica (ACTH) de
oveja, vaca con la del cerdo.

La técnica más común de


comparar pares de secuencias
(de
nucleótidos/aminoácidos/genes
/proteínas) es la del
alineamiento.
secuencia es una sucesión
finita ordenada (cadena) de
elementos sobre un alfabeto
finito
Las secuencias de aminoácidos de las proteínas reflejan la
Anfinsen (1959). relación filogenética de diferentes especies

revelan las porciones de una proteína que pueden ser


importantes para su función biológica.
OBJETIVO Evolución desde un
ancestro común

Permite determinar si dos o Tienen funciones


más secuencias de un gene o similares
una proteína esta
relacionada con otra.

Si tienen formas
similares (proteínas)

Identificar los dominios o


motifs (motivos) que son
compartidos (moléculas)
TIPOS DE ALINEAMIENTO
Alineamiento pareado.
•Alinea dos secuencias entre si.

Alineamiento múltiple.
•Alinea tres o más secuencias entre si.
Alineamiento de pares
Alineamiento entre dos secuencias que son
comparadas para conocer su relación.

Múltiple de
Familias de
secuencias
proteínas
Base de diversas
herramientas de
análisis de
secuencias Estructura Análisis
3D de filogenético
proteínas
No existen grados de
Homología homología.

Secuencias son homólogas


Dos secuencias son o no.
homologas cuando
comparten un
ancestro común.
Casi siempre comparten
(inferencia una estructura
cualitativa) tridimensional similiar

Las secuencias de
amonoácidos o nucleótidos
usualmente son parecidas
Proteinas
Homológas
(3D)

Comparten
una
identidad de
aminoácidos
Pevsner, 2015 muy limitada
Secuencias
homólogas en Entre diferentes
Ortólogo diferentes especies especies
que vienen de un
ancestro común

Homólogos

secuencias
homólogas pero
debidas a un
mecanismo distinto Dentro de una
Parálogo a la evolución misma especie

Duplicación
genética
Árbol
filogenético
Ortólogo de Trasporte
mioglobinas O2
(células
musculares
)

Divergieron Similar
del mismo función
ancentro biológica
(90 millones
de años)

Pevsner, 2015
Árbol
filogenético
Parálogo de
globinas en
humanos
Comparten
la identidad
del 100% de
aminoácido
s

Todas tienen
funciones distintas
pero relacionadas
(proteínas
transportadoras de
O2)
Pevsner, 2015
Similitud cantidades que Identidad
describen
la relación de
secuencias

Grado de Coincidencia total entre


dos secuencias
coincidencia entre Analogia
dos secuencias (Similitud al 100%)
(Grado muy alto
similitud)

Homología no
siempre garantiza Beta globina y neuroglobina
El grado de similitud
analogia.
(homólogas)
entre dos
secuencias es de Comparten solamente el 22%
un 45% de identidad en los
aminácidos
Huecos (Gaps)
Separaciones añadidas
artificialmente a una secuencia para
maximizar su alineamiento con otra.
• Representan posibles mutaciones
• Inserciones
• Deleciones

Pueden ocurrir en medio o en los


extremos de la secuencia
Se introducen huecos
(igualar las longitudes de
secuencia)
Las secuencias se
Alineamiento global alinean a lo largo de
toda su longitud
(secuencias completas)
Secuencias muy
parecidas y de longitud
similar

Favorece encontrar
patrones similares dentro
de la secuencia
Sólo se alinean la partes
Alineamiento local más parecidas de la
secuencia
es una combinación de
muchos alineamientos
globales de secuencias
cortas.
ALGORITMOS DE ALINEAMIENTO
COMPARACIÓN ENTRE DOS SECUENCIAS MEDIANTE
ALINEAMIENTOS ÓPTIMOS

EXISTEN VARIOS TIPOS DE ALGORITMOS DE ALINEAMIENTO:

• DIAGRAMA DE PUNTOS (DOT PLOTS)


• ALGORITMOS DINÁMICOS
• ALINEAMIENTO GLOBAL (Needleman and Wunsch)
• ALINEAMIENTO LOCAL (Smith and Waterman)
ALGORITMOS DINÁMICOS
Funcionan con una base de puntuaciones :

+1 por cada elemento igual (match)

-1 por cada elemento desigual (mismatch)

-1 por cada hueco introducido (gap)


Needleman and Wunsch

◦ PRIMER PASO:

◦ CONFIGURACIÓN
DE LA MATRIZ
◦ SEGUNDO PASO
Puntuación de la
matriz
MATRICES DE PUNTUACIONES
métodos de puntuación más sofisticados, con sentido biológico:

Genético: coste de mutación de un aminoácido en otro

Químico: similitud en las características de los aminoácidos

Evolutivo: frecuencia evolutiva de cambio en aminoácidos


• Lod scores
• PAM
• BLOSUM
PAM: basada en familias de
proteínas muy relacionadas

Útil para alinear secuencias


parecidas

BLOSUM: basada en
observaciones de
alineamientos entre
secuencias muy distintas
Útil para alinear secuencias
distintas
BLOSUM
62

LA MÁS UTILIZADA
PRÁCTICA
◦ Usar el programa ugene para el alineamiento de secuencias
◦ Editor gedit
BIBLIOGRAFÍA
◦ Jonathan Pevsner (2015). Bioinformatics and Functional Genomics. Third edition. Wiley ¡
◦ Regalia M. (2015). Introducción a la Bioinformática.
◦ Santamaria R (2012). Alineamiento en pares. Obtenido de:
http://vis.usal.es/rodrigo/documentos/bioinfo/temas/3_Alineamientos%20de%20pares.
pdf

You might also like