You are on page 1of 3

Alinhamento Mltiplo com o ClustalX

Artur Trancoso Lopo de Queirz


Doutorando no Programa de Ps-graduao Interunidades em Bioinformtica - USP

Resumo:

A comparao entre sequncias representa o corao da bioinformtica, que inclui


tambm as anlises filogenticas. o primeiro e mais importante passo para a anlise
estrutural, funcional e evolutiva de sequncias recm-sintetizadas, cuja informao ainda
no foi descrita. Como o DNA, RNA e protenas refletem os processos da evoluo de
cada organismo, o alinhamento dessas macromolculas pode gerar inferncias sobre a
relao entre organismos distintos.
O primeiro passo na comparao de sequncias o alinhamento aos pares, onde
duas sequncias so comparadas, utilizando penalidades de match e mismatch, alm de
penalidades para abertura e extenso de gaps para escolha do melhor alinhamento,
porm essa comparao poder ser por duas formas: utilizando alinhamentos locais, onde
apenas pequenas regies de alta similaridade so identificadas; e utilizando alinhamentos
globais, onde as duas sequncias sero comparadas desde do primeiro ao ltimo stio.
Para anlise de evoluo, cuja comparao entre sequncias assume que as mesmas
so homlogas, essa ultima abordagem (alinhamento global) mais indicada, visto que
alinhamentos locais so utilizados para identificao de homologia atravs de anlise de
similaridade.
Entretanto, a comparao apenas de duas sequncias no gera informao
suficiente para classificao de diversos organismos ou para identificao de perfil de
famlias de protenas. Para essas abordagens o uso do alinhamento mltiplo mais
indicado, pois permite comparaes de mais de 2 sequncias por vez, o que gera mais
informao sobre um determinado conjunto de dados.
O alinhamento mltiplo consiste na realizao de todas comparaes par a par
possveis das N sequncias de um dado, onde elas sero classificadas por sua
similaridade (utilizando uma rvore guia QUE NO FILOGENTICA), de onde o
alinhamento mltiplo ser gerado juntando os alinhamentos aos pares de forma
hierrquica.
Devido sua natureza heurstica, ou seja, que no garante encontrar o
alinhamento ideal e mais correto, o alinhamento mltiplo deve ser frequentemente
averiguado manualmente para correo de possveis erros metodolgicos.
Diversos programas implementaram os algoritmos de alinhamento mltiplo,
entretanto o um dos mais utilizados atualmente o ClustalX, pois um dos que possuem
interface amigvel ao usurio. Entretanto, para realizar o alinhamento mltiplo
necessrio um arquivo com todas as sequncias que sero comparadas na anlise.

Para iniciar o programa clique 2 vezes no cone:


Para carregar o conjunto de dados clique em FILE, LOAD SEQUENCES. Uma janela ser
aberta onde ir navegar at o arquivo contendo os dados.

Aps carregar os dados, necessrio otimizar os parmetros do alinhamento par a par e


mltiplo. Para isso clique em ALIGNMENT, depois ALIGNMENT PARAMETERS, primeiro
em PAIRWISE ALIGNMENT PARAMETERS. Uma janela ir abrir. Modifique os
parmetros GAP OPENING para 10 e GAP EXTENSION par 0.10. Aps isso clicar em OK
Clique em ALIGNMENT, depois ALIGNMENT PARAMETERS, primeiro em MULTIPLE
ALIGNMENT PARAMETERS. Uma janela ir abrir. Modifique os parmetros GAP
OPENING para 15 e GAP EXTENSION par 1. Parmetros propostos por Hall, porm
poderemos modificar para melhorar o alinhamento de acordo com seu conhecimento
prvio.

Modificar o formato do arquivo de saida para fasta. V em ALIGNMENT depois em


OUTPUT FORMAT, e tirar de clustal e colocar para FASTA. Para realizar o alinhamento
clique em ALIGNMENT depois em DO COMPLETE ALIGNMENT. Depois de algum tempo
o alinhamento ser gerado, e os arquivos com a arvore guia e o alinhamento no formato
indicado no output sero gerados na pasta indicada.
Modifiquem os parmetros de abertura e extenso de gaps para melhorar o alinhamento.
Lembre-se: A arvore gerada pelo clustal no pode ser usada como arvore filogentica.
Ela gerada apenas por similaridade simples, sem nenhuma correo de substituies,
alm da sua montagem no utilizar nenhum algortimo refinado de reconstruo de
topologias.
O alinhamento dever ser avaliado utilizando um programa de edio de alinhamento
como o GeneDoc ou Bioedit.

O que aconteceu quando modificamos os parmetros de gap?


O que acontece quando aumentamos os parmetros de abertura e extenso?
O que acontece quando diminumos os parmetros de abertura e extenso?