Fabiana G. S.

Pinto
SEQ
SEQ
Ü
Ü
ENCIAMENTO
ENCIAMENTO
GENÔMICO
GENÔMICO
T
T
é
é
cnicas e Aplica
cnicas e Aplica
ç
ç
ões
ões
Fabiana G. S. Pinto
Ácidos Nucléicos
* 2 tipos de ácidos nucléicos: DNA -Ácido desoxirribonucléico
RNA- Ácido ribonucléico
* Constituição dos Nucleotideos:
Base nitrogenada - Pentose - Grupo fosfato *
* Bases Nitrogenadas: *
Púricas: Adenina (A) ; Guanina (G) e Pirimídicas: Timina (T), Citosina (C)
Uracil (U)
DNA: A, G, C, e T e RNA: A, G, C, e U
DNA X RNA
Fabiana G. S. Pinto
Seqüências não codificadoras
e
Seqüências codificadoras
(proteinas, rRNA, tRNA)
GENES
Repertório total de genes do organismo vivo
GENOMA
Organiza Organizaç ção do DNA nos organismos vivos ? ão do DNA nos organismos vivos ? * *
Organiza Organizaç ção do Genoma nos organismos vivos? ão do Genoma nos organismos vivos?
Fabiana G. S. Pinto
Conceitos Básicos
GENÔMICA: GENÔMICA:
- Elucidar o genoma de um organismo e o papel dos genes que o compõem
desde o ponto de vista estrutural e funcional
1 1- - GENÔMICA ESTRUTURAL: GENÔMICA ESTRUTURAL:
- - Identificar, isolar, localizar e caracterizar o conjunto de Identificar, isolar, localizar e caracterizar o conjunto de genes genes de um de um
organismo. (GENOMA) organismo. (GENOMA)
2 2- - GENÔMICA FUNCIONAL: GENÔMICA FUNCIONAL:
- -Descrever a fun Descrever a funç ção biol ão bioló ógica dos gica dos genes genes mediante o conhecimento de mediante o conhecimento de
como eles interacionam, para definir um fen como eles interacionam, para definir um fenó ótipo tipo determindo determindo
2.1 2.1- - GENÔMICA COMPARATIVA GENÔMICA COMPARATIVA
- Comparação e estudos da evolução dos genomas
GENOMA: todo DNA existente num organismo
GENE: um segmento de DNA que codifica um produto funcional
(proteínas ou RNAs)
Fabiana G. S. Pinto
OS N OS NÍ ÍVEIS DA PESQUISA GENÔMICA VEIS DA PESQUISA GENÔMICA
Genômica Estrutural Genômica Estrutural
Mapeamento
de genes
Seqüênciamento
de DNA
Anotação das
seqüências
Genômica Funcional Genômica Funcional
Expressão
Transcriptoma
Análise de
mutantes
Proteoma
Genômica Comparativa Genômica Comparativa
Fabiana G. S. Pinto
mRNA mRNA
Pr Pré é- -mRNA mRNA
DNA DNA
GENÔMICA GENÔMICA
ESTRUTURAL ESTRUTURAL
Metab Metabó ólitos litos
Prote Proteí ínas nas
mRNA mRNA
GENÔMICA GENÔMICA
FUNCIONAL FUNCIONAL
TRANSCRIPTOMA TRANSCRIPTOMA
PROTEOMA PROTEOMA
METABOLOMA METABOLOMA
Fabiana G. S. Pinto
DNA
Pré-mRNA
mRNA
R
e
g
u
l
a
ç
ã
o
mRNA
Proteína
Metabólitos
c
i
t
o
p
l
a
s
m
a
núcleo
(Transcriptoma)
(Proteoma)
(Metaboloma)
(Genoma)
An Aná álise do fluxo da informa lise do fluxo da informaç ção celular pela pesquisa genômica ão celular pela pesquisa genômica
•Mapeamento
•Seqüênciamento
•Anotação
• Microarranjos de
DNA
• Hibridização
• Eletroforese em
Gel 2D
• Espectrometria
de massa
• Seqüênciamento
de proteínas
• Cromatografia
• Espectrometria
Genômica
Estrutural
Genômica
Funcional
Fabiana G. S. Pinto
1866 Gregor Mendel – estabelece as leis da hereditariedade
1903 Walter Sutton - Cromossomos são unidades hereditárias
1913 Thomas Morgan - Cromossomos arranjos lineares de gene
1944 Avery, McCarty, McLeaod, Griffith’s - O DNA é o material
genético. Harshey, Chase (1950)
Histórico da Genética e a Corrida pelo Projeto Genoma
1945 Beadle, Tatum - Um gene codifica uma proteína
1953 Franklin, Wilkins, Watson, Crick - O DNA é uma dupla hélice
1958 Meselson, Stahl - O DNA replica semicoservativamente
Fabiana G. S. Pinto
1961 Marshall Nirenberg - O código genético é formado por um códon
de três bases – RNA mensageiro
1983 Kary Mullis cria a técnica do PCR
1995 Haemophilus influenzae – 1º genoma completo sequenciado - TIGR
1978 GENENTECH, americana, produz insulina humana recombinante
1988 Início Projeto Genoma Humano Estatal-PGH (NIH-USA)
1972 Paul Berg produz a 1ª molécula de DNA recombinante, um grande
passo para experimentos entre organismos diferentes,
1998 Craig Venter – CELERA GENOMICS- sequenciar genoma humano
2003 Grupo PGH finalização sequenciamento: 3,2 bilhões pb – U$ 4 bilhões
Fabiana G. S. Pinto
GENOMAS NO MUNDO
www.ncbi.nlm.nih.gov/genomes/
Fabiana G. S. Pinto
GENOMAS NO BRASIL
1997: ONSA criada pela FAPESP – Rede 30 laboratórios
2000: Publicado 1º genoma patógeno vegetal: Xylela fastidiosa
(CVC) – U$12 milhões
Fabiana G. S. Pinto
Fabiana G. S. Pinto
2000: REDE PROJETO GENOMA BRASILEIRO 2000: REDE PROJETO GENOMA BRASILEIRO – – BRGENE BRGENE
- - 25 centros 25 centros em todo o pa em todo o paí ís s
- - CNPq e MCT CNPq e MCT
2001 : 2001 : Chromobacterium Chromobacterium violaceum violaceum - - R R$26 $26 milhões milhões
http://www.brgene.lncc.br/ http://www.brgene.lncc.br/
Fabiana G. S. Pinto
GENOMAS REGIONAIS BRASILEIROS GENOMAS REGIONAIS BRASILEIROS
Rhizobiumtropici
Crinipellis perniciosa
Gluconacetobacter
diazotrophicus
Herbaspirillumseropedicae
Á Área de rea de
Agricultura Agricultura
Fabiana G. S. Pinto
Seqüênciamento de Genomas
Complexidade de Genomas
100000 3 3200 Mb Genoma Humano
12000 10 125 Mb Arabidopsis thaliana
13600 13 180 Mb
Drosophila
melanogster
19099 25 98 Mb
Caenorhabditis
elegans
5885 70 12 Mb
Saccharomyces
cereviciae
4432 90 4,7 Mb
Chromoacterium
violaceum
4288 90 4,6 Mb Escherichia coli
Tamanho
Seqüências
Codificantes
(%)
Número de
genes
Fabiana G. S. Pinto
• Definição :
- Identificação da ordem exata dos pares de bases (A, T, G e C)
em um segmento de DNA
Seqüênciamento de DNA
•Importância:
- O conhecimento da seqüência de bases de um gene fornece
importantes informações sobre sua estrutura, função e relação
evolutiva com outros genes (de um mesmo organismo ou de
organismos diferentes)
* No caso do Projeto Genoma Homem, foi
determinada a ordem exata dos 3 bilhões de
pares de bases que constituem o DNA dos 24
cromossomos
Fabiana G. S. Pinto
Etapas para Seqüênciamento Genômico
* Isolamento DNA organismo – Biblioteca Genômica
* Fragmentar DNA: métodos químicos ou físicos
* Separação DNA tamanho de interesse (gel) e Reparo do DNA
* Clonagem: fragmento DNA interesse + Vetor (plasmídeo)
- Transformação: Escherichia coli
* Seleção dos transformantes em meio seletivo e crescimento colônias
* Extração de plasmídeo+inserto : PCR seqüênciamento com marcação fluorocromos
* Injeção amostras no Sequenciador Automático: Leituras fragmentos (READS)
* Obtenção grande nº seqüências: BIOINFORMÁTICA
* Processamento e Montagem das seqüências e Anotação do Genoma
Fabiana G. S. Pinto
ESTRAT ESTRATÉ ÉGIAS DE SEQ GIAS DE SEQÜ ÜENCIAMENTO DE GENOMAS ENCIAMENTO DE GENOMAS
“shotgun” Hierárquico
“shotgun” genoma inteiro
Geração de milhões
de fragmentos a
serem seqüenciados
Construção
de mapas
de clones
(BAC) e
seleção
dos clones
mapeados
Geração de
centenas de
fragmentos
a serem
seqüenciados
Montagem
Montagem
Fabiana G. S. Pinto
Seqüênciamento shotgun do genoma inteiro
DNA DNA
Genômico Genômico
Clones Clones Shotgun Shotgun
(Plasmideos ou
Cosmídeos)
Seq Seqü üência ência
Shotgun Shotgun
Montagem Montagem
Montagem Montagem
final final
Gap Virtual Gap real
Desenho de primer
PCR
Clones para conectar Clones para conectar
Fabiana G. S. Pinto
Seqüênciamento shotgun Hierárquico
DNA DNA
Genômico Genômico
Clones Clones
Shotgun Shotgun
Seq Seqü üência ência
Shotgun Shotgun
Montagem Montagem
Montagem Montagem
final final
Clones para conectar Clones para conectar
Seq Seqü üênciamento ênciamento
dos BAC dos BAC
Biblioteca BAC Biblioteca BAC
Contigs Contigs dos dos
clones clones
organizados e organizados e
mapeados mapeados
Fabiana G. S. Pinto
• Seqüênciamento shotgun do genoma inteiro
Cobertura rápida do genoma
Dificuldades para finalizar e fechar o genoma
• Seqüênciamento shotgun hierárquico
Construção de clones de fragmentos maiores e
mapas genéticos e físicos permite verificação da
montagem das seqüências.
Ambos casos, o número de seqüências
geradas deverá ter uma cobertura de
> 8 vezes o tamanho do genoma total
Fabiana G. S. Pinto
Mapa genético – marcadores
morfológicos clássicos, bioquímicos,
genéticos, moleculares.
Mapa físico – clonagem de grandes
regiões genômicas:
1000 Kb
YACs: Cromossomo Artificial
Levedura
100 – 300 Kb
BACs: Cromossomos Artificial
Bacterias
PACs: Cromossomo Artificial Fago
45 Kb
Cosmídios: Híbridos fagos e
plasmidios
Seqüênciamento – plasmídios ou fagos
≥ 4 kb
Seqüênciamento shotgun Hierárquico
Fabiana G. S. Pinto
Seqüênciamento final dos clones para ambas estratégias
“Eletroferograma”
Fabiana G. S. Pinto
Clonagem de DNA em vetores para seqüênciamento
* Clonagem de fragmentos
randômicos de DNA de um
genoma completo.
* Clonagem de DNA de um gene
de interesse.
* Diversos tipos de Vetores
PCU18/19 para insertos
≥ 4 kb
Inserto DNA no plasmídio
vetor
* Diversos tipos de Vetores
PCU18/19 para insertos
≥ 4 kb
Fabiana G. S. Pinto
Inserto de DNA e
Vetor cortados com a
mesma endonuclease de
restrição
EcoRI
Fabiana G. S. Pinto
Seleção de clones recombinantes, contendo inserto DNA
X-Gal = Substrato cromogênico.
β Galactosidase funcional usa X-Gal → colônias azuis
β Galactosidase inativa → colônias brancas
Inserto de fragementos DNA
que queremos sequenciar
interrompe a expressão do
gene LacZ. Portanto, o
fenótipo resultante de uma
célula de E. coli
transformada com um
plasmideo recombinate com
DNA exógeno é uma enzima β
Galactosidase inativa β
Fabiana G. S. Pinto
Construção de Bibliotecas Genômicas para seqüênciamento
• DNA genômico total: 500 ug.
•DNA fragmentado:
Método físico, Nebulização. Sonicação.
Enzimático, Sau3AI, DNaseI.
1- Fragmentos randômicos de DNA
Fabiana G. S. Pinto
2- Reparo das pontas dos fragmentos DNA
GTACTTTACG
CATGAAATGCAAT
GTACTTTACG
** TGAAATGC
GGTA CTTTACG***
* CATGAAATGCAAT
GTACTTTACG “blunt”
CATGAAATGC
SmaI 1 único sítio de
clonagem no polylinker
“Blunt” *
Fragmento klenow da
DNA Polimerase I
DNA Polimerase I Fago
T4
Fabiana G. S. Pinto
2- Reparo das pontas dos fragmentos: fosforilação
5’ pGTACTTTACG “blunt”
CATGAAATGCp 5’
5’ monofosfato
Polinucleotídeo
quinase do fago T4
PNK
Função do vetor usado para clonagem:
- Kit utilizam sistema TOPO – topoisomerase II
( desfosforilar os fragmentos em função do vetor
fosforilado)
- Vetor pUC 18 (inverso do Kit TOPO)
Fabiana G. S. Pinto
3-Seleção dos fragmentos de DNA do tamanho desejado
Low Melting Agarose
Cortar fragmentos entre
1 – 3 Kb
KB
3 KB
1 KB
Fabiana G. S. Pinto
4-Ligação dos fragmentos no vetor pUC18 e transformação
Seleção Ampicilina
e colônias brancas
Fabiana G. S. Pinto
Seleção de clones: Ampicilina (250 μg/mL) e colônias brancas
Colônias
azuis sem
inserto
Colônias brancas
contém inserto
serão picadas para
placas
Fabiana G. S. Pinto
Crescimento de clones para extração do DNA plasmidial: mini-prep.
Placas deep well para crescimento
dos clones de E. coli.
Meio LB Ampicilina. 12 a 16 h.
37°C. 150 rpm.
Mini-prep – Lise alcalina
Placa de fundo U
Placa Millipore – filtro para
purificar DNA plasmidial na
ultima etapa da mini-prep
Fabiana G. S. Pinto
Crescimento de clones para extração do DNA plasmidial: mini-prep.
•Ressuspensão.
Tampão Tris-HCl. EDTA. Glicose.
RNAse.
•Lise
NaOH/SDS. Solubilizar componentes de
membranas celulares e lise celular.DNA
cromossomal e plasmidial e proteinas
desnaturados. RNA degradado.
•Neutralização.
Acetato de potássio. Precipitação
proteína, restos celulares e DNA
cromossomal em complexo sal-
detergente insolúvel. DNA plasmidial
re-natura corretamente em
sobrenadante.
•Purificação DNA plasmidial.
Centrifugação. Filtração (millipore).
Sobrenadante DNA plasmidial
precipita Isopropanol/Etanol.
Fabiana G. S. Pinto
Eletroforese em gel de agarose
Gel de Mini-prep em placa de 96 poços
Fabiana G. S. Pinto
Seqüênciamento de DNA
Fabiana G. S. Pinto
Seqüênciamento de DNA
1977. Duas técnicas de seqüênciamento.
MAXAM-GILBERT – Método Químico.
FREDERICK SANGER – Método Enzimático.
Fred Sanger
Gilbert
Fabiana G. S. Pinto
MAXAM-GILBERT:
alteração química das bases
Walter Gilbert
Fabiana G. S. Pinto
Método de Maxam-Gilbert
•Preparações de DNA.
Marcação com fosforo
radiativo (
32
P) no extremo 5’.
•Alteração química das
bases. Remoção e clivagem.
•Separação dos fragmentos
por eletroforese em gel de
poliacrilamida.
Fabiana G. S. Pinto
Frederick Sanger
Método Didesóxi/ Enzimático
ou
Terminadores de Cadeia
Fabiana G. S. Pinto
Seqüênciamento de DNA
4 dNTPs
desoxinucleotídeos
trifosfatos
ddNTPs – Terminadores marcados
ddG, ddA, ddT, ddC
( fluorescência)
4 ddNTPs
di-desoxinucleotídeos
trifosfatos
Método de Sanger
Fabiana G. S. Pinto
Método de Sanger
Química de terminação da cadeia com di-desoxinucleotídeos. ddNTP.
Fabiana G. S. Pinto
Seqüênciamento de DNA Manual : Método de Sanger
DNA molde
A T T G G C G A A
A T T G G
A
A T T G G C
C A C A C T A T T C G T T T A T C
3´ 5´
T A A

T A A

T A A

T A A

A

C

C C A C T A A T T C G T T T A T C


T C A C T A A T T C G T T A T C C


T

C A C T A A T T C G T T T A T C C
5´ 3´
G

Video: Sequenciamento Manual
Fabiana G. S. Pinto
Seqüênciamento de DNA
Auto-radiografia de Gel de
seqüênciamento clássico para
ambos métodos Maxam-
Gilbert e Sanger.
Gel desnaturante. Formamida
ou Uréia.
ddNTPs marcados com
32
P
Fabiana G. S. Pinto
Seqüênciamento de DNA Automatizado
Seqüênciamento automatizado ABI 377
ABI 377
Sistema de eletroforese
gel de poliacrilamida.
Capacidade para 48
leituras
em 5 a 6 horas.
Seqüências de boa
qualidade > 400 pb.
Fabiana G. S. Pinto
MegaBace 1000.
Sistema de eletroforese
capilar.
Capacidade para 96
leituras
em 1 a 3 horas.
Seqüências de boa
qualidade > 400 pb.
Seqüênciamento de DNA Automatizado
Seqüênciamento automatizado MegaBace 1000
Vídeo Sequenciamento Automático
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Reação Seqüênciamento:
•Primer: Universal ou Reverso para
plasmídeos ou cosmídeos.
* DNA: 200 – 400ng plasmídeo (+/-4 kb)
> 800ng cosmídeo (+/-40 kb)
* Dye ET Mix
Termociclador: Ciclos de PCR
•Kit de seqüênciamento: DyeET Mix. Mistura contendo enzima de
seqüênciamento, “Thermo Sequenase” (DNA Polimerase com alta
processividade e afinidade para dNTP). ddNTP, Dye terminators com duas
marcas de fluorescência.
•Seqüênciamento de insertos em vetores (plasmídeos ou cosmídeos)
Placa de 96 well
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Preparação para injeção
das amostras
• Matriz Poliacrilamida
• Placa com Tampão
• Placa com amostras
* Ajustar parâmetros de
injeção.
* Eletro-injeção.
•Voltagem (Kv) e
•tempo de injeção (s).
Após Reação de seqüênciamento:
* Precipitação dos produtos de
PCR. Eliminar os dNTP, ddNTP
não incorporados, enzimas
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Compartimentos internos de cátodo e anodo
cátodo anodo
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Interior da câmara contendo 6 conjunto de 16 Capilares c/u (96)
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Sistema de detecção e identificação de terminators ddNTP
• Cada um dos quatros dideoxy terminators – ddG, ddA, ddC, ddT – estão
marcados com dois tipos de dye – fluoresceína e rodomina.
•A fluoresceína alto coeficiente de extinção (488nm) no laser de argon.
Atua como um dye doador absorve a energia da luz do laser incidente e a
transfere para o dye aceptor (rodomina)
•A rodomina emite a luz em um comprimento de onda característico para a
identificação dos 4 nucleotídeos que terminam a fita de DNA.
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Seqüênciamento de DNA em MegaBace 1000
Detecção de fluorescência no sequenciador automático
Fabiana G. S. Pinto
Seqüênciamento em MegaBace 1000
Eletroferograma e seqüência em nucleotídeos
A = verde G= preto
C= azul T= vermelho
Tamanho da seqüência= 400 – 700 bp
Fabiana G. S. Pinto
Eletroferograma completo
Fabiana G. S. Pinto
Seqüênciamento de DNA em MegaBace 1000
Score Card
Vídeo Sequenciamento Automático 2
Fabiana G. S. Pinto
Obtenção de Seqüências geradas pelo MegaBace 1000
* PHRED:
- Transforma os dados brutos em seqüências de bases, atribuí valores
de qualidade a cada base na seqüência e gera arquivos de saída FASTA
e PHD
* PHRAP:
- Leitura Montagem dos pequenos fragmentos de DNA seqüenciados em
seqüências maiores: CONTIG
* CONSED:
- Visualização e edição das montagens das seqüências de alta qualidade
• Dados brutos (medidas analógicas) de saída do seqüênciamento→ Base calling
BIOINFORMÁTICA
Fabiana G. S. Pinto
Valores de qualidade gerados pelo PHRED
Quando arquivos de seqüências de DNA são analisados pelo phred
→ a cada base é assinada um valor de qualidade, o qual é uma
estimativa da probabilidade de erro para essa base.
Bases com um valor de qualidade de 20 são consideradas com um
alto valor de qualidade.
q = -10 log
10
(pe) onde pe= erro estimado
q20 = 1/100 probabilidade de erro
q30= 1/1000 probabilidade de erro
q40= 1/10000 probabilidade de erro
Fabiana G. S. Pinto
Regiões genômicas que podem ser melhoradas re-seqüênciamento.
Fabiana G. S. Pinto
Análise e Montagem das Seqüências
Seqüências shotgun analisadas Phred, Phrap e Consed
Resultado
Seqüências ordenadas com consenso formam um “CONTIG”
Fabiana G. S. Pinto
Evolu Evoluç ção do seq ão do seqü üênciamento ênciamento shotgun shotgun
Projeto genoma → depositar as seqüências para a central de Bioinformática
Evolução dos contigs
com a submissão
das seqüências
shotgun.
Finalização
40% a 50%
do tempo total do
projeto
Fabiana G. S. Pinto
PCR
Animações
•http://www.dnalc.org/Sockwave/pcranwhole.html
MUITO
OBRIGADA!!!!!!!