Prof. Alexandre S.

Osório

O QUE É UM GENOMA
• É o conjunto haplóide de cromossomos de uma espécie. • O projeto genoma humano cromossomos humanos. - 22 autossomos + X + Y analisou 24

• Podemos considerar o genoma como o conjunto de todo material genético de um ser vivo.

COMPOSIÇÃO DO GENOMA HUMANO

Objetivo Mapear o patrimônio genético do Homem

• Avanço na Medicina
– Preventiva – Diagnóstico (específico, sensível, efetivo e seguro) – Tratamento (desenhos de fármacos específicos)

• O arranjo linear dos nossos cromossomos fazem parte da nossa micro-anatomia. • Histórico:
– 1543- corporis humani Fabrica por Andreas Vesalius; – 1628- fisiologia da circulação por Harvey; – 1761- anatomia mórbida por Morgagni.

1956- Evolução da Genética Médica
• 1956- Estabelecimento do número de cromossomos e a determinação da estrutura de dupla-hélice do DNA por Watson e Crick; • 1959, descrita a 1º síndrome (Down). Nos anos 60 uma série de anormalidades começaram a ser descritas (nº, translocação, deficiência, mosaicos, triploidias e microdeleções).

Mapeamento Genético

• Provavelmente o 1º gene a ser mapeado foi o do Daltonismo (1911-1968) • 1980- análise de células somáticas através do uso de sondas (“diretamente no gene afetado); • Construção de marcadores genéticos para serem utilizados em famílias (RFLP, Seq TANDEM, Microsatélites, etc).

O Sequenciamento do Genoma Humano – A última anatomia
Antes mesmo do lançamento do PGH ser lançado uma variedade genes já haviam sido descritos; • 1944- 1ª apresentação do material genético por Avery, McLeod e McCArty em pneumococcus; • 1953- Watson e Crick deduziram a dupla-hélice do DNA por difração de radiografia; • 1966- dedução dos nucleotídeos (para codificação de aa); • 1960s – Uso de enzimas de restrição; • 1970s- Clonagem de genes em plasmídeos bacterianos e a técnica do DNA recombinante;

• 1980- O Departamento de Energia dos EUA propõem do sequenciamento do genoma humana devido a preocupação de mutações ocorridas devido a radiação que seus trabalhadores estavam expostos.

Década de 1980- Primeiras discussões  PGH; 1984- PG: EUA  mapear patrimônio genético humano. Japão e Austrália: organismo de coordenação internacional HUGO (Human Genome Organization)  facilitar e coordenar  mapear, sequenciar e analisar: genoma humano e sua aplicação; 1990PGH internacional: americanos e europeus. pesquisadores

• 1988- acreditava-se que o mapeamento e o seq. completo do genoma humano seria possível ser feito em 10-15 anos (2005), com um custo de $200 milhões de dólares as ano liberado pelo congresso nacional americano. • O Comitê assessor do PGH recomendou que se fizesse o seq. a partir da construção dos mapas genéticos e físicos dos cromossomos e que fossem sendo feitos modelos de outros organismos em paralelo.

• 01/10/1990: foi lançado nos EUA do PGH: patrocinado pelo NIH (National Institutue of Health) e pelo DOE (Departament of Energy). • Foi criado o grande consórcio mundial para o seq. do genoma humano formado pela Europa, Japão e Austrália. • HUGO ( Human Genome Organization)sintonizar o trabalho e organizar o conhecimento em um banco de dados.

• Abril de 2003 durante as comemorações de 50 anos da molécula de DNA. – 96% do genoma. • Os 6% restante são regiões que ainda hoje não se possui meios de serem analisadas. Essas regiões são basicamente os centrômeros e os telômeros dos cromossomos, que representam o centro e as extremidades de um cromossomo, respectivamente. A dificuldade em se analisar essas regiões se deve a grande quantidade de repetições de DNA e regiões de extremo condensamento.

No dia 4 de Setembro de 2007, o grupo de pesquisa do Instituto J. Craig Venter publicou a sequência completa do genoma do próprio pesquisador Craig Venter (Venter, et al 2007). A grande revolução nesse novo trabalho é a de que o genoma avaliado corresponde ao genoma diplóide, contendo a informação de cada par de cromossomo herdado de nossos pais, ao contrário da sequência determinada pelo Projeto Genoma que corresponde ao genoma haplóide. Como resultado, descobriu-se que a diferença das sequências genéticas entre dois indivíduos é de 99,5% e não de 99,9% como se imaginava ao fim do Projeto Genoma Humano.

Quem participa do PGH ?
• Setor Público  dados - qualidade e precisão: detalhes das células humanas. • Setor Privado  genes de interesse. • 18 Países : Alemanha, Austrália, Brasil, Canadá, China, Coréia, Dinamarca, EUA, França, Holanda, Israel, Itália, Japão, México, Reino Unido, Rússia, Suécia e União Européia.

MAPEAMENTO E SEQUENCIAMENTO DO GENOMA
GENOMA: DNA  células - determinado organismo. • Mapeamento  Divisão dos cromossomos  fragmentos menores  propagados, caracterizados e ordenados  respectivas posições nos cromossomos. • Sequenciamento  Seqüência de bases  fragmentos de DNA já ordenados  genes na seqüência do DNA.

VANTAGENS DO PGH
• Doenças fator genético; • Tecnologias clínicas  diagnósticos de DNA; • Terapias novas classes de remédios; • Técnicas imunoterápicas;

•Prevenção Doenças condições ambientais: mal de Alzheimer, hipertensão, obesidade, artrite reumática, suscetibilidade ao câncer de mama e ovário, osteoporose, câncer do cólon, doenças cardiovasculares, mal de Parkinson, calvície; •Genes defeituosos  Terapia Gênica •Drogas medicinais  organismos geneticamente alterados

Filme Projeto Genoma Humano

COMO É FEITO O SEQUENCIAMENTO
• Mapeamento • Sequenciamento • Etapas do Sequenciamento
1. 2. 3. Picotando o DNA Clonagem Marcação com Fluorescência 4. Separação 5. Leitura

Ver animação!!!
1. Picotando o DNA 4. Separação

Fig . 1 : Bases nitrogenadas do DNA

2. Clonagem 3. Marcação com Fluorescência

Fig . 3: Fragmentos de DNA separados pelo tamanho

5. Leitura

Fig . 2 : Cromatograma de 4 cores Fig . 4 : Dados processados

Os resultados são mostrados num cromatograma de quatro cores. •Depois os computadores reúnem as seqüências em longos e contínuos trechos.

• 1º organismo livre seq. foi a bactéria Haemophilus influenzae, com 1800 genes que codificam proteínas. Este seq. foi feito pelo grupo do J. Craig Venter utilizando a técnica de aproximação. • Helicobacter pylori, Mycobacterium tuberculosis e Treponema pallidum. • 1996- 1º eucarioto seq. completamente, o Saccharomyces cereviae. • 1998- 1º organismo multicelular completamente seq. foi o nematoíde Caenorhabditis elegans. • 2000/ março – Drosophila melanogaster.

ALGUNS GENOMAS FINALIZADOS

• 26 de junho de 2000
– Na Casa Branca, Colins e Venter anunciaram a conclusão inicial do PGH – O grupo do Colins publicou na “Nature” – O grupo do Venter publicou na “Science”

A maior conclusão deste grande projeto foi explicar que a complexidade do ser humano esta baseada codificação de diferentes proteínas e não no número de genes.

Venter et al.

Colins et al.

• Abril de 2003 : seqüência completa.
• O sequenciamento do genoma humano não corresponde ao genoma específico de determinada pessoa. • Estima-se que 99.9% da seqüência seja exatamente a mesma entre todos os seres humanos. • O Tamanho dos genes varia enormemente: gene médio = 3.000 bases • Maior gene conhecido: distrofina (2.4 milhões de bases). • Cromossomo 1 tem a maioria dos genes (2.968), e o Y a menor parte (231).

Sequenciamento dos genes
“É cada vez maior o esforço dos cientistas para colocar à disposição um número crescente de genomas inteiros sequenciados dos mais diferentes organismos.”

Fig.7 : Representação do mapeamento genético no cromossomo humano

O DNA humano é formado por 3.1 bilhões de pares de base, com 4 nucleotídeos diferentes (A, C, G, T). Essas combinações se repetem ao longo do genoma em diferentes ordens para formar aa, que combinado formaram as proteínas necessárias. Ele é formado por grandes desertos e alguns oásis. Só 3% do DNA contém regiões codificadoras (centrais). O genoma humano é idêntico em 99,5%, os 0,1% é que traz as variações e pistas de muitas doenças

“A complexidade dos seres humanos surgiu de alguma outra fonte” Colins 12/02/01

• O Brasil também participou do Projeto Genoma Humano . • As principais iniciativas tomadas foram a da clonagem dos genes pelo laboratório da pesquisadora Mayana Zatz; • Projeto Genoma Humano do Câncer está em andamento graças a união da Fapesp, Instituto Ludwig, Unicamp, EPM e da Faculdade de Medicina da USP; • O Genoma Cana leva o Brasil a liderar a pesquisa em genoma de plantas (Copersucar à FAPESP em 1998) • O seqüenciamento de uma praga de lavoura de laranja chamada de Xylella fastidiosa.

Câncer e o Projeto Genoma

Fig . 8 : Representação da porcentagem dos tipos de câncer

Genoma Câncer
• Pretende gerar entre 500mil e 700mil sequenciamentos • Acesso a regiões codificadoras ainda não explorados • Elucidação no sequenciamento genético do Homo sapiens • Descoberta (???) da cura do câncer

• O Futuro: A Medicina do Século 21
– – – – – – – Saber a função de todas essas proteínas Saber as variações, padrões, estruturas e fenótipos Identificar alelos para suscetibilidade Buscar marcadores Especificar diagnósticos (mendelianos ou não) Conhecer a vulnerabilidade ou resistência Influência: medicina reprodutiva, preditiva, no conceito de doenças que levem os médicos a interpretar genes como hemogramas, diagnósticos específicos e clínicos, caracterização precisa das doenças, busca de terapias personalizadas (fármacos), impressão digital dos tumores (2020).

EXERCÍCIOS
1) (Unifesp-2004) Em abril de 2003, a finalização do Projeto Genoma Humano foi noticiada por vários meios de comunicação como sendo a “decifração do código genético humano”. A informação, da maneira como foi veiculada, está a) correta, porque agora se sabe toda a seqüência de nucleotídeos dos cromossomos humanos. b) correta, porque agora se sabe toda a seqüência de genes dos cromossomos humanos. c) errada, porque o código genético diz respeito à correspondência entre os códons do DNA e os aminoácidos nas proteínas. d) errada, porque o Projeto decifrou os genes dos cromossomos humanos, não as proteínas que eles codificam. e) errada, porque não é possível decifrar todo o código genético, existem regiões cromossômicas com alta taxa de mutação.

CORRETA : LETRA C

2) O bacteriófago t2 tem como material genético uma molécula de DNA com cerca de 3600 nucleotídeos, que compreendem três genes. Admitindo que esses três genes tenham aproximadamente as mesmas dimensões e que a massa molecular média dos aminoácidos seja igual a 120, cada uma das proteínas por eles codificada deve ter uma massa molecular aproximada de: a) 48000 d) 12 000 b) 24 x 103 e) 144 x 103 c) 4 x 102 RESOLUÇÃO: 3600 nucleotídeos / 3 genes = 1200 nucleotídeos em cada gene.

3 nucleotídeos ----------- 1 aminoácido 1200 nucleotídeos ------- X aminoácidos X = 400 aminoácidos em cada proteína.

400 aminoácidos x 120 massa molecular média 48 000 massa molecular das proteínas

RESPOSTA : LETRA A

3) (UnB – DF) Cientistas norte-americanos e britânicos conseguiram, pela primeira vez, identificar todos os elementos que compõem o genoma de um animal, um verme conhecido como Caenorhabditis elegans. O trabalho, realizado durante oito anos por equipes da Universidade de Washington, de Saint Louis (EUA), e do Centro Sanger de Carnbridge (GrãBretanha), permitiu que fossem identificados os 97 milhões de pares de bases e os cerca de 20 mil genes que constituem o ácido desoxirribonucléico (DNA) do animal. O Estado de s. Paulo, 11/12/98 (com adaptações). Supondo que todos os genes mapeados codifiquem proteínas e que uma proteína possui, em média, 200 aminoácidos, calcule a porcentagem do genoma do Caenorhabditis elegans representada pelas regiões codificadoras de proteínas. Despreze a parte fracionária de seu resultado, caso exista.

RESOLUÇÃO : 20 000 genes = 20 000 proteínas = 2 x 104 proteínas. 2 x 104 proteínas x 200 aminoácidos 400 x 104 = 4 x 106 aminoácidos em todas as proteínas do verme. 3 nucleotídeos ------------ 1 aminoácido X nucleotídeos ----------- 4 x 106 aminoácidos X = 12 x 106 nucleotídeos (que codificam todas as proteínas do verme)

97 000 000 de pb. = 97 x 106 pb. 97 x 106 ----------------- 100% 12 x 106 ----------------- X X = 1200/97 = 12,37 % RESPOSTA: 12

4) As duas principais revistas científicas do planeta, a inglesa Nature e a norte-americana Science, publicaram, dia 12/02/2001, uma das conquistas mais aguardadas dos últimos tempos: a conclusão do seqüenciamento do genoma humano. A grande novidade, no final dos estudos, foi que o número de genes identificados (cerca de 30 mil) é bem mais tímido do que o inicialmente aguardado (em torno de 140 mil). Os trabalhos desenvolvidos pela empresa de biotecnologia Celera e o Projeto Genoma Humano (PGH), formado por 16 instituições públicas de pesquisa, permitiram a identificação quase total dos 3 bilhões de pares de bases que constituem o ácido desoxirribonucléico dos humanos. (http://noticias.correioweb.com.br, com adaptações) Supondo que todos os genes mapeados codifiquem proteínas e que uma proteína possui, em média, 200 aminoácidos, calcule a porcentagem do genoma humano representada pelas regiões codificadoras de proteínas. a) 0,6% d) 2,5% b) 1% e) 50% c) 1,6%

RESOLUÇÃO: 30 000 genes = 30 000 proteínas = 3 x 104 proteínas 3 x 104 proteínas x 200 aminoácidos 600 x 104 aminoácidos em todas as proteínas humanas 3 nucleotídeos ------------- 1 aminoácido X nucleotídeos ------------ 6 x 106 aminoácidos X = 18 x 106 nucleotídeos (codificam todas as proteínas humanas) 3 000 000 000 pb = 3 x 109 pb 3 x 109 ---------------- 100% 18 x 106 ---------------- X X = 18 x 108 / 3 x 109 X = 18/30 = 0,6 % RESPOSTA: LETRA A

5) O gene supressor de tumor p-53 é um dos principais alvos de mutação durante o processo de carcinogênese. Está localizado no braço curto do cromossomo 17 e codifica a nucleoproteína p-53 que é responsável pela regulação da transcrição nuclear, funcionando como um “policial molecular”. Se a célula for exposta a agentes mutagênicos externos a p-53 acumula-se no núcleo freando o ciclo celular em G1, dando tempo para que a célula repare seu DNA. Caso a célula não o repare, a p-53 dispara a morte celular por apoptose. Na versão mutagênica desse gene, a célula que sofre lesão em seu material genético não tem sua divisão celular interrompida e deste modo, o dano celular se transmite às células filhas. A mutação de p-53 não causa a transformação maligna sozinha, porém predispõe a célula a outras mutações que a levarão a uma transformação maligna. Baseando-se no texto e em conhecimentos correlatos, responda ao que se pede. a) Sabendo que a p-53 é uma proteína constituída por 393 aminoácidos, quantos nucleotídeos serão necessários apenas para a codificação desses aminoácidos? b) Quantos códons serão necessários para a síntese dos 393 aminoácidos? Justifique.

RESOLUÇÃO : c) 3 nucleotídeos --------------- 1 aminoácido X nucleotídeos --------------- 393 aminoácidos X = 1179 nucleotídeos h) 3 nucleotídeos = 1 códon = codificação de 1 aminoácido, logo 393 aminoácidos = 393 códons.

6) Galactosemia: incapacidade de transformar galactose em glicose As reações bioquímicas que envolvem a galactose – monossacarídeo derivado da lactose (açúcar do leite) – são de particular interesse porque, em seres humanos, estão sujeitas a defeitos genéticos que resultam na doença conhecida como galactosemia. Quando o defeito está presente, os indivíduos são incapazes de metabolizar a galactose a metabólitos da glicose, o que freqüentemente ocasiona catarata, crescimento deficiente, retardo mental e eventual morte por lesão hepática. Um dos distúrbios genéticos é devido à mutação no gene GALK1, expressa como uma deficiência celular da enzima galactoquinase, promotora da degradação do referido monossacarídeo. Sabendo-se que a enzima galactoquinase possui 392 aminoácidos e que o gene GALK1 ocupa uma região de 7.300 pb no genoma, qual a porcentagem da região codificadora (éxons) em relação ao tamanho total do gene?

RESOLUÇÃO : 1 aminoácido ------- 3 bases no RNAm -------- 3 pb no DNA 392 aminoácidos -------------------------------------- X X = 1.176 pb 7.300 pb ------------ 100% 1.176 pb ------------x x = 16,11%

7) "Um mecanismo molecular para as conexões entre os neurônios" Artigo publicado recentemente na revista norte-americana Cell (vol. 101, pp. 671684, 2000) apresenta uma possível explicação para a grande especificidade e diversidade das conexões feitas pelas células nervosas. Além de dar novas pistas sobre as bases moleculares dos circuitos neuronais, o trabalho também é uma valiosa contribuição aos estudos sobre o papel de certas regiões do genoma, que aparentemente não têm função, na síntese de proteínas. O trabalho baseou-se na clonagem e na identificação de um gene da Drosophila, mais conhecida como moscadas- frutas. Esse gene codifica uma proteína localizada na membrana celular dos axônios, que são as projeções dos neurônios responsáveis pelas conexões com outras dessas células nervosas. G. Schmucker e colaboradores descobriram que uma proteína, denominada Dscam, localizada na membrana dos axônios, é o componente externo do receptor de um sistema de sinalização que governa o movimento e o estabelecimento de conexões entre os neurônios. (Ciência Hoje, nº 168, com adaptações) Sabendo-se que a Dscam tem 2.026 aminoácidos e que o gene que a produz contém 24 regiões codificadoras (exons), espalhadas num total de 61.200 pares de bases nitrogenadas, calcule: a) A porcentagem aproximada da região do DNA codificadora de tal proteína. b) A quantidade aproximada de códons do RNAm responsável pelo "comando" da tradução da Dscam. Justifique.

RESOLUÇÃO: a) 3 nucleotídeos --------------- 1 aminoácido X nucleotídeos ------------- 2026 aminoácidos X = 6078 nucleotídeos

61.200 nucleotídeos ----------------- 100% 6.078 nucleotídeos -------------------- x x = 9,93% b) 3 nucleotídeos ----------------- 1 códon 6078 nucleotídeos ------------- X X = 2026 códons.

8) "DNA pode criar novo teste para hanseníase" O bacilo da hanseníase acaba de ter seu genoma decifrado. Os resultados deverão permitir o desenvolvimento de testes de diagnóstico mais rápidos e eficazes para a doença, que é responsável por 700 mil casos novos anualmente em todo o mundo, mais de 42 mil só no Brasil. O trabalho publicado na edição de hoje da revista britânica "Nature" (www.nature.com) trouxe algumas surpresas para os pesquisadores do Instituto Pasteur (França) e do Sanger Centre (Reino Unido) que conduziram o estudo. Uma delas é o número reduzido de genes, principalmente se comparado com o de um parente próximo, o bacilo da tuberculose. Enquanto a Mycobacterium leprae (que causa a hanseníase) tem cerca de 1.600 genes, a M. tuberculosis (que causa a tuberculose) tem mais de 3.900 genes. O tamanho do genoma dos bacilos é 3.268.203 e 4.411.532 pares de bases, respectivamente. A análise do proteoma (o repertório de proteínas que são produzidas pelo organismo) revelou dados mais curiosos ainda. Como a cada gene corresponde pelo menos uma proteína, seria de esperar que a M. leprae produzisse 1.600 proteínas. No entanto, foram detectadas apenas 391. "Cerca de um terço são proteínas de membrana, insolúveis, e portanto não identificáveis pelo proteoma.(...) (Folha de São Paulo, 22/02/2001, com adaptações) Supondo-se que todas as proteínas do M. leprae possuam 300 aminoácidos, calcule a porcentagem da região codificadora, identificável pelo proteoma, em relação ao genoma total dessa bactéria.

RESOLUÇÃO :
1 códon ----------- 3 nucleotídeos ------ 1 aminoácido x ---------------------- 300 aminoácidos X = 900 nucleotídeos 1 gene ---------- 900 nucleotídeos ----------1 proteína X ------------- 391 proteínas X = 351.900 nucleotídeos Genoma: 3.268.203 pb ---------------- 100% 351.900 pb ---------------- X X = 10,77%

8) Grupo decifra DNA de levedura da cerveja Um consórcio internacional completou o seqüenciamento do material genético da levedura de cerveja Schizosaccharomyces pombe, que tornouse o sexto organismo com núcleo celular organizado a ter seu genoma conhecido. O grupo foi coordenado pelo britânico Paul Nurse, do Instituto do Câncer em Londres, Nobel de Medicina de 2001. O sequenciamento revelou um número pequeno de genes que codificam proteínas (4.824) e um grande número deles (43%) com os chamados "íntrons" no meio (DNA não-codificador de proteína). "Pombe" quer dizer cerveja em suaíli, língua da África oriental, onde a levedura foi primeiro isolada, no século 19. O estudo está na "Nature". (Folha de São Paulo 21/02/2002) Baseando-se no texto e em conhecimentos correlatos, responda: a) Supondo que cada gene codifique uma proteína de 400 aminoácidos, calcule o tamanho total (em pares de bases ou pares de nucleotídeos) das regiões que não contêm introns nesses genes. b) Quantos códons seriam transcritos pelos exons?

RESOLUÇÃO: a) 3 nucleotídeos ----------- 1 aminoácido X ---------- 400 aminoácidos X = 1.200 nucleotídeos no DNA = 1 gene (com exon e intron) 1 gene ---------------- 1.200 nucleotídeos 4.824 genes ---------- X X = 5.788.800 nucleotídeos (sendo que 43% são introns, portanto, 57% são exons) 5.788.800 x 57% = 3.299.616 nucleotídeos

a) 1 códon --------------- 3 nucleotídeos X ---------------- 3.299.616 nucleotídeos X = 3.299.616/ 3 = 1.099.872 códons