You are on page 1of 91

Universidade Federal de Santa Catarina

Centro Tecnolgico
Departamento de Engenharia Qumica e Engenharia de Alimentos
Curso de Engenharia Qumica

Apostila

EQA5561
IntroduoEngenhariaGenmica

2005
Gisele Serpa, Dr. Eng.
Luismar Porto, Ph.D.
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
1
1. Fundamentos bsicos de bioqumica e biologia molecular.

A composio qumica dos organismos vivos qualitativamente muito diversa da do meio fsico
em que vivem. A maioria dos componentes qumicos dos organismos vivos de natureza orgnica
compostos de carbono nos quais o carbono est relativamente reduzido ou hidrogenado. Muitas
biomolculas orgnicas tambm contm nitrognio, enxofre, e oxignio. Em contraste, os elementos
carbono e nitrognio no so abundantes na matria inanimada, ocorrendo na atmosfera e na crosta
terrestre somente nas formas inorgnicas simples, como o dixido de carbono, nitrognio molecular,
carbonatos e nitratos.
Os compostos orgnicos presentes na matria viva ocorrem numa variedade extraordinria e
muitos deles so extremamente complexos. Mesmo as clulas mais simples e menores, as bactrias,
contm um nmero muito elevado de molculas orgnicas diferentes de protenas, carboidratos, lipdios e
cidos nuclicos. Alm disso, a maior parte da matria orgnica das clulas vivas constituda de
macromolculas com pesos moleculares elevados, incluindo no somente as protenas e cidos
nuclicos, como tambm substncias polimricas como amido e celulose, entre outras.
Embora sejam molculas complexas, a imensa variedade de macromolculas orgnicas
constituintes dos organismos vivos pode se reduzir a alguns grupos simples de molculas mais simples,
chamados monmeros primrios ou blocos construtivos. O amido e a celulose, por exemplo, so
constitudos de vrias molculas de glicose, arranjadas uma ao lado da outra. As protenas, por sua vez,
consistem de uma cadeia de aminocidos, ligados covalentemente, os quais so compostos pequenos
de estrutura conhecida. Os cidos nuclicos, DNA e RNA, so tambm polmeros formados por apenas 8
tipos diferentes de monmeros, denominados nucleotdeos, quatro dos quais so os blocos construtivos
do DNA e quatro do RNA. Alm destes polmeros encontrados nas clulas, ainda destacam-se os lipdios,
que no so molculas polimricas, j que no so resultantes da adio de monmeros. Os lipdios em
conjunto com as protenas, so as molculas formadoras de todas as membranas existentes nas clulas.
O objetivo deste captulo fornecer alguns conceitos e aplicaes de cada umas destas classes
de macromolculas.

1.1. Carboidratos

Os carboidratos, ou sacardeos, so mais simplesmente definidos como poliidroxialdedos ou
poliidroxicetonas e seus derivados. Muitos possuem a frmula bsica [CH
2
O]
n
, que originalmente sugere
hidratos de carbono. Os monossacardeos tambm chamados de acares simples consistem numa s
unidade poliidroxialdedica ou cetnica.
Carboidratos podem servir como elementos estruturais. Encontram-se livres ou combinados,
especialmente com as protenas (glicoprotenas). Entram tambm na composio da membrana,
citoplasma, ncleo, membranas de organelas celulares, sendo pois, substncias de destacada
importncia biolgica. Os carboidratos so o substrato dos processos bioqumicos orgnicos, como
gliclise, fermentao alcolica e lctica. No ciclo energtico da vida, o processo de fotossntese,
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
2
realizado pelas plantas, utiliza a luz solar para converter gs carbnico (CO
2
) e gua (H
2
O) em
carboidratos (por ex., C
6
H
12
O
6
). Os carboidratos so oxidados com oxignio do ar, durante o processo de
respirao, produzindo ATP a partir de ADP, molculas utilizadas pelas clulas em processos onde se
necessita transferncia de energia (Figura 1.1). A respirao celular ser estudada no captulo 4.


1.1.1. Aldoses e cetoses






Figura 1.2: Trioses Os
monossacardeos mais simples
(Adaptado de Mathews, 1999)
As menores molculas normalmente encontradas como
monossacardeos so as trioses, com n=3, ou seja 3 carbonos (O
sufixo ose comumente usado para designar compostos como
sacardeos).
Existem 2 tipos de trioses: gliceraldedo e diidroxiacetona
(Figura 1.2). Elas representam as duas maiores classes de
monossacardeos. O gliceraldedo um aldedo da classe das
aldoses. A diidroxicetona uma cetona da classe das cetoses.
Observe que ambos tm a mesma composio atmica elementar.
Eles so tautmeros (ismeros estruturais que diferem na
localizao dos seus hidrognios e ligaes duplas) e podem ser
convertidos de um para outro.

1.1.2. Enantimeros
Uma caracterstica importante da estrutura dos
monossacardeos pode ser observada examinando-se um pouco
mais cuidadosamente a frmula do gliceraldedo. O segundo
tomo de carbono carrega 4 substitutos diferentes, assim ele um carbono quiral, como um
carbono nos aminocidos, como veremos mais adiante.
O monossacardeo mais abundante o acar de
seis carbonos D-glicose; o monossacardeo fundamental
de onde muitos outros so derivados.
A D-glicose o principal combustvel celular para a
maioria dos organismos e o monmero primrio bsico dos
polissacardeos mais abundantes, como amido e celulose.







Figura 1.1: Ciclo energtico da vida
(Adaptado de Mathews, 1999)
A celulose, em especial a celulose bacteriana,
pode ser utilizada como substituto de pele
humana em procedimentos de medicina
regenerativa (engenharia de tecidos), onde
necessria uma grande quantidade de
material, como o caso de queimaduras que
se estendem por todo o corpo e outras leses
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
3

Assim sendo, o gliceraldedo tem dois
estereoismeros do tipo chamado enantimeros,
os quais no possuem uma imagem subreposta no
espelho. Essas formas tridimencionais so
designadas como D- e L-gliceraldedo, como
mostra a Figura 1.3.
Na natureza, a forma enantiomrica D-
monossacardeo prevalece em organismos vivos.
No h razes obvias do porqu desta preferncia
tenha sido estabelecida, mas ela evolutivamente
persistente para a maioria das maquinarias
celulares, que esto preparadas para operar com
D-acares.


Figura 1.3: Enantimeros do glicaraldedo. D e L so prefixos
para dextrgiro e levgiro, respectivamente, e dizem respeito
ao efeito provocado pela molcula (em geral em soluo) no
desvio, para a direita ou para a esquerda, do plano de vibrao
da luz polarizada. O nmero de ismeros depende do nmero
de carbonos assimtricos, sendo que s existem para carbonos
com ligaes simples. Misturas equimolares de ismeros
dextrgiros e levgiros resultam em misturas ditas racmicas,
no ativas opticamente. (Adaptado de Mathews, 1999)


1.1.3. Estereoismeros dos monossacardeos
Quando se consideram
monossacardeos de mais de trs
carbonos, algumas formas mais
complicadas aparecem. Nestes
casos os monossacardeos podem
ter mais de um carbono assimtrico
ou quiral, o que resulta em mais
estereoismeros. Estes so
anantimeros e diasteremeros,
cujo caso mais simples uma
tetrose. Em geral, a molcula com n
carbonos quirais ter 2
n

estereoismeros, porque h duas
possibilidades para cada centro
quiral (L ou D).
As Figuras 1.4 e 1.5
apresentam os estereoismeros
para os aldo e ceto-
monossacardeos de at seis
carbonos.
Figura 1.4: Estereoismeros para os D-aldomonossacardeos
(Adaptado de Mathews, 1999)
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
4
As molculas D-ribose e D-glicose so de especial interesse em engenharia genmica. A ribose
o acar que compe a cadeia estrutural dos cidos ribonuclicos (RNA) e a glicose a acar
preferido como fonte de carbono e energia para a maioria das clulas.



Figura 1.5: Estereoismeros para os
D-cetomonossacardeos
(Adaptado de Mathews, 1999)
1.1.4. Estruturas Cclicas (Em anel)
Com as pentoses e hexoses, outra caracterstica
qumica dos monossacardeos assume uma maior importncia.
Havendo cinco ou seis carbonos na cadeia principal, estes
compostos, apresentam um potencial para formao de
estruturas cclicas (anis). Os ngulos caractersticos das
ligaes CO so tais que o anel contendo menos de cinco
tomos de carbono no so estveis; no entanto anis com
cinco ou seis carbonos so facilmente formados.
A questo da facilidade de formao dos anis est na
verdade relacionada estabilidade das ligaes carbono
carbono. Ligaes qumicas se formam e se desfazem
continuamente, na maioria das vezes com o auxlio de
catalisadores (enzimas, por exemplo), e a deteco de uma
determinada estrutura est diretamente associada
quantidade relativa da mesma no meio.
Desta forma, ligaes cclicas de quatro carbonos so
pouco estveis, porque sua formao requer uma grande
quantidade de energia; do contrrio, como sua quebra
acompanhada de grande liberao de energia, compostos mais
estveis (menos energticos) so formados em maior
proporo. Um processo que altera profundamente a energia e, portanto, a reatividade e estabilidade de
biomolculas a fosforilao, a adio de um grupo fosfato a acares, protenas, cidos nuclicos, etc.

C
OH H
H HO
OH H
OH H
CH2OH
H O
C
OH H
H HO
OH H
H
CH2OH
H OH
O
H
OH
H
OH
H
OH H
OH
H2C
H
OH
O
O
H
OH
OH
H
H
OH H
OH
H2C
H
OH
D-Glicose
estrutura linear
D-Glicose
estrutura emanel
(piranose)
-D-Glicose
-D-Glicose
(a)
(b)
OH
H2C
H
CH2
HO
H
H OH
O
OH HO
H2C
OH
H
CH2
HO
H
H OH
O
HO
OH
-D-Frutose -D-Frutose








Estruturas apresentadas pelas hexoses. (a) A glicose apresenta-se na
forma linear ou cclica, havendo ainda as possibilidades de formao dos
seus ismeros e , conforme a posio dos grupos hidroxila no carbono
1. (b) A frutose na sua forma cclica de furanose, apresenta tambm os
ismeros e .

Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
5
A glicose uma hexose e dessa forma ocorre na forma cclica. Essas formas cclicas so
chamadas de piranoses, por se assemelharem ao composto pirano, que tambm tem o anel composto
de 6 tomos. Outro tipo de estrutura cclica encontrado nas hexoses so as chamadas furanoses,
estruturas cclicas formadas com cinco tomos, que se assemelham ao furano (Quadro).

1.1.5. Monossacardeos fosforilados
Os monossacardeos carregam um certo nmero de grupos hidroxila nos quais alguns
substituintes podem se ligar ou podem ser trocados por outros grupos funcionais. So muitos os
compostos resultantes deste tipo de modificao, porm pode-se destacar a formao de acares
fosforilados, que so encontrados nas molculas carreadoras de energia do organismo (AMP, ATP, GTP,
etc.) e tambm nos cidos nuclicos (DNA, RNA). Veremos que os monossacardeos fosfatados so os
maiores participantes de muitas das vias metablicas das clulas, merecem destaque os seguintes
compostos: gliceraldedo 3-fosfato, -D-glicose-1-fosfato, -D-glicose-6-fosfato e -D-glicose-6-fosfato
(Figura 1.6).

Figura 1.6: Monossacardeos fosfatados

Para detalhes de nomenclatura e uso apropriado de numerao de carbonos e prefixos, consulte
as publicaes da International Union of Pure and Applied Chemistry, IUPAC (www.iupac.org).

1.1.6. Oligossacardeos e polissacardeos
Os monossacardeos podem ligar-se uns aos outros atravs de ligaes glicosdicas, conforme
apresentado na Figura 1.7, havendo a liberao de uma molcula de gua. As ligaes glicosdicas so
facilmente hidrolisadas (lise = quebra) por cidos, assim, os dissacardeos podem ser clivados,
liberando seus monmeros, sob a ao de cidos diludos. A hidrlise das ligaes glicosdicas gera
energia livre (de Gibbs) que utilizada para realizao de trabalho em processos celulares.
Os oligossacardeos
1
mais simples e mais importantes so os dissacardeos, formados por dois
acares simples. Alguns deles, como, sacarose e lactose so fontes de energia solveis presentes em

1
Oligossacardeos so carboidratos (acares) formados por alguns poucos monossacardeos.

Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
6
plantas e animais. J outros como a maltose e a celobiose, so produtos da degradao de
polissacardeos maiores.


Quando um grande nmero de
monossacardeos est ligado entre si, o resultado
denominado polissacardeo. Estes compostos
freqentemente no so solveis em gua,
mas so importantes na estrutura das clulas
e no armazenamento de energia. So exemplos
de polissacardeos a dextrana, sintetizada por
bactrias e utilizada em substituio do plasma
sanguneo, a celulose, encontrada nas paredes
celulares de plantas e da maioria das algas e
tambm produzida por bactrias, o amido,
importante fonte de reserva de energia das
plantas.


Figura 1.7: Ligao glicosdica



1.2. Lipdeos

Lipdeos so substncias orgnicas normalmente insilveis em gua, porm solveis em
solventes apolares tais como acetona, clorofrmio, ter ou benzeno. Eles so constitudos principalmente
por tomos de hidrognio e carbono, com menor quantidade de outros elementos como o oxignio,
nitrognio e fsforo.

Diferentemente dos polissacardeos e das protenas, os
lipdeos no so polmeros. No entanto so molculas pequenas
que tm uma grande capacidade de se associarem por foras no
covalentes entre suas estruturas. A molcula de lipdeo
normalmente caracterizada por possuir uma estrutura formada por
uma cabea polar e hidroflica conectada a uma calda no
polar e hidrofbica (Figura 1.8).

As molculas lipdicas dispersas em uma soluo aquosa
tendem a se manter juntas atravs de associaes no
covalentes, do tipo interaes hidrofbicas, de suas caldas,

Figura 1.8: Estrutura geral da molcula de
lipdeo

Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
7

Figura 1.9: Arranjos naturais das molculas
lipdicas (Adaptado de Mathews, 1999)
deixando as cabeas hidroflicas em contato com o solvente
polar.
Este arranjo natural das molculas lipdicas, dependendo
do tipo de ambiente onde se encontram, contribui para a formao
de uma variedade de estruturas necessrias a sustentao da
clula, tais como: formao de monocamadas e bicamadas
lipdicas, micelas e vesculas formadas por lipdeos, em contato
com a gua (Figura 1.9).
Existem trs categorias principais de lipdeos
biologicamente importantes, baseadas em diferenas estruturais:
triglicerdeos, fosfolipdeos e esteris, que formam a base de
gorduras animais e vegetais, hormnios, vitaminas e outras
molculas biologicamente ativas, incluindo muitos medicamentos.

1.2.1. Triglicerdeos
As gorduras e leos so lipdeos simples constitudos de dois tipos de grupamentos: glicerol e
cidos graxos (Figura 1.10). A molculas de glicerol possui trs tomos de carbono:

C H
2
OH
C H OH
C H
2
OH





Figura 1.10: Formao dos triglicerdeos
Os grupamentos hidroxila (-OH), que so polares, tornam o
glicerol solvel em gua. Os cidos graxos tm a frmula geral
CH
3
(CH
2
)
n
COOH, onde n usualmente um nmero par.

Quando n muito grande como no cido palmtico (n=14),
o cido denominado cido graxo de cadeia longa. Uma molcula
de gordura formada quando trs molculas de cidos graxos so
ligadas, sob a ao de um conjunto de enzimas, a uma molcula
de glicerol. Assim, gorduras so freqentemente chamadas de
triglicerdeos.

1.2.2. Fosfolipdeos
Lipdeos complexos conhecidos como fosfolipdeos so componentes importantes de
membranas celulares. Por exemplo, uma nica clula de bactria Escherichia coli contm cerca de 22
milhes de molculas de fosfolipdeos em sua membrana.
Os fosfolipdeos diferem dos triglicerdeos em dois aspectos: (1) somente duas molculas de
cidos graxos so ligadas molcula de glicerol e, (2) um grupo fosfato est ligado ao glicerol (Figura
1.11a).
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
8
Os fosfolipdeos mais simples no tm
componentes adicionais, mas outros tm
componentes qumicos ligados ao grupo fosfato.
Os nomes destes lipdeos refletem o grupo
adicional.
Em qualquer fosfolipdeo, o grupo fosfato
hidroflico, devido presena de carga negativa,
quando no estado ionizado (-PO
3
H
2
-PO
3
H
-
+
H
+
). Contudo, as cadeias longas de
hidrocarbonetos dos cidos graxos so apolares,
portanto grupos hidrofbicos. Desta forma uma
molcula de fosfolipdeo anfiptica, isto ,
possui caractersticas hidrofbicas (que so
repelidas do meio aquoso e interagem mais
facilmente com leos, gorduras e solventes
orgnicos) e hidroflicas (que tm afinidade com
substncias polares, por exemplo gua).
A natureza anfiptica responsvel pelo
comportamento caracterstico dos fosfolipdeos
quando so colocados em contato com a gua.

Figura 11: (a) Tipos
mais simples de
fosfolipdeo
composto de uma
molcula de
glicerol, duas de
cidos graxos e
uma molcula de
fosfato. (b)
Fosfolipdeos em
contato com a gua
formam uma
bicamada com os
grupos fosfato
voltados para a fase
aquosa. (Adaptado
de Pelczar, 1997)




Eles formam uma bicamada lipdica, na qual os grupamentos fosfatos ionizados hidroflicos esto em
contato com a gua e a cadeia de hidrocarbonetos apolares de cidos graxos est voltada parte interna
da bicamada (Figura 1.11b).
Esta bicamada forma a estrutura fundamental das membranas celulares. O desenvolvimento de
antibiticos freqentemente conta com substncias qumicas que rompem essas bicamadas e
conseqentemente destroem os microrganismos.

1.2.3. Esteris
Uma molcula de esterol altamente apolar e consiste principalmente em vrios anis
constitudos de tomos de carbono ligados entre si (Figura 1.12a). Os animais utilizam os esteris para
sintetizar a vitamina D e os hormnios esterides e eles tambm so encontrados nas membranas de
alguns tipos de clulas. O composto colesterol, um componente natural de algumas membranas, um
membro desse grupo de lipdeos. Certas drogas antifngicas combinam-se com os esterides nas
membranas dos fungos e eventualmente matam as clulas.

1.2.4. Outros lipdeos
Alm dos trs grupos principais de lipdeos, outros so encontrados nos microrganismos. Entre
eles esto a clorofila, lipdeos presentes na parece celular da bactria que causa a tuberculose e alguns

Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
9
pigmentos responsveis pelas coloraes
vermelhas e amarelas de alguns
microrganismos.
Um lipdeo, o poli--hidroxibutirato ou
PHB ocorre somente em certas bactrias e
funciona como uma fonte de reserva de
carbono e energia. Ele insolvel no somente

em gua mas tambm em muitos solventes
apolares, incluindo o lcool e o ter. Entretanto
solvel em clorofrmio quente. Molculas de
PHB so constitudas de centenas e at
milhares de molculas de cido -
hidroxibutrico ligadas entre si (Figura 1.12b).


Figura 1.12: (a) Colesterol, caracterizado por uma srie de
anis interconectados; (b) Poli--hidroxibutirato, uma cadeia
de muitas molculas de cido -hidroxibutirato ligados entre
si, tambm conhecido como PHB.




1.3 Protenas

As protenas so as macromolculas mais abundantes das clulas. Elas ocorrem em todas as
clulas, estando presentes em todos os seus compartimentos e em grande variedade. As protenas so
molculas que desempenham uma srie de funes especficas nas clulas vivas e atravs delas que a
informao gentica contida no DNA no ncleo da clula expressa na forma de reaes e produtos
bioqumicos no citoplasma e organelas celulares.

1.3.1. Aminocidos
Protenas so polmeros constitudos por aminocidos, as subunidades monomricas, que
embora relativamente simples fornecem a chave para a estrutura de milhares de macromolculas
diferentes. Todas as protenas, incluindo as de bactrias at as do homem, so construdas com o
mesmo conjunto de 20 aminocidos, ligados covalentemente em seqncias lineares caractersticas, que
seguem a receita contida no DNA. Em virtude de cada um desses aminocidos ter uma cadeia lateral
distinta, a qual determina as suas propriedades qumicas, como por exemplo, a sua polaridade.
Todos os 20 aminocidos encontrados nas protenas tm um grupo carboxila e um grupo amino
ligados ao mesmo tomo de carbono (carbono ) (Figura 1.13). Eles diferem uns dos outros atravs de
suas cadeias laterais ou grupos R, os quais variam em estrutura, tamanho e carga eltrica, e
influenciam a solubilidade do aminocido em gua e outros meios.
B
A
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
10





Figura 1.13: Estrutura geral dos
aminocidos











Figura 1.14: Aminocidos padro
constituintes das protenas


Os 20 aminocidos das protenas so freqentemente referidos como aminocidos padres,
primrios ou normais, para distingu-los dos aminocidos que so modificados no interior das protenas,
depois que as mesmas so sintetizadas, e de muitos outros tipos de aminocidos que podem estar
presentes nos organismos vivos, porm no nas protenas.
Os aminocidos padres, por conveno internacional, tm sido designados por abreviaes de
trs letras (derivadas de seus nomes na lngua inglesa), ou por um smbolo de uma nica letra, conforme
a Figura 1.14. Ambos so usados como abreviaturas para indicar a composio e a seqncia dos
aminocidos nas protenas
2
.
Notamos na Figura 1.14 que em todos os aminocidos, exceto na glicina, o carbono
assimtrico, ligado a quatro grupos substituintes diferentes: o grupo carboxila, o grupo amino, um grupo
R e um tomo de hidrognio. Assim, o tomo de carbono torna-se um centro quiral. Devido ao arranjo

2
Em programas de bioinformtica as seqncias consulta so normalmente fornecidas como cdigos de uma nica letra. Por
exemplo, a seqncia LQTSKWMMELVDKTQLDEDAKDKLAFATRQYLDAMSPSNFMLTNPDVVKRAIETKGESLV representa uma
pequena parte da protena PHA sintase de Chromobacterium violaceum, uma enzima que sintetiza poliidroxibutirato nesta bactria;
os resultados, no entanto, podem ser em geral formatados para apresentar os cdigos de trs letras, mais facilmente interpretados.
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
11
tetradrico dos orbitais de ligao ao redor do carbono dos aminocidos os quatro diferentes grupos
substituintes podem ocupar duas disposies espaciais distintas, e estas so, entre si, imagens
especulares no sobreponveis. Estas duas formas so chamadas enatimeros ou estereoismeros e
so designadas como L ou D aminocidos, assim como no caso dos carboidratos (Figura 1.15).
Quase todos os compostos biolgicos com centro
quiral ocorrem naturalmente em apenas uma forma
estereoisomrica, D ou L. Os aminocidos nas molculas
proticas so sempre L-estereoismeros. Os D-aminocidos
foram encontrados apenas em pequenos peptdeos (ver item
1.3.2) da parede de clulas bacterianas e em alguns
peptdeos que tm funo de antibiticos. Os aminocidos
podem ser tambm agrupados em classes, de acordo com as
propriedades dos seus grupos R, em particular a sua
polaridade, ou tendncia para interagir com a gua em pH
fisiolgico (pH prximo de 7,0).


Figura 1.15: Os dois estereoismeros da alanina
(Adaptado de (http://www.mun.ca/biology/
scarr/Karp_2_25_alanine_stereoisomers.gif)
A polaridade dos grupos R varia bastante, desde um comportamento totalmente no polar ou
hidrofbico (insolvel em gua) at polaridade alta ou hidroflica (solvel em gua). Existem cinco classes
principais de aminocidos, aqueles cujo grupo R : no polar e aliftico; aromtico (geralmente no
polar); polar, mas no carregado; negativamente carregado e positivamente carregado, conforme Figura
1.14. Essas caractersticas qumicas dos aminocidos sero fundamentais na conformao espacial que
a protena assumir, ou seja, a ordem com que os aminocidos esto organizados far com que os
grupos de aminocidos afins se agrupem, levando uma ou outra configurao espacial. Uma alterao
na seqncia de aminocidos pode levar a uma modificao de funo (em geral, uma perda) na
protena correspondente. A figura abaixo mostra o efeito produzido na estrutura tridimensional de PHA
sintases de Chromobacterium violaceum e Pseudomonas aeruginosa, protenas que codificam a enzima
produtora de PHB.



Figura 16: Variaes estruturais de protenas (enzimas) PHA sintases de Chromobacterium violaceum ( esquerda) e
Pseudomonas aeruginosa do tipo 1 (centro) e do tipo 2 ( direita), modeladas por homologia (Piemolini, 2004).

1.3.2. Peptdeos
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
12
Os peptdeos so molculas que ocorrem naturalmente e variam muito de tamanho, desde
molculas pequenas contendo apenas dois ou trs aminocidos at grandes macromolculas contendo
milhares de aminocidos (chamadas protenas).
Duas molculas de aminocidos podem ser unidas
atravs de ligaes covalentes entre um grupo amina de um
e o grupo carboxila do outro, em uma ligao chamada
ligao peptdica, para formar um dipeptdeo, conforme
ilustra a Figura 1.17. Trs aminocidos podem ser reunidos
por duas ligaes peptdicas para formar um tripeptdeo. Da
mesma forma, aminocidos podem ser reunidos para formar
tetra e pentapeptdeos. Quando um pequeno nmero de
aminocidos reunido desta forma a estrutura resultante
chamada de oligopeptdeo e quando muitos aminocidos
so reunidos assim, a estrutura chamada de polipeptdeo.
As unidades de aminocidos de um peptdeo so geralmente
chamadas de resduos, pois cada um deles perdeu um tomo


Figura 1.17 Ligao Peptdica
de hidrognio de seu grupo amino e a parte hidroxila do seu grupo carboxila. O resduo de aminocido
presente na extremidade do peptdeo que exibe um grupo -amino o resduo amino-terminal (ou N-
terminal); o resduo na outra extremidade, que exibe um grupo carboxila livre, o resduo carboxi-
terminal (ou C-terminal).
Alguns oligopeptdeos e polipeptdeos pequenos possuem atividades biolgicas importantes e
pronunciadas, exercendo suas funes em concentraes muito pequenas. Como exemplo, pode-se citar
um certo nmero de hormnios, presentes nos vertebrados, que so polipeptdeos pequenos
responsveis por alguns processos de comunicao celular.

O hormnio insulina, por exemplo, contm duas cadeias
polipeptdicas, uma com 30 resduos de aminocidos e outra com 21.
Outros hormnios polipeptdicos so o glucagon, um hormnio
pancretico de 29 resduos que tem ao oposta a da insulina, e a
corticotrofina, um hormnio com 39 resduos de aminocidos,
secretado pela hipfise anterior e que estimula o crtex adrenal.

Outros peptdeos importantes tm apenas uns poucos resduos de aminocidos, como o caso
do peptdeo sintetizado comercialmente, L-aspartilfenilalanil-metilster, conhecido como aspartame. O
aspartame 200 vezes mais doce do que o acar comum (sacarose) utilizado como substituto
direto do acar, em refrigerantes diet, gomas de mascar, iogurte, sucos de fruta, etc. Marcas comerciais
incluem NutraSweet, Equal, Sugar Twin, e Sweet'n'Low. Pessoas com fenilcetonria (PKU), um defeito
congnito do metabolismo (1:10.000 nascimentos), so incapazes de metabolizar a fenilalanina e devem,
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
13
portanto, evitar o uso de aspartame. Saiba mais sobre a PKU e outras doenas genticas no site do
OMIM (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM), Online Mendelian Inheritance in Man.


1.3.3. Protenas
Quase tudo que ocorre nas clulas envolve uma ou mais protenas. As protenas fornecem a
estrutura, catalisam as reaes celulares, atuam no transporte e motilidade das clulas, funcionam como
reserva de nutrientes, atuam no sistema de defesa dos organismos e na regulao dos sistemas vivos. O
seu papel principal sem dvida a expresso da informao gentica, que em ltima instncia
traduzida em protenas. Para cada protena existe um segmento do DNA, um gene, que guarda a
informao, especificando sua seqncia de aminocidos. As protenas esto entre as macromolculas
mais abundantes e tambm so extremamente versteis nas suas funes. Assim podem ser
classificadas segundo a funo que desempenham nos organismos vivos:

a) Enzimas: o grupo de protenas mais variado e mais especializado, cujos componentes exibem
atividade cataltica. De um modo geral, todas as reaes qumicas que ocorrem nas clulas, nas quais
participam biomolculas orgnicas, so catalisadas por enzimas. H milhares de enzimas diferentes,
mesmo em microrganismos simples, cada uma capaz de catalisar uma ou mais reaes especficas.

b) Protenas Transportadoras: Ligam-se a ons ou molculas especficas os quais so transportados de
um lado ao outro da clula ou de um rgo ao outro, no caso de organismos mais evoludos, atravs da
corrente sangunea. Um exemplo tpico a hemoglobina, protena composta de quatro cadeias
polipeptdicas, que se liga ao oxignio, medida que o sangue atravessa os pulmes, transportando-o
at os tecidos perifricos. Outros tipos de protenas transportadoras esto presentes nas membranas
plasmticas e nas membranas intracelulares de todos os organismos, onde elas atuam como canais,
permitindo a passagem de molculas especficas.

c) Protenas nutrientes e de armazenamento: muito encontradas em organismos vegetais, como por
exemplo, trigo, milho e arroz. So protenas que guardam grande valor nutricional. As sementes de
muitas plantas, por exemplo, so ricas nestas protenas, necessrias para a germinao e o crescimento
dos brotos. A ovoalbumina, encontrada na clara do ovo e a casena, so exemplos de protenas
nutrientes e de reserva encontrados em animais.

d) Protenas contrteis ou de motilidade: importantes para as clulas e organismos, por permitirem que
estes se contraiam, mudem de forma, ou se desloquem no ambiente. Exemplos destas protenas so a
actina e miosina, que so encontradas nos msculos e algumas clulas no musculares e no caso de
microrganismos, a protena dinena, responsvel pela movimentao de clios e flagelos, utilizados para a
locomoo celular.

Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
14
e) Protenas estruturais: a classe de protenas que serve como filamentos de suporte, cabos ou lminas
para fornecer proteo ou resistncia a estruturas biolgicas. Alguns exemplos so, o colgeno,
encontrado em cartilagens e tendes; a elastina, dos ligamentos; a queratina, encontrada em cabelos e
unhas, entre outras.

f) Protenas de defesa: responsveis pela defesa dos organismos contra a invaso de outras espcies ou
no caso de ferimentos. Alguns exemplos so as imunoglobulinas, ou anticorpos, protenas especializadas
em reconhecer e precipitar, ou neutralizar invasores como bactrias, vrus ou protenas estranhas
oriundas de outras espcies.

g) Protenas reguladoras: Auxiliares na regulao da atividade celular ou fisiolgica. Entre elas esto
muitos hormnios, como o caso da insulina. Outras protenas reguladoras ligam-se ao DNA e regulam a
biossntese de enzimas e das molculas de RNA envolvidas na diviso celular, tanto em procariotos
como em eucariotos, como veremos nos captulos seguintes.

Cabe aqui lembrar que todas as protenas, com suas propriedades e funes to diferentes, so
construdas com o mesmo grupo de 20 aminocidos, sendo que o fator determinante a seqncia com
que esses aminocidos so adicionados um a um (estrutura primria), determinando assim a sua forma
espacial, suas propriedades e suas funes.


1.3.3.1. Estrutura das protenas
A estrutura espacial dos tomos de uma protena chamada de conformao. A conformao
de uma protena determinada pela seqncia primria dos aminocidos que compem a protena e
pode sofrer mudanas, devido a rotaes de ligaes simples, por exemplo, sem a quebra das ligaes
covalentes. Porm, a protena para ser funcional, necessita estar na sua conformao espacial
predominante, que termodinamicamente a mais estvel, sendo, neste caso chamada de protena
nativa.
Existem quatro nveis na arquitetura das protenas, conforme ilustra a Figura 1.16, a estrutura
primria inclui todas as ligaes covalentes entre os aminocidos que compem uma protena e
definida pela seqncia destes aminocidos unidos por ligaes peptdicas. Estas cadeias peptdicas
formadas pela unio dos aminocidos no so livres para assumir, ao acaso, uma estrutura
tridimensional qualquer. Restries estricas, ou geomtricas e muitas interaes intramoleculares
determinam que alguns arranjos sejam mais estveis do que outros.
Estrutura secundria a designao que se d aos arranjos regulares e recorrentes no espao
dos resduos de aminocidos adjacentes em uma molcula protica, ou seja, decorrentes das interaes
entre um aminocido e seus vizinhos prximos devido principalmente formao de pontes de
hidrognio entre os grupos (C=O) polares e NH ao longo da cadeia. As estruturas secundrias
predominantes so a -hlice e as folhas , mostradas na Figura 1.18.
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
15
A estrutura terciria refere-se ao relacionamento
espacial entre todos os aminocidos de um polipeptdeo. Essa
estrutura se caracteriza pelas diversas dobras da molcula em
uma forma especfica, como se fosse uma fita emaranhada.
Esta forma causada pela interao entre diferentes
partes da cadeia, principalmente por ligaes entre tomos de
enxofre do aminocido cistena, chamadas de pontes ou
ligaes dissulfeto.
E por fim, algumas protenas contm duas ou mais
cadeias polipeptdicas combinadas, ligadas atravs de
interaes intermoleculares, que determinam a estrutura
quaternria desta protena final.
Para ser capaz de desempenhar a sua funo a
protena deve estar na sua forma nativa. Porm essa
conformao preferencial sofre alteraes resultantes da
interao com o meio. Essas alteraes podem se dar na
estrutura quaternria, terciria ou secundria da protena,
fazendo com que a protena perca suas funes
temporariamente, porm s vezes, sendo capaz de voltar
forma inicial, caso o ambiente volte ao normal.
Mas, se o ambiente for capaz de romper as ligaes
peptdicas da protena, ou seja, alterar sua estrutura primria, o
processo no reversvel.

Figura 1.18: Nveis de estrutura das
protenas ( Adaptado de
http://ghs.gresham.k12.or.us/
science/os/sci/ibbio/chem/notes
/chpt3/proteinlevels.gif
Uma alterao extrema capaz de levar perda total da sua estrutura tridimensional um
processo chamada desnaturao. As protenas podem ser desnaturadas pelo aquecimento, por
variaes extremas do pH do meio, por alguns solventes orgnicos miscveis com gua, como o etanol
ou a acetona, por algumas substncias em soluo, como uria, ou por exposio da protena a
substncias detergentes. Esses agentes desnaturantes atuam enfraquecendo as interaes inter e
intramoleculares da protena levando perda da conformao nativa. Porm em muitos casos, quando
os agentes so retirados, as interaes voltam a atuar e os resduos de aminocidos se organizam
novamente, voltando conformao inicial e funcional. Este processo chamado de renaturao.

1.3.3.2. Enzimas
As enzimas so protenas com capacidade cataltica que atuam nas diversas reaes
bioqumicas que ocorrem nas clulas. Muitas reaes bioqumicas envolvem a formao de compostos
intermedirios muito instveis e normalmente para que estas reaes ocorram necessrio que as
molculas estejam orientadas de modo certo. A funo da enzima nestes casos atuar como mediador,
ligando-se aos substratos de forma muito especfica, promovendo a aproximao das molculas e
fornecendo as condies ideais para trocas de eltrons e grupos funcionais entre elas.
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
16
A posio onde os substratos ligam-se na enzima chamada de stio ativo da enzima, e este
normalmente muito especfico, permitindo que apenas um tipo ou grupo de molculas liguem-se da forma
correta e promovam a reao (Figura 1.19).


Figura 1.19 Esquema representativo da atuao da enzima num processo bioqumico
(http://ghs.gresham.k12.or.us/science/ps/sci/ibbio/chem/notes/chpt8/enzymerxn.gif)

Muitas vezes as enzimas ligam-se a grupos no proticos, que so imprescindveis para que a
reao ocorra. Esses grupos, chamados cofatores, podem ser ons metlicos de Mg, Zn, Mn, F; uma
coenzima, como as molculas de NAD, FAD, Coenzima A (CoA), e algumas vitaminas.
A atividade cataltica da enzima ou de um grupo de enzimas que atuam numa determinada rede
de reaes bioqumicas, interligadas para desenvolver um dado processo metablico de sntese ou
degradao, funciona de modo integrado e regulado e esta regulao se d por meio de enzimas
reguladoras, que tm a sua atividade aumentada ou diminuda mediante a presena de molculas
sinalizadoras, que so em geral metablitos (molculas envolvidas no metabolismo celular, como
veremos no captulo 4) ou cofatores. Devido presena dessas molculas sinalizadoras chamadas
inibidores ou ativadores alostricos, que se ligam enzima de modo reversvel alterando sua
conformao espacial, a atividade cataltica pode ser inibida ou estimulada, respectivamente (Figura
1.20).


Figura 1.20: Ativao (a) e inibio alostrica (b)
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
17
Muitas vezes o prprio substrato ou produto um modulador alostrico, ativando a enzima, no
caso dos substratos e inibindo no caso dos produtos. Dessa forma as reaes bioqumica ficam
integradas e reguladas de modo a evitar snteses ou degradaes desnecessrias clula.


1.4. cidos Nuclicos

Os cidos nuclicos, cido desoxirribonuclico (DNA) e o cido ribonuclico (RNA), so as
organelas moleculares da informao gentica. A estrutura de toda protena e, em ltima anlise, de
todo constituinte celular um produto da informao programada numa seqncia nucleotdica dos
cidos nuclicos da clula. Os nucleotdeos so compostos ricos em energia que direcionam os
processos metablicos (principalmente as biossnteses) em todas as clulas. Eles tambm funcionam
como sinais qumicos, elos importantes nos sistemas celulares que respondem a hormnios e a outros
estmulos extracelulares, e so componentes estruturais de vrios cofatores enzimticos e de
intermedirios metablitos.


Figura 1.21: Estrutura geral dos nucleotdeos (a) e suas bases
nitrogenadas (b)
Os nucleotdeos possuem trs
componentes caractersticos: uma base
nitrogenada, uma pentose (desoxirribose, no DNA
e ribose, no RNA) e um fosfato, conforme
mostrado na Figura 1.21. As bases nitrogenadas
so derivadas de duas estruturas bsicas, as
pirimidinas e as purinas.
Nas molculas de DNA ocorrem quatro
tipos de bases nitrogenadas, duas delas derivadas
da purina: adenina e guanina, e duas derivadas
da pirimidina: citosina e timina. Assim, h quatro
tipos de nucleotdeos no DNA, cada um com uma
base particular.
O RNA tambm possui quatro tipos de
bases diferentes, sendo elas a adenina, guanina e
citosina, tambm encontradas no DNA e a uracila,
base derivada da pirimidina que aparece apenas
no RNA, ao invs da timina (Figura 1.21).
Uma clula mantm ligados milhares de
nucleotdeos para formar uma fita de DNA ou
RNA, atravs de ligaes entre os grupos fosfato
e as desoxirriboses ou riboses, respectivamente conforme a Figura 1.21, formando um esqueleto a partir
do qual as purinas e pirimidinas se projetam.
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
18
Observa-se que o esqueleto tanto de DNA quanto de RNA hidroflico. Os grupos hidroxila dos
resduos de acar formam ligaes de hidrognio com a gua. Os grupos fosfato no esqueleto
encontram-se completamente ionizados e carregados negativamente em pH 7; desta forma o DNA
cido e essas cargas precisam ser neutralizadas por interaes inicas com cargas positivas de algumas
protenas, ons metlicos e poliamidas que sempre acompanham o DNA.
Como pode ser observado na Figura 1.22, todas as ligaes fosfodisteres nas fitas de DNA e
RNA possuem a mesma orientao ao longo da cadeia, conferindo a cada fita linear do cido nuclico
uma polaridade e extremidades distintas, chamadas 5 e 3. Por definio, a extremidade 5 no possui
um nucleotdeo na posio 5, e a extremidade 3 no o possui na posio 3.

Figura 1.22: Estrutura qumica do DNA e RNA e suas ligaes
fosfodister (Adaptado de Mathews, 1999)
No caso do DNA, duas fitas
apresentam ligaes cruzadas por meio
das suas bases pricas e pirimdicas
formando uma fita dupla de DNA.
Ligaes de hidrognio ligam as
bases de uma cadeia com as bases da
outra (Figura 1.23). Duas bases ligadas
desta maneira so denominadas pares de
bases complementares. Somente dois
pares de bases complementares so
encontrados na fita dupla de DNA:

Adenina (A) ligada timina (T)
Guanina (G) ligada citosina (C)

Assim, a proporo de A com T ou G com C na fita dupla de DNA sempre 1:1. A
complementaridade das purinas e pirimidinas significa que a seqncia de bases em um das fitas ordena
a seqncia da outra. Isto de grande importncia na sntese de novas fitas de DNA durante a diviso
celular, porque esta a seqncia de bases do DNA que representa a informao gentica da clula,
sendo que h uma seqncia diferente para cada espcie de organismo vivo.
No RNA, no h formao de fitas duplas, ou seja, no h uma segunda fita complementar
pareada, porm em alguns casos a fita simples de RNA pareia-se com ela mesma, formando um lao.
A porcentagem de A com U e G com C pode variar entre diferentes molculas de RNA e no
necessariamente 1:1 como no DNA. O RNA a segunda forma principal de cidos nuclicos nas clulas
e desempenha o papel de intermedirios na converso da informao existente no DNA para uma
protena funcional.
Nos eucariotos, o DNA principalmente confinado no ncleo, enquanto a sntese de protenas
ocorre nos ribossomos do citoplasma.
Portanto, alguma molcula diferente do DNA deve transportar a mensagem gentica para a
sntese de protenas do ncleo at o citoplasma. A molcula responsvel por transportar esta mensagem
Introduo Engenharia Genmica
Captulo 1: Fundamentos bsicos de bioqumica, biologia molecular - 2005 Serpa e Porto
19
o RNA chamado RNA mensageiro (mRNA), que consiste de uma fita simples composta pelos
nucleotdeos A, U, C e G, e confeccionado a partir da seqncia de nucleotdeos existente no DNA.

Figura 1.23: Estrutura da dupla
hlice do DNA

O mRNA consegue transitar do ncleo at o citoplasma,
levando a informao gentica at os ribossomos onde o
mensageiro fornece os moldes para a especificao da seqncia de
aminocidos nas cadeias polipeptdicas.

Nos procariotos no existe um ncleo definido como no caso
dos eucariotos, mas os mRNAs tambm so os responsveis por
transportar a mensagem gentica.

Outros tipos de RNA so o RNA transportador (tRNA), que
atua como carreador para os aminocidos que sero utilizados na
sntese das protenas e os RNAs ribossmicos (rRNA), que so
componentes estruturais dos ribossomos.


Leitura Recomendada:
1. MATHEWS, Christopher K; VAN HOLDE, K E; AHERN, Kevin G. Biochemistry. 3. ed. San Francisco:
Addison Wesley Longman, 1999.
2. LEHNINGER, Albert L; NELSON, David L.; COX, Michael M. Princpios de bioqumica. 3. ed. So
Paulo: Sarvier, 2002.
3. PELCZAR, Michael J oseph; CHAN, Eddie Chin Sun; KRIEG, Noel R. Microbiologia : conceitos e
aplicaes. 2. ed. So Paulo: Makron Books, 1997.
4. BERG, J eremy M.; TYMOCZKO, J ohn L.; STRYER, Lubert. Biochemistry. New York: W. H. Freeman
and Co., 2002.
5. VOET, Donald; VOET, J udith G. Biochemistry. 3. ed. J ohn Wiley. New York, 2005.



Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
20
2. A Clula Procariotos e Eucariotos


As clulas so consideradas as unidades bsicas de qualquer organismo, desde os microrganismos
constitudos por uma nica clula s formas de vida com tecidos especializados e rgos complexos. A clula
consiste de um protoplasma, que uma mistura complexa e gelatinosa de gua, protenas, lipdeos e cidos
nuclicos, envolvido por uma membrana flexvel e algumas vezes por uma parede celular rgida. Dentro de cada
clula existe uma regio que controla a funo celular e a hereditariedade. Em algumas clulas, esta regio
representada por uma estrutura denominada ncleo, que circundado por uma membrana nuclear. Em
clulas mais simples, existe tambm uma regio similar, mas que no delimitada por uma membrana. A essa
regio se d o nome de nucleide. Em cada um desses tipos celulares o ncleo ou o nucleide contm o DNA
da clula, que carrega a informao gentica, as instrues codificadas que regulam a construo e a
manuteno da clula e so transmitidas para as geraes seguintes. O restante do protoplasma denominado
de citoplasma, que o local onde as snteses de protenas, lipdeos e nucleotdeos ocorrem e onde os
processo vitais da clula acontecem.
Um organismo pode ser constitudo de apenas uma clula unicelular sendo que nesse caso todos
os processos celulares ocorrem nesta nica clula, ou ento pode ser constitudo de muitas clulas
multicelular como o caso de formas de vida superiores, como as plantas e os animais, onde as clulas so
arranjadas em estruturas chamadas de tecidos ou rgos, com funes especficas. De qualquer forma, todos
os organismos apresentam os seguintes processos celulares: reproduo, utilizao de alimentos ou nutrientes
como fonte de energia, sntese de substncias e estruturas celulares, excreo de substncias e resposta a
alteraes ou estmulos ambientais.

2.1 Classificao dos Organismos Vivos

Os organismos vivos so ainda classificados segundo o modo como seu material nuclear se apresenta
dentro da clula: clulas eucariticas tm um ncleo separado do citoplasma por uma membrana nuclear,
enquanto as clulas procariticas apresentam material nuclear sem a membrana envoltria. Essa diferena
a base para a separao de bactrias de outros tipos de microrganismos e de todas as outras clulas, de
plantas e animais. As bactrias tm uma estrutura celular procaritica e so procariotos. Outras clulas,
incluindo algas, fungos, protozorios e clulas vegetais e animais tm uma estrutura celular eucaritica e so
eucariotos.
Os organismos podem ser tambm classificados segundo a sua fonte de energia, sendo
quimiotrficos, aqueles que, como ns, obtm sua energia de um combustvel qumico (compostos orgnicos
ou inorgnicos) e fototrficos, aqueles que obtm sua energia da luz solar. Como complementao para essa
classificao, inclu-se a capacidade que os organismos tm de sintetizar suas macromolculas a partir de
fontes naturais: os autotrficos so organismos que tm a capacidade de sintetizar algumas ou todas as suas
subunidades monomricas, intermedirios metablicos e macromolculas a partir de materiais iniciais muito
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
21
simples, tais como CO
2
e NH
3
. J os heterotrficos devem adquirir alguns de seus nutrientes pr-formados de
seu ambiente, necessitando assim de compostos orgnicos mais complexos como fontes de carbono. Sendo
assim, so quatro as possibilidades de classificao
dos organismos vivos, dependendo de suas fontes
de energia e carbono, conforme mostra a Figura 2.1.
Para os heteroquimiotrficos, como ns, os
compostos orgnicos so tanto a fonte de energia
quanto a fonte de carbono.


2.2 Evoluo e Estrutura das Clulas
Inicialmente achava-se que os procariotos
eram as formas de vida mais simples, os mais
primitivos de todos os organismos. Porm, atravs de
estudos utilizando o cido ribonuclico ribossmico
(rRNA), que essencial para a sobrevivncia das
clulas, de diferentes organismos, os cientistas
descobriram que o rRNA de eucariotos possui um
tipo geral de seqncia e o dos procariotos um
segundo tipo. Mas eles tambm descobriram que
alguns procariotos tm um terceiro tipo de rRNA e o
arranjo desse rRNA difere dos outros procariotos e

Figura 2.1: Classificao dos organismos conforme suas fontes de
carbono (em azul) e energia (em vermelho). (Adaptado de Lehninger
et al.,1995)


dos eucariotos. Assim, eles concluram que existem dois tipos principais de bactrias, que so agora
designadas de arqueobactrias e eubactrias, que so to diferentes umas das outras como o so dos
eucariotos.
Assim, se aceita hoje que as arqueobactrias, eubactrias e eucariotos evoluram por caminhos
diferentes a partir de um ancestral comum, conforme ilustra a Figura 2.2. Existem ainda outras evidncias de
que as bactrias podem ter desempenhado uma outra funo na evoluo das clulas eucariticas.
As clulas eucariticas atuais contm organelas auto-replicativas, diferentemente de seus ancestrais,
que no as possuam. Essas organelas so os cloroplastos e as mitocndrias, que tm genes e ribossomos
prprios. Alm disso, estudos dessas organelas sugerem que as mitocndrias e os cloroplastos parecem ter
sido derivados das eubactrias.
Acredita-se que, em algum estgio da evoluo, uma bactria invadiu uma clula eucaritica, sem
causar danos para essa clula, e pelo contrrio, acabou fornecendo a esta clula hospedeira algumas
habilidades extras, tais como a capacidade de respirar ou realizar a fotossntese. Ambas se beneficiaram desta
associao e cada uma tornou-se gradualmente dependente uma da outra.
A bactria invasora ao longo da evoluo sofreu algumas mutaes e tornou-se a mitocndria ou o
cloroplasto da clula invadida, e passou a ser responsvel pela respirao e pela fotossntese,
respectivamente.
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
22

Figura 2.2: Evoluo dos organismos vivos (Adaptado de Pelczar et al.,1997)


A idia da origem das organelas eucariticas a partir dos procariotos conhecida como teoria
endossimbintica (Figura 2.3). A partir do surgimento dessas clulas eucariticas, outros organismos
evoluiram, levando a uma vasta diversificao de organismos eucariticos, tais como os protistas, as algas e os
diversos organismos multicelulares.


2.3. Diferenas entre procariotos e eucariotos
2.3.1. Organismos procariotos:
Morfologicamente, os procariotos so normalmente unicelulares, com dimetros de 0,5 a 2 m em
mdia e comprimentos de at 100 m. Podem ser clulas esfricas (cocos), cilndricas (bacilos) ou espiraladas
ou helicoidais (espirilos). E ainda podem viver isolados, como normalmente acontece com as clulas
espiraladas, vivendo como clulas nicas, ou ento na forma de arranjos ou padres caractersticos, muito
comuns no caso dos cocos.
Quanto a suas estruturas, os procariotos so relativamente mais simples que os eucariotos, porm
apresentam algumas particularidades. Algumas das estruturas dos procariotos so encontradas no lado
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
23
externo da clula, responsveis principalmente pela locomoo e defesa da clula, enquanto a maioria
encontra-se no interior da clula, que limitada pela membrana citoplasmtica e pela parece celular (Figura
2.4).



Figura 2.3: Teoria endossimbintica. Proposta de evoluo e
diferenciao das clulas eucariticas a partir de uma clula pr-
eucaritica que desenvolveu invaginaes na membrana celular e
tambm passou a ser colonizada de modo simbitico por uma
bactrias. Essa associao resultou numa nova clula eucaritica,
capaz de realizar fotossntese, quando o simbionte era um
procarioto fotossinttico; ou ento, capaz de realizar a respirao
celular, quando o simbionte era um aerbio no fotossintetizante.
(Adaptada de Pelczar et al.,1997)












Figura 2.4: Estrutura esquemtica de uma clula procaritica
(Adaptado de http://www.phschool.com/
science/biology_place/biocoach/images/cells

Membrana citoplasmtica:
Estrutura formada por duas camadas de fosfolipdeos (20 a 30%) complementadas com protenas (50 a
70%) que esto dispersos nesta bicamada (Figura 2.5). Os fosfolipdeos contm uma cabea polar, devida ao
fosfato e uma calda apolar, devida terminao hidrocarbnica. Assim, as terminaes polares, que so
solveis em gua,ficam arranjadas para os lados de fora da bicamada e conseqentemente as terminaes
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
24
apolares, se orientam para o seu interior. Neste arranjo inicial, ainda so acrescentadas as protenas, que so
arranjadas de modo a ficarem inteira ou parcialmente inseridas na membrana. Devido sua estrutura qumica,
a membrana citoplasmtica fluida, ou seja, essas protenas inseridas se movimentam dentro da membrana.




Figura 2.5: Estrutura da membrana citoplasmtica (Adaptado de
http://www.brunel.ac.uk/depts/bl/project/microbio/cellstrc/bacwall/cytoplas.htm)





A membrana citoplasmtica, alm de delimitante da rea celular, est envolvida em funes vitais
clula, tais como transporte seletivo de substncias e ons, produo de energia, reaes enzimticas,
metabolismo e replicao celular. Inseridas na bicamada, encontram-se muitas protenas transportadoras e
tambm muitas enzimas, que desempenham esses papeis vitais.


Parede celular:
A parede celular uma estrutura externa membrana citoplasmtica, que encontrada nos
organismos procariotos e nas algas, fungos e plantas, e tem a funo de proteger e manter a forma
caracterstica das clulas, resistindo inclusive a altas presses e condies fsicas adversas.
Sua constituio qumica varia com as diferentes espcies, correspondendo de 10 a 40% da massa
seca de cada clula. Devido composio da parede celular, as bactrias podem ser classificadas em Gram-
negativas, que possuem uma parede celular mais fina, e Gram-positivas, que possuem uma parece celular mais
espessa.
As bactrias Gram-positivas possuem uma parece celular composta de 50% ou mais, de um polmero
poroso e insolvel muito resistente, chamado peptideoglicano e polissacardeos, formando uma camada muito
entrelaada e resistente sobre a membrana citoplasmtica, conforme mostrado na Figura 2.6a.

Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
25


Figura 2.6: Representao esquemtica da estrutura da parede celular e membranas das clulas
procariticas (Pelczar et al.,1997)


J a parede celular das bactrias Gram-negativas possui uma quantidade menor de peptideoglicano na
sua composio (de 5 a 10%), porm recoberta por uma membrana externa, que possui uma constituio
muito parecida com a membrana citoplasmtica, ou seja, uma bicamada fosfolipdica, acrescida de protenas
e ainda lipopolissacardeos. Esta membrana externa fica ancorada na camada de peptideoglicano atravs de
lipoprotenas, (Figura 2.6b). A membrana externa das bactrias Gram-negativas serve como barreira seletiva
para a entrada de substncias na clula e tambm est relacionada com os efeitos nocivos causados por essas
bactrias, uma vez que causam efeito txico a alguns animais infectados.


Flagelos e plos:
Estrutura encontradas nas partes externas parece celular, os flagelos e os plos, so estruturas finas
que se estendem a partir da membrana citoplasmtica. Os flagelos so mais compridos e com forma helicoidal,
tendo a funo de propulso da clula, permitindo que as bactrias se movimentem no meio. Nem todas as
bactrias possuem flagelos, sendo estes mais freqentemente encontrados em bacilos e espirilos. O tamanho e
a quantidade de flagelos de uma bactria variam com a espcie.
J os plos so menores que os flagelos e mais numerosos, particularmente encontrados nas bactrias
Gram-negativas. So encontrados diferentes tipos de plos, sendo que cada tipo associado a funes
caractersticas tais como reproduo sexual (plo F) e adeso celular nas superfcies de outras clulas
hospedeiras (infeces).


Glicoclice
Consiste de uma camada viscosa composta de polissacardeos que circunda algumas espcies de
bactrias. Esta camada viscosa pode ser organizada e acoplada firmemente parede celular, formando uma
(a) (b)
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
26
cpsula, ou ento, apresentar-se desorganizada e sem forma, fracamente ligada clula, formando uma
camada limosa.
O glicoclice tem como funes a facilitao da aderncia da clula em superfcies de difcil aderncia
e de grande movimentao, o aumento da proteo da clula contra a desidratao, evitar a adsoro e lise por
bacterifagos (vrus que atacam as bactrias) e ainda protegem as bactrias contra o ataque das clulas de
defesa dos animais.


Regio citoplasmtica
O citoplasma o material interno da clula, composto de gua (80%), protenas, carboidratos, lipdeos
e cidos nuclicos, alm de ons orgnicos e muitos compostos e partculas de baixo peso molecular. no
citoplasma das bactrias que as reaes enzimticas vitais acontecem, desde a degradao de compostos
nutrientes at a sntese das protenas e cidos nuclicos. Na regio citoplasmtica esto presentes ainda
algumas estruturas tpicas, indispensveis para a vida da clula, tais como: 1) os ribossomos, que so
partculas densas onde ocorre a sntese de protenas, podendo ser encontrados dispersos no citoplasma ou
ento associados estrutura da membrana citoplasmtica; 2) corpos de incluso, que so depsitos de
substncias presentes no citoplasma das clulas. Podem conter reservas de energia e carbono, como o caso
dos poli-hidroxialcanoatos (PHA), polmeros de material lipdico e os grnulos de glicognio e enxofre.


Regio nuclear:
As bactrias no possuem uma membrana nuclear, ento o material gentico (DNA) da clula fica
tambm disperso no citoplasma na poro mais central da clula, agrupado numa estrutura chamada
cromossomo, que nico e circular. o cromossomo que carrega a informao hereditria da clula e sempre
que a clula for se dividir, esse material previamente duplicado.


2.3.2. Organismos eucariotos:
As clulas de organismo eucariotos diferem das clulas procariticas quanto ao tamanho e quanto a
sua complexidade. Como j mencionado anteriormente, as clulas eucariticas evoluram do mesmo ancestral
comum que as procariticas, porm por caminhos diferentes. Os eucariotos atuais so organismos formados
por uma ou mais clulas oriundas da incorporao de uma bactria por uma clula eucaritica primitiva, durante
o perodo evolucionrio. Essa simbiose permitiu que hoje as clulas eucariticas possussem a capacidade de
respirar ou realizar a fotossntese, atravs de organelas chamadas mitocndria e cloroplastos, respectivamente.
Alm dessas organelas, as clulas eucariticas possuem outras, conforme a Figura 2.7, que no
existem nas clulas procariticas, e ainda possuem uma carioteca, uma membrana que delimita o ncleo, que
a caracterstica principal dos eucariotos.
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
27

Figura 2.7: Estrutura esquemtica de uma clula eucaritica (Adaptado de
http://www.phschool.com/science/biology_place/biocoach/images/cells


Alguns dos organismos eucariticos so microrganismos, assim como os procariotos, como as algas,
fungos e protozorios. Outros so organismos mais complexos e acabam por constituir todas as outras
espcies de animais e vegetais encontradas na Terra.
Algumas das estruturas encontradas nas clulas procariticas tambm so encontradas nas
eucariticas, e muitas vezes com a mesma funo.


Flagelos e clios:
Assim como as bactrias, alguns organismos eucariticos tambm possuem estruturas externas
membrana citoplasmtica e parede celular, que permitem sua locomoo. Muitos protozorios e algas
unicelulares utilizam os flagelos, que se movimentam em zigue-zague, impulsionando as clulas. Outras clulas
possuem clios, que so menores e mais numerosos, e movimentam-se em um movimento coordenado a fim de
movimentar a clula em meios fluidos.


Parede celular
A parede celular uma estrutura mais externa que a membrana citoplasmtica, e est presente em
algumas clulas eucariticas, tais como nas plantas, nas algas e nos fungos. Tem, como nos procariotos, a
funo de manter a forma e proteger a clula. As paredes celulares de plantas, algas e fungos, diferem umas
das outras e tambm diferem da parede celular dos procariotos, tanto na sua composio qumica quanto na
sua estrutura fsica. Nas plantas a parede celular formada principalmente de celulose e pictina. Nos fungos a
parede celular contm quitina e celulose e nas algas podem ser formadas por celulose ou at carbonato de
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
28
clcio. Nas clulas eucariticas tambm no so encontrados peptidoglicanos na formao da parede celular,
como ocorre com os procariotos.

Membrana citoplasmtica
Assim, como os procariotos, as clulas de organismos eucariticos tambm possuem a membrana
citoplasmtica, uma bicamada fosfolipdica semipermevel, na forma de mosaico fluido, estrutura na qual
muitas protenas ficam inseridas parcial ou totalmente, conforme mostra a Figura 2.5.
Existem, no entanto, algumas diferenas entre a membrana citoplasmtica de eucariotos e de
procariotos. Nos eucariotos, alm das fosfolipdeos e das protenas, encontram-se tambm esteris,
principalmente o colesterol, entrelaados na bicamada lipdica, conferindo resistncia membrana. Nos
organismos que no possuem parede celular, a membrana citoplasmtica reforada por fibras de actina e
miosina.

Organelas celulares
As organelas celulares so estruturas especializadas na realizao de funes especficas, tais como
fotossntese, respirao, transporte de substncias, entre outras. As organelas so delimitadas por membranas
e localizam-se na regio citoplasmtica da clula. O citoplasma dos eucariotos diferente daquele dos
procariotos, possuindo uma extensa rede de microtbulos e estruturas proticas que constituem o citoesqueleto
das clulas, o que lhe confere forma e d maior proteo s clulas.

Ncleo: O ncleo dos eucariotos delimitado por uma membrana dupla membrana nuclear que se
assemelha a duas membranas citoplasmticas juntas. A membrana nuclear muito porosa, o que permite que
molculas complexas como protenas e RNA passem de um lado para o outro. O ncleo tem a forma oval ou
circular e contm toda a informao gentica do organismo na forma de fitas duplas de DNA, que so
organizadas em cromossomos. O ncleo o local onde ocorrem as snteses do RNAs (mensageiros,
ribossmicos e transportadores) a partir da mensagem codificada no DNA. A partir da membrana nuclear
segue-se o retculo endoplasmtico.

Retculo endoplasmtico: O retculo endoplasmtico (RE) consiste de uma rede de tbulos e bolsas
achatadas que se conectam membrana nuclear e
membrana citoplasmtica, como mostra a Figura 2.8.
Esta complexa rede a responsvel pelo transporte
de molculas atravs da clula. Existem dois tipos de
retculos endoplasmticos, o liso e o rugoso. O RE
rugoso est envolvido na sntese de protenas, com
ribossomos acoplados ao longo de sua extenso. As
protenas recm sintetizadas podem ento ser
liberadas no citoplasma, ou ser enviadas, atravs do
RE, para diversas partes da clula. J o RE liso, que

Figura 2.8: Retculo endoplasmtico
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
29
no possui ribossomos acoplados, est relacionado com a sntese de glicognio, lipdeos e esterides. A
quantidade de RE liso existente em uma clula pode variar, dependo da funo que esta clula desempenha no
organismo.

Complexo de Golgi: O complexo de Golgi uma organela composta de bolsas achatadas e vesculas,

Figura 2.9: Complexo de Golgi
Conforme apresentado na Figura 2.9. Funciona como uma central
de empacotamento da clula. Sua funo empacotar todas as
substncias produzidas pela clula e que precisam ser enviadas
para o exterior, assim como envolver as enzimas da clula
(proteases, lipases, glicosidades, entre outras) para que estas
no atuem sobre a prpria clula em situaes inoportunas,
formando organelas chamadas lisossomos.

Mitocndria: As mitocndrias so as organelas celulares responsveis pela produo de energia para
a clula, atravs da respirao aerbia. A energia, na forma de ATP, produzida na mitocndria necessria na
sntese de biomolculas teis para a clula e no transporte ativo de substncias atravs da membrana
citoplasmtica. A mitocndria o resultado da
incorporao de uma bactria aerbia, por uma clula
eucaritica primitiva, segundo a teoria
endossimbintica. Sua forma cilndrica e formada
por duas membranas, uma externa, que delimita a
organela e outra interna, muito invaginada, como
apresentado na Figura 2.10, onde ocorre a produo
de energia (ATP). As mitocndrias possuem seus

Figura 2.10: Mitocndria
prprios ribossomos e seu prprio DNA, que carrega a informao para a sntese de um nmero limitado de
protenas, que esto relacionadas com as atividades da mitocndria. Elas podem tambm se dividir dando
origem a novas mitocndrias independente da diviso da clula.

Cloroplasto: Os cloroplastos so organelas que possuem a mesma funo das mitocndrias, ou seja,

Figura 2.11: Cloroplasto
produo de energia (ATP). Porm so encontrados em
organismos que realizam fotossntese, na qual a luz utilizada
como fonte de energia para a sntese de ATP para a clula.

Como as mitocndrias, tm sua origem explicada pela simbiose
de uma clula eucaritica primitiva e uma bactria
fotossintetizante. Como ilustrado na Figura 2.11, o cloroplasto
tem a forma de um pepino, circundado por uma dupla membrana.
No seu interior encontram-se um DNA circular, que codifica para
algumas protenas, e os ribossomos do cloroplasto. A membrana
Introduo Engenharia Genmica
Captulo 2 - A Clula Procariotos e Eucariotos 2005 Serpa e Porto
30
interna se dobra vrias vezes para formar bolsas,chamadas tilacides, que contm os pigmentos clorofila e
carotenides usados na fotossntese.


Leitura Recomendada:
1. PELCZAR, Michael J oseph; CHAN, Eddie Chin Sun; KRIEG, Noel R. Microbiologia: conceitos e
aplicaes. 2. ed. So Paulo: Makron Books, 1997.


Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 31
3. O funcionamento das clulas

A maioria dos constituintes celulares so compostos de carbono, hidrognio, oxignio e nitrognio que,
devido s muitas possibilidades de ligao do carbono, podem ser molculas pequenas, com massa molecular
baixa, ou molculas gigantescas, com grande massa molecular, como as protenas e os cidos nuclicos.
Estas molculas, organizadas de modo a seguir as leis da qumica, interagem entre si atravs de
reaes bioqumicas, onde molculas so decompostas para que sua energia e matria sejam aproveitadas
para a sntese de outras molculas, e estas por sua vez acabam por formar a clula, em todas as suas
organelas e membranas.
A maquinaria que permite que molculas sem vida (pr ex. protenas, cidos nuclicos, lipdeos, entre
outros) venham a formar um ser vivo capaz de se manter e de se multiplicar, muito complexa, porm,
totalmente coerente com as leis da termodinmica e da qumica.

3.1. Energia para a clula

Para que a vida seja possvel, as clulas vivas precisam realizar trabalho. Este trabalho, na forma
qumica, utilizado na sntese de compostos celulares, no transporte de substncias atravs das membranas,
na manuteno da presso osmtica da clula, no movimento celular, entre outros.
Na clula, a energia para estes processos extrada, canalizada e consumida atravs de reaes
bioqumicas, onde a energia resultante de reaes exergnicas
1
da degradao de substratos canalizada
para tornar possveis as reaes endergnicas
2
de sntese de compostos que no se processariam
espontaneamente, como ilustrado na Figura 3.1.


Figura 3.1: Relao entre degradao e sntese de compostos pela clula
(Adaptado de Pelczar et al., 1997)

1
Reaes onde os produtos possuem menor energia livre do que os reagentes. G negativo.
2
Reaes onde os produtos possuem maior energia livre do que os reagentes. G positivo.
Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 32
Imagine a situao apresentada na Figura 3.2. Uma reao qumica do tipo A B C onde a primeira
reao endergnica (G positivo) e a segunda exergnica (G negativo), conforme apresentado no grfico.

Figura 3.2: Reao qumica A B C
(Adaptado de Lenhinger et al.,1995)

A variao de energia total da reao (A C) a soma aritmtica das energias livres de cada reao.
Para que as reaes sejam possveis, necessrio que esta soma seja negativa, ou seja, a reao total seja
exergnica.
As reaes neste sistema esto acopladas, uma
vez que o produto de uma reao o reagente da outra.
Este acoplamento de uma reao endergnica com
outra exergnica a base das reaes bioqumicas que
ocorrem nas clulas vivas.
As clulas vivas podem usar duas estratgias
para obter energia livre do meio:

1) Os quimiotrficos utilizam-se de
componentes qumicos do meio (compostos orgnicos e
inorgnicos), extraem a energia livre destes
componentes, atravs de reaes exergnicas e
transferem esta energia para reaes endergnicas
acopladas s primeiras;

2) Os fototrficos utilizam a energia absorvida
da luz solar para a realizao de reaes fotoqumicas
exergnicas, que esto acopladas a reaes
endergnicas.


Figura 3.3: Fluxo de energia qumica na clula (Adaptado
de Pelczar et al.,1997)

Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 33
As clulas capturam, armazenam e transportam energia livre na forma qumica. A principal molcula
altamente energtica que atua como intermedirio nas reaes bioqumicas dos organismos, servindo como um
carreador de energia o trifosfato de adenosina, ou adenosina trifosfato (ATP). O ATP , por isso,
considerado um tipo de moeda energtica de troca entre as reaes.
O ATP transporta a energia entre as vias metablicas acoplando as reaes exergnicas de catlise de
compostos orgnicos energticos com as reaes endergnicas de sntese dos compostos celulares.
A alta energia do ATP devida ao seu grupo fosfato terminal, que transferido a uma variedade de
molculas receptoras que so assim ativadas para sofrerem outras transformaes qumicas. A molcula
resultante, adenosina difosfato (ADP) ento reciclada em outras reaes exergnicas, voltando a ser ATP.
Este ciclo ento se repete, constituindo o principal fluxo de energia qumica dentro da clula, conforme
apresentado na Figura 3.3

3.2. Transporte de substncias atravs da membrana celular

As membranas celulares so fundamentais para a vida nas clulas. A membrana plasmtica envolve a
clula, definindo seus limites e mantendo as diferenas essenciais entre o citoplasma e o meio externo. As
clulas eucariticas possuem ainda organelas especializadas como o retculo endoplasmtico, o complexo de
Golgi, as mitocndrias entre outras que so envolvidas por membranas para manter sua funcionabilidade.
A bicamada lipdica das membranas no miscvel com o lquido extracelular nem com o lquido
intracelular. Desta forma ela constitui uma barreira para a passagem de molculas de gua e outras
substncias do meio externo para o meio interno da clula e vice-versa e tambm entre os diversos
compartimentos celulares. Porm cada clula viva necessita adquirir do meio onde se encontra os compostos
energticos necessrios para a biossntese e a produo de energia, assim como precisa liberar para o meio
alguns produtos do seu metabolismo, esse conjunto de reaes bioqumicas que sustenta a vida.
Estas passagens de ons, nutrientes e metablitos ocorrem atravs da difuso direta pela camada
lipdica, principalmente com substncias lipossolveis, ou ento atravs de canais especficos, constitudos por
protenas, presentes na membrana.
As diferentes protenas presentes na membrana agem de forma distinta no transporte das substncias.
Algumas protenas atravessam totalmente a bicamada lipdica, constituindo assim um canal aquoso que
permitem o movimento livre de gua, ons e outras molculas hidrossolveis. Outras, por sua vez unem-se a
ons e molculas que vo ser transportados e, a seguir, vo sofrendo transformaes conformacionais, devidas
presena da substncia, fazendo com que a molcula ou on se movimente dentro da camada lipdica,
passando de um lado ao outro da membrana. Estas protenas so chamadas protenas transportadoras ou
carreadoras. Os dois tipos de protenas, as que formam canais e as transportadoras, so em geral seletivos a
um tipo de on ou molcula.
Nas membranas celulares existem basicamente dois tipos de transporte: a difuso e o transporte
ativo. Atravs de um desses processos as molculas de gua, metablitos, nutrientes e os ons atravessam a
bicamada lipdica de um lado ao outro da membrana (Figura 3.4).
Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 34
Existem algumas variaes desses mecanismos, mas de um modo geral so esses dois tipos que
ocorrem na clula. A difuso a passagem de molculas ou ons atravs da membrana, seja por espaos
intermoleculares atravs das camadas lipdicas, seja por protena formadora de canal ou por protena
transportadora. A energia que causa esse processo a energia do movimento cintico (trmico) normal da
matria, obedecendo a um gradiente de concentrao da substncia.

Figura 3.4 Tipos de transportes atravs de membranas.

O transporte ativo s possvel se for mediado por uma protena transportadora que movimenta ons e
molculas atravs da membrana, contra gradientes de concentrao. Essa movimentao exige por sua vez a
utilizao de energia adicional, em geral na forma de ATP, alm da energia cintica para que ocorra o
movimento.

3.3. Metabolismo Celular

Uma vez dentro da clula os nutrientes e ons comeam a fazer parte de milhares de reaes qumicas,
que acontecem ao mesmo tempo dentro de cada uma das clulas vivas. O arranjo destas reaes embora
muito complexo revela uma extrema sincronia entre cada uma delas, de modo que a clula consiga obter a
energia ou os componentes desejados da melhor maneira possvel e com pouco desperdcio.
Embora sejam muitas as reaes qumicas que ocorrem nas clulas, so poucos os tipos de reaes,
que normalmente so simples e mediadas por enzimas, que atuam como catalisadores biolgicos, diminuindo
a energia de ativao das reaes, e facilitando sua ocorrncia. So tambm as enzimas que ao se ligarem
com molculas de ATP, promovem a transferncia da energia qumica desta molcula para outras molculas
que esto reagindo tambm ligadas enzima.
Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 35
A primeira lei da Termodinmica diz que a energia no pode ser nem criada nem destruda, apenas
transformada. Seguindo este princpio, as clulas obtm a energia do meio ambiente e a transforma de tal
modo que possam utiliz-la para as diversas funes celulares.
Os organismos fototrficos utilizam-se da energia solar para converter complexos pobres em energia
em molculas mais complexas. J os quimiotrficos, obtm a energia atravs da oxidao de substncias
qumicas. Ao conjunto de reaes bioqumicas que envolvem a degradao e a sntese de compostos pela
clula, d-se o nome de metabolismo celular.
Existem muitos caminhos pelos quais as reaes metablicas podem seguir, que comeam com uma
molcula em particular sendo convertida a outras molculas intermedirias, numa seqncia de reaes
definida e regulada, chamados vias metablicas.
O arranjo entre estas vias inclui a transferncia de energia qumica (ATP) e a circulao de um nmero
limitado de compostos intermedirios, que so elementos chaves das vrias vias metablicas e interligam todas
as reaes, tanto de degradao como de sntese, conforme a Figura 3.4.


Figura 3.4: Vias metablicas (www.genome.ad.jp/kegg)

Introduo Engenharia Genmica
Captulo 3 - O funcionamento das clulas. 2005 Serpa e Porto 36
As vias metablicas so interdependentes e suas atividades so reguladas de forma a deix-las em
sintonia com o estgio de crescimento e atividade em que a clula se encontra.
Podemos dividir o metabolismo celular em duas classes de reaes: 1) reaes de degradao de
substrato para a obteno de energia, chamadas em conjunto de catabolismo, e 2) reaes de sntese de
compostos celulares que necessitam de energia, chamadas em conjunto de anabolismo.
Na primeira classe, as reaes transformam o combustvel (substrato) em energia disponvel.
Constituem assim as reaes catablicas, e podem ser generalizadas da seguinte forma:

2 2
( , , ...)
Catabolismo
combustvel carboidrato gorduras CO H O energia + +

As reaes de sntese, chamadas de reaes anablicas, so reaes do tipo endergnicas e, portanto,
necessitam de energia para que ocorram. Podem ser generalizadas na forma:

Anabolismo
energia molculas simples molculas complexas +

Observe que a energia, na forma de ATP, o elo qumico entre o catabolismo e o anabolismo. Sua
converso exergnica em ADP + fosfato est presente em um grande nmero de reaes bioqumicas e
processos endergnicos. Nesta converso o grupo fosfato transferido para o substrato ou para a enzima que
est mediando a reao, transferindo assim a energia de uma reao para a outra e possibilitando que as
reaes endergnicas ocorram.
O metabolismo celular composto de muitas vias metablicas, que incluem todas as vias de
degradao de substratos (carboidratos, lipdeos, protenas, etc) e as vias de sntese de todos os compostos
essenciais vida da clula. Destas inmeras vias, destacam-se algumas, que merecem um estudo mais
detalhado, justamente por se tratarem do que se conhece como Vias do Metabolismo Central da Clula, que
incluem as reaes bsicas para degradao da glicose, principal substrato para a maioria das clulas
quimiotrficas, e as reaes de formao de ATP e de muitos compostos intermedirios importantes para as
reaes de sntese celular. Destas, merecem destaque a Gliclise, o Ciclo dos cidos Tricarboxlicos, as
vias de sntese de alguns metablitos e a Cadeia Transportadora de Eltrons, que onde ocorre a sntese
de ATP.


Leitura Recomendada:
1. MATHEWS, Christopher K; VAN HOLDE, K E; AHERN, Kevin G. Biochemistry. 3. ed. So Francisco:
Addison Wesley Longman, 1999.
2. LEHNINGER, Albert L; NELSON, David L.; COX, Michael M. Princpios de bioqumica. 3. ed. So Paulo:
Sarvier, 2002.
3. PELCZAR, Michael Joseph; CHAN, Eddie Chin Sun; KRIEG, Noel R. Microbiologia: conceitos e
aplicaes. 2. ed. So Paulo: Makron Books, 1997.
4. BERG, Jeremy M.; TYMOCZKO, John L.; STRYER, Lubert. Biochemistry. New York: W. H. Freeman and
Co., 2002.
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
37
4. Principais Vias Metablicas

Uma clula viva necessita de energia para manter suas funes vitais, e para isso utiliza-se de
uma maquinaria complexa, formada de organelas celulares onde ocorre uma srie de transformaes
qumicas, tanto de degradao como de sntese de compostos orgnicos e inorgnicos. Essas reaes
qumicas so na sua grande maioria mediadas por enzimas que devido sua conformao espacial
possuem stios de ligao especficos para determinados substratos e outras molculas, fazendo com
que os reagentes se aproximem de tal forma a permitir que as reaes qumicas ocorram. Nota-se,
portanto, que a organizao destas reaes, para que ocorram no lugar certo, no tempo certo, e ainda
evitando desperdcios bastante complexa.
A compreenso da seqncia destas reaes, bem como sua localizao na clula e sua
regulao so o objeto de estudo dos bioqumicos h muitos anos. Muitas so as vias metablicas
existentes em uma clula e a maioria sofre alteraes de um organismo para o outro. Porm, as vias
metablicas do Metabolismo Central, ou seja, aquelas que envolvem a degradao da glicose para
obteno de energia e compostos intermedirios para as snteses, foram muito conservadas ao longo da
evoluo e podem ser encontradas tanto em bactrias como em humanos, com algumas pequenas
alteraes.

4.1. Gliclise

Os organismos vivos podem utilizar uma ampla variedade de substratos para a obteno de
energia qumica, incluindo compostos orgnicos e inorgnicos. Muitos, incluindo o homem e algumas
bactrias de interesse industrial, utilizam-se de monossacardeos, especialmente a glicose, como fonte
de energia e de carbono para a sua manuteno. Existem muitas vias de degradao da glicose, porm a
mais comum a Gliclise, que encontrada em muitos microrganismos, animais e plantas.
Na gliclise uma molcula de glicose degradada por uma srie de reaes catalticas mediadas
por enzimas, resultando em duas molculas de piruvato, que um importante intermedirio de outras
vias. A energia contida nas ligaes qumicas que so quebradas fica retida sob a forma de ATP
disponvel para a clula. Durante as reaes da gliclise bem como em outras vias metablicas,
molculas de um cofator chamado NAD (nicotinamida adenina dinucleotdeo) so reduzidas a NADH que
numa etapa futura sero precursores na formao de outras molculas de ATP (Figura 4.1).
Nota-se tambm que a gliclise possui duas fases distintas. Inicialmente para ativar e rearranjar a
molcula de glicose so gastas duas molculas de ATP, para fosforilar a glicose e a frutose, de modo a
deixar a molcula mais instvel e favorecer a quebra da molcula de frutose 1,6-bifosfato (6C) em uma
molcula de gliceraldedo 3-fosfato (3C) e outra de diidroxicetona-fosfato (3C), que se apresentam em
equilbrio dinmico. Nesta primeira etapa ento, h um investimento de energia pela clula que, porm,
compensado na segunda etapa onde essas molculas passam por outras reaes que resultam na
formao de quatro molculas de ATP e duas molculas de NADH para cada molcula de glicose inicial.
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
38
Assim, a gliclise uma via metablica que possui um saldo positivo de 2 ATP e 2 NADH, terminando
com a formao de 2 molculas de piruvato.


Figura 4.1: Gliclise
(Adaptado de http://tina.bu.edu/rmh/BookBackup/Wiley/figures/Glycolysis/ch15_glycolysis-cmutexas.jpg)


Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
39
A regulao desta via metablica ocorre de trs maneiras. A primeira regulao ocorre j na
primeira reao, catalisada pela enzima hexoquinase, que fosforila a glicose a glicose 6-fosfato. Quando
a concentrao de glicose 6-fosfato aumenta no interior da clula, a enzima inibida alostericamente, ou
seja, a glicose 6-fosfato se liga enzima mudando a sua conformao espacial e diminuindo sua
atividade. A segunda regulao ocorre devido ao aumento da concentrao de ATP na clula, que inibe
alostericamente a enzima piruvato quinase, que catalisa a reao de transferncia do grupo fosfato do
fosfoenolpiruvato para o ADP, resultando em ATP e piruvato. Alm destas duas regulaes internas da
gliclise ela ainda pode ser regulada, de forma mais complexa, atravs da enzima fosfofrutoquinase-1,
que catalisa a formao de frutose 1,6-bifosfato, que inibida alostericamente por ATP, citrato (um
intermedirio de outra via metablica), e tambm pode ser ativada pela presena de ADP, AMP e frutose
2,6-bifosfato. A regulao da gliclise bem como de todas as outras vias metablicas fundamental para
a vida celular e para o controle de desperdcios na clula.
Para os organismos anaerbios, a gliclise a nica fonte de produo de ATP, ou seja, a via
responsvel pela produo de energia qumica para a clula. Nestes organismos a clula dispe apenas
de 2 molculas de ATP formado para cada molcula de glicose degradada. Para os organismos aerbios,
a seqncia de reaes continua a partir do piruvato para uma outra via, chamada Ciclo dos cidos
Tricarboxlicos (Ciclo de Krebs), onde outras molculas de ATP tambm so formadas, alm de outros
fatores de reduo.
Outro problema a ser resolvido pela clula, alm da obteno de energia, como regenerar as
molculas de NADH, fazendo-as voltar forma oxidada NAD
+
, para que possam ser novamente
utilizadas na gliclise. Esses cofatores so limitados na clula, ou seja, no so produzidos
continuamente e sem limites, portanto, precisam ser regenerados. Essa regenerao acontece quando
eles se ligam a outras enzimas que favorecem a reduo de outro substrato, com aquele poder redutor
que est disponvel no cofator. Para isso ento, necessrio que a clula possua outras vias metablicas
visando a regenerao do NADH.
No caso dos organismos aerbios, o receptor de eltrons dos diversos NADH produzidos pela
clula ser o O
2
, numa etapa chamada Cadeia Transportadora de Eltrons, que ser estudada mais
adiante.
Porm, os organismos anaerbios no utilizam o O
2
como receptor, e sim outras molculas
orgnicas, num processo chamado Fermentao.


4.2 Fermentao

Certos organismos ou tecidos, como os msculos, funcionam anaerobicamente, muitas vezes por
restrio da quantidade de O
2
(anaerobiose facultativa), outras pelo fato de ele ser prejudicial ao
organimo (anaerobiose total). Nestes casos a clula precisa dar algum destino para as molculas de
piruvato e NADH produzidos na gliclise.
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
40
A opo adotada nos processos anaerbios a fermentao, onde o piruvato transformado em
lactato (Fermentao Ltica) ou em etanol (Fermentao Alcolica) (Figura 4.2).

4.2.1. Fermentao ltica
Em alguns tecidos animais e em alguns
microrganismos, a gliclise seguida da
fermentao ltica, onde o piruvato reduzido a
lactato, mediante a regenerao de uma molcula de
NADH em NAD
+
.
Essa reao imprescindvel para a
viabilidade da vida celular, nos casos onde no
possvel que a clula utilize o O
2
como receptor de
eltrons para a regenerao do NADH. Essas clulas
quando cultivadas em substrato base de glicose
tm na gliclise sua principal via de obteno de
energia o que as leva a altas taxas de reao. Isso
por sua vez, acarreta ama alta produo de NADH
que precisa ser regenerado para ser reutilizado.


Figura 4.2: Destinos para o piruvato em processo
anaerbios
importante observar que no caso de processos anaerbios a fermentao ltica apresenta uma tima
sada para a regenerao de NADH, j que para cada molcula de glicose formam-se 2 molculas de
piruvato e, portanto, 2 molculas de lactato, com a regenerao total dos NADH.

4.2.2. Fermentao alcolica
As leveduras e outros microrganismos utilizam outra forma de fermentao para regenerar o
NADH e utilizar o piruvato, formados na gliclise. Nestes organismos o piruvato convertido em etanol e
CO
2
. Primeiramente um dos carbonos retirado da molcula, numa reao de descarboxilao, onde so
formadas uma molcula de gs carbnico e uma de acetaldedo. Numa segunda etapa, o acetaldedo
reduzido a etanol, com o NADH fornecendo o poder redutor.
Como no caso da fermentao ltica, na alcolica o nmero de NADH formados na gliclise de
uma molcula de glicose igual ao nmero de NADH regenerados na formao de 2 molculas de etanol
e 2 de CO
2
; assim o balano de carbonos e hidrognio fecha perfeitamente.


4.3 Ciclo dos cidos Tricarboxlicos

Seguindo a gliclise em condies aerbias, algumas bactrias e a maioria das clulas
eucariticas utilizam-se de uma via chamada Ciclo dos cidos Tricarboxlicos (TCA) para produzir
ainda mais ATP e fatores reduzidos, atravs da oxidao total da glicose em CO
2
e H
2
O, num processo
chamado Respirao Celular.
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
41
Aps o gliclise, o piruvato produzido convertido a acetato e ligado a uma coenzima (Coenzima
A), formando-se assim a molcula de acetil-CoA, conforme Figura 4.3. A reao de formao do acetil-
CoA catalisada por um complexo enzimtico formado por 3 enzimas (complexo da piruvato
desidrogenase) cuja atividade regulada atravs da inibio da sua atividade na presena de altas
concentraes de ATP, acetil-CoA e NADH. Assim como a presena de altas concentraes de AMP,
CoA e NAD
+
ativam alostericamente o complexo. O acetil-CoA tambm o produto da oxidao de
cidos graxos e da maioria dos aminocidos, que em ltima estncia tambm sero ento convertidos a
CO
2
e H
2
O, como ocorre com a glicose.

C
O
C
O
CH
3
O
C
CH
3
O S CoA
+
CO
2
CoA-SH NAD
+
complexo da piruvato
desidrogenase (E
1
+E
2
+E
3
NADH

Figura 4.3: Reao global para formao de Acetil-CoA a partir de piruvato. Catalisada pelo complexo enzimtico
piruvato desidrogenase


Nos eucariotos, que possuem organelas que compartimentalizam a clula, as reaes do TCA
ocorrem dentro da matriz mitocondrial, assim como a oxidao de piruvato, cidos graxos e aminocidos
gerando o acetil-CoA.
O ciclo dos cidos tricarboxlicos uma via cclica, que visa oxidar totalmente o acetil-CoA em
CO
2
e H
2
O. Para isso a estratgia utilizada transferir o radical acetila (2C) que est ligado coenzima A
para uma molcula de quatro carbonos (oxalacetato), gerando assim uma molcula de seis carbonos
(citrato). A partir da o citrato entra numa srie de oito reaes, nas quais dois carbonos so retirados sob
a forma de CO
2
, restando novamente uma molcula de oxalacetato, que novamente segue pelo ciclo,
conforme a Figura 4.4.
Quatro das oito reaes de ocorrem no ciclo so oxidaes e a energia resultante destas reaes
conservada na forma de cofatores reduzidos (NADH e FADH). Alm disso, em outra reao do ciclo
ocorre a fosforilao de uma molcula de guanosina difosfato (GDP) produzindo uma molcula de
guanosina trifosfato (GTP), cujo fosfato pode ser transferido para uma molcula de ADP formando ATP,
sem custo energtico.
GTP +ADP GDP +ATP G
0f
=0
Mg
2+


O ciclo inicia-se com a condensao do acetil-CoA com a uma molcula de oxalacetato (4C),
numa reao catalisada pela enzima citrato sintase, formando uma molcula de citrato (6C). O citrato por
sua vez sofre a uma isomerizao sob ao da enzima aconitase levando formao o isocitrato (6C).
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
42
Na seqncia ocorre a primeira das duas descarboxilaes catalisada pela enzima isocitrato
desidrogenase, onde o isocitrato oxidado para a formao do -cetoglutarato (5C), liberando uma
molcula de CO
2
e dois hidrognios na forma de NADH +H
+
. O -cetoglutarato tambm oxidado, pela
ao de um complexo enzimtico chamado complexo da -cetoglutarato desidrogenase, com o auxlio da
coenzima A, liberando mais uma molcula de CO
2
e dois hidrognios (NADH +H
+
), para a formao de
uma molcula de succinil-CoA (4C).


Figura 4.4: Ciclo dos cidos Tricarboxlicos

A partir desse ponto no ciclo no ocorrem mais descarboxilaes e a molcula agora com
quatro carbonos sofre mais algumas oxidaes e volta ao incio do ciclo na forma de oxalacetato.
Primeiramente, o succinil-CoA fosforilado sob a ao da succinil-CoA sintetase formando succinato e
liberando a coenzima. A energia liberada nesta reao utilizada para fosforilar uma molcula de GDP
formando GTP, que posteriormente transfere o grupamento fosfato para formao de ATP. O succinato
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
43
segue no ciclo e oxidado pela succinato desidrogenase para a formao do fumarato, que por sua vez
sofre uma hidratao sob a ao da fumarase, gerando o malato. Na ltima reao do ciclo o malato
oxidado, sob a ao da malato desidrogenase, com a liberao de dois hidrognios na forma de NADH +
H
+
e formao do oxalacetato, que novamente estar disponvel para reiniciar o ciclo.
Todas as reaes do ciclo dos cidos tricarboxlicos ocorrem na matriz mitocondrial, com
exceo da reao catalisada pela succinato desidrogenase, onde ocorre a formao de FADH
2
. Esta
enzima uma protena de membrana, faz parte tanto do TCA como da fosforilao oxidativa, que ser
estudada adiante, e utiliza o cofator FAD
+
para o qual transfere os hidrognios removidos da molcula de
succinato.
Alm de toda a contribuio para a produo de energia e de cofatores reduzidos, que
posteriormente sero utilizados na sntese de mais molculas de ATP, o TCA ainda abastece o
metabolismo celular com alguns compostos intermedirios do ciclo que so precursores em vrias vias
de sntese de compostos celulares, como o citrato que entra na sntese de cidos graxos e esterides, o
-cetoglutarato que precursor para o glutamato e outros aminocidos, o oxalacetato que precede o
aspartato e outros aminocidos, purinas e pirimidinas, entre outros.
A regulao do ciclo dos cidos tricarboxlicos se d de vrias formas, tanto utilizando a
propriedade que as enzimas tm de serem reguladas alostericamente, quanto por concentrao de
certos substratos. Um resumo desta regulao est apresentado na Figura 4.5. As reaes que envolvem
desde a transformao de piruvato em acetil-CoA at o final do ciclo so, de um modo geral, reguladas
principalmente pelas relaes NAD
+
/ NADH e ADP / ATP que se forem maior do 1, tendem a ativar o
ciclo, e se forem menores do que 1 tendem a diminuir a velocidade do ciclo TCA.



Figura 4.5: Esquema resumido da regulao do
ciclo TCA (Adaptado de Mathews, 1999)
O complexo enzimtico da piruvato
desidrogenase, que converte o piruvato a acetil-CoA inibido
alostericamente pela pelo ATP, NADH e pelo prprio acetil-
CoA. Suas altas concentraes em relao aos seus pares,
indicam um estado suficiente de liberao de energia para a
clula, o que significa que a clula no est precisando de
mais energia daquele momento. A diminuio da
concentrao destes compostos leva a uma ativao da
atividade do complexo.
Logo no incio do TCA, a enzima citrato sintase
regulada pela disponibilidade de acetil-CoA e oxalacetato,
que varia com a condio metablica da clula, o que pode
ser uma fator limitante da velocidade desta reao e,
conseqentemente, do ciclo. Altas concentraes de NADH
atuam como inibidores alostricos de duas enzimas que
catalisam reaes de desidrogenao, a isocitrato desidrogenase e a -cetoglutarato desidrogenase,
diminuindo suas atividades e, conseqentemente, a velocidade do ciclo. Existe ainda a inibio retroativa,
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
44
ou seja, aquela realizada pelos produtos das reaes, como o caso da inibio causada pelo excesso
de succinil-CoA, que inibe a -cetoglutarato desidrogenase e a citrato sintase, e a inibio causada pelo
excesso de citrato, que bloqueia a ao da citrato sintase. Deve-se ainda lembrar que o ciclo dos cidos
tricarboxlicos responsvel pelo abastecimento do metabolismo celular dos precursores de muitos
compostos celulares. Sendo assim, a disponibilidade destes metablitos intermedirios, tambm afeta a
velocidade das reaes do ciclo.
O controle da gliclise e do TCA ocorre de modo integrado, ou seja, a primeira via fornece
apenas a quantidade de piruvato necessria para que o TCA consiga suprir as necessidades energticas
e de compostos intermedirios que a clula requer num dado momento. Logicamente este ajuste
realizado a cada momento e as taxas das reaes sofrem oscilaes que dependem totalmente deste
sistema integrado de regulao da atividade das enzimas. Porm a regulao bsica envolve sem dvida
a relao NAD
+
/ NADH e ADP / ATP, que refletem exatamente as necessidades energticas e a
condio metablica em que a clula se encontra.


4.4 Fosforilao oxidativa e cadeia transportadora de eltrons

As clulas aerbias de um modo geral utilizam-se do ciclo dos cidos tricarboxlicos para
oxidar o acetil-CoA proveniente da gliclise e do catabolismo de aminocidos e cidos graxos para obter
a energia necessria e os precursores metablicos requeridos para sobrevivncia e reproduo da
clula. Porm, como observado at agora, somando-se a gliclise e o ciclo TCA, so produzidas apenas
quatro molculas de ATP por mol de glicose, diretamente no ciclo. Esta energia no suficiente para
manter a clula. Porm, alm do ATP so produzidos nestas vias de oxidao, fatores de reduo NADH
e FADH
2
. J untando-se todas as etapas, so formados 10 moles de NADH e dois moles de FADH
2
, por
mol de glicose. A energia contida nestes fatores de reduo a energia que a clula utilizar para formar
as molculas de ATP necessrias.
O processo de reoxidao de NADH e FADH
2
, que est resumido na Figura 4.6, chamado de
cadeia transportadora de eltrons (cadeia respiratria), e envolve uma srie de carreadores de
eltrons que de um modo geral so protenas presentes na membrana interna das mitocndrias, cujos
grupos prostticos so capazes de aceitar ou doar eltrons.

4.4.1. Regenerao do NADH
A regenerao do NADH, levando-o a NAD
+
novamente, inicia-se sob a ao de um complexo
enzimtico, chamado complexo I (complexo da NADH desidrogenase), que constitudo de mais de
25 cadeias polipeptdicas. Este complexo est localizado na membrana interna das mitocndrias com seu
stio de interao voltado para a matriz mitocondrial. O stio ativo do complexo recebe o NADH e favorece
a sua desidrogenao, com a liberao de um on hidreto (dois eltrons e um prton (H
+
)), que so
recebidos pelo complexo, passando pelos seus sete centros de Fe-S. A passagem dos eltrons para o
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
45

Figura 4.6: Esquema simplificado da cadeia transportadora de eltrons (Adaptado de Mathews, 1999).


complexo enzimtico um processo exergnico e a energia liberada nesta passagem utilizada para
bombear prtons atravs do complexo enzimtico da matriz da mitocndria para a rea intermembrana,
mesmo contra um gradiente de concentrao estabelecido. Os eltrons so encaminhados para uma
outra molcula receptora, a ubiquinona, que se encontra na forma oxidada. A ubiquinona, ou a coenzima
Q, como tambm chamada, lipossolvel e est presente no interior da membrana interna das
mitocndrias, de tal forma que pode se movimentar livremente no interior da bicamada lipdica
transportando os eltrons recebidos at o prximo complexo da cadeia respiratria, o complexo III
(complexo ubiquinonacitocromo c oxidorredutase).
O complexo III formado por citocromos b, citocromo c, e outras protenas, que recebem o par
de eltrons da ubiquinona. Novamente a passagem dos eltrons pelo complexo enzimtico libera
energia, que utilizada para bombear mais prtons para a regio intermembrana. Os eltrons percorrem
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
46
um caminho no interior do complexo atravs dos grupos heme
1
dos citocromos chegando at o
citocromo c que reduzido. O citocromo c entrega ento o par de eltrons para o terceiro complexo da
cadeia, o complexo IV. O complexo IV tambm chamado de citocromo c oxidase e formado pelos
citocromos a e a
3
e ainda contm os ons Cu
A
e Cu
B
. Todo este complexo responsvel por receber os
eltrons do citocromo c e pass-los para molculas de O
2
, que sero reduzidas a H
2
O. Esse fluxo de
eltrons pelo complexo IV induz a passagem de prtons (H
+
) do interior da mitocndria para a regio
intermembrana. Todos estes prtons que so bombeados atravs dos complexos enzimticos sero
posteriormente utilizados pela ATP sintase na sntese de ATP, como ser visto a seguir.

4.4.2. Regenerao do FADH
2

O FADH
2
tambm precisa ser regenerado a FAD para que possa novamente ser utilizado no
ciclo dos cidos tricarboxlicos. Este fator de reduo faz parte da cadeia transportadora de eltrons,
atuando como cofator de uma das protenas do complexo II. Como visto anteriormente, a transformao
do succinato para fumarato, no ciclo TCA, ocorre sob a ao da enzima succinato desidrogenase, que
tambm uma enzima do complexo II, ocorrendo a formao do FADH
2
.
Sendo assim, na verdade os eltrons resultantes da oxidao do succinato so transferidos
para o FAD, levando-o a FADH
2
, no complexo II da cadeia transportadora de eltrons. Em seguida os
eltrons passam atravs de centros Fe-S de protenas constituintes do complexo, e so entregues
ubiquinona, que tambm recebe os eltrons provenientes do NADH do complexo I. A partir da os
eltrons seguem o mesmo caminho j detalhado para os eltrons do NADH.

No caso do NADH, assim como para o FADH
2
, resumindo todas as etapas da cadeia
transportadora de eltrons, pode-se escrever a seguinte equao:

mol kJ G O H NAD O H NADH
o
/ 220 '
2
1
2 2
= + + +
+ +


Nota-se que o processo altamente exergnico, no caso do FADH
2
a energia liberada de
152 kJ /mol, sendo que a cadeia transportadora de eltrons o meio pelo qual esta reao realizada em
etapas mais brandas, aproveitando-se a maior parte dessa energia, sem muitas perdas na forma de
calor. A energia desprendida na cadeia usada na sntese de ATP na etapa seguinte, chamada
fosforilao oxidativa.

4.4.3. Fosforilao Oxidativa
A fosforilao oxidativa a etapa do metabolismo celular onde a energia liberada durante a
cadeia respiratria finalmente transformada em ATP, para ser utilizada pela clula.

1
Grupos prostticos heme so formados por quatro anis de cinco tomos, contendo nitrognio numa estrutura cclica chamada
porfirina. Os quatro nitrognios dos anis ligam-se a um on de Fe central.
Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
47
A energia necessria para a reao de formao do ATP a partir de ADP de
aproximadamente 31 kJ /mol, segundo a equao:

mol kJ G O H ATP P ADP
o
i
/ 5 , 30 '
2
+ +

Nota-se, portanto, que a energia desprendida na oxidao do NADH mais do que a
necessria para a sntese de ATP. Na verdade atravs de constataes experimentais sabe-se que, para
cada molcula de NADH oxidada so formadas 3 molculas de ATP e para cada molcula de succinato
oxidado, ou FADH
2
formado, so formadas 2 molculas de ATP.
Porm a termodinmica no suficiente para explicar todo o processo de acoplamento da
reao exergnica de oxidao do NADH pelo O
2
com a reduo endergnica de condensao do ADP e
P
i
, formando o ATP, uma vez que a reao de formao do ATP no ocorre de modo espontneo.
J untando-se as duas reaes acima, e assumindo-se o seu acoplamento, que j foi confirmado
experimentalmente, tem-se a seguinte equao global:

ATP O H NAD ADP O H NADH 3 4 3
2
1
4
2 2
+ + + + +
+ +


Somando-se as energias livres nota-se que h um excesso de energia liberada (220 kJ /mol) e
que no aproveitada para a sntese de ATP (3x31 = 93 kJ /mol). A sntese de ATP consome
aproximadamente 42% da energia liberada nas etapas oxidativas. O restante da energia liberado na
forma de calor, ou ento utilizado para possibilitar alguns rearranjos moleculares durante as diversas
etapas da cadeia respiratria e fosforilao oxidativa. Estas perdas ficariam mais bem explicadas em
nvel macromolecular, quando se associa a energia livre de Gibbs (G) com a entalpia (H) e a entropia
(S) de um sistema.
S T H G =

O ATP sintetizado sob a
ao de um complexo enzimtico,
chamado ATP sintase (complexo
enzimtico V), que devido diferena de
potencial existente na membrana (Figura
4.7), permite a passagem de prtons (H
+
)
da regio intermembrana para a matriz
mitocondrial. Os prtons que foram
bombeados, contra um gradiente de
concentrao, pelos complexos I, III e IV
da cadeia transportadora de eltrons,

Figura 4.7: Fosforilao oxidativa. Favorecida pela diferena de potencial na
membrana interna da mitocndria (Adaptada de
http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=stryer.figgrp.2486)

Introduo Engenharia Genmica
Captulo 4 Principais vias metablicas 2005 Serpa e Porto
48
retornam para a matriz mitocndrial, e nesse retorno liberam energia para a condensao de ADP e P
i
.
As bactrias, embora no possuam mitocndrias, realizam a fosforilao oxidativa de modo
semelhante, utilizando os transportadores de eltrons e a ATP sintase presentes na membrana
citoplasmtica.
A regulao da cadeia transportadora de eltrons e da fosforilao oxidativa ocorre
principalmente pelas relaes NAD
+
/ NADH e ADP / ATP, ou seja pelas necessidades energticas da
clula. A clula no capaz de estocar grandes quantidades de energia na forma de ATP, de modo que
a demanda desta molcula, exigida pelo metabolismo celular, est estreitamente ligada cadeia
transportadora de eltrons e a fosforilao oxidativa. Esses dois processos tm sua velocidade
aumentada sempre que a clula se encontra em necessidades energticas, principalmente nas fases de
crescimento celular e reproduo. Assim todas as vias catablicas e anablicas ficam interligadas entre si
e concomitantemente a estes dois processos.



Leitura Recomendada:
1. MATHEWS, Christopher K; VAN HOLDE, K E; AHERN, Kevin G. Biochemistry. 3. ed. San Francisco:
Addison Wesley Longman, 1999.
2. LEHNINGER, Albert L; NELSON, David L.; COX, Michael M. Princpios de bioqumica. 3. ed. So
Paulo: Sarvier, 2002
3. BERG, J eremy M.; TYMOCZKO, J ohn L.; STRYER, Lubert. Biochemistry. New York: W. H. Freeman
and Co., 2002.

Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 49
5. Informao celular

H 50 anos os cientistas J ames Watson e Francis Crick propuseram a estrutura em dupla hlice do
DNA, o sal do cido desoxirribonuclico. Compondo essa longa macromolcula de cido desoxirribonuclico
esto seqncias de nucleotdeos (compostos por bases nitrogenadas + acar + fosfato), formando um
polmero das bases que compem a molcula de DNA, a saber: adenina (A), timina (T), guanina (G), e citosina
(C). A ordenao dessas seqncias de forma caracterstica leva a regies do DNA que reconhecemos como
genes, entidades responsveis pela transmisso de nossos traos hereditrios, e tambm por determinar em
cada organismo sua natureza peculiar, clula por clula.
Um organismo muito simples pode possuir apenas uma nica molcula (de dupla fita) de DNA, mas
muitos possuem vrias, distribudas em cromossomos, plasmdeos, mitocndrias e cloroplastos, cujas
seqncias so reproduzidas em cada clula do indivduo. Os genomas so o conjunto dessas macromolculas
(DNA ou RNA, o cido ribonuclico, no caso de alguns vrus), responsveis pela estrutura dos organismos, e
todo o conjunto de reaes qumicas (metabolismo celular) que conferem propriedades particulares a cada tipo
de clula.

5.1. Informao Celular

A vida mantida devido a um influxo contnuo de energia e a um complexo sistema de estoque e
processamento de informao genmica. Toda a informao que a clula precisa para se manter est
codificada na forma de combinaes dos quatro nucleotdeos formadores do DNA (guanina, citosina, timina e
adenina). Esta informao est organizada na forma de genes, seqncias caractersticas de nucleotdeos que
leva a informao correspondente a uma seqncia de aminocidos de uma dada protena. Alm das regies
do DNA que codificam uma protena o DNA repleto de outras seqncias caractersticas, conhecidas como
regies regulatrias, que so responsveis pela regulao da expresso de um dado gene em um dado
momento da vida celular.
A transmisso ou fluxo de informao na clula segue o que se conhece como o Dogma Central da
Biologia Molecular, teoria formulada por Francis Crick, conforme mostra a Figura 5.1.

DNA RNA Protena
Replicao
Transcrio
Transcrio Reversa
Traduo

Figura 5.1: Dogma central da biologia molecular. Transferncia da informao gentica.

Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 50
O DNA, uma espcie de organela de informao, tem a capacidade de replicao, ou seja, num dado
momento a clula utiliza a sua maquinaria celular (enzimas e outras molculas) para duplicar a molcula de
DNA, usando como molde suas fitas simples de nucleotdeos. O DNA fonte para a produo de RNA, cuja
seqncia de nucleotdeos corresponde a uma seqncia especfica do DNA. O RNA formado num processo
conhecido como transcrio, que assim como a replicao ocorre no ncleo celular, desencadeado por um
complexo sistema de regulao da expresso gnica, responsvel pela coordenao da expresso gnica
numa determinada fase da vida celular. Em seguida, fora do ncleo, o RNA por sua vez utilizado como molde
na sntese de protenas, num processo chamado de traduo, onde aquela informao codificada na forma de
nucleotdeos finalmente expressa numa seqncia especfica de aminocidos, dando origem a um
polipeptdio ou uma protena. Nos retro-vrus esse processo diferenciado porque eles possuem como fonte de
informao o RNA. Quando esto hospedados em uma clula traduzem o seu RNA para a forma de DNA que
unido ao DNA da clula, num processo chamado transcrio reversa, utilizando para tanto a enzima
transcriptase reversa, que atualmente, na forma isolada, possui um importante papel nas tcnicas de biologia
molecular e gentica.
Deste modo cada uma das clulas vivas existentes carrega consigo uma macromolcula formada de
nucleotdeos que contm a informao da vida. Todas os peptdeos e protenas existentes no seu interior e
ainda alguns tipos de RNA (transportador e ribossmico) esto codificados na molcula de DNA. Esta molcula
est disposta dentro de ncleo de formas diferentes.

No caso das bactrias, a
fita dupla e helicoidal de DNA est
disposta na forma circular (conforme
figura 5.2a); j nas clulas
eucariticas, incluindo as humanas,
o DNA se encontra muito
condensado, na forma de
cromossomos. O empacotamento
do DNA necessrio para que ele
ocupe um espao menor do ncleo,
sendo que medida que se torna
necessrio, na replicao ou na
transcrio de um gene, o DNA
desenrolado deixando livre o acesso
sua seqncia de bases
nitrogenadas, conforme mostra a
Figura 5.2b.
O empacotamento do DNA
nas clulas humanas auxiliado por
protenas carregadas positivamente,

Figura 5.2: Disposio do DNA no interior da clula. (a) DNA bacteriano na forma
circular. (b) DNA de eucariotos, na forma de cromossomos altamente
condensados com o auxlio de histonas, protenas carregadas positivamente que
auxiliam no empacotamento da macromolcula (Adaptado de
http://www.koshland-science-museum.org/exhibitdna/intro02.jsp)
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 51
as histonas, que auxiliam na neutralizao das cargas negativas dos cidos nuclicos com seus grupos
fosfato. A estrutura primria das histonas foi conservada durante a evoluo, apresentando apenas variaes
pontuais na seqncia de aminocidos. O DNA bacteriano e mitocondrial no possuem histonas na sua
estrutura tridimensional.


5.2. Replicao do DNA

A maquinaria celular constituda pelos componentes necessrios para que o DNA possa ser replicado,
usando como molde uma de suas fitas, que contm a seqncia de nucleotdeos de cada indivduo. A
replicao do DNA chamada de semiconservativa, uma vez que ao final da replicao, o novo DNA formado
contm uma fita nova e outra antiga, que serviu como molde para a confeco da outra. A maquinaria inclui
enzimas especficas para abrir a fita dupla de DNA, enzimas responsveis pelo incio e continuao da
formao da fita nova de DNA complementar ao molde antigo, enzimas de reparo dos possveis erros de
replicao, protenas estabilizadoras do processo, nucleosdeos trifosfato, entre outros.
A replicao da dupla fita de DNA ocorre sempre a partir de uma posio predeterminada, chamada
origem de replicao, conforme mostra a Figura 5.3. Nas bactrias os seus cromossomos circulares possuem
apenas uma origem de replicao; j nos eucariotos podem ocorrer mltiplas origens a partir da qual o DNA
inicia sua duplicao. Este stio de origem na verdade corresponde a uma dada seqncia de nucleotdeos que
pode ser reconhecida por algumas protenas, chamadas protenas iniciadoras, que se ligam ao DNA
quebrando as ligaes de hidrognio que unem as duas fitas, forando o DNA a se separar na forma de um Y.
A partir deste momento ocorre uma srie de interaes entre protenas especficas e o DNA para promover a
replicao.
Conforme mostrado na Figura 5.4, para possibilitar a
abertura da dupla fita de DNA, uma enzima chamada
topoisomerase liga-se a ele diminuindo a tenso causada pela
toro da dupla hlice. Essa enzima altera a forma da dupla
hlice deixando-a mais frouxa, facilitando o acesso para as
protenas seguintes. Uma enzima chamada helicase a
responsvel por desfazer as ligaes de hidrognio abrindo a
dupla hlice, requerendo para isso a hidrlise de ATP. A helicase
por sua vez associa-se primase, a enzima responsvel pela
iniciao da replicao do DNA. A primase na verdade uma
RNA polimerase, ou seja, ela utiliza o DNA como molde para
produzir um RNA. Esse RNA inicial chamado do primer e serve
de iniciador para a nova fita de DNA que ser formada. A enzima
responsvel pela continuao da duplicao do DNA a DNA
polimerase, que catalisa a formao das ligaes fosfodiester
entre a poro 5 dos deoxirribonucleotdeos (dNTPs) e o grupo

Figura 5.3: Origens de replicao. (Brown, 2002)
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 52
hidroxila 3 do DNA que est sendo formado. Desta forma a nova fita de DNA formada sempre sintetizada no
sentido 53. Desta forma uma das fitas novas de DNA ser sintetizada de forma contnua no sentido 53 a
medida que a dupla fita vai sendo desenrolada. A outra fita ser sintetizada um pouco atrasada, j que um
trecho de DNA de fita simples deve ser exposto antes que a nova fita de DNA possa ser iniciada. Uma srie
destes fragmentos, chamados fragmentos de Okazaki, sintetizada, cada um deles de 5 para 3. O primer,
formado de RNA posteriormente substitudo por DNA pela enzima DNA polimerase I, estendido a partir da
extremidade 3-OH do fragmento de Okazaki seguinte. Posteriormente estes fragmentos so unidos por uma
enzima chamada ligase, para formar um cadeia nica.


Figura 5.4: Replicao do DNA (http://oak.cats.ohiou.edu/~ballardh/pbio475/Heredity/DNA-replication.J PG)

Fazendo parte ainda da complexa maquinaria para a replicao do DNA existem as protenas de
ligao a filamentos nicos (em ingls, abreviadas por SSB, single-stranded binding), que se ligam aos
filamentos de DNA estabilizando o estado unifilamentar.
A replicao do DNA um processo fundamental para a clula, uma vez que atravs dessa
replicao que a informao gentica transmitida das clulas me para suas filhas. O processo
desencadeado sempre que a clula inicia a diviso celular.
A informao gentica contida no DNA, de tempos em tempos utilizada. Algumas partes da fita so
expostas e a seqncia torna-se disponvel para ser transcrita na forma de outra fita de nucleotdeos que tem a
funo de transportar a informao do ncleo da clula, onde se encontra o DNA, at o citoplasma, onde a
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 53
informao ser utilizada na sntese protica. O processo no qual a informao contida numa parcela especfica
do DNA, chamada gene, copiada na forma de um RNA mensageiro chamado de transcrio.

5.3. Transcrio do DNA

Neste processo a informao gentica copiada no ncleo celular dando origem a uma nova molcula
codificada chamada de RNA mensageiro (mRNA). O RNA mensageiro uma fita simples de ribonucleotdeos
numa seqncia complementar quela do DNA que lhe deu origem, conforme a Figura 5.5. A sntese do
mRNA catalisada pela enzima RNA polimerase. As
seqncias do DNA que daro origem a um mRNA
so chamadas de genes e correspondem a uma
seqncia de bases nitrogenadas precedidas por uma
regio promotora e finalizadas por um terminador.
A RNA polimerase capaz de reconhecer a regio
promotora do gene, ou seja, ela possui um stio de
reconhecimento de uma seqncia especfica que
sempre se encontra no incio de cada gene. O
promotor inclui o primeiro par de bases que
transcrito no RNA, e a partir da a enzima move-se ao
longo do DNA transcrevendo a seqncia e
sintetizando o mRNA, at que encontre outra
seqncia especfica, onde a transcrio termina o
terminador. O RNA formado incluir toda a seqncia
do gene e outras seqncias de sinalizao utilizadas
pela maquinaria celular.

Figura 5.5: Sntese da fita de RNA complementar ao gene codificado
no DNA (http://www.hort.purdue.edu/hort/courses/HORT250/
pict.gif%20images/l4%20rna%20transcription%20pict.gif
Assim como a replicao, a transcrio um processo complexo, catalisado por enzimas que
necessitam do acoplamento de vrias protenas, chamadas de fatores de transcrio, que so recrutadas e
reconhecem seqncias especficas do DNA, ligando-se a ele e favorecendo a ligao da RNA polimerase e,
conseqentemente, a transcrio do gene.
A transcrio de um gene, assim como a replicao, se d no sentido 53 do DNA. Convencionou-se
numerar a primeira base transcrita do gene como a base +1, sendo que os nmeros aumentam no sentido da
transcrio. A base anterior ao incio da transcrio numerada como -1, e os nmeros negativos progridem no
sentido 35. O incio da regio codificante no mRNA, em bactrias e algumas clulas eucariticas, se d com
uma trinca de nucleotdeos muito caracterstica, A-U-G.
O incio do processo de transcrio ocorre quando a RNA polimerase localiza a regio promotora do
gene, conforme mostra a Figura 5.6. A identificao das regies promotoras dos genes complicada e s
possvel atravs da comparao entre seqncias promotoras de vrios genes. Em bactrias estas seqncias
promotoras so bem caracterizadas e dentro da regio promotora encontram-se segmentos curtos altamente
conservados de uma espcie para a outra que so crticos para a transcrio. Pouco antes da base que ser o
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 54
incio da transcrio na posio entre as bases -18 e -9, encontra-se uma seqncia de 6 pares de bases que
reconhecvel em todos os promotores. Essa seqncia freqentemente chamada de TATA Box e nas
bactrias normalmente corresponde s bases TATAAT, com algumas possveis variaes. Outra seqncia
reconhecida na regio promotora de bactrias est localizada aproximadamente na posio -35 e chamada
de seqncia -35, com as bases TTGACA. Nos eucariotos estas seqncias variam de posio e na
composio, porm para que um gene seja transcrito necessria a existncia de uma regio promotora que
deve ser reconhecida pela RNA polimerase.
Em bactrias comum que vrios genes sejam regulados pela mesma regio promotora. Nestes casos
um segmento de DNA inclui o operador seguido de vrios genes que codificam para protenas diferentes que,
porm, esto geralmente ligadas ao mesmo processo celular. A este grupo de genes contguos controlados por
um nico operador d-se o nome de operon. As clulas eucariticas no apresentam operons no seu DNA.
Aps o reconhecimento da regio promotora e incio da transcrio o RNA alongado a medida que a
RNA polimerase desliza ao longo do DNA. Esse movimento promove a abertura da dupla hlice do DNA para
expor a seqncia de nucleotdeos que deve ser transcrita. Os nucleotdeos so adicionados atravs de
ligaes covalentes extremidade 3 da cadeia de RNA nascente. Ao final da transcrio a RNA polimerase
reconhece uma seqncia de bases especfica que determina o ponto final do processo. Esta seqncia
caracterstica chamada de seqncia de parada. Neste momento o complexo da transcrio desfeito,
liberando-se o RNA formado, e o molde de DNA volta a se condensar.


Figura 5.6: Transcrio do DNA (Adaptado de http://www.geneticengineering.org/chemis/Chemis-NucleicAcid/RNA.htm)

O mRNA formado contm toda a informao necessria para a sntese protica e, ainda, vrias
seqncias de nucleotdeos no codificantes, ou seja, seqncias que no correspondem a aminocidos na
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 55
traduo. Essas seqncias no codificantes, embora no contenham informao relativa aos aminocidos que
faro parte da protena, contm muitas informaes importantes na regulao do processo.
Nas bactrias, o mRNA sintetizado na forma funcional, sendo transcrito e traduzido no citoplasma
celular. Os dois processos esto muito intimamente ligados e podem inclusive ocorrer simultaneamente no
mesmo mRNA, ou seja, a traduo inicia no ribossomo antes mesmo que a transcrio termine, e ainda
podendo ocorrer com a participao de vrios ribossomos, ou seja muitas protenas iguais so formadas a partir
do mesmo mRNA, conforme apresentado na Figura 5.7. O RNA uma molcula muito instvel e sujeita a
hidrlise pelas enzimas RNAses. Sendo assim, sua vida til de poucos minutos.
Nas clulas eucariticas, o mRNA, chamado
de transcrito primrio, depois de sintetizado sofre
algumas modificaes ps-transcricionais, que
ocorrem ainda no ncleo celular, como mostra a
Figura 5.8. As extremidades do mRNA recm
transcrito so modificadas. Na ponta 5, assim que
formada, ocorre a adio de um cap, que consiste
de uma molcula de GTP (guanosina trifosfato) que
em seguida reage com uma molcula de S-adenosil-
metionina tornando-se metilada. O cap substitui o
trifosfato do transcrito inicial por um nucleotdeo
(guanosina) com orientao contrria (35)
protegendo assim a extremidade. A ponta 3 tambm
sofre um processamento, que consiste da adio de

Figura 5.7: Transcrio em clulas de procariotos.
Muitas vezes acoplada ao processo de traduo.
uma calda de adeninas, chamada de calda poli-A. A
seqncia de poli-A no est codificada no DNA, ela
adicionada no final da transcrio. A adio
catalisada pela enzima poli(A)-polimerase que
adiciona uma calda de aproximadamente 200
adeninas extremidade 3-OH do transcrito. A funo
da poli-A no mRNA, entre outras, de aumentar a
estabilidade desta molcula. Como j comentado
anteriormente, o RNA uma molcula bastante
instvel e tem pouco tempo de vida til. As RNAses
(endonucleases e exonucleases) esto
freqentemente controlando o tempo de durao de
cada RNA, sendo que as exonucleases degradam o
RNA no sentido 35. A existncia da calda poli-A
nesta extremidade acaba garantindo uma maior vida
til ao RNA, antes que sua parte codificante seja
degradada. Outras funes da calda poli-A tambm



Figura 5.8: Processamento do mRNA em clulas eucariticas.
(Adapatado de http://www.geneticengineering.org/chemis/
Chemis-NucleicAcid/RNA.htm).
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 56
esto sendo investigadas e acredita-se que ela tambm auxilie de alguma forma no processo de traduo.
O mRNA, nas clulas eucariticas, sintetizado contendo seqncias internas no codificantes,
chamadas ntrons. Por muitos anos pensou-se que esses ntrons correspondiam a seqncias lixo do DNA
e conseqentemente do RNA, hoje, porm, sabe-se que muitas informaes referentes regulao da
expresso gnica esto contidas nestas seqncias intrnicas e elas so to importantes para a clula quanto
s seqncias codificantes, chamadas de xons. O processo de remoo destes ntrons do mRNA chamado
de splicing, resultando num RNA menor (mRNA maturado), contendo uma seqncia codificadora contnua. A
posio exata do incio de um ntron e seu fim, dentro do gene, est indicado por uma seqncia particular de
bases que reconhecida pelas enzimas responsveis pelo processo de splicing. Comparando-se as
seqncias nucleotdicas do mRNA com a do gene estrutural, as junes entre os xons e os ntrons podem ser
determinadas. So seqncias pequenas, porm, bem conservadas, muitas vezes seguindo a regra GT-AG,
que diz que os ntrons comeam com o par de nucleotdeos GT e terminam com o par AG. Normalmente a
remoo dos ntrons de um dado transcrito primrio d origem a um nico tipo de mRNA maturado, porm
alguns genes seguem um padro de transcrio seguidos de processamento do mRNA diferentes, dando
origem a mais de uma seqncia de mRNA maturado para o mesmo gene transcrito. Nestes casos a retirada
das partes intrnicas pode ocorrer em vrias posies da seqncia, podendo inclusive ocorrer a omisso de
xons inteiros no mRNA maturado, conforme apresentado na Figura 5.9.



Figura 5.9: Splicings alternati vos de um mesmo transcrito primrio


Em alguns casos o padro de splicing descrito pelo transcrito primrio, porque o uso de diferentes
stios de incio e trmino da transcrio altera a localizao das junes. Outras vezes, de um mesmo transcrito
primrio so oriundos vrios mRNA maturados diferentes. Neste caso a regulao do padro de expresso final
feita por protenas, que se ligam ao transcrito primrio encobrindo seqncias e promovendo o splicing na
posio adequada.
Uma vez processado o mRNA segue ento para o citoplasma onde encontram-se os ribossomos. Essa
movimentao do mRNA do ncleo at o citoplasma regulada e promovida por complexos proticos
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 57
carreadores, que se ligam ao mRNA e aos mecanismos de transporte celular. Neste caso uma das protenas do
complexo carreador liga-se ao cap do mRNA.
Uma vez no citoplasma, o mRNA encontra-se com os ribossomos, onde ocorre a traduo.

5.4. Traduo do mRNA em protena

A traduo um processo que ocorre no citoplasma celular, nos ribossomos, e consiste da leitura da
informao contida no mRNA e a utilizao desta informao na sntese de uma cadeia polimrica de
aminocidos (polipeptdeos). O mRNA, constitudo de uma cadeia de ribonucleotdeos, interage no citoplasma
com os ribossomos, que so grandes partculas ribonucleoproticas, e com o auxlio dos RNA transportadores
(tRNA), que carregam os aminocidos, promovem a sntese protica, conforme ilustrado na Figura 5.10.




Figura 5.10: Sntese de protenas. O processo de sntese protica tem incio com a transcrio e termina na traduo do
mRNA. (Adaptado de http://oswego.org/staff/jbuckley/regentsprep/heredity/graphics/centraldogma.gif).


Os 20 aminocidos (aa) que formam as protenas ligam-se a tRNA especficos atravs de ligaes
covalentes entre a sua carboxila e o grupo hidroxila da ribose da extremidade 3 do tRNA (conforme mostra a
Figura 5.11).
A reao de acoplamento do aminocido ao tRNA uma reao endergnica, portanto, necessita de
energia para que ocorra. Assim, uma molcula de ATP requerida para formar o complexo ativo de um grupo
de enzimas, chamadas aminoacil-tRNA sintetases, que promovem esta reao, como mostra a Figura 5.12. A
enzima que catalisa a reao reconhece no tRNA uma trinca de nucleotdeos localizados na ala inferior da
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 58
conformao do tRNA, chamado anticdon (ver Figura 5.11). Cada tipo de tRNA possui um anticdon diferente
e esses anticdons podem ser relacionados aos aminocidos segundo o Cdigo Gentico Padro,
apresentado na Tabela 5.1.


Figura 5.11: RNA transportador (Adaptado de http://www.
ncbi.nlm.nih.gov/Class/NAWBIS/Modules/RNA/images/
fig_rna10.gif)

Figura 5.12: Formao do complexo tRNA-aminocido. (a) a enzima que
cataliza a reao de ativao do tRNA especfica para cada aminocido;
(b) o tRNA especfico para o aminocido reconhecido pela enzima; (c)
primeira etapa da reao: formao do aminoacil-AMP; (d) segunda etapa
da reao: formao do complexo tRNA-aminocido e liberao de AMP
(Adaptado de http://fig.cox.miami.edu/Faculty/Dana/tRNA.gif)



Ento, cada aminoacil-tRNA sintetase reconhece o anticdon do tRNA e o seu aminocido especfico,
de forma que no haver erros na sntese desses complexos tRNA-aa. No processo da traduo, a seqncia
de ribonucleotdeos do mRNA interage com o ribossomo de forma particular, e esse arranjo molecular
favorece a interao desse complexo com os tRNA, que vm carregando os aminocidos que faro parte
da protena final. Assim, o complexo formado entre o ribossomo e o mRNA funciona como uma pequena
unidade funcional onde entram e saem os tRNA trazendo os aminocidos que sero usados na sntese
protica.
O ribossomo formado de duas subunidades, como mostra a Figura 5.13, sendo que cada uma
formada de um rRNA e vrias protenas pequenas. O mRNA associa-se a subunidade menor, e durante todo o
processo de traduo aproximadamente 30 bases do mRNA ficam sempre ligadas quela subunidade. Na
subunidade maior encontram-se os stios de interao com os tRNA que chegam trazendo os aminocidos,
chamados stio A, que recebe o tRNA que est chegando, stio P, onde encontra-se o tRNA que est
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 59
carregando a cadeia polipeptdica e vai do-la em seguida para o tRNA do stio P, e ainda o stio E, onde
encontra-se o tRNA que est de sada do ribossomo.

Tabela 5.1: Cdigo gentico padro


O primeiro aminocido a fazer parte da
cadeia polipeptdica sempre a metionina
(tRNA(met)). Isso acontece porque o tRNA que
carrega esse aminocido tem como anticdon a
seqncia UAC, que pareia com a trinca UAG do
mRNA. Como j foi mencionado anteriormente a
trinca UAG corresponde ao incio da regio
codificante do mRNA.
A formao do complexo de transcrio se d
com a interao entre o mRNA, o tRNA(met) e a
subunidade menor do ribossomo. Essa interao
auxiliada por 3 protenas chamadas fatores de
iniciao (IF1,IF2 e IF3).

Figura 5.13: Esquema representativo do ribossomo e seus stios de
interao com o tRNA (Adaptado de http://staff.jccc.net/pdecell/
proteinsynthesis/translation/steps.html).

O mRNA liga-se subunidade menor do ribossomo atravs de sua extremidade 5, que possui uma
seqncia no codificante especfica, reconhecida pelo ribossomo. Em seguida, est o cdon de incio AUG
onde liga-se o tRNA(met). Todo este complexo ento ligado subunidade maior do ribossomo, na posio
exata, sendo que o tRNA(met) fica posicionado do stio P.
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 60
O complexo iniciador est formado e pronto para receber o prximo tRNA, que traz o segundo
aminocido codificado na fita do mRNA, que se ligar ao complexo atravs do stio A.
O incio da formao e o alongamento da cadeia polipeptdica se d pela formao de uma ligao
peptdica entre o aminocido que est ligado ao tRNA do stio P e o aminocido que est no tRNA do stio A.
Assim que a ligao ocorre o ribossomo move-se sobre a fita de mRNA e o tRNA que estava no stio A
deslocado para o stio P carregando a cadeia peptdica. O tRNA do stio P desloca-se para a sada do
ribossomo (stio E). Tanto a ligao dos tRNA aos stios P e A, como o seu deslocamento para os stios E e P,
so mediados pela existncia de uma molcula de GTP, que transfere energia para a reao, atravs da
quebra da ligao (hidrlise) do grupamento fosfato. O alongamento da cadeia polipeptdica auxiliado por dois
fatores de alongamento (EF-Tu e EF- G), que carregam a molcula de GTP.

A traduo termina quando no mRNA aparece
o cdigo de parada, que pode ser, conforme a Tabela
5.1, as trincas UAA, UAG ou UGA. Para estes cdons
no existe um tRNA correspondente para se acoplar ao
complexo ribossmico. Algumas protenas, chamadas
de fatores de liberao, reconhecem estes cdons de
parada e auxiliam no processo de trmino da traduo.
Ao final, o mRNA, as subunidades do ribossomo, as
protenas auxiliares e a cadeia polipeptdica recm
sintetizada so liberados.

conveniente ressaltar que as clulas
procariticas realizam a transcrio e a traduo da
informao gentica no citoplasma celular. J as
clulas eucariticas tm a transcrio
compartimentalizada no ncleo celular e o mRNA deve
ser exportado do ncleo para o citoplasma, onde
ocorre a traduo, conforme mostra a Figura 5.14.


Figura 5.14: Fluxo da informao gentica nos procariotos e
eucariotos (Adaptado de http://35.9.122.184/images/17-
FromGeneToProtein/).

Embora, aparentemente as clulas eucariticas paream mais especializadas e organizadas do que as
clulas procariticas, ambas as clulas possuem toda a informao de que necessitam para sobreviver, ou seja,
tanto as bactrias, como os eucariotos, unicelulares ou no, possuem no seu interior, uma organela detentora
da informao correspondente seqncia de todas as protenas existentes na clula. Como as protenas
(enzimas) so os catalisadores de todas as vias metablicas, tanto de catabolismo como de anabolismo,
necessrias para a obteno de energia e precursores e sntese de todos os compostos celulares, fica claro
que a vida est representada na molcula de DNA. Muito provavelmente a compreenso do significado de toda
Introduo Engenharia Genmica
Captulo 5 - Informao celular 2005 Serpa e Porto 61
a seqncia de nucleotdeos da molcula de DNA fornecer informaes importantes e fundamentais para a
compreenso de toda a evoluo e dos processos celulares. A compreenso desses processos e as possveis
alteraes que eles sofrem devido a mutaes na seqncia de algumas bases em genes especficos, podem
esclarecer as causas e abrir caminhos para tratamentos mdicos para muitas doenas.



Leitura Recomendada:
1. LEWIN, Benjamin. Genes VII. Porto Alegre: ARTMED, 2001.
2. MATHEWS, Christopher K; VAN HOLDE, K E; AHERN, Kevin G. Biochemistry. 3. ed. So Francisco:
Addison Wesley Longman, 1999.
3. Brown. T. A. Genomes. Oxford, BIOS Scientific Publishers, 2002

Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 62
6. Fundamentos de Genmica


Nos ltimos anos uma enorme quantidade de informao gentica tornou-se disponvel. O
sequenciamento de genomas, desde bactrias at o humano, abre caminhos para a pesquisa genmica, ou
seja, a compreenso dos fentipos a partir do conhecimento da seqncia gentica correspondente.
Desde a descoberta da estrutura da dupla hlice por Watson e Crick h 50 anos, ocorreram muitas
descobertas e muitos mtodos analticos foram implementados. Nos anos 60, com a descoberta do cdigo
gentico, a informao contida no DNA pde ser associada s inmeras protenas que compe a estrutura e o
metabolismo celular, De posse desta informao foi possvel associar cada protena ao seu gene e assim
iniciou-se a era de manipulao gentica, onde os genes passaram a ser objetos individualizados para o estudo
do metabolismo e das funes das protenas.
Nos anos 80 o desenvolvimento da Reao em Cadeia da Polimerase (PCR Polymerase Chain
Reaction), que permite gerar milhes de cpias de uma dada seqncia gentica ou gene in vitro, a
manipulao gentica, e o uso de bactrias como vetores de expresso de genes heterlogos abriram as portas
para o desenvolvimento de organismos geneticamente modificados (OGM) e o seu uso na pesquisa bsica e na
produo de produtos de interesse comercial, como por exemplo, a insulina recombinante. Nos anos 90, o
sequenciamento de genomas inteiros e o advento de tecnologias como os chips de MicroArrays (micro-arranjos)
para monitoramento da expresso gnica foram as grandes destaques.
Agora, no incio deste novo milnio, tem-se a disposio o genoma humano completamente
seqenciado e anotado automaticamente por softwares desenvolvidos exclusivamente visando varrer toda a
seqncia de nucleotdeos, mais de trs bilhes de pares de bases no caso do genoma humano, visando
identificar as regies codificantes, ou seja, os genes.
A comparao entre genomas de vrias espcies possibilitou determinar por analogia a utilidade de
muitos genes conhecidos, principalmente queles associados s vias metablicas principais e s funes vitais
das clulas. Porm, a maior parte dos genomas seqenciados at hoje composta de seqncias para as
quais ainda no se tem funo. Alm de supostos genes ainda no estudados, sabe-se que a maior parte do
DNA dos eucariotos composta de seqncias no codificantes, que embora no contenham a seqncia de
bases que correspondem a uma protena, contm seqncias importantes na regulao da expresso gnica.
O estudo dos genomas, tanto das partes codificantes como das no codificantes, o objeto de estudo
da Genmica. Aliada s tecnologias analticas disponveis a genmica estuda os genes, a da regulao da
expresso gnica e os mRNA transcritos de cada gene, conhecido como Transcriptoma, alm das diversas
protenas celulares, traduzidas destes mRNA, o Proteoma (Protemica). A interao das enzimas (protenas)
e dos metablitos e compostos celulares conhecido como Metaboloma (Metabolmica). O conjunto dessas
vertentes da Biologia visa propiciar a compreenso global do funcionamento e manuteno dos sistemas vivos
e sua correlao com os Fentipos (Fenmica) apresentados pelos diversos organismos.



Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 63
6.1. Genoma

O genoma todo o DNA (cido desoxirribonuclico) que um determinado organismo tem nas suas
clulas, com exceo de alguns vrus, cujo genoma constitudo de RNA. As clulas procariticas tm seu
genoma constitudo de seu DNA cromossmico (circular) e ainda podem possuir plasmdeos, pequenos
segmentos de DNA, tambm circular, que codificam para protenas especficas, que no esto codificadas no
DNA cromossmico e que normalmente esto ligadas a caractersticas de resistncia a antibiticos ou
condies adversas. J os eucariotos tm o seu DNA cromossmico e ainda o DNA das mitocndrias e dos
cloroplastos, que circular.
No caso do genoma humano o DNA cromossmico constitudo de aproximadamente 3 bilhes de
pares de bases e est arranjado em 24 cromossomos e num genoma mitocondrial circular. Os cromossomos
so de tamanhos diferentes, sendo que o menor deles possui aproximadamente 50 milhes de nucleotdeos e o
maior 263 milhes. O nmero de genes e a sua organizao em cromossomos variam de espcie para espcie,
como mostra o quadro 6.1.

Quadro 6.1: Nmero de pares de bases e cromossomos de alguns organismos modelo:
Organismo N
o
de bases N
o
de cromossomos
Amoeba dbia (ameba) 670.000.000.000 centenas
Mus musculus (camundongo) 3.454.200.000 20
Homo sapiens (homem) 3.200.000.000 24
Gallus gallus (galinha) 1.200.000.000 39
Musca domestica (mosca) 900.000.000 6
Lycopersicon esculentum (tomate) 655.000.000 12


A grande maioria das clulas humanas diplide, ou seja, possuem duas cpias de cada autossomo
(cromossomos 1 a 22) e ainda os cromossomos sexuais, no caso de machos (XY) e no caso de fmeas (XX).
J as clulas sexuais (gametas), so haplides, possuem apenas uma cpia de cada autossomo e um dos
cromossomos sexuais (X ou Y).
Os cromossomos tanto de bactrias como de eucariotos so formados por seqncias de nucleotdeos,
que podem ou no corresponder regies codificantes. Os mamferos de um modo geral possuem a maior
parte de todo o seu DNA composto por seqncias no codificantes, ou seja, seqncias que no sero
transcritas e traduzidas em protenas. No caso do genoma humano de 2 a 5 % de todo o DNA corresponde a
seqncias codificantes, o restante possui papel regulatrio, ou ento outras funes ligadas expresso
gnica. Bactrias e leveduras possuem um DNA com, em media, 85 e 70% respectivamente, de regies
codificantes.
Atualmente as pesquisas tm se concentrado na explicao das funes destas regies no
codificantes, uma vez que parece ser essa a grande diferena entre os genomas das diversas espcies.
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 64
Em relao composio do DNA, acredita-se que o percentual dos nucleotdeos GC e AT servem
como uma caracterstica especfica da espcie, e possvel correlacionar seus percentuais no DNA com a
evoluo de cada espcie.
Dos eucariotos, sabe-se que o percentual de GC maior nas regies codificantes, principalmente nos
xons de cada gene. J o percentual de AT maior nas regies no codificantes e intrnicas. Sabe-se tambm
que muitas seqncias codificantes (xons) so evolutivamente conservadas, porm nota-se uma grande
divergncia nas regies no codificantes, incluindo os ntrons. Uma explicao para esse fato est relacionada
com a fora da interao G-C e A-T As molculas de guanina e citosina, de fitas opostas, esto ligadas entre
si por trs ligaes de hidrognio, enquanto que as molculas de timina e adenina, apenas por duas ligaes de
hidrognio. Isso mostra que a interao GC mais forte do que a interao AT, o que dificulta a substituio de
uma guanina ou de uma citosina no momento da replicao do DNA, evitando assim variaes ou mutaes em
regies ricas em GC. J nas regies no codificantes, ricas em AT, as variaes so mais comuns, e muito
provavelmente essas variaes foram fundamentais na evoluo das espcies.
Outra caracterstica interessante o fato de mRNA ricos em GC serem mais resistentes s endo-
RNAses, que quebram o polmero na seqncia AU. Isso tambm justifica a predominncia de GC nas regies
codificantes que sero transcritas em mRNA.
No caso do genoma humano o percentual de GC igual a 41%, se considerarmos que o genoma
homogneo, porm sabe-se que em alguns cromossomos este percentual maior e em outros o percentual
menor, assim como a densidade gnica tambm diferente de um cromossomo para o outro.
A distribuio dos genes nos diversos cromossomos e sua conservao ao longo da evoluo, a
regulao da sua expresso nos diversos tipos celulares e a compreenso da diversificao dos genomas de
uma espcie para a outra, so assuntos abordados pela Genmica, uma cincia que vem ganhando destaque
no mundo cientfico e que visa elucidar as seqncias de DNA que esto sendo produzidas em larga escala
atualmente.


6.2. Genmica

As novas tecnologias, sobretudo as de alto rendimento (high throughput), que vm surgindo no cenrio
cientfico nas ltimas dcadas vm contribuindo para ampliar imensamente os bancos de dados de seqncias
genticas tanto de genes especficos como de genomas inteiros, a grande maioria disponveis publicamente na
Web. O sequenciamento de DNA pode ser feito de vrias maneiras, porm nos ltimos anos uma das tcnicas,
conhecida como mtodo didesoxi, foi amplamente desenvolvida, automatizada e atualmente utilizada em
larga escala, principalmente para o sequenciamento de genomas inteiros.
Nesta metodologia, uma cadeia simples do DNA a ser seqenciado serve de molde para gerar a outra
metade complementar da dupla fita. A reao de sntese realizada in vitro (por PCR), na presena da enzima
DNA polimerase e dos 4 nucleotdeos sob a forma de 3-desoxinucleotdeo trifosfatos (dNTPs): dATP, dCTP,
dGTP e dTTP. Como a DNA polimerase catalisa somente o alongamento da cadeia, necessria a presena
de um pequeno fragmento de DNA iniciador (primer), complementar a uma regio conhecida do DNA molde
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 65
na extremidade 3. Isso fornecer um ponto de partida para a
replicao do DNA. J unto com todos os elementos essenciais
para a sntese da segunda fita de DNA so adicionados quatro
dNTP sob a forma anloga, 2,3-didesoxinucleotdeo
trifosfatos (ddNTPs), (Ver na Figura 6.1), marcados com
fluorescncia de 4 cores diferentes. Estes anlogos,
conhecidos como terminadores, quando incorporados fita de
DNA, por no apresentarem 3OH que permita formar ligao
com o prximo dNTP a ser adicionado, bloquear o processo
de adio de nucleotdeos.
Desta forma os produtos finais do PCR sero vrias
fitas de DNA de tamanhos variados, uma vez que os
didesoxinucleotdeos so adicionados aleatoriamente pela

Figura 6.1: Forma anloga dos nucleotdeos
formadores do DNA. 2, 3-
didesoxinucleotdeo trifosfato (ddNTPs)
(Adaptado de http://educacao.genesisdbm.
com.br/sequenciamento.shtml)
Polimerase, porm, de todos os tamanhos possveis, conforme
mostra a Figura 6.2. Os fragmentos so separados por
tamanho por filtrao em gel. A ordem dos nucleotdeos, na
cadeia de DNA recm sintetizada obtida diretamente por um
sensor automtico na sada da coluna de gel do seqenciador
(Ver Figura 6.3). Um sensor capaz de detectar as quatro
fluorescncias diferentes percebe a passagem dos fragmentos
com as terminaes especficas. A fita de DNA sintetizada
complementar ao DNA que serviu de molde. Assim, possvel
conhecer a seqncia de nucleotdeos do DNA de interesse.
Este mtodo de sequenciamento automtico foi o que
possibilitou que o genoma humano fosse seqenciado antes do
prazo previsto no projeto. Muitos grupos de pesquisa tm se
dedicado a seqenciar genomas de interesse, desde bactrias
at os mamferos. Com isso ocorre um aumento exponencial do
nmero de seqncias disponveis nas bases de dados. Uma
das bases de dados mais utilizadas, a do NCBI (National
Center for Biotechnology Information -
http://www.ncbi.nlm.nih.gov/), registrava em 1990, 39.533
seqncias depositadas; em 2000, eram 10.106.023
seqncias, e em 2004, chegou a 40.604.319, conforme
apresentado na Figura 6.4, e esse nmero continua crescendo.
As inmeras seqncias disponveis so o objeto dos
estudos ps-genmicos que visam esclarecer a funo dos
genes e das seqncias no codificantes, que acredita-se
terem papel importante na regulao da expresso gnica.











Figura 6.2: Determinao da seqncia de nucleotdeos
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 66

Figura 6.3: Seqenciador automtico

Em projetos genoma adota-se a estratgia
de fragmentar o DNA do organismo a ser
seqenciado em pedaos pequenos, que possam ser
mais facilmente seqenciados, e depois se utilizam
programas computacionais para montar a seqncia
e reconstruir a informao gentica inicial. Todo esse
trabalho de montagem, determinao da localizao
e determinao da funo destas seqncias
codificantes ou de regulao, realizado com a
ajuda de programas de ltima gerao
especialmente desenvolvidos para a rea biolgica,
que deram origem a uma nova rea de estudo
chamada Bioinformtica (Captulo 7). Essa nova
cincia envolve diversas reas do conhecimento
engenharia de software, matemtica, estatstica,
cincia da computao e biologia molecular. A
bioinformtica tem sido imprescindvel na ordenao
e compreenso das seqncias genticas e cada
vez mais vai ser necessria na anlise dos dados
que ainda sero disponibilizados.


Figura 6.4: Crescimento do GenBank, banco de dados do NCBI
(http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html)

Uma vez obtidas as seqncias de nucleotdeos que compem o DNA do organismo estudado,
precisamos conhecer o significado de cada parte das seqncias. Essa parte do processo chamada de
anotao gnmica e consiste basicamente da identificao das seqncias que codificam para uma protena,
que so precedidas por uma regio promotora, caracterstica de cada organismo e possuem pequenas
seqncias de nucleotdeos caractersticas, como, a trinca de iniciao (ATG) e a calda poli-A. Na primeira
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 67
etapa da anotao, o trabalho praticamente feito apenas pelos computadores, que varrem a seqncia atrs
das regies promotoras e dos genes, utilizando programas especialmente desenvolvidos para este fim, por
exemplo o GenScan (http://genes.mit.edu/GENSCAN.html), desenvolvido pelo MIT - Massachusetts Institute of
Technology. Numa segunda etapa os genes, encontrados por esses programas de anlise, so comparados
com outros genes j identificados, na inteno de se encontrar homologias entre os genes de outras espcies e
assim supor a sua funo, que ser posteriormente investigada mais a fundo, computacionalmente, ou atravs
de experimentos de deleo ou silenciamento gentico, por exemplo. Esta etapa realizada num esforo
conjunto entre bioinformatas e fisiologistas que atuaro como curadores dos dados obtidos
computacionalmente.
Lembrando-se do dogma central da biologia molecular: DNA mRNA protena, pode-se estudar as
regras de expresso gnica, atravs do estudo dos mRNA transcritos nas clulas. Quando o foco do estudo
passa a ser o mRNA ao invs do DNA, elimina-se deste estudo todas as regies no codificantes e foca-se a
ateno apenas nos genes transcritos em determinado estado celular. Esses estudos vm esclarecer muitas
das regras da regulao da expresso gnica, j que rastreiam-se todos os mRNA produzidos numa dada
situao.
Em organismos eucariotos, cujos mRNA possuem calda poli-A, utiliza-se para a sua purificao a
cromatografia em coluna contendo poli-T imobilizados, que capturam os mRNA pela calda. Os mRNA so
muito instveis, porm utiliza-se a transcrio reversa para a reconstituio do pedao de DNA (cDNA)
correspondente ao transcrito purificado, que ento podem ser seqenciados, e o gene expresso pode ser
identificado e estudado. Esse procedimento tpico dos Projetos Transcriptoma, que ao invs de
seqenciarem o DNA completo dos organismos, estudam apenas os genes expressos (mRNA) ou parte deles,
as seqncias expressas conhecidas como EST (Expressed Sequence Tag). Esses projetos acabam sendo
mais baratos e rpidos de serem executados e continuam sendo muito teis para a identificao de genes.
Outra forma de anlise dos mRNA, conhecida como Microarrays (micro-arranjos), baseia-se no fato de
que RNA e DNA hibridizam-se. Nesta tcnica a existncia de mRNA, especficos nas clulas, so investigados
utilizando-se como sondas o DNA ou o cDNA do gene em questo. Como apresentado na Figura 6.5, as
sondas so fixadas em lminas de vidro, podendo chegar a milhares de sondas por lmina, e uma amostra
contendo os cDNA produzidos a partir dos mRNA a serem estudados incubada sobre a lmina. Aps o tempo
de incubao e lavagens apropriados, a placa lida em leitor especfico, para a identificao dos mRNA que
hibridizaram com as sondas.
Os dados lidos so analisados por programas computacionais especficos e os nveis de expresso so
determinados. Com essa tcnica pode-se determinar comparativamente os nveis de expresso de
determinados genes para a mesma clula em condies diferentes de crescimento. Muitos dados de
microarrays esto disponveis em bases de dados na Web (Veja, por exemplo, o Stanford Microarray Database
em http://genome-www5.stanford.edu) e estudos sobre o cncer tm ganho especial destaque, j que a
proliferao celular, tpica do cncer, envolve a expresso de genes diferentes, e a expresso destes genes
pode ser identificada e medida pelos microarrays.

Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 68

Figura 6.5: Esquema representativo das etapas envolvidas em experimentos com Microarrays (Adaptado de Palsson e Bhatia, 2003)



6.3. Regulao da Expresso Gnica

A molcula de DNA armazenada nas clulas contm toda a informao necessria para a criao de
uma nova clula ou um organismo completo, com vrias clulas diferenciadas. As diferentes fases de
desenvolvimento do organismo so marcadas por diferentes nveis de expresso de determinados genes. No
caso dos organismos superiores, a diferenciao celular, que se inicia no perodo embrionrio, regida pela
expresso gnica diferencial, ou seja, em determinados perodos do desenvolvimento. Grupos de genes
passam a ser expressos de formas diferentes. Nos estgios de desenvolvimento embrionrio dos organismos
as mudanas no fentipo so conseqncia dos nveis de expresso de conjuntos especficos de genes. Nos
perodos subseqentes, muitos dos genes que foram expressos no perodo embrionrio deixam de ser
expressos e outros novos passam a fazer parte do processo. As regras que coordenam essa expresso
diferenciada no so bem claras ainda, mas muitos avanos esto ocorrendo nesta rea da genmica que visa
estudar a regulao da expresso gnica.
Tanto nos organismos procariotos como nos eucariotos existem sistemas de regulao da expresso
dos genes. Muitos possuem uma regulao simplificada enquanto outros dependem da interao do DNA ou do
mRNA com vrias protenas e fatores regulatrios.
Os mecanismos de regulao incluem: alterao na velocidade de transcrio dos genes; tempo de
processamento do mRNA ainda no ncleo, estabilidade do mRNA no citoplasma, tempo e eficincia na
traduo do mRNA em protena, etc. Esses mecanismos so diferentes de um gene para o outro e, no caso de
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 69
genes conservados ao longo da evoluo, podem ter sua regulao semi ou parcialmente conservadas. Nota-
se, no entanto, que medida que os organismos tornam-se mais complexos, os sistemas de regulao da
expresso gnica tambm evoluem.

A estrutura de um gene no se
resume apenas a uma seqncia de
nucleotdeos que resultaro no mRNA
que ser traduzido posteriormente. As
regies no-codificantes prximas a
um gene, ou ento dentro dele, no
caso dos ntrons, podem conter
seqncias regulatrias.



Figura 6.6: Stio de incio de transcrio de genes eucariticos

As regies regulatrias so pequenas seqncias caractersticas de nucleotdeos que so reconhecidos
por protenas ou fatores regulatrios, chamados de fatores de transcrio (FT), que se acoplam nestes locais
viabilizando ou dificultado a expresso de um determinado gene. Essas regies regulatrias podem estar


Figura 6.7: Esquema representativo da atuao de um
enhancer na regulao da expresso de um gene.



localizadas imediatamente frente do gene, numa regio
chamada promotor ou regio promotora, formada por
vrios stios de ligao dos fatores de transcrio (TF),
onde tambm se encontra a TATA Box, como apresenta a
Figura 6.6, ou ento milhares de pares de base distante
do gene a ser regulado, como no caso dos enhancers,
que atuam como amplificadores da expresso gnica,
conforme mostra a Figura 6.7
Os organismos procariotos possuem um sistema de regulao de expresso bastante caracterstico,
onde alguns dos genes so organizados em operons. Um operon uma unidade de expresso gnica
coordenada, ou seja, uma forma de organizao dos genes de um organismo (procariotos) de tal forma que
vrios genes so regulados por uma mesma regio promotora (operador). Os genes presentes em um operon,
normalmente, esto correlacionados no metabolismo, fazendo parte de uma mesma via metablica. A
regulao do operon pode estar associada a outros genes, que codificam para protenas regulatrias ou para
enzimas que sintetizam um metablito regulador. Um exemplo muito caracterstico deste tipo de regulao o
operon Lac, apresentado na Figura 6.8, existente na E. coli. Culturas de E. coli quando submetidas a um meio
de cultura rico em lactose necessitam de enzimas especficas para degradar a lactose e utiliz-la como fonte de
carbono. As trs enzimas responsveis pela degradao da lactose esto codificadas em seqncia no DNA da
bactria e sob a mesma regio regulatria ou operador. Essa estrutura caracteriza o operon lac. O operon
possui, na regio regulatria, um stio de interao para uma molcula repressora. Esse repressor uma
protena codificada em outro gene, chamado gene I. Na presena de lactose, esta se liga protena repressora
e evita que ela interaja com a regio regulatria, inibindo a transcrio. Nos casos de ausncia de lactose, o
repressor liga-se ao DNA e impede a interao dos fatores de transcrio e da RNA polimerase.
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 70
(a)


(b)
Figura 6.8: O operon Lac Um exemplo de sistema de regulao em procariotos. (a) Na presena de lactose, o repressor inibido e h
transcrio do operon; (b) Na ausnciade lactose, o repressor liga-se ao operador do operon e reprime a transcrio (Adaptado de
http://www.phschool.com/science/biology_place/biocoach/lacoperon/effect.html)


As regies regulatrias so seqncias de nucleotdeos que foram altamente conservadas durante a
evoluo, e essa caracterstica auxilia muito no seu estudo e caracterizao. So comuns os estudos de
genmica comparativa, que utilizam ferramentas de bioinformtica para comparar seqncias e padres de
seqncias de DNA de determinados genes em espcies diferentes, visando a determinao e caracterizao
de stios de interao de fatores de transcrio.
Outra forma de regular a expresso de um gene est relacionada eficincia no transporte do mRNA
at os ribossomos e ao processo de traduo do mRNA em protena. A maquinaria responsvel pelo transporte
e pela traduo tambm envolve uma srie de protenas e fatores de traduo que se acoplam ao mRNA e ao
ribossomo para viabilizar o processo. A falta destes transportadores e fatores de traduo pode inviabilizar a
traduo e da mesma forma regular a expresso do gene, que embora tenha sido transcrito no seria traduzido,
e a protena codificada no seria produzida.
Os fatores de transcrio ligam-se s regies regulatrias de tal forma que favorecem o acoplamento da
RNA-polimerase na posio correta para reconhecer o incio do gene, onde deve ser iniciado o processo de
transcrio. Esses fatores modulam a expresso do gene que muitas vezes estes fatores so o produto do
metabolismo celular, ou ento da expresso de outros genes, pode-se compreender que a expresso gnica
resultado da interao harmoniosa de diversas vias metablicas e de vrios genes interligados. Deste modo fica
evidente que o estudo do genoma no se resume apenas identificao dos genes estruturais e suas regies
regulatrias mas, principalmente, de toda essa rede de interaes que est associada a cada gene e a todo o
metabolismo celular. Para isso muitas vezes necessita-se de dados que vo alm do genoma e do
transcriptoma. So necessrias pesquisas que revelem as interaes entre as molculas de DNA, RNA,
protenas e metablitos. Entra-se ento numa outra rea da Genmica que inclui o estudo das protenas de um
organismo e de suas interaes com outras molculas. A cincia que estuda todas as protenas existentes em
um organismo, visando compreender as causas e a regulao dessa expresso chamada de Protemica, e o
conjunto de protenas chamado de Proteoma. Seguindo-se ainda o raciocnio do dogma central da biologia
molecular pode-se dizer que se o objetivo estudar os genes expressos de um dado organismo e como essa
expresso afeta todo o sistema, o estudo e isolamento das protenas deste organismo refletem essa expresso
e podem revelar muitos dados importantes para a compreenso do genoma.
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 71
6.4. Protemica

Assim como um gene pode dar origem a diferentes mRNA, devido aos splicings altenativos, da mesma
forma nem sempre um mRNA dar origem a uma protena. Muitas so as protenas formadas por mais de uma
cadeia polipeptdica, ou seja, produto da traduo de mais de um mRNA. Sendo assim, nem sempre possvel
correlacionar de forma linear o produto da expresso de um gene com uma funo na clula. Nestes casos
mais interessante estudar diretamente as protenas existentes num dado organismo numa dada situao. Essa
abordagem mais direta do produto final da expresso de um ou mais genes, permite relacionar diretamente a
funo a uma determinada protena, o que muito til na elucidao de mecanismos celulares relacionados a
doenas e interaes moleculares dos compostos celulares com frmacos, por exemplo.

As estruturas complexas das protenas tornam muito mais difceis os estudos nesta rea,
principalmente no que se refere caracterizao das molculas. Alm disso, o nmero de protenas existentes
nos organismos muito maior do que o nmero de genes ou mRNA, devido aos splicings alternativos e s
modificaes ps-traducionais. No caso dos
humanos, as cerca de 100.000 protenas
estimadas so resultado da expresso de
aproximadamente 40.000 genes existentes no
genoma.
O estudo dessas protenas (proteoma)
parte da reunio de vrias tcnicas de purificao,
identificao e caracterizao de protenas que
vm sendo implementadas no mundo cientfico h
muitos anos.
A Figura 6.9 mostra um esquema clssico
para purificao e caracterizao de uma protena
de estudo. Essas tcnicas incluem: cromatografia
de afinidade, cromatografia lquida de alto
desempenho (HPLC), eletroforese 2D,
espectrometria de massa, ressonncia magntica
nuclear, alm de muitos recursos computacionais
para a armazenagem e interpretao dos dados
obtidos.
O estudo das protenas envolve a


Figura 6.9: Esquema clssico para o estudo de protenas
compreenso da estrutura primria (seqncia de aminocidos) da protena, e principalmente suas estruturas
secundrias e tercirias, que revelam regies catalticas e de interao com outras biomolculas e, quando
existir, a sua estrutura quaternria, que o resultado da interao de mais de uma cadeia polipeptdica.
Neste sentido, a bioinformtica vem auxiliando muito nas pesquisas de protemica, principalmente em
relao modelagem 3D das molculas de protena.
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 72
Alguns programas so capazes de prever a
estrutura 3D de protenas a partir da sua estrutura
primria, ou seja, da seqncia de aminocidos que
a compe. (por ex., HMMSTR em
http://www.bioinfo.rpi.edu/~bystrc/hmmstr/server.php).
Outros programas utilizam bancos de dados de
estruturas 3D de protenas (por ex., PDB Protein
Links interessantes:

Eletroforese bi-dimensional em gis de poliacrilamida:
http://us.expasy.org/ch2d/protocols/
Cromatografia lquida de alta eficincia e espectrometria
de massa
http://www.lcms.com/lcms_top.htm
http://i-mass.com/guide/tutorial.html

Data Bank em http://www.rcsb.org/pdb/), determinadas experimentalmente, para caracterizar por homologia,
utilizando softwares especficos (por ex., Modeller em http://salilab.org/modeller/; SWISS-MODEL -
http://swissmodel.expasy.org//SWISS-MODEL.html), estruturas de protenas desconhecidas ou que no
tiveram sua estrutura 3D determinada por difrao de raios-X ou ressonncia magntica nuclear (NMR).
O conhecimento da estrutura 3D das protenas muito valioso nos estudos de interao molcula-
molcula, ou enzima-substrato, onde se busca compreender as funes das protenas no metabolismo e
regulao das funes do organismo. Os estudos farmacolgicos tm na protemica uma grande ferramenta
para a compreenso da ao de inibidores e ativadores enzimticos e ligantes que permitam a produo e
purificao de novos princpios ativos para medicamentos.


6.5. Organismos Modelo

O sculo XXI chegou com a promessa de trazer consigo uma nova era nos estudos biolgicos. O
sequenciamento do genoma humano abriu inmeras portas para pesquisas em vrias reas, principalmente
mdica e farmacutica. Com certeza as pesquisas nestas reas sero cada vez mais vinculadas e fruto dos
conhecimentos gerados pelos estudos genmicos e ps-genmicos.
A biologia molecular e a bioinformtica vm evoluindo no sentido de desvendar as funes de cada um
dos genes encontrados no genoma, de sua expresso transcriptoma, e para compreender as formas e
funes das diversas protenas do proteoma humano.
Embora muitos organismos estejam sendo seqenciados, sendo muitos de interesse industrial, com
certeza o maior esforo ser feito na compreenso do genoma humano. E nesse esforo incluem-se os
sequenciamentos de animais modelo.
Animais modelo so espcies que tm sido largamente estudadas, normalmente devido facilidade em
sua criao e manuteno e algumas vantagens experimentais particulares. Esses animais foram utilizados ao
longo de vrios anos em estudos mdicos e farmacolgicos e muitos dados j foram acumulados e
correlacionados com caractersticas humanas. Sendo assim, interessante agora, na era genmica, que seus
genomas sejam seqenciados e seus gentipos sejam correlacionados com os fentipos antes estudados. Os
organismos modelo so utilizados para que seja possvel obter informaes sobre outras espcies, incluindo a
humana, que so mais difceis de serem estudados diretamente.
Dependendo do foco da pesquisa, organismos como a bactria Escherichia coli, a levedura
Saccharomyces cerevisiae, a mosca das frutas Drosophila melanogaster, o verme Caenorhabditis elegans,
Introduo Engenharia Genmica
Captulo 6 Fundamentos de Genmica 2005 Serpa e Porto 73
alm de mamferos, como o camundongo Mus musculus, o cachorro Canis familaris, o porco Sus scrofa, entre
outros, possuem seus genomas seqenciados e disponveis (http://www.ncbi.nlm.nih.gov) e podem ser
utilizados como organismos ou genomas de referncia.


Bases de dados de seqncias genmicas
E. coli: http://www.ncbi.nlm.nih.gov/genomes/chrom.cgi?db=G&gi=176
S. cerevisiae: http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932
D. melanogaster: http://www.ncbi.nlm.nih.gov/projects/genome/guide/fly/
C. elegans: http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=6239
M. musculus: http://www.ncbi.nlm.nih.gov/genome/guide/mouse/index.html
C. familaris: http://www.ncbi.nlm.nih.gov/genome/guide/dog/index.html
S. scrofa: http://www.ncbi.nlm.nih.gov/genome/guide/pig/index.html
H. sapiens: http://www.ncbi.nlm.nih.gov/genome/guide/human


Alm de suas vantagens experimentais e genticas, alguns organismos so utilizados como modelo
genmico devido posio que ocupam na rvore evolucionria.
Alguns organismos modelo, como o Fugu rubripes (peixe baiacu), por exemplo, possui um genoma
muito menor do que o humano, embora possua um grande nmero de genes homlogos aos genes humanos.
A diferena de tamanho nos genomas esta de forma geral relacionada presena de seqncias repetitivas de
nucleotdeos que de um modo gera no correspondem a genes, nem a regies regulatrias. A comparao dos
genomas do homem com o do baiacu tem sido utilizada nos estudos de localizao de seqncias regulatrias,
que tendem a ser conservadas ao longo da evoluo.
Em alguns casos necessrio que o organismo modelo esteja evolutivamente mais prximo do homem
ou da espcie em estudo. No caso do homem, um modelo mais prximo seria o camundongo (M. musculus) ou
o chimpanz (P. troglodytes) (http://www.ncbi.nlm.nih.gov/genome/guide/chimp/index.html) cujo genoma est
sendo sequenciado.
A genmica comparativa vem sendo muito favorecida com o aumento do nmero de genomas
seqenciados. Muitos avanos foram conseguidos devido comparao de genes ou conjunto de genes
humanos com genes homlogos de outras espcies.
A possibilidade de criao e manipulao gentica destes organismos possibilita a experimentao com
os gentipos, buscando sua correlao com determinados fentipos de interesse. No caso do homem, isso
possibilita estudos nas reas de terapia gnica e farmacogenmica, que no seriam possveis de outro modo.

Leitura Recomendada:

1. LEWIN, Benjamin. Genes VII. Porto Alegre: ARTMED, 2001.
2. MATHEWS, Christopher K; VAN HOLDE, K E; AHERN, Kevin G. Biochemistry. 3 ed. So Francisco:
Addison Wesley Longman, 1999.
3. PALSSON, B. O. and BHATIA, S. N. Chapter 8 - High-Throughput Biological Data in Tissue
Engineering. Prentice Hall, 2003.
4. KANEHISA, Minoru; Post-Genome Informatics. New York, Oxford University Press, 2000.
5. BROWN, T. A. Genome. 2 ed. BIOS Scientific Publishers. Oxford, 2002.
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 74
7. Encontrando e Analisando Genes

Os projetos genoma desenvolvidos nos ltimos anos tm fornecido cada vez mais informaes de
sequenciamento genmico. Seqncias de nucleotdeos so obtidas e organizadas diariamente e necessitam
serem analisadas e devidamente anotadas. Para esta tarefa muitos programas de computador foram e so
desenvolvidos e aprimorados. A Bioinformtica vm desempenhando um papel fundamental na compreenso
destas seqncias de quatro letras (ATCG) organizadas de forma to peculiar e que contm toda a
informao sobre as protenas celulares necessrias para a desenvolvimento e manuteno celular.
O primeiro desafio dos pesquisadores, aps a obteno do genoma completo do organismo,
determinar a localizao dos genes dentro do vasto nmero de nucleotdeos seqenciados. O processo de
localizao dos genes segue regras especficas para procariotos ou eucariotos, e utiliza programas especficos
que garimpam as seqncias funcionais a partir destas regras de organizao genmica.
A determinao das regies no codificantes, porm regulatrias, ou seja, que contm seqncias
conservadas de ligao de fatores que favorecem ou inibem a transcrio, tambm de extrema importncia
para a compreenso dos genomas.
Para a determinao da funo dos genes bem como para a localizao de regies conservadas entre
e inter espcies, so utilizados programas computacionais que alinham e comparam seqncias de
nucleotdeos desconhecidas com outras j caracterizadas, na busca por regies semelhantes, o que caracteriza
a Genmica Comparativa.


7.1. Comparao de Seqncias

O processo de anlise dos genes, seqncias de nucleotdeos, ou seqncias de aminocidos,
normalmente inicia com a comparao da seqncia em questo com outras seqncias j conhecidas. As
previses feitas por programas de predio de genes podem ser curadas atravs da comparao entre a
seqncia de nucleotdeos do suposto gene com outras seqncias ou genomas j conhecidos. Esse processo
de comparao de pares de seqncias normalmente j realizado automaticamente aps as etapas de
sequenciamento e predio de regies codificantes. Os genomas recm seqenciados so comparados com os
genomas disponveis nos diversos bancos de dados de genoma (por ex. o GenBank, do NCBI), os genes so
encontrados e sua funo estimada de acordo com o resultado da comparao.
A grande quantidade de dados disponveis sobre as seqncias biolgicas, permite-nos concluir que a
natureza conservadora, ou seja, ao longo da evoluo muitos genes foram mantidos nos genomas e suas
funes, numa grande quantidade de genes, foram mantidas originais. Com base nessa idia, a determinao
da similaridade entre as seqncias permite a correlao entre as informaes de genes conhecidos e outros
sob investigao, com uma flexibilidade razovel.
O primeiro passo na comparao entre seqncias de nucleotdeos, assim como tambm ocorre na
comparao entre a seqncia de aminocidos de duas protenas, o alinhamento. O melhor alinhamento
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 75
possvel aquele onde as duas ou mais seqncias a serem alinhadas esto dispostas, paralelamente, de tal
forma que o maior nmero possvel de unidades (nucleotdeos ou aminocidos) estejam coincidindo entre elas.
Na prtica o processo de alinhamento de seqncias feito atravs de programas especficos que
ordenam as seqncias e determinam uma pontuao para o alinhamento de acordo com padres biolgicos
aceitveis. Por exemplo, muitas vezes para que o alinhamento seja possvel necessita-se inserir alguns
espaos (gaps) entre as unidades. Esses gaps podem ter pontuao varivel, dependendo do padro de
pontuao utilizado. As possveis mutaes, trocas de unidades, so pontuadas negativamente e as
combinaes so pontuadas positivamente. As trocas, no entanto, podem ter pontuao variada. Algumas
mutaes so biologicamente mais aceitveis, onde a troca feita por unidades similares. Por isso utilizam-se
pontuaes diferenciadas entre as mutaes.
Na comparao de seqncias alguns termos so muito utilizados e, portanto, precisam ser definidos
para que no haja confuso. Os mais importantes so: identidade entre seqncias, similaridade entre
seqncias e homologia entre seqncias.
A identidade de uma seqncia refere-se ao alinhamento perfeito, do mesmo aminocido ou cido
nuclico na mesma posio de duas ou mais seqncias. A similaridade entre duas seqncias existe quando
ocorrem substituies, que possuem alguma probabilidade biolgica de ocorrncia. No caso de uma seqncia
de aminocidos, uma substituio entre aminocidos com caractersticas qumicas similares mais provvel do
que entre aminocidos com caractersticas diferentes. J homologia um termo que indica a relao evolutiva
entre as seqncias. Seqncias homlogas so aquelas que descendem de uma seqncia ancestral comum.
Quanto maior a homologia entre duas seqncias, maior a probabilidade de elas descenderem de uma mesma
seqncia ancestral.


7.1.1. Matrizes de Substituio
Para determinar a pontuao dos alinhamentos, os programas utilizam uma matriz de valores com as
probabilidades de ocorrer um par de resduos (aminocidos ou nucleotdeos) aleatoriamente ou como resultado
da evoluo. Essa matriz o resultado da avaliao estatstica do alinhamento entre seqncias conhecidas,
onde se podem determinar as probabilidades das mutaes, como elas ocorrem naturalmente. Os valores da
matriz de substituio so o resultado de uma relao entre a probabilidade de um resduo surgir
aleatoriamente em alinhamento de seqncias e a probabilidade de ocorrncia significativa de um par de
resduos em um alinhamento, ou seja, decorrente da evoluo. No caso das matrizes de substituio para
alinhamento de protenas, levam-se em considerao ainda as caractersticas qumicas dos aminocidos.
Dentre as matrizes de substituio mais usadas esto a PAM e a BLOSUM. A PAM (Point Accepted
Mutation) que baseada numa teoria evolucionria onde as mutaes observadas atravs do alinhamento
global de seqncias so analisadas, incluindo todas as regies do alinhamento, altamente e fracamente
conservadas. J a BLOSUM (Blocks Substitution Matrix) baseada unicamente nas regies altamente
conservadas dos alinhamentos. Sendo assim, a escolha da matriz pode influenciar muito o resultado obtido nos
alinhamentos de seqncias. A Figura 7.1 mostra um exemplo de matriz de pontuao de alinhamento para
seqncias de aminocidos.
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 76

Figura 7.1: Matriz PAM 250 para alinhamento de seqncias de aminocidos.

Alm das possveis trocas entre nucleotdeos e aminocidos nas seqncias de DNA, RNA ou
protenas, podem ocorrer inseres ou delees de resduos. Essas delees, no momento do alinhamento
devem ser compensadas com a insero de gaps em uma ou outra seqncia, para produzir o melhor
alinhamento entre elas. A Insero de um gap precisa valer a pena na pontuao geral do alinhamento, de tal
forma que ele s ser inserido se com isso aumentar a pontuao global do alinhamento. A maioria dos
programas de alinhamento penaliza os alinhamentos de tal forma que incluir um novo gap na seqncia deve
ter maior custo para o alinhamento do que aumentar um gap j existente. Por exemplo, para alinhamentos
utilizando a matriz BLOSUM 62 utilizam-se os valores -11 e -1, como pena para uma incluso ou um aumento
de gap, respectivamente.


7.1.2. Programao Dinnica
O mtodo de programao dinmica utilizado na resoluo de vrios problemas computacionais, e foi
introduzido por Needleman e Wunsch para resolver os problemas de alinhamento de seqncias.
Este mtodo utilizado quando h uma grande variedade de solues para o mesmo problema, como
o caso dos alinhamentos, porm, apenas uma delas (ou poucas) a melhor. O objetivo da programao
dinmica encontrar esta melhor soluo. Para isso o algoritmo divide o problema original em subproblemas
menores. Os subproblemas possuem uma dependncia seqencial, ou seja, a segunda parte s pode ser
resolvida se houver resposta para a primeira, ou, a quinta parte s poder ser resolvida depois da quarta. A
resoluo destas partes do problema gera resultados que so armazenados na forma de uma matriz de
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 77
pontuao e no final, o programa utiliza esta matriz para encontrar a melhor soluo para o problema original,
ou seja, aquela que resultar numa maior pontuao.
No alinhamento de seqncias, o problema consiste em determinar o melhor alinhamento possvel
entre elas. A soluo consiste em decidir se os resduos devem ser alinhados entre si, ou deve-se incluir um
gap na primeira ou na segunda seqncia, de modo que a melhor soluo seja obtida.
Suponha o alinhamento das seguintes seqncias LIMO e LMAO. Para alinhar estas seqncias
usaremos uma programao dinmica. Para tanto, as seqncias so dispostas na forma de colunas e linhas
de uma matriz, conforme a Figura 7.2.

Figura 7.2: Alinhamento de seqncias utilizando um algoritmo de programao dinmica.

O melhor alinhamento final obtido seguindo-se pelos elementos da matriz atravs do menor caminho
possvel, obedecendo a orientao das setas e buscando sempre passar pelos pontos onde h coincidncia
entre os resduos que representam a linha e a coluna (pontos em vermelho). Sempre que se segue pela
diagonal, no se insere nenhum gap nas seqncias; seguindo para a direita, insere-se um gap na seqncia
que representa as linhas; e seguindo-se para baixo, insere-se um gap na seqncia que representa as colunas.
Assim o melhor alinhamento seria:

L I M - O
L - M A O

A pontuao do alinhamento decorrente da soma das pontuaes de cada ponto percorrido no
trajeto. Os valores das matrizes de pontuao, para a programao dinmica, so definidos de forma
diferenciada, dependendo do tipo de alinhamento, global ou local.


7.1.3. Alinhamento Global
Uma das possibilidades de se efetuar um alinhamento entre seqncias de nucleotdeos ou
aminocidos faz-lo atravs de todo o seu comprimento. Esses casos de alinhamento so recomendados
para estudos de genomas completos na busca por regies homlogas. No alinhamento global, os valores da
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 78
matriz de substituio para nucleotdeos, normalmente, so valores fixos para um alinhamento perfeito ou um
no alinhamento, independente da base trocada. J para alinhamentos de aminocidos a matriz de substituio
construda a partir da freqncia de mutaes observadas entre aminocidos em seqncias homlogas que
refletem de certa forma os processos biolgicos de mutao e insero. As sries de matrizes PAM e BLOSUM
so as mais utilizadas nestes casos.
A construo da matriz de pontos da programao dinmica para o alinhamento global de seqncias
utilizando o algoritmo da programao dinmica feita para cada alinhamento. Os valores de cada elemento da
matriz de pontuao so determinados seguindo trs possibilidades:











onde, F a matriz da programao dinmica, s o valor referente a substituio, obtido de matrizes de
substituio e d o valor da penalidade para um gap.

Considere o seguinte exemplo:
i) Alinhamento global entre as seqncias AAG e AGC:
Considerar penalidade de -5 para cada gap.
Considerar a matriz de substituio:






Matriz de Programao Dinmica (PD):






( )
( )
( ) ( )
( )
( )

+
+
+
=
=
d j i F
d j i F
y x s j i F
j i F
F
j i
1 ,
, 1
, 1 , 1
max ,
0 0 , 0
( ) 1 , 1 j i F
( ) j i F ,
( ) j i F , 1
( ) 1 , j i F
d
d
( )
j i
y x s ,
( ) 1 , 1 j i F
( ) j i F ,
( ) j i F , 1
( ) 1 , j i F
d
d
( )
j i
y x s ,
2 -7 -5 -7 T
-7 2 -7 -5 G
-5 -7 2 -7 C
-7 -5 -7 2 A
T G C A
2 -7 -5 -7 T
-7 2 -7 -5 G
-5 -7 2 -7 C
-7 -5 -7 2 A
T G C A
C
G
A
G A A
C
G
A
G A A
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 79
O preenchimento da matriz PD seque as trs possibilidades apresentadas acima, iniciando na posio
(0,0) com o valor zero.












E assim, sucessivamente, a matriz formada:







O melhor alinhamento obtido percorrendo-se a matriz do canto inferior direito at o canto superior
esquerdo, passando pelas maiores pontuaes possveis. Quando se move para a esquerda, um gap inserido
na seqncia vertical, quando se move para cima, um gap inserido na seqncia horizontal, e na diagonal
usado um caractere de cada seqncia. Neste exemplo a pontuao para o alinhamento -6.








Os programas para alinhamento global de seqncias esto disponveis na Web e alguns podem ser
obtidos, diretamente, para funcionamento local. Cada programa possui uma indicao adequada e as
pontuaes e as penalidades so diferenciadas. Os alinhamentos globais podem ser feitos entre duas ou
mltiplas seqncias. Dentre os muitos programas disponveis pode-se citar:

C
G
2 -5 A
-5 0
G A A
C
G
2 -5 A
-5 0
G A A
( )
( )
( ) ( )
( )
( )

= + = +
= + = +
= + = +
=
=
5 ) 5 ( 0 1 ,
5 ) 5 ( 0 , 1
2 2 0 , 1 , 1
max ,
0 0 , 0
d j i F
d j i F
y x s j i F
j i F
F
j i
-6 -8 -8 -15 C
-1 -3 -3 -10 G
-8 -3 2 -5 A
-15 -10 -5 0
G A A
-6 -8 -8 -15 C
-1 -3 -3 -10 G
-8 -3 2 -5 A
-15 -10 -5 0
G A A
-6 -8 -8 -15 C
-1 -3 -3 -10 G
-8 -3 2 -5 A
-15 -10 -5 0
G A A
-6 -8 -8 -15 C
-1 -3 -3 -10 G
-8 -3 2 -5 A
-15 -10 -5 0
G A A
A A G
| |
A G C
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 80
ClustalW (http://www.ebi.ac.uk/clustalw/): programa de alinhamento de mltiplas seqncias de DNA
ou protena. Calcula o melhor alinhamento entre as seqncias selecionadas, sendo que as
identidades, similaridades e diferenas podem ser determinadas, como mostra a Figura 7.3..










Figura 7.3: Alinhamento de seqncia de aminocidos utilizando o programa ClustalW. As marcaes abaixo do
alinhamento correspondem a () alinhamento perfeito entre os dois aminocidos; (:) substituio de um aminocido por
outro com as mesmas caractersticas qumicas; () substituio de um aminocido por outro com caractersticas
diferentes.


T-Coffee (http://www.ch.embnet.org/software/TCoffee.html): programa de alinhamento mltiplo de
seqncias, mais indicado para seqncias com menos de 30% de identidade.

Dialign (http://dialign.gobics.de/): programa para alinhamento de seqncias que compara segmentos
inteiros sem penalizar os gaps. Essa metodologia especialmente eficiente nos casos em que as
seqncias no so inteiramente relacionadas, porm possuem algumas similaridades locais, como
ocorre na comparao de genomas inteiros de espcies filogeneticamente distantes.

MAVID (http://baboon.math.berkeley.edu/mavid/): um programa de alinhamento mltiplo de
seqncias de DNA. O programa integrado a outros programas de construo de rvores
filogenticas, de identificao de regies conservadas e de visualizao. MAVID no pode ser utilizado
para o alinhamento de protenas.


7.1.4. Alinhamento Local
O alinhamento local entre seqncias de nucleotdeos ou aminocidos consiste no alinhamento entre
partes das seqncias estudadas, de tal modo que se obtenha as melhores resultados de alinhamento. Esta
estratgia foi desenvolvida pelos Dr. Temple Smith e Dr. Michael Waterman e especialmente til quando
deseja-se pesquisar uma seqncia pequena e desconhecida de DNA num banco de dados contendo genomas
inteiros ou seqncias grandes. Nas seqncias de genes ou protenas, com alguma proximidade evolutiva,
normalmente os que se mantm conservados so pequenos segmentos homlogos, que servem como
indicativo da homologia que restou.
CLUSTAL W( 1. 82) mul t i pl e sequence al i gnment


gi | 4504349| r ef | NP_000509. 1| MVHLTPEEKSAVTALWGKVN- - VDEVGGEALGRLLVVYPWTQRFFESFGD 48
gi | 24209906| gb| AAN41264. 1| - MALSDAEKAALEPLFVKI DADAEKI GGEAMESLFQHHPDTKSHFTHM- - 47
: *: **: *: . *: *: : . : : : ****: *: : * *: . * :

gi | 4504349| r ef | NP_000509. 1| LSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLH 98
gi | 24209906| gb| AAN41264. 1| - - - - DVTPGSQDLKTHGGKI I HAI NDALNHYGKLQENLATLRDMHTNKLK 93
*. . *. . : *: ** *: : *: . *. * * . : *: . : *** : : * : **:

gi | 4504349| r ef | NP_000509. 1| VDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH 147
gi | 24209906| gb| AAN41264. 1| LSVDTI KLLCGCLLEVLVKHF- - - - PDVDKSACDKFLNEVAVALI SS- - 136
: . : . : : ** . *: **. : ** . : : * : *. : ** ** .
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 81
O algoritmo usado para o alinhamento local de seqncias muito parecido com aquele desenvolvido
para o alinhamento global, porm apresenta uma possibilidade a mais ao percorrer-se a matriz.













onde, F a matriz da programao dinmica, s o valor referente a substituio, obtido de matrizes de
substituio e d o valor da penalidade para um gap. No alinhamento local s e d so usados se a soma final
com o elemento anterior for maior que zero. Caso contrrio o valor do elemento da matriz ser zero.
No caso dos alinhamentos locais nunca a pontuao final negativa e os alinhamentos podem
comear em vrios pontos das seqncias, e no precisam percorrer toda a seqncia.

Considere o seguinte exemplo:
ii) Alinhamento local entre as seqncias AAG and GAAGGC:
Considerar penalidade de -5 para cada gap.
Considerar a matriz de substituio:




A Matriz de Programao Dinmica preenchida iniciando-se na posio (0,0) com o valor zero e
completando ainda toda a primeira linha e primeira coluna tambm com o valor zero. Isso possibilita que o
alinhamento local comece em qualquer ponto das duas seqncias, sem que seja penalizado por um gap.







( )
( )
( ) ( )
( )
( )

+
+
+
=
=
0
1 ,
, 1
, 1 , 1
max ,
0 0 , 0
d j i F
d j i F
y x s j i F
j i F
F
j i
( ) 1 , 1 j i F
( ) j i F ,
( ) j i F , 1
( ) 1 , j i F
d
d
( )
j i
y x s ,
0
2 -7 -5 -7 T
-7 2 -7 -5 G
-5 -7 2 -7 C
-7 -5 -7 2 A
T G C A
2 -7 -5 -7 T
-7 2 -7 -5 G
-5 -7 2 -7 C
-7 -5 -7 2 A
T G C A
0 G
0 A
0 G
0 C
0 G
0 A
0 0 0 0
G A A
0 G
0 A
0 G
0 C
0 G
0 A
0 0 0 0
G A A
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 82
Seguindo as quatro possibilidades apresentadas acima, segue-se completando a matriz, porm, os
valores de d e s s so somados aos valores dos elementos anteriores se a soma for maior que zero.










O resultado do alinhamento ser a soma obtida ao final do melhor alinhamento. No caso do exemplo, o
resultado do alinhamento apresentado ao lado seria 6.
Dentre os vrios programas de alinhamento existentes, destaca-se o BLAST, disponvel na Web na
pgina do NCBI (http://www.ncbi.nlm.nih.gov/BLAST/). O BLAST (Basic Local Alignment Search Tool)
apresenta um mtodo de pesquisa rpida para seqncias de nucleotdeos e protenas. O algoritmo do BLAST
determina alinhamentos global e local, fornecendo os alinhamentos das regies de similaridade, conforme
mostra a Figura 7.4.



Figura 7.4. Resultado de um alinhamento utilizando o programa BLAST.

Freqentemente utiliza-se um alinhamento local entre duas seqncias para determinar regies
conservadas de genes ou domnios especficos em protenas.

2 0 0 0 G
0 4 2 0 A
6 0 0 0 G
0 0 0 0 C
1 0 0 0 G
0 2 2 0 A
0 0 0 0
G A A
2 0 0 0 G
0 4 2 0 A
6 0 0 0 G
0 0 0 0 C
1 0 0 0 G
0 2 2 0 A
0 0 0 0
G A A
G A A G G C
| | |
A A G
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 83
7.2. Encontrando Genes

A localizao de genes nos diversos genomas um problema ligado compreenso estrutural das
seqncias de nucleotdeos. O genoma estruturalmente constitudo de seqncias organizadas em padres
que podem ser preditas, e dessa forma os genes que possuem um padro estrutural caracterstico podem ser
localizados. J a compreenso funcional de cada gene envolve a investigao experimental ou ento atravs
de comparaes com outros genomas seqenciados.
O gene formado por uma seqncia de nucleotdeos que codifica para uma protena ou RNA
especfico. Essa seqncia funcional precedida por uma regio promotora caracterstica e, no caso dos
eucariotos, seguida por uma seqncia que indica a calda poli-A. A regio codificante inicia normalmente com
o cdon ATG e termina com um dos cdons de parada.
Para iniciar a anlise de uma seqncia de DNA, visando identificar o incio de um gene, necessrio
estabelecer critrios de leitura desta seqncia visto que, como j mencionado, os genes normalmente iniciam
com uma seqncia (cdon) caracterstica (ATG) e o cdigo gentico envolve sempre trs bases para
especificar um determinado aminocido. Deste modo, qualquer seqncia de DNA ou mRNA possui
potencialmente seis quadros de leitura.

Quadro 1: comea com a primeira base na extremidade 5 da seqncia.
A quarta base na seqncia a primeira base do segundo cdon do quadro 1, e assim
por diante.
Os cdons precisam comear nos resduos 1, 4, 7, ..., etc, para permanecerem no
quadro 1.
Quadro 2: comea com a segunda base na extremidade 5 da seqncia.
Os cdons neste quadro comeam nos resduos 2, 5, 8, ..., etc.
Quadro 3: comea com a terceira base na extremidade 5 da seqncia.
Os cdons neste quadro comeam nos resduos 3, 6, 9,..., etc.
Quadros 4, 5 e 6: seguem o mesmo princpio que os 3 primeiros, porm iniciando a leitura na
extremidade 3. Isso importante para os casos em que os genes esto localizados nas fitas
reversas do DNA.

Um quadro aberto de leitura (ORF- Open Reading Frame) no DNA ou mRNA uma srie de cdons
adjacentes, comeando por um cdon de incio (ATG) e terminado com um cdon de parada (TAA, TAG ou
TGA), conforme mostra o esquema da Figura 7.5.



Figura 7.5: Representao de um ORF


Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 84
No caso dos organismos procariotos, os ORF correspondem a um gene, uma vez que a estrutura dos
genes procariotos no envolve a existncia de ntrons, ou seja, o gene no sofre modificaes ps-
transcricionais. J no caso dos eucariotos no se pode afirmar que todos os xons que formaro o mRNA faro
parte do mesmo quadro de leitura, o que dificulta um pouco a localizao dos genes.
Para isso existem programas disponibilizados na Web, como o caso do ORF Finder, disponvel no
site do NCBI (http://www.ncbi.nlm.nih.gov/gorf/gorf.html), que basicamente foi desenvolvido para identificar
regies do DNA que dentro de um mesmo quadro de leitura iniciam com ATG e terminam com um cdon de
parada, apresentando ao usurio dados de sada, conforme a Figura 7.6.




















Figura 7.6: Sada do ORF Finder.
Identifica todos os ORF possveis nos 6
quadros de leitura possveis. Os OFS
esto marcados em verde no quadro e
sua localizao exata est indicada nas
colunas ao lado. Assim como o nmero
do quadro de leitura (+1, +2 e +3) no
sentido 5-3 e (-1, -2, -3) no sentido 3-5


O ORF Finder apresenta, como dados de sada da sua pesquisa, todos os ORF possveis encontrados
na seqncia de nucleotdeos fornecida, para todas as seis possibilidades de leitura, nos dois sentidos da fita, e
apresenta tambm uma tabela com a localizao exata do ORF na seqncia.
Outros programas de predio de genes combinam mtodos de reconhecimento de padres e de
contedo das seqncias fornecidas. Os mtodos de contedo para a predio do gene so vantajosos, pois a
distribuio dos nucleotdeos nos genes diferente da distribuio encontrada nas regies intergnicas. Essas
dedues por contedo, logicamente, podem variar muito de espcie para espcie e, portanto, necessitam
serem utilizadas de forma adequada.
Esses programas tambm esto disponveis na Web, como o caso do GENSCAN, disponvel no site
do MIT em http://genes.mit.edu/GENSCAN.html). O GENSCAN combina informaes sobre estatsticas de
contedo com um modelo de probabilidade de estrutura de genes, e percorre a seqncia fornecida em busca
de regies promotoras, de xons e de regies marcadas para a calda poli-A. O resultado da pesquisa
apresentado como na Figura 7.7, e traz os possveis genes devidamente localizados com a pontuao de cada
xon ou sinal encontrado, o que serve como indicao da relevncia ou no do gene encontrado (Figura 7.7.a).
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 85
O GENSCAN ainda apresenta a predio da seqncia de aminocidos (protena) codificada nos genes
encontrados (Figura 7.7.b).
Para avaliar essas predies necessrio compreender como elas so feitas e principalmente entender
as diferenas de predio de genes de procariotos e eucariotos, devido a existncia dos ntrons.



(a)



(b)



Figura 7.7.: (a) Resultado de uma pesquisa com o
software GENSCAN. Gn.: nmero do gene; Ex: nmero
do xon; Type: Init =xon inicial, Intr=xon interno,
Term = xon terminal, Sngl= xon nico, Prom=
Promotor, PlyA=sinal para calda poli-A; S: sentido de
leitura; Begin: comeo do xon ou sinal; End: trmino
no xon ou sinal; Len: comprimento do xon ou sinal;
Fr: quadro de leitura; I/Ac : pontuao relativa ao sinal
de iniciao ou splice da extremidade 3 do xon; Do/T:
Pontuao pelo splice na regio 5 do xon ou sinal de
terminao; CodRg: Pontuao pela regio codificante;
P: probabilidade de existncia do xon; Tscr: pontuao
final do xon (dependente do tamanho, I/Ac, Do/T e
CodRg); (b) Predio da suposta protena codificada no
gene encontrado.

No caso dos eucariotos, o primeiro xon do pr-mRNA (ou gene) vai do incio da transcrio (o stio
cap, resduo nmero 1 do pr-mRNA) at o primeiro ntron. A TATA Box, da regio promotora, est tipicamente
a cerca de 25 resduos acima no DNA genmico, a partir (acima) do incio da transcrio. A TATA box est na
seqncia de DNA do gene, mas no na seqncia do pr-mRNA correspondente. O primeiro xon
normalmente consiste da 5' RNT (Regio No Traduzida 5') mais a primeira regio codificante (CDS)
(comeando com ATG). A primeira CDS, portanto, comea em algum lugar no interior do primeiro xon.
ntrons e xons alternam-se, ento, ao longo do pr-mRNA (ou gene). Os xons internos so, com raras
excees, sempre CDS. O ltimo xon vai do ltimo ntron at o stio de poli-adenilao. O ltimo xon
normalmente consiste da ltima CDS (terminando com o cdon de parada) mais a RNT 5'. A ltima CDS,
portanto, termina em algum lugar no interior do ltimo xon.
Em alguns programas, como o caso do GENSCAN, a caracterizao de um gene inclui localizar a
fronteira exata xon/ntron. As previses do GENSCAN so baseadas em vrios fatores. Estes incluem:
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 86
Motivos (motifs) caractersticos de seqncias, associados com propriedades do gene (por ex., stio
promotor TATA box antes do incio da transcrio, sinal de poli-adenilao AATAAA antes do stio de
poli-adenilao).
Stio de consenso de segmentao do doador (Splice donor site consensus): (para humanos)
AG/gtaagt [onde gt o incio (extremidade 5') do ntron].
Stio de consenso de segmentao do receptor (Splice acceptor site consensus): (para humanos)
(y)10ncag/G (onde ag a extremidade 3' do ntron, y(10) =10 resduos de pirimidina (c,t), e n =
qualquer nucleotdeo)
Os ntrons raramente, mas ocasionalmente, ocorrem nas RNT 5' e 3'.

Em contraste, o ORF Finder no se preocupa de forma nenhuma com as fronteiras exatas xon/ntron.
Naturalmente, as previses feitas por esses programas, uma vez que so fruto de um algoritmo
preditivo, no so totalmente confiveis e devem ser analisadas e curadas atravs de tcnicas experimentais e
de genmica comparativa.


7.3. Predio de Regies Regulatrias

O estudo dos genomas atualmente no se resume mais na determinao das regies codificantes
(genes) e suas funes, considerando todo o restante como DNA lixo. Esse conceito de que a parte
importante dos genomas so apenas os genes foi substitudo por outro mais realista que parte do princpio de
que muitas regies no codificantes do DNA so indispensveis para que ocorra a expresso de certos genes.
Genes relacionados com o perodo de desenvolvimento embrionrio, com algumas vias metablicas
secundrias, com o sistema hormonal, e muitos outros genes que devem ser expressos apenas em condies
pr-determinadas, necessitam de um sistema de regulao de sua expresso. Essa regulao est associada
com fatores de transcrio que se ligam a regies especficas (stios) do DNA e controlam, amplificando ou
restringindo, a transcrio desses genes.
Nos ltimos anos muitos mtodos computacionais foram desenvolvidos visando predizer possveis
regies regulatrias de genes, porm a predio desses elementos tem se mostrado muito mais difcil do que a
predio de genes. Isso porque os stios de ligao de fatores de transcrio (TFBS - Transcription Factor
Binding Sites) so em geral muito curtos, a maioria de 612 pares de bases, o que aumenta a sua ocorrncia
ao longo de uma seqncia de DNA, porm nem sempre atuando realmente como um TFBS. So vrias as
condies necessrias para que os fatores de transcrio liguem-se ao DNA, e no apenas a existncia do stio
certo. Muitas vezes a ligao de um fator est relacionada ligao prvia de outros fatores. O problema maior
que estas condies nem sempre so conhecidas. Tem se demonstrado tambm que apenas entre quatro ou
seis bases dentro de cada TFBS so totalmente conservadas, entretanto em outras posies, que so muito
variveis de gene para gene. Tudo isso dificulta muito a caracterizao desses TFBS. Numa tentativa de
diminuir os erros de previso, os TFBS so freqentemente modelados usando-se uma matriz de pesos de
posies especficas (PWM position-specific weight matrices) que rene as freqncias relativas de cada
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 87
um dos quatro nucleotdeos em casa posio de uma dada regio de consenso, como mostra a Figura 7.8, que
apresenta uma matriz do tipo PWM para o fator de transcrio humano GATA-1.
Dada uma matriz PWM pode-se varrer uma seqncia de DNA em busca de potenciais stios de
ligao para fatores de transcrio. Porm muitas vezes os resultados encontrados so falsos positivos, que
no tm nenhuma funo biolgica. Muitas estratgias so empregadas na tentativa de reduzir esses falsos
positivos, incluindo, entre outras, o uso de genmica comparativa, ou seja, comparando seqncias de
espcies diferentes em busca de regies conservadas, e nestas regies conservadas buscando os TFBS.









Figura 7.8: Matriz de pesos de posies. A
seqncia que tem sido caracterizada
experimentalmente como um stio de ligao
do fator de transcrio GATA-1 tem 14
posies, das quais apenas 6-10 so
totalmente conservadas (Modificada de
http://www.gene-regulation.com/cgi-bin/pub/
databases/ transfac/getTF.cgi?AC=m00127).

Estudos mostram que as regies encontradas, atravs de experimentos biolgicos, e indicadas como
um stio de ligao para um fator de transcrio, tm se localizado normalmente em uma regio que se
conserva nos genomas ao longo da evoluo. Assim sendo, as pesquisas mais recentes que visam localizar
TFBS incluem a comparao da seqncia de estudo com outras seqncias homlogas j caracterizadas, ou
sobre as quais se tenham informaes teis. Para estes estudos normalmente utiliza-se a comparao com
seqncias obtidas dos genomas seqenciados de organismos modelo.
O processo inicia-se com o alinhamento (global ou local) das seqncias atravs de programas
adequados em busca de regies no codificantes conservadas. Essas regies conservadas so ento
analisadas em busca de seqncias de consenso, que so seqncias tpicas e conservadas que
caracterizam os stios de ligao de fatores de transcrio.
Essas regies podem localizar-se na RNT 5 prximas do gene, o que caracteriza a regio promotora,
ou ento distantes, ou a at milhares de pares de base do gene que elas regulam, caracterstica tpica dos
enhancers ou amplificadores da transcrio. Em alguns casos, os TFBS podem estar localizados aps o gene
na regio 3 no traduzida, ou at mesmo nos ntrons.
Existem vrios programas disponveis na Web para alinhamento de seqncias e outros tantos que
executam uma pesquisa nas seqncias em busca de TFBS (Ver quadro 7.1). A base de dados mais utilizada
nestas buscas de TFBS a base TRANSFAC, que uma base de dados de fatores de transcrio de
eucariotos e seus stios de ligao no DNA.
Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 88






:

Quadro 7.1: Pginas na Web de pesquisa de TFBS

TRANSFAC - http://www.gene-regulation.com/pub/databases.html#transfac
Match - http://www.gene-regulation.com/cgi-bin/pub/programs/match/bin/match.cgi
P-Match - http://www.gene-regulation.com/cgi-bin/pub/programs/pmatch/bin/p-match.cgi
COMPEL - http://compel.bionet.nsc.ru/new/compel/compel.html
TRRD - http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/
Tess - http://www.cbil.upenn.edu/tess/
Consite - http://mordor.cgb.ki.se/cgi-bin/CONSITE/consite/
Vista - http://genome.lbl.gov/vista/index.shtml



Alguns programas disponveis, como o caso do Vista, disponibilizam ferramentas que alinham as
seqncias (mVista) e uma outra que varre as seqncias em busca de stios de ligao de fatores de
transcrio que esto alinhados ou conservados nas duas seqncias. No caso do programa Vista, a sada do
resultado de alinhamento feita atravs de um browser interativo. Uma vez realizado a alinhamento, pode-se
escolher regies especficas para anlise quanto a existncia de TFBS. A Figura 7.9 apresenta um exemplo de
resultado de alinhamento feito com mVista.



Figura 7.9: Resultado de um alinhamento utilizando o programa mVista (http://genome.lbl.gov/vista/mvista/submit.shtml). O picos
apresentados na figura representam as regies conservadas entre as duas seqncias analisadas (com mais de 50% de
homologia). esquerda na figura encontram-se o quadro de comandos e a legenda.

Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 89
Na busca por TFBS utiliza-se a ferramenta rVista, que varre as seqncias (at 20 Mbp) em busca de
regies conservadas (representadas pelos picos na Figura 7.9) que contenham stios de ligao para os fatores
de transcrio. A Figura 7.10 apresenta um esquema ilustrando o processo de busca e os resultados obtidos.
O resultado do rVista pode ser visualizado atravs do browser interativo, de onde se obtm o grfico
demonstrativo dos stios de ligao de fatores de transcrio encontrados nas regies conservadas, e tambm
um arquivo texto contendo os alinhamentos onde ficam indicados os TFBS encontrados.


Figura 7.10: Esquema ilustrando o processo de busca e os resultados do programa rVista.


Esse processo de comparao genmica obviamente sujeito a erros e falsos positivos, porm
caracteriza-se como uma importante ferramenta de previso que auxilia na escolha dos experimentos biolgicos
a serem realizados visando confirmar essas previses.

Introduo Engenharia Genmica
Captulo 7 Encontrando e Analisando Genes 2005 Serpa e Porto 90
Leitura Recomendada:

1. KANEHISA, Minoru; Post-Genome Informatics. New York, Oxford University Press, 2000.
2. GIBAS, C., J AMBECK, P. Desenvolvendo Bioinformtica. Ed. Campus, Rio de J aneiro, 2001.
3. BROWN, T. A. Genome. 2 ed. BIOS Scientific Publishers. Oxford, 2002.
4. LEWIN, Benjamin. Genes VII. Porto Alegre: ARTMED, 2001.