You are on page 1of 91

CHƯƠNG 4

BIỂU HIỆN GEN VÀ NGHIÊN CỨU


CÁC GEN ĐÃ TÁCH DÒNG
4.1 C¬ së lÝ thuyÕt cña biÓu hiÖn gen (gene expression

4.2 Vector biÓu hiÖn gen


- Promotor

- Terminator

- Ribosome binding

4.3 Nghiªn cøu c¸c vật chủ để biểu hiện


(các vật chủ: procaryote, eucaryote: nấm men,
nấm mốc, thực vật)

4.4 Nghiªn cøu c¸c gen ®· biÓu hiªn


(C¸c yÕu tè ¶nh h­ëng ®Õn biÓu hiÖn gen)
4.1 C¬ së lÝ thuyÕt cña biÓu hiÖn gen (gene
expression)

Tất cả các gen đều có thể được biểu hiện để xác định
chưc năng của gen.
Quá trình biểu hiện qua hai bước chính:

- Thông tin của gen ở ADN đươc phiên mã thành m ARN

- mARN đươc dịch mã chuyển thành protein


Regulation of gene expression
Promoter Gene (red) with an intron (green)
1. DNA replication Plasmid single copy vs. multicopy
plasmids
2. Transcription
Primary mRNA degradation
transcript
3. Posttranscriptional
processing
Mature
mRNA
4. Translation

inactive Protein degradation


protein
5. Posttranslational
processing
active
protein
Seven Processes That Affect the
Steady-State Concentration of a
Protein
Control of Gene Expression
• Controlling gene expression is often
accomplished by controlling transcription
initiation.

• Regulatory proteins bind to DNA to


either block or stimulate transcription,
depending on how they interact with RNA
polymerase.
Prokaryotic Regulation
• Control of transcription initiation can be:
– positive control – increases transcription
when activators bind DNA
– negative control – reduces transcription
when repressors bind to DNA regulatory
regions called operators
Prokaryotic Regulation
• Prokaryotic cells often respond to their
environment by changes in gene
expression.
• Genes involved in the same metabolic
pathway are organized in operons.
• Some operons are induced when the
metabolic pathway is needed.
• Some operons are repressed when the
metabolic pathway is no longer needed.
RNA Polymerase Binding to
Promoters Is a Major Target of
Regulation
• RNA polymerases bind to promoter sequences
near the starting point of transcription initiation.

• The RNA pol-promoter interaction greatly


influences the rate of transcription initiation.

• Regulatory proteins (transcription factors) work to


enhance or inhibit this interaction between RNA
pol and the promoter DNA.
A Consensus Sequence Is Found
in Many E. Coli Promoters
• Most bacterial promoters include the conserved
–10 and –35 regions that interact with the 
factor of RNA polymerase.
– Substitutions in this –10 to –35 region usually reduce
the affinity of RNA Pol for the promoter.
• Some promoters also include the upstream
element that interacts with the  subunit of RNA
polymerase.
Mechanisms to Regulate
Transcription in Bacteria
• Use of σ factors
– recognize different classes of promoters
– allows coordinated expression of different sets of genes
• Binding other proteins (transcription factors) to promoters
– recognize promoters of specific genes
– may bind small signaling molecules
– may undergo posttranslational modifications
– protein’s affinity toward DNA is altered by ligand binding or
posttranslational modifications
– allows expression of specific genes in response to signals in the
environment
Small-Molecule Effectors
Can Regulate Activators
and Repressors
• Repressors reduce RNA Pol-promoter
interactions or block the polymerase.
– bind to operator sequences on DNA
• usually near a promoter in bacteria but further away in many
eukaryotes
• Effectors can bind to repressor and induce a
conformational change.
– change may increase or decrease repressor’s affinity
for the operator and thus may increase or decrease
transcription
Activators Improve Contacts
Between
RNA Polymerase and the
Promoter
• Binding sites in DNA for activators are called
enhancers.
• In bacteria, enhancers are usually adjacent
to the promoter.
– often adjacent to promoters that are “weak” (bind
RNA polymerase weakly), so the activator is
necessary
• In eukaryotes, enhancers may be very
distant from the promoter.
Negative Regulation
• Negative regulation involves repressors.
– Example: Repressor binds to DNA and shuts down
transcription
– Alternative: Signal causes repressor to dissociate
from DNA; transcription induced

Despite opposite effects on


transcription, both are
negative regulation
Positive Regulation
• Positive regulation involves activators.
• Enhance activity of RNA polymerase
• Activator-binding sites are near
promoters that weakly bind
RNA Pol or do not bind at all.
• It may remain bound until a
molecule signals dissociation.
• Alternatively, the activator may
only bind when signaled.
DNA Looping Allows Eukaryotic Enhancers
to Be Far from Promoters

• Activators can influence


transcription at promoters
thousands of bp away.
• How? Via formation of DNA
loops
• Looping can be facilitated by
architectural regulator
proteins.
• Co-activators may mediate
binding by binding to both
activator and RNA
polymerase.
Prokaryotic Regulation
• The lac operon contains genes for the
use of lactose as an energy source.
• Regulatory regions of the operon include
the binding site, promoter, and the
operator.
• The coding region contains genes for 3
enzymes:
 -galactosidase, permease, and
transacetylase
Many Bacterial Genes Are Transcribed And
Regulated Together in an Operon

• An operon is a cluster of genes sharing a


promoter and regulatory sequences.
– Genes are transcribed together, so mRNAs are
several genes represented on one mRNA
(polycistronic).
• First example: the lac operon
The lac Operon Reveals Many Principles of
Gene Regulation

• Work of Jacob and Monod − 1960


• Shows how three genes for metabolism of
lactose are regulated together as an operon:
 -galactosidase (lacZ)
• cleaves lactose to yield glucose and galactose
– lactose permease (galactoside permease; lacY)
• transports lactose into cell
– thiogalactoside transacetylase (lacA)
• Thet rely on negative regulation via a repressor.
Prokaryotic Regulation
• The lac operon is negatively regulated by
a repressor protein:
– lac repressor binds to the operator to block
transcription
– in the presence of lactose, an inducer
molecule binds to the repressor protein
– repressor can no longer bind to operator
– transcription proceeds
Lactose Metabolism in E. Coli
• When glucose is abundant and lactose is
lacking, cells make only very low levels of
enzymes for lactose metabolism.
– Transcription is repressed.

• If glucose is scarce and cells are fed lactose,


the cells can use it as their energy source.
• The cells suddenly express the genes for the
enzymes for lactose metabolism.
– Transcription is no longer repressed.
Lactose Metabolism in E. Coli
Eukaryotic Transcription
• General transcription factors bind to the
promoter region of the gene.
• RNA polymerase II then binds to the
promoter to begin transcription at the start
site (+1).
• Enhancers are DNA sequences to which
specific transcription factors (activators)
bind to increase the rate of transcription.
Eukaryotic Transcription
• Coactivators and mediators are also
required for the function of transcription
factors.
– coactivators and mediators bind to
transcription factors and bind to other parts of
the transcription apparatus
Eukaryotic Chromosome Structure
• Eukaryotic DNA is packaged into
chromatin.
• Chromatin structure is directly related to
the control of gene expression.
• Chromatin structure begins with the
organization of the DNA into nucleosomes.
• Nucleosomes may block RNA polymerase
II from gaining access to promoters.
Eukaryotic Regulation
• Controlling the expression of eukaryotic
genes requires transcription factors.
– general transcription factors are required
for transcription initiation
• required for proper binding of RNA polymerase to
the DNA
– specific transcription factors increase
transcription in certain cells or in response to
signals
Eukaryotic Chromosome Structure
• Methylation (the addition of –CH3) of DNA
or histone proteins is associated with the
control of gene expression.
• Clusters of methylated cytosine nucleotides
bind to a protein that prevents activators
from binding to DNA.
• Methylated histone proteins are associated
with inactive regions of chromatin.
Posttranscriptional Regulation
• Control of gene expression usually involves
the control of transcription initiation.
• But gene expression can be controlled after
transcription, with mechanisms such as:
– RNA interference
– alternative splicing
– RNA editing
– mRNA degradation
Posttranscriptional Regulation
• Introns are spliced out of pre-mRNAs to
produce the mature mRNA that is
translated.
• Alternative splicing recognizes different
splice sites in different tissue types.
• The mature mRNAs in each tissue possess
different exons, resulting in different
polypeptide products from the same gene.
4.2 Vector biểu hiện
Một gen lạ (không phải là gen của vi khuẩn) nếu đơn
giản chỉ đưa vào vector rồi chuyển vào E. coli thì rất có
thể gen này sẽ không tổng hợp được protein mong muốn

Để biểu hiện được gen vector cần có đầy đủ các tín hiệu
để mà vi khuẩn nhận biêt được. Các tín hiệu này là các
đoạn ngắn nucleic giúp cho quá trình phiên mã và dịch
mã. Có ba tín hiệu quan trọng:

- Promotor có điểm mà ở đó bắt đầu quá trình phiên mã.


Ở E.coli promotor được nhận biết ở vị trí sigma subunit
của enzym RNAse polymerase
- Trình tự bắt đầu và trình tự kết thúc của quá trình phiên
mã. Điểm kết thúc của phiên mã thường là trình tự nucleic
mà các trình tự này liên kết nhau tạo nên cấu trúc vòng
(stem-loop).

- Vị trí gắn kết của ribosome là trình tự của nucleic được


ribosome nhận biết. Bộ mã đầu tiến của gen thường cách
vị trí này vài nucleic về phía dưới
Promotor Ribosome Terminator
binding site
Gen

ADN

ARN

Point at which ribosome binds to mARN


4.2.1 Promotor

Promotor là thành phần quan trọng nhất của vector


biểu hiện. Promotor điều khiển bước đầu tiên của quá
trình và nó xác định tốc độ tổng hợp mARN. Lượng protein
tổng hợp được phụ thuộc lớn vào promotor

a- Cần lựa chọn promotor cẩn thận


VD Trình tự vùng -35 của E.coli là TTGACA.Trình tự này
không khác nhiều với trình tự trình tự khác như TTTACA.
Tuy nhiên chỉ có sự khác nhỏ này thôi nhưng nó ảnh
hưởng rất lớn đến hướng mà promotor phiên mã.
Các trình tự đặc trưng của promotor của E.coli và
tế bào động vật

------------- TTGACA-------------------TATAAT --------- Gen


E.coli vùng -35 vùng -10

------- các tín hiệu khác nhau ------TATAAAT------------- Gen

vùng -25
Động vật
- Promotor mạnh (strong promotor) là những promotor
duy trì tốc độ phiên mã cao, các promotor này thường
biểu hiện cho các sản phẩm cần tạo ra số lượng lớn
trong tế bào

- Promotor yếu thì ngược lại


Promotor mạnh

Phiên mã Dịch mã

Số lượng protein

Promotor yếu

Phiên mã Dịch mã
Số lượng protein
Một yếu tố khác cũng phải chú ý đó là vấn đề điều khiển
promotor. Hai dạng chính để điều hoà gen đó là chất
cảm ứng và kìm hãm

Một gen có khả năng cảm ứng khi quá trình phiên mã xaỷ
ra khi trong môi trường có bổ sung thêm chất hoá học

Một gen bị kìm toả khi trong môi trường có bổ sung thêm
chất hoá học
Cảm ứng
Gen thông thường Chất cảm ứng

Không có sản phẩm

Kìm hãm
Gen thông thường Chất kìm hãm

Không có sản phẩm


b- Các promotor hay sử dụng trong vector biểu hiện gen

+ Lac promotor

+ Trp promotor

+ Tac protomotor

+  Pl promotor
+) Lac promoter IPTG

Dịch mã
-35 -10

Đây là trình tự dùng để điều khiển quá trình dịch mã của gen lacZ mã
hoá cho enzym - galactosidasa.

Lac promoter cảm ứng bởi lactose và IPTG. Khi bổ sung IPTG
vào môi trường nuôi cấy quá trình dịch mã gen sau lac promoter
xảy ra
Catabolite activator protein protein ho¹t hãa dÞ hãa
+) trp promoter
IPTG Tryptophan

Dịch mã Không dịch mã


-35 -10

Thường ở phía trước các gen mã hoá các enzym sinh tổng
hợp axit amin tryptophan.

trp promoter bị kìm hãm bởi tryptophan và dễ dàng bị


cảm ứng bởi axit 3--indoleacrylic
Prokaryotic Regulation
• The trp operon encodes genes for the
biosynthesis of tryptophan.
• The operon is not expressed when the cell
contains sufficient amounts of tryptophan.
• The operon is expressed when levels of
tryptophan are low.
The trp operon
TrpR (repressor) Attenuator

P T PO T
trpR trpE trpD trpC trpB trpA
mRNA Polycistronic mRNA (encodes 5 proteins)

TrpR

5 separate proteins that were


P = promoter synthesized from one mRNA
T = terminator
O = operator
The trp operon
The trp operon is responsible for the biosynthesis of
tryptophan.

In man and plants the amino acid is essential as we are


unable to synthesize this amino acid, so we obtain it
from food and our gut flora.

The trp operon is involved in biosyntheis, so it is


repressible by the presence of tryptophan
Prokaryotic Regulation
• The trp operon is negatively regulated by
the trp repressor protein
– trp repressor binds to the operator to block
transcription
– binding of repressor to the operator requires a
corepressor which is tryptophan
– low levels of tryptophan prevent the repressor
from binding to the operator
Comparison of lac & trp operons

lac operon trp operon


• encodes catabolic • encodes anabolic enzymes.
enzymes.
• tryptophan is an co-
• lactose (allolactose) is repressor.
an inducer.
• trpR gene situated a long
• lacI gene situated just way away from trp gene
upstream of lacZYA cluster
gene cluster

• No transcriptional • See transcriptional


termination termination as a fine control
+) tac promoter
IPTG
Dịch mã
-35 -10

Đây là sự kết hợp của hai loại promoter trp và lac nhưng nó
có khả năng biểu hiện tốt hơn cả hai loại khi riêng rẽ.

Chất gây cảm ứng cho tac promoter là IPTG


+) PL promoter

30OC
Không dịch mã  30OC
-35 -10
Dịch mã

Đây là một trong promoter trong quá trình dịch mã của ADN. PL là
promoter mạnh. Promoter này bị ức chế bởi sản phẩm của cI gen.

Vector biểu hiện có PL thường được sử dụng với vật chủ là E. coli và
quá trình tổng hợp rất nhạy cảm với nhiệt độ. Ở nhiệt độ nhỏ hơn 30 OC
cI protein sẽ ức chế PL và ở nhiệt độ lớn hơn 30OC protein này bị mất
khả năng liên kết promoter do vậy quá trình dịch mã xảy ra.
+) Lac promoter IPTG

Dịch mã
-35 -10

IPTG Tryptophan
+) trp promoter
Dịch mã Không dịch mã
-35 -10

+) tac promoter IPTG


Dịch mã
-35 -10

+) PL promoter 30OC


Không dịch mã  30OC
-35 -10
Dịch mã
4.2.2 Cassetes và hơp nhất gen

Vector biểu hiện gen ngoài yêu cầu về promotor (mạnh và có khả năng
điều khiển) còn cần có yêu cầu về trình tự để ribosome E. coli gắn kết và
terminator. Trong hầu hết các vector các tín hiệu biểu hiện này gọi là
cassete. Gen lạ được chèn vào vị trí lí tưởng giữa các tín hiệu này.

Gen lạ
R PR T
P T
Chèn gen lạ vào vị trí enzym giới hạn sao cho nó hợp nhất được gen
tạo ra một gen lai. Gen mới này được bắt đầu là gen của E. coli. Sản
phẩm sẽ là một protein lai gồm có đoạn peptid của E. coli và protein
của gen lạ.

E. coli gen
P R T

Gen lạ
Tạo gen hợp nhất có 4 ưu điểm
- Tránh hiện tượng liên kết ảnh hưởng ribosome gắn kết

Tạo liên kết


5/
3/

Vị trí ribosome gắn kết

- Sự có mặt của E. coli peptide ngăn chặn sự phân huỷ protein lạ

- Góp phần định hướng vị trí protein so với tế bào (đưa ra ngoài môi trường
trong màng tế bào chất hay nằm ở periplasmic

- Trợ giúp cho quá trình tinh chế nhờ sắc kí ái lực
Nhược điểm

Sự có mặt của peptid có thể làm thay đổi đặc tính của protein tái tổ
hợp.

Người ta thường dùng phương pháp hoá học hay enzym để loại bỏ đoạn
này trước khi sử dụng

methionine cyanogen bromide

arginine enzym throbin


4.3 Nghiªn cøu c¸c vật chủ để biểu hiện
(các vật chủ: procaryote, eucaryote: nấm men,
nấm mốc, thực vật)

1- Nghiªn cứu vật chủ để biểu hiện là procaryote,


- Hệ thống biểu hiện ở vi khuẩn được sử dụng rộng rãi để
biểu hiện DNA tái tổ hợp .

- They offer several advantages: high level of recombinant


protein expression, rapid cell multiplication and simple
media requirement.

- There are some limitations such as intracellular


accumulation of heterologous proteins, improper folding
of the peptide, lack of post-transcriptional modifications,
the potential for product degradation due to trace of
protease impurities and production of endotoxin
Escherichia coli

• Escherichia coli is a typical prokaryotic expression


system and one of the most attractive heterologous
protein producer.
• The expression of proteins in this system is the easiest,
quickest and cheapest.
• Rapid growth rate which is as short as 20-30 minutes
capacity for continuous fermentation and relatively low
cost.
• There are many commercial and non-commercial
expression vectors available and many different strains
are being optimized for special applications.
• There are also problems related to the use of E. coli as production host. These problems
can be grouped into two categories: the sequence of the gene of interest and E. coli as a
host
• In the first category: three ways might prevent efficient expression Firstly, the foreign gene
may contain introns. Secondly, the foreign gene might contain sequences which act as
termination signals in E. coli. Thirdly, a problem with codon bias of the gene making E. coli
not an ideal host for translation.
• In the second category, there are three major limitations. Firstly, E. coli might not process
the recombinant proteins correctly especially with respect to post translational
modifications like N and O linked glycosylation, fatty acid acylation, phosphorylation and
disulfide-bond formation that are required for proper folding of the secondary, tertiary and
quaternary structures and for the functional characteristics of the protein of interest.
Glycosylation is extremely uncommon in bacteria and recombinant proteins synthesised in
E. coli are never glycosylated correctly. This can affect the bioactivity, function, structure,
solubility, stability, half-life, protease resistance and compartmentalization of the functional
proteins . Secondly, E. coli might not correctly fold the recombinant proteins and is unable
to synthesise disulphide bonds present in mammalian proteins. In such case, protein may
become insoluble and forms an inclusion body within the bacterium .Thirdly, E. coli may
degrade the recombinant protein. Accumulation of endotoxins lipopolysaccharide LPS,
Bacillus subtilis

It is an alternative to the E. coli expression system. B. subtilis, also known


as hay bacillus or grass bacillus, is a Gram positive, catalase positive
bacterium, found in soil and the gastrointestinal tract of ruminants and
humans. It can secrete degradative enzymes or antibiotics, produce spores
and can become competent for genetic transformation. It is a non-
pathogenic and a GRAS (Generally regarded as safe) organism. The major
advantage of B. subtilis is that it does not produce lipopolysaccharide LPS
(endotoxin), which may otherwise cause degenerative disorders in humans
and animals. B. subtilis can also be transformed readily with many
bacteriophages and plasmids due to its genetic characteristics. It is capable
of secreting functional extracellular proteins directly into the culture
medium, facilitating further purification steps. It has no significant bias in
codon usage which is considered as an added advantage. Processes such
as transcription, translation, protein folding, secretion mechanisms,
genentic manipulations and large scale fermentation has been very well
acquainted with this organism. The organism is also useful for the
construction of metagenomic libraries
Lactococcus lactis

Lactococcus lactis is widely used in biotechnology for


large-scale production of heterologous proteins.
During the past two decades, remarkable progress
has been made towards the development of genetic
engineering tools and the molecular characterization
of L. lactis
Pseudomonas

It is considered as a potential alternative to E. coli.


Pseudomonas fluorescens has been proven to function as a
recombinant protein producer as it can be cultivated to high
cell densities often producing soluble proteins, while E. coli
produces insoluble protein. P. putida was having high plasmid
stability and proved to be potential recombinant protein
producer for industrial use with growth properties similar to E.
coli during fed batch fermentations.
EUKARYOTIC EXPRESSION SYSTEMS

In theory, prokaryotic hosts can express any gene, but in practice


the proteins produced do not always have the desired biological
activity or stability. Further, toxic components from the bacteria may
contaminate the final product. This becomes a major issue
particularly when the expressed protein is intended for therapeutic
use. One must ensure that the recombinant protein must be identical
to natural protein in all its properties. As eukaryotic cells share many
molecular, genetic and biochemical features, it can be used as an
alternative to prokaryotic expression of proteins.
Yeast

System Yeast is an expression system with the highest commercial value.


Among yeast, Saccharomyces cerevisiae (Baker’s yeast) is the most widely
used. Further, it has been widely used as a model organism for cell function
research as its biochemistry, genetics and cell biology is very well
characterized to express a number of proteins including proteins to be used
for vaccines, pharmaceutical products and for diagnostics It was engineered
to express different heterologous genes for almost 25 years. It satisfies the
economic efficiency and biosafety regulations for human applications. This
system is used successfully to make hepatitis B vaccine and Hantavirus
vaccine. It has been used to optimize the functional yields of potential
antigens for the development of subunit vaccines against a wide range of
diseases caused by bacteria and viruses.
Fungus

System Filamentous fungi, especially Aspergillus (Aspergillus niger and


Aspergillus oryzae) and Trichoderma have been developed into expression
platforms for screening and production of diverse industrial enzymes.
Trichoderma reesei has tremendous capability to secrete over 100 g/L
of proteins and therefore makes an excellent host system for pro-duction of
high levels of therapeutic proteins at low cost. Fungal-based systems have
several advantages due mainly to their high-level secretion of enzymes and
their decomposer lifestyle. Further, in the largescale production of
recombinant proteins of eukaryotic origin, the filamentous fungi become the
system of choice due to critical processes shared in gene expression with
other eukaryotic organisms. But, the complexity and relative dearth of
understanding the physiology of filamentous fungi, compared to bacteria,
have hindered rapid development of these organisms as highly efficient
factories for the production of heterologous proteins.
4.3 C¸c yÕu tè ¶nh h­ưëng ®Õn biÓu hiÖn gen
Mặc dù đã phát triển nhiều vector để biểu hiện gen nhưng vẫn còn một số
khó khăn. Những vấn đề này được chia làm 2 loại: trình tự gen lạ và tế
bào chủ

a) Trình tự của gen lạ

- Gen lạ có thể chứa intron

- Gen lạ chứa trình tự có tác dụng như là tín hiệu kết thúc ở E. coli

P R T

T
- Sử dụng bộ ba mã hoá không thường gặp trong quá trình dịch mã
ở E. coli.

Gen của người

CCA CCT CCA CCG

Codon cho proline CCA, CCT và CCG

Gen của E. coli

CCG CCG CCG

Codon cho proline CCG


b- Tế bào vật chủ E. coli

- Trong thực tế nhiều protein của động vật sau quá trình dịch mã bị các nhóm
đường hoá gắn vào. Trường hợp này không xảy ra ở vi khuẩn và tổng hợp
protein tái tổ hợp ở E. coli.

- Trong tế bào E. coli protein tái tổ hợp không cuộn theo đúng cấu trúc
của nó. Do vậy, cấu trúc bậc ba của nó thường ở dạng không hoà tan và
nó tồn tại ở các hạt trong tế bào. Ở trạng thái đó protein thường ở dạng
bị bất hoạt

- E. coli có thể phân huỷ các protein lạ


Ngoài ra còn nghiên cứu các yếu tố ảnh hưởng khác

- Thời gian cho inducer vào môi trường, nồng độ inducer

- Ảnh hưởng của nhiệt độ

- Nồng độ các chất dinh dưỡng

- Thời gian thu sản phẩm

You might also like