You are on page 1of 14

a citron is a single stretch of DNA

One gene : one enzyme hypothesis is the basis of modern genetics: that a gene is a stretch of DNA coding
for a single polypeptide chain.

A mutation in the gene alters the activity of the protein for which it is responsible.

This explains the nature of recessive mutations: they represent an absence of function, because the mutant
gene has been prevented from producing its usual enzyme. Figure 1.19 illustrates the basis for the
dominance relationship between recessive and wild-type alleles. When a heterozygote contains one wild-
type allele and one mutant allele, the wild-type allele is able to direct production of the enzyme. The wild-
type allele is therefore dominant. (This assumes that an adequate amount of protein is made by the single
wild-type allele. When this is not true, the smaller amount made by one allele as compared to two alleles
results in the intermediate phenotype of a partially dominant allele in a heterozygote.)

A modification in the hypothesis is needed to accommodate proteins that consist of more than one
subunit. If the subunits are all the same, the protein is a homomultimer, represented by a single gene. If
the subunits are different, the protein is a heteromultimer. Stated as a more general rule applicable to any
heteromultimeric protein, the one gene : one enzyme hypothesis becomes more precisely expressed as one
gene : one polypeptide chain.

How do we determine whether two mutations that cause a similar phenotype lie in the same
gene? If they map close together, they may be alleles. However, they could also represent
mutations in two different genes whose proteins are involved in the same function. The
complementation test is used to determine whether two mutations lie in the same gene or in
different genes. The test consists of making a heterozygote for the two mutations (by mating
parents homozygous for each mutation).

If the mutations lie in the same gene, the parental genotypes can be represented as:

The first parent provides an m1 mutant allele and the second parent provides an m2 allele, so that
the heterozygote has the constitution:
No wild-type gene is present, so the heterozygote has mutant phenotype.

If the mutations lie in different genes, the parental genotypes can be represented as:

Each chromosome has a wild-type copy of one gene (represented by the plus sign) and a mutant
copy of the other. Then the heterozygote has the constitution:

in which the two parents between them have provided a wild-type copy of each gene. The
heterozygote has wild phenotype; the two genes are said to complement. Failure to complement
means that two mutations are part of the same genetic unit. Mutations that do not complement
one another are said to comprise part of the same complementation group. Another term that is
used to describe the unit defined by the complementation test is the cistron. This is the same as
the gene. Basically these three terms all describe a stretch of DNA that functions as a unit to give
rise to an RNA or protein product.
If two recessive mutations arise independently and both have the same phenotype, how do we know whether they are both
mutations of the same gene? That is, how do we know whether they are alleles? To answer this question, we must construct a
heterozygote and determine the complementation between the two mutations. A heterozygote with two mutations of the same
gene will produce only mutant messenger RNAs, which result in mutant enzymes (fig.12.2a).
If, however, the mutations are not allelic, the gamete from the a1 parent will also contain an a2 allele, and the gamete from the a2
parent will also contain the a1 allele (fig. 12.2b).
If the two mutant genes are truly alleles, then the phenotype of the heterozygote should be mutant. If, however, the two mutant
genes are nonallelic, then the a1 mutant will have contributed the wild-type allele at the A2 locus, and the a2 mutant will have
contributed the wild-type allele at the A1 locus to the heterozygote. Thus, the two mutations will complement each
other and produce the wild-type.
Mutations that fail to complement each other are termed functional alleles.

The test for defining alleles strictly on this basis of functionality is termed the cis-trans complementation test. There are two
different configurations in which a heterozygous double mutant of functional alleles can form (fig. 12.3). In the cis-trans
complementation test, only the trans configuration is used to determine whether the two mutations were allelic. In reality, the cis
configuration is not tested; it is the conceptual control, in which wild-type activity (with recessive mutations) is always expected.
The test is thus sometimes simply called a trans test. Functional alleles produce a wild-type phenotype in the cis configuration
but a mutant phenotype in the trans configuration. This difference in phenotypes is called a cis-trans position effect.

From the terms cis and trans, Seymour Benzer coined the term cistron for the smallest genetic unit (length of genetic material)
that exhibits a cis-trans position effect. We thus have a new word for the gene, one in which function is more explicit. We have,
in essence, refined Beadle and Tatum’s one-gene-one-enzyme hypothesis to a more accurate one-cistron-one-polypeptide
concept. The cistron is the smallest unit that codes for a messenger RNA that is then translated into a single polypeptide or
expressed directly (transfer RNA or ribosomal RNA).
From functional alleles,we can go one step further in recombinational analysis by determining whether two allelic mutations
occur at exactly the same place in the cistron. In other words, when two mutations prove to be functional alleles, are they also
structural alleles? The methods used to analyze complementation can be used here also. Crosses are carried out to form a
mutant heterozygote (trans configuration) whose offspring are then tested for recombination between the two mutational sites. If
no recombination occurs, then the two alleles probably contain the same structural change (involving the same base pairs) and are
thus structural alleles. If a small amount of recombination occurs that generates wild-type offspring, then the two alleles are not
mutations at the same point (fig. 12.4). Alleles that were functional but not structural were first termed pseudoalleles because it
was believed that loci were made up of subloci. Fine-structure analysis led to the understanding that a locus is a length of genetic
material divisible by recombination rather than a “bead on a string.” Eye-color mutants of Drosophila melanogaster can be
studied by complementational analysis. The white-eye locus has a series of alleles producing varying shades of red.This locus is
sex linked, at about map position 3.0 on the X chromosome. (Several other eye-color loci on the X chromosome are not relevant
to this cross—e.g., prune and ruby.) If an apricot-eyed female is mated with a white-eyed male, the female offspring are all
heterozygous and have mutant light-colored eyes (fig. 12.5).Thus, apricot and white are functional alleles: they do not
complement (table 12.2). To determine whether apricot and white are structural alleles, light-eyed females are crossed with
white-eyed males, and the offspring are observed for the presence of wild-type or light-eyed males. Though their rate of
appearance is less than 0.001%, this is significantly above the background mutation rate. The conclusion is that apricot and white
are functional, but not structural, alleles.
2.6 Exon sequences are conserved but introns vary

Is a structural gene unique in its genome? The answer can be ambiguous. The entire length of the
gene is unique as such, but its exons often are related to those of other genes. As a general rule,
when two genes are related, the relationship between their exons is closer than the relationship
between the introns. In an extreme case, the exons of two genes may code for the same protein
sequence, but the introns may be different. This implies that the two genes originated by a
duplication of some common ancestral gene. Then differences accumulated between the copies,
but they were restricted in the exons by the need to code for protein functions.

As we see later when we consider the evolution of the gene, exons can be considered as basic
building blocks that are assembled in various combinations. A gene may have some exons that
are related to exons of another gene, but the other exons may be unrelated. Usually the introns
are not related at all in such cases. Such genes may arise by duplication and translocation of
individual exons.

The relationship between two genes can be

plotted in the form of the dot matrix comparison
of Figure 2.15. A dot is placed to indicate each
position at which the same sequence is found in
each gene. The dots form a line at an angle of
45¢X if two sequences are identical. The line is
broken by regions that lack similarity, and it is
displaced laterally or vertically by deletions or
insertions in one sequence relative to the other.

Figure 2.15 The sequences of the mouse maj

and min globin genes are closely related in
coding regions, but differ in the flanking
regions and large intron. Data kindly provided
by Philip Leder.
When the two β-globin genes of the mouse are compared, such a line extends through the three
exons and through the small intron. The line peters out in the flanking regions and in the large
intron. This is a typical pattern, in which coding sequences are well related, the relationship can
extend beyond the boundaries of the exons, but it is lost in longer introns and the regions on
either side of the gene.

The overall degree of divergence between two exons is related to the differences between the
proteins. It is caused mostly by base substitutions. In the translated regions, the exons are under
the constraint of needing to code for amino acid sequences, so they are limited in their potential
to change sequence. Many of the changes do not affect codon meanings, because they change
one codon into another that represents the same amino acid. Changes occur more freely in
nontranslated regions (corresponding to the 5′ leader and 3′ trailer of the mRNA).

In corresponding introns, the pattern of divergence involves both changes in size (due to
deletions and insertions) and base substitutions. Introns evolve much more rapidly than exons.
When a gene is compared in different species, sometimes the exons are homologous, while the
introns have diverged so much that corresponding sequences cannot be recognized.

Mutations occur at the same rate in both exons and introns, but are removed more effectively
from the exons by adverse selection. However, in the absence of the constraints imposed by a
coding function, an intron is able quite freely to accumulate point substitutions and other
changes. These changes imply that the intron does not have a sequence-specific function.
Whether its presence is at all necessary for gene function is not clear.
2.8 Genes show a wide distribution of sizes

The existence of interrupted genes makes it evident that the gene can be much larger than the
unit that codes for protein. As genome size increases, the tendency is for introns to become rather
large, while exons remain quite small.

Figure 2.21 Exons coding for proteins are usually short.

Figure 2.21 shows that the exons coding for stretches of protein tend to be fairly small relative to
the size of the gene. Most code for less than 100 amino acids (often less than 50 in vertebrates),
and the general distribution fits well with the idea that genes have evolved by the slow addition
of units that code for small, individual domains of proteins (see later). There is no very
significant difference in the sizes of exons in different types of organisms, except perhaps for an
apparent absence of larger exons in the vertebrates. (The peak of exons coding for >300 amino
acids in fungi and Drosophila mostly represents the presence of uninterrupted genes, that is,
genes that consist of 1 exon.) There are some much larger exons coding for untranslated 5′ and 3′
regions (not included in the figure).

Figure 2.22 Introns in vertebrate genes range from very short to very long.
Figure 2.22 shows that introns are longer than exons. Their size distribution extends from
approximately the same size as the exons (<200 bp) to lengths measured in 10s of kbs, and
extending up to 50¡V60 kb in extreme cases.
Figure 2.23 Most genes are uninterrupted in yeast, but most genes are interrupted in flies and
mammals. (Uninterrupted genes have only 1 exon, and are totaled in the leftmost column.)
Figure 2.23 shows the overall organization of genes in yeasts, insects, and mammals. In S.
cerevisiae, the great majority of genes (>96%) are not interrupted, and those that have exons
usually remain reasonably compact. There are virtually no S. cerevisiae genes with more than 4

In insects and mammals, the situation is reversed. Only a few genes have uninterrupted coding
sequences (6% in mammals). Insect genes tend to have a fairly small number of exons, typically
fewer than 10. Mammalian genes are split into more pieces, and some have several 10s of exons.
~50% of mammalian genes have >10 introns.

Figure 2.24 Yeast genes are small, but genes in flies and mammals have a dispersed distribution
extending to very large sizes.
If we now examine the consequences of this type of organization for the overall size of the gene,
we see in Figure 2.24 that there is a striking difference between yeast and the higher eukaryotes.
The average yeast gene is 1.4 kb long, and very few are longer than 5 kb. By contrast, relatively
few genes in flies or mammals are shorter than 2 kb, and many have lengths between 5 kb and
100 kb.
Figure 3.1 DNA content of the haploid genome is related to the morphological complexity of
lower eukaryotes, but varies extensively among the higher eukaryotes. The range of DNA values
within a phylum is indicated by the shaded area.

The switch from largely uninterrupted to largely interrupted genes occurs in the lower
eukaryotes. In fungi (excepting the yeasts), the majority of genes are interrupted, but they have a
relatively small number of exons (<6) and are fairly short (<5 kb). The switch to long genes
occurs within the higher eukaryotes, and genes become significantly larger in the insects.
Perhaps genes become large at the same point where the relationship between genome
complexity and organism complexity is lost (see Figure 3.1).

Very long genes are the result of very long introns, not the result of coding for longer products.
There is no correlation between gene size and mRNA size in higher eukaryotes; nor is there a
good correlation between gene size and the number of exons. The size of a gene therefore
depends primarily on the lengths of its individual introns. In mammals, insects, and birds, the
"average" gene is approximately 5¡Ñ the length of its mRNA.
citron adalah satu hamparan DNA

Satu gen: satu hipotesis enzim adalah dasar dari genetika modern: bahwa gen adalah rangkaian kode
DNA untuk rantai polipeptida tunggal.

Mutasi pada gen mengubah aktivitas protein yang menjadi tanggung jawabnya.

Ini menjelaskan sifat mutasi resesif: mereka mewakili tidak adanya fungsi, karena gen mutan telah
dicegah dari memproduksi enzim yang biasa. Gambar 1.19 menggambarkan dasar untuk hubungan
dominasi antara alel resesif dan tipe liar. Ketika heterozigot mengandung satu alel tipe liar dan satu alel
mutan, alel tipe liar dapat mengarahkan produksi enzim. Alel tipe liar karenanya dominan. (Ini
mengasumsikan bahwa jumlah protein yang memadaidibuat oleh alel tipe-liar tunggal. Ketika ini tidak
benar, jumlah yang lebih kecil yang dibuat oleh satu alel dibandingkan dengan dua alel menghasilkan
fenotipe menengah dari alel dominan sebagian dalam heterozigot) .)

Modifikasi dalam hipotesis diperlukan untuk mengakomodasi protein yang terdiri dari lebih dari satu
subunit. Jika semua subunitnya sama, proteinnya adalah homomultimer , diwakili oleh satu gen. Jika
subunitnya berbeda, proteinnya adalah heteromultimer . Dinyatakan sebagai aturan yang lebih umum
yang berlaku untuk setiap protein heteromultimerik , satu gen: satu hipotesis enzim menjadi lebih tepat
dinyatakan sebagai satu gen: satu rantai polipeptida .

Bagaimana kita menentukan apakah dua mutasi yang menyebabkan fenotipe yang sama terletak
pada gen yang sama? Jika mereka memetakan berdekatan, mereka mungkin alel. Namun, mereka
juga bisa mewakili mutasi pada dua gen berbeda yang proteinnya terlibat dalam fungsi yang
sama. Tes komplementasi digunakan untuk menentukan apakah dua mutasi terletak pada gen
yang sama atau dalam gen yang berbeda. Tes terdiri dari membuat heterozigot untuk dua mutasi
(dengan perkawinan orang tua yang homozigot untuk setiap mutasi).

Jika mutasi terletak pada gen yang sama, genotipe orang tua dapat direpresentasikan sebagai:

Orang tua pertama memberikan alel mutan m 1 dan orang tua kedua menyediakan alel m 2 ,
sehingga heterozigot memiliki konstitusi:
Tidak ada gen tipe liar, sehingga heterozigot memiliki fenotipe mutan.

Jika mutasi terletak pada gen yang berbeda, genotip orang tua dapat direpresentasikan sebagai:

Setiap kromosom memiliki salinan tipe liar dari satu gen (diwakili oleh tanda plus) dan salinan
mutan yang lain. Kemudian heterozigot memiliki konstitusi:

di mana kedua orang tua di antara mereka telah memberikan salinan tipe liar dari setiap
gen. Heterozigot memiliki fenotip liar; dua gen dikatakan saling melengkapi . Kegagalan untuk
melengkapi berarti bahwa dua mutasi adalah bagian dari unit genetik yang sama . Mutasi yang
tidak melengkapi satu sama lain dikatakan terdiri bagian dari kelompok
komplementasi yang sama. Istilah lain yang digunakan untuk menggambarkan unit yang
didefinisikan oleh uji komplementasi adalah cistron . Ini sama dengan gen . Pada dasarnya
ketiga istilah ini semua menggambarkan hamparan DNA yang berfungsi sebagai unit untuk
menghasilkan RNA atau produk protein.

Jika dua mutasi resesif muncul secara independen dan keduanya memiliki fenotip yang sama, bagaimana kita tahu apakah
mereka keduanya adalah mutasi dari gen yang sama? Yaitu, bagaimana kita tahu apakah mereka alel? Untuk menjawab
pertanyaan ini, kita harus membuat heterozigot dan menentukan komplementasi antara kedua mutasi. Hormon heterozigot
dengan dua mutasi gen yang sama akan menghasilkan hanya RNA messenger mutan, yang menghasilkan enzim mutan
(gbr.12.2 a ).
Jika, namun, mutasi tidak alelik, gamet dari a 1 parent juga akan mengandung a 2 allele, dan gamet dari a 2 parent juga akan
mengandung a 1 alel (gbr. 12.2 b ).
Jika kedua gen mutan itu benar-benar alel, maka fenotip dari heterozigot seharusnya mutan. Namun, jika kedua gen mutan itu
tidak paralel , maka 1 mutan akan memberikan kontribusi alel wild type di A 2 lokus, dan 2 mutan akan memberikan kontribusi
alel wild type di A 1lokus untuk heterozigot. Dengan demikian, kedua mutasi akan saling melengkapi
lainnya dan menghasilkan jenis liar.
Mutasi yang gagal saling melengkapi disebut alel fungsional.

Tes untuk menentukan alel secara ketat berdasarkan fungsi ini disebut uji komplemen cis -trans . Ada dua konfigurasi yang
berbeda di mana mutan ganda heterozigot dari alel fungsional dapat terbentuk (gbr. 12.3). Dalam uji komplemen cis -trans ,
hanya trans konfigurasi digunakan untuk menentukan apakah dua mutasi bersifat alelik. Pada kenyataannya, cis konfigurasi
tidak diuji; itu adalah kontrol konseptual, di mana Aktivitas tipe liar (dengan mutasi resesif) selalu diharapkan. Tes dengan
demikian kadang-kadang hanya disebut trans uji.Alel fungsional menghasilkan fenotipe tipe liar di cis konfigurasi tetapi fenotip
mutan dalam trans konfigurasi. Perbedaan fenotip ini adalah disebut efek posisi cis -trans .

Dari istilah cis dan trans , Seymour Benzer menciptakan istilah cistron untuk unit genetik terkecil (panjang materi genetik)
yang menunjukkan efek posisi cis -trans . Dengan demikian kami memiliki kata baru untuk gen, di mana gen fungsi lebih
eksplisit. Kami telah, pada dasarnya, halus Beadle dan hipotesis satu-gen-satu-enzim Tatum terhadap
a konsep one - cistron - one -polypeptide yang lebih akurat . Itu cistron adalah unit terkecil yang memberi kode untuk
messenger RNA yang kemudian diterjemahkan menjadi polipeptida tunggal ataudiekspresikan secara langsung (transfer RNA
atau RNA ribosom).
Dari alel fungsional , kita dapat melangkah lebih jauh dalam analisis rekombinasi dengan menentukan apakah dua
alelik mutasi terjadi di tempat yang persis sama di cistron . Di Dengan kata lain, ketika dua mutasi terbukti berfungsi alel,
apakah mereka juga alel struktural?Metode yang digunakan untuk menganalisis komplementasi dapat digunakan di sini
juga. Persilangan dilakukan untuk membentuk heterozigot mutan ( trans konfigurasi) yang keturunannya kemudian diuji untuk
rekombinasi antara dua situs mutasi. Jika tidak ada rekombinasiterjadi, maka kedua alel mungkin mengandung yang
sama perubahan struktural (melibatkan pasangan basa yang sama) dan dengan demikian alel struktural. Jika sejumlah kecil
rekombinasi terjadi yang menghasilkan keturunan tipe liar, maka kedua alel bukan mutasi pada titik yang sama (gbr.
12.4). Alel yang fungsional tetapi tidak struktural pertama kali disebut pseudoalleles karena diyakini lokus itu terdiri
dari subloci . Analisis struktur halus mengarah pada pemahaman bahwa lokus adalah panjang dari materi genetik yang dapat
dibagi oleh rekombinasi daripada “manik pada tali.” Mutan warna mata kaleng Drosophila melanogaster dipelajari
dengan analisis komplementer . Mata putih lokus memiliki serangkaian alel yang menghasilkan berbagai warna merah. Lokus
ini terkait seks, sekitar posisi peta 3.0 aktifkromosom X. (Beberapa lokus warna mata lainnya pada X kromosom tidak relevan
dengan persilangan ini — misalnya, pangkas dan ruby.) Jika perempuan bermata aprikot dikawinkan dengan a jantan bermata
putih, keturunan betina semuanya heterozigot dan memiliki mata berwarna terang mutan (gbr. 12.5). Jadi, aprikot dan putih
adalah alel fungsional: mereka tidak saling melengkapi (tabel 12.2). Untuk menentukan apakah aprikot dan putih adalah alel
struktural, betina bermata cahaya disilangkan dengan jantan bermata putih, dan keturunannya diamati untuk keberadaan pria
berjenis liar atau bermata terang. Meskipun tingkat penampilan mereka kurang dari 0,001%, ini secara signifikan di atas tingkat
mutasi latar belakang. Itu Kesimpulannya adalah bahwa aprikot dan putih fungsional, tetapi tidak struktural, alel.

2.6 Urutan ekson dilestarikan tetapi intron berbeda-beda

Apakah gen struktural unik dalam genomnya? Jawabannya bisa ambigu. Seluruh panjang gen itu
unik, tetapi eksonnya sering dikaitkan dengan gen-gen lain. Sebagai aturan umum, ketika dua
gen saling berhubungan, hubungan antara ekson mereka lebih dekat daripada hubungan antara
intron. Dalam kasus ekstrem, ekson dua gen dapat mengkode urutan protein yang sama, tetapi
intronnya mungkin berbeda.Ini menyiratkan bahwa dua gen berasal dari duplikasi beberapa gen
leluhur yang sama. Kemudian perbedaan terakumulasi di antara salinan, tetapi mereka dibatasi di
ekson oleh kebutuhan untuk kode fungsi protein.

Seperti yang kita lihat nanti ketika kita mempertimbangkan evolusi gen, ekson dapat dianggap
sebagai blok bangunan dasar yang dirangkai dalam berbagai kombinasi. Sebuah gen mungkin
memiliki beberapa ekson yang terkait dengan ekson gen lain, tetapi ekson lainnya mungkin tidak
terkait. Biasanya intronnya tidak berhubungan sama sekali dalam kasus seperti itu. Gen semacam
itu dapat timbul karena duplikasi dan translokasi ekson individu.

Gambar 2.15 Urutan gen

globin mouse  majdan  min terkait erat di
daerah pengkodean, tetapi berbeda di daerah
mengapit dan intron besar. Data disediakan
oleh Philip Leder .
Hubungan antara dua gen dapat diplot dalam bentuk perbandingan dot matrix pada Gambar
2.15. Sebuah titik ditempatkan untuk menunjukkan setiap posisi di mana urutan yang sama
ditemukan di masing-masing gen. Titik-titik membentuk garis pada sudut 45 ¢ X jika dua urutan
identik. Garis terputus oleh daerah yang tidak memiliki kesamaan, dan dipindahkan secara lateral
atau vertikal oleh penghapusan atau penyisipan dalam satu urutan relatif terhadap yang lain.
Ketika dua gen β-globin dari mouse dibandingkan, garis tersebut meluas melalui tiga ekson dan
melalui intron kecil. Garis itu keluar di daerah mengapit dan di intron besar. Ini adalah pola yang
khas, di mana urutan pengkodean terkait dengan baik, hubungan dapat melampaui batas ekson,
tetapi hilang dalam intron yang lebih panjang dan daerah di kedua sisi gen.

Tingkat keseluruhan perbedaan antara dua ekson terkait dengan perbedaan antara protein. Ini
sebagian besar disebabkan oleh substitusi dasar. Di wilayah yang diterjemahkan, ekson berada di
bawah kendala karena perlu kode untuk urutan asam amino, sehingga mereka terbatas dalam
potensi mereka untuk mengubah urutan. Banyak perubahan tidak mempengaruhi makna kodon,
karena mereka mengubah satu kodon menjadi yang lain yang mewakili asam amino yang
sama.Perubahan terjadi lebih bebas di daerah nontranslated (sesuai dengan 'pemimpin dan 3' 5
trailer dari mRNA).

Dalam intron yang sesuai, pola divergensi melibatkan perubahan ukuran (karena penghapusan
dan penyisipan) dan substitusi dasar. Intron berkembang jauh lebih cepat daripada ekson. Ketika
gen dibandingkan pada spesies yang berbeda, terkadang eksonnya homolog, sedangkan
intronnya sangat berbeda sehingga sekuens yang sesuai tidak dapat dikenali.

Mutasi terjadi pada tingkat yang sama di kedua ekson dan intron, tetapi dihapus lebih efektif dari
ekson melalui seleksi yang merugikan. Namun, dengan tidak adanya kendala yang dipaksakan
oleh fungsi pengkodean, intron dapat dengan bebas mengakumulasi penggantian titik dan
perubahan lainnya. Perubahan ini menyiratkan bahwa intron tidak memiliki fungsi urutan
tertentu. Apakah kehadirannya sama sekali diperlukan untuk fungsi gen tidak jelas.

2,8 Gen menunjukkan distribusi ukuran yang luas

Keberadaan gen terputus membuatnya jelas bahwa gen bisa jauh lebih besar dari unit yang
mengkode protein. Ketika ukuran genom meningkat, kecenderungan intron menjadi agak besar,
sementara ekson tetap cukup kecil.

Gambar 2.21 Ekson pengkodean untuk protein biasanya pendek.

Gambar 2.21 menunjukkan bahwa pengkodean ekson untuk bentangan protein cenderung cukup
kecil relatif terhadap ukuran gen. Sebagian besar kode untuk kurang dari 100 asam amino (sering
kurang dari 50 di vertebrata), dan distribusi umum cocok dengan gagasan bahwa gen telah
berevolusi dengan penambahan lambat unit yang mengkode untuk domain protein individu yang
kecil (lihat nanti). Tidak ada perbedaan yang sangat signifikan dalam ukuran ekson dalam
berbagai jenis organisme, kecuali mungkin karena tidak adanya ekson yang lebih besar dalam
vertebrata. (Puncak pengkodean ekson untuk> 300 asam amino dalam jamur dan Drosophila
sebagian besar mewakili keberadaan gen yang tidak terputus, yaitu, gen yang terdiri dari 1
ekson.) tidak termasuk dalam gambar).

Gambar 2.22 Intron dalam gen vertebrata berkisar dari sangat pendek hingga sangat panjang.
Gambar 2.22 menunjukkan bahwa intron lebih panjang dari ekson. Distribusi ukuran mereka
meluas dari sekitar ukuran yang sama dengan ekson (<200 bp) ke panjang diukur dalam 10s
dari kbs, dan memperluas hingga 50¡V60 kb dalam kasus yang ekstrim.
Gambar 2.23 Sebagian besar gen tidak terganggu dalam ragi, tetapi sebagian besar gen terganggu
pada lalat dan mamalia. (Gen yang tidak terputus hanya memiliki 1 ekson, dan dijumlahkan di
kolom paling kiri.)
Gambar 2.23 menunjukkan keseluruhan organisasi gen dalam ragi, serangga, dan mamalia. Pada
S. cerevisiae , sebagian besar gen (> 96%) tidak terganggu, dan mereka yang memiliki ekson
biasanya tetap cukup kompak. Hampir tidak ada gen S. cerevisiae dengan lebih dari 4 ekson.

Pada serangga dan mamalia, situasinya terbalik. Hanya beberapa gen yang memiliki urutan
pengkodean yang tidak terputus (6% pada mamalia). Gen serangga cenderung memiliki sejumlah
kecil ekson, biasanya kurang dari 10. Gen mamalia terpecah menjadi lebih banyak, dan beberapa
memiliki beberapa ekson. ~ 50% gen mamalia memiliki> 10 intron.

Gambar 2.24 Gen ragi kecil, tetapi gen pada lalat dan mamalia memiliki distribusi tersebar
hingga ukuran yang sangat besar.
Jika kita sekarang memeriksa konsekuensi dari jenis organisasi ini untuk ukuran keseluruhan
gen, kita melihat pada Gambar 2.24 bahwa ada perbedaan yang mencolok antara ragi dan
eukariota yang lebih tinggi. Gen ragi rata-rata adalah 1,4 kb panjang, dan sangat sedikit yang
lebih panjang dari 5 kb. Sebaliknya, gen yang relatif sedikit pada lalat atau mamalia lebih pendek
dari 2 kb, dan banyak memiliki panjang antara 5 kb dan 100 kb.

Gambar 3.1. Isi DNA genom haploid terkait dengan kompleksitas morfologis eukariota yang
lebih rendah, tetapi bervariasi secara luas di antara eukariota yang lebih tinggi. Kisaran nilai
DNA dalam sebuah filum ditunjukkan oleh area yang diarsir.

Pergantian dari gen yang tidak terganggu menjadi gen terputus terjadi pada eukariota
bawah. Pada jamur (kecuali ragi), sebagian besar gen terganggu, tetapi mereka memiliki jumlah
ekson yang relatif kecil (<6) dan cukup pendek (<5 kb). Peralihan ke gen panjang terjadi di
dalam eukariota yang lebih tinggi, dan gen menjadi lebih besar secara signifikan pada
serangga. Mungkin gen menjadi besar pada titik yang sama di mana hubungan antara
kompleksitas genom dan kompleksitas organisme hilang (lihat Gambar 3.1).
Gen yang sangat panjang adalah hasil dari intron yang sangat panjang, bukan hasil pengkodean
untuk produk yang lebih lama. Tidak ada korelasi antara ukuran gen dan ukuran mRNA pada
eukariota yang lebih tinggi; juga tidak ada korelasi yang baik antara ukuran gen dan jumlah
ekson. Oleh karena itu ukuran gen tergantung terutama pada panjang intron individu. Dalam
mamalia, serangga, dan burung, gen "rata-rata" adalah sekitar 5 ¡panjang mRNA-nya.