You are on page 1of 15

Bird Flu Cellular and Molecular biology

The following inserts are from the website 'Effect Measure'. I am in the process of asking [hopefully recieving] 
permission to reproduce their writings here. Stay tuned.

I encourage you to visit the original site as well as confirm the science and opinions contained within. I want to 
state that I am in no way making money off of this. Its purely science teaching. 

Here is a January 2007 update on some avian flu science. 

Influenza virus, science background, I.

Category: Bird flu • biology
Posted on: October 30, 2006 7:04 AM, by revere

[Back in January we did a series of posts on the old site giving some background science on the influenza virus 
for the general reader. The Reveres are traveling (for a change) and so we thought it was an appropriate time to 
dig around in the old archives and update some of the posts thought useful by readers. Here's the first 
installment of a set of posts on cell surface and HA protein of the influenza virus and where they fit in the 
picture. Links to all four posts: part I, part II, part III, part IV]

Avian influenza, as its name suggests, is a disease of birds. Most aquatic waterfowl seem to tolerate infections 
with the virus with little difficulty (there are exceptions, especially with H5N1), while terrestrial poultry seem 
to do very badly, indeed. The H5N1 subtype of the virus also infects other animals, including mammals like 
cats, dogs, ferrets, horses, pigs and humans. Most readers here know that the H and N designations refer to the 
proteins on the outside of the virus but don't know much about the general subject of lipoproteins, so these posts 
will be for those of you who want to know a little of what this is all about, especially how this is related to 
things like what animals can be infected and how the immune system responds to different viral strains. For a lot 
of you this will be much more than you want to know, but there are a number of lay and professional (but non­
specialist) readers of this blog who have become quite knowledgeable and this is meant to provide some 
additional background. 

So we'll start at the beginning.
The influenza (or any) virus needs to get inside a host cell in order to make new copies of itself. Reproducing is 
essentially its only task in life. We know that viruses and other pathogens don't usually infect all animals (they 
have a specific host range) and within an animal, usually infect only specific tissues. So cells from different 
animals and different tissues must somehow look different to the virus. How does a virus "recognize" the right 
cell? Although we are leaving out a lot of details, there is still much we need to discuss. Since the virus first 
"sees" the cell from the outside, we start at the cell surface or cell membrane, as it's called. Animal cell 
membranes have a very complicated structure but essentially they consist of a supporting structure, called a 
lipid bilayer and various bits and pieces sticking on, in and through it. Below is a picture of a lipid bilayer, the 
structural stuff. (I copped this from a nice set of 1997 lecture notes by Prof. Steve Downing at the University of 
Minnesota­Duluth. This is copyrighted material, but I am not making any money from it and if the Regents of 
the University of Minnesota want me to take it down I will, of course. I doubt they care and are probably 
grateful for the free publicity.)

You can see the reason it's called a bilayer (it has two layers). Each little building block consists of two long 
fatty chains (the black bars) joined at the end by one of the colored balls. The fatty chains don't like to mix with 
water and face each other in the interior of the membrane, while the colored balls don't mind water and line both 
the interior and exterior of the cell. The reason the diagram has different colored balls is that these building 
blocks can be of various kinds (called phospholipids). Besides the phospholipids, there are also a fair number of 
glycolipids. They aren't shown above because I wanted to keep the picture clean. Whenever you see the word 
"glyco­" attached to something you should be thinking sugars (carbohydrates). Lots of the building blocks have 
sugars on them. Attaching a sugar is called glycosylation, and the thing that has the sugar attached is said to be 
glycosylated (and often the location of the attachment is given). Here's a closer view of a glycolipid, showing 
some of the molecules (there are four different glycolipids shown in the four corners, each with different 
numbers of sugars attacked; in the middle is a blow­up of the one at the upper left showing a single sugar 
attached to the two long fatty acid chains shown as black bars in the other pics): 

The previous picture of the bilayer didn't show any of these guys (the round colored balls are all phospholipids), 
but the membrane has these kinds of building blocks, too, although fewer of them. Here is what it looks like 
when we add these glycolipid building blocks to the structural membrane bilayer: 

Those colored hexagons are different kinds of sugars and they are strung together in chains (the little pink 
squiggles are cholesterol and we don't need to discuss them here). Chains of sugar building blocks (the block 
units are called monosaccharides) can be oligosaccharides (when there are only a few of them), polysaccharides 
(when there are many building blocks, often in the form of oligosaccharide units strung together) or, more 
generically, saccharides, sugar chains, or glycans. The variety of terms can be confusing, so we are taking the 
trouble to set it out here, as they often appear in the literature. See here, for some (very technical) guidance. So 
we have fats and sugars here. What about the third food group, proteins. Yes, lots of them and of various kinds 
and configurations with respect to the cell membrane. They can be bound either to the inside or outside 
surfaces, be tethered to the membrane and stick out in either direction, or wind their way back and forth through 
the membrane surface with loops and ends sticking up on either side or both. The proteins can be globs, 
oblongs, long threads or other complex shapes, but whatever their shape, they are long strings of amino acids 
(folded into the various shapes) and have two ends, one called the N­terminal end, here designated ­NH2, and 
the other the carboxyterminal end, here designated ­COOH. And it turns out these protein molecules also have 
sugars hanging off of them (the colored hexagons again), i.e., they are glycosylated. Here's another cartoon 
picture illustrating an example:

From this you can see that the cell surface will have a lot of sugars (carbohydrates) studding its surface, some 
from the glycolipids and some from the glycoproteins. Together they form a dense "canopy" of sugars (like the 
tops of the trees in the rainforest) called the glycocalyx. The glycocalyx of a cell is invisible with usual 
microscope techniques, but special procedures can bring it out. Here are some examples, taken from a 
wonderful (but very technical) website of Dr. Kevin J. Yarema at Johns Hopkins: 

The picture in the left panel shows a cell surface with a fluorescent tags on the glycans to make them visible. 
The middle panel has a glycocalyx brush border (the hard to read label with two arrows). The right panel shows 
the glycocalyx looking like a lot of hairs sticking up from the cell surface. So we've arrived at this point. The 
cell surface has a lot of sugar chains of various kinds covering it and sticking up around it. This is the surface 
various pathogens (including the influenza virus) "see" and which determines which pathogens will glom on to 
which cells.

Part 2

Influenza virus, science background, II

Category: Bird flu • biology
Posted on: October 31, 2006 7:41 AM, by revere
[This is the second installment from the archives of a series of posts giving some scientific background on the 
influenza virus, in this case the terminology basics on viral receptors. Technical but not beyond the range of 
most well educated readers. Links to all four posts: part I, part II, part III, part IV]

In the last post we discussed the dense canopy of sugars linked to cell surface proteins that covers most cells. 
This outer fur­like sugar surface is called the glycocalyx and plays an important biological role, including cell­
cell recognition and communication, interacting with and binding of cells to the material that glues cells 
together (the extracellular matrix), altering or modulating the response of immune cells and proteins, and, most 
important for our purpose, protecting against or determining sensitivity to pathogens like the flu virus. There is 
a lot of technical detail here that is probably more than most readers want to know. But there is a solid subset of 
readers of this blog who have a genuine appetite for being able to read the flu literature, and this is for them. It 
won't make you an expert, but it should help you understand the language. Here's the short version. The last post 
explained what the surface of a cell looks like. Here we explain in more detail about one particular sugar on the 
cell surface (sialic acid) and explain the terminology for the different ways this sugar connects to the rest of the 
stuff on the cell surface. That terminology is used in the flu literature to discuss viral receptors on host cells, the 
places the virus recognizes as a docking point preparatory to infecting the cell. Here's the picture again (go back 
to the first post for a fuller explanation):

The proteins with the sugars attached that make up the glycocalyx are the black threads (the proteins) with the 
colored hexagons attached to them (the sugars). There are quite a few different sugars so there can be many 
different patterns. We are primarily concerned with what is going on at the very tips of the sugar chains, where 
we commonly have a special sugar called sialic acid. Sugars are molecules made up of carbon, hydrogen and 
oxygen, where each carbon has either an oxygen attached to it with a double bond or a hydroxyl group (­OH) 
and a hydrogen. Table sugar (sucrose) has 12 carbons (made up of two simpler 6 carbon sugars hooked 
together), and so on for a vast array of possible sugars. Sialic acid has 9 carbons. So far we haven't done much 
except point out that we are particularly interested in a particular sugar, sialic acid, that often rests at the tips of 
the sugar chains that come off the glycoproteins or glycolipids that are part of the cell membrane (the cell 
surface). Unfortunately at this point we need to get into some of the details of the chemical structure of sialic 
acid in order to explain what terms like α±­2, 3 or α±­2, 3 linkages mean. It is thought the linkages are a 
determinant for whether a bird virus thinks it is seeing a human cell or a bird cell. We'll present the simple story 
in this and the next few posts, for background, and then briefly discuss in the last post how the story may be 
getting a bit more complicated. So here are some of the grubby details. You will see below that the particular 
form of sialic acid we are most concerned with has a slight modification, an acetyl group attached through a 
nitrogen at carbon 5 and thus it is also called Neu5Ac, because confusingly, this sialic acid is also called 
neuraminic acid. So Neu5Ac and "sialic acid" are the same and you will see both names in the literature, often 
in the very same paper. This terminology is a bit clearer if you see the chemical structure of sialic (N­
acetylneuraminic) acid, so here it is (you don't need to know it to follow what comes later, however. This is for 
people who want to know what the terms mean and why they are of interest. The pics are from the website of 
Dr. Kevin J. Yarema at Johns Hopkins, but the original link seems broken now). [NB:It is common in drawing 
these structures to leave out the letter "C" for carbon which is assumed to be wherever two lines meet (so carbon 
#2 is the spot just to the right of the ­O­, or oxygen atom, in the chair­shaped ring in the middle of the picture]:

Details of sialic acid with parts labeled in different colors. This looks more complicated that it is. The (black 
and red) sugar 9 carbon chain has bent back on itself and formed a ring that has an oxygen in it. Because of the 
way atoms connect to each other, the ring is also slightly deformed into a shape like a chair. The green 
modification addition is the N­acyl group attached at the carbon numbered #5, hence Neur5Ac. The part on the 
right hand side that is labeled Carbon #2 (the anomeric position) is where the sialic acid attaches to the rest of 
the oligosaccharide (multi­sugar) chain. It turns out there are two ways to make this attachment, depending on 
whether the attachment is above or below the plane of the chair­shaped ring structure. These two ways to link 
are called α±­ and α²­ linkages. The α±­linkage connects below the plane and that's the one that humans have 
on their glycocalyces. For those who are following the bird flu story, you already know that the influenza virus 
likes α±­2, 6 sialic acid linkages while the bird virus likes α±­2, 3 sialic acid linkages. So we are two thirds of 
the way to explaining this since we know that the "2" refers to attachment at the carbon #2 in the ring while the 
α± part refers to whether the linkage is above or below the plane of the ring. The other number in α±­2, 6 or 
α±­2, 3 (the 6 and the 3) is the number of the carbon atom on the sugar that the sialic acid links to via the α±­
linkage. The sugar important for us is called galactose, which has 6 carbons. The sialic acid at the tip of the 
chain can be linked to the next in line almost­at­the­tip galactose, either at galactose's carbon #6 or its carbon 
#3. Here is what the sialic acid ­ galactose linkage looks like, on the left a 2, 6 linkage and on the right both a 2, 
8 [we didn't discuss this] and a 2, 3 linkage.

The letter R on the right of the galactose unit stands for the rest of the oligosaccharide, a chain of variable 
amounts of sugar units that ends at the protein's amino acid. If you compare the shapes of the α±­2, 6 and the 
α±­2, 3 linkages (ignore the α±­2, 8 part) you will see that they are different, one is straighter and one is 
slightly bent, and it is those differences that the HA proteins of the bird versus human influenza viruses notice 
when they are looking for a place to grab on to. The whole assembly: [sialic acid] connected to [galactose] 
connected to [remaining oligosaccharide] connected to the membrane anchored [protein] is called a 
glycoprotein. Here is a cartoon picture of sialic acid tipped glycoproteins (it's hard to see but those are all little 
"Sia" on the leaves of the tree in the middle):

The sialic acid is the thing the influenza virus is looking to grab onto via its hemagglutinin (HA) protein spike 
that protrudes from its surface (for additional explanation of the viral proteins, see our write­up, Influenza 
Primer II at The Flu Wiki). As an analogy, the virus is looking for a specific "street address" of the house that 
has the kind of lock it has a key for. It knows the number is "34" (sialic acid) and that it is on a green 
background (attached to a galactose) and that it is on the right side of the door (as opposed to being above the 
door or to the left of the door or somewhere else). The orientation with respect to the door is like the linkage 
(α± 2, 3 or 2, 6 or 2, 8 for example). When it sees the right address it rings the bell (and other things happen 
which we haven't discussed but which lead to the door opening). By the way, the alternative name for sialic acid, 
neuraminic acid, might remind you of the name of the other protein spike on the flu virus, neuraminidase. The 
neuriminidase protein on the virus is an enzyme, and any enzyme with the suffix ­ase indicates it splits things 
off, in this case neuraminic or sialic acid (it is also sometimes called a sialidase). Here's a summary. What we 
have done so far is explain (in the first post) what the surface of a cell looks like to a virus (it is covered with a 
pattern of sugar chains the cell uses for a variety of purposes) and then in this post looked in more detail at a 
common sugar at the tips of some of these sugar chains that the flu virus is "looking for" as a place to grab onto 
preparatory to entering a cell and infecting it. That sugar, sialic acid, has a numbering scheme and a shape and 
attaches to another sugar (galactose) closer in through its own #2 carbon to either the #3 carbon (birds) or #6 
carbon (humans) via a link that hooks in below the plane of the sialic acid ring (an α±­linkage). The difference 
between hooking to either #3 or #6 of galactose makes the sugar chain look different to the virus.

Part 3

Influenza virus, science background, III

Category: Bird flu • biology
Posted on: November 1, 2006 7:36 AM, by revere
[This is the third in a reprise from the archives about some of the science of the influenza virus. Links to all four 
posts: part I, part II, part III, part IV]

Note from James Linzel: 
The articles below have errors concerning the syntax used to describe the alpha bonds. The alpha  
symbol did not import properly and is represented as an I. I'm trying to fix but be aware of this error  

An influenza virus does only one thing: tries to make many copies of itself. And it does it poorly, although 
prolifically. Instead of making exact copies it is liable to make inexact copies and this is one of the sources of 
genetic variation which produces the parallel "random experiments" characteristic of viral replication. Lots of 
the copies it makes are fine, but many are fatally flawed, and also many that are more or less imperfect copies 
but which might have properties that turn out to be useful if the environment changes, for example, if the host 
makes antibodies to the original version or the virus finds itself in a colder, warmer or unfamiliar host. One 
thing is certain, however. The virus cannot replicate without infecting a host cell. Viruses, unlike bacteria, plants 
or animals, are not "free living" forms. They have to hijack a living cell and commandeer its copying machine 
and protein workshop to make more copies of itself. To do this it has to get into a living cell. In the first two 
posts of this series we have been discussing a tiny slice of the replication process: how a virus finds a cell to 
hijack (infect), and we continue that theme here. We know that viruses aren't completely promiscuous. They 
usually are restricted in the kinds of animals and the tissues or organ cells they infect. In humans, influenza is 
primarily (although not exclusively) a respiratory disease, at least at first. Moreover, influenza viruses that infect 
birds don't usually readily infect humans. We now know that influenza viruses can "jump the species barrier" 
and ones that formerly just infected birds can start infecting humans. Since H5N1 is primarily a bird (avian) 
influenza virus, and in birds usually infects the bird's intestines, the question of what allows a virus to infect 
particular animals and tissues is obviously an important question. In Part I of this series we discussed what the 
influenza virus "sees" when it cruises by a cell, describing the lawn or canopy of sugars that cover the surface of 
most cells. Part I. also introduced some terms (like glycolipid and glycoprotein) you will encounter when 
reading papers about influenza. The main idea, however, was to give you a picture (both literally and 
conceptually) of where the action is taking place, at the surface of a host cell. In Part II we discussed a 
particular sugar that tips the ends of this lawn of sugar chains sticking up from the cell's surface. It is called 
sialic acid. The terminology that is used in this field is keyed to the details of the chemical structure of sialic 
acid, so we spent most of Part II explaining that terminology. It isn't really necessary to know why something is 
called an α±­2, 3 linkage or an α±­2, 6 linkage, but I like to know these things and I thought I'd take the time to 
explain it to you. My (long) experience as a professor has taught me that people get pleasure out of 
understanding things, even if it is only vaguely. If it's not your cup of tea, just skip it. Here's a quick summary of 
the gist of Part II. The particular sialic acid we are concerned with has a modification to it, an attached chemical 
group called an acetyl group, hooked on at the #5 carbon through a Nitrogen atom. We show the numbering and 
other stuff in the post. Sialic acid also has another name, neuraminic acid, so this modified sialic acid is also 
designated Neu5Ac (neuraminic acid N­acetylated at position 5; somehow the "N" part didn't make it into the 
abbreviation). Neu5Ac has a crinkled ring shape with stuff hanging off of it and can attach (link) to still other 
sugars in two different ways, designated α± and α². Remember where Neu5Ac is: at the tip of a chain of sugar 
units, the other end of which connects either directly to the cell membrane (glycolipids) or to proteins that stick 
through the cell membrane (glycoproteins). So there are other sugars before the sialic acid connecting it to the 
cell surface or surface tethered protein. We will only be concerned with the next one in line, when Neu5Ac is 
linked at its carbon #2 via an α±­linkage to a sugar called galactose at its carbon #3 or #6. We designate these 
sugar pairs at the end of the sugar chains Neu5Ac­α±2,3Gal and Neu5Ac­α±2,6Gal. It should be understood 
that there will be still more sugars connected to the galactose further in, leading to lots of other possible 
patterns, some of which are thought to be important in one way or another. So Part II brought us to this point: 
avian influenza viruses like to grab on to cells with Neu5Ac­α±2,3Gal on their surfaces, human influenza 
viruses like to grab on to cells with Neu5Ac­α±2, 6Gal on their surfaces. When we first realized this, it seemed 
the picture was starting to really make sense. It got even more interesting when it was found that birds had 
Neu5Ac­α±2,3Gal cells in their intestines and humans had Neu5Ac­α±2,6Gal in their respiratory tracts and 
some animals, like pigs, had both. That made pigs a possible "mixing vessel" for both human and bird viruses. It 
was a great story. Unfortunately, as usually happens, the more we learn the less we know. So let's continue the 
story a bit further. From now on I am going to refer to Neu5Ac­α±2,3Gal and its companion in shorthand by 
α±­2,3 and α±­2,6. The problem began a few years ago when it was discovered that human lungs have both 
cells with α±­2, 3 on their surface and cells with α±­2,6. Bummer. It is still a bit unclear which cells in the 
respiratory tract have which surface markers, but it appears that the ciliated cells in the upper respiratory tract 
have α±­2,3 and the non­ciliated cells have α±­2,6. Ciliated? Non­ciliated? OK. We have to pause for a quick 
look at lung histology (the structure and cell types of the lung). First a review of the respiratory system. Think 
of it as an upside down tree with two functional parts. One is the conducting system, consisting of the root of 
the tree (your nose and mouth) connected to a trunk (the trachea) which branches right and left, branches again 
into bronchi, etc. until it gets down to very fine twigs. The conducting system, as its name implies, conducts 
oxygen from the outside in and waste gas (mainly carbon dioxide) from the inside out. At the ends of the twigs 
are the leaves, the gas exchange functional part. This is where oxygen and carbon dioxide pass back and forth 
between your blood and the conducting system. Here's a picture (the one I used at the Flu Wiki Influenza 
Primer I (go there for more explanation of influenza as a clinical illness):

You can see the upside­down tree easily here, although the gas exchange units are not indicated. They would be 
at the ends of the little branches if we drew them. The gas exchange units (the alveoli) are very thin, delicate 
structures which have to be protected from dirt, junk and microbes that might be breathed in. There is a lot 
going on in producing that protection, but we will only consider one aspect of it, located further up in the 
conducting system. Imagine a particle, like a piece of dust that you inhale. What prevents that from getting all 
the way down into the gas exchange units and clogging them up? There are a lot of twists and turns as the air 
stream goes down the conducting system and the larger particles can't maneuver it very well. Think of a tight 
curvy race track. If you are driving a big truck or an SUV very fast along it it is not going to be able to make the 
quick turns and you will wind up crashing into the wall. Only the very small, speedy sports cars can maneuver 
the course. So it is with most particles you inhale. Those over ten microns in diameter will wind up smashed 
against one of the walls of the conducting system. You wouldn't want it to be stuck there for all time, however, 
because you'd eventually clog up the pipe. So your respiratory system has a way to remove them. The 
conducting system is lined with cells (cells on the surface of an organ are called epithelial cells, so these are 
bronchial or tracheal epithelial cells), and some of them secrete mucus which entraps the particles. Now we 
have to move the particles up and out of the conducting system and this is done by specialized cells that have 
little hairs sticking out into the pipe interior. The hairs, called cilia, are connected to a little cellular motor which 
makes them beat or wave in unison, fast in the upward direction, slow in the downward direction. The result is 
that the layer of mucus is slid upwards until its far end gets to the back of your throat where you either spit it out 
or swallow it. This apparatus has the picturesque name of "the mucociliary escalator." It turns out that one of 
the constituents of mucus is a substance called mucin, a large protein studded with sugars, some of have 
abundant α±­linked 2,3 sialic acids. Interesting. Runny nose? Coughing up mucus? Anyway, most of the cells in 
the upper conducting system (nose, mouth, throat, larynx, trachea, bronchi) where the influenza virus first 
begins its infections are ciliated cells, but there are also some non­ciliated cells, including the mucus secreting 
goblet cells and some other cells of various kinds. It turns out that the ciliated cells have α±­2,3 on their 
surfaces while the non­ciliated ones have α±­2,6. This is just the reverse of what we would expect and the 
explanation is not completely clear at this time. But here's one of the explanations that has been put forth and it 
makes some sense. Human influenza viruses initially infect cells that have α±­2,6 on their surface, in this case 
the minority of cells that are non­ciliated. But we can see that once they have infected these cells they produce 
such abundant virus that the heavy local dose can infect the ciliated cells that are right next to them and little 
foci of infected non­ciliated and ciliated cells get bigger and coalesce. When you look late in an influenza 
infection you see mainly infected ciliated cells (since they make up most of the cells). But it starts with the non­
ciliated ones and spreads. Well if ciliated cells can be infected by human influenza viruses even though they 
have α±­2, 3 on their surfaces, why aren't we susceptible to bird viruses right away? We don't know the answer 
to this for sure, but one plausible explanation involves the mucus layer which is loaded with α±­2, 3 receptors 
that can bind the virus and keep it from reaching the cells in any great quantity. You can overcome this 
safeguard with large exposures, which may be why we see human infections in those with heavy exposure to 
poultry. The mucus doesn't protect at all against the α±­2,6­loving human virus, so it is free to infect the non­
ciliated cells and produce a high enough dose to infect them first and then the rest. There is clearly more to the 
story than this, but we don't know most of what is going on here. In any event, the original α±­2,3 = birds and 
α±­2,6 = humans story doesn't quite do the trick. Too bad.

Part 4:

Influenza virus, science background IV

Category: Bird flu • biology
Posted on: November 2, 2006 7:57 AM, by revere
[This is the last post in a series about viral and cell surface glycoproteins and their role in the influenza story. 
It's a slightly updated series from the archives on the old site. Links to all four posts: part I, part II, part III, part 

In the first three posts of this series we have given an overview of what the cell surface looks like to the 
influenza virus and set out the ideas and vocabulary virologists use to discuss the sugar molecules on the cell's 
surface the virus hooks on to, the viral receptor. The many possible configurations of sugars on a cell's surface 
serve important biological functions, like cell to cell communications and anchoring, structural uses and as 
receptors for important biological molecules the organism needs to function properly. These surface sugars are 
essential to the internal communication of the organism. But other organisms can also take advantage of them 
and that is how pathogens like viruses, bacteria and parasites find their way to the particular tissues and cells 
they need for their life cycles. Viruses use these sugar signposts as receptors to grab on to a cell in preparation 
for entering it and hijacking its genetic replication and protein manufacturing machinery to make new viruses. 
At the risk of belaboring the point, here is yet another cartoon picture that gives the general idea (I'd credit the 
source if I could find it):

This picture shows the cell surface structures we have been talking about. From the first post you can see the 
cell membrane (the wall around the cell, also called the plasma membrane). It is a lipid bilayer, seen here as the 
blue and yellow archway from lower left across the picture to lower right. The blue area below it is the inside of 
a cell. The blue balls with yellow sticks (facing each other) are the phospholipid units that make up most of the 
cell membrane structure, but there are also some glycolipids, where instead of the blue balls you see a string of 
colored hexagons, which are sugar units. You see one at the left in the archway. In the first post we also talked 
about proteins which are anchored to and through the cell membrane. These also often have sugars attached to 
them, so they are called glycoproteins. There is an example second from left. The string of attached sugars is 
called an oligosaccharide. See the first post for details. Items (b), (c), (d) and (e) in the picture show ways that 
viruses, toxins, bacteria and lymphocytes (a white cell that is part of the body's immune system) interact with 
glycolipids, glycoproteins and in one case, (e), an odd shaped protein that has no sugars on it but which interacts 
with the sugars on a glycoprotein of the lymphocyte. One of the things to notice in this stylized depiction is that 
the docking of the virus, the toxin or whatever, has a sort of "lock and key" aspect to it. The lock is usually a 
protein or glycolipid with a chain of sugars on it. The "key" is usually a protein that is shaped in just such a way 
that it can fit snugly with the sugar chain. When that kind of "perfect fit" occurs it will set in motion biological 
processes, often mechanisms that allow the "key" to enter into the cell or make the cell do something like 
manufacture a protein. Hormones work this way. They are part of the body's internal signaling system, where 
the signals (the hormones) travel through the blood and activate particular cells through receptors the cells have 
on their surfaces. Cells that don't have the receptors are unaffected. Neat system. In the picture you can see how 
a virus might exploit this biological mechanism for its own purposes. If it can mimic the key of a receptor that 
serves another natural function (and we know only a few of these functions), it might be able to get the cell to do 
something useful for the virus, like set in motion processes which take the virus into the cell. But these 
mechanisms have to be very precise, and just like a real lock and key, if one of the bumps on the key isn't exactly 
right it won't work. Thus the influenza virus looks for very special sugar combinations on the cell surface. We 
spent most of the second post and part of the third discussing the specific signpost the virus looks for on the 
surface of a cell it will try to infect. These are the α±­2,3 and α±­2,6 linked Neu5AcGal two­sugar units you 
hear about in the flu world. In this post we look at the other side of the interaction, not the "lock side" but the 
"key" side, that is, the protein on the virus that fits exactly to the α±­2, 3 or α±­2, 6 linked Neu5AcGal units. As 
we noted in the third post, things now start to get really hairy. This double sugar unit is pretty specialized but it 
is still relatively common and is found in many species. We now know that there is a still finer structure, 
produced by the sugars next in line in the chain, an effect we hadn't appreciated before. Thus the next sugar 
might determine whether a bird virus that likes Neu5Ac α±­linked to galactose through carbon #2 on Neu5Ac 
to carbon #3 on galactose (i.e., an α±­2,3 Neu5AcGal double sugar unit) will be more likely to infect a duck or 
a gull. So the basic idea is simple but its details certainly aren't. Practically this means we still have a lot to learn 
about the consequences of changes in the key protein for what kind of lock it fits. Back to the flu virus. The 
"key" protein, as most of you know, is the hemagglutinin (HA) protein spike that sticks through the surface of 
the virus. There are a lot of these spikes and they cover the surface pretty densely. Lots of "keys" to grap on to 
the right locks (α± linked Neu5AcGal units plus whatever else might be involved we don't know about yet). The 
HA protein has different sections and the outermost of them is called HA1 and it has a part that matches (or 
doesn't match) the cell surface receptor. (Small digression: HA also has other parts recognized by the immune 
system's chemical warriors, the antibodies. Antibodies recognize very specific patterns on HA and if those 
patterns change, as they do with regularity, the antibody may not recognize it any longer. ) Now proteins are 
linear strings of amino acids, one linked to another, the sequence determined by the virus's genetic code. If there 
is a change in the genetic code, the viral protein will have a different sequence of amino acids. A change in the 
code is called a mutation. What is the effect of changing the resulting sequence of the amino acids in the HA? 
This turns out to be a difficult question, in general, although we know the answer in many particular cases and 
we are improving our abilities to predict what will happen by using computer models. One of the problems is 
that while the protein is one long string, like a real string it can fold into a huge number of different shapes. 
Proteins can be globular, ribbon shaped, elongated, threadlike, oblong or many other shapes, as the picture of 
the pink objects in the picture above shows. Predicting what shape a protein will take when you change the order 
or composition of the amino acid sequence is difficult. To show you how complicated the protein shape can be, 
here is a depiction of an HA protein:

The receptor binding site is at the top, indicated with an arrow. You can see how complicated this is (and this is 
a schematic depiction; the actual atoms aren't shown, only patterns they assume, like ribbons or sheets or loops). 
And because the way the long protein chain is folded, amino acids that are very far from each other in the 
sequence can wind up near each other after the folding is done or wind up in a place that the shape of one amino 
acid might hinder binding of the Neu5AcGal unit but another one might not ­­ or something in between. When 
we look at the sequence of amino acids in avian flu viruses (the ones that bind efficiently to α±­2,3 linkages), 
we find that amino acids at certain positions are important. One of these is the position numbered 223 (amino 
acid 223 from the start of the whole sequence; this isn't exactly correct because there are different ways to do 
the numbering, but this isn't too important for our purposes). When this is the amino acid serine, the HA binds 
nicely to α±­2,3. But if it changes to asparagine, it switches its allegiance to α±­2,6 linkages. Mutations are 
designated by the giving the amino acid before the change followed by the position and then the amino acid 
after the change. Hence this mutation would be designated S223N, where the S is abbreviation for serine and N 
the abbreviation for asparagine (you can find the standard amino acid abbreviations here). When we ran this 
series of posts last (in January, 2006), information was dribbling out about mutations seen in isolates from 
Tureky. Turkey was the first stop in the gateway to Europe for H5N1 and it was feared that the spate of cases 
there, eventually totaling 12 cases and four deaths, was the harbinger of a changed virus, perhaps a pandemic 
strain. S223N was one of the mutations seen in the Turkish isolate. In other words, it was a mutation that made 
it easier for the viral HA to bind to α±­2,6 Neu5AcGal, characteristic of human influenza viruses. It was not 
new, even then, having been seen twice before, in a father and son in Hong Kong in 2003 and a fatal case in 
Vietnam last year (see Declan Butler's piece in Nature). Ww now know there was another mutation in the HA 
protein, at position 153. WHO didn't mention it at the time because, as their spokeswoman said, "it is not clear 
what role this particular change plays." This position is adjacent to both the receptor binding site and the site 
that antibodies against HA attack, i.e., it is related to whether the host's immune response can protect against the 
virus. Evasion of antibody response has been associated with a change at or near this site achieved by attaching 
a sugar there. This had been seen in viruses from Hong Kong, Indonesia, Thailand, Vietnam and Yunnan, China 
(Li et al. in Nature 430, 209 ­ 212, 2004). While WHO was correct to say the significance is not known in this 
case, the fact that there is a change at or near a crucial area was additional cause for concern. Which brings us to 
another lesson. WHO had neither justification to dismiss the mutation nor anyone justification for saying it was 
the signal for a changed and more dangerous virus. We simply do not understand the relationship between the 
genetics and the biology well enough to make those predictions (either way). We are observing the evolution of 
this virus without knowing where it will wind up. Some of these changes may be incremental steps toward the 
development of a pandemic strain. Just as plausibly, they may be leading the virus to an evolutionary end that 
serves it well but is without significance to the human species. Wisdom and prudence suggest we assume the 
former, however, especially as preparing our public health and social services infrastructures for a pandemic will 
benefit us whether or not a pandemic with this virus does happen. The story we have detailed in the four posts 
on glycoproteins is a rich and well documented portion of flu biology. We now know that there are interactions 
between these visible proteins and the other internal proteins of the virus that are also important to what species 
the virus infects and what cells within that species are the targets. It is not a simple matter of finding the right 
kind of receptor and matching them up. 

The more we learn, the less we know. But at least now you have some of the language used to express our