You are on page 1of 22

UNIVERSIDAD NACIONAL

DE
SAN
AGUSTIN
Alumno: Blgo. William Apaza Mamani

FACULTAD DE CIENCIAS
BIOLOGICAS

SEGUNDA ESPECIALIDAD EN
LABORATORIO DE ANALISIS CLINICOS
Y BIOLOGICOS

BIOLOGA
MOLECULAR Y
GENTICA
GENE ARNR 16S

DOCENTE: Blgo. Luis Carlos Lizarraga


Vargas

Biologa Molecular y Gentica

NDICE
ABSTRACT

INTRODUCCIN

GENE ARNR 16S

LOS RIBOSOMAS, OPERONES RIBOSMICOS Y EL ARNR 16S


5
RIBOSOMAS

ARNR 16S

CARACTERSTICAS RELEVANTES DEL ARNR 16S

EXTRACCIN DE CIDOS NUCLEICOS

ASPECTOS METODOLGICOS DE LA IDENTIFICACIN BACTERIANA MEDIANTE SECUENCIACIN DEL


ADNR 16S

10

AMPLIFICACIN
11
OLIGONUCLETIDOS INICIADORES
11
SECUENCIACIN DEL AMPLICON
11
ANLISIS DE SECUENCIAS
12
APLICACIONES DE LA SECUENCIA DE ARNR 16S
12
SISTEMAS COMERCIALES
13
BASES DE DATOS Y ESTRATEGIAS DE ANLISIS
13
BASES DE DATOS GENERALES
14
BASE DE DATOS ESPECFICAS
14
PROGRAMAS COMPUTACIONALES
15
TENDENCIAS

16

CONCLUSIONES
17

Biologa Molecular y Gentica

BIBLIOGRAFA

18

ABSTRACT
Phylogenetic relationships among prokaryotes can be inferred from comparisons of
their 16S rRNA (or 16S rDNA) sequences. This has had an enormous repercussion on
bacterial taxonomy, leading to the currently applied system of classification, and
allowing a rapid and precise identification of bacteria. In clinical microbiology,
molecular identification based on 16S rDNA sequencing is applied fundamentally to
bacteria whose identification by means of other types of techniques turns out
impossible, difficult, or requires a lot of time. Amplification of the gene to be
sequenced uses preferably DNA extracted from a bacterial pure culture, but can be
achieved also directly from a clinical sample. The latter has led to the discovery of
new pathogens. Bearing in mind its potential, as the technical resources improve
and the prize becomes more competitive, the identification based on 16S rDNA
sequencing will certainly find a wider application in the clinical microbiology
laboratory.

Biologa Molecular y Gentica

INTRODUCCIN
En 1969, Carl Woese y sus colegas decidieron examinar la secuencia del rRNA 16S
de muchos organismos, con especial nfasis en bacterias inusuales que
previamente eludieron colocacin filogentica. Woese escogi el rRNA 16S para la
construccin de un rbol filogentico, debido a su universalidad y su alta
conservacin en estructura y funcin. Despus propuso que los procariotes fueran
divididos en 2 grupos, llamados arqueobacterias y eubacterias, los cuales son tan
diferentes uno de otro, como cualquiera de ellos lo es de los eucariotes.
La comparacin de las secuencias del rRNA 16S, ha facilitado grandemente la
identificacin de bacterias, incluyendo microorganismos no cultivables, y la
elucidacin de sus relaciones naturales.
Consecuentemente, estas pueden ser utilizadas para determinar relaciones
taxonmicas entre especies que presentan poca interrelacin en su DNA.
Inicialmente se comenzaron a realizar estudios de secuenciacin del rRNA 16S.
Posteriormente, los estudios se extendieron al rRNA 23S. Las secuencias
nucleotdicas constantes del rRNA 16S presentan la ventaja de proporcionar un sitio
de iniciacin adecuado para la elongacin de los cebadores y as aplicar de forma
ms fcil la tcnica de secuenciacin.
La secuenciacin completa del rRNA 5S, debido a su pequeo tamao, es ms
rpida y econmica que las anteriores, e incluso la secuenciacin de determinados
fragmentos del rRNA 5S puede proporcionar una informacin adecuada. Dos
miembros pertenecientes a un mismo gnero pueden poseer entre 114-116 p.b.
comunes de 118-120. Actualmente existe un debate sobre cul es el anlisis ms
adecuado para establecer relaciones filogenticas. El anlisis del rRNA 16S parece
ser el ms adecuado con seres procariotas, ya que contiene aproximadamente 1550
p.b. frente a los 75-120 del rRNA 5S, por lo que pequeas diferencias en los
nucletidos del rRNA 5S afectan mucho ms al resultado final que en el caso del
rRNA 16S.
3

Biologa Molecular y Gentica

Adems de su utilidad en los estudios taxonmicos, la secuenciacin del rRNA se ha


aplicado en identificacin bacteriana. Mediante el anlisis de las secuencias
parciales del rRNA 16S es posible encontrar patrones de secuencias especficos para
grupos, especies o incluso serotipos bacterianos. Para la identificacin de los
microorganismos a ese nivel, se han desarrollado pequeas sondas especficas de la
regin variable del rRNA 16S. Las diferencias en las regiones conservativas
proporcionan as mismo secuencias para el diagnstico de grupos de organismos
relacionados y pueden ser usadas como dianas para sondas especficas de
oligonucletidos. Sondas especficas de rRNA 16S y 23S han sido aplicadas para
establecer diferentes grupos y especies, as como en la identificacin de bacterias.
La hibridacin con sondas especficas permite la identificacin rpida de un gran
nmero de aislados, al mismo tiempo que posibilitan la deteccin directa de
microorganismos concretos en las muestras, usando un extracto de cidos nucleicos
como diana. La sensibilidad de las pruebas puede ser aumentada in vitro aplicando
la tcnica de la reaccin en cadena de la polimerasa (PCR). A partir de un pequeo
fragmento de DNA, es posible amplificar una secuencia diana hasta unos cuantos
microgramos, los cuales pueden ser secuenciados directamente o pueden ser
utilizados como diana de una sonda especfica. El uso combinado de sondas
universales y especficas permite tambin estimar la fraccin de determinados
microorganismos dentro de un conjunto. Por ltimo, se pueden realizar estimaciones
de unidades formadoras de colonias utilizando mtodos de hibridacin de colonias
in situ (FISH).
La precisin de las inferencias filogenticas de las secuencias del rRNA, depende en
el numero de bases comparadas; y para ser completamente efectivas, al menos
deben ser consideradas 1000 bases para cada organismo.
Incluso se han realizado estudios en el mbito evolutivo, intentando delimitar el
origen de las mitocondrias en los eucariotes, logrando descubrir que estas derivaron
por endosimbiosis, de la subdivisin a de las eubacterias prpuras. Sin embargo, la
organelognesis no ha sido exclusiva de este grupo. Las cianobacterias tambin
presentaron relaciones simbiticas con los eucariotes, y su linaje dio origen a los
cloroplastos.
En cuanto a la metodologa de este anlisis, el rRNA 16S es secuenciado utilizando
una modificacin de la tcnica de Sanger (1977) de dideoxinucleotidos, en la que
conocidos primers complementarios a las regiones conservadas del rRNA 16S, son
elongados utilizando una transcriptasa inversa. Las pequeas cadenas de DNA
producidas pueden ser amplificadas mediante la PCR o por clonacin, y despus
secuenciadas mediante un proceso automatizado por electroforesis en geles de
poliacrilamida.
Anteriormente, la metodologa utilizada para estudiar estas secuencias, recaa en el
aislamiento exitoso del rRNA, seguido de la secuenciacin directa utilizando
transcriptasa inversa. Actualmente, estas secuencias pueden ser clonadas y
detectadas por hibridizacin, con genes que codifican para sondas de
rRNA (rDNA) de un organismo diferente. La utilizacin del PCR, permite amplificar
especficamente la regin a secuenciar, utilizando una corta seleccin de primers.
4

Biologa Molecular y Gentica

Estas secuencias amplificadas especficamente, pueden ser subclonadas para


secuenciarse por mtodos convencionales.
Se usan dos estrategias a la hora de aislar genes de rRNA del total de los cidos
nucleicos. Una aproximacin es clonar fragmentos al azar de DNA del medio
ambiente y analizar aquellos que contienen genes de rRNA. Como la cantidad de
DNA clonado que contiene genes de rRNA es pequea, el segundo paso, casi
obligado, es la utilizacin de la PCR para amplificar este rRNA. Como el rRNA esta
altamente conservado en la naturaleza los investigadores utilizan primers
universales para los tres dominios de organismos (eucariotas, bacterias y
arqueobacterias), desde todos los puntos parece aconsejable el uso de la PCR pues
se necesita amplificar el rRNA que antes slo formaba una pequea parte del total.
La manera ms rpida de obtener los constituyentes de los ecosistemas
microbianos es pues mediante el uso de la PCR. En principio la PCR realizada con
estos primers amplifica los genes de RNA de todos los tipos de organismos
presentes en un ambiente. Los tipos individuales de genes en la mezcla son
separados en principio por clonacin y posteriormente son secuenciados.

Gene ARNr 16S


La comparacin de las secuencias de los ARNr 16S (o de los genes que los codifican)
permite establecer las relaciones filogenticas existentes entre los organismos
procariotas.
Este hecho ha tenido una enorme repercusin en taxonoma bacteriana, dando lugar
al sistema de clasificacin vigente y permitiendo la identificacin rpida y precisa de
las bacterias. En microbiologa clnica la identificacin molecular basada en el ADNr
16S se utiliza fundamentalmente para bacterias cuya identificacin mediante otro
tipo de tcnicas resulta imposible, difcil o requiere mucho tiempo. La amplificacin
del gen, para su posterior secuenciacin, parte preferentemente de ADN extrado de
un cultivo puro de la bacteria, pero tambin puede conseguirse directamente de una
muestra clnica. Esto ltimo ha conducido al descubrimiento de nuevos agentes
patgenos. Teniendo en cuenta su potencialidad, a medida que los recursos tcnicos
aumenten y el precio se haga ms competitivo, la identificacin bacteriana basada
5

Biologa Molecular y Gentica

en el ADNr 16S encontrar probablemente una aplicacin ms amplia en el


laboratorio de microbiologa clnica.
LOS RIBOSOMAS, LOS OPERONES RIBOSMICOS Y EL ARNR 16S
RIBOSOMAS
Son orgnulos complejos, altamente especializados, que utilizan los organismos
para el complicado proceso de sntesis de protenas. El ribosoma bacteriano (fig. 1)
tiene un coeficiente de sedimentacin de 70S (expresado en unidades Svedberg), y
puede disociarse en dos subunidades, la subunidad grande (50S) y la subunidad
pequea (30S). Cada subunidad es un complejo ribonucleoproteico constituido por
protenas ribosmicas y molculas de ARNr especficas. La subunidad 30S contiene
el ARNr 16S y 21 protenas diferentes (numeradas desde S1-S21, donde S procede
de small), mientras que la subunidad 50S contiene los ARNr 5S y 23S junto con unas
34 protenas (L1-L34; L, large).

Figura 1. El ribosoma bacteriano. Se muestra un esquema de su estructura, y se indican las


subunidades y macromolculas que lo componen.

En bacterias, los genes que codifican los ARN ribosomales estn organizados en
operones (conjunto de genes que se transcriben a partir de la misma regin
promotora). Cada opern ribosmico (rrn; fig. 2) incluye genes para los ARNr 23S
(rrl), 16S (rrs) y 5S (rrf), separados por regiones espaciadoras o intergnicas (IG), y
contiene adems genes para uno o ms ARN de transferencia (ARNt). El producto de
la transcripcin del opern a partir de dos promotores, P1 y P2, situados en la regin
anterior a rrs, ser procesado por el enzima ARNasa III mediante cortes en sitios
especficos que separan las tres clases de ARNr, el/los ARNt y las dos IG.

Biologa Molecular y Gentica

Figura 2. El opern ribosmico (rrn). A) Representacin esquemtica del opern, donde se muestran los
genes estructurales de los tres tipos de ARNr (rrs, rrl y rrf), los promotores P1 y P2, y las regiones
intergnicas (IG). B) Estrategia de amplificacin del gen rrs (ADNr 16S). Se indica la posicin de los
iniciadores I1 (directo), I2 e I3 (reversos) utilizados para la amplificacin (y posterior secuenciacin) del
gen completo (I1-I3; amplicn de 1500 pb, aproximadamente) o de un fragmento menor (11-I2; 500 pb
correspondientes al extremo 59 del gen; ver explicacin en el texto). C) Visualizacin de ambos
fragmentos por electroforesis en gel de agarosa.

ARNr 16S
Es un polirribonucletido de aproximadamente 1.500 nt, codificado por el gen rrs,
tambin denominado ADN ribosomal 16S (ADNr 16S), a partir de cuya secuencia se
puede obtener informacin filogentica y taxonmica. Como cualquier secuencia de
nucletidos de cadena sencilla, el ARNr 16S se pliega en una estructura secundaria,
caracterizada por la presencia de segmentos de doble cadena, alternando con
regiones de cadena sencilla5 (fig. 3). En eucariotas el ARNr 18S es la macromolcula
equivalente. Dado que los ARNr 16S y 18S proceden de las subunidades pequeas
de los ribosomas, el acrnimo ARNr SSU (del ingls, small subunit) se utiliza para
ambos. Los ARNr SSU se encuentran altamente conservados, presentando regiones
comunes a todos los organismos, pero contienen adems variaciones que se
concentran en zonas especficas (fig. 3). El anlisis de la secuencia de los ARNr 16S
de distintos grupos filogenticos revel un hecho adicional de gran importancia
prctica: la presencia de una o ms secuencias caractersticas que se denominan
oligonucletidos firma6. Se trata de secuencias especficas cortas que aparecen en
todos (o en la mayor parte de) los miembros de un determinado grupo filogentico,
y nunca (o slo raramente) estn presentes en otros grupos, incluidos los ms
prximos. Por ello, los oligonucletios firma pueden utilizarse para ubicar a cada
bacteria dentro de su propio grupo.

Biologa Molecular y Gentica

Figura 3. Estructura secundaria del ARNr 16S (tomada de Neefs et al 5, con permiso de Oxford University
Press; Reino Unido). Las hlices comunes a todos los seres vivos, denominadas hlices universales, se
numeran de la 1 a la 48, en orden de aparicin a partir del extremo 59. Las hlices especficas de
procariotas se indican con Pa-b, donde a es el nmero de la hlice universal precedente y b el nmero
de serie. Las regiones relativamente conservadas se presentan en negrilla. Las regiones variables, en
lneas finas, se designan V1-V9, teniendo en cuenta que V4 es exclusiva de eucariotas. Las regiones
que se muestran en lneas discontinuas slo estn presentes en un nmero limitado de estructuras.

El nmero de copias del opern ribosmico por genoma bacteriano vara


considerablemente, de 1 a 15, siendo relativamente constante a nivel de especie,
gnero e incluso familia (tabla 1). Entre las copias de los ARNr 16S codificadas por
un mismo genoma se ha detectado un cierto grado de heterogeneidad (denominada
microheterogeneidad). El anlisis de 14 genomas bacterianos, cuya secuencia
completa se encuentra disponible, indic una divergencia mxima del 1,23%, que
corresponde a los ADNr 16S de Escherichia coli (tabla 1). Adems, diferentes autores
encontraron variabilidad intragenmica entre los ADNr 16S de otras bacterias de
inters clnico, cuyo genoma an no ha sido secuenciado. Destaca la elevada
heterogeneidad (1,43%) detectada entre las 4 copias del ADNr 16S presentes en la
cepa clnica ADV 360.1 de Veillonella 8. Obviamente, la variabilidad intragenmica,
tiene importantes implicaciones prcticas para la identificacin. Sin embargo, en la
mayor parte de los casos, todas las copias del ADNr 16S de un organismos son
idnticas o casi idnticas.

Biologa Molecular y Gentica

CARACTERSTICAS RELEVANTES DEL ARNR 16S PARA SU UTILIZACIN


COMO HERRAMIENTA FILOGENTICA Y TAXONMICA
Aunque existen cronmetros moleculares alternativos al ARNr 16S, hasta el
momento ninguno ha conseguido desplazarle. De hecho, esta macromolcula
presenta una serie de caractersticas, en base a las cuales fue considerado por
Woese3 como cronmetro molecular definitivo:
1. Se trata de una molcula muy antigua, presente en todas las bacterias actuales.
Constituye, por tanto, una diana universal para su identificacin.
2. Su estructura y funcin han permanecido constantes durante un tiempo muy
prolongado, de modo que las alteraciones en la secuencia reflejan
probablemente cambios aleatorios.
9

Biologa Molecular y Gentica

3. Los cambios ocurren de manera suficientemente lenta, como para aportar


informacin acerca de todos los procariotas y, junto con las variaciones en los
ARNr 18S, a lo largo de toda la escala evolutiva. Los ARNr SSU contienen, sin
embargo, suficiente variabilidad para diferenciar no slo los organismos ms
alejados, sino tambin los ms prximos.
4. El tamao relativamente largo de los ARNr 16S (1.500 nt) minimiza las
fluctuaciones estadsticas.
5. La conservacin en estructura secundaria puede servir de ayuda en las
comparaciones, aportando una base para el alineamiento preciso.
6. Dado que resulta relativamente fcil secuenciar los ADNr 16S existen bases de
datos amplias, en continuo crecimiento.
Una vez determinada la secuencia de nucletidos y establecidas las comparaciones,
ser el grado de similitud entre las secuencias de los ADNr 16S de dos bacterias lo
que indique su relacin evolutiva. Adems, el anlisis comparativo de secuencias
permite construir rboles filogenticos, que reflejan grficamente la genealoga
molecular de la bacteria, mostrando su posicin evolutiva en el contexto de los
organismos comparados.
Hay que tener en cuenta, no obstante, que es la comparacin de genomas
completos, y no la comparacin de los ADNr 16S, la que aporta una indicacin
exacta de las relaciones evolutivas. En su ausencia, la especie bacteriana se define,
en taxonoma, como el conjunto de cepas que comparten una similitud del 70% o
ms,
en
experimentos
de
reasociacin
ADN-ADN.
Stackebrandt
y
Goebel demostraron que cepas con este nivel de relacin presentan tpicamente una
identidad del 97% o ms entre sus genes ARNr 16S. As, cepas con menos del 97%
de identidad en las secuencias de sus ADNr 16S es improbable que lleguen a estar
relacionadas a nivel de especie. Sin embargo, existen cepas que comparten una
similitud inferior al 50% en experimentos de reasociacin, y son por tanto
clasificadas en especies diferentes, pero presentan una identidad del 99-100% a
nivel de ADNr 16S. Por ello, en taxonoma, actualmente se recomienda la
identificacin polifsica, que utiliza criterios fenotpicos junto con datos de
secuenciacin. En microbiologa clnica, esto implica que la secuenciacin del ADNr
16S no aportar siempre una identificacin definitiva a nivel de especie.
EXTRACCIN DE CIDOS NUCLEICOS
Los cidos desoxiribonucleico (ADN) y ribonucleico (ARN) son polmeros de
nucletidos formados por un azcar de cinco carbones (desoxiribosa en el ADNy
ribosa en el ARN), una base nitrogenada (que puede ser adenina, timina, citosina,
guanina o uracilo) y una molcula de fosfato. El ADN es la macromolculaque
contiene la informacin gentica de las clulas procariontes, eucariontes y de los
adenovirus. El ARN est involucrado en la sntesis de protenas y constituye el
material gentico de los retrovirus.
10

Biologa Molecular y Gentica

La expresin de los genes es la base del metabolismo celular, y por sta se entiende
que el ADN se transcribe en ARN, que a su vez se traduce en protenas.
Esta secuencia ADN-ARN-protenas constituye el dogma central de la biologa
molecular. Hay tres tipos de ARN:
El ARN mensajero (mARN), que se sintetiza durante la transcripcin
gracias a la ARN polimerasa, est conformado por codones, que son
secuencias de tres pares de bases que codifican un aminocido en especfico.
El ARN de transferencia (tARN) permite el vnculo entre el tARN y los
aminocidos, ya que en un extremo cuenta con un aminocido y en el otro,
con una secuencia de tres pares de bases llamada anticodn, a la que se une
el codn del mARN.
El ARN ribosomal (rARN), que constituye la mayor parte del ARN en las
clulas, forma junto con protenas a los ribosomas, que facilitan el aco
plamiento especfico entre el mARN y los tARN para la traduccin; los
ribosomas estn compuestos por tres subunidades de rARN de diferentes
tamaos en los eucariontes (23S, 18S y 5S) y procariontes (23S, 16S y 5S).
ASPECTOS
METODOLGICOS
DE
LA
MEDIANTE SECUENCIACIN DEL ADNR 16S

IDENTIFICACIN

BACTERIANA

El mtodo molecular de identificacin bacteriana mediante secuenciacin del ADNr


16S incluye tres etapas:
a) amplificacin del gen a partir de la muestra apropiada
b) determinacin de la secuencia de nucletidos del amplicn,
c) anlisis de la secuencia.

11

Biologa Molecular y Gentica

Figura 4. Etapas a seguir en el proceso de identificacin bacteriana mediante secuenciacin


del ADNr 16S.

AMPLIFICACIN
La amplificacin del ADNr 16S se consigue en un termociclador, gracias a la reaccin
en cadena de la polimerasa (PCR). Como sustrato se utiliza normalmente ADN
purificado a partir de un cultivo puro del agente patgeno. Alternativamente, el ADN
podr obtenerse directamente de la muestra clnica, en el caso de bacterias
fastidiosas o no cultivables, cuando aquella proceda de rganos o tejidos
normalmente estriles. Para la extraccin del ADN bacteriano existen protocolos
generales, pero pueden requerirse modificaciones, dependiendo de la bacteria.
Adems, la amplificacin tambin puede conseguirse directamente a partir de una
colonia aislada o un cultivo lquido de la bacteria de inters, o incluso a partir de una
muestra clnica, simplificando significativamente la identificacin, al evitar el
laborioso proceso de extraccin del ADN.
Oligonucletidos iniciadores
Para la amplificacin del ADNr 16S, las regiones conservadas facilitan el diseo de
oligonucletidos iniciadores (20 nt, aproximadamente). Cuando se pretende
amplificar el ADNr 16S prcticamente completo, se utilizan iniciadores diseados en
base a secuencias conservadas prximas a los extremos 59 y 39 del gen, que
originan amplicones de 1.500 pb, aproximadamente. Se ha demostrado, sin
embargo, que una identificacin precisa no siempre requiere la amplificacin, y
12

Biologa Molecular y Gentica

posterior secuenciacin, del ADNr 16S completo. En estas circunstancias se


utilizarn oligonucletidos que permitan la amplificacin de fragmentos de menor
tamao, preferentemente las 500 pb correspondientes al extremo 59 del gen (v.
ms adelante). En cualquier caso, antes de pasar a la siguiente etapa es
conveniente comprobar el producto mediante electroforesis en gel de agarosa, para
asegurar la presencia de un nico fragmento, amplicn, del tamao adecuado.
Secuenciacin del amplicn
En esta etapa se llevan a cabo las reacciones de secuenciacin y el anlisis de los
productos por electroforesis. Actualmente, se emplea la secuenciacin cclica, en
una reaccin similar a la de amplificacin, que utiliza un nico iniciador por reaccin
y terminadores marcados con fluorocromos adecuados, que interrumpirn la sntesis
de manera aleatoria, y facilitarn la deteccin posterior de los fragmentos
interrumpidos.
La disponibilidad de secuenciadores automticos facilita enormemente la etapa de
deteccin. El nmero de bases generadas por un secuenciador automtico es de
500 a 900, dependiendo del capilar utilizado en la electroforesis. Por ello, para la
secuenciacin de las dos cadenas del ADNr 16S completo, sern necesarios de 8 a 4
iniciadores, dos de los cuales podrn ser los mismos utilizados en la amplificacin.
Sin embargo, la secuencia obtenida podr contener errores y/o presentar posiciones
ambiguas (indicadas por N). Por ello, la obtencin de la secuencia definitiva requiere
la evaluacin de los electroferogramas y la alineacin de la cadena directa con la
reversa, para resolver las posibles discrepancias. As, aunque la secuenciacin de
una cadena del amplicn puede conducir a una correcta identificacin, la calidad de
la secuencia ser ptima cuando la comparacin de ambas cadenas se utiliza para
la correccin de errores.
Ya se ha indicado que la identificacin de una bacteria a nivel de especie no requiere
necesariamente la secuenciacin del ADNr 16S completo. De hecho, aunque existen
posiciones filogenticamente informativas a lo largo de todo el gen, la mayor
variabilidad se concentra en las primeras 500 bases, correspondientes al extremo
59. Generalmente, esta secuencia de 500 bases ser suficiente para la correcta
identificacin de un aislado clnico, necesitndose nicamente 2 iniciadores. En
cualquier caso, la secuenciacin de las dos cadenas del ADNr 16S completo ser
necesaria a la hora de identificar nuevos patgenos.
Anlisis de la secuencia
La ltima etapa ser la comparacin de la secuencia del ADNr 16S con las
depositadas en bases de datos. Actualmente existen distintas bases de datos,
algunas pblicas, cuyo acceso es libre a travs de internet, como GenBank NCBI
(National Center for Biotechnology Information), EMBL (European Molecular Biology
13

Biologa Molecular y Gentica

Laboratory), RDP (Ribosomal Database Project), RIDOM (Ribosomal Differentiation of


Medical Microorganisms), y otras privadas, como MicroSeq (Applied Biosystems) y
SmartGene IDNS (Integrated Database Network System).
RDP es la principal base de datos de secuencias de ADNr (no slo 16S, sino tambin
23S de procariotas, y 18S y 28S de eucariotas). Permite la comparacin de
secuencias on line, y ofrece otras muchas posibilidades (incluida la construccin de
rboles filogenticos; ver ms adelante). En octubre de 2003 contena ms de
78.000 secuencias de ADNr 16S, que son alineadas, teniendo en cuenta la
estructura secundaria de la molcula. La base de datos RIDOM se limita tambin a
secuencias de ADNr, centrndose exclusivamente en microorganismos patgenos.
Como se ver posteriormente, la eleccin de la base de datos es importante, siendo
recomendable la utilizacin de ms de una de ellas, para comprobar si conducen al
mismo resultado. Finalmente, se podr construir un rbol filogentico, que refleja,
de forma esquemtica, el grado de parentesco gentico entre las bacterias
comparadas.
Aplicaciones de
microbiolgico

la

secuenciacin

del

ARNr

16S

en

el

diagnstico

La identificacin basada en la secuenciacin del gen que codifica el ARNr 16S en los
laboratorios clnicos se centra principalmente en cepas cuya identificacin por
mtodos fenotpicos resulta imposible, difcil o requiere mucho tiempo, incluyendo
los siguientes casos:
1. Bacterias no cultivables presentes en muestras clnicas, hecho que en ocasiones
ha conducido al descubrimiento de nuevos agentes patgenos.
2. Bacterias cuyas caractersticas bioqumicas no se adaptan a las de ningn
gnero o especie reconocido. Esta situacin puede presentarse cuando se trata
de patgenos nuevos, patgenos infrecuentes o tambin cepas de especies
comunes que exhiben un perfil bioqumico ambiguo.
3. Bacterias para las cuales la caracterizacin fenotpica sea sustancialmente
deficiente.
4. Bacterias fastidiosas, a consecuencia de sus requerimientos nutricionales.
Bacterias de crecimiento lento, que retrasa considerablemente la identificacin
convencional
Sistemas comerciales
La identificacin bacteriana basada en el anlisis de la secuencia del ADNr 16S se
facilita grandemente por la disponibilidad de sistemas comerciales. Entre ellos
destaca MicroSeq500 (Applied Biosystems; Foster City, EE.UU.), diseado para la
identificacin rpida y correcta de bacterias patgenas. Este sistema utiliza un par
de oligonucletidos que permiten amplificar un fragmento de 527-bp
14

Biologa Molecular y Gentica

correspondiente al extremo 59 del ADNr 16S. En realidad se trata de una versin


simplificada del "MicroSeq 16S rRNA" original (tambin disponible en Applied
Biosystems), que slo requiere dos iniciadores para la secuenciacin de ambas
cadenas, reduciendo de manera considerable el coste y el trabajo requeridos para la
identificacin. Como parte del sistema, se incluye una base de datos para
determinar el gnero y la especie del aislado. Adems, el software permite exportar
las secuencias que podrn ser comparadas con otras bases de datos, e incluye
herramientas para el anlisis filogentico. La utilidad de MicroSeq500 ha sido
ampliamente demostrada para una gran variedad de patgenos bacterianos. El
coste de cada identificacin estimado en diferentes laboratorios vara
considerablemente: 84 a 144 1, sin el gasto previo destinado a tener en cuenta
equipamiento (termociclador, secuenciador automtico, etc.). S se incluyen los
gastos de extraccin, material desechable, reactivos, utilizacin de la base de datos
y salarios del personal de laboratorio. Dado que la mayor proporcin corresponde a
este ltimo concepto, el coste por identificacin se reduce de manera considerable
al identificar ms de un aislado simultneamente.
Actualmente, otro aspecto a favor es la disponibilidad de kits comerciales
independientes para cada etapa del proceso de identificacin (extraccin de ADN,
amplificacin por PCR y secuenciacin), as como la posibilidad de recurrir a
servicios comunes de secuenciacin automtica. Esto ltimo resulta interesante, ya
que slo requiere generar el producto de PCR, cuya secuencia ser determinada por
el servicio de secuenciacin y remitida directamente al laboratorio solicitante, por
correo electrnico. En nuestro laboratorio se han utilizado, con excelentes
resultados, los Servicios de Secuenciacin Automtica de la Universidad de Oviedo,
del Hospital Central de Asturias y del Centro Superior de Investigaciones Biolgicas
(Consejo Superior de Investigaciones Cientficas). En estos casos, partiendo del
amplicn, la secuencia puede estar disponible en 24-48 h, a un precio de 10-12 1
por reaccin. Muchos otros hospitales espaoles disponen tambin de
secuenciadores automticos de ADN.
Bases de datos y estrategias de anlisis
Debido a que la asignacin taxonmica se realiza por comparacin de secuencias,
las bases de datos donde se almacenan estas secuencias, las herramientas de
bsqueda y las estrategias de comparacin son primordiales. Existen distintas bases
de datos y programas que se pueden utilizar para la asignacin taxonmica; cada
programa sigue diferentes estrategias de anlisis y las bases de datos con las que
operan muestran algunas variaciones. El nivel de desarrollo que han alcanzado los
estudios sobre el ARNr 16S y sus aplicaciones, ha favorecido el establecimiento de
bases de datos especficas, que son herramientas fundamentales para la
clasificacin taxonmica microbiana.

15

Biologa Molecular y Gentica

1. Bases de datos generales


El Centro Nacional para la Informacin Biotecnolgica (NCBI) de los Estados
Unidos es la institucin con mayor nmero de secuencias depositadas en sus
bases de datos, el GenBank, con ms de 182 millones de registros. Las
secuencias del ARNr 16S estn localizadas en dos bases de datos con
secuencias de nucletidos: la base de datos no redundante, que contiene ms
de 30 millones de registros, y la base de datos 16S, que contiene solamente
secuencias (17,600, completas en su mayora) del ARNr 16S de bacterias y
arqueas identificadas. Si bien ambas bases de datos pueden servir como
referencia para la bsqueda y comparacin de secuencias nucleotdicas,
mediante el algoritmo BLAST, la base de datos no redundante es ms amplia y
contiene las colecciones de secuencias del GenBank, del Instituto Europeo de
Bioinformtica (EMBL-EBI), del Banco de Datos de ADN de Japn (DDBJ), y del
Banco de Datos de Protenas (PDB), adems de las secuencias de referencia del
NCBI (RefSeq). Se le considera no redundante porque en algunos casos las
secuencias idnticas han sido fusionadas en una sola entrada, que conserva el
nmero de acceso, el identificador del GenBank, ttulo e informacin taxonmica
para cada secuencia.

2. Bases de datos especficas


Aunque el gen ARNr 16S originalmente se utiliz para la identificacin de
bacterias, hoy en da es utilizado como un estndar en la clasificacin e
identificacin de microorganismos y las secuencias estn disponibles en muchas
bases de datos pblicas. Sin embargo, con frecuencia esas secuencias no han
sido validadas y por ello se han creado varias bases de datos que recolectan
nicamente secuencias 16S. Algunas bases de datos, como la de Greengenes
(http:// greengenes.lbl.gov/), no se encuentran actualizadas pero permiten el
acceso a y descarga de las secuencias registradas. A continuacin, se
mencionan las bases de datos ms importantes.
a. SILVA: Bases de datos de ARN ribosomal de alta calidad
SILVA es un portal (http://www.arb-silva.de) que alberga secuencias del ARNr
tanto de 16S/18S (subunidad pequea, SSU) como de 23S/28S (subunidad
grande) para los dominios Bacteria, Archaea y Eukarya. Para la SSU, la
informacin se encuentra en tres bases de datos que se diferencian por el
tamao y la calidad de las secuencias: (1) SSU Parc contiene ms de 4.3
millones de secuencias con tamao mayor que 300 nucletidos; (2) SSU Ref
contiene ms de 1.5 millones de secuencias de buena calidad y con longitud
cercana a la del gen completo (1450 nucletidos); y (3) SSU Ref NR contiene
ms de 534,000 secuencias no redundantes, que bsicamente son las
mismas de la base de datos SSU Ref, pero con similitud por debajo del 99%.
Todas las secuencias estn asociadas a su registro en GenBank, taxonoma,
16

Biologa Molecular y Gentica

alineamiento de secuencias mltiples, informacin del tipo de cepa y ltima


nomenclatura vlida.
Adems de las bases de datos, SILVA dispone del programa SILVA Incremental
Aligner (SINA), que permite alinear cientos de secuencias sobre la base de
alineamiento semilla utilizando una combinacin de bsqueda pork-meros y
un alineamiento de orden parcial para mantener alta exactitud de alineacin.
Posterior al alineamiento, es posible clasificar taxonmicamente a travs del
mtodo del ancestro comn ms bajo (LCA), basado en diferentes taxonomas
alojadas por SILVA (SILVA, LTP, Greengenes, RDP, EMBL).

b. Ribosomal Database Project


El
Ribosomal
Database
Project
(RDP)
es
un
portal
(https://rdp.cme.msu.edu/index.jsp) de la Universidad Estatal de Michigan
(EUA) que, adems de contener secuencias de ARNr 16S alineadas y con
anotaciones, proporciona servicios de anlisis y un marco de referencia
taxonmico y filogentico. En esta base de datos se encuentran ms de tres
millones de secuencias de bacterias y arqueas, tanto cultivables como no
cultivables. Las secuencias son alineadas por medio de un programa de
alineamientos basados en el contexto estocstico (INFERNAL: INFERence of
RNA ALignment) que incorpora informacin sobre la estructura secundaria del
ARNr16S. Para la identificacin taxonmica, esta base de datos utiliza la
herramienta RDP Classifier, la cual se basa en un algoritmo Bayesiano
sencillo.
c. EzTaxon
La base de datos EzTaxon (http://www.ezbiocloud.net/eztaxon) originalmente
inclua solamente las secuencias de 16S de cepas bacterianas tipo de
especies identificadas. Posteriormente se ampli al incluir el registro de
secuencias provenientes de especies no cultivadas, las cuales son muy
frecuentes en los estudios medioambientales. Actualmente, esta base de
datos contiene ms de 64,000 especies y filotipos, y para la bsqueda de
secuencias similares se utiliza BLAST y MEGABLAST, adems de un riguroso
alineamiento de secuencias globales por pares.
3. Programas computacionales
a. MEGAN es un programa que permite el anlisis de secuencias
metagenmicas mediante la herramienta de comparacin BLAST y el
algoritmo LCA para la asignacin de taxones, y utiliza como referencia la
taxonoma del NCBI.

17

Biologa Molecular y Gentica

b. PhymmBL es un programa diseado para la clasificacin taxonmica de


lecturas cortas de secuencias metagenmicas. Bsicamente, el programa
combina las predicciones taxonmicas basadas en composicin (Phymm) y
aquellas basadas en la homologa (BLAST).
c. RITA es un programa que realiza un consenso entre los enfoques basados en
homologa y aquellos basados en composicin, lo cual incrementa de forma
importante la certeza en las asignaciones taxonmicas. RITA utiliza un
clasificador Bayesiano ingenuo e involucra a algoritmos optimizados de
deteccin de homologa, por lo que es ms rpido que PhymmBL y otros
programas.
d. Kraken es un programa para la asignacin de niveles taxonmicos de
secuencias metagenmicas que utiliza el alineamiento exacto de la secuencia
problema con la base de datos de k-meros, lo cual lo convierte en una
herramienta rpida en comparacin con las que realizan el alineamiento
inexacto. Adems, provee una mayor riqueza taxonmica, ya que el utilizar kmeros de 31 pares de bases le permite una alta sensibilidad entre secuencias
con un alto grado de similitud. La sensibilidad y precisin se modifican
dependiendo de la base de datos que utiliza el programa para hacer las
comparaciones.
e. RDP Classifier es un clasificador Bayesiano ingenuo que permite la rpida
clasificacin de bacterias con asignaciones taxonmicas de dominio a gnero.
Utiliza "palabras" de ocho bases subsecuentes, logrando un equilibrio entre la
sensibilidad y la velocidad de anlisis o requerimientos computacionales. La
posicin de la palabra es ignorada y solamente las palabras que se
encuentran contribuyen en la calificacin. Este programa es til para analizar
secuencias largas y no discrimina bien al utilizar secuencias cortas.
4. Tendencias
Existen mltiples estrategias para el uso del ARNr 16S como herramienta de
identificacin de los organismos presentes en comunidades microbianas; sin
embargo, se hace patente que la clasificacin precisa de los microorganismos es
una tarea compleja. Ms an, la identificacin de organismos de una comunidad,
ya sea que se utilice la secuencia completa o una regin del ARNr 16S, se facilita
si una buena proporcin de sus miembros ha sido previamente localizada dentro
de un arreglo taxonmico. En ambientes como el marino, donde la vida
microbiolgica ha sido poco revelada, la tarea de identificacin se ve dificultada
por la ausencia de secuencias de referencia. Muchas investigaciones centradas
en la caracterizacin de comunidades microbianas de ambientes poco conocidos
encontraron en las nuevas tcnicas de secuenciacin una opcin para generar
informacin gnica, pero se enfrentaron con otras limitantes inherentes a la gran
extensin de datos crudos producidos en la secuenciacin, como
almacenamiento, procesamiento, anlisis e interpretacin. Afortunadamente,
todas las limitantes se han ido resolviendo gracias al desarrollo de la
18

Biologa Molecular y Gentica

infraestructura computacional y el desarrollo de algoritmos y programas con la


precisin suficiente para la identificacin microbiana.
Con la secuenciacin masiva se ha generado una gran cantidad de secuencias
parciales y los esfuerzos para obtener una secuencia completa an no dan los
resultados deseados. Muchos estudios que utilizan secuencias parciales para la
identificacin microbiolgica no encuentran una secuencia de referencia, y
reducen la certeza de las determinaciones taxonmicas. En otros casos, el
resultado puede ser una sobreestimacin de la diversidad. En el anlisis de una
comunidad simulada, construida por las secuencias del ARNr 16S de bacterias
del suelo pertenecientes a 20 OTUs y usando fragmentos que incluan a las
regiones V4/V5 y V2/V3, despus de un proceso adecuado de seleccin de
calidad y eliminacin de quimeras, se encontraron de 72 a 333 OTUs,
dependiendo de las condiciones experimentales durante la secuenciacin. Por
ello, para mantener el paralelismo con el desarrollo de las tcnicas "micas" y el
incremento exponencial de las bases de datos del ARNr 16S y, particularmente
en el estudio de las comunidades bacterianas marinas, es necesario contar con
un mayor nmero de secuencias completas de este gen para resolver con mayor
precisin y reproducibilidad las distintas asignaciones taxonmicas.

Conclusin
Una variedad de genes diferentes del gene 16S rRNA pueden ser utilizados para
estudios de diversidad bacteriana. Sin embargo, una limitante es que solo la base de
datos de genes 16S rRNA es suficientemente amplia en comparacin con la base de
datos de otros genes. El uso de otros genes es valioso para disear reacciones de
PCR especficas de especies bacterianas y pueden dar una visin ms precisa de la
filogenia de bacterias muy cercanas y difciles de distinguir mediante anlisis solo
del gene 16S rRNA. Por otro lado, cuando se requiere detectar una actividad
metablica ms que una especie o un grupo particular de bacterias, algunos genes
codificando por enzimas responsables de esta actividad es posible.
19

Biologa Molecular y Gentica

Bibliografa.
1. SECUENCIAS DE ADN RIBOSOMAL 16S EN MUESTRAS BACTERIANAS UTILIZANDO
LA TCNICA DE PCR. Riao Rojas Laura Mara, Quintero Ruiz Ludy Marcela, Pulido
Soler Nancy, Fonseca Milln Arnulfo, Ros Ortiz Hctor Fabio. Universidad
Nacional Abierta y a Distancia. UNAD. Escuela de Ciencias Agrcolas Pecuarias y
del Medio Ambiente EMCAPA.
2. MALDONADO, Eneida. Biologa Molecular en Medicina. Ed: Limusa, S.A. de CV.
Mxico D.F. 1996.

20

Biologa Molecular y Gentica

3. KLINDWORTH, Anna., PRUESSE, Elmer., SCHWERR, Timmy., PEPLIES, Cristian.,


HORN, Mathias., GLOCKNER, Frank O. Evaluacin de los Genes 16S Ribosomal
RNA Genes Primers de PCR para Estudios de Diversidad Clsicos y de Nueva
Generacin Basada en la Secuenciacin. Oxford Journals. Nucleic Acids
Research. 31/10/2012
4. Madigan, MT., JM Martinko y J Parker, 2000. Brock biology of microorganisms.
Prentice Hall, Upper Saddle River, NJ. 991 pp.
5. Boom, R., C J Sol, M M Salimans, C L Jansen, P M Wertheim-van Dillen y J van der
Noordaa, 1990. Rapid and simple method for purification of nucleic acids.
Journal of Clinical Microbiology
6. Rodicio,
Mara del Rosario y Mendoza, Mara del Carmen. Identificacin
bacteriana mediante secuenciacin del ARNr 16S. Departamento de Biologa
Funcional. rea de Microbiologa. Universidad de Oviedo. Espaa

21

Biologa Molecular y Gentica

You might also like