Unidad Profesional Interdisciplinaria de Ingenieras
Campus Guanajuato
Ingeniera Farmacutica
Laboratorio de Biotecnologa Farmacutica
Reporte de la prctica #3: Bioinformtica
Integrantes:
Yvan Arroyo Gnem Omar Enrique Murillo Ayala Jana Arriaga Moreno Maritza Fernanda Reyes Ziga Deyandira Barroso Salas
Fecha de entrega: 25 de Septiembre del 2014
Grupo: 6FV1
Objetivos Objetivo general: Conocer, aprender e interactuar con las bases de datos actualmente utilizadas para realizar anlisis de datos biolgicos y utilizarlas para analizar una secuencia elegida.
Objetivo especfico: Seleccionar una secuencia nucleotdica de la base de datos de NCBI y analizarla mediante el uso de BLAST y ExPASy terminando con el diseo de un juego de Primers con ayuda de DNASTAR.
Introduccio n En la actualidad la Bioinformtica es, en un contexto general, la disciplina que resulta de la aplicacin en la computadora, as como las teoras, mtodos y procedimientos que le son propios, al mbito de las Ciencias de la Vida. No obstante, actualmente no parece haber un acuerdo general sobre cules son los objetivos y el mbito de aplicacin de esta disciplina. (Lahoz, 2010). Al contrario, varias son las escuelas o tendencias en las que se rigen los investigadores. Tal es la escuela formal, que define a la Bioinformtica como la aplicacin de los sistemas computacionales en la investigacin, almacenamiento y anlisis de la informacin biolgica (Sobral, 1997). El trmino informacin biolgica hace referencia a las secuencias de protenas y cidos nucleicos (ADN y ARN). La bioinformtica es por sus caractersticas una disciplina integradora que surge del encuentro o reunin de aquellos proyectos en los que un sistema biolgico es analizado, modelado o simulado aplicando teoras, mtodos y procedimientos informticos. (Lahoz, 2010). Por este motivo, la Bioinformtica es la disciplina que rene o da cabida a los experimentos clsicos de simulacin en Biologa, el estudio de las secuencias de protenas y cidos nucleicos y que han conducido al desarrollo actual de la Genmica y Protemica, los modelos y las tcnicas de Vida Artificial e Inteligencia Artificial, el diseo y mantenimiento de bases de datos, bibliotecas on line etc... (Lahoz, 2010) Segn la definicin del National Center for Biotechnology Information (NCBI) la Bioinformtica es la disciplina cientfica que combina ciencias como la biologa, computacin y las tecnologas de la informacin. El objetivo de esta disciplina es investigar y desarrollar herramientas tiles para llegar a entender el flujo de informacin. Inicialmente, la Bioinformtica se ocupaba sobre todo de la creacin de bases de datos de informacin biolgica, especialmente secuencias, y del desarrollo de herramientas para la utilizacin y anlisis de los datos contenidos en esas bases de datos. La Bioinformtica ha ido evolucionando para ocuparse cada vez con mayor profundidad del anlisis e interpretacin de los distintos tipos de datos (secuencias de genomas, proteomas, dominios y estructuras de protenas, etc). (Consultado en: http://gmo- crl.jrc.ec.europa.eu/capacitybuilding/manuals/Manual%20ES/Sesi%C3%B3n6.pdf. Recuperado el 24/09/14) Las bases de datos que se utilizan en la biologa molecular son archivos de datos de diferentes reas que son almacenados eficaz y uniformemente y son de uso pblico para la comunidad cientfica). (Lourdes, 2009). Hay que tener en cuenta los siguientes aspectos: - Los proveedores de recursos: centros u organizaciones especializadas en tener y mantener las bases de datos. - Las bases de datos: hay mucha variedad. - Las herramientas para estudiar y analizar toda la informacin contenida en las bases de datos y as poder extraer conocimiento en sentido biolgico a partir de ellas.
Existen bases de datos primarias que contienen secuencias de DNA y de protenas, estructuras de protenas y perfiles de expresin de genes y protenas. Cada registro de estas bases de datos contiene una secuencia y su correspondiente "anotacin" (comentarios que incluyen informacin acerca de esa secuencia, habitualmente hechos de modo manual por algn anotador). (Lourdes, 2009). Las bases de datos secundarias archivan los datos que son fruto del anlisis de las bases de datos primarias, tales como familias de protenas, motivos o dominios proteicos, familias de genes, mutaciones, polimorfismos, implicacin en enfermedades, etc. (Lourdes, 2009). Existen cientos de bases de datos, por el tipo de informacin se pueden distinguir: bibliogrficas, taxonmicas, de nucletidos, genmicas, de protenas, de microarrays y otras. Cabe mencionar que existe un catlogo completo de todas las Bases de Datos disponibles y aparece todos los aos en la revista Nucleic Acids Research. (Lourdes, 2009). Las bases de datos de secuencias de nucletidos son muy importantes para la biologa. Existe una colaboracin internacional entre las 3 principales bases de datos de nucletidos: EMBL-Bank, DDBJ (DNA Data Bank of Japan) y GenBank en el NCBI. Estas bases de datos intentan alojar todas las secuencias de nucletidos que son de dominio pblico. Estn divididas en varias secciones que reflejan grupos taxonmicos, adems de otros grupos tales como secuencias EST (expressed sequence tag), patentes, secuencias HTGs (high-through- put genomic sequences), etc. (Lourdes, 2009).
ExPASy es el acrnimo del ingls Expert Protein Analysis System, Sistema Experto de Anlisis de Protenas, un servidor de protemica del Instituto Suizo de Bioinformtica (Swiss Institute of Bioinformatics, SIB) que analiza secuencias y estructuras de protenas y 2D-PAGE. El servidor funciona en colaboracin con el Instituto Europeo de Bioinformtica (European Bioinformatics Institute, EBI) desde el 1 de agosto de 1993. El ExPASy tambin gestiona las bases de conocimiento de secuencias de protenas UniProtKnowledgebase/Swiss-Prot y UniProtKnowledgebase/Trembl. (ExPASy, 2014).
DNASTAR es un software de Bioinformtica para el ADN, el ARN y el anlisis de secuencias de protenas, incluyendo Sanger y la secuencia de montaje de ltima generacin. El uso de esta herramienta permite el diseo de primers para llevar a cabo la duplicacin de fragmentos de ADN de inters (PCR), el primer reacciona con la hebra sencilla de ADN obtenida tras una desnaturalizacin aparendose en lugares especficos por complementariedad de bases. Se asegura una tcnica de PCR adecuada y por ende la obtencin del gen de inters. (DNASTAR, 2014)
La tcnica de PCR brinda mejores resultados con el uso de la bioinformtica pues se disean Primers ms especficos con el fin de asegurarse de obtener el gen de inters. La tcnica de PCR comprende tres etapas; la desnaturalizacin; donde se rompe la doble hebra de ADN usando temperaturas de 94C-96C. El apareamiento es otra etapa donde los primers se aparean en lugares especficos por complementariedad de bases a 50C-60C. La ltima etapa comprende la extensin o polimerizacin donde se sintetiza la secuencia complementaria de las hebras de ADN con ayuda de DNA polimerasa a temperaturas de 70-72. Una vez obtenidas las copias de los fragmentos de DNA de inters, se requiere la separacin de los fragmentos y la identificacin de los mismos con ayuda de una electroforesis. Los mapas de restriccin permiten identificar los sitios especficos donde las endonucleasas llevaran a cabo los cortes en ADN, antes de realizar la electroforesis. La electroforesis es una tcnica que permite realizar cortes de fragmentos de ADN as como determinar el tamao de los mismos. Recuperado de: http://gmo- crl.jrc.ec.europa.eu/capacitybuilding/manuals/Manual%20ES/Sesi%C3%B3n6.pdf. 24/09/14
Diagrama de flujo
Elegir una secuencia de un gen Contar las bases que componen la secuencia Ingresar a NCBI Obtener el BLAST Dejar solamente la secuencia de aminocidos traducidos que correspondan a la protena analizada Contar aminocidos Calcular PI y PM con ExPASy Disear Primers con DNASTAR Resultados
Gen elegido:
Justificacin de eleccin del gen:
Elegimos trabajar con Bacillus weihenstephanensis para disear los Primers y llevar a cabo todo el proceso bioinformtico correspondiente a la prctica ya que es un microorganismo de inters cientfico reciente. Algunos de los antecedentes que se encontraron en la literatura donde se aplica la tcnica de PCR para el gen de este microorganismo se describen a continuacin.
Cepas bacterianas pertenecientes al grupo Bacillus cereus pueden ser aislados de varios tipos de alimentos, ya que son habitantes del suelo en diferentes zonas climticas (Stenfors et al., 2002) y pueden contaminar fcilmente los alimentos crudos, as como los equipos de procesamiento de alimentos. La leche y los productos lcteos pasteurizados son una fuente comn de aislamiento de cepas psicrotolerantes de especies de Bacillus (Christiansson et al., 1989). B. cereus puede producir mal sabor en la leche as como causar el defecto llamado crema Bitty. (Meer et al., 1991)
En 1998, Bacillus weihenstephanensis se sugiri como una nueva especie del gnero B. cereus con base en las diferencias de secuencia en los genes de ARN ribosomal y protenas. Aunque las cepas psicrotolerantes constituyen claramente un grupo separado en el estudio de 1998, tambin estaba claro el alto grado de similitud en las secuencias de ADN, en la que las especies del grupo B. cereus estaban estrechamente relacionadas. Dado que las cepas de B. weihenstephanensis difieren en una caracterstica fisiolgica y la temperatura ptima de crecimiento, existe una necesidad de establecer otras propiedades que son diferentes de las de B. cereus. La patogenicidad de B. cereus est bien establecida, ya que segn la literatura puede causar infecciones sistmicas, adems de ser un importante contribuyente a las estadsticas de intoxicacin alimentaria de algunos pases (Noruega, Japn, los Pases Bajos), B. cereus produce una toxina emtica y al menos tres enterotoxinas asociadas al tipo diarreica de intoxicacin alimentaria (Vaisanen et al., 1991). La enterotoxina hemoltica Hbl ha sido bien caracterizada y tiene varios efectos biolgicos, como causar gastroenteritis de origen alimentario (Van et al., 1990). Hbl consiste en tres protenas, B, L1 y L2, que es similar a la composicin de la enterotoxina no hemoltica Nhe (Lechner et al., 1998) . Un tercio de la enterotoxina que causa la gastroenteritis por B. cereus fue descrita recientemente despus de un brote en Francia, en el que tres personas murieron. Esta toxina fue nombrado CYTK, y se compone de una sola protena necrtica y hemoltica de 34 kDa (Lund et al., 2000). Es por eso que Lotte et al., 2002 trabajaron con veintitrs cepas de B. weihenstephanensis las cuales fueron sometidas a PCR para probar la presencia de componentes de genes que codifican las enterotoxinas Hbl, Nhe y CYTK. (Ver Tabla 1)
Tabla 1. Secuencias y genes amplificados de B. weihenstephanensis.
La secuencia con la que se trabaj en la presente prctica es la siguiente:
- Contar cuantas bases componen la secuencia a analizar, en la misma pgina de Word. La secuencia tiene 1516 Bases. - Buscar en Google: ncbi (http://www.ncbi.nlm.nih.gov/) - Presionar: BLAST - Presionar: nucleotide BLAST - Copiar la secuencia y pegarla en el recuadro
- Cambiar el parmetro: Choose Search Set, en lugar de Human genomic, poner others. - Presionar: Blast (botn azul, hasta debajo de la pantalla) - Enseguida aparecen todas las comparaciones de tu secuencia con los genomas de los dems organismos:
La secuencia que se copi, pertenece a un fragmento de un gen, ya que, como indica la informacin adquirida anteriormente, se trata de una secuencia parecida a Homocysteinemethyl Transferase (Bacillus weihenstephanensis KBAB4), de longitud de 325 aminocidos, de tal manera que en nuestra secuencia, del nucletido 5 al 964, tenemos un fragmento del gen, que va del aminocido 1 al 325.
Ubica la secuencia aminoacdica de la protena que identificaste dentro de la secuencia nucleotdica que analizaste. - Busca en Google : Expasy, presiona translate (http://expasy.org/tools/dna.html) - Copiar la secuencia y pegarla en el recuadro - Cambia el parmetro: Output format, por: includes nucleotide sequence
- Presionar: Translate sequence - Buscar, dentro de los 6 marcos que predice el expasy, la secuencia que corresponda con la protena que predijo el Blast. Ubicacin de la secuencia aminoacdica de la protena identificada dentro de la secuencia nucleotdica tambin analizada anteriormente:
- 5'3' Frame 2 - aatcaacccaattgatgctattttatcccaacattccattatgcttcttgacggagcatta - I N P I D A I L S Q H S I M L L D G A L - gctacagaattggaggcgcatggatgtaatttggacgatcccctttggtcggcacgtgtg - A T E L E A H G C N L D D P L W S A R V - ttactagaaaatccggaactaatttatcaggttcattcggactattttcgtgctggagcg - L L E N P E L I Y Q V H S D Y F R A G A - gactgtgccataacagcaagctatcaagctactattagtggtttttccgcgcgtggaata - D C A I T A S Y Q A T I S G F S A R G I - caagaacaggaagctttggaattaattaagaaaacggtgttacttgcaagaagggcaaga - Q E Q E A L E L I K K T V L L A R R A R - gatgatttttggaaggaaaatacgcaaacgaataggcctaaaccattggttgttgcatca - D D F W K E N T Q T N R P K P L V V A S - gttgggccgtacggggcttaccttgcagatggttcagagtatgtaggcaactatggtgtg - V G P Y G A Y L A D G S E Y V G N Y G V - acagataaaacattagcagactttcaccgttcgagaatgtcagcgttaatcgaagcaggt - T D K T L A D F H R S R M S A L I E A G - gcagatctattggcatttgaaacgatcccttccctgcaagaagcaagagtattagataca - A D L L A F E T I P S L Q E A R V L D T - ttattgcgtgagtttccagaaacatatgcttggctttccttttcgctaaaaaatgagaaa - L L R E F P E T Y A W L S F S L K N E K - gagattagtgaaggtatgaaactcgtggagtgtgcacgagcttttgagaaaagtgaacaa - E I S E G M K L V E C A R A F E K S E Q - attgtagcgataggcatcaattgtgcgccagtaaccgttgtgactggtgcaatccaagag - I V A I G I N C A P V T V V T G A I Q E - ttgagggcaaacaccaaaaaaccgattattgtttatccaaactcgggtgaaacttataat - L R A N T K K P I I V Y P N S G E T Y N - ccagaatcaaaaacatggcatggtcatgaacaatgtaacgcgttggatattcaatctgaa - P E S K T W H G H E Q C N A L D I Q S E - gaatggtaccaagcaggtgcacgtttaataggtggatgctgcagaacgacaccttatcac - E W Y Q A G A R L I G G C C R T T P Y H - attgaggagatatcgaacaagtggcgttcttccgagtttttctattcgaacgaagcaaaa - I E E I S N K W R S S E F F Y S N E A K - cagtaatgtaatggatgataatctatctttgtgtgtattttcatgattttgcttgttcag - Q - C N G - - S I F V C I F M I L L V Q - gaatctacagttacgtctattggcacaaaatgtcttttcagagacacaaatgtggatggt - E S T V T S I G T K C L F R D T N V D G - agcttcgggaatccagtggacttttgggtaccttaggtatggaaaggaatcagggaaaat - S F G N P V D F W V P - V W K G I R E N - aaaaaccgctagtttaatagatatggtagacaacatgctgaatcttttaatgaagatgta - K N R - F N R Y G R Q H A E S F N E D V - gttgatccaattgaaggtgaaggggaccatttattcgtaattgaagttaacgaagaggtt - V D P I E G E G D H L F V I E V N E E V - aatttagttattcaaaaaatagttcaataactatatgaaaatttgttgtggtaaaaatcc - N L V I Q K I V Q - L Y E N L L W - K S - ttgttgtagtagtaaatgtggtcatattgttgtaaaaaaggatagatgtaaacaggtata - L L - - - M W S Y C C K K G - M - T G I - ctctcctgttcatctatcctttcctttttaccttataaaatgtgtgacattatattcaat - L S C S S I L S F L P Y K M C D I I F N - cgcataaatataggatttcattactatttccttgacttttattgaactacccccactttc - R I N I G F H Y Y F L D F Y - T T P T F - acttcgtttaaaaga - T S F K R
- Eliminar de esta secuencia los aminocidos que el Blast no haya reconocido como parte de esta protena, sombrear los nucletidos de un color y los aminocidos de otro. - aatcaacccaattgatgctattttatcccaacattccattatgcttcttgacggagcatta - I N P I D A I L S Q H S I M L L D G A L - gctacagaattggaggcgcatggatgtaatttggacgatcccctttggtcggcacgtgtg - A T E L E A H G C N L D D P L W S A R V - ttactagaaaatccggaactaatttatcaggttcattcggactattttcgtgctggagcg - L L E N P E L I Y Q V H S D Y F R A G A - gactgtgccataacagcaagctatcaagctactattagtggtttttccgcgcgtggaata - D C A I T A S Y Q A T I S G F S A R G I - caagaacaggaagctttggaattaattaagaaaacggtgttacttgcaagaagggcaaga - Q E Q E A L E L I K K T V L L A R R A R - gatgatttttggaaggaaaatacgcaaacgaataggcctaaaccattggttgttgcatca - D D F W K E N T Q T N R P K P L V V A S - gttgggccgtacggggcttaccttgcagatggttcagagtatgtaggcaactatggtgtg - V G P Y G A Y L A D G S E Y V G N Y G V - acagataaaacattagcagactttcaccgttcgagaatgtcagcgttaatcgaagcaggt - T D K T L A D F H R S R M S A L I E A G - gcagatctattggcatttgaaacgatcccttccctgcaagaagcaagagtattagataca - A D L L A F E T I P S L Q E A R V L D T - ttattgcgtgagtttccagaaacatatgcttggctttccttttcgctaaaaaatgagaaa - L L R E F P E T Y A W L S F S L K N E K - gagattagtgaaggtatgaaactcgtggagtgtgcacgagcttttgagaaaagtgaacaa - E I S E G M K L V E C A R A F E K S E Q - attgtagcgataggcatcaattgtgcgccagtaaccgttgtgactggtgcaatccaagag - I V A I G I N C A P V T V V T G A I Q E - ttgagggcaaacaccaaaaaaccgattattgtttatccaaactcgggtgaaacttataat - L R A N T K K P I I V Y P N S G E T Y N - ccagaatcaaaaacatggcatggtcatgaacaatgtaacgcgttggatattcaatctgaa - P E S K T W H G H E Q C N A L D I Q S E - gaatggtaccaagcaggtgcacgtttaataggtggatgctgcagaacgacaccttatcac - E W Y Q A G A R L I G G C C R T T P Y H - attgaggagatatcgaacaagtggcgttcttccgagtttttctattcgaacgaagcaaaa - I E E I S N K W R S S E F F Y S N E A K - cagtaatgtaatggatgataatctatctttgtgtgtattttcatgattttgcttgttcag - Q - gaatctacagttacgtctattggcacaaaatgtcttttcagagacacaaatgtggatggt - agcttcgggaatccagtggacttttgggtaccttaggtatggaaaggaatcagggaaaat - aaaaaccgctagtttaatagatatggtagacaacatgctgaatcttttaatgaagatgta - gttgatccaattgaaggtgaaggggaccatttattcgtaattgaagttaacgaagaggtt - aatttagttattcaaaaaatagttcaataactatatgaaaatttgttgtggtaaaaatcc - ttgttgtagtagtaaatgtggtcatattgttgtaaaaaaggatagatgtaaacaggtata - ctctcctgttcatctatcctttcctttttaccttataaaatgtgtgacattatattcaat - cgcataaatataggatttcattactatttccttgacttttattgaactacccccactttc - acttcgtttaaaaga
Copiar la traduccin virtual, eliminar la secuencia de nucletidos y dejar solamente la secuencia de aminocidos traducidos que correspondan a la protena analizada:
I N P I D A I L S Q H S I M L L D G A L A T E L E A H G C N L D D P L W S A R V L L E N P E L I Y Q V H S D Y F R A G A D C A I T A S Y Q A T I S G F S A R G I Q E Q E A L E L I K K T V L L A R R A R D D F W K E N T Q T N R P K P L V V A S V G P Y G A Y L A D G S E Y V G N Y G V T D K T L A D F H R S R M S A L I E A G A D L L A F E T I P S L Q E A R V L D T L L R E F P E T Y A W L S F S L K N E K E I S E G M K L V E C A R A F E K S E Q I V A I G I N C A P V T V V T G A I Q E L R A N T K K P I I V Y P N S G E T Y N P E S K T W H G H E Q C N A L D I Q S E E W Y Q A G A R L I G G C C R T T P Y H I E E I S N K W R S S E F F Y S N E A K Q
- Contar palabras (320 aminocidos, en este caso) - En la pgina del expasy correspondiente a la traduccin a protena, presionar en el cono 5'3' Frame 3 (o en el marco y en la direccin donde se lea correctamente el gen que ests analizando, en este caso, corresponde este cono)
- Presionar en la primera letra que corresponde al fragmento que se desee analizar (en este caso presionar I, que corresponde al inicio del fragmento INPI )En un recuadro aparecer la secuencia de aminocidos que se analizar (checar que corresponda con el fragmento que se desea comparar o analizar, y si hay letras de mas, eliminarlas, o agregar las que falten). - Presionar el cono Compute pI/Mw (Punto isoelctrico y peso molecular) - Copiar con Control-Imprimir, pegar en la pgina de Word y ajustar el tamao o las partes que se peguen:
Diseo de oligonucletidos:
- Instalar el programa DNASTAR en una computadora - Abrir el programa Editseq - Copiar la secuencia nucleotdica y pegarla en el recuadro - Presionar file y Save as - Guardar el archivo con un nombre identificable y en un lugar identificable (disco extrable) - Cerrar el programa Editseq - Abrir el programa PrimerSelect - Presionar file y Enter sequence - Abrir el archivo - Presionar done - Presionar Conditions y Primer characteristics. Aparecern las caractersticas de los primers que se disearn (longitud, Tm) Por lo regular son condiciones estndar, con las cuales quedan bien diseados los primers. - Presionar Locate y PCR primer pairs. Aparecern todas las opciones de primers que se pueden disear dentro del fragmento que se abri. - Seleccionar el par de primers que se ajusten a la posicin donde est el fragmento que se ha estado delimitando con los programas Blast y Expasy. - Presionar un juego de primers. - Presionar dos veces el mismo juego de primers. - Presionar Edit y Work on Upper primer - Redirigir el Primer Directo, para que el diseo de este primer comience donde inicia el fragmento desead. Ajustar el tamao del primer entre 17 y 25 bases. Entre las indicaciones de este primer, es que tenga una Tm entre 55 y 60C. Al mover el cursor sobre las flechas negras, se ajusta el tamao del fragmento como uno lo desee. - Presionar el botn OK - Presionar Edit y Work on Lower primer - Redirigir el Primer Reverso. Ajustar el tamao del primer entre 20 y 25 bases. Entre las indicaciones de este primer, es que tenga una Tm entre 55 y 60C, similar a la del Primer directo. Al mover el cursor sobre las flechas negras, se ajusta el tamao del fragmento como uno lo desee. - Presionar el botn OK o cancel, si el diseo no fue el adecuado. - Presionar report y amplification summary para ver el reporte del resultado. - Presionar edit y copy - Pegar en el archivo de Word.
Upper Primer (Primer directo):
Lower Primer (Primer reverso)
Analizar la informacin contenida en este recuadro: Fragmento amplificado: productlength= 1068pb Primer directo: 5 AGGTTCATTCGGACTATTTTCGTG 3 (24 nt, Tm 55.4 C) Primer reverso: 5 CTTCAATTGGATCAACTACATCT 3 (23 nt, Tm 47.3 C)
Sacar la secuencia complementaria del primer reverso, para ubicarlo dentro del DNA analizado: Secuencia complementaria del primer reverso: AGATGTAGTTGATCCAATTGAAG (esta es la secuencia que se ubica dentro del DNA analizado)
Ubicar:
AGGTTCATTCGGACTATTTTCGTG AGATGTAGTTGATCCAAGAAG
5'3' Frame 2 aatcaacccaattgatgctattttatcccaacattccattatgcttcttgacggagcatta I N P I D A I L S Q H S I M L L D G A L gctacagaattggaggcgcatggatgtaatttggacgatcccctttggtcggcacgtgtg A T E L E A H G C N L D D P L W S A R V ttactagaaaatccggaactaatttatcaggttcattcggactattttcgtgctggagcg L L E N P E L I Y Q V H S D Y F R A G A gactgtgccataacagcaagctatcaagctactattagtggtttttccgcgcgtggaata D C A I T A S Y Q A T I S G F S A R G I caagaacaggaagctttggaattaattaagaaaacggtgttacttgcaagaagggcaaga Q E Q E A L E L I K K T V L L A R R A R gatgatttttggaaggaaaatacgcaaacgaataggcctaaaccattggttgttgcatca D D F W K E N T Q T N R P K P L V V A S gttgggccgtacggggcttaccttgcagatggttcagagtatgtaggcaactatggtgtg V G P Y G A Y L A D G S E Y V G N Y G V acagataaaacattagcagactttcaccgttcgagaatgtcagcgttaatcgaagcaggt T D K T L A D F H R S R M S A L I E A G gcagatctattggcatttgaaacgatcccttccctgcaagaagcaagagtattagataca A D L L A F E T I P S L Q E A R V L D T ttattgcgtgagtttccagaaacatatgcttggctttccttttcgctaaaaaatgagaaa L L R E F P E T Y A W L S F S L K N E K gagattagtgaaggtatgaaactcgtggagtgtgcacgagcttttgagaaaagtgaacaa E I S E G M K L V E C A R A F E K S E Q attgtagcgataggcatcaattgtgcgccagtaaccgttgtgactggtgcaatccaagag I V A I G I N C A P V T V V T G A I Q E ttgagggcaaacaccaaaaaaccgattattgtttatccaaactcgggtgaaacttataat L R A N T K K P I I V Y P N S G E T Y N ccagaatcaaaaacatggcatggtcatgaacaatgtaacgcgttggatattcaatctgaa P E S K T W H G H E Q C N A L D I Q S E gaatggtaccaagcaggtgcacgtttaataggtggatgctgcagaacgacaccttatcac E W Y Q A G A R L I G G C C R T T P Y H attgaggagatatcgaacaagtggcgttcttccgagtttttctattcgaacgaagcaaaa I E E I S N K W R S S E F F Y S N E A K cagtaatgtaatggatgataatctatctttgtgtgtattttcatgattttgcttgttcag Q gaatctacagttacgtctattggcacaaaatgtcttttcagagacacaaatgtggatggt agcttcgggaatccagtggacttttgggtaccttaggtatggaaaggaatcagggaaaat aaaaaccgctagtttaatagatatggtagacaacatgctgaatcttttaatgaagatgta gttgatccaattgaaggtgaaggggaccatttattcgtaattgaagttaacgaagaggtt aatttagttattcaaaaaatagttcaataactatatgaaaatttgttgtggtaaaaatcc ttgttgtagtagtaaatgtggtcatattgttgtaaaaaaggatagatgtaaacaggtata ctctcctgttcatctatcctttcctttttaccttataaaatgtgtgacattatattcaat cgcataaatataggatttcattactatttccttgacttttattgaactacccccactttc acttcgtttaaaaga
Seleccionar nuevamente la secuencia, y traducir a protena en el Expasy, para conocer realmente la protena que se obtendr a partir del juego de Primers diseado: aggttcattcggactattttcgtgctggagcg gactgtgccataacagcaagctatcaagctactattagtggtttttccgcgcgtggaata caagaacaggaagctttggaattaattaagaaaacggtgttacttgcaagaagggcaaga gatgatttttggaaggaaaatacgcaaacgaataggcctaaaccattggttgttgcatca gttgggccgtacggggcttaccttgcagatggttcagagtatgtaggcaactatggtgtg acagataaaacattagcagactttcaccgttcgagaatgtcagcgttaatcgaagcaggt gcagatctattggcatttgaaacgatcccttccctgcaagaagcaagagtattagataca ttattgcgtgagtttccagaaacatatgcttggctttccttttcgctaaaaaatgagaaa gagattagtgaaggtatgaaactcgtggagtgtgcacgagcttttgagaaaagtgaacaa attgtagcgataggcatcaattgtgcgccagtaaccgttgtgactggtgcaatccaagag ttgagggcaaacaccaaaaaaccgattattgtttatccaaactcgggtgaaacttataat ccagaatcaaaaacatggcatggtcatgaacaatgtaacgcgttggatattcaatctgaa gaatggtaccaagcaggtgcacgtttaataggtggatgctgcagaacgacaccttatcac attgaggagatatcgaacaagtggcgttcttccgagtttttctattcgaacgaagcaaaa cagtaatgtaatggatgataatctatctttgtgtgtattttcatgattttgcttgttcag gaatctacagttacgtctattggcacaaaatgtcttttcagagacacaaatgtggatggt agcttcgggaatccagtggacttttgggtaccttaggtatggaaaggaatcagggaaaat aaaaaccgctagtttaatagatatggtagacaacatgctgaatcttttaatgaagatgta gttgatccaattgaag aggttcattcggactattttcgtgctggagcg V H S D Y F R A G A gactgtgccataacagcaagctatcaagctactattagtggtttttccgcgcgtggaata D C A I T A S Y Q A T I S G F S A R G I caagaacaggaagctttggaattaattaagaaaacggtgttacttgcaagaagggcaaga Q E Q E A L E L I K K T V L L A R R A R gatgatttttggaaggaaaatacgcaaacgaataggcctaaaccattggttgttgcatca D D F W K E N T Q T N R P K P L V V A S gttgggccgtacggggcttaccttgcagatggttcagagtatgtaggcaactatggtgtg V G P Y G A Y L A D G S E Y V G N Y G V acagataaaacattagcagactttcaccgttcgagaatgtcagcgttaatcgaagcaggt T D K T L A D F H R S R M S A L I E A G gcagatctattggcatttgaaacgatcccttccctgcaagaagcaagagtattagataca A D L L A F E T I P S L Q E A R V L D T ttattgcgtgagtttccagaaacatatgcttggctttccttttcgctaaaaaatgagaaa L L R E F P E T Y A W L S F S L K N E K gagattagtgaaggtatgaaactcgtggagtgtgcacgagcttttgagaaaagtgaacaa E I S E G M K L V E C A R A F E K S E Q attgtagcgataggcatcaattgtgcgccagtaaccgttgtgactggtgcaatccaagag I V A I G I N C A P V T V V T G A I Q E ttgagggcaaacaccaaaaaaccgattattgtttatccaaactcgggtgaaacttataat L R A N T K K P I I V Y P N S G E T Y N ccagaatcaaaaacatggcatggtcatgaacaatgtaacgcgttggatattcaatctgaa P E S K T W H G H E Q C N A L D I Q S E gaatggtaccaagcaggtgcacgtttaataggtggatgctgcagaacgacaccttatcac E W Y Q A G A R L I G G C C R T T P Y H attgaggagatatcgaacaagtggcgttcttccgagtttttctattcgaacgaagcaaaa I E E I S N K W R S S E F F Y S N E A K cagtaatgtaatggatgataatctatctttgtgtgtattttcatgattttgcttgttcag Q gaatctacagttacgtctattggcacaaaatgtcttttcagagacacaaatgtggatggt agcttcgggaatccagtggacttttgggtaccttaggtatggaaaggaatcagggaaaat aaaaaccgctagtttaatagatatggtagacaacatgctgaatcttttaatgaagatgta gttgatccaattgaag
Restringida por Hind III (AAGCTT) y PstI (CTGCAG).
DISCUSIO N Se analiz los resultados obtenidos y se compar con la informacin que se proporciona en la literatura acerca de las caractersticas que debe cumplir un buen par de Primers para que se pueda amplificar la regin seleccionada del gen de inters. Para elegir los primers ms adecuados, se debe de considerar diferentes factores que son importantes para tener el resultado esperado, por ejemplo la temperatura entre los primers directo y reverso no debe de tener una diferencia de ms de 3C entre ellos (Voet, 2006), adems se debe tomar en cuenta el porcentaje de G y C el cual se recomienda que este entre 50-60% (Voet, 2006) pero el Primer diseado tiene 40.7 % por lo que sera un Primer de mala eleccin. La longitud del par de primers es de 1068 pb por lo que no se pueden considerar como primers ptimos. Con el par de oligonucletidos diseados, se amplifica un fragmento del gen, trunco en la regin 5, en donde al traducirse a protenas, le faltan los nucletidos correspondientes a los primeros 34 aminocidos cercanos al extremo amino. Tambin se amplificara un fragmento de ADN ubicado en el extremo 3, el cual no codificara para la protena. Si se deseara amplificar un fragmento de ADN que codificara slo a la regin estructural de la protena, el oligonucletido reverso tendra que redisearse y ser compatible con el oligonucletido directo para que slo se amplifique dicha regin.
Conclusio n
Se utiliz la base de datos del NCBI para realizar un anlisis bioinformtico de la secuencia del gen de Bacillus weihenstephanensis en la cual se hizo uso de la herramienta BLAST. Se identific la regin del gen a replicar con ExPASy adems de obtener el punto isoelctrico y el peso molecular con esta herramienta y se desarrollaron juegos de Primers en DNASTAR para poder amplificar la secuencia de inters lo cual es de gran importancia para la tcnica de PCR ya que se clona el fragmento seleccionado para introducir el vector propuesto por el programa y de esa manera realizar los mapas de restriccin.
Cuestionario
1.- Cules son las ramas de la Ciencia en las que participa la Bioinformtica?
2.- Para qu sirve el anlisis Bioinformtico de una secuencia de ADN?
Sirve para observar similitudes estructurales y la diferencia entre diversas secuencias biolgicas. Con esto se determina si existen secuencias similares entre diferentes organismos para que se pueda concluir que son secuencias homlogas. (Attwood, 2002).
3.- Menciona metodologas de Biologa Molecular que complementaran los resultados obtenidos en un anlisis Bioinformtico en el estudio de un ADN, ARN o protena.
Pueden utilizarse marcadores de ADN los cuales nos ayudan a detectar polimorfismo en el ADN nuclear, al igual que marcadores usados para calcular el tamao efectivo de una poblacin lo cuales pueden basarse en genotipos para los marcadores ligados, pero tambin pueden usarse herramientas moleculares para el estudio de la variacin funcional con enfoques basados en la posicin. (Lahoz, 2010).
Referencias
Anlisis de la Presencia de Organismos Genticamente Modificados en Muestras de Alimentos. Reaccin en Cadena de la Polimerasa (PCR). Recuperado de: http://gmo- crl.jrc.ec.europa.eu/capacitybuilding/manuals/Manual%20ES/Sesi%C3%B3n6.pdf. 24/09/14
Attwood, T. (2002). Introduccin a la Bioinformtica. 2 edicin. Editorial Prentice- Hall.
Beecher, D, Schoeni, J, Wong, A (1995). Enterotoxic activity of hemolysin BL from Bacillus cereus. Infect. Immun. 63, 44234428.
Christiansson, A, Naidu, A.S, Nilsson, I, Wadstrom, T, Pettersson, H (1989). Toxin production by Bacillus cereus dairy isolates in milk at low temperatures. Appl. Environ. Microbiol. 55, 25952600.
DNASTAR, I. (2014). MegAlign3. 18 eds. Madison, WI. USA: DNASTAR.
Gasteiger, E., Gattiker, A., Hoogland, C., Ivanyi, I., Appel, R. D., & Bairoch, A. (2003). ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic acids research, 31(13), 3784-3788.
Lahoz-Beltr, R. (2010). Bioinformtica: simulacin, vida artificial e inteligencia artificial. Ediciones Daz de Santos.
Lechner, S, Mayr, R, Francis, K.P, Prss, B.M, Kaplan, T, Wiessner-Gunkel, E, Stewart, G.S, Scherer, S (1998). Bacillus weihenstephanensis sp. nov. is a new psychrotolerant species of the Bacillus cereus group. Int. J. Syst. Bacteriol. 48, 13731382.
Lund, T, de Buyser, M.L, Granum, P.E (2000). A new cytotoxin from Bacillus cereus that may cause necrotic enteritis. Mol. Microbiol.38, 254261.
Lund, T, Granum, P.E (1996). Characterisation of a non-haemolytic enterotoxin complex from Bacillus cereus isolated after a foodborne outbreak. FEMS Microbiol. Lett. 141, 151156.
Lourdes, E. 2009. Aplicacin de herramientas bioinformticas en el estudio de las enfermedades genticas humanas. Universidad Politcnica de Madrid.
Meer, R.R, Baker, J, Bodyfelt, F.W, Griffiths, M.W (1991). Psychrotrophic Bacillus spp. in fluid milk products a review. J. Food Protect. 54, 969979.
Stenfors, L. P., Mayr, R., Scherer, S., & Granum, P. E. (2002). Pathogenic potential of fifty Bacillus weihenstephanensis strains. FEMS microbiology letters, 215(1), 47- 51.
Vaisanen, O.M, Mwaisumo, N.J, Salkinoja-Salonen, M.S (1991). Differentiation of dairy strains of the Bacillus cereus group by phage typing, minimum growth temperature, and fatty acid analysis. J. Appl. Bacteriol. 70, 315324.
Van Netten, P, van de Moosdijk, A, van Hoensel, P, Mossel, D.A, Perales, I (1990) Psychrotrophic strains of Bacillus cereusproducing enterotoxin. J. Appl. Bacteriol. 69, 7379.
Voet, D., y Voet, J. G. (2006). Bioqumica. Ed. Mdica Panamericana.
Von Stetten, F, Mayr, R, Scherer, S (1999). Climatic influence on mesophilic Bacillus cereus and psychrotolerant Bacillus weihenstephanensis populations in tropical, temperate and alpine soil. Environ. Microbiol. 1, 503515.