Centro de Estudios Genómicos del Perú CEGENP

FELIZ 4to ANIVERSARIO

PRINCIPALES HERRAMIENTAS UTILIZADAS EN BIOINFORMÁTICA
Uceda Campos Guillermo. guilluc_6@hotmail.com

GENOMA HUMANO

MANUAL DE LA VIDA
SECRETOS 4 LETRAS DEL ALFABETO ¿Y SI IMPRIMIERAMOS EL GENOMA HUMANO? ¿Y SI LO LEYERAMOS ?

¿Qué es la Bioinformática?
La Bioinformática es un campo interdisciplinario que desarrolla y aplica tecnologías computacionales para estudiar preguntas de las ciencias de la vida.

Antes

Predicción

observación

1953

Ahora

ATATTGCCGACC GGCGCCCGGTAC CTGGCCCATGTC

2012

Multidisciplinas

GRANDES REVOLUCIONES EN LA BIOLOGÍA 1986 REACCION EN CADENA DE LA POLIMERASA PROYECTO DE GENOMA HUMANO 1990 PROYECTO MICROBIOMA HUMANO 2007 PROYECTO DE LOS 1000 GENOMAS 2008 ERA POST-GENÓMICA “OMICAS” .

LA CASCADA DE LAS ÓMICAS .

un cambio de paradigma en las ciencias de la vida. .BIOINFORMÁTICA Como tecnología… … la bioinformática es una poderosa herramienta para gestionar. Como metodología… … la bioinformática es un enfoque holístico. consultar y analizar la gran cantidad de bases de datos en las ciencias de la vida. donde se aborda genomas completos para generar nuevas hipótesis.

TIPOS DE EXPERIMENTACIÓN BIOLÓGICA Con un ser vivo (in vivo) En un entorno artificial (in vitro) En un entorno informático (in silico) .

IMPACTO DE LA BIOINFORMÁTICA EN CIENCIAS Necesidades en Bioinformática Demanda al 2010 Se requiere personal con experiencia en Bioinformática Oferta de especialistas .

Acumulación de información genómica en la base de datos “Genbank” Número de nucleótidos en la base de datos de secuencias de EMBL .

Centro: DDBJ (DNA Data Bank of Japan).LOS TRES GRANDES BANCOS DE BASES DE DATOS BIOLÓGICOS. Superior: ENA (European Nucleotide Archive). . Inferior: GenBank del NCBI (National Center for Biotechnology Information).

.

• La Bioinformática almacena los datos de genes a través de la minería de datos para luego observar lo que estos realizan . proponiendo nuevas interpretaciones y modificando el dogma de la biología. proteínas. genomas. • La Minería de datos es referida a la información generada por el ADN.MINERÍA DE DATOS • En corto tiempo la Bioinformática ha logrado imponerse como una gran herramienta. mutaciones y polimorfismos.

Chile Brazil PERÚ: •Universidad Particular Cayetano Heredia •Farvest •CEGENP: Tesis pregrado Trabajos de invest. LICENCIATURA EN BIOINFORMÁTICA (2009) Argentina.Donde se realiza Bioinformática? Centros de Bioinformática en el Mundo Institutos de Bioinformática en el Mundo Centros de Bioinformática en America del Sur Colombia Carreras profesionales en Bioinformática INGENIERÍA EN BIOINFORMÁTICA (2004). Talca-Chile. . Cursos de capacit.

LA TECNOLOGÍA BIOINFORMÁTICA INVOLUCRA . Diseño. Predicción de estructura y dinámica de macromoléculas Relaciones filogenéticas entre organismos Estudio de todos los genes y proteínas de un organismo: “Genómica y proteómica funcional” .. implementación e integración de bases de datos Alineación de secuencias de ADN y proteínas Ensamblaje de fragmentos de ADN y creación de mapas genómicos..

Buscando información… .

NCBI Es una parte de la National Library of Medicine (NLM). http://www.ncbi.nlm. así como un departamento de National Institutes of Health (NIH) del Gobierno de los Estados Unidos.nih.gov/ . En este portal la información biológica está disponible al público y no se puede patentar esta información.

NCBI-Facebook .

National Institutes of Health (NIH) que contiene literatura biomédica y de ciencias de la salud.ncbi. Proporciona búsquedas de consultas clínicas. http://www.gov/pubmed/ .nlm. desde el que se accede a las citas y resúmenes de sitios que ofrecen artículos de libre acceso.PubMed Es el portal de acceso libre y gratuito que proporciona la NLM ( National Library of Medicine). enlaces a artículos relacionados. PubMed Cental es la biblioteca digital con artículos de libre acceso del U.S. direcciones de investigadores.nih.

. verá la opción Sign in to NCBI en el recuadro. Si ya está registrado. Para inscribirse en My NCBI. puede ir a Sign into My NCBI. Haga clic en MY NCBI para inscribirse.PubMed/My NCBI Desde la pantalla de PubMed. haga clic en el hipervínculo Register for an account.

Buscando secuencias y genomas… .

an annotated collection of all publicly available DNA sequences GenBank is part of the International Nucleotide Sequence Database Collaboration. The complete release notes for the current version of GenBank are available on the NCBI ftp site. the European Molecular Biology Laboratory (EMBL).GENBANK GenBank ® is the NIH genetic sequence database. These three organizations exchange data on a daily basis. which comprises the DNA DataBank of Japan (DDBJ). . and GenBank at NCBI.

ncbi.nih.gov/nuccore/ .NCBI-GENBANK http://www.nlm.

.

Analizando secuencias… .

las cuales permitirán una gamma de análisis de las secuencias estudiadas. . • El termino homología es una medida cualitativa entre las secuencias. es observable cuando la similitud que estas tienen es atribuible a razones evolutivas.• El alineamiento de secuencias es una manera de comparar dos o más secuencias de ADN. ARN o estructuras proteicas primarias con la finalidad de encontrar zonas de similitud y reconocer su variabilidad. • El termino similitud es referido al análisis cuantitativo de la estructura primaria de secuencias de ácidos nucleicos o proteínas.

• Existen varias “implementaciones” de este algoritmo. .BLAST (Basic Local Alignment Search Tool) • BLAST es un algoritmo para comparación de secuencias. • La velocidad y la relativamente buena precisión han permitido que probablemente sea la herramienta de búsqueda más popular en bioinformática. el NCBIBLAST. • BLAST busca alineamientos de secuencias de alto puntaje entre la secuencia problema y las secuencias consultadas. una de las más conocidas es la realizada por el NCBI.

.http://blast.gov/Blast.ncbi. BlastX. el cual busca una secuencia ADN/ARN en la base de datos de nucleótidos (ADN/ARN) BlastP.nih. TBlastN. busca nucleótidos (ADN) en la base de datos de proteínas.cgi • Existen diversos tipos de Blast entre ellos tenemos: BlastN.nlm. busca una proteína en una base de datos de proteínas. busca proteínas en el secuencias de ADN.

.

sin necesidad de instalar software. pero asimismo tiene ventajas instalarlo localmente. también hay servidores online para la utilización de CLUSTALW. bastante rápido. CLUSTAL es muy útil para definir familias de proteínas y de ácidos nucleicos.CLUSTALW • Es un servidor que permite hacer alineamientos de proteínas y ácidos nucleicos. sobre todo para realizar trabajos de alineamiento múltiple a gran escala y tener todo el proceso bajo control. • En combinación con herramientas como BLAST. • Al igual que BLAST. . para calcular alineamientos múltiples.

http://www.uk/Tools/msa/clustalw2/ .ac.ebi.

Eco: Escherichia coli. Sfl: Shigella flexneri. Sdy: Shigella dysenteriea. Sbo: Shigella boydii. Bhe: Bartonella henselae .

megasoftware.http://www.edu/bioedit/bioedit.mbio.net/ http://www.ncsu.html .

ANALISIS DE LA SECUENCIA ADN16S DE ESPECIES DE BARTONELLA Y BRUCELLA UTILIZANDO EL SOFTWARE BIOEDIT .

Construyendo arboles filogenéticos… .

• La importancia de los alineamientos múltiples radica en que son utilizados para construir árboles filogenéticos los cuales representan de forma gráfica las similitudes y diferencias entre determinadas secuencias. cuando se realiza un análisis filogenético. . en microorganismos el gen más estudiado para realizar filogenia es el ARNr 16S. por lo tanto. • Los organismos que hace más tiempo se han separado en la evolución suelen tener más diferencias en las secuencias de sus respectivos genes. y. • Generalmente las secuencias de los genes y proteínas son más parecidas entre organismos más cercanos evolutivamente. aparecen más alejados entre sí.

.

.

washington.html .http://evolution.edu/phylip/software.genetics.

Trabajando con estructuras proteicas… .

• La búsqueda en PDB se puede realizar mediante el nombre de la proteína o por medio de un código asignado a dicha estructura (ej. técnica experimental utilizada. simetría cristalográfica. . dimensiones de la unidad celular cristalográfica y coordenadas cartesianas.PDB • PDB (Protein Data Bank) es una web donde se almacenan los datos sobre la estructura 3D de macromoléculas proteicas en una disolución. número y tipos de átomos que contiene. resolución.: 1REX corresponde a la Lisozima). publicación. residuos que forman el sitio activo. hélicesα. contenido de solvente. descripción breve indicando el organismo al que pertenece. • La principal información que podemos encontrar en el PDB es: nombre y código de la estructura proteica. hojas-β.

org/pdb/home/home.http://www.rcsb.do .

• Conocer la estructura 3D de una molécula es útil porque nos permite inducir sobre los mecanismos de las reacciones en las que la molécula participa. la cual muchas veces es complementaria a la cristalización de rayos X.Visualización estructura 3D. . • Las biomoléculas como las proteínas poseen tamaños y estructuras tridimensionales (3D) características que son resultado de su estructura primaria y sus grupos funcionales. el estudio de la estructura 3D de las biomoléculas se realiza principalmente por medios físicos como la Cristalización por difracción de rayos X o Resonancia magnética nuclear (RMN).

com/swiss-pdbviewer442505.net/projects/pymol/ DeepView/Swiss-PdbViewer http://www.html .brothersoft.PyMOL http://sourceforge.

• La predicción de las estructuras 3D es posible mediante diversos servidores como: I-TASSER ONLINE. . Protein Structures & Function Prediccions (http://zhanglab.expasy. • La predicción se realiza siguiendo un “molde” cuya identidad de secuencia es superior al 25%. • Para la validación de un modelo debe someterse a evaluación la cual puede realizarse también desde servidores online.ccmb.org/) • Estos servidores necesitan de la secuencia problema en formato FASTA que se quiere enviar a modelar y de una dirección electrónica para el envío de los resultados.umich.edu/I-TASSER/) SWISS MODEL Workspace (http://swissmodel.med.

Analizando el metabolismo… .

jp/kegg/ .genome.KEGG http://www.

.

.

BIOCYC .

nlm.expasy.gov/blastp www.expasy.softberry.uk/Tools/InterProScan/ www.html www.nlm.ac.phtml www.uk/ClustalW/ www.ac.html www.ch/tools/protparam.nih.ad.nlm.com/berry.sanger.genome.ncbi.ch/prosite http://www.ebi.nih.htm www.nih.ncbi.gov/gorf www.integratedgenomics.org www.nlm.gov/COG/index.ebi.ncbi.ac.nih.uk/cgi-bin/pfam .ncbi.gov www.APLICACIÓN WEB ANÁLISIS Y HERRAMIENTAS NCBI ERGO COG SOFTBERRY KEGG BLASTP CLUSTAW PROTPARAM ORF FINDER PROSITE INTERPRO PFAM Búsqueda de genes y proteínas Genómica y proteómica Grupo de Genes Ortólogos Alineamientos y predicciones Rutas Metabólicas Similitud Alineamientos Parámetros de proteína Predicción de ORFs Sitios funcionales de Proteínas Análisis de proteínas Familias de Proteínas DIRECCIÓN EN INTERNET www.jp/kegg/kegg2.

html www.pl CONSENSO LOGO CONSENSO FGENESB PROMOTOR PREDICTION BPROM Motivos consensos de DNA Motivos consensos de DNA Predicción de operones Predicción del promotor Predicción del promotor www.html http://weblogo.com/berry.cgi http://www.uk/emboss/align/ BLAST 2SEQ MICROBES ONLINE Alinear dos secuencias Contexto genético www.cs.bork.cgi www.ac.washington.com/berry.fr/seqanal/interfaces/mfold-simple.berkeley.pasteur.fruitfly.ebi.com CLC-RNA Workbench Predicción del terminador MFOLD PAIRWISE Estructura 2ria RNA Alinear dos secuencias http://bioweb.softberry.clcrnaworkbench.gov/blast/bl2seq/wblast2.edu/htbinpost/unrestricted/FootPrinterWeb/FootPrinterInput2.nlm.nih.org/ .Aplicación web FOOTPRINTER Análisis y herramientas Motivos conservados en DNA Dirección en internet http://wingless.org/seq_tools/promoter.phtml?topic=fgenesb&group=progr ams&subgroup=gfindb www.microbesonline.embl-heidelberg.html www.softberry.phtml?topic=bprom&group=progra ms&subgroup=gfindb www.edu/logo.de /Alignement/consensus.ncbi.

AGRADECIMIENTOS • • • • INTEGRANTES DE CENTRO DE ESTUDIOS GENÓMICOS DEL PERÚ-CEGENP. CONSUELO ROJAS IDROGO FACULTAD DE CIENCIAS BIOLÓGICAS . DR. PEDRO CHIMOY EFFIO. MSC.

… ¿Preguntas? .