Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
48Activity
0 of .
Results for:
No results containing your search query
P. 1
Bioinformática práctica: PROCESAMIENTO DE CADENAS Y SECUENCIAS BIOLÓGICAS

Bioinformática práctica: PROCESAMIENTO DE CADENAS Y SECUENCIAS BIOLÓGICAS

Ratings:

4.44

(9)
|Views: 6,023 |Likes:
Published by Jacobo Hernández V
Eugenio Jacobo Hernández Valdelamar. Congreso de sistemas e informática CONSI 2003. San Luis Potosí. Octubre, 2003.
Eugenio Jacobo Hernández Valdelamar. Congreso de sistemas e informática CONSI 2003. San Luis Potosí. Octubre, 2003.

More info:

Categories:Types, Research, Science
Published by: Jacobo Hernández V on Apr 12, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

12/07/2012

pdf

text

original

 
Bioinformática práctica:procesamiento de cadenas y secuencias biológicas
Eugenio Jacobo Hernández Valdelamar Fundación Arturo Rosenblueth. Insurgentes Sur 670-3.Colonia del Valle. CP 03100. México, D.F., México jack@mail.rosenblueth.mx jack_hv@yahoo.com
Resumen.
En este art
í 
culo se aborda el tema del procesamiento de informaci
ó
n biol
ó
gica cont
é
cnicas para el procesamiento de cadenas de caracteres. El objetivo es tratar el tema desde unaperspectiva de computaci
ó
n e inform
á
tica para mostrar que hay cosas en el
á
rea que pueden aplicarseen proyectos interdisciplinarios.
Palabras clave:
biocomputaci
ó
n, bioinform
á
tica, procesamiento de cadenas de caracteres,procesamiento de informaci
ó
n biol
ó
gica.
1.Introduccn
Actualmente, aunque términos como bioinformática o biotecnología son muy sonados, pocas personasconocen su alcance. Más aún, la comunidad de tecnologías de la información (TI) aún no cuenta coninformación completa sobre todo lo que podría aplicar en el área de la biología.El objetivo de este articulo es introducir a la comunidad de TI al mundo de la bioinformática pero desdeuna perspectiva que le sea familiar, es decir, en lugar de iniciar hablando de genomas y ADN, el punto deinicio de este trabajo son los algoritmos y el procesamiento de datos e información.Una de las tareas básicas de todo desarrollador de software es crear programas para procesar datos. Noimporta el tipo de aplicación, siempre habrá que hacer conversiones entre tipos de datos, procesar archivosde texto o binarios, o integrar, comparar o analizar cadenas de caracteres.Esta última actividad tiene mucho que ver con la bioinformática, pues todos los datos que se obtienen delos laboratorios deben analizarse, no solo para encontrar algo específico, sino para encontrar relaciones delas que no se tiene conocimiento o referencia.
 
Aquellos dedicados al desarrollo de software, por lo general lidian con datos que van desde el nombre deuna persona, su dirección, fecha de nacimiento, etc. , hasta información más compleja que puede ser unaexpresión regular o datos codificados. En el caso de la bioinformática la información tiene que ver con laconstrucción y mantenimiento de un organismo (genotipo), con sus características físicas (fenotipo) o sucomportamiento.En ambos casos es un hecho el tener que enfrentar el procesamiento de grandes volúmenes deinformación. La diferencia se da en el tipo de procesamiento que hay que aplicarle a los datos o a lainformación.
2.Procesamiento de cadenas de caracteres
Las computadoras trabajan con datos digitales (0 y 1), que son la base del sistema de numeración binario.Las computadoras usan este sistema de numeración para denotar los datos en forma de bits. Una serie de 8 bits es un byte. La computadora puede representar los datos en forma numérica o en forma de caracteresalfanuméricos.Cuando están en forma numérica, se refiere a los datos que son cifras y serán usados en operacionesaritméticas. Y si están en forma de caracteres, quiere decir que son letras, números o símbolos que no seusarán en dichas operaciones. Por lo general, los datos alfanuméricos o de caracteres se representanmediante el código ASCII (American Standard Code for Information Interchange).Los caracteres son los bloques de construcción fundamentales para el intercambio de datos y procesamiento de los mismos. En el caso del procesamiento, los programas fuente se componen de unasecuencia de caracteres que, agrupados de manera significativa, son interpretados por la computadora comouna serie de instrucciones que sirven para llevar a cabo una tarea. En el caso de intercambio de datos, loscaracteres pueden agruparse para representar identificadores, claves, valores o formar textos que el usuariorequiera.Una
cadena de caracteres
es una secuencia de cero o más caracteres representables por la computadora,que se almacenan en un área contigua de memoria. Una cadena puede incluir letras, dígitos y diversoscaracteres especiales, como +, -, *, /, $ y otros.El almacenamiento de los caracteres puede realizarse en la memoria principal o en dispositivos dealmacenamiento secundario. En ambos casos es necesario el uso de
estructuras de datos
, que son unconjunto de variables de un determinado tipo agrupadas y organizadas de alguna manera para representar un comportamiento. Lo que se pretende con las estructuras de datos es facilitar un esquema lógico paramanipular los datos en función del problema que haya que tratar y el algoritmo para resolverlo.Según su comportamiento durante la ejecución del programa se distinguen estructuras de datos [7]:
 
-
Estáticas: su tamaño en memoria es fijo. Ejemplo: arreglos.
-
Dinámicas: su tamaño en memoria es variable. Ejemplo: listas ligadas con apuntadores, archivos,etc.En los lenguajes de programación las cadenas de caracteres se abstraen por lo general mediante arreglos,que son estructura de datos que constan de un número fijo de elementos del mismo tipo, en este casocaracteres.Algunas operaciones típicas que se realizan para manipular las cadenas de caracteres son:
Determinar la longitud de una cadena (contar cuantos caracteres contiene)
Encontrar determinado carácter o secuencia de caracteres dentro de una cadena
Obtener una subcadena de la cadena original
Comparar 2 cadenas
Unir 2 o más cadenas
Convertir una cadena en otro tipo de dato específicoDe este punto en adelante el procesamiento puede ser más sofisticado, por ejemplo:
Determinar si una cadena es palíndromo
Codificar los caracteres de la cadena en otro tipo de información
Procesar subcadenas separadas por delimitadores
Procesar un vector de caracteres como si fuese una matriz
Interpretar un comando contenido en la cadenaA continuación se explora más a fondo el proceso de comparación de cadenas de caracteres.
3.Comparación de cadenas de caracteres
La comparación entre cadenas consiste en aplicar operaciones de igualdad a cada uno de los elementos decada una de las cadenas, y determinar si la correspondencia en uno a uno. Por lo general cuando secomparan cadenas de caracteres el resultado es binario; es o no es igual. Un caso un poco más sofisticadoes la función strcmp() del lenguaje C que compara el primer argumento con el segundo, carácter por carácter. La función devuelve 0 si las cadenas son iguales, un valor negativo si la primera cadena es menor que la segunda y un valor positivo si la primera cadena es mayor que la segunda.

Activity (48)

You've already reviewed this. Edit your review.
1 hundred reads
1 thousand reads
Rob Miño Ortiz liked this
Sheila Souto liked this
Julián Jn liked this
Alonso Arroyo liked this
Sofía Borkert liked this
Paola Mejia liked this

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->