• En 1995 un equipo liderado por J. dos grandes equipos.8 millones de pares de bases) y en 2001. secuenció el prim er genom a de un organism o de vida libre. • Haemophilus influenzae (1. • uno liderado por Venter (entonces en una com pañía privada) y el otro por Francis • Collins (en los Institutos Nacionales de la Salud) anunciaron de form a conjunta el b o rrador • de la secuencia del genom a hum ano (3 mil millones de pares de bases). . Craig Venter. en el Instituto • de Investigación Genómica.

Además.• En diciembre de 2011.as de microorganism os y 320 genomas eucariotas. . el Protein Data Bank (PDB) es un almacén de • estructuras de proteínas y ácidos nucleicos*. se habían com unicado las secuencias completas de • 3334 genom • Casi todas las secuencias de DNA están depositadas en las bases de datos públicas • como GenBank y se dispone de varias herram ientas en la red que pueden emplear los • investigadores para buscar en estas bases de datos (algunas de ellas se citan en la Bibliografía • al final de este capítulo).

Por ejemplo.• Dado que la tecnología para determ inar la secuencia de DNA ha llegado a un punto • donde pueden determ inarse genomas com pletos en periodos de tiem po relativamente • cortos. ¿qué cantidad del genom a hum ano codifica • funciones metabólicas. o diferenciación tisular y crecimiento o señalización celular? . que codifica • propiedades funcionales. existe un trem endo interés por identificar la parte de un genoma dado.

• es razonable • utilizar la semejanza de secuencia para proponer propiedades funcionales de una • proteína sin caracterizar. .

• La definición de «semejanza» es m enos clara.16). aunque como se ha señalado antes en este capítulo. Considérese la lisina. que tiene un • grupo amino cargado en el extremo de cuatro grupos metileno hidrófobos. polaridad y carga. aunque por otro podría considerarse cargada. . la • lisina podría considerarse como hidrófoba. • se basa en la clasificación de las propiedades químicas de las cadenas laterales como • su hidrofobicidad.• diferenciar entre identidad de secuencia y sem ejanza de secuencia. • En este contexto «identidad» se refiere a aquellas partes de la secuencia de aminoácidos con • una coincidencia exacta (por ejemplo. por un lado. La clasificación de algunos aminoácidos es ambigua • debido a que poseen más de una de estas propiedades. los aminoácidos destacados en azul en la Figura 5.