You are on page 1of 45

ESCUELA POLITECNICA DEL EJERCITO BIOINFORMATICA PRODUCTO INTEGRADOR SEGUNDA UNIDAD NOMBRE: Diego Jarrn V.

EJERCICIO 1 Se tiene una secuencia de DNA de baja calidad resultante de una secuenciacin en la que con el programa ORF FINDER no se ha podido encontrar ningn ORF. Puedo saber si codifica para alguna protena? CGAAGTTGTCTGGCTGGAAATCAATAACCCAGCCGGGGATGACTCCTACCTCGCTCG TGCCTGATATCGCCAAAGCGGCGGGTATCTCTTTCGCTGAGTTGTTGAGTTGGATGG TGGAGGACGCGTCTTGTTTGCGTTGAACGGAAAATCGGATGGATATAGGCGCGCGG GCGCGGTGCGGGATGCATCGGGCGACGATGAATGCCGCTTTTGTCCTGCCGCGCTTC CTGCGCAAGCCGTTCCGCTTTGCCGTCCGTCTCTTTCAGGGAAACGTCAATATCCCG CGCCATGCAGGCACGGTGGGCATGTTGGGCTTCCTTGGCGCGACCGGCCTTTATGGC ATGGTAATTGGTGGCCACTCGCAGGATGTCGTGAAGGCAACTGCTTCCACGATGGGT TTTGCGATCGAGGACATCAAGGTCGTCGGCAAATAACGAAACCTCCGATATCGACA TTCTGGGCCAGCTTAACCTGGATGGCGAAACGTCGCTGGTCGGCCTTAGCGCCGAAG AAGCACGCCAGTCCATCCCGAACAAGCGGGTGGAGAGCGCGGAAGTGCGCAAGGT CTATCCGGGCACGATTCTCGTTTCGCTTCAGGAGCGCAAGGCTTTTGCGATCTGGCA GAACGATAAGGAGCTTTCGCTGATCGATGACGGCGGGCGACACCATCGTTCCATCC GTCCGGGCCGTTACAACTCGCTGCCGCGTGGGTGAGGGGGCTGAAAAAGAAGGTCA AGGGTTTTGTGGACCAGATCGTCGCCTATCCGGGATTGGCCGGAAAGGTTCGCGCCT ATATCCGCGTCGGCGACCGCCGCTGGGATCTGCTTCTCGATAATGGCGTGCGCATCA TGCTGCCGGAAAGCGCGCCGCTGAAGGCTCTGGCGCAGGTCGAGAAGCTTGATCGG GAAAAACATCTCCTGTCGCGCGATATCTCTGCGGTCGATCTTCGCCTTAAAGATCGT GTGACCAGTTCAATTGACCGCAAGCGGCATGGAACAGCGCCAGAAACTTCTGGCGG ATCGTAAGAAAGAACTGTCCCGTATGGGGAATCGCGTATGAGTATTCTTGGCGGTCA TGGAGCATCACAACACGGAACCGCAGGGCGCAAGGTGCGCCTGTTAACGGTTCTGG ACGTTGGGTCGAGCAAGGTTT

No codifica ninguna proteina porque las secuencias no se encuentran conservadas EJERCICIO 2 Hacer un BLAST de la siguiente secuencia contra el genoma de Escherichia coli y contestar las preguntas: >secuencia Y MLEEYRKHVAERAAEGIAPKPLDANQMAALVELLKNPPAGEEEFLLDLLTNRVPPGVD EAAYVKAGFLAAIAKGEAKSPLLTPEKAIELLGTMQGGYNIHPLIDALDDAKLAPIAAK ALSHTLLMFDNFYDVEEKAKAGNEYAKQVMQSWADAEWFLNRPALAEKLTVTVFKV TGETNTDDLSPAPDAWSRPDIPLHALAMLKNAREGIEPDQPGVVGPIKQIEALQQKGFPL AYVGDVVGTGSSRKSATNSVLWFMGDDIPHVPNKRGGGLCLGGKIAPIFFNTMEDAGA LPIEVDVSNLNMGDVIDVYPYKGEVRNHETGELLATFELKTDVLIDEVRAGGRIPLIIGR GLTTKAREALGLPHSDVFRQAKDVAESDRGFSLAQKMVGRACGVKGIRPGAYCEPKM TSVGSQDTTGPMTRDELKDLACLGFSADLVMQSFCHTAAYPKPVDVNTHHTLPDFIMN RGGVSLRPGDGVIHSWLNRMLLPDTVGTGGDSHTRFPIGISFPAGSGLVAFAAATGVMP LDMPESVLVRFKGKMQPGITLRDLVHAIPLYAIKQGLLTVEKKGKKNIFSGRILEIEGLPD LKVEQAFELTDASAERSAAGCTIKLNKEPIIEYLNSNIVLLKWMIAEGYGDRRTLERRIQ GMEKWLANPELLEADADAEYAAVIDIDLADIKEPILCAPNDPDDARPLSAVQGEKIDEV

FIGSCMTNIGHFRAAGKLLDAHKGQLPTRLWVAPPTRMDAAQLTEEGYYSVFGKSGAR IEIPGCSLCMGNQARVADGATVVSTSTRNFPNRLGTGANVFLASAELAAVAALIGKLPTP EEYQTYVAQVDKTAVDTYRYLNFNQLSQYTEKADGVIFQTAV a) De qu protena es esta secuencia y que funcin metablica tiene?

Nombre de la proteina

Funcion metabolica

b) Encuentre DOS GENES parlogos y DOS ortlogos, indique sus secuencias

1 gene paralogo

>gi|16445223:135988-138585 Escherichia coli O157:H7 str. EDL933 chromosome, complete genome GTGCTAGAAGAATACCGTAAGCACGTAGCTGAGCGTGCCGCTGAGGGGATTGCGCCCAAACCCCTGGATG CAAACCAAATGGCCGCGCTTGTAGAGCTGCTGAAAAACCCGCCCGCGGGCGAAGAAGAATTCCTGTTAGA TCTGTTAACCAACCGTGTTCCTCCTGGCGTCGATGAAGCCGCCTATGTTAAAGCAGGCTTCCTGGCTGCT GTCGCCAAAGGCGAAGCCAAATCCCCACTGCTGACTCCGGAAAAAGCCATCGAACTGCTGGGTACTATGC AGGGTGGTTACAACATTCATCCGCTGATCGATGCGCTGGATGATGCCAAACTGGCACCGATCGCTGCCAA AGCACTTTCTCACACACTACTGATGTTCGATAACTTCTATGACGTAGAAGAGAAAGCGAAAGCAGGCAAC GAATATGCGAAGCAGGTTATGCAGTCCTGGGCTGATGCCGAATGGTTCCTGAATCGCCCGGCGCTGGCTG AAAAACTGACCGTTACCGTCTTCAAAGTCACTGGCGAAACCAACACCGATGACCTTTCTCCGGCACCGGA TGCGTGGTCACGCCCGGATATCCCATTGCACGCGCTGGCGATGCTGAAAAACGCCCGTGAAGGTATTGAG CCAGACCAGCCAGGTGTTGTTGGCCCGATCAAACAGATTGAAGCTCTGCAACAGAAAGGTTTCCCGCTGG CGTACGTCGGTGACGTTGTGGGTACGGGTTCATCGCGTAAATCCGCCACGAACTCCGTTCTGTGGTTTAT GGGCGATGATATTCCACATGTGCCGAACAAACGCGGCGGTGGTTTGTGCCTCGGCGGTAAAATTGCACCC ATCTTCTTTAACACGATGGAAGATGCGGGTGCGCTGCCAATCGAAGTGGATGTCTCTAACCTGAACATGG GCGACGTAATTGACGTTTACCCGTACAAAGGTGAAGTACGTAACCACGAAACCGGCGAACTGCTGGCGAC CTTCGAACTGAAAACCGACGTGCTGATTGATGAAGTGCGTGCTGGCGGCCGTATTCCGCTGATTATCGGT CGTGGCCTGACCACCAAAGCGCGTGAAGCACTTGGTCTGCCGCACAGTGATGTGTTCCGTCAGGCGAAAG ATGTCGCTGAGAGCGATCGCGGCTTCTCGCTGGCGCAGAAAATGGTAGGCCGTGCCTGTGGCGTGAAAGG CATTCGTCCGGGCGCGTACTGTGAACCGAAAATGACTTCTGTAGGCTCTCAGGACACCACAGGCCCGATG ACCCGTGATGAACTGAAAGACCTGGCGTGCCTGGGCTTCTCGGCTGACCTGGTGATGCAGTCTTTCTGCC ACACCGCGGCGTATCCGAAGCCAGTTGACGTGAACACGCACCACACGCTGCCGGACTTCATTATGAACCG TGGCGGTGTGTCGCTGCGTCCGGGTGACGGCGTAATCCACTCCTGGCTGAACCGTATGCTGCTGCCGGAT ACCGTCGGTACCGGTGGTGACTCCCATACCCGTTTCCCGATCGGTATCTCTTTCCCGGCGGGTTCTGGTC TGGTGGCATTTGCAGCCGCAACAGGCGTAATGCCGCTGGATATGCCGGAATCCGTTCTGGTGCGCTTCAA AGGCAAAATGCAGCCGGGCATCACCCTGCGCGATCTGGTACACGCCATTCCGCTGTATGCGATCAAACAA

GGTCTGCTGACCGTTGAGAAGAAAGGCAAGAAAAACATCTTCTCTGGCCGCATCCTAGAAATTGAAGGTC TGCCGGATCTGAAAGTTGAGCAGGCCTTTGAGCTGACCGATGCGTCCGCCGAGCGTTCTGCTGCCGGTTG TACCATCAAGCTGAACAAAGAACCAATCATCGAATACCTGAACTCCAACATCGTCCTGCTGAAGTGGATG ATCGCGGAAGGTTACGGCGATCGTCGTACCCTGGAACGTCGTATTCAGGGCATGGAAAAATGGCTGGCGA ATCCTGAGCTGCTGGAAGCCGATGCAGATGCGGAATACGCGGCAGTGATCGACATCGATCTGGCGGATAT TAAAGAGCCAATCCTCTGTGCTCCGAACGACCCGGACGACGCACGTCCGCTGTCTGCGGTACAGGGCGAG AAGATCGACGAAGTGTTTATCGGTTCTTGCATGACTAACATCGGTCACTTCCGTGCCGCAGGTAAACTGC TGGATGCGCACAAAGGTCAGTTGCCGACCCGCCTGTGGGTGGCACCGCCAACCCGTATGGACGCCGCACA GTTGACCGAAGAAGGCTACTACAGCGTCTTCGGTAAGAGTGGTGCGCGTATCGAGATCCCTGGCTGTTCC CTGTGTATGGGTAACCAGGCGCGTGTGGCGGACGGTGCAACGGTGGTTTCCACCTCTACCCGTAACTTCC CGAACCGTCTGGGTACTGGCGCGAATGTCTTCCTGGCTTCTGCGGAACTGGCTGCTGTTGCGGCGCTGAT TGGCAAACTGCCGACGCCGGAAGAGTACCAGACCTACGTGGCGCAGGTAGATAAAACAGCCGTTGATACT TACCGTTATCTGAACTTCAACCAGCTTTCTCAGTACACCGAGAAAGCCGATGGGGTGATTTTCCAGACTG CGGTTTAA

Segundo gen paralogo

>gi|387825439:134420-137017 Escherichia coli BL21(DE3) chromosome, complete genome GTGCTAGAAGAATACCGTAAGCACGTAGCTGAGCGTGCCGCTGAGGGGATTGCGCCCAAACCCCTGGATG CAAACCAAATGGCCGCACTTGTAGAGCTGCTGAAAAACCCGCCCGCGGGCGAAGAAGAATTCCTGTTAGA TCTGTTAACCAACCGTGTTCCCCCAGGCGTCGATGAAGCCGCCTATGTCAAAGCAGGCTTCCTGGCTGCT ATCGCTAAAGGCGAAGCCAAATCCCCTCTGCTGACTCCGGAAAAAGCCATCGAACTGCTGGGCACCATGC AGGGTGGTTACAACATTCATCCGCTGATCGACGCGCTGGATGATGCCAAACTGGCACCGATCGCTGCCAA AGCACTTTCTCACACACTGCTGATGTTCGATAACTTCTATGACGTAGAAGAGAAAGCGAAAGCAGGCAAC GAATATGCGAAGCAGGTAATGCAGTCCTGGGCGGATGCCGAATGGTTCCTGAATCGCCCGGCGCTGGCTG AAAAACTGACCGTTACCGTCTTCAAAGTCACTGGCGAAACCAACACCGATGACCTCTCTCCGGCACCGGA TGCGTGGTCACGCCCGGATATCCCACTGCACGCGCTGGCGATGCTGAAAAACGCCCGTGAAGGCATCGAG CCAGACCAGCCAGGTGTTGTTGGTCCGATCAAGCAAATCGAAGCTCTGCAACAGAAAGGTTTCCCGCTGG CGTACGTCGGTGACGTTGTGGGTACGGGTTCATCGCGTAAATCCGCCACGAACTCCGTACTGTGGTTTAT GGGTGATGATATTCCACATGTGCCGAACAAACGCGGCGGTGGTTTGTGCCTCGGCGGTAAAATTGCACCA ATCTTCTTTAACACAATGGAAGACGCAGGTGCACTGCCAATCGAAGTCGACGTCTCTAACCTGAACATGG GCGACGTAATTGACGTTTACCCGTACAAAGGTGAAGTGCGTAACCACGAAACCGGCGAACTGCTGGCGAC CTTCGAACTGAAAACCGACGTGCTGATTGATGAAGTGCGTGCTGGCGGCCGTATTCCGCTGATTATTGGG CGTGGCCTGACCACCAAAGCGCGTGAAGCACTTGGTCTGCCGCACAGTGATGTGTTCCGTCAGGCGAAAG ATGTCGCTGAGAGCGATCGCGGCTTCTCGCTGGCGCAAAAAATGGTAGGCCGTGCCTGTGGCGTGAAAGG CATTCGTCCGGGCGCGTACTGCGAACCGAAAATGACTTCTGTAGGCTCTCAGGACACCACCGGCCCGATG ACCCGTGATGAACTGAAAGACCTGGCGTGCCTGGGCTTCTCGGCTGACCTGGTGATGCAGTCTTTCTGCC ACACCGCGGCGTATCCGAAGCCAGTTGACGTGAACACGCACCACACGCTGCCGGACTTCATTATGAACCG TGGCGGTGTGTCGCTGCGTCCGGGTGACGGCGTCATTCACTCCTGGCTGAACCGTATGCTGCTGCCGGAT ACCGTCGGTACCGGTGGTGACTCCCATACCCGTTTCCCGATCGGTATCTCTTTCCCGGCGGGTTCTGGTC TGGTGGCGTTTGCTGCCGCAACTGGCGTAATGCCGCTGGATATGCCGGAATCCGTTCTGGTGCGCTTCAA AGGCAAAATGCAGCCGGGCATCACCCTGCGCGATCTGGTACACGCGATCCCGCTGTATGCGATCAAACAA

GGTCTGCTGACCGTTGAGAAGAAAGGCAAGAAAAACATCTTCTCTGGCCGCATCCTGGAAATTGAAGGTC TGCCGGATCTGAAAGTTGAGCAGGCCTTTGAGCTAACCGATGCGTCCGCCGAGCGTTCTGCCGCTGGTTG TACCATCAAGCTGAACAAAGAACCGATCATCGAATACCTGAACTCTAACATCGTCCTGCTGAAGTGGATG ATCGCGGAAGGTTACGGCGATCGTCGTACCCTGGAACGTCGTATTCAGGGCATGGAAAAATGGCTGGCGA ATCCTGAGCTGCTGGAAGCCGATGCAGATGCGGAATACGCGGCAGTGATCGACATCGATCTGGCGGATAT TAAAGAGCCAATCCTCTGTGCACCGAACGACCCGGACGACGCACGTCCGCTGTCTGCGGTACAGGGCGAG AAGATCGACGAAGTGTTTATCGGTTCCTGCATGACCAACATCGGTCACTTCCGTGCTGCGGGTAAACTGC TGGATGCGCACAAAGGCCAGTTGCCGACGCGCCTGTGGGTGGCACCGCCAACCCGTATGGATGCCGCGCA GTTGACCGAAGAAGGCTACTATAGCGTCTTCGGTAAGAGCGGTGCGCGTATCGAGATCCCTGGCTGTTCC CTGTGTATGGGTAACCAGGCGCGTGTAGCAGACGGTGCGACGGTGGTTTCCACCTCTACCCGTAACTTCC CGAACCGTCTGGGGACTGGCGCGAATGTCTTCCTGGCTTCTGCGGAACTGGCGGCTGTTGCGGCGCTGAT TGGCAAACTGCCGACGCCGGAAGAGTACCAGACCTACGTGGCGCAAGTAGATAAAACTGCCGTTGATACT TATCGTTATCTGAACTTCAACCAGCTTTCTCAGTACACCGAAAAAGCCGATGGGGTGATTTTCCAGACTG CGGTTTAA

GENES ORTOLOGO 1

>gi|30061571:129353-131950 Shigella flexneri 2a str. 2457T, complete genome GTGCTAGAAGAATACCGTAAGCACGTAGCTGAGCGTGCCGCTGAGGGGATTGCGCCCAAACCCCTGGATG CAAACCAAATGGCCGCGCTTGTAGAGCTGCTGAAAAACCCGCCCGCGGGCGAAGAAGAATTCCTGTTAGA TCTGTTAACCAACCGTGTTCCCCCAGGCGTCGATGAAGCCGCCTATGTAAAAGCAGGCTTCCTGGCTGCT ATCGCTAAAGGCGAAGCTAAATCCCCTCTGCTGACTCCGGAAAAAGCTATCGAACTGCTGGGCACCATGC AGGGTGGTTACAACATTCATCCGCTGATCGACGCGCTGGATGATGCCAAACTGGCACCTATTGCTGCCAA AGCACTTTCTCACACGCTGCTGATGTTCGATAACTTCTATGACGTAGAAGAGAAAGCGAAAGCAGGCAAC GAATATGCGAAGCAGGTAATGCAGTCCTGGGCGGATGCCGAATGGTTCCTGAATCGCCCGGCGCTGGCTG AAAAACTGACCGTTACCGTCTTTAAAGTCACTGGCGAAACCAACACCGATGACCTTTCTCCGGCACCGGA TGCGTGGTCACGCCCGGATATCCCACTGCACGCGCTGGCGATGCTGAAAAACGCCCGTGAAGGTATTGAG CCAGACCAGCCAGGTGTTGTTGGCCCGATCAAACAGATTGAAGCTCTGCAACAGAAAGGTTTCCCGCTGG CGTACGTCGGTGACGTTGTGGGTACGGGTTCATCGCGTAAATCCGCCACGAACTCCGTTCTGTGGTTTAT GGGCGATGATATTCCACATGTGCCGAACAAACGCGGCGGTGGTTTGTGCCTCGGCGGTAAAATTGCACCC ATCTTCTTTAACACGATGGAAGACGCGGGTGCACTGCCAATCGAAGTCAACGTCTCTAACCTGAACATGG GCGACGTGATTGACGTTTACCCGTACAAAGGTGAAGTGCGTAACCACGAAACAGGCGAACTGCTGGCGAC CTTCGAACTGAAAACCGACGTGCTGATTGATGAAGTGCGTGCTGGCGGCCGTATTCCGCTGATTATCGGG CGTGGCCTGACCACCAAAGCGCGTGAAGCACTTGGTCTGCCGCACAGTGATGTGTTCCGTCAGGCGAAAG ATGTCGCTGAGAGCGATCGCGGCTTCTCGCTGGCGCAGAAAATGGTAGGCCGTGCCTGTGGCGTGAAAGG CATTCGTCCGGGCGCGTACTGCGAACCGAAAATGACTTCTGTAGGCTCTCAGGACACCACCGGCCCGATG ACCCGTGATGAACTGAAAGACCTGGCGTGCCTGGGCTTCTCGGCTGACCTGGTGATGCAGTCTTTCTGCC ACACCGCGGCGTATCCGAAGCCAGTTGACGTGAACACGCACCACACGCTGCCGGACTTCATTATGAACCG TGGCGGTGTGTCGCTGCGTCCGGGTGACGGCGTCATTCACTCCTGGCTGAACCGTATGCTGCTGCCGGAT ACCGTCGGTACCGGTGGTGACTCCCATACCCGTTTCCCGATCGGTATCTCTTTCCCGGCGGGTTCTGGTC TGGTGGCGTTTGCTGCCGCAACTGGCGTAATGCCGCTGGATATGCCGGAATCCGTTCTGGTGCGCTTCAA AGGCAAAATGCAGCCGGGCATCACCCTGCGCGATCTGGTACACGCCATTCCGCTGTATGCGATCAAACAA GGTCTGCTGACCGTTGAGAAGAAAGGCAAGAAAAACATCTTCTCTGGTCGCATTCTGGAAATTGAAGGTC

TGCCGGATCTGAAAGTTGAGCAGGCCTTTGAGCTAACCGATGCGTCCGCCGAGCGTTCTGCCGCTGGTTG TACTATCAAGCTGAACAAAGAACCGATCATCGAATACCTGAGCTCCAACATCGTCCTGCTGAAGTGGATG ATCGCGGAAGGTTACGGCGATCGTCGTACCCTGGAACGCCGTATTCAGGGCATGGAAAAATGGCTGGCGA ATCCTGAGCTGCTGGAAGCCGATGCAGATGCGGAATACGCGGCAGTGATCGACATCGATCTGGCGGAGAT TAAAGAGCCAATCCTGTGTGCTCCGAACGATCCGGATGACGCACGTCCGCTGTCTGCGGTACAGGGCGAG AAGATCGACGAAGTATTTATCGGTTCTTGCATGACTAACATCGGTCACTTCCGTGCCGCTGGTAAACTGC TGGATGCGCACAAAGGTCAGTTGCCGACCCGCCTGTGGGTGGCACCGCCAACCCGTATGGACGCCGCGCA ACTGACGGAAGAAGGCTACTACAGCGTCTTCGGTAAGAGCGGGGCTCGTATCGAGATCCCGGGCTGTTCC CTGTGTATGGGTAACCAGGCGCGTGTAGCAGACGGTGCGACGGTGGTTTCCACCTCTACCCGTAACTTCC CGAACCGTTTGGGTACTGGCGCGAATGTCTTCCTGGCTTCTGCAGAACTGGCGGCTGTTGCGGCGCTGAT TGGCAAACTGCCGACGCCGGAAGAGTACCAGACCTACGTTGCGCAAGTAGATAAAACTGCCGTTGATACT TATCGTTATCTGAACTTCAACCAGCTTTCTCAGTACACCGAAAAAGCCGATGGGGTGATTTTCCAGACTG CGGTGTAA

>gi|16758993:189006-191603 Salmonella enterica subsp. enterica serovar Typhi str. CT18 chromosome, complete genome GTGCTAGAAGAATACCGTAAGCACGTAGCTGAGCGTGCTGCCCAGGGGATTGTGCCGAAACCTTTAGACG CAACCCAAATGGCTGCGCTTGTCGAGCTGCTGAAGACCCCGCCTGTGGGCGAAGAAGAATTCCTGTTAGA CCTGTTGATCAACCGCGTTCCTCCTGGCGTCGATGAAGCCGCTTATGTTAAAGCCGGTTTTCTCGCTGCT GTCGCGAAAGGCGACACCACCTCCCCGCTGGTCTCCCCAGAAAAAGCCATTGAACTGCTGGGCACCATGC AGGGTGGTTACAACATTCATCCGCTGATTGACGCGCTGGACGATGCGAAACTGGCGCCGATTGCGGCCAA AGCGCTGTCTCACACCCTGCTGATGTTCGATAACTTCTACGACGTAGAAGAGAAAGCCAAAGCGGGCAAT GAATATGCCAAACAGGTGATGCAATCTTGGGCCGACGCCGAATGGTTCCTGAGCCGTCCGCCGCTGGCGG AAAAAATCACCGTCACCGTTTTCAAAGTGACCGGCGAAACGAATACCGACGATCTCTCTCCGGCGCCGGA TGCGTGGTCGAGACCGGATATCCCGTTACATGCGCAGGCGATGCTGAAAAACGCCCGTGAAGGCATTGAG CCGGATCAGCCAGGCGTTGTCGGCCCGATCAAACAAATCGAAGCATTGCAGAAAAAAGGCTACCCGCTGG CCTACGTGGGTGACGTGGTGGGCACCGGTTCTTCCCGTAAATCCGCGACCAACTCCGTGCTGTGGTTCAT GGGCGATGACATCCCGAACGTGCCGAACAAGCGCGGCGGCGGTCTGTGCCTCGGCGGCAAAATTGCGCCT ATCTTCTTTAACACCATGGAAGATGCGGGCGCGCTGCCGATTGAAGTTGACGTTTCTAACCTGAACATGG GCGATGTAATTGACGTCTACCCGTACAAAGGCGAAGTGCGCAATCATGAAACCGATGAACTGCTGGCAAC CTTCGAACTGAAAACCGACGTGCTGATCGACGAAGTACGCGCCGGTGGCCGTATTCCGCTGATTATCGGA CGTGGCCTGACCACCAAAGCGCGTGAAGCGCTGGGTCTGCCGCACTCTGACGTTTTCCGTCAGGCAAAAG ACGTGGCAGAAAGCAGCCGTGGCTTCTCTCTGGCGCAGAAAATGGTCGGTCGCGCCTGCGGCGTGAAAGG CATTCGTCCGGGCGCGTACTGCGAACCGAAAATGACCTCCGTCGGTTCTCAGGATACTACTGGCCCGATG ACCCGTGATGAGCTGAAAGACCTGGCCTGTCTGGGATTCTCCGCCGATCTGGTCATGCAGTCGTTCTGTC ACACCGCAGCCTATCCGAAGCCCGTTGACGTCACCACGCACCACACGCTGCCGGACTTCATTATGAACCG CGGCGGTGTCTCCCTGCGTCCGGGCGACGGCGTGATCCACTCCTGGCTGAACCGTATGCTGCTGCCGGAC ACCGTCGGTACCGGCGGTGACTCCCATACCCGTTTCCCGATTGGTATCTCTTTCCCGGCGGGTTCTGGTC TGGTGGCGTTTGCCGCCGCGACCGGCGTGATGCCGCTGGATATGCCGGAATCGGTGCTGGTGCGCTTCAA AGGCAAAATGCAGCCGGGCATCACCCTGCGCGATCTGGTCCATGCCATCCCGCTGTACGCCATCAAACAG

GGCCTGCTGACCGTTGAGAAGAAAGGCAAGAAAAACATCTTCTCTGGCCGCATCCTGGAAATCGAAGGTC TGCCGGATCTGAAAGTCGAGCAGGCGTTTGAGCTGACCGATGCTTCTGCCGAGCGTTCCGCTGCCGGTTG TACCATCAAGCTGAACAAAGAGCCGATCGTTGAATACCTGACCTCCAACATCGTCCTGCTGAAGTGGATG ATCGCCGAAGGCTACGGCGACCGTCGTACGCTGGAACGTCGTATCCAGGGTATGGAAAAATGGCTGGCGG ACCCGCAGCTGCTGGAAGCCGATGCTGACGCGGAATACGCAGCGGTGATCGACATCGATCTGGCGGATAT CAAAGAGCCAATCCTCTGTGCGCCGAACGATCCGGACGACGCGCGTCTGCTGTCTGACGTGCAGGGCGAG AAGATCGACGAAGTGTTCATCGGTTCCTGCATGACCAACATCGGCCACTTCCGCGCGGCTGGTAAGCTGC TGGATAGCCACAAAGGCCAGTTGCCAACCCGCCTGTGGGTAGCGCCGCCAACCCGTATGGACGCTGCGCA GCTGACCGAAGAAGGTTACTACAGCGTGTTTGGTAAGAGCGGTGCGCGTATCGAAATCCCGGGTTGTTCC CTGTGTATGGGTAACCAGGCGCGTGTGGCTGACGGCGCGACGGTGGTTTCCACTTCTACCCGTAACTTCC CGAACCGTTTAGGTACTGGTGCGAACGTCTTCCTGGCTTCTGCGGAGCTGGCGGCGGTTGCAGCGCTTAT TGGCAAACTGCCGACGCCGGAAGAGTACCAGACCTTTGTGGCGCAGGTGGATAAGACGGCGGTGGATACC TACCGTTATCTGAACTTCGACCAGCTCTCTCAGTACACTGAGAAAGCGGATGGGGTGATTTTCCAGACTG CGGTATAA

c) Se obtiene algn resultado diferente al hacer un BLAST variando matrices y usando el GEN de la secuencia?

Con BLOSUM 45

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++ EJERCICIO 3


SE TIENE LA SIGUIENTE SECUENCIA DE NUCLEOTIDOS, Y SE CONOCE LAS POSICIONES DE LOS EXONES DENTRO DE LA SECUENCIA (5017 a 5141, 15065 a 15330, 18778 a 18931, 26762 a 26795) a) ENCONTRAR LA PROTEINA CODIFICADA Y EL ORGANISMO AL QUE PERTENECE Y SU POSICIN CROMOSMICA b) MUESTRE LA SECUENCIA PROTEICA Y LA DEL CDS
AATTAGCATATTCATATATAATTTCGTGGGTGTTATTGTTTAAAAAAATGAGTGAACTTATTTTAGATGA GTCATTTTAAAGAAAAATGTTGAGTAAAGAAAAGTGTAGCCGGAGGCCAGGCACAGTGGCTCACGCCTGT AATCCCAGCACTTCGGGAGGCCGAGGCAGGTGGATCACTTGAGATCAGGAGTTCAAGACCGGCCTGGCCA ACATGCTGAAACACTGTCTCTACTAAAAATACAAAAATTAGCTGGACATGGTTGTGGGCGACTGTCATCC CAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTGGAACCCAGGAGGCAGAGGTTGCAATGAGTTGAGAT CACACCATTGCACTCCAGCCTGGGTGATAGAGCGAGACTCTGTCTCAAAAGAAAAAAAAAAGGGTAGCCA AGTGCAGAGGCTCAGGCCTGTAATCCCGGCACTTTGGGAAGCCAAAGCAGGAGGATCACTTGTGCCCAGG AGTTTGAGACCAGCCTGGGCAACATAGGAAGATCCCAACTCTACAAAAAAATTTTTTTAATTAGTCGGTC

ATGGTGGTGTGTGCTGTAGTCCTAGCTACTCGGGGGGATGAGGCAGGAAGATCACTTGAGCCAAGAGGTC AAGGCTGCAGTGAGCTGTGGTCACACCACCGCACTCCAGCCTGGGCTACAGAAGGAAACCCTGTCTCAAA AAAAAAGAAAAAGAAAAGTGTAGGTGATGTGTGCATATGGAAAGAATTACGAATGTGGTATGAGAAACAC TGAGGTTTGAGAAATGTTCACAATAAACAAAGCGGGACATCAGTTAAAGCTGTGAAAAGGATCTTATTCA GTAACCACTGGCAGTAGGGGAAAGAGCTGAGCTCCGTTCAGATTCCTGCAGAGGTGGCTGGGTGTCTAGA AGGCAGAATGAGGGATGGCGAGAGAAGGGCACTGCAAGTAAAAATCATAAAAAGTTGGCTGGCTCATGCC TGTAATCCCAGCACTTTCAGAGGCCAAGGCAGGTGAATCACCTGAGGTTAGAAGTTCGAGACCAGCCTGG CCAACATGGCAAAATCCCGTGTCTACTAAAAACACAAAAACTAGCTGGGCGTGGTGGTGTGCACCTGTAA TCCCAACTACTCAGGAGGCTGAGGAAGGAGAATCGCTTGAACCCGGAAGGCAGAGGTTGCAATGAGCCGA GATCATGCCACTGCACTCCAGCTTGGGCAACAGAGCAAGACACCATCTAAAAAAAAAAAATTGTACAGTG TCAATGGGATTCAGCCAGCTGTGTCTGCTAGCTGGCAATTGTCATAGTTAGAATTCTATCCTCCCGCAGA GACTGGGAGATGGAGGTCCTCTCCTTCTGACAATTCTATTTCAAAGGAATGGCTTTCAGATCCTCTAGAA ACACCCCTGAGTTGTAGGATATAGATACATATACACCCATGTCTGAAAAAGGAAGGAGTCATAATTGTAG GCCCTTCTTAGTAAATGCTCTGAAAAGGGAAATTAGGGGTATATTGCCAGATATTGGCTAGGTCAGACAG TAAATTCTCCTGGCAAGGTAGAGCTTTCTCGGGTGGTATTTTAACTGGGGGCTGGAGTCATCCTAAGAAC ACGACCTTATGCTGCTAGATGCCCTGCTAAACTTTGATCATCTCTTTCTTTCTTTTCTTTTTCTCTTTTT TTTTTTTTTTTTGAGACAGAGCCTTGCTCTGCTGCCCAGGCTGGAGTACAGTGGCTCAATAATAATTCAC TGCAGCCTCGAACTCCTGAGCGCAAGCAATTCTCCCACCTCAGCCTCCCAAGTAGCTAAGACTACAGGCA CATGCATGCCACCATGCCCAGCTAATTTTTTTATTTTTTTGTAGAAATGGGGGTCTCATTATGTTTCCCA GGCTGGTCTCAAACACCTGGCCTCAAGCAATCCTCCCACCTCAGCCTCCCTAAGTGCTGGGATTACAGGC ATGAGCCACCACACCTGGCCTTGGTCATCTCTTAATGCAGAGGTTTACATGGAGTTCTGCAGTCCTCAGA AACAGTGACCTGCTAAGTTCTCCTCGTCCTGCAGGGGTCCGCTTCACCGTCTCTTCCCCAGAGTCTTCCC TTATCCAGCCTGAGTCTCAGCTAGATTGAGAGTCAGATCCTTTCAAAGCTCTGTTTTTCATCTTTCCTTT CCATTAAAGTTCTTTCTTTTCTTTTTTTTTTTTTGAGACCGAGTTTCACTCCTGTTTCCCAGGCTGGAGT GCAATGGCGTGATCTTGGCTCAGCACAACCTCTGCCTCCTGGGTTCAAGAGGTTCTCCTGCCTCAGCCTC CCGAGTAGCTGGCATGCACCACCACGCCCAGCTAATTTTCTATTTTTAGTAGAGACAGGGTTTCTCCATG TTGGTCAGTCTGGTCCAGAACTCCTGACCTCAAGTGATCCGCCTGCCTCGGCCTCCCAAAGTGCTGGGAT TACAGGTGTGAGCCACCGTGCCCGACCTCAATCAAAGTTCTTTTGGGATTTAAAGTAACTGAATCCCAAA ACAAACTGACTTCAGGGGAAACAATGAGAATACACAGACCAGCATAGCACACAAGCTGAAGGATCAGTAT GGACATCAGGCACAGCTGAATCTAGGTGTTTAAATGATGCCATTAGAAATCTCTCTTTCTGTGCATTGAC TATGCTTTCACATGTGTTGGCCTCGTTTTTAGGCAATCTCTCTACTCATGATAGAAAGATGGCCCCCAGC AGCTGCACACTGAGATCTCTTCAGCTCAGCAAACCCGGAAGCAAGAAAAAATGCTTTTAGGCTGGGTGCG GTGTCTCACGCCTATAATCCCACCACTTTGGGAGGCCGAGGCAGGTGGGTCACTGGAGGCCAGGAGTTCA AGACCAGCCTGGGCAACATAGTGAAAGACTGTCTCTACTAAAAATATGAAAAAATTAGCTGGGCATGGTG GCACATGCCTGTAATCCCAGCTAATCCGGAGGCTGAGGCATGAGAATCTCTTAAACCCCAGAGGTGGAAG TTGCAGCGAGCAGAGATCACACCACTGCACTCCAGCTTGAGCAACACAGCAAGACTCTGTCTTTAAATAA ATAAATAAAAATTTAAAAACAGAAAAAAGAAAAATTGCTTTATTCCCCAGAGTTCCAATAAAATCCGTAA GAGATTGCTTCTCCTTGGCCTGTTCTGAGTGCCACGCCCAGGTCTCCAAAAATCACTGTTGTCAGGGGAT GAAGTGCTCTGATTGGCCAGTCCTGGGCCCCTCACCTCCCTGGAGCCATGAGGAGGCTGGTTTCCAAAAG AGAACTCCAGGTGCTGTTACCTGGATACAAGAGAGTACTGGCTGGGTAGAAACCCCAGAAACCTTACAAC ATAATGGTTATTAACTGCATCGTAAATATTTACTTTTTCCTACAGTGGTCTCCTGACCTAGCTAATCACT CCAGCAGAGGCCTTCAGACCAACCATAAAAAAGGCACTTTAGCAAATGCTAATAAAGAAATAACTGTGTC ACCTGATAATGACTATTATTAGAGACTTATGGGTGAACCTTAGCCCCTGGGTGGAACCTGAACCTCTCTG GGAGGGAAAAGCATGAGCTTCTAAGTCAGAAAGATCTGAGTTCAAGTCTGAACACTCCCATTTCACTCAC TTGCTCTTCATTCATTTATTCACTAAAAAGAAAACATGTAGGCTGGCTAGGTGGTTCATGCCTGTAATCC CAGCACTCTGGGAGGCTGAGGCAGGAGGATCACTTGAGCCCAGAAGTTTGAGACCAGCCTGGGTAATATA GTGAAACTCTATTTCTACAAAAAGAAAAAAAATTTAATTGGCTGGGAATGGTAGTGTGAGACTGTAGTCC CAGCTACTCAGGAGACTGAGGCAGGATTATTGCTTGAATCCAAAAGGTTGAAGCTGCAGTGAGCTATGAC CGTGCCACTGCACTCCAGCCTGGCTGACAGAGTGAGACCCCGTCTCAAAAACAAAAACATGTATTGAGCA CCTGTTATATGCAAGGCACTGTTCTAGTCACTAGGGACATAGCCACAAGCCAGACAACATCCCTGCCCTC CTGGATCTGATATTCAAGTCGGAGAGGTGGGACTAAGGAGGGAGAGACAGATAATACAAGTGGACAAATA AATAAATCATCTAAAATAGCGGTAAATGATGTAAAGAAAACAAAACAGTGTGGCTTGCTAGCAAAGAGGT GGGGAACTGAGTTGCAGCAGGCATTAAGAAAGGCCTTTTTGATAGAGTGATGTGTGTGAATTAAGCCAAA ATAATAAGATACAGTCAGCTTTGAGATTACATGAGTAAGGTTCTAAGGAGAGGGAACGGCTCATGCAAAG CCCCTGAGCTGGTGCCTCCAAAAACTGGCAGAAAGCCCCTGTGAACGGTTGTGTGATGGTAGGTGAGTTA CTTAGCCCCTGTGCACCACGAGAAAATGGGGATGCTCATATCTACCCCTCGAGGTTGCTATGAGGATTCA AATTAGGCAACCCTGTTACAAGGTTAATGCTGTGTCCGGCATATAGTAGGTGTTCAATAAACACCAGCTA

TTAGTTTGAGTAATATAATTATTAATTTGAGGAGGAAAGAATGGACCTGGGGAGTGAGAAGGGTGAGGAA AAAGTAGCTAGTGTAGCTTATCCTTCTAGAATCTAAAATTCAGGATATAGTCTGAGCAAGCTCCTGATAA CGGGATTCTAAACATGCCTCCAGGACATCCTAGACACCAAATTATAATTAGCATTGACTTCATAGTGACT GCCATTCGTTGAGCGCCTACTACGTGACCAGGCACTACTCCAAGCACCTTGTGTCCACGGCCCTGTCTGA CTCTGGGGCAGGCACTATTATTAACGCCTCCATTTTACAGAGGAGAAAAGCTGTGGTTCAGAGTCCAAAG CCCCGTCACCTCCTACCAGGTTGACCTTTGGCCATTCCTTGCCTTTGATGTGAGTGATAGGAGCGGGCGA TTCTGCTTCTCCCTCCATCTCCCGGCGGGGATTGTACGGTGAGAGAATGAGAGCAAAACCTCAGAGCCCC CTTCCCAGGAACCCTGTCCCAGCCTGGTCCCCACCCACCACCACCACTGACCCGATGCTAGAGAAGGATG CGGCTGGAGGTGACTTCCCAGCCAACTTGGTGTAAGTCATGTGGGGAAGTGGCCAGGGTAGGGCATGGTC ATCGTGAGCAGGGTCCTGCAGGGTGAGGCCGGGGCTGCAGACGCGACTGTACAGGTCTATGAAGACCCCA TGTGTGATGAGGAGACCTTCTCTGCACAGTCCCTGGACAGAACACGAGATGAGGGGTCCTCTGGACGTCA GCTCCAGCCACACCCCTACCTGGAGGAAGCTGCTTTTAACAGGTGCGTTGGAGACAGCGGCTTCACCACG GGCCAGGGACAAGGAGGAGAGTGTCTCCTTACGAGTCCAAGTCACCCCCACTCAGAGCTTTGACCCTGTC AGTTTGAGGCCCATGCAGCTCAGGCACCCAACTCATGAGAACTCTTGAAGGCCACTCCGCCACAAGAGAT GACCCTATTGGCTTCTTTTAGGAAGAAGGGAAGTGAGGCGCAAAGAGGAGAACAGGTCACCTACCCAAGA TCACAGGGCTGGCAAGGGGCAGGATCAGAATTTGGGACCCCAGCCCAGCCCCCTTCCACCAGAATGCCCT GTCTCACCCCTGCAATCCGCAACTTAGTAATAATACATATAAATAATAACAATCATAAAATAATAACAGC CGTAATAGAAGGTCACTGTAACTGAATAGATCTATATACCAGCCTGTTTGGGGTTTTTGTTTTTTTGTTT TGTTTTGTTTTGAGACAAGGTCTTGCTCTGTTGTCCAGGCTACAGTGCAGTGGCCCGATAATGACTCATT GCAGCTTCAACCTGCTGGGCTGAAGCCGTTCTCCTGCCTCAGCGTCCTGCGTAGCTGGGACCATAGGTAT GCGCCACCAAACCCAGCTAATTTTTTATTTTTAGTAGAGATGAGGTCTTACTATGTTGCCCAGGCTAGTC TCGAACTCCTGGGCTCAAGCGATCCTCCTGCCTCGGCCTCCCCAAGTGCCAGGATTACAGGCGTGAGCCA CTGCGCCCAGCCTGTCAGCCCGTTCTAAGTGCTTTCCTATAGTAACATTTACCTCTTATCACAACTCTTT GAGATCAGAGCTGTACGATCCCTATTTCACAGAAGGGGAAACTGAGGTTCAGAGAGGTCATGTGCCCTCT CCAGGTCACACACTTGGAAGTGGCAGACTGAAGATTTGAAGCCAGATGGGCTGGCTTCCCAGACCACACT TTCCAGAGACCACACACATCTGCCTCTCAGATAGTGAATGAATTGCTTCCTTATCCAGGTCTTAAAAGTT CACTTCTGAGTTGGGCGCGGTGACTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGCAGGCGGATC ACGAGGTCAGGAGATCGAGACCATCCTGGCTAACACGGTGAAACCCCGTCTCTACTAAAAATACAAAAAA TTAGCCAGGCCTGGTGGCGGGCGCCTGTAGTCCCAGCTACTCAGAAGGCTGAGGCAGGAGAATGGCGTGA ACCCGGGAGGCGGAGCTTGCAGTGAGCCAAGATCGTGCCACTGCACTCCAGCCTGGGCGACAGAGCACGA CTCCGTCTCAAAAATAAATAAATAAAGTTCAGTTCTGAGCCGGGTGCAGTGGCTCACGGGTGCAGTGGCT GGGATTACAAAGTGCTGTAATCCCAGCACTTTGGGAGGCCAAGGCGGGCGGATCATCTGAGGTCAGGAAT TCAAGACCAGCCTGACCAACATGGAGAAACCCCGTCTCTACTAAAAACAGAAAATTAGCTGGGCGTGGTG GTGCATGCCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGGCGGAGG TTGCGGTTAGCTGAGATGGTGCCATTGCACTCCAGCCTGAGCAACAAGAGCGAAACTCCATCTTTAAAAA AAAAAAAAAAAAGTTCAGTTCCATGTAATTTTAAAACCTCAAAGTCCACCTAGTTCAAAGCTTTGCTCTG TCCCCAGCTCAGGCAGGTGTCACACTGGAAGGAGGAAAGGGACGTGGTGGGCCTCTTCCCTATTTTGTCA GAGCTGTTGTCTGAGGCCTCTCTCAGGGCGGAGGGCAGAGGGGAGGAAGGAAAGAAAAGGAGATTGGAAA GTTTCTCCTAGGCTGCTGTAGTTTTGTGATGGAAACACGGCATGCTGTGTGTTGCTGGATCTTCCTGGGG GCGGGAGGGTGGGGTACTTTGGAAATTGGCTGTGCCACTGGATAAAACAGCAACCAGTTTTTAGAAAGTG GTTTACAACATGTTTGCAAAGTGAGCTGGGGGAGCTTACAAAACATTGTCCAAAGGAAAACAAAGCCACA GTGCAACGAACTTCAACTCTGTAAATACAAAATGTTCTCTTGATAACAGCAGGTACCTCGAGAGTGTGAC CAGGACAAGCGTAGGGGTGGAGGTCAAAGGGATATTTGGCTTTATATGGGTCTACTTTTTTTTCCTAAGG AGAAGCTCTTGAGTGATTAAAAATTAATTTTAAAAATTATGAAAAACCTTCAAAGAAAATATACTCCCCA AAGTGGTTATCTGAGTATTAGGCTTAAGGATTTGTTTTACTGCTTTTTACTTTACTTTCCAAATTATTCT ATAATGAGGAGCAGACATTGTTTTTTCTGATGCCTTGTAAGAATTGCTGAACATAATTCTACTTTTTGTT TAAAAGAAATAGAAACAGCCAGGCGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCCAGGCA GGCGGATCACAAGGTCAGGAGATTGAGACCATCCTGGCCGACATGGTGAAACCCTGTCTCTACTAAAATA CAAAAAAATTAGCTGGGCGTGGTGGCGCACGCCTGTAGTCCCAACTACTCGGGAGGCTGAGGCAGGGGAA TCACTTGAACCCGGGAGGTGGAGCTTGCAGTGAGCCGAGATTGCACCACTGCACTCCAGCCTGGCGACAG AGCGAGACTCCATCTCAAAAAAAAAAAAAAAAAGAAGAAGGAAATAGAAACAATAACAAGCATAAAGCTT GAAAAAAAAAAACAGTAAAAGTTTCCAAAACATAGTGTTTATTTCTAGGAGTCTAAGTTTTCTGCTATAA AAATGGAAATAAATAAATATATATATATGAGTATATATGAGTAATACCATATATGTAGAGAGAGAGAGGG AGAGAGAGAAAAAGAGAGAGAGAGAGAGGGAGAAAGGTCTTGCTCTGTCACCCAGGCTGCAGTGCAGTGG CAGGATCATAGCTCACTGAAACCTCAAACTCCTGGACTTGAGGAATCTTCCCACCTCAGCCTCCTGAGTA GCTGGGACTACAGGCGCGTGCCACCATGCCCAGCGAATTTTTTATTTTTGTAGAGACAGGGCCTCACTCA GTTGCCCAGGCTAGTCTTGAACTTCTGGCTCAAGTAATCTTCCAGCCTTGCCCCACCCCTCCCCCCGCCC

CCGCAAAGTGCAGGATTACAGGTATGAGCCAACACACCGGCCTACTCTTATATTAAAAAAAAAAAAAAAA TGCCTATCAGGAGTGAAAGGATTAGGTGTGGTGCCCAAGAGACGCAGGGATTCTTTTTGGGATGACGAAA ATGTCCTTAAATTGCTTGAGGTGATGGTTGCCCAATTCTGTGAGTATACTAAAAGCTCTTGAATTGTACG CTTTAAATGAGTAAATTATTGGCTAAGAAAGTAGATTTTATGTGTTCTCACCACAAAAAAAATAAGTACA TGAGGTAATGCATATGTTAATTAGCTCAATTTAGCCATTCCACAATGTATATGTATTTTAAAACATCACA TTGTACACCATAAATATACACAATTTGTATTTGTTAATTTTAAAAAGAAAAAATAGTGGCAAGGTTATAA CTTAATCAGTGTCCAGAACAAACATTATGTCACCCTTTAAAAATGTACCATTCACATTGATTTATAACCC TTTATTATTTCTAAATAAGGTGGTGAGAAAATGTTGGGTGAGGGGTTGGGTAGGAGTAAATGGAGCGAAG CAGATCCCAGAACCAGAAGACATTAGTAGTATATGGAGAGAGACACTCAACAGGAGCTGTGGGCTGGAAC AGAAGGACCCAGCCAACTGTAGGACTAATCCCTTCAAGCTTACTCCCCCGCTGCCCTCTCCTCTTCTGCC AACGTGCCCACTGACAGAAACCAACCAGCAGCAAAAGGTAAGGGGACCCCAACAACACAGCTCAGAGAAG TCAGCCTTTCAGGCAGCAGAGTGGAGCAGAGAAGGGTAGAAAACCAATTTTTGCAACATCCAGTATAATA TACGTGCGTGCTTCAAGGGGTCAAGGAGAGGAATCAATGATTCCTCCTCCTTCCCTGCTCTTCCAAGGCG CCCTGCTCACATCCTGCACCTGCTCTGCCTTCTCGGAGCTGCCCTTCTCGGCACAGCTGAACACCTTGAC CGAAGGAGCCAGTGTCCATCTTCCTGTCCCCGGAAGGCTTGAAGGCATTCTCACCACGTCTTGGTTCTGA GGGTATGACGCCCAGCCAGCAGCCATGATATTCTCCCCGAAGGGCCTCCCAGGACCTGCTCACACTGGCC GGGAGATGCTGGGAACCCAAGGCAGCCTGGTCATTAGAAAATGACGGCTCAGGACTCGGGCAGCTACACC GTCGTGCTGGAAACCAGCAGGGGACACAGGAGTGTGACGGAGCAGATCCATGTCAAGAGTGAGTGGGGCC CCGCAGTGGGAGGGGCTGACTTCTCAGAAAGCAGACCCACTGGACCTCAGAAGAGCCCACCAGGACACTT TGCATGCTGGTTATCCATTGCTCCCCAATAAACCACCCCAAAACTTAAAACATCAATCACTTATCTAGCT GGACAGTTGTTGTGTTCAGCTGTTGGGGTGTCTGGGTGTTGGCTGGTCCAGAATGACCTCCTTCATGTGC CTGGCCATGGACCAGCTGGTGGCTGGAGTGATGGGGATGAGTGGGCCACATAGCCTCCCAACCTCCAGCA GGCTATCCCAGGCTTGTTCACTCAGCAATGGAAGAGGAACAAGAGGTAAAGCTGCAAAACTCCTTCAGGC CCAGGCTCAAAACTGACCACCATCACTTCTGCCACCTTCTATTGGTCAAAGCAAGTCACATGGCCAGCCC AGCTTCAACAGGAAGGAAAAAGGCCCCACCTCTTAAGGAGAGGAGTTGCAATGTGTTGTGGCTATTTTTT GTCGTTGTGTTAGATTGTTCTTCCATTGCTATAAAGACATACCTGAGACTGGGTTATTTATTTAAAAAAA AAAAAAAAGAAGAAGACGTTTGATTGGCTCATGGTTCCACAGGTGGAAGTGTAATGCCAGCATCTGCTCA GCTTCTAAGGAGCCCTCAGGGAGCTTTTAATCATAGCGAAGGCAAAGGAGGAGCAGGTGTCTCCCGTGAG AACAGGAGCAAGAGAAAGAGAGAGTCAGAGAGGAAGTGCCACATTTTACAACAATCAGATCTCATGAGAA CTCACTACCATGAGGACAGCGTCAAGCCATAAGGGATCCGCCCCTGTGGCCCAAACACCTTTACTGAGGC CCCACCACCAACACTGGGGATCGCATTTCAACATGAGATTTTGGCAGGGATAAATATCCACATTATAACA GCCAAGACTTGCAACAGACATTCATGAGATACGCATTCATCATCACTTGGGAAAGGTAGAGAAGGTCTGG TAGCAGCCTTCAACCTCATCTATATTTTTATCACCTGGACTCAAACTTTCATATCTGAATTAGGAAAACA AAGCCCTGAGAGTAACCAGACCCATCCTCCTTTTAGAAGATAGTCCAGAGACTGTCCTAGTCGGCTCGGG CAAAATACTCTAGGCTTAATCAACAGAAACTTATTCCCTCACAGTTCTGAAGGATGGATTGCAAGATGAA GCTGCTGGCAGGTTTCATCTCCTCTGAGGCCTCTCTTTTTTGACTTGCGGAAGGGTGCCTTCTCATTCTG TCCTTGCATGGTCTTTCTTCTGTGTGTGCACATCCCTGGTGTCTCTCTGTGTGTCCAAACTTCCTCTTCT TATAAGGGCACCAGTCAGGTTGGATTAGGACCCACCCTAACAACTTCATTCTAACTTAATCACCTCGTTA AAGACCTTATCTCCAAATACGGTCACATTCTGAGGTACTGGGGGTTAGGGTTTCAACATATATGTTTGGT GGGGGACTCAATTCAGTTCATAACAGAGATCAACTTAGTTAGGGTTCAGATTCTGATGCTCTAACAAAGA CTCAAAAAGTTCCAGTGTCGGCCGGGCGCAGTGGCTCACGCCTGTAATCCCAGCATTTTGGGAGGCCAAG GCGGGCAGATCACGAGTTCAGGAGTTCAAGACCAGCCTGACCAACATGGTGAAACCCCGTATTTATTAAA AATACAAAAATTAGCCGGGCATAGTGGCAGGCGCCTGTAATCCTAGCTATTCAGGAGACTGAGGAAGTAG AATCGCTTGAACCTGGGAGTCGGAGGTTGCAATGAGCCAAGACCATGCCACTGCACACTTAGAACCCCAC TTCTGCACAGAGGGGTTTTTACTCCCCTCCCAGAGAATTTATGGACCGCTGAGGTTCATCCATCTGTATT TCTGTGATTTGATGACTAATTTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAGATGGAGCCTCGCTC TGTCGCCCAGGCTGGAGTGAAGTGGTGCGATCTCGGCTCACTACAACCTCCACCACCCGGGTTCAAGCGA GTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGATCACAGGCGCCCGCCACCACGCCCGGCTAATTTTTATA TTTTTAGTAGAGACAGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAATTCCTGACCTCAGGTTATCCAC CTGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCGGGCCCGGCCTGAAGGCTAATTCTT CTAAAGGCCTGGCTCCACACCTTCGCCTATGCCATTCTCAGTCCGAAGGGCCCTTTCTAAAGAGAGAGGT TGCAGGAACTCACGCTCGGTGGTGCAGGCTGTGTGGCCAGAACTCCCTGGATCAAATCCCTCTGGCATCT GTTATGCCCCTGAGTCCCTGCAAAAAAGTAACTTTCTGTTTTGCACTTCAGTTTCCCCATCTGTGCAATG AGGTCATAGTGGAACCTACCTCATAGGGTGACTGTGAGGAGTAAGTGAGTTAATCAGTGCTAAATGCCTA CAACAATGCCTGACAAAGAGCAAGTAAATGTTAGCCCTGGCCAGGTGCTATGGCTCACACCTGTAATCCC AGCAGTTTGGGAGGCCGAGGTGAGAGGATTGCTTGAGCTCAGAAGTTCGAGACCAGCCTGGGCAACATGA TGAGACGCCCATCTCAACAAAGAATTTAAAAATTAGCCAAGCCTGGTGATGTGCGCCCATAGTCCCAGCT

ACTCAGGAGGCTGAGATGGAAGGATCCCTTGAGCCCGGGAGGTTGAGGCTGCAGTGAGCTGTAACCTTGC CACTGCACTCCAGCCTGGGGGACACAGCAAGACCCTGTCTCAAAAAAAAAAAAAAAAAATAGCCCTGTTT GTTTCAAAGGACTTGACTTCTTTGAGCCTTCCTTTTCTCATCAAAATGGGAATAAGGCCGGCACAGTGGC TTACACCTTTAACCCCAGCACTTTGGGAGGACAAGGTGGGTGGATCACTTGAGCCCGGGAGTTCAAGACC AGCCTGGGCAACATGGTGAGACCCCATCTCTACAAAAAATAGCTGGATGTAGTGGCGCACGCCTGTAATC CCAACTACTCTGGAGGAGACTTTGAGCCCGGGAGGTGGAGGTTGCAGTAAGCTATGATTGCACCACTACA CTCCAGCCTGAGTGACAGAACAAGACCCTGTCTCAAAAAAAAAAAGGAATAATAATAATTACTTCATAGG ATTGTTGTGAGGATTAAATGAATAAATCCAGTGGCTTTCATGAGAAATGCTTTTCACATCATGTCCAGTA TATCCCACAACTAACCAAAAGGCAAGTGTAGTAACAGTTATTACTATGAGTAATGCTCTCTGATGTTTTC TATAATATTTCTTTTCATGTTTTGAATGTTGATCACAGTCTACTAATGATTTAGACACCTGGGCATGGGT CTCGCATGCAGTATAACAAGCCATGGATTAACACGTGTGCTTGGCTCATAGTAAGAGCCCAATCCATGGC CGGGTATGGTGGTTCATGCTTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGTGGATCACCTGAGGTCA GGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCCACTAAAAATACTAAAATTAGCCGGAT GTGGTGGCGGGTGCCTATAATCCAGCTATAGAGAGGCAGAGGCAGGAGAATTGCTTGAACCCAGGGGGCA GAGGTTGCAGTGAGCCAAGCTCCAGCCTGGATGAAAAAGCAAAACTCCGTTTCAAGAAAAAAAAAAAAAA AAGAGCCCAATCCAGGTGGCTGTTATATTGCCTCTTGTTTGTACACCTAGTGGGCTCTTTCTCCTCCTTC AAGGCTTAACTCAGACACCTCCTCCAGGAAGCCTTTCATGAGGTCTCTGGTTGTGCTAAAGTTCTTTTCA CTTATAACATTGCATTGAAATCAGAAATCAGCTCTAAGTGGAAGTTCCCAGCACAGTCTGGGAGTTCAAA TCCCAGATGTGTCCCTACTAGACCACGAAGCCTGGCCCTAATGAGCCCCAAACCTCAGAGCCTTTCACCT GAAAAATGCAGACAAGAAGTGGGGACCTCTTGGGTCACCTCCTCGCTGGGCTGTTTCCACTCCTCCAAAC TTAAAGTCAAGTTCTCACATGATAGCCAGAGTGAGCCTGTTCAAACCTAAGCCAGCTCACGTCCCTCCTC TGGGCAGTCCTCCCATGGGTCCTACTGCACTCAGAGTCAAAATCAGAGTCCTCACCCTGGCCCAGGAAAC CCCAGCATGATCTGCTCCCATTATCTCTCTGACTTCTTCTCCCAGCCCTCTCTCCCTTTCCCTCCTCTCT ATGCCCACCTTGGCTCACACCCATCTCAGGGCCTTTTACTTGGTGTTCCCTCTGTCTGGAACATTTTTTT CTTAGGAATCCACATGGCTTATTCCTCTGCTTCTTCAGGACTCTGCTCAAACATAACCTCCCCAAAGAGG TCCTCCTTGACCCACCTTACCTGAAACGGGTTTACCCCACCCCCAGTCCAACCCCACAGCCCTGTGCAGT TTTCCTCACAGCCCTTACCACCACTATATATACTTGTCAGTTTGTTGACCCTCTCCTCACTCAGTCGTAA GTTTCATGAGGGCAGCAACAGCGTCTGTTTAATCACTGCTGAGCCCCCGAGTCCTAGAGCCTTAGAGTCC TAGATTTGGTTCACCCAGATCCAGAGGCGAGGATTCAAGGACAGATAGTCTGTTTGGGAGGTGCAAGGAA CTCGAGAGTGGGGAAGTTAGGCAGAGAAGGCAGGAAATAATAAAAGCTGTGTTCCCAAGCTGGTTACCAT GGGCAACTGGAGCACAGTCCCATTGGGGAACTCAGGCCCTGGTGTGGAATGACTCTGCAGAGTTATCCCA CATAGCAGAGAGGGAGCTGGGGAATTTATATACCAACGTGTCCTGGCATTGTGGAGGGCTGCTCCCTGAT GTGCTCATTCCCCAGCACTTCCAGCCTGCTGCCTCCATGGGCAGAGTAGGCTTTGGCCACCAGTGAAAGT CCTCAGGCAACGGGATGCAGGTGCTGGCCGTTGGAAGTGGGAAGGGCAAGGGGTTGGACTGGGGGCACTG GGCACAGACCAGGCTCTTCAAACACATTCATGGGTGAATTAATGAATGAATGAACACATGAAAGAATGGA TGTCTCTATGGTGGGCAGAAGAAATGCCCAGCTTTTCTGAGTGGACTCCACTCTTGTGGCCTTGTTCCCT GTTTACACAGACAGCCTCCAACTAATGCCACTGAAGACATTCCCAGCTGCTATCCGGGGAGTCATCCAGA GTGAGCTCAACTATTCTGTGATCCTGCAGTGGGTGGTGACAATGGACCCTGAGCCTGTGCTGAGCTGGAC CTTCAGTGGGGTGCCCTGTGGGATGGGAGAGAAGCTGTTCATCCGACGGTTGTCCTGTGAGCAGCTGGGC ACCTACATGTGCATAGCCACAAACAGCAAGAAACAGCTGGTCTCTGAGCCTGTAACCATCTCGCTGCCAA GTGAGTCCCCCATTCCACCCCACCCCACCCCACCCAAGAGCCCTGCACCCTCTCCAGCCTGTGGCAGCCT CTATGATTCCATTAAGCCACCTACTATGAGCAGTCCCCTGTGAGACCCTTTATAGGCAAAATGTCATTCC AATGTTCCATCCACCTGGCGGACTGTGGATTATTAGGCCACTTTCTTCTTCTTTCTTCTTTCCTCTTCTT CTTCTTTTCTTTCTTCTTCTTTTTCTTTCTTCTCCTTCTTTTCCTCCTCCTCCTCCTCCTTCTTCTTCCT TCTTCTTCTCCTTCTCCTTCTTCTACTTCTTCTTCTTCTTTTTTTTTTTTTTGATAGAGTCTTGCTCGGT CACCCAGGCTGGAGTACAGTGCTGTGATCTCAACTCACTGCAACCTCTGCCTCCCAGGTTCAAGTGATTC TCATGCCTCAGCCTCCTGAGTAGCTGGGATTACAGGCATGCACCACCACATCTGGCCTATTTTTGTATTT TTAGGAGAGACGGGGTTTCACTGTGTTGTCCAGGCTGGTCTCGAACTCCTGGGCTCGAGTGATCCACCCA CCTTGGCCTCCCAAACTACTGGGATTACAGACATGAGCCACCTCGCCCAGCCAATTAGGCCATTTTCAGA TGACAGGCTGAGGCTCAAAGAGGTTAACTATGATGAAAGCCCAGCTTAGGATCTGGACCAGGCTACCTGG GTCCTTGGCTCCAACCATTTGCTTGTTACATGAACATGGGAAGCCTCTTTGCCTCTCTGAGTCTCAGCAC ATACCTACAAAAAATGCAGATCAAAATCTAAGGAGTGGGCCAGGTGCAGTGGCTCACACCTGTAACCCCA GCACTTTGGGAGGCTGAGGCAGGAGGATCACTTGAGCCCAGGAGTTAGAGACCAACCTGGACAACATAGT GAGACCCTGTCTCTACCAAAAAAAAAAAAAAAAAAAAAAACTAAAAATTTAATCAGGCATGGTAATGCCA CCTGTAGTCCCAGCTGCAATGGGAGGATCACTTGAGCCCAGGAGTTTAAGGCTACAGTGAGCTGTAATCG CACCACTGCACACCAGCCTGAGTGACAGAGGATGACTGTCTCAAAAAAAAAATCACCATTGTCATCATCT AAGGAGTGGTTCAAAGCAATGGCTTTGGAATTTGAATCCCTGGCTGTGTGACTCTGAGCCAGTGCCTTGA

CTTCTCTGTGCCTCAGTTTCCTCATCTATAACACTGGGAAGATAATAGTGCCTACCCCAGTGTGTAGTTG TGAGCATTCAATGAGATAAGCCGGTGAATAGCTTAAAACAATAATGTCTAGCACTATCGAACACTAATGA GTGCTCAATAACCGTGAGCCAATAACACTGTTGCAATTAGCATTGTCATTATTAATTGTAGCTATTACCA TATACAGTCGGTATATGGAGCCCTAGGTGGCAATCAAAATGACAGCAAGTTGTTGAGATCAGAGAAGTGG TTTGGGACCTGGTCAAAACTCAGTTCAGTCCCTGTTCCCGTGCCTTCCTGGCTGGGTAACTTAGCGCAAG TGACTTCCCCTCTCTGAGCCCCAGTTTCCTCATGTGTATAATGGAGGTAATCCTATATACCTCTTCAGGG TTGTTATAAGGAACGAAAACAAGGGGTGACTGAGTTTGGCAGAACAACTGTCAGGCAGCAGGTGCCTTGA ATAGCAGCTGTTATGGTGAATATTGTTTTTAGTGTGTTATTCATGGAGGGACACATGGTGATATGGTTTG GCTGTGTCCCCACCCAAATCTCATCCTGAATTGTAGCTCTCATAATCCCCATGTGTCATGAGAGGGACCC GGTAGGAGGTAACTGAATCATGGGGTCAAGTTTTTCCCATGCTGTTCTCGTGATAGTCAATAAGTCTCAC GAGTTCTGATGGTTTTACAAAAGGCAGTTCCCCTGCACACATTCTCTTGCCTGCCGCCATGTAAGACATG CCTTGCTCCTCCTTCACCTTCTGCCATGATTGTGAGGCCTCCCCAGCCATGTGGAACTGGGAGTCCATTA AACCTCCTTTTTTTTAATAAAGTACCCAGTCTCAGGTATTTCTTCATAGCAGTATGAAAATGGACTACCA TGGCTTGGAGTGAACTAGAGGTATGCAGAGGAACTGGCCAGGAGAGAAGAGAGGGAGGGTATTTGGGGTA GGAAAGAATGCATGAGTCAAGGTTCAGAGCTGGGACATGGAAATGGAATGCGTGATGGGAATCTCAGCTT GGCTGGGTCCCAGAGAACCACCTCACCTCCCTGGCCAGGGTCCAGTGGGAGCTTCAGGGCTGATGCACTG GGGGAAAAAATGTAAATCTTATATCACCTAGTGACCCTGATATTCAGTGAGAAGGACAATACTTCCAAGA CCTCCTTTGCTCATTCATCAACTGCCCAGGAAATGTTTATGAGCACTTGCTGTGTGGCCAGCCCACACAG CTGGGAACACTCTGGTGACCAAGACAGCTGCAGCCCTGCCTTCACAAGACTTACAGTCCAGTGTCCACAG ACAGTGATCACCAGAGTGGGCAGGGCTGGGATGGGGGAGCCCAGAGAGCTATGAGACTCAGCCTAGGAGT TAAGGAGGGCTTCCTGGAAGAAGGGACACCTGAGCTGAGAATTATGCTTAGCTGGCCAGGTACAGTGGCT CATTCCTGTAATCTCAGCACTTTGGGAGGTTGAGGCGGGTGGGTCACTTGAGGCTAGGAGTTTGAGACCA CGCTGGCCAACATGGTGAAGTAGATGGTGAAGAAGATGGTGAAACCCCATCTCTACTAAAAATACAAAAT TTAGCTGGGAATGGTGGCATGTGCCTGTAATCCCAGCTACCAGGGAGGCTGAGACACAAGAATTACTGGA ACCCAGGAGGTGGAGGTTGTAGTGAGCTAAGATTGTGCCACTGCACTCCAGCCTGGTGACAGAGGGAGAC TCTGTCTCAAAAAAAAAAAAAAAAGGAATTATGCAAGCCAAGAGAGAGAGATGGCATTCCAGAGAGACAG TGCAGCATGGACAGGCCTGGAGGCAAGAGAGAAAGAAAGGGATGAGCTTGGAAAATTGAGTGGAGTCCAG GGTTGCATGGCTATAAAGGCAGGGCAATGAGAGAGATGAGGCTGGCCAGGTGGCAGGGCCTCGAAGGCTA AGGTGAGAAACTGACTTCTGCCCCAGGGTGCTGGGAAGCCACAGCAGGGTTCTGAGCAGGGGAGGAACAG GGTCAGGTGTGAGCTTTAGAAAGATCCTCCTGGCTTCCATGTGGTAGGAAGGTGGATGGGCGCTGGACTA GGGCAGGAGAGCAGGGAGGAGAGGGGGCCAGAGACCTGGAGGATGGAAGAGAAGGATGGATTGAAGAGAC ACTTGGGAGGGGGAATGGCAGGAGGGAGGGGTGCACAGGGAGGGCGGGCAGATGGCTCCTCCAATCTCAC CCCTCCTTGGTCCCCAGAACCCATCATGCAGCCCACAGAAGCAGAGCCCATGGAGCCAGACCCCACTCTG TCCCTGTCAGGAGGCTCTGCCATCGGGCTCCTTGCGGCTGGGATCCTGGGAGCCGGGGCACTGATTGCAG GCATGTGTTTCATCATCATCCAGAGCCTAAGGTACCTCTATCCCTCACCCCCGTCCACTGGGCAACATCC ACTCAGCCCCCATGGGGCACAGAGCTGGCTCAACAAGGAAACAGAGATGAAACCAACACCCCCATCAGGG AGGGTGATAGCGACTCCTGAGGAGCCCATCTGACTCACTGGTTTCCAAAATGGGATCACAGCAACAAAGA GATAGAAGAGGACACTAGAGCTGGGCTGTCTGGCTTCAAGTCCCAGCTCTGTAACTTACTAGCAGTGAGG CTGTGGGCAAGCCACTCCCCTTCTCTGTGCCTCAGTTTGCCCATCTGCAAAATGGGGATGATAATAATAG CATCTGACTCTCTGGGTTGTTGGGTTGGGTTGTTGTGAGTGAATTTTTCTTTTTCTTTTTTTTTTTTTTT TGAGATGGAGTCTTGTTCTGTTGCCCAGGCCGGAGTGCAGTGGTGCGATCTCGGCTCACTGCAACCTCTG CTTGCCAGGTTCAAGCAGTTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGATTACAGGTGCATACCACCAC GCCTGGCTAATTTTTGTATATTTAGCAGAGACAGGGTTTCGCCATGTTGGTCAGGCTGATCTCAAACTCC TGACCTCATGATCTGCCTACCTCAGCTTCCCAAAGTTTTGGGATTACAGGCATGAGCCACTGCACCCGTC CAGTGAGTGAATATTTCTAAGAAACTTAAAGCAGTGCCTGGAATGTGGTAAGTACTATGTTCGTCCTCTC TACACATATCTGCAGTGACCGCTCTGTGCCAGGCACTGAGGATACCGAGGGAAGAAACAGCAGAAAGTCC CTGCCCTCATGGAACTTGCATCCTGGTCGGGGACACCATCAAGAAACACAATGAATGAGTGAAATATAGA TAGTATATTGGATGGGCCAGGTGTAGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGTGGG TAGATCACTCGAGCCCAGGAGTTTGAAACCAGCCTGAGCAACATGACAAGACATCTTGTCATCTCTCTCA AAATATAAAAATTAGCCAGGCATGGTGGCATGCACTTATAGTCCCAGCTACTCAGGAGGCTGAGATGGGA GGATCACCTGAGCCCAAGGAAGTCAAGACTGCAGTGAGCTAGGATCATGCCACTGCACTCCACACTGGAC ACAGAGTGAGACCCTGAGTCAAAAAAGTAATAATAATAAATCTTTTAAAAAAGATAGTATGTTGGATGAG CGCTAAGGAGAGGAGTGAGGCTGGGAAGCAGGACAAAGATTGTGGAGTGGGGTGGCATTTAACGAGTCAG GGAAGGCCTCCCTGGGACAGTGACATTTGAACAAAGGGAGGGAGTGGGGAGCCACGTGAGGGTCTGAAGG AATGGCATATCCAGCAGAGGGAACAGCAAGTGCAAAGGCCCTGAGGCAGGATTGCCTGGCATGTTCAGGA AATAGTGAGGAGCCCAGGGTGGCCAGAGTGGTGTGAAGAATGGGCAGAGAAGTAGCATGTGGGTCAGAGA GGGAGTAGGGAGGCAGGGGAAGGCAGCTAGACCCTTGCATAAGGCCTTGTAGGCTCTCTGAGCACTTGGC

TTTTGCTCTGAGTGAGATGGAAGCCATGGAGGGTCTAGTGCAAGGGAAGGATGGCATCTGACTTATATTT GATCCTATATGTTGGCTAGTACTACAACGCTATTAATATCTTACCATCAGCAAGGCATGGTGGCCCACAT CTGTAATCCTAGCACTTTGGAAGGCCAAGGCAGGAGGATCACTTGAGCCTAGGAGTTTGAGACCGGCCTG GGCAACATAGTGAGACCCCGTCTCTACCAAAACTAAAGTTTTTTTTTTTTAATTAGCTGAGTATGGTAGC ACGTACCTATAGTCCCACCACTTGGGAAGCTTAGGTGGGAGGATTGCTTGAGCCCAGGAATTTGAGGCTG CAGCGAGCGATGATCGTGCCACCACACTCCAGCCTGCTTGACAGAGCAAGACCCTATTTCTAAAAATTAA AAAAATAATGTTTTTAAAAAACTTGATCTTACCATGTATTGAGCACCTATTATATGCTTTCTTTTTTTTT TTTTTTTTTTTTTGAGACGGGGTCTCACTCCATTGCCAGGCTGGAGTGCAGTGGTGCAATCTCGGCTCAC TGCAACCTCCACCTTCTGGGTTGAAGTGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGACTACAGGCG GGCACCACCATGCCCAGCCAATTTTTGTATTTTTAGTAGAGACGGAGTTTCACCATGTTGGCCAGGATGG TCTTGATCTCTTGACCTCATGATCTGCCTGCCTTGCAAAGTGCTGGGATTACAAGCATAAGCCACCAAGC ATTACTCTATTTAATCTCCATAAGAGCTGGGGAGGTGAGGGGGCTGTGGTAGGGGTGAAGATCTCATTTC AGTCCAGAGAGTAGTGATCTGCCCAGGGCCCACAGCTGGAGAGAAAGGATTCAAGCCTAGACTCCTGCCT GCCACTTTGTTCTAGCTCCTGTCTACACTGCCTTTTCCACCATCAGTAACTGTACAGACCTCTGTAATCT ATGTTGTGAGGAAGAGAAATCTGTAGGTGGTAGTGGTTTAGGGAGACATTGTGGACCAGCTGGGAGGAAC TGGGGCCAGGTCTCCATCCATGAGTCCTGCACACAACCATCTAGGGGCAAGGGAGGGCCAGCCTGCAGCC TCGGCCACCCAGATTGCCTTCATCATTGTGGCAGCTCCGATGTCCTGGCCCCTCAGCACGTACCAGGTGC TGAAAGCCCCAACTCTCAGGGCTAGGTGCTATTATTGTCGTCATTTCCCAAGTGAGTAGAGCTAACGCTC AGAAAAGCTCATTAACTTGCCCAAGGACACACAGCGAATGAATGGCTGGCCCTGAATCAAACCCTGATCT AAGTCTACAGAGGGGAAAGGTGAGGAGTCAGGCTGGCATGAAAATCCTCACCCAGGCACCTCAAGTCCCT GCCCTCATGAGCAGGCAAGAAGGGTCACTTTCTGTCTTCCCCGCCCTTGTGGCCAAGACCTATTTAGTTG TGAGCAACAGACTCCTGGGACAAGGCCAATGGGGGCATCAGCTGGAAGGAGCTAGCCTCATCCAATCAGC TGTGACCTTGCAGATGAGGCCACGTGTCATGGACATGGCTGCCTTGACCCTCCCAGTGAGGAGGAACATT TCTCAGAAAAGAAGTGTATATGGGCTAGGCAGGAACCCCATGCATGCCTAACATGCCCACCAAGGGCCAG GAGAGATCCCCATTGTTTGTAGTTGAGGAGAGGGACCTGAAGCCAGGCTACTTATATTCACATCTCAGCT CTGCTGTACATGACCTTGTGGAATTTGGGGGAGCCCTTTAACCCCTCAGTGGCTCATCTGTAAAACAGGA ATATGGCAGTGTGTGGTGCTCACAATTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGGAGGATTGCTTG AGTCCAGGAGTTTGAGACCAGCCTGGGCAGCATAGCGAGACTCATGTCTCTACAAAAAAAAAAAAAAGGA AAAGAAAAATTCACTGGGCATGATAACACATGCTTGTGGTTCCAGCTACTCGAAAGGCTAAGGTGGGAGG ATCGTTTGAGTCTGGGAGTTCGAGGTGGCAGTGAGCCATTATTGCTCTACTGCACTCCAGCCTGGGTGAC AGAGTGAGACTCTGTCTCAATAAACATTTTTTTAATTGAAAATAAAAATTAAAAACAGGCTGGGCACAGT GGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCAGGAAGATCTCTTGAAGCTAGGAGTTCGAG ACCAGCCTGGCTAACATGGTAAAACCCCATCTCTACTAAAAACACAAAAATTAACAAGGCATGGTGGTGC ATGCCTGTAATCCCAGCTATTTGGGAGGCTGAGGCAGGAGAATCATGCCAAGACCAGCTCAGTCAGGGAA ACTCTAACCCAGCGGTGCTAGAGGAATTAAAGACACAGAAATATAGAAGTGTGAAGTGGGAAATCAGGGG TCTCACAGCCTTCAGAGCTGAGAGCCTCAAACAGAGATTTACCCACGTATTTATTAACATTAGCATTGTT TCTATAGATTTTAGATTAACTAAAAGTATCCCTTATGGGAAGCAAAGGGATGGGCTGAAATAAAGGCATG GGTATGGCTACTTATCTGCAGCAGGAGCATGTCCTTAAGGCACAGATCACTCATGCGGTTGTTTGTGGTT TAAAAACGCCTTTAAGTGGTTTTCCGCCCTGGGTGGGCAAGGTGTTCCTTGCCCTCATTCCAGTAAACCC ACAACCTTCCAGCGTGGGCGTCATGGCCATCATGAACATGTCACAGTGCCACAGAGATATTGTTCATGGT CAGTTTCGGGGCCAGTTTATGGCCAGGTTTTGCGGGGGGGCCTGTTGGTGCAATTTAAGCTAAACATCCC TTTAGGGGACCAATTAATAATGATTCCATAGGAATCGTTGTGCAGCACCTCTGCCTGTTCTGCAATGCAA TCTTCCTAAACAAGTATGTTCATTTTTTCTGGCCAGGTTCAATTTTGTTACAGATAGGTTTTTGAGGGCA GTATGCCTCAATTATAGGAGGAGATTTGTTATGGTAAATACTGAGATCAGAAAGCACATGTAACTGTGTC ATAGAGTGATTACATCCAGGCATTATTGCCAGCCAAGATTGATGAATATGCCTAATAAGTATAATTGTTC TCTGTGTCAGCCCTTCTTTAAGGAATACTCACGGCAATGGTGATTACCACTATCATAGCTACCATTACTC ATTCTGAGTGGTTGTCCCGCTTTCCTCAGGTTTTCTTCCATCATCTGTGACAGCTTCTTGATCTGTCTCC AGCTGGGTGGCTGTGTTCGACGGGTGTTTCTCGTGACAGTTGGGGTCCTCCTCAGCATCAGCCTCGACAT GGCTGCAACCGGGGGGTCCTCAGGATCCTCCCGGAGTCTCTTCCTTGGCATCTGGCTCATGCTAAAATTT CAGGTGTCTTGATGGTATCCAAATCAGCTGTTCATGTTGGCCTGGAGAAACACAAGCATAACCAACACCC CAAGTTATTATTTTACCTACTTCCCAACTTTTTGTTATTGGATCTCTCCACCAAACCAATTGTTCTGCTT CTGTCTTTGCAGCTGGTTTCTGTAGATGCTGTTCAGCTGCTGATAACATCTGGCCTTTGGGCAGGCTCAA AAAATTTAAAGTTAATAATGCTAGACTCAATTGTGTATGGGCTGTCCCATAATCCTGTTTCTCCCTCTTT TTTGTTTTTGTCATCAGTTGTTCATCTGTATGAAATCATAACTGAGCATTTTCAATTAACTGTGTGGAAT GAACCACGTATGAAGAATCAGAAATCATATTAATAGGCATATCAAAAGCAGTCAATACCTCAATTACACC TACAAGCTCCGCTTTCTGAGCTGAAGTATAGGGCGTCTGGAAAACTTTACCTTTCAAGCCAGAATAAGAA GCTGTACTATTACTAGACCCATCTGTAAAACAATGAAAATGCTTAGCAGGCTACAGTATGTAAATGCAAA

CCGTTCACAGTCTTGCTCAGCTAAGGGGATAGTAAAGAAACAGTCTTTTAAATCTATGACTATTAAAGGC CAGTTTTAAGTCCTCTGAAGCCTCCAGTTTCTCTTTACTCAGCGGCCACTGTTCTAAACATTTTAAAGGT ATAGGTTCTGGAAGCTTAACAATGGCTGCCATCAAAAATGATATTCTAATCTTTGGCGGGAACTTTGTCT TTCCGCTTGAAGCGGTTCTTTCAAACCTTGCAAATTTTTTTCTAGTCTCATGCTAGGGACATGCCCCATT TCATGCATCATATGTTGATTTTGAAGGATATATAATTGTTCTGGAGTTAGAACTTGTGCTCCCCATTGTT GTAATAAATCTTTCCCCCACAAAGTTATAGATACAGAAGTTATAATTGGTTGAATAGTCCCAAGTTGTCC ATCTGGCCCTTCAAAATGCAAAATATAGCTACTTTGATATACTTCAGGGGCTTTACCAACTCCAACTATG TTAAATTGAGTGGGTTGAATTGGCCACGTGGACGACCAGTGCTGTAGAGAAATGATTGAAATGTCCGCTC CTGTATCTGCCAAGCCTTTAAATTTCTTTCCCTGAATAGTTATTTCACAGGTGGAATGTTTATCAGTAAT TTGATTTACCCAATAAGCTGCTTTGCCTTGTTTCTTTGTGCTTCCAAATCCTCCTGTTCATTTAATTTCA CTTTTCCCCATTCCCACATACGGCACAATCAGGAGCTGTGCTGTGCGCTCTCCTGGCTCTGCTTTCCAGG GAACAGAAGTAGATGTAACAATTTGAATTTCCTCATTGTAATCTGAATCAATGACTCCTGTATGTGTTTG TACCCCTTTTAAACTTAAACTAGACCTTCCTAAAAGTAATCCTATTGTCCCCGCTAACAAGGGTCCACAG ACTCCTGTTGGGACCTTTTACGGGGGTTCCCCAGGCAGAAGGCTCACAGCTTTTGTGCAGCATAAATCTA CTGCGGCACTACCGGCTGTGGCGGGGGACAGACATTGTACGGGTGTGAGGGAATGGCCTGAGCTGGAAAT GCCCCAGTTTGGAATGGGGCCCAGGACAGGCCCCTCATGGCATTTCCTGAAATCAGGTTCCCTTCTTTAT CAAACTTAGAGTGACACTGATTAGCCCAGTGTTTTCCTTTTTTACATGTTGGACATATTTCAGACTCAGC AGTTTTCTTTTTTCCCCTATCTGGCAGCTGACTTGCTGATTATTTCTACATTCTTTTTTAGTATGAATAG CTTGTTTAAATTCTTTGAGTAATTTACAAGGAAAAGGCTCAAATGTAGCTATAATATTTCCCTGTTGATC TGGGGGGTGTATTCTAACAGGGAACTGCCAAGCCTCTAAATCACCTTCTCTTCTAGCTTGCTGGATTCCT GCCTGAATAGAACTGACAGCAGTCGCTCCAGGCGCTGCTCGAACAGTCACTGGGGCAACTACTTTTCGCC CAGCGTCCTCCAGAAAAGAAAGAACTGGAGGGTCAGGCCACTATTTATGGCCAGTTTTGGGGCCAGTTTA TGGCCAGATTTTGGGGGGCATGTTCCCAACAGAATCTCTTGAACCTGGGAGGCGGAAGTTGCAGTAAGCC AAAATAGCGCCACTGTACTCCAGCCTGGGCAACAGAACCAGACTGTCTCCAAAAAAAAGAAAAAAGAAAA AAAAAAAAAAACCCAGGGATGTGATTATACTTCCCTCCAAAGACAGGAGTGAGGATTAAGTAAAATGGTG GGAGTCATGAGCTGTGAACAGTGCCTGGAATGTGATGAGCCTTCAATAAACCTCAGCCATGTGATGATGA TGATTGTATTAGTTTGCTCCAGCTGCTGTAACAAAAATGCTACAGACCGGGGGGGCTTAAACAACAAAAA TTTATTTTCTCACAGTCTGGATGCTGGAAGTCCAAGATCAAGGTGGCAGCCAGTTTGATGTCCCATAGTG CCCCTCTCCATGGCTTGCAGAAGGCCACCTTCTCACTGTGTCCTCACGTGACCTTTTCTCTATGCTCATC CCTGGGGTCTCTTCCTCTTCTTGTAAGGATACCAGTCTTATTGGATCAGGACCCCACTCTTATGATCTCA TTTAACCTTACTGTGTCTGAAGAATCTATCTCCAAATATAGTCACATTGGAGGGTTAGGACTACATATTA ATTTGGGGAACGGATAATAATTCAGTCGATGATTCTTATTCTCTCTCTCTCTCTCTCTCTCTCTCTGTCT CTCTCTCTCTCTCCACTGCAGGACTGACAGGCAGAGAATAGGAATATGCAGCTGAAATGTGGGCAACTCT CCTGTCAGCTGAAGAGGTAATACCAGGAAGGGTGTGAAGGAAATCCTAGGTTTGGGAACAGAAAGAAGTT CTTGGGCAGAGACTCCATATGTGATTTCCTCCCTCCTGGTTCCCTGGTCATTTGTCTGTGAGATGTTCCC CTCCTGTGGAGAGCTCCAGGAGCTGCTTTTCTCTTCTTTTGCCAACTGCCAGCACCCCATCTGCCCAGCT CATCAAATTCCTGGAAGCTGCCTAAACAAGCAGTCTATATTTCATAAACCTCTTGGGCTCCATGCAAAAG AAACTCACTGACGTAGCTCAGGAAAAAATAAAATGAACAGTTTAATATAAGGACCTATGAAATTTTTCAG CAATCCATAGGTGTGAGTCAGCATTTGCTTTGTAACAAACTGCCTCCCCAAAATTCACTGGCTTGAAACA ACAGCCATTTATTTAGCTTGCAATTTCATGGGTCATCCATTTGGGCTGGGCTCAGCTGGGTAGTTCTGGT CTCTGCCAGGCTCGCTCCTGCATCTGGGGTCAGTTGACAGATTGCCCAGGGGCTGTCTGGACTAGGATAG CCTCATAGCTGGGACAACTGGCCTCTCCTTCATGTTGTCTCTCATCCTCCAGCAGGGTGACCCAAGCTTG TTCACATGGCAGAGGCAGGATTCCAAGAGTAACAGCAGAAACTTCAAGGCCCCTTAAGTCTCAAGCTCAA AATGGACATGCCATCACTTCTGCCACAGAAAGGACTTCATTGGCCAAAGTTACATGACTGGCCAAATTCA AGGGATGGGGAAGTTGACTCCACCTCTTGCTAAGAAGGGAAAAATCTGTGGCCATTTTTGCAATCTACGA AGAAATGTGGAAGTACACACAGCTCTCTCTGCCAGCCTCCCCCACACACACACTTCACCCCCACCCCAAG CCCTTACAATTCCTTTCCTCCTGCATGTGGAATTTACAGTTCTCTGTCTCTCTCTGCAGATGGGTGCTTT GTACCTCTCTATCCACGTGGAAAAAAAAACCCATCCCATAGCTTCCAAGTCTACAACATCTCTGTTCAAG GGAACAACCCAACGTAACCAGACTCCCTTTGCCCTGTTTCTGAAACACCTGAAGAAAACATCTGATGGGT TGACTCGGTGCCATCCTTGGTCCCATCGCCGTGACACGTTGTGCAAGCAAAGCATCAGAGGCTCATCCCT GTCTGTGGGAGCTCAGTGCTCAGAAAACAGGGGGGAGGTTTTACCTTGGAAATTGGCCAGACCCCAAAAT ATGTCTTTTACACATGCTGCTTTTTTTTTCTCTTTTTCAAAAAGAACCAAAAAATAAATTAAAACACCAC CACTTCTGAATGGTTTCTCATGAAGCCTCTCTTCCTGAGAGTGGGAGAGGCATGTTTGCAAATAAGATCA ACCTTTGAGCTTTGCACTGTTCAAGTTTAATACCTCTCCATAGGAGGATCCTGACAGATAGCAGGCACAG GGCACACAAGTATGGCTGAAACTCCTCTGGGGGATATATCTCACATTTGAGGAAAATTCGGTGCTTCTGT GACCAACACAGAACCACCTAACATGGCATTCTGCTTAGCAATAATAGTAGCAGAACTGAGTCCAAGTCTT GTCTGTTGAGGGCTCTCCATGTGCCAGCCACTGACTATTTACCTTACATGATTAATGTGTCATAGCAGGC

CAGGCGCAGTGGCTCACACCTGTAATCCCACCACTTTGGGAGGCCAAGGCAGGTGGCTCACCTGAGGTCA GGAGTTCAAGACCAGCCTGGCCAACATAGTGAAACCCCATCTCTACTAAAAATACAAAAATTGGCCGGAT GTGGGGGCACATGCCTATAATCCCAGCTACCGGGGAGGCTCAGGCAGGAGAACCACTTGAACCCAGGAGG CAGAGGTTTCAGTGAGCCGAGATCATGGCCACTGTGCTCCAGCCTGGGTGAGGGAGTGACAGTATCTCAA AAATAAAATAAAATAAGTAAGAGATGTTAGCCAGGCACGGTGACTCACGCCTGTAATCCCAGCATTTTGG GAGGCCAAGGCGGGCAGATCACCTGAGGTCAGGAATTCAAGACCAGCATGGCAACATGGTGAAACCCTGT CCCTTGTTATCACACGAATGGGGATGTGGCTTGTGTGCTGCCTAATCTTGCCTAGAACTAGGTGTACCTG CGTTCTTTTGCTTATGGCTTTACCCTTGGTTACCCTAATTCCCTATTCTCCTGCCTCAAGAGGTGACCAC AGCAGCCCTGGGCCTGCCCTCCTAGGGCTTATAGTACAGTGAGGGAGACAGACCTGTTCCCAGTGATGAC CCAGAGTCATCACTCTCCTCTGGGAGGCCAGGGGGGAGTCTTAATGGAGACTGGAGGATCCAGGAGGGCT TCCTGGTGAGGGAGGGGTCAGCTGTACTAGAGAACAACATTAAGATCATTAATAACAAGAGCAGCCAGAT GGCCGGGCACGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGTGAGGCAGGCAGATCACGAGGTCA GGAGATCAAGACCATCCTGGCTAATACAGTGAAACCCTGTCTCTACTAAAAATACAAAAAATTAGCTGGC GTGGTGGCAGGAGCCTGTAGTCCCAGCTACTCGGGAGGCTGAGGCAGAAGAATGGCGTGAACCCGGGAGG TGGAGCTTGCAGTGAGCCAAGATCGTTACCACTGCACTGCAGCCTGGGCAACAGAGCGAGACTCCGTCTC AAAAAAAAAAATAAATAAATAAAAGAGCAGCCAGGTCTTCTGGTTGGAGTTGGTGTTTAAGAAAAATAAA ATTTAAAAATTAAAATTTTTTTGGCCGGGCACAGTGGCTCACAGCTGTAATCCTAGCACTTTGGGAGGCC GAGGCAGATGGATTGACTGAGCTGAGCTCAGGAGTTCAAGACCAGCCTGGCCAACATGGCGAAACCTTGT CTGCTAAAAATGCAAAAAAAATTAGCCAGGCGTGGTGGTGCGGGCCTGTAATCCCAGCTACTTGGGAGGC TGAAGCATGAGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAACCAAGATTGTGCCACTGTACTTC AGCCTGGGCAGCAGAGCAAGACTCTGCCAAAAATAAAAAAATTTTAAAAATTGTTTAAAGAGCAGCCACG TCTCCATAGTGGTAATTGTCAGGCATCGCACCAAAGAGCTTTAATGCGTTCTTCTCAAACAGTCCTCCCA CTTCAGCCTGCCAAAGTGCTGAGATTTCAGGTTTGAGCCACTGTGCCATGCTATGCCCATTTTTCAGATA AAGAATCATAAGCCCCAGGAGACATCAATAATAATTGCTGCC

EJERCICIO 4 a) SE CONOCE QUE EL CONTIG DADO CONTIENE EL GEN QUE CODIFICA PARA LA CITOCROMO OXIDASA (COX) DE VIBRIO CHOLERAE Y QUE ESTA PROTEINA CUENTA CON 45 AMINOACIDOS >contig 1 GAGTATGTGATGCGTGACCAGACAGATGACAGTAAGCCGTAGATGGGCACCATTCGCCAG TACATCGCAGAAGGGCGAATCATCATCAAACCCAAAACCAAAACGAAAGAAAAACCCTTAG TCAACATGGTTGCGATGCACGAAATCGCAGCGCGTGAAGCTATGCAGGTGCTGGGGTAAC GTAGACAGCTAACGACATGACGATAATAGAAGTCAGATGAGACTAC 1) ENCONTRAR LA SECUENCIA PROTEICA (PRESENTAR EN FORMATO FASTA)

>gi|487838657|ref|WP_001912123.1| cox [Vibrio cholerae] MGTIRQYIAEGRIIIKPKTKTKEKPLVNMVAMHEIAAREAMQVLG

>gb|CP001236.1|:217621-217755 Vibrio cholerae O395 chromosome II, complete sequence ATGGGCACCATTCGCCAGTACATCGCAGAAGGGCGAATCATCATCAAACCCAAAACCAAAACGAAAGAAA AACCCTTAGTCAACATGGTTGCGATGCACGAAATCGCAGCGCGTGAAGCTATGCAGGTGCTGGGG

2) INDICAR LA SECUENCIA NUCLEOTIDICA DE DICHA PROTEINA b) SE CONOCE QUE EL CONTIG DADO CONTIENE EL GEN QUE CODIFICA PARA LA PROTEINA RIBOSOMAL 50S DE TETRAGENOCOCCUS HALOPHILUS Y QUE ESTA PROTEINA CUENTA CON 50 AMINOACIDOS >contig 2 TGAAATGGACCATAGGGATAGACCATAGAATAGACATGAGACTAAATGAGCAAAAAGAAGA CAGCACTTGCTTGTTCAATATGCGGCTCACGTAATTACACAAAATCTACCAGTGAAGGAACA GATGGACAACGTTTAGAAACGAATAAATTTTGTAAGTATTGTCATAAACATACATTACATAA AGAAACGAAATAAATTACATACAGATAGGCCGGATGACTAAATT 1) ENCONTRAR LA SECUENCIA PROTEICA (PRESENTAR EN FORMATO FASTA)

>gi|352516868|ref|YP_004886185.1| 50S ribosomal protein L33 [Tetragenococcus halophilus NBRC 12172] MSKKKTALACSICGSRNYTKSTSEGTDGQRLETNKFCKYCHKHTLHKETK

2) INDICAR LA SECUENCIA NUCLEOTIDICA DE DICHA PROTEINA

EJERCICIO 5 ENCONTRAR EL ORGANISMO, POSICION CROMOSOMICA Y EL NOMBRE DEL GEN DE LAS SIGUIENTES SECUENCIAS
>1 null (372 nt) atgattcaaattcaaactaaattaaaagtaaacgataatagcggtattaaaataggacaa tgtttaaaaatttataaaaaaaaagtaggaaaaattggtgatacaattttaatttctgca aaaaaattacgtttaaatcaaaaaaaaaaaattaaaataattaaaggagatttatttaaa gctttaattattcacacaacatatcaaaaaaaaagtactataggtaatttaattaaattt gataaaaattgtataattattttaaataatcaaaataaacctttagggacacgtatcttc ggtccaattacttctgaatttagaaaacaaaaaaatttcaaaatattatcattagcttca aatattttataa >2 null (534 nt) atggaaaaaaatttacaaaatcattatcaaaatattactgtttacgatcttttaacaaaa

ttaaatcttaaaaatatatttgaaattactaaaattactaaaatttgtttaaatattggt tttaaaaatgcaaatattgaaaaaaaaaaattaattaatataattttacttttaaaatta ataacgaatcaaaaacctataatcacaaaatcaaaaaaaaataatatttttttaaaaata aaaaaaaattcaattattggttgtaaaataactttaagaaaaaaaaatatttttaatttt ttagcaaaaattttaattttcattttaccaaatttaactaaaataaattttaattttaca aataaaaatatttttaattttcaaattcaaaatgtcttacagtttttcgaattaaaaaca gaattcttaaaatttaaagatatacctccaatagatgtatcaattcatacaaatgcaaaa aataataatgaattatttttattattaaattcatttttaataataaaaaaataa >3 null (240 nt) atgcaaaaaaaattaaaaattttattcttatttttatttttaagtataagcataagcatt cttatcttatacttacataacgttttaccttatattaatttaaaaattatatttttatta ttaaaaaacagaattaatatctttactctatgtatagatgatgaccattttcatccacgt tatatatcaagtggggattttaatttattaattacggaattatcggaagatttttcttaa >4 null (777 nt) atgacaataacaaattatataaataatcaatttacttttttagatatggcagaaccttgg caattaggttttcaagatccagcaactccagttatggaaggtattattaactttcaccat gatttaatgttttttttaattatgattactgtgtttgtttgttggatgttatttagagtt attactctttttgatgaaaaaaaaaataaaataccatcaactgttgtacatggagctact atagaaattatttggacttcaattccagctttaattttattaatagttgcagttccttct ttcgcgttattatattcaatggatgaagtaattgacccaattattactttaaaagtaatt ggtagtcaatggtattggagttatgaatattcagataatttagaattttcagatgaacct ttaatttttgatagttatatggtacaagaagatgatttagctattggtcaatttagactt ttagaagtggataatcgtgtagtagttccaactaatagtcatattagagtattaattact gcatcagatgtattacattcatgggctataccgtcattaggtataaaattagatgcttgt ccaggtcgtttaaatcaaacttcgatgtttattaaaagagagggtgttttttatggacaa tgtagtgaaatttgtggagtaaatcatggatttatgcctattgttatagaagcagtatca ttagaagattatttaacttggttaaaaaataaaattaattttgattttaatgtataa >5 null (99 nt) atgatatttaaaatcattggtataatttttatagtaatattattatttacagatattaaa caaataattaacaaaattaagcaatttttccataaataa >6 null (1479 nt) atgaattttcaaaatataaataaatggtcaacaagatggcttttttcaacaaatcataaa gatattggaactttatatttaatttttagtgcttttgctggtgttgttggtacaacattt tctcttttaattagaatggaattagcacaaccaggtaatcaaatttttatgggaaatcat caattatataatgttgttgttaccgcacatgcttttattatggttttctttttagttatg cctgctttaatcggtggttttggtaattggtttattcctttaatgataggtgctcctgat atggcttttcctcgtatgaataatattagtttttggttattacctccttctttattatta ttagtttcttcagctatcgttgaatctggggctggtactggttggacagtttatccacca ttatctagtgttcaagcacattcaggaccttctgtagatttagctatttttagtttacat ttatcaggtatttcttctttattaggtgctattaattttatttcaacaatttataatatg agagctcctggtttaagttttcatagattacctttatttgtatggtctatattaattact gcatttcttttattattaactttacctgtactagctggggcaattactatgttactaact gatagaaatttaaacacttcattttatgatccatcaggtggaggtgatccagtattatat caacatctattttggttttttggtcatccagaggtttatgttttaattttaccagcattt ggtattatcagtcaagtttctgcatcttttgcaaaaaaaaatgtatttggttatttaggt atggtttatgctatgttatctataggtttactaggttcaattgtatgggcgcaccacatg tttactgttggtttagatgtagatacacgcgcttacttttcagcagctactatgattatt gcggtaccaacgggtattaaaatatttagttggttagcaactttatggggaggttctcta aaatttgaaacacctttattatttgttttaggttttattttattatttgttatgggcgga gtaactggtgtagctatgtcgaattcgggtttagatattgcattacatgatacctattat

attgtggggcattttcattatgtattatctatgggtgctgtttttggtatatttactgga ttttatttttggattggaaaaatttctggtcgtagatatcctgaaattttaggacaaatt catttttggttattttttattggggtaaatgttaccttttttccaatgcattttttaggt ttagcgggtatgcctagaagaatccctgattttcctgatgctatgagtggttggaatgct gtaagtagttttggttcttatatttcatttttttcagctttattctttttttacattgta tatgtaacattagttcacggtaaaaaaattgaaaattaa >7 null | (228 nt) atgttattacaagcttctaaatttttaggtgcaggattagctactttaggattaattggt gctggtatcggtatcggtaatgtttttggttctttaattataggtatttcaagaaatcct tctttacaacaagaattaatgagaactgctattttaggttttgctttaactgaagcaatt gctttattctgtttaatgatggcttttttaattttatttgctttttaa >8 null (567 nt) atgaaaattttaaaaaaatttagtcaatatttattacaaattttacctataataaattat actttatataaaaatgaattatgtattaatatttcttcagataaattaattcctatttta tttttttttaaaaatcatacaaatacacaatttaaagtattatctgaaatttgtgctgtt gattatattaataaagaaaaacgttttgaaattatttataatttattaagtatacgtttt aatagtcgtttaaagattaaaattacaattaatgaattacaacctataaattctattatt aaaatatatagagctgcaaattggtgtgaaagagaggtttgggatatgtttggtattttt tttttaaatcatccagatttaagaagaattttaactgattatggttttgaaggacatcct ttacgtaaagatttccctttaagtggttttttagaagttttttataatgaattaaaaaaa agagttgtttatgaacctattaatttatcacaacaatatagagtatttgaatttaataat ccttgggataaaaaaataaatatataa >9 null (1152 nt) atgagatggaacaaaaaatcattatttgcagttattaataatcatttaatagattatcct actcctattaatttaaattatttttttggattcggttcgttagccggtattatgttagta gtacaaattttaactggtatttttttagcaatgcattatacaccacatatcgatttagct tttaatagtgttgaacatattatgagagatgttaataatggttggttaattagatataca catgcaaatggagcttcttttttttttattgtagtatacatacatatttttagaggttta tattatggttcttatataacaccgagagaagctatatggtgctcaggtgtaattattttt attttaatgatggctactgcttttatgggttatgttttaccttggggacaaatgagtttt tggggtgcaactgttattactaatttattttctgcaatccctttaataggtaaagatatt gttgattggttgtggggaggttttgctgttgataatccaacattaaatcgtttttttagt ttacattttactcttccttttataatagtaggtgctgtattagttcacttaattttatta catgaagttggttctaataatccattaggtattacattaaaaactgaaaatatacctttt tacccttatttttatacaaaagatttattcggtttaatggttttatttttagttttcttt atttttgttttttattatccaaatactttaggtcatccagataattatattgaagcaaat ccaatgaaaacacctttacatattgttcctgaatggtatttcttacctttttatgcaatt ttaagatctattcctaataaaattggtggagttgttgcaatgttcggttcattaataatt ttattaactataccttttacaaactcatctgaaattagaagtacagcttttagacctatt tttaaagtttgttattggttattagttatagctttcttaatattaggttggattggacaa tgtccagttgaatatccttatactgaaattggtattataagtatgatttattattttttt ttttttatcataattataccatttttaggtaaatttgaagcatatttagtacgttatagt attaataaataa >10 null (1530 nt) atggctattgaattatcatatatattggaatcaaatattaaaaaatataaagatgaaaaa agtttacaagaaacaggtattgttctttcaatgagcgatggtattgctagatgttatggt ttaactaaaattcaagccggtgaaatggttgaatttaataatggtaatattaagggaatg gctttaaatttagaacctgatgttgttggtgttgttgtttttagtaatgatagagaaatt caagaaggtaattttgtaagaagaactggatctattgttagtgttcctgtaggaccagaa gtattaggtagagtagtagatgctttaggacaacctattgacggtaaaggtcaaattaat

agtaaattagaaagtagagtagaagttaaagctcctggtattatgcctagagaaagtgtt aaagaacctgtacaaacaggtttaaaagctgtagatagtttaattcctatcggtagagga caaagggaattaattattggagatagacaaaccggaaaaacttctattgctattgatact ataattaatcaaagagaacctcatttaaaaaaagatacaaataatcaattatattgtatt tacgtaggtgtaggtcaaaaaagatcaacaattgctgaattaactaaaactttagaagaa aaaaatgcaatgtttttttctgttattgtagcagctactgcttctgattcagcaccttta caatatttagcaccttatactggttgtgctttaggtgaatattttagagataatggaaaa catgctgttattttttatgatgatttatcaaaacaagctgtagcttatagacaaatgtct ttattattaagaagacctccaggtcgagaagcttacccaggtgatgtattttatttacac tctcgtttattagaaagagctgctaaaatgaatagaaaaataggtggtggttctttaaca gctttacctattatcgaaacacaagcaggagatgtttctgcatatatcccaactaatgtt atttcaattactgacggacaaatttttttagaaactgaattatttaatgaaggtcaaaga cctgcaattagtgttggtttatctgtaagtcgtgtaggttctgcagctcaaattaaagct atgaaacaaatagcaggtactatgaaattagaattagcacaatttagagaagtacaagct ttcgcgcaatttggttctgatttagatgcaactactcaacaacaattaaatagaggggtt agattaacagaaatgttaaaacaaggtttaaatatacctttatctgttgaagatcaaatt gtaattatttatttaggtgtacgaggtttcttagataaaattgctgtagataaaatttcg atttttgaaactaattggttaaactttattcaaaataatcattctgatattttagaagaa attttaacaaaaaaagaaatttcaaaagaattagataaaaaattaaatactttagctatc gattttactaataattttattactaaataa

EJERCICIO 6 El siguiente alineamiento tiene un porcentaje de identidad del 40%: PEEKSAVTAL VEEKAVITSI Calcule el puntaje que obtendra en este alineamiento usando: a) La matriz BLOSUM62 b) La matriz BLOSUM45 Con cul se obtiene ms puntaje? Cul da ms valor a las identidades? En cual se penalizan ms los mismatches?

EJERCICIO 7 La siguiente secuencia de nucletidos fue diseada como sonda: GAGGAGGCACGTACATGCAGGGCAAACTCTGAGAGATCTTGAGAAATTAACGTC El diseador de esta sonda dice que es capaz de diferenciar - sin lugar a duda - si hay presencia o ausencia de Escherichia coli en una muestra.

Es confiable la afirmacin del diseador de esta sonda? Es esta sonda suficientemente especfica, o es posible que detecte ms de una especie bacteriana a la vez? Argumente su respuesta basndose en el e-value de un BLAST. (Qu programa de BLAST usara?)

EJERCICIO 8 1. OBTENGA UNA SECUENCIA CODIFICANTE DE 1800 NUCLEOTIDOS, CON CODIGO GENETICO BACTERIANO (muestre pantalla de cmo lo hizo y la secuencia obtenida) 2. OBTENGA UNA CADENA DE ADN DE 12 NUCLEOTIDOS BASADA EN UNA SECUENCIA GUIA: 20% G, 30%C, 20% A y 30% T (muestre pantalla de cmo lo hizo y la secuencia obtenida) 3. BUSQUE ESTA ULTIMA SECUENCIA (12 NUCLEOTIDOS) DENTRO DE LA SECUENCIA INICIAL (1800 NUCLEOTIDOS). ENCUENTRE LOS CINCO MEJORES RESULTADOS. UTILICE LOS PARAMETROS DE SCORE POR DEFECTO (muestre pantalla de cmo lo hizo y los resultados) 4. OBTENGA OTRA SECUENCIA DE 1800 NUCLEOTIDOS QUE SEA 98% IDENTICA A LA INICIAL (muestre pantalla de cmo lo hizo y la secuencia obtenida) 5. REPITA EL PASO 3 CON ESTA NUEVA SECUENCIA Y LA DE 12 NUCLEOTIDOS (muestre pantalla de cmo lo hizo y los resultados) 6. MOSTRAR AMBOS RESULTADOS (DEL NUMERAL 3 y 5) INDICADOS EN LA SECUENCIA DE 1800 NUCLEOTIDOS EN LETRA MAYUSCULA 7. COMPARE AMBOS RESULTADOS. SON DIFERENTES? COMENTE