You are on page 1of 20

Datos Moleculares: secuencias, edición, alineamiento

Dr. Richard Cadenillas

rcadenillaso@unmsm.edu.pe
Bases nitrogenadas
Se clasifican en tres grupos:

Isoaloxazínicas (derivadas de la estructura


de la isoaloxazina).
La flavina (F)

Púricas o purinas.
Citosina (C), Timina (T) y Uracilo (U).

Pirimidínicas.
Adenina (A), Guanina (G)
Consideraciones
Código genético Saturación
Consideraciones
Modelo evolutivo
Saturación
Transition

Transvertions

Transition
Tipos Datos genéticos

Ø Nucleotide.
Ø Amino acid sequences.
Ø Restriction fragment length
Polymorphisms (RFLPs).
Ø Single-nucleotide polymorphism
(SNP).
Ø Ultraconserved elements (UCEs).
Homología. https://peerj.com/articles/6399/
Phylogenetics in the Genomic Era

Chapter 2.1 To What Extent Current Limits of


Phylogenomics Can Be Overcome?

https://hal.inria.fr/PGE/page/table-of-contents
Phylogenetic Diversification of the Globin Gene Superfamily
in Chordates
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4399706/pdf/nihms-285209.pdf
MetaPhOrs 2.0: integrative,
phylogeny-based inference of
orthology and paralogy across the
tree of life
https://doi.org/10.1093/nar/gkaa282

The Impact of Paralogy on


Phylogenomic Studies – A Case
Study on Annelid Relationships
https://doi.org/10.1371/journal.pone.0062892
Bases de datos
ACNUC: http://pbil.univ-lyon1.fr/databases/acnuc/acnuc.html
BioXL/H: http://www.biocceleration.com/BioXLH-technical.html
BLAST: http://www.ncbi.nlm.nih.gov/blast/
DDBJ and DAD: http://www.ddbj.nig.ac.jp/
EMBL: http://www.ebi.ac.uk/embl/
EMBL Sequence Version Archive: http://www.ebi.ac.uk/cgi-bin/sva/sva.pl
Ensembl: http://www.ensembl.org/
Entrez: http://www.ncbi.nlm.nih.gov/Entrez/
fastA: http://fasta.bioch.virginia.edu/fasta/
GenBank: http://www.ncbi.nlm.nih.gov/Genbank/
Gene Ontology: http://www.geneontology.org/
HAMAP: http://www.expasy.org/sprot/hamap/
HCV database: http://hcv.lanl.gov/
HIV database: http://hiv-web.lanl.gov/
HOGENOM: http://pbil.univ-lyon1.fr/databases/hogenom.html
HOVERGEN: http://pbil.univ-lyon1.fr/databases/hovergen.html
IMGT/HLA: http://www.ebi.ac.uk/imgt/hla/
IMGT/LIGM: http://imgt.cines.fr/
MPsrch, Scan-PS, WU-BLAST and fastA at EBI: http://www.ebi.ac.uk/Tools/
similarity.html
MRS: http://mrs.cmbi.ru.nl/mrs-3/
NCBIMap Viewer: http://www.ncbi.nlm.nih.gov/mapview/
ORALGEN: http://www.oralgen.lanl.gov/
PDB: http://www.rcsb.org/
PRF/SEQDB: http://www.prf.or.jp/
RefSeq: http://www.ncbi.nlm.nih.gov/RefSeq/
Sequin: http://www.ncbi.nlm.nih.gov/Sequin/
SRS: http://www.biowisdom.com/navigation/srs/srs
SRS server of EBI: http://srs.ebi.ac.uk/
SRS list of public servers: http://downloads.biowisdomsrs.com/publicsrs.html
https://www.amazon.es/Phylogenetic-Handbook-Practical-Approach-Hypothesis-ebook/dp/B007NW85OG Taxonomy: http://www.ncbi.nlm.nih.gov/Taxonomy/
TIGR: http://www.tigr.org/
UCSC Genome Browser: http://genome.ucsc.edu/
https://cl1lib.org/book/857117/993fd9
UniGene: http://www.ncbi.nlm.nih.gov/UniGene/
UniProt at EMBL: http://www.ebi.ac.uk/uniprot/
UniProt at SIB: http://www.expasy.uniprot.org/
VAST: http://www.ncbi.nlm.nih.gov/Structure/VAST/vastsearch.html
WU-BLAST: http://blast.wustl.edu/
https://www.ncbi.nlm.nih.gov/genbank/
An extended IUPAC nomenclature code for
polymorphic nucleic acids
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2865858/
Descargar secuencias de genbank

- Crear una carpeta: descargar


Terminal linux/unix
- Copiar los archivos:
remplazar texto dentro de un archivo
data_base.xlsx
# para linux
bajar_secuencies.R sed -i 's/texto-viejo/texto-nuevo/g' archivo

Scrip_concatenar.R #para mac


sed -i.bak 's/texto-viejo/texto-nuevo/g' archivo

#windows
get-content somefile.txt | %{$_ -replace "expression","replace"}
Alineamiento

http://www.bork.embl.de/pal2nal/
Alinear
- Crear una carpeta: alineamiento

- Copiar los archivos:

batsCYTB1.fas
batsNAD1.fas

Explorar con AliView

Alinear
Alinear

MAFFT - Una línea

https://mafft.cbrc.jp/alignment/server/ mafft --auto batsCYTB1.fas> ALN_cytb.fasta

Terminal mafft-linsi --thread 8 batsCYTB1.fas> ALN_cytb2.fasta

- Secuencial for i in *.fas


do
echo “$i”
mafft-linsi --thread 8 $i > ALN_$i
done
Modelos de Sustitución http://www.iqtree.org/doc/Substitution-Models

You might also like