/  24
 
O. E. A. Arce
et al.
: Estudio comparativo basado en una aplicación a la taxonomía numérica
10
Componentes principales y coordenadas principales:estudio comparativo basado en una aplicación a la taxonomía numérica
R
 
e
 
s
 
u
 
m
 
e
 
n
— Arce, Osvaldo E. A.; Nora E. De Marco; María R. Santillán. 2009.“Componentes principales y coordenadas principales: estudio comparativo basado en unaaplicación a la taxonomía numérica”.
Lilloa 
46 (1-2). El objetivo
 
del trabajo
 
es realizar un es- tudio comparativo de las ordenaciones obtenidas mediante la aplicación de componentes prin-cipales y coordenadas principales a una matriz de datos mixtos correspondiente a los taxonesargentinos del género
Echinochloa 
(
Poaceae 
), bajo diferentes condiciones de aplicación
.
Se uti-lizaron los datos sin estandarizar y estandarizados por desvío estándar o rango. En coorde-nadas principales se usaron: distancia Euclidiana, disimilaridades Manhattan, Bray Curtis,Canberra y el coeficiente de similaridad de Gower. Para la comparación de resultados obte-nidos se emplearon varias técnicas. Los análisis se corrieron en el paquete NTSys. En loscasos que fueron necesarios se aplicaron correcciones por autovalores negativos por losmétodos de Lingoes y Cailliez. El uso de los diagramas de Shepard y correlaciones entrematrices resultó muy útil para juzgar las ordenaciones. La estandarización resultó el elementomás importante para la obtención de ordenaciones apropiadas. El coeficiente de Gower ma-nejó apropiadamente la naturaleza mixta de las variables. La presencia de autovalores nega- tivos no introdujo distorsiones importantes en espacios de dimensión reducida.
Palabras claves:
ordenación,
Echinochloa 
, estadística multivariada, autovalores negativos,diagramas de Shepard, NTSys, coeficiente de Gower.
A
 
b
 
s
 
 t
 
r
 
a
 
c
 
 t
— Arce, Osvaldo E. A.; Nora E. De Marco; María R. Santillán. 2009.“Principal components and principal coordinates: a comparative study based on an implemen- tation to numerical taxonomy”.
Lilloa 
46 (1-2). The objective of the present paper is to com-pare ordinations obtained from principal components and principal coordinates using a mixeddata matrix corresponding to the Argentinean taxa of
Echinochloa 
(
Poaceae 
) under differentapplication conditions. The following coefficients were used in principal coordinates: Euclideandistance, Manhattan, Bray Curtis and Canberra dissimilarities, and Gower similarity coeffi-cient. Unstandardized and range or standard deviation standardized data were used. Ordina- tion comparisons were accomplished using several techniques. All the analyses were run on the package NTSys. Corrections for negative eigenvalues were applied when necessary bymeans of Lingoes and Cailliez methods. Using Shepard diagrams and matrix to matrix corre-lations was very useful in order to judge ordinations. Standardization was the most importantelement to obtain appropriate ordinations. Gower coefficient handled appropriately the vari-ables mixed nature. No important distortions in reduced dimensionality spaces were obtainedwhen negative eigenvalues were present.
Keywords:
Ordination,
Echinochloa,
multivariate statistics, negative eigenvalues, Sheparddiagrams, NTSys, Gower coefficient.
 Arce, Osvaldo E. A.
1
; Nora E. De Marco
1
; María R. Santillán
2
1
Facultad de Agronomía y Zootecnia.
2
Facultad de Ciencias Económicas.Universidad Nacional de Tucumán. E-mail: ova.arce@gmail.comRecibido: 21/08/08 – Aceptado: 27/07/09
INTRODUCCIÓN
La diversidad de los organismos biológi-cos despertó la curiosidad del hombre desdesus inicios. En un principio se comenzaron aobservar y diferenciar los animales y plan-tas. Luego se les pusieron nombres. Cuandoel adelanto tecnológico permitió la movili-dad de un lugar a otro del planeta el núme-ro de seres vivos conocidos se fue incremen-tando y surgió la necesidad de reunirlos engrupos definidos. Así es como surge la Taxonomía (palabrade origen griego que significa “ley o normade ordenación”), que es la ciencia de la cla-sificación (De La Sota, 1982).
 
Lilloa 46 (1–2): 10–33, 2009
10
 
Lilloa 46 (1–2): 10–33, 2009
11Una doctrina dentro de esta ciencia es elfeneticismo, el cual se basa en el estudio delas relaciones taxonómicas fenéticas, enten-diéndose como tales a aquellos arreglos porsimilitud total basados en todos los caracte-res disponibles para los objetos u organis-mos bajo estudio sin una ponderación de losmismos (Crisci y López Armengol, 1983; Dela Sota, 1982; Sneath y Sokal, 1973).Debido a que los caracteres empleadosen estudios de este tipo deben ser cuantifica-dos con precisión es que al enfoque feneti-cista de la taxonomía se le ha llamado
 
taxo-nomía numérica. Esta taxonomía empleaentonces técnicas numéricas, entendiéndosecomo tales, aquéllas que mediante operacio-nes matemáticas calculan la afinidad entreunidades taxonómicas a base del estado desus caracteres. Al trabajar con caracteres cuantitativos ocualitativos codificados es que la taxonomíadebió valerse de las técnicas proporcionadaspor la estadística. Por otra parte, como cadaentidad está caracterizada por múltiplesatributos, es la estadística multivariada laprincipal proveedora de herramientas deanálisis para estudios taxonómicos de tiponumérico.Las técnicas clasificatorias basadas eninformación estrictamente numérica comen-zaron a desarrollarse a mediados del siglo XX. Sin embargo el gran auge de las mismasse da con la difusión masiva de las compu-tadoras a fines de los ‘80. Numerosos pa-quetes estadísticos han sido desarrolladosdesde entonces, lo cual ha puesto estas herra-mientas de análisis a disposición de toda lacomunidad científica y técnica.Entre todas las técnicas usadas en taxo-nomía numérica, los métodos basados enautovalores y autovectores (ordenación) talescomo componentes principales (Peña, 2002;Hair
et al.
, 1999; Legendre y Legendre,1998; Gnanadesikan, 1997; Jobson, 1992;Johnson y Wichern, 1992; Everitt y Dunn,1991; Jolliffe, 1986; Anderson, 1984; Dillony Goldstein, 1984; Seber, 1984; Karson,1982; Mardia
et al.
, 1979; Morrison, 1967),y coordenadas principales (también llamadoescalado multidimensional métrico) (Peña,2002; Legendre y Legendre, 1998; Legendrey Anderson, 1998; Jobson, 1992; Jolliffe,1986; Seber, 1984; Gower y Digby, 1981;Gower, 1966) han sido ampliamente usados.Otras técnicas han sido utilizadas también,aunque en menor grado, como ser análisisde factores, escalas multidimensionales nométricas y análisis canónico.En taxonomía numérica estas técnicas seusan para obtener grupos a partir de repre-sentaciones gráficas bi y/o tridimensionales,es decir, se usan como una alternativa alanálisis de conglomerados (“cluster” análi-sis) y con fines clasificatorios.La calidad de las representaciones gráfi-cas obtenidas a partir de los métodos de or-denación ha sido motivo de numerosos tra-bajos. Al ser dichas representaciones en es-pacios de dimensión reducida el elementoque el investigador tomará en cuenta paraextraer conclusiones válidas sobre su traba- jo, es que se debe asegurar que éstas sean lomás fieles posibles a las matrices de proxi-midades en las que éstos se basan.Moss (1968) fue uno de los primeros au-tores en plantear que la aplicación de dife-rentes técnicas puede conducir a resultadosdiferentes y, en consecuencia, a conclusionestaxonómicas distintas. Realiza estudios com-parativos aplicando diferentes técnicas(componentes principales, coordenadasprincipales y escalas multidimensionales nométricas) a los mismos datos.Las primeras presentaciones de estos mé-todos y discusión de sus propiedades se pre-sentan en el clásico libro de Sneath y Sokal(1973).Rohlf (1972) trabaja en la comparaciónde distintos métodos de ordenación y usa al-gunos datos simulados muy simples. Su inte-rés radica principalmente en el efecto de losdatos faltantes. Propone algunas medidasque pueden ser usadas para evaluar la cali-dad de las representaciones gráficas.Thorpe (1980) trabaja sobre razas de laserpiente
 Natrix natrix 
y compara variosmétodos de ordenación: componentes princi-pales, coordenadas principales, escalas mul-tidimensionales no métricas. Los datos conlos que trabaja representan un modelo taxo-
 
O. E. A. Arce
et al.
: Estudio comparativo basado en una aplicación a la taxonomía numérica
12nómico conocido. Llega a la conclusión quela estandarización es recomendable.Pimentel (1981) realiza un trabajo simi-lar al de Thorpe para especies de
 Abronia
.Trabaja con componentes principales, coor-denadas principales, escalas multidimensio-nales no métricas y mapeo linear. Aplica elcoeficiente de Gower.Hartmann (1988) compara métodos deordenación empleando datos de dientes de
 Homínidos
. Analiza el efecto de la estandari-zación de datos y propone comparar el ajusteentre diferentes métodos usando coeficientesde correlación entre matrices de distancias y matrices derivadas a partir de los puntos enlos espacios de dimensión reducida.En todos los casos se concluye que lasdiferentes combinaciones de tipos de datos,estandarización, coeficientes de disimilari-dad / similaridad y técnica empleada pue-den producir distintos resultados.En los trabajos mencionados previamentelos autores trabajaron con variables de tipomixto, es decir, datos con variables cuantita-tivas y cualitativas codificadas. Según Thor-pe (1980) la codificación otorga a los datosno numéricos un carácter de numéricos y propone estandarizarlos como si se tratarande variables de este tipo. Pimentel (1981)realiza su estudio sobre
 Abronia
aplicandoun concepto similar.Crisci y López Armengol (1983) aplicancomponentes principales a una matriz deespecies del género
 Bulnesia
constituida por23 variables cuantitativas y 20 categóricascodificadas. También trabajan con las varia-bles codificadas como si se trataran de va-riables numéricas. El uso de matrices de da-tos que contienen variables de tipo mixto esmuy común en estudios de taxonomía numé-rica, no habiéndose dado la importancia queel tema tiene en la bibliografía existente so-bre análisis estadístico multivariado.Componentes principales y la mayoría delas medidas de di/similaridad existentes,empleadas en coordenadas principales, nohan sido diseñadas para manejar matrices dedatos mixtos. Gower (1971) presenta unaalternativa, la única encontrada por los au-tores, para manejar datos de este tipo.En trabajos posteriores (Peña, 2002; Le-gendre y Legendre, 1998; Gower y Legendre,1986; Gower, 1985) se comenzó a dar im-portancia a las propiedades matemáticas delas matrices obtenidas a partir de distintoscoeficientes de disimilaridad o similaridad,ya que la metricidad y euclinidad de los mis-mos son esenciales para la obtención de re-presentaciones apropiadas de los datos enespacios de dimensión reducida. Se discuteasimismo como la estandarización por ran-go puede llevar a la euclinidad a ciertos co-eficientes de disimilaridad.Legendre y Legendre (1998) proponendos métodos, Cailliez (1983) y Lingoes(1971), para corregir la presencia de auto- valores negativos y asegurar la euclinidadde disimilaridades y similaridades no métri-cas. Legendre y Anderson (1998), desarro-llan un paquete de software (DistPCoA) paraaplicar estas correcciones.Bramardi (2000) y Rohlf (1990) presen-tan la técnica del árbol de distancia mínima(“minimum-length spanning tree”) comouna manera adicional de evaluar la calidadde las representaciones gráficas al superpo-nerlo sobre la representación obtenida a par-tir de cualquier ordenación.Rohlf (2009) desarrolla la versión 2.2 delpaquete
 NTSys-pc
para su aplicación en pro-blemas de taxonomía numérica incorporan-do todos los procedimientos que aparecen enla bibliografía sobre el tema desde los men-cionados por Sneath y Sokal (1973) hastalos más modernos, como análisis de “pro-crustes”.En este trabajo se realizaron todos losanálisis con dicho paquete estadístico.El objetivo general del presente trabajo esrealizar un estudio comparativo de las orde-naciones obtenidas mediante la aplicaciónde las técnicas de componentes principales y coordenadas principales a una matriz dedatos correspondiente a los taxones argenti-nos del género
 Echinochloa
(
 Poaceae
:
 Pani-coideae
:
 Paniceae
), bajo diferentes condicio-nes de aplicación.Los objetivos parciales son:– Analizar el efecto de la estandarizaciónde datos por desvío estándar o rango sobre

Share & Embed

More from this user

Add a Comment

Characters: ...