You are on page 1of 24

Métodos de Ordenação

Valério De Patta Pillar
Departamento de Ecologia Universidade Federal do Rio Grande do Sul Porto Alegre, RS vpillar@ufrgs.br http://ecoqua.ecologia.ufrgs.br

• Em ecologia buscamos revelar padrões, processos e mecanismos ao examinar conjuntos, geralmente complexos, de unidades ecológicas descritas por muitas variáveis.

Métodos de ordenação podem sintetizar conjuntos complexos de dados, permitindo interpretações sobre padrões no espaço e no tempo.

• Podani. SPB Academic Publishing. Numerical Exploration of Community Patterns.Bibliografia • Legendre. Ecologia Numérica. L. 853 p. 407 p. Elsevier. 1999.D. . • Valentin. V. Numerical Ecology 2nd ed. Leiden. Backuys Publishers. p. Amsterdam.. Rio de Janeiro. Interciência. J. O.L. 6568. The bootstrapped ordination reexamined. 2000. Journal of Vegetation Science 10: 895-902. J. 1998. 2000. Haia. Introduction to the Exploration of Multivariate Biological Data. L. Legendre. & Orlóci. 1990. • Wildi. ISBN 905782-067-6 • Pillar. P.

br .Análise de dados com MULTIV Disponível em http://ecoqua.ecologia.ufrgs.

Ordenação é uma projeção dos pontos em um número menor de dimensões (geralmente 2 ou 3) com mínima perda de informação. multidimensional: .Ordenação Os dados podem ser representados em um espaço de comparação.n unidades amostrais. pontos no espaço de comparação. Análise de Redundância) . Alguns métodos de ordenação: •Análise de Componentes Principais (PCA) •Análise de Coordenadas Principais (PCOA) •Análise de Correspondência (CA) •Ordenação não-métrica (NMDS) •Ordenação Canônica (CCA.p variáveis são as dimensões que descrevem . abstrato.

. A terceira dimensão (variável 3) é representada pelo diâmetro das esferas (esferas maiores estão mais próximas do observador e indicam maior abundância da variável 3).Unidade amostral 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Campos (-Ast) 25 47 22 64 109 115 188 223 170 235 220 195 205 230 234 253 234 228 242 227 227 217 Floresta Ombrófila Mista 237 234 269 214 175 156 68 37 40 24 20 16 15 6 6 8 12 11 13 19 24 28 Floresta Ombrófila Densa 6 16 9 14 6 15 8 12 6 0 2 4 0 1 2 0 0 1 0 1 1 1 350 300 250 200 150 100 50 0 -5 0 -5 0 0 50 100 150 200 250 300 Diagrama de dispersão de 22 paleo-inventários (unidades amostrais) descritas por três variáveis.

Late Quaternary Araucaria forest. Pillar.G. Brazil. H. Cambará do Sul. . charcoal and multivariate analysis of the Cambará do Sul core in southern Brazil. Método de análise de coordenadas principais com base em distâncias euclidianas usando porcentagem de pólen em 138 taxa. 2004. studied by high-resolution pollen. S. grassland (Campos). & Bauermann. indicando a trajetória da composição da vegetação em 42. Palaeoecology 203: 277-297. Orlóci. L.840 14C anos antes do presente. Fonte: Behling. fire and climate dynamics.D. V. Palaeoclimatology.Wei n Aran Mi sc Mora Myrs Di ck Myrt Cl et La sp Proc Ile x So la Schi Ce cr Eu te Trem Se co Acal Ce lt Al chXyri Eryn Pa mp Pl au Pl tu Cype Echi Ap ia Se ne Hydr Ju ng Ba cc Myri AsTu Po ac Ordenação de dados de pólen de um perfil de sedimento... Taxa mais correlacionados com os eixos de ordenação estão indicados em posições proporcionais ao nível de correlação. Palaeogeography.

Método de análise de coordenadas principais com base em distâncias euclidianas usando porcentagem de pólen em 92 taxa.. L. S.G. Pillar. & Bauermann. fire and climate dynamics. H. inferred from a high resolution pollen and charcoal record at Cambará do Sul in southern Brazil. Late Quaternary Araucaria forest. Palaeogeography. Cambará do Sul. indicando a trajetória da composição da vegetação desde 610 anos antes do presente.. Brazil. 2004. V.Wei n Da ph Se ne Myrt Mel a Mi ry sc Ile x AsTu Ph Stru Ba cc La sp Za nt Cl et cP ro So la Pi pe Di ck Acal Ce lt Aran Cype Myrs Amar Trem Eri o Po ac Pi nu Se ba Ordenação de dados de pólen de um perfil de sedimento. grassland (Campos). Orlóci. . Palaeoclimatology. Taxa mais correlacionados com os eixos de ordenação estão indicados em posições proporcionais ao nível de correlação. Fonte: Behling.D. Palaeoecology 203: 277-297.

Análise de Componentes Principais (Hotelling 1933) nxp Dados Calcula matriz de semelhança pxp Extração de raízes da matriz .

67 13.17 5.19 -0.854 -0.0 Autovetores (normalizados max.B Sp.4 3.662 0.15 -2.49 -1.39 Eixo 3: -0.83 0.730 Eixo 2: -0. 6): Eixo 1: -0.5 1.5 -0.67 0.78 0.44 Coeficientes de correlacao entre descritores originais e eixos da ordenacao: Variáveis Eixo 1 Eixo 2 Eixo 3 a -0.2 17.50 Numero de autovalores >1e-6 3 Autovalores: 32.6 Porcentagem: 79.71 0.29 -0.50 16.17 1.51 0.78 -3.Análise de Componentes Principais Sp.167 -0.750 -0.191 c 0.24 0.C 1 2 3 4 5 6 7 26 28 29 29 30 35 39 28 30 31 33 27 38 36 18 14 13 13 19 15 15 de autovalores e autovetores: 13.266 -0.00 -5.322 0.117 b -0.940 -0.17 -5.amostrais nos primeiros Eixo 1: 2.430 7.405 -0.55 3 componentes 0.90 -1.00 0.396 -0.A Sp.73 0.01 1.640 Escores de unid.76 Eixo 2: -0.97 0.326 .57 Matriz submetida a extracao 19.636 0.531 Eixo 3: 0.83 -1.945 0.83 -1.

Análise de Coordenadas Principais (Gower 1966) ou Metric Multidimensional Scaling (Torgerson 1952) nxp Dados Calcula semelhanças nxn Extração de raízes da matriz .

22 -13.35 39.91 1.945 0.amostrais nos primeiros 3 componentes: Eixo 1: -6.63 -19.08 -56.7 3.91 -1.5 Escores de unid.4 17.45 -1.35 -11.66 Eixo 2: -0.06 -35.76 -1.96 1.80 7.94 10.94 8.37 10.51 6.46 -2.191 c -0.42 -4.63 -19.08 2.08 80.35 -11.326 6.22 -1.78 -19.0 43.65 7.17 -4.94 5.20 10.80 -35.22 8.23 Eixo 3: -1.A Sp.78 -13.34 0.08 Sp.322 0.24 -0.03 0.940 -0.08 -29.117 b 0.854 -0.49 -13.22 35.49 -44.22 -0.49 -1.08 -44.06 56.51 7.37 Coeficientes de correlacao entre descritores Variáveis Eixo 1 Eixo 2 Eixo 3 a 0.35 -1.63 -13.405 -0.54 0.94 7.35 -56.266 -0.80 -0.06 56.5 8.38 3.94 8.63 2.35 Número de autovalores Autovalores Porcentagem e autovetores: 35.35 -29.Análise de Coordenadas Principais Matriz de distancias ao quadrado: 0 34 0 43 1 0 59 5 4 18 42 53 190 86 89 242 126 129 0 73 65 113 0 162 178 0 20 0 Matriz submetida a extracao de autovalores 48.63 -1.B Sp.06 52.74 -0.20 5.08 3 195.49 -11.78 -19.60 1.35 -11.22 10.3 79.78 2.C 1 2 3 4 5 6 7 26 28 29 29 30 35 39 28 30 31 33 27 38 36 18 14 13 13 19 15 15 .

“reciprocal averaging”. em Legendre & Legendre 1998:451) nxp Dados ajuste duplo Calcula matriz de semelhança pxp Extração de raízes da matriz .Análise de Correspondência ou “contingency table analysis”. “reciprocal ordering”. “analyse factorielle des correspondances” (ref.

018354 0.32932 -0.044907 -0.014453 -0.0014897 -0.0007389 0.0010201 0.Sp.007456 Porcentagem: 85.0378 Escores de variaveis nos primeiros 2 componentes: Eixo 1: -0.70681 Eixo2: 1.B Sp.667 0.0011092 0. colunas= 3 variaveis) -0.7409 .27698 1.0058395 0.74296 -1.00073943 -0.005045 -0.38188 0.333 Escores de unidades amostrais nos primeiros 2 componentes: Eixo1: 1.28395 1.555 -0.A Sp.046138 -0.043 0.0175 0.6): 0.20106 -0.020088 -0.022491 -0.000025534 0.011265 0.0090759 0.02622 Matriz submetida a extracao de autovalores e autovetores: 0.03116 0.005902 Numero de autovalores >1e-6: 2 Autovalores(max.001781 -0.64119 2.0023905 0.0589 -0.024052 -0.C Análise de Correspondência 1 2 3 4 5 6 7 26 28 29 29 30 35 39 28 30 31 33 27 38 36 18 14 13 13 19 15 15 Matriz de dados transformados: (Linhas= 7 unidades amostrais.75526 0.001248 14.0054785 -0.005552 0.6765 -1.4062 -0.52273 -0.014185 -0.002613 0.1903 1.018077 -0.0102 Eixo 2: -1.

as mesmas tendências de variação nesse espaço de ordenação em duas dimensões reapareceriam se o mesmo universo amostral fosse reamostrado? É suficiente o número de unidades amostrais para responder essa questão? .e.. i.É estável esta ordenação.

Ecology 74: 2204-2214. 1993. V. Pode haver perda de informação importante ao descartar dimensões significativas. The bootstrapped ordination reexamined. Pillar. a serem então interpretadas. Stopping rules in principal components analysis: a comparison of heuristical and statistical approaches. 1999. D. • Jackson. . Interpretações podem ser enganosas quando baseadas em dimensões representando tendências instáveis de variação que não reapareceriam na análise de outras amostras do mesmo universo amostral.A. D.Significância de eixos de ordenação • • Um problema na ordenação é saber quantas dimensões são significativas. Journal of Vegetation Science 10: 895-902.

6 . 4 . 2 . de tal fo rma a maximi zar o ajuste com a ordenação do pseu do univ erso amos t ral. (Schön emann and Carroll 1 9 7 0). Envo lve rotaç ão. 5 . Ajust e Proc rusteano envo lven do os prime iros i eixo s da ordenação t orna os escores das duas ordenações comparáveis .Algoritm o: Bootstrapped ordination 1 . Armazenam -se em uma matriz X os escores das unidades amostrais que estão na amos t ra boots t rap . t ransla ção e dilatação do subespaço de ordenação na amos t ra boot st rap . Armazenar os escores de ( escores de ref erência ). . mas ex t raídos dos e scores de referê ncia (unidades amostrais p odem est ar repetidas). unidades amostrais Repet ir os passos seguintes um grande núme ro de vezes para cada amos t ra de t amanho k: 3 . Tomar uma amostra boots t rap de tamanho n k a qual é submetida ao mét odo de ord enação. Armazenam -se em uma ma t riz X* os escores de ordenação da amos t ra boot st rap para um dado núm ero de eixos da or denação. Anali sar a amos t ra (pseud o univ erso amos t ral) usando o m ét odo de or denação escolhido.

Bootstrapped ordination .

1970. R. Fitting one matrix to another under choice of a central dilation and a rigid motion.M. translação e dilatação do sub-espaço de ordenação da amostra bootstrap de modo a maximizar o ajuste com a ordenação do pseudo universo amostral. Primeiro. Segundo. & Carroll. O ajuste é necessário devido à forma como os algoritmos de ordenação posicionam os eixos de diferentes amostras. imagens especulares são comuns e arbitrárias. Psychometrika 35: 245-256. • Schönemann. há variação entre amostras boostrap na ordem de expressão da mesma dimensão intrínseca porque podem ser muito semelhantes.Ajuste de Procrustes • O ajuste envolve rotação.H. . P.

The effect of sample size on the significance of ordination axes (PCOA). Upper: data set with 60 species and 60 relevés from grassland in the south of Brazil. (Pillar 1999) . Bottom: the data set with the same relevés described by 20 environmental variables. The method involved bootstrap resampling with increasing sample size.

(Pillar 1999) .Efeito do tamanho da amostra na significância de eixos de ordenação. A análise usou matrizes simuladas com 3 grupos de 4 variáveis cada e 40 unidades amostrais: correlação entre variáveis r = 0. O método envolveu auto-reamostragem (bootstrap) com tamanhos crescentes de amostra.6 dentro e r = 0.3 entre grupos.

9 9 1 0.0 0 0.0 0 0.0 0 0.9 9 0.0 0 0.9 9 -0.9 9 0.9 9 .0 0 0.9 9 0.9 9 0.9 9 1 0.0.9 9 0.0 0 1 -0.0 0 0.0 0 0.9 9 1 0.0 0 0.9 9 0.9 9 0.0 0 0.0 0 0.( A) 1 0.0 0 1 0.9 9 0.9 9 0.0 0 1 0.9 9 ( B) 1 0.9 9 1 0.9 9 -0.9 9 1 0.0 0 0.9 9 1 ( C) 1 0.9 9 0.9 9 -0.9 9 1 0.0 0 0.9 9 0.0 0 0.9 9 1 .9 9 0.9 9 0.9 9 0.9 9 0.0 0 0.0 0 (D) 1 -0.0 0 1 0.0 0 0.

3939 -4.24378 5.1088 Ax is 2: -2.69 1 1 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5 Ax is 1: 1.84347 -5.5 4 14 1 3 .8302 -2.32221 ( 3 ) Get a boot st rap sample f rom (1 ) : Sampling units: 3 4 2 1 2 ( 4 ) Sc ores of boot str ap sampling units on t he f irst 2 ref erence ordinat ion axe s.00086 5.Bootstrapped ordination ( 1 ) Da t a set ( variables in rows.80579 0.93124 -0.12269 .32964 6.413 8 5 . 9 10 0 8 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2 Ax is 1: -9.00678 ( 7 ) Correlat ion 2 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 2: 0.86007 -4.9865 4.3469 -5.9386 -9.9386 1.28828 4.385703 5.00678 0. 9 71 9 97 ( 8 ) Sc ores on axis 1 f rom ( 5) aft er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 4 ): 3 4 2 1 2 Ax is 1: -8.80 579 Ax is 2: 0.49071 2.2166 2.159 4 3 .39389 -4.08556 -0.32221 1.6 3347 6.56826 -2.12578 2.9865 4. sampling unit s in columns): 17 14 27 21 16 5 9 8 5 0 5 8 0 0 10 ( 2 ) Comp ute r efe rence ordinat ion with th e dat a set: PCOA eigenvalues: 1 83 .78952 -1.56838 Ax is 2: 6. t aken f rom ( 2 ): 3 4 2 1 2 Ax is 1: -9.75821 2.86007 4.12578 -1.8812 -4.46444 -1.00955 5.28828 4.7088 5.08556 -0.32964 Ax is 2: -0.18864 6.4064 -4.1 7 81 1.12336 ( 1 1) R ef erence ordinat ion of permut ed dat a set: PCOA eigenvalues: 1 39 .93864 ( 9 ) Correlat ion 1 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 1: 0.712 1 9 .12336 1.56064 -6.28128 ( 6 ) Sc ores on axis 2 f rom ( 5) aft er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t with similar ordinat ion subspace in ( 4 ): 3 4 2 1 2 Ax is 2: 0.9865 4.5 4 97 1 1 .44 5 4 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5 Ax is 1: 4. 9 95 9 73 ( 1 0) D at a set f rom st ep with in variables: 27 14 17 16 5 5 0 8 5 10 8 0 ( 1 ) r andomly permut ed 21 9 0 ( 5 ) Ordinat ion wit h boot str ap sample: PCOA eigenvalues: 1 81 .

13995 7.77643 5.613028 ( 1 5) S cores on axis 2 f rom (1 4 ) a f t er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t wit h simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2 Ax is 2: 2. ta ken f rom st ep (1 1 ): 3 4 2 1 2 Ax is 1: -5.Bootstrapped ordination (cont…) The fo llowing st eps ( 1 2) to ( 1 8) are similar to st eps ( 3 ) to (9 ) .613028 -2.69214 -2.2166 ( 1 6) Correlat ion 2 o betw een bootst rap ( 15 ) and ref erence scores (1 3 ) on a xi s 2: 0.7068 -9.8 70 7 88 ( 1 4) Ordinat ion of boot str ap sample t aken f rom permut ed data : PCOA eigenvalues: 1 32 .7068 Ax is 2: -3.20902 The probabilit ies indicat e none of th e ordinat ion dimensions examined is signif icant .84347 -1. 7 76 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2 Ax is 1: 1.75821 2.56826 -1.07875 4.53962 -1.56838 6.20902 6. wh ich is smaller th an th e correlat ion 1 * fo und i n st ep ( 9) . 9 47 2 99 . 2 ( 1 7) S cores on axis 1 f rom (1 4 ) a f t er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2 Ax is 1: -4. ( 1 9) R epeat st eps ( 3 ) to ( 1 8) up to B it erat ions. wh ich is larger th an th e correlat ion  * fo und i n st ep ( 7) .3 91 0.0544 -0.02699 4.90144 -0.3248 -5.53895 -1. 9 99 9 99 .8 4 5 16.77643 ( 1 8) Correlat ion 1 o betw een bootst rap ( 17 ) and ref erence scores (1 3 ) on a xi s 1: 0.979 7 1 .56064 -6.2166 4. .5 67 0.62398 -6.9 82 2 27 0.26744 -0.3469 -5.64967 -6.24378 -6.84347 Ax is 2: 2. ( 2 0) A r un with B = 10 0 0 i t erat ions g ave th e f ollowing result s: Axi s P( io • i* ) Average i* 1 2 0. but p erf orme d with permut ed dat a fr om ( 1 0): ( 1 2) Get a boots t rap sample f rom p ermut ed data (w ith same number o f repeats as in (3 ) ): Sampling units: 3 4 2 1 2 ( 1 3) S cores of bootst rap sampling unit s on th e fi rst 2 ref erence ordinat ion axe s of permut ed d at a.