You are on page 1of 19

Anlise Factorial(AF)

A Anlise de Componentes Principais(ACP) uma tcnica de anlise exploratria de dados multivariado que transforma um conjunto de variveis correlacionadas num conjunto menor de variveis independentes, combinaes lineares de variveis originais, designadas por componentes principais ou factores. O objectivo reduzir os dados das varias variveis correlacionadas em uma ou mais combinaes lineares independentes que representam a maior parte da informao presente nas variveis originais. Estas componentes ou factores podem ser depois utilizadas com indices ou indicadores que resumem a informao disponvel nas variveis originais .

Os factores podem ser utilizadas em anlises posteriores, nomeadamente em tcnicas estatsticas (exemplo, Anlise de Clustters ou Regresso linear mltipla) que exigem que as variveis em estudo sejam independentes.

Anlise Factorial(AF)
Anlise de Componentes Principais(ACP) e Anlise Factorial(AF), so duas tcnicas que confundem-se nos packages estatsticos uma vez que se encontram intimamente relacionados. Existe diferena relacionado com o facto da ACP analisar a varincia e AF estudar aspecto relacionados com a co-varincia. O objectivo da ACP retirar a mxima varincia dos dados com o mnimo das componentes ortogonais.

Anlise Factorial(AF)
Usa-se a matriz correlaes quando necessrio ter em consideraes que as variveis so medidas com amplitudes de mensurao diferentes capazes de influenciar a importncia que cada varivel tem na AF. Exemplo o peso corporal pode ser medido em kg e a altura em mm. Neste caso para a mesma amplitude das observaes, a varincia da altura vai ser maior que a varincia do peso por causa das unidades de medida. (O peso varia entre o a 100kg e a altura entre 0 a 1800mm). Depois das variveis estarem standardiza pode-se utilizar a matriz de varincia co-varincia.

Anlise Factorial
Considere a base de dados classificao referente dos alunos em varais disciplinas. Comandos:
Analyses/data reduction/factor Variables: colocar as diversas disciplinas Na caixa descritives: Em statistics escolher: univariate descritives e inicial solution. Em correlation Matrix escolher: Coeficientes, reproduced, anti-image, kMO and Bartlet`s test

Anlise Factorial
Comandos (cont) Na caixa de Extraction: Em method escolher: Principal Components Em Extract escolher: Eigenvalues over than 1 Na caixa de Rotation Em Method escolher: varimax(mais que um factor) ou Em Display escolher: Loading Plots. Na caixa de scores escolher: save as variables

Anlise Factorial
Comandos (cont) Na caixa de options Em coefficientes Display Format escolher: sorted by size, suppress absolute values less than 0,32

Anlise Factorial
Anlise dos resultados
Total Variance Explained Initial Eigenv alues % of Variance Cumulat iv e % 50,092 50,092 23,286 73,379 8,234 81,613 5,931 87,544 4,702 92,246 3,883 96,129 3,222 99,351 ,649 100,000 Extraction Sums of Squared Loadings Total % of Variance Cumulat iv e % 4,007 50,092 50,092 1,863 23,286 73,379 Rotation Sums of Squared Loadings Total % of Variance Cumulat iv e % 2,974 37,170 37,170 2,897 36,208 73,379 Component 1 2 3 4 5 6 7 8 Total 4,007 1,863 ,659 ,474 ,376 ,311 ,258 ,052

Extraction Method: Principal Component Analy sis.

Analisando o output, constata-se que apenas dois factores possuem valores proprios superiores a um.

Anlise dos resultados(cont)

Anlise Factorial

Anlise do Scree Plot, consiste em representar graficamente os valores dos valores prprios associados aos factores. Neste caso faz-se a reteno dos factores at momento em que a curva comea a perder verticalidade. Neste caso so se pode observar, apenas depois pontos acima da linha, logo mediante este mtodo consideramos a existncia de dois factores.

Anlise Factorial
Anlise dos resultados(cont) Matriz de correlaes revela os ndices de correlaes entre as varias variveis. Se houver vrias correlaes elevadas significa que existe muita informao comum as varias variveis.
Correlati on Matrix Correlation Matemtica Fisica Quimica Ingls Hist ria Francs Port ugus Biologia Matemtica Fisica Quimica Ingls Hist ria Francs Port ugus Biologia Matemtica 1,000 ,888 ,728 ,349 ,498 ,194 ,389 ,595 ,000 ,000 ,020 ,001 ,132 ,011 ,000 Fisica ,888 1,000 ,572 ,140 ,378 ,093 ,262 ,492 ,000 ,000 ,211 ,013 ,297 ,065 ,001 Quimica ,728 ,572 1,000 ,159 ,439 ,040 ,139 ,396 ,000 ,000 ,181 ,004 ,410 ,214 ,009 Ingls ,349 ,140 ,159 1,000 ,564 ,719 ,654 ,357 ,020 ,211 ,181 ,000 ,000 ,000 ,018 Hist ria ,498 ,378 ,439 ,564 1,000 ,452 ,533 ,387 ,001 ,013 ,004 ,000 ,003 ,000 ,011 Francs ,194 ,093 ,040 ,719 ,452 1,000 ,678 ,399 ,132 ,297 ,410 ,000 ,003 ,000 ,009 Port ugus ,389 ,262 ,139 ,654 ,533 ,678 1,000 ,408 ,011 ,065 ,214 ,000 ,000 ,000 ,008 Biologia ,595 ,492 ,396 ,357 ,387 ,399 ,408 1,000 ,000 ,001 ,009 ,018 ,011 ,009 ,008

Sig. (1-tailed)

Anlise Factorial
Anlise dos resultados(cont)
Neste caso se pode constatar que as correlaes so elevadas entre alguns itens(normalmente valores superiores a 0,30). Depreende-se que possam existir poucos factores. Todavia, esta anlise pode ser complementada com tabela seguinte.
KM an d Bartl ett's Test O Kaiser-Mey er-Olkin Measure of Sampling Adequacy . Bart lett 's T est of Sphericity Approx. Chi-Square df Sig. ,699 171,198 28 ,000

A medida de Kaiser- Meyer- Olkin procura verificar a adequao da amostra realizao da AF, normalmente valores inferiores a 0,5 so considerados inaceitveis . O desejvel so valores a rondar os 0,8/0,9. Neste caso como o valor superior a 0,5, podemos considerar valida a anlise.

Anlise Factorial
Anlise dos resultados(cont) O teste de de Bartlett permite verificar se a matriz de correlaes uma matriz identidade, caso o valor de sig seja superior a 0,05, ento os factores no podem ser extrados da matriz, depreende-se que uma no correlao entre as variveis. A tabela de comunalidade indica quais so as variveis mais influenciadas pelos factores extrados. As comunalidades esto relacionadas com a representao de um varivel para um factor.

Um valor elevado na comunalidade indica que aquela varivel da um contributo grande para formao do factor extrado.

Anlise dos resultados(cont) Neste caso todas as variveis tem um peso considervel para a formao dos factores.
Commu nalities Matemtica Fisica Quim ica Ingls Hist ria Francs Port ugus Biologia Initial 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Extraction ,926 ,803 ,697 ,781 ,588 ,809 ,740 ,526

Anlise Factorial

Extraction M ethod: Principal Component Analy sis.

A matemtica e Fsica so as variveis que mais contribuem para a formao dos factores.

Anlise dos resultados(cont)

Anlise Factorial

Na tabela seguinte retrata o total de varincia explicada, ou seja, a percentagem de informao que explicada pelos factores extrados.
Total Variance Explained Initial Eigenvalues % of Variance Cumulativ e % 50,092 50,092 23,286 73,379 8,234 81,613 5,931 87,544 4,702 92,246 3,883 96,129 3,222 99,351 ,649 100,000 Extraction Sums of Squared Loadings Total % of Variance Cumulativ e % 4,007 50,092 50,092 1,863 23,286 73,379 Rotation Sums of Squared Loadings Total % of Variance Cumulativ e % 2,974 37,170 37,170 2,897 36,208 73,379 Component 1 2 3 4 5 6 7 8 Total 4,007 1,863 ,659 ,474 ,376 ,311 ,258 ,052

Esto os conjuntos dos valores prprios, que representam a quantidade de informao que est a ser analisado na matriz dos factores extrados.

Extraction Method: Principal Component Analy sis.

Anlise dos resultados(cont) O numero de valores prprios igual ao numero de variveis estudada. O valor prprio dividido pelo numero de variveis estudada, indica a proporo de informao na matriz de um determinado factor. Neste caso apenas se conseguiu extrair 2 factores com valores prprios superiores a 1 (4,007 e 1,863). Os dois factores explicam 73,3% da varincia dos dados, sendo restante varincia explicada por outros factores que possuem um peso menos significativo. O 1 factor explica 37,1% e o 2 factor explica 36,2%.

Anlise Factorial

Anlise dos resultados(cont)


a Rotated Component Matri x

Anlise Factorial

Matriz de componente rodada. A funo desta matriz relacionar as variveis com os factores extrados.
Component Matemtica Fisica Quimica Biologia Francs Ingls Portugus Histria 1 ,935 ,894 ,834 ,591 2

,455

,420 ,899 ,876 ,840 ,617

Ext raction Met hod: Principal Component Analy sis. Rotation Method: Varim ax with Kaiser Norm alization. a. Rotation conv erged in 3 iterations.

Muitos correlaes entre as variveis e factores apresentam valores quase insignificantes. Neste caso retiram-se valores com correlaes superiores a 0,32 que so interpretveis. Assim quanto maior a correlao, maior a pureza das medidas dos factores.

Anlise Factorial
Anlise dos resultados(cont) A tabela da matriz de componentes rodada permite identificar a distribuio das variveis pelos factores extrados. As variveis que medem o factor 1 so , por ordem de importncia, Matemtica, Fsica, Qumica, Biologia e Histria, por sua vez o factor 2 medido pelas variveis, Francs, Ingls, Portugus ,Histria e Biologia. Biologia caracteriza o factor 1 e 2

Anlise dos resultados(cont)

Anlise Factorial

Neste caso depreende-se que o 1 factor mede a inteligncia (matemtica, Fsica e Qumica) e o 2 factor mede a capacidade verbal(Francs, Ingls e Portugus)

Anlise de clusters
A anlise de grupos ou de clusters, uma tcnica exploratria de anlise multivariada que permite agrupar sujeitos ou variaveis em grupos homogneos a uma ou mais caractersticas comuns.

Anlise de clusters
C A S E Label Num 25 31 5 13 1 28 10 35 18 7 14 16 33 8 32 23 6 27 21 34 15 24 29 9 3 19 12 2 17 11 22 4 30 26 20 0 5 10 15 20 25 +---------+---------+---------+---------+---------+

You might also like