Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense

Análise Estatística Utilizando o SPSS Guia prático de comandos

Juliana-Bahiense de Sousa Guimarães. Salvador/BA

julianabahiense@gmail.com

............................ Primeiro Passo ..................................................................................................................................................................................................... Os Menus ..................................................com ...... As Janelas .... Introdução............3 2......................................................................Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Sumário 1................................19 julianabahiense@gmail................................................................................3 3...............................................................................................................................1 Data Editor....................6 4.............................................................9 5..........................................................................................................................................................................................4 4..........................................................2 Output........ Bibliografia Consultada ....................................10 6...................... Análise de Dados...................6 4.....

Um dos usos importantes deste software é para realizar pesquisa de mercado”. A primeira versão data de 1968 e. a mais recente é a SPSS for Windows 16 (2007). acrónimo de Statistical Package for the Social Sciences . julianabahiense@gmail. Para exemplificar utilizaremos os bancos de dados 1991 U. Introdução O Statistical Package for Social Science for Windows (SPSS) é um software para análise estatística de dados. 2. “SPSS é um software aplicativo (programa de computador) do tipo científico.sav anorectic. que permite realizar cálculos complexos e visualizar seus resultados de forma simples e autoexplicativas. General Social Survey. Pacote este de apoio a tomada de decisão que inclue: aplicação analítica. em um ambiente amigável. utilizando-se de menus e janelas de diálogo. criar um novo banco de dados. Primeiro Passo Assim que você inicia o programa aparece a seguinte tela: Nela você poderá abrir um arquivo já existente (banco de dados ou sintaxe ou output). e Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessário um prévio conhecimento de técnicas estatísticas de exploração de dados. Text Mining e estatística que transformam os dados em informações importantes que proporcionam reduzir custos e aumentar a lucratividade.S. Segundo o site Wikipedia. ir ao tutorial.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense 1.sav que se encontra no diretório SPSS.com .pacote estatístico para as ciências sociais. Data Mining.

ele trabalha basicamente com as três primeiras.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense 3. Label: descritivo da variável julianabahiense@gmail. monetária. Type: tipo da variável (numérica. alfanumérica (string)) Width: comprimento da variável. isto é. modificação e visualização dos dados. a quantidade de dígitos que possui. Na Figura 1 temos o Data View (Data Editor). em que as colunas são as variáveis e as linhas os casos (ou indivíduos). Output – SPSS Viewer: é a janela de resultados. letras maiúsculas e minúsculas são iguais. local onde definimos as características das variáveis: Name: nome da variável. Script Editor: cria e modifica scripts para automatizar tarefas.Tela dos dados – banco anorectic. que estarão expostas nesta apostila. máximo de 64 caracteres. mas não podem conter fórmulas. Syntax – SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos em outra ocasião. SPSS Chart Object: permite editar e modificar gráficos. Decimals: número de casas decimais que a variável possui.com .sav Na Figura 2 temos o Variable View (Data Editor). tabelas e gráficos. data. Text Output Editor: altera texto não visíveis no Pivot Table Editor. Figura 1 . As células podem conter valores numéricos ou alfanuméricos. As Janelas No SPSS existem 7 tipos de janelas. SPSS Pivot Table Object: permite editar e modificar tabelas. Porém. são elas: SPSS – Data Editor: permite a entrada. O aspecto inicial do editor é apresentado nas figuras a seguir.

Missing: para indicar a codificação dos valores perdidos. Columns: indica o numero de caracteres que formam a coluna.Tela de saída – Output – banco anorectic. aqueles que não serão considerados para efeito de cálculo estatístico. tabelas. 1=feminino e 2=masculino). como gráficos. Align: alinhamento dos dados. que mostra todas as saídas solicitadas. e resultados estatísticos.com . Measure: seleciona a escala de medida da variável (intervalar/razão.sav Na Figura 3 temos o View (Output).Tela das variáveis – banco anorectic.sav julianabahiense@gmail. ou seja. Figura 2 . Na Figura 4 temos a tela de sintaxe do comando “Frequencies” do tópico Descriptive Statistics. ordinal ou nominal).Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Values: rótulos dos valores das variáveis (pe. a largura da coluna. Figura 3 .

para o processo.com . Os Menus 4. imprimir. julianabahiense@gmail.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Figura 4 .sav 4. mostra os arquivos recentemente utilizados. ler.1 Data Editor File – tem as funções de criar.Tela de sintaxe – Syntax – banco anorectic. salvar. abrir. sai do programa.

View – formato das telas: barras de ferramentas. copiar.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Edit – gerencia comandos de edição dos arquivos. gera amostra aleatória. ordena o arquivo segundo valores de uma variável. cria variável Lag de uma série temporal. fontes. cria novo arquivo com valores agregados das variáveis originais. apagar. transpõe variáveis (em um novo arquivo – transpose).com . calcular novas variáveis a partir das existentes. atribui postos aos valores de uma variável (segundo outra). recodifica variáveis. cria nova variável através de uma existente. julianabahiense@gmail. roda as transformaçõess pendentes. cortar. modificar. localizar e manipula o formato de saída (default). colar. status e linha de grade e rótulos de variáveis. substitui valores perdidos. seleciona casos em que cumprem uma certa condição. Data – inserir variável ou dados. agrupa arquivos (merge files). transforma variável qualitativa em categórica. Transform – para alterar variavel selecionada. pondera os valores da variável. divide um arquivo segundo uma variável qualitativa. define formato dos dados.

julianabahiense@gmail. Boxplot. Análise de Sobrevivência. Tabelas de Freqüências. Graphs – Criar gráficos de barras. setorial. linha.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Analyze – Funções estatísticas como Análise Descritiva. Análise de respostas múltiplas. histograma. Análise de Variância. Correlação. Análise Fatorial. etc. Testes Não-paramétricos. Análise de confiabilidade. etc. Regressão.com .

Help – Tópicos de ajuda. tutorial.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Utilities – para obtenção de informações acerca das variáveis. alterar menus.com .. Home page do SPSS. scripts.. Window – comutar entre as várias janelas do SPSS que estão abertas. 4.2 Output A barra de menus do Output é similar a da janela Data Editor. acrescido dos itens Insert e Format julianabahiense@gmail.

Para este exemplo selecionamos a variável “sex” (sexo dos respondentes). é necessário. julianabahiense@gmail.9 58.sav Tabela de Distribuição de Freqüência Para gerar a tabela de freqüência seguimos os seguintes comandos na barra de menu nas janelas Data Editor ou Output: Analyze >> Descriptive Statistics >> Frequecies Ou. General Social Survey. para que se abra a “ilha” de edição. DBase. obtendo a seguinte saída: Respondent's Sex Frequency Valid Male Female Total 636 881 1517 Percent 41.0 Cumulative Percent 41. tais com Excel. ou acrescentá-las nos comandos do Syntax: FREQUENCIES VARIABLES=sex sibs /ORDER= ANALYSIS . incluir %.1 100. Também é possível solicitar a tabela de freqüência de diversas variáveis ao mesmo tempo. darmos duplo clique com o botão esquerdo do mouse na tabela.0 Valid Percent 41.1 100. Para isto.9 58. podemos utilizar os comandos diretamente da janela Syntax. selecionamos os dados que queremos formatar e damos um clique com o botão direito para que se abra a lista de opções do menu. como segue: FREQUENCIES VARIABLES=sex /ORDER= ANALYSIS . ainda na janela Output. Análise de Dados No SPSS podemos criar um banco novo no próprio programa ou importar de um outro software. etc.com . Iniciaremos com procedimentos mais simples de estatística descritiva. Acess.9 100. Para esta análise utilizaremos o banco de dados 1991 U.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense 5.0 Podemos formatar os dados da tabela. fonte.S. bastando seleciona-las na janela de diálogo. Após carregar o banco de dados o SPSS está pronto para ser explorado. como número de casas decimais.

gráficos boxplot e ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hipótese nula. versus a hipótese alternativa. nos diz que a variável estudada segue distribuição Normal. Ha. H0. através do botão Statistics e Charts algumas estatísticas resumo e gráficos para representar as variáveis. Quando necessitamos descrever variáveis quantitativas através de estatísticas gerais podemos utilizar o comando: Analyze >> Descriptive Statistics >> Descriptives Ou mesmo os comandos em: Analyze >> Descriptive Statistics >> Explore Neste item do menu Analyze podemos obter além de parâmetros estatísticos.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Ainda neste item. a variável não julianabahiense@gmail. podemos solicitar.com .

Podemos ainda usar um dos comandos do Tables. queremos saber se o sexo (sex) pode explicar variações no tempo de estudo (educ). Para os dois testes temos como regra de decisão se p-valor < α então rejeitamos H0. Podemos fazer esta verificação usando: I. Para analisarmos variáveis quantitativas em função de uma qualitativa. este último pode ser verificado pelo teste Levene cuja hipótese nula diz não existir diferença entre as variâncias. O teste t-student tem como hipótese nula a não existência de diferença entre a média da variável por grupo (fator). Analyze >> Explore Analyze >> Reports >> Report Summary in Row Analyze >> Compare Means >> Means Analyze >> Compare Means >> Independet Sample T Test Graphs >> Boxplot Para aplicarmos o test t-Student devemos verificar se a variável testada atendem aos pressupostos de normalidade e homocedasticidade. III. por exemplo: Analyze >> General Tables >> General Tables julianabahiense@gmail.com . Para fazermos a analise da variável X segundo os fatores da variável Y devemos inserir X em “Dependent list” e Y em “Factor List”. II. V. por exemplo. cuja regra de decisão é se p-valor < α então rejeitamos H0) e a analise visual utilizando os gráfico QQ e QQ detrended (normalidade quando os pontos estão distribuídos de forma aleatória em torno da reta). IV.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense segue uma distribuição Normal. Cruzamento de Variáveis pode ser feito através dos comandos: Analyze >> Descriptive Statistics >> Crosstable Então selecionamos as variáveis que irão compor as linhas e as colunas. Podemos acrescentar as percentagens clicando no “Cell Display”.

000 . (2-tailed) N Highest Year of School Completed Correlation Coefficient Sig.000 1065 1. Podemos obter os coeficientes de Correlação de Pearson e o Coeficiente de Correlação de Spearman (variáveis cujas distribuição não seja Normal).com . Father Correlation Coefficient Sig.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Análise de Correlação pode ser feita para responder como as variáveis se relacionam.000 . 1069 A hipótese nula testada é de correlação nula (teste bicaudal).450(**) .01 level (2-tailed).000 1064 Highest Year of School Completed -.000 .450(**) .262(**) . (2-tailed) N ** Correlation is significant at the 0. Analyze >> Correlate >> Bivariate Correlations Number of Children Spearman's rho Number of Children Correlation Coefficient Sig.297(**) . Analyze >> Regression >> (selecionamos o tipo de modelo) julianabahiense@gmail. 1510 . (2-tailed) N Highest Year School Completed. 1509 -. 1. Análise de Regressão pode ser feita para modelar uma variável em função de outra (s). Father -.262(**) .000 1065 Highest Year School Completed.000 1507 1.000 1507 -.297(**) .000 1064 .

com Todos os preditores são estatisticamente significantes. Respondent's Sex.000(a) Com p-valor= 0.160 .067 .189maeduc julianabahiense@gmail.782 -2. Mother 9. a Predictors: (Constant). Variables Entered/Removed(b) Model 1 Variables Entered Variables Removed Method Highest Year School Completed. Highest Year School Completed.026 .231 Standardized Coefficients Beta 25. Respondent's Sex. Este modelo explica 23. Respondent's Sex.993 99. Highest Year School Completed.000 . Highest Year School Completed.189 Std. .000 Sig.381 7.486(a) . .574 6.6% da variação de “educ”.236 .745 7603.017 . Error of the Estimate 2. Father(a) . Mother.085 .853 5. a Predictors: (Constant).288 .384 .380 .000 .6%.934 df Mean Square F Sig. t a Dependent Variable: Highest Year of School Completed A equação do modelo proposto é: educ = 9. Father Highest Year School Completed.305 3 969 972 598.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense A seguir apresentamos a saída do comando Regressão Linear Em que a variável dependente é “educ” e as variáveis independentes são: “sex”.234 Adjusted R Square Std.560 Residual Total 5806. Highest Year School Completed. Enter a All requested variables entered. “paeduc” e “maeduc”. Highest Year School Completed.000 rejeitamos H0 e educ pode ser modelado por uma reta com os preditores selecionados. Mother.448 Coeficiente de determinação: R2= 23. Father b Dependent Variable: Highest Year of School Completed ANOVA(b) Model Sum of Squares 1 Regression 1796.380sex + 0. Error . Mother.031 -.196 paeduc + 0.902 − 0.902 -. b Dependent Variable: Highest Year of School Completed Model Summary(b) R Square Model 1 R .196 . Father b Dependent Variable: Highest Year of School Completed Coefficients(a) Unstandardized Coefficients B 1 (Constant) Respondent's Sex Highest Year School Completed.

Predicted Value Standard Error of Predicted Value Adjusted Predicted Value 9.359 2.000 .002 2.0 0.8 1.11 Residual Std.22 2.045 13.000 . Indica normalidade dos dados “educ”.4 0.20 8. 0. Residual Stud.104 Maximum 17.com .2 0.003 .000 2.54 .399 8.2 0.360 1.0 0.000 .000 .0 0.444 .923 -3.455 1. O SPSS usa os comandos a seguir: Analyze >> Data Reduction >> Factor julianabahiense@gmail. Deleted Residual Mahal.998 1.54 . sem perda de informação.603 -3.636 -3.001 2.707 .997 .001 a Dependent Variable: Highest Year of School Completed .023 .499 .000 .6 0.001 1.959 .Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Residuals Statistics(a) Minimum Predicted Value Std.418 22.365 3.000 .379 Mean 13.6 0.381 3. Residual Deleted Residual Stud. Distance Cook's Distance Centered Leverage Value . Deviation 1.8 Expected Cum Prob Análise visula dos resíduos para avaliar a qualidade do ajuste.003 973 973 973 973 973 973 973 973 9.000 17.151 Std.744 .277 3.239 .003 973 -9.4 0.930 -9.0 Observed Cum Prob A Análise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de variáveis em termos de um número menor de variáveis que estão relacionadas com o grupo original através do modelo linear.14 -3.041 N 973 973 973 Normal P-P Plot of Regression Standardized Residual Dependent Variable: Highest Year of School Completed 1.354 .

Interpretação do teste KMO: <0. Na mesma caixa de diálogo podemos definir também a Rotação (Rotation). com diferentes variâncias para cada variável. Kruskal-wallis.70 0. o teste dos sinais. Initial solution apresenta as comunalidades. E em Options podemos escolher como será tratado o valor missing.90 – 1 iniciais.50 – 0. Matriz de correlação: variáveis em escalas diferentes. por exemplo.com . Direct Oblimin e Promax: métodos não ortogonais. temos com testes paramétricos disponíveis o teste t e o ANOVA e como testes não paramétricos.80 – 0. por exemplo. podemos especificar estatísticas descritivas e coeficientes e correlação. McNemar. Testes para validade da aplicação da análise fatorial. julianabahiense@gmail. observa-se o pressuposto de independência das componentes. Os método de cálculo dos escores são definidos em Scores.80 0. Equamax: combinação do Varimax e Quartimax. Selecionamos o método de extração dos fatores. Binomial e o Qui-quadrado.60 0. Matriz de covariância: múltiplos grupos.60 – 0. Wilcoxon. . que é aplicada para transformar os coeficientes das componentes principais numa estrutura simplificada pelos métodos: Varimax: alguns pesos significativos e os outros próximos de zero Quartimax: pesos elevados para um número reduzido de componentes e próximos a zero para as restantes.70 – 0. Mann-whitney.90 0. Aleatoriedade.50 0.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Nesta caixa de diálogo. Inaceitável Má Razoável Média Boa Muito boa A hipótese nula do teste de Esfericidade de Bartlett afirma não haver correlação entre as variáveis No SPSS temos alguns testes de hipóteses. os valores próprios e a percentagem de variância explicada.

839 Std.157 95% Confidence Interval of the Difference Lower .000 Mean Difference . se H0 for verdadeira.226 Sig. Média de anos para as amostras (mas. (2-tailed) .602 anos.096 Highest Year of School Completed % de possibilidade de observar uma diferença de médias desse valor. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means Std. neste caso. Deviation 3.602 . julianabahiense@gmail.143 2. Error Mean .454 Sig. 1=masculino e 2=feminino A saída apresentada é: Group Statistics Respondent's Sex Male Female N 633 877 Mean 13.com .23 12.602 Teste da igualdade de variâncias.911 Highest Year of School Completed Equal variances assumed Equal variances not assumed F 11. e fem.63 Std.125 .298 .000 . “sex”. H0 variâncias iguais.293 Upper . Error Difference . . Esses valores correspondem aos códigos usados na variável.001 t 3.906 .) difere de 0.824 df 1508 1276.887 3.155 .Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense O teste t pode ser feito através dos comandos: Analyze >> Compare Means >> Independent Samples T test Os grupos da variável é definido em “Define Groups”.

os testes Qui-quadrado. Kruskal-Wallis e Mediana (k Independent Samples) Para fazermos Análise de Cluster. Para os Testes Não PAramétricos procedemos da seguinte maneira: Analyze >> Nonparametric Tests Temos. Kolmogorov-Smirnov.com . testes para duas amostras independentes. Aleatoriedade. testes para duas amostras relacionadas. Binomial. Obter testes de comparação múltipla de Bonferroni. seguimos os seguintes comandos: Analyze >> Classify >> Hierarchical Cluster julianabahiense@gmail.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense A ANOVA pode ser feita através dos comandos: Analyze >> Compare Means >> One-Way ANOVA Obter resumo dos dados. nesta ordem.

Manual Básico do SPSS para Windows. 2001 Wikipedia. Irene M.Apostila: Análise Estatística utilizando SPSS Juliana-Bahiense Para colocar as variáveis numa mesma escala devemos padronizá-la através do método de transformação encontrado na caixa de diálogo . Escola Superior Agrária de Castelo Branco. Análise de dados para Ciências Sociais e Psicologia. Disponível em: <http://pt. FERREIRA.wikipedia. 6.org/wiki/SPSS>. Ago 2003. 1999. Alexandre. SPSS – Manual de Utilização. UESC. SPSS Inc. Curso de Pacotes Estatísticos. 4ª ed. Cora. Armando M. julianabahiense@gmail. SANTANA. SPSS. Graça. Bibliografia Consultada CAZORLA. Edições Silabo. Chicago. Lisboa. Guia Prático de Utilização do SPSS. Statistical Analysis Using SPSS. LISBOA. Mar 2003. Para dendogramas. CPD/ UFBA. Ilheus. PEREIRA.com .

Sign up to vote on this title
UsefulNot useful