Professional Documents
Culture Documents
Guia Prático do
SPSS
Outubro/2010
Utilização do SPSS
(Statistical Package for the Social Sciences)
– Guia Prático I –
2
Programa “Utilização do SPSS”
1. Introdução
2. Origem
3. Abordagem conceptual
4. Áreas de interesse
5. Ambiente de trabalho
7. Importação de ficheiros
9. Análise de gráficos
Bibliografia
• PESTANA, M. H., GAGEIRO, J. N., Análise de Dados para Ciências Sociais
– a complementaridade do SPSS, Ed. Sílabo, 1998
• PEREIRA, Alexandre, SPSS – Guia prático de utilização – Análise de
Dados para Ciências Sociais e Psicologia, Ed. Sílabo, Lisboa, 1999
• HILL MAGALHÃES, Manuela, Hill, ANDREW, Investigação por
Questionário, Ed. Sílabo, Lisboa, 2000.
• Site: www.spss.com
3
1. Introdução
O SPSS é um package estatístico que integra diversas funcionalidades que
envolvem a recolha, validação e a análise de dados. A sua utilização deve ser
sempre supervisionada por uma boa orientação em termos de
conhecimento e domínio das técnicas estatísticas envolvidas.
1.1 Objectivo:
¾ Dotar os formandos de conhecimentos básicos
para a utilização de determinadas técnicas para a
obtenção e análise de resultados estatísticos.
4
2. Origem
5
¾ SPHINX: é originário da França; possui
particularidades como a capacidade de realizar
análises lexicais, factoriais e de correspondências
múltiplas; ao contrário dos softwares tradicionais,
possui uma visão dos dados que vai do particular ao
geral;
♦ www.statsoft.com/textbook/stathome.html
♦ trochim.human.cornell.edu/selstat/ssstart.htm
— é um site para seleccionar procedimentos
estatísticos.
6
3. Abordagem conceptual
Segundo alguns especialistas, o SPSS é:
¾ uma poderosa ferramenta informática que
permite realizar cálculos estatísticos complexos,
e visualizar os seus resultados, em poucos
segundos, (Pereira, 1999).
7
4. Áreas de interesse
O SPSS pode ser utilizado nas mais diversas
áreas do conhecimento e aplicações:
¾ Marketing
¾ Psicologia
¾ Administração
¾ Educação
¾ Ciências Sociais
¾ Serviço Social
¾ Economia
¾ Governamental
¾ Finanças
¾ Saúde Pública
¾ Pesquisa de Mercado
¾ Pesquisa Social
¾ Pesquisa Eleitoral
¾ Pesquisa de Opinião
¾ Pesquisa de Mídia
¾ Investigação cientifica.
8
5. Ambiente de trabalho
5.1 Janelas
9
Data Editor – A janela que apresenta o conteúdo do ficheiro de
dados. Os dados podem ser criados ou modificados
através desta janela. Só é possível ter uma destas
abertas num dado momento. É a primeira janela
que abre quando inicia o SPSS.
Barra de ferramentas
Barra de menus
Barra
de
estado
10
Viewer (Output) – Janela onde são apresentados todos os
resultados estatísticos, tabelas, gráficos, etc. Abre
automaticamente, sempre que um determinado
procedimento gera resultados. É composto por duas sub-
janelas: à esquerda está um organigrama do output: à
direita estão os resultados propriamente ditos.
11
Chart Editor – permite editar e modificar gráficos. Podem alterar-
se as cores, seleccionar tipos e tamanhos de letras, trocar os eixos
vertical com horizontal, fazer rotações, etc.
Text Output Editor – permite alterar texto que não seja visível no
Pivot Table Editor. Pode alterar-se com o
tipo, tamanho, cor e estilo das letras.
12
5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help
13
6. Criação de Ficheiro de dados
¾ As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT,
AND, NOT, GE, WITH não podem constituir nomes para
as variáveis. Estão reservadas para a Syntax.
14
Exemplo 1 - Considere um exemplo prático.
15
Depois de efectuar o exemplo anterior, faça o seguinte:
Count
SEXO
f m Total
7 4 4
8 2 2
ANO
9 2 1 3
10 1 1
Total 4 6 10
16
11. Repita o procedimento utilizado em 10), separando
os resultados por turma.
¾ Split File: permite dividir uma variável
qualitativa/categórica por grupos.
17
Figura 8
18
6.2 Transformação de variável (TRANSFORM)
19
7. Importação de ficheiros
File → Open →
20
8. Análise de estatística de dados (STATISTICS)
Ano de Escolaridade
Valid Cumulative
Frequency Percent Percent Percent
7 18 36,0 36,0 36,0
8 14 28,0 28,0 64,0
Valid 9 11 22,0 22,0 86,0
10 7 14,0 14,0 100,0
Total 50 100,0 100,0
Interpretação:
¾ ...
21
8.2 Análise de Relatórios (Reports)
¾ O SPSS produz pequenos relatórios, contendo medidas
estatísticas. Por exemplo, para seleccionar uma ou mais
variáveis (ou categorias de variáveis), utiliza-se o seguinte
procedimento:
Figura 10
• Ainda, pode-se seleccionar diferentes medidas estatísticas,
clicando no Statistics.
Figura 11
22
8.3 Medidas Estatísticas (Statistics)
Localização Localização/Posição
(Tendência não Central) (Tendência Central)
23
¾ Medidas de Tendência Central
24
Std deviation (Desvio Padrão) – mais importante medida de
dispersão, sendo definida como a raiz quadrada da
variância.
Variance (Variância) – média dos quadrados dos desvios de
cada valor em relação à sua média. Contudo, a sua
utilização como medida descritiva ocasiona alguma
dificuldade (sobretudo de interpretação) visto que se
trata, por definição, de uma média quadrática, não
possuindo a mesma unidade de medida dos dados
originais.
¾ Medidas de Assimetria
25
distribuição pode ser Mesocúrtica (k igual a 0), Platicurtica
(k menor que -2) e Leptocúrtica (k maior que +2).
Statistics
IDADE
Valid 50
N
Missing 0
Mean 12,78
Std. Error of Mean ,25
Median 13,00
Mode 14
Std. Deviation 1,80
Variance 3,24
Skewness -,554
Std. Error of Skewness ,337
Kurtosis -1,093
Std. Error of Kurtosis ,662
Range 5
Minimum 10
Maximum 15
Sum 639
25 10,75
Percentiles 50 13,00
75 14,00
IDADE
Valid Cumulative
Frequency Percent Percent Percent
10 12 24,0 24,0 24,0
11 1 2,0 2,0 26,0
12 3 6,0 6,0 32,0
Valid 13 12 24,0 24,0 56,0
14 14 28,0 28,0 84,0
15 8 16,0 16,0 100,0
Total 50 100,0 100,0
26
Interpretação:
27
Distribuição normal
¾ Veja o Output:
IDADE
16
14
12
10
4
Frequency
0 N = 50,00
10,0 11,0 12,0 13,0 14,0 15,0
IDADE
28
relação à distribuição teórica, bem como um achatamento um
maior que o que seria de esperar.
¾ Opção Explore - calcula as estatísticas, e elabora o gráfico
caule-e-folhas e o gráfico de extremos-e-quartis, muito útil
para analisar a amostra em termos de concentração ou
dispersão dos valores por intervalos quartílicos, bem como a
sua simetria; além disso, é uma boa ferramenta de verificar
se há observações “outliers”, isto é, observações extremas
que se afastam muito da média dos valores da amostra.
Figura 15
Figura 16
29
¾ Faça Explore, utilizando o Factor List para a variável Sexo.
Teste de Normalidade
Figura 17
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
IDADE ,229 50 ,000 ,824 50 ,010**
**. This is an upper bound of the true significance.
a. Lilliefors Significance Correction
30
Intervalos de Confiança sobre a média (IC μ)
Figura 18
Figura 19
31
Resultado: IC99% μ = ] 12,10 ; 13; 46[
32
Figura 20
Resultado:
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 36,883a 2 ,000
Continuity Correction
Likelihood Ratio 40,291 2 ,000
Linear-by-Linear
Association
N of Valid Cases 50
a. 2 cells (33,3%) have expected count less than 5. The
minimum expected count is 3,90.
Conclusão:
33
Medidas de Associação – baseadas no Teste de Qui-Quadrado
Symmetric Measures d
Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Phi ,859 ,000
Nominal by Nominal Cramer's V ,859 ,000
Contingency Coefficient ,652 ,000
Kendall's tau-b -,117 ,132 -,893 ,372
Ordinal by Ordinal Kendall's tau-c -,122 ,136 -,893 ,372
Gamma -,162 ,179 -,893 ,372
Measure of Agreement Kappa ,c
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values
of the first variable match the values of the second variable.
d. Correlation statistics are available for numeric data only.
Variáveis Quantitativas
34
Figura 21
Variáveis Ordinais
35
Y = aX + b,
em que, Y: var. dependente/explicada
X: var. independente/explicativa
a: declive ou inclinação
b: ordenada na origem (CONSTANT)
Para proceder ao cálculo da equação da recta de regressão
linear, deve executar o seguinte procedimento:
Figura 22
Standardi
zed
Unstandardized Coefficient
Coefficients s
Model B Std. Error Beta t Sig.
(Constant) ,238 ,276 ,864 ,413
1
ALTURAP ,858 ,154 ,892 5,574 ,001
a. Dependent Variable: ALTURAF
Interpretação:
Exercício:
Model Summaryb
Std. Error
Adjusted of the
Model R R Square R Square Estimate
1 ,892a ,795 ,770 4,638E-02
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF
Coeficiente de correlação
Coeficiente de determinação
37
Teste T – testa a hipótese dos parâmetros, individualmente,
serem nulos.
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
Regression 6,683E-02 1 6,683E-02 31,072 ,001a
1 Residual 1,721E-02 8 2,151E-03
Total 8,404E-02 9
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF
38
Figura 24
1,9
Antonio, Joao
El ton, Elio
Mapa, Melo
1,8 Leao, Santos
Pedr o, Jorge
Tavares, Silva
Borges, Elzo
1,6
1,6 1,7 1,8 1,9 2,0
ALTURAP
Figura 25
39
Tabela 2 - Procedimentos de estatística: descritiva, inferencial e
multivariada disponíveis pelo SPSS.
Summarize
Descriptives Frequencies Calcula a tabela de distribuição de
statistics frequências.
Descriptives Calcula as principais estatísticas
descritivas.
Explore Faz uma análise completa das
variáveis, podendo ainda repetir
essas análises por outra variável.
Crosstabs Calcula a tabela de distribuição de
frequências cruzadas, calcula o
teste Qui-quadrado e o Coeficiente
de Pearson para associação de
variáveis e outros testes.
List cases Lista casos escolhendo as
variáveis desejadas
Report Summaries Organiza relatórios em linhas,
in Rows segundo uma variável
Compare Means Calcula a média, o desvio padrão,
means soma, etc. das variáveis desejadas.
Independent– Calcula o teste de diferença de
sampled T-test duas médias de populações
independentes
Paired-sampled T- Calcula o teste de diferença de
test duas médias de populações
emparelhadas.
One-Way ANOVA Testa a diferença de médias de
mais de duas amostras
ANOVA Simple factorial Testa a diferença de médias do
models modelo fatorial
General factorial Testa a diferença de médias do
modelo geral
Multivariate Calcula o teste de análise de
variância multivariada
Correlate Bivariate Calcula a matriz de correlação,
tomando as variáveis de duas em
Partial duas.
Distances Calcula o coeficiente de correlação
40
parcial.
Calcula a distância euclidiana entre
os casos.
Regression Linear Ajusta o modelo de regressão
Logistic linear
Probit Ajusta o modelo de regressão
Nonlinear logística
Ajusta o modelo Probit
Ajusta um modelo não linear
Loglinear General
Hierarchical
Logit
Classify K-means cluster Análise de clusters
Hierarchical Análise de clusters hierárquicos
clusters Análise discriminante
Discriminant
Data Factor Análise factorial
Reduction
Scale Reliabity analysis Análise de confiabilidade
Multidimensional
Scaling
Non Chi-square Testes não paramétricos ou de
Parametric Binomial distribuição livre
Test Runs
1-Sample K-S
2-Independent
Samples
k-Independent
Samples
2-Related Samples
K-Related Samples
Survival Análise de sobrevivência
Multiple Análise de respostas múltiplas
response
41
9. Análise de gráficos (GRAPHS)
42