Guia Pratico de SPSS

Guia Prático do
SPSS
Outubro/2010
Utilização do SPSS
(Statistical Package for the Social Sciences)
– Guia Prático I –
2
Programa “Utilização do SPSS”
1. Introdução
2. Origem
3. Abordagem conceptual
4. Áreas de interesse
5. Ambiente de trabalho
6. Criação de ficheiro de dados
7. Importação de ficheiros
8. Análise estatística de dados
9. Análise de gráficos
10. Ajuda - Utilização do tutorial
Bibliografia
• PESTANA, M. H., GAGEIRO, J. N., Análise de Dados para Ciências Sociais
– a complementaridade do SPSS, Ed. Sílabo, 1998
• PEREIRA, Alexandre, SPSS – Guia prático de utilização – Análise de
Dados para Ciências Sociais e Psicologia, Ed. Sílabo, Lisboa, 1999
• HILL MAGALHÃES, Manuela, Hill, ANDREW, Investigação por
Questionário, Ed. Sílabo, Lisboa, 2000.
• Site: www.spss.com
3
1. Introdução
O SPSS é um package estatístico que integra diversas funcionalidades que
envolvem a recolha, validação e a análise de dados. A sua utilização deve ser
sempre supervisionada por uma boa orientação em termos de
conhecimento e domínio das técnicas estatísticas envolvidas.
1.1 Objectivo:
¾ Dotar os formandos de conhecimentos básicos
para a utilização de determinadas técnicas para a
obtenção e análise de resultados estatísticos.
1.2 Requisitos básicos:

¾ Estatística (ou que utilizem como apoio um livro
de estatística).
¾ Informática (windows,..).
1.3 Resultados esperados:
¾ Introduzir dados num novo ficheiro; gravar
ficheiros e abrir ficheiro criado anteriormente;
definir e transformar variáveis;
¾ Importar dados do Excel e de outras aplicações;
¾ Analisar dados (estatística univariada e bivariada,
tabelas e gráficos);
¾ Executar alguns procedimentos de estatística
inferencial.
4
2. Origem
¾ Universidade de Londres nos anos 60. Tornou-se

muito popular no meio académico a partir da
década de 70;
Além do SPSS, foram desenvolvidos na década de 60

vários softwares estatísticos. De entre esses, podem ser
citados:
¾ SAS (Statistic Analysis System): foi desenvolvido na

Universidade da Carolina do Norte; é semelhante ao
SPSS; contém vários módulos; é muito popular nos
institutos de pesquisa;
¾ "BMD" (Biomedical Computer Programs):

desenvolvido na Universidade da Califórnia.
¾ EPINFO: foi desenvolvido sob os auspícios da ONU,

para ser utilizado e popularizado na área médica;
possui diversos módulos estatísticos; todavia,
tecnicamente constitui um software limitado,
principalmente quanto aos seus recursos gráficos;
5
¾ SPHINX: é originário da França; possui
particularidades como a capacidade de realizar
análises lexicais, factoriais e de correspondências
múltiplas; ao contrário dos softwares tradicionais,
possui uma visão dos dados que vai do particular ao
geral;
Alguns endereços estatísticos:

♦ www.spss.com — é o site do SPSS com alguns
links interessantes.
♦ www.statsoft.com — é o site de um pacote

menos conhecido, chamado Statistica.
♦ www.statsoft.com/textbook/stathome.html
♦ trochim.human.cornell.edu/selstat/ssstart.htm
— é um site para seleccionar procedimentos
estatísticos.
♦ www.ats.ucla.edu/stat/ — é o site sobre

recursos académicos da Univiversidade Califórnia
Los Angeles (UCLA).
6
3. Abordagem conceptual
Segundo alguns especialistas, o SPSS é:
¾ uma poderosa ferramenta informática que
permite realizar cálculos estatísticos complexos,
e visualizar os seus resultados, em poucos
segundos, (Pereira, 1999).
¾ Uma das muitas aplicações para o tratamento

estatístico de dados disponíveis e das mais
divulgadas no mundo inteiro (Fonseca & Silva,
2003).
¾ Um software útil para gerir e analisar

estatisticamente uma matriz de dados. Processa
em ambientes DOS e Windows e possui uma
visão que vai do geral para o particular.
¾ Um poderoso software estatístico especialmente
desenvolvido para a utilização por profissionais
de ciências humanas. Diferentemente de outros
pacotes estatísticos existentes no mercado, o
SPSS apresenta uma interface bastante amigável
ao usuário, facilitando em muito suas análises
estatísticas (Valentim, Fernando, 2001:
fvalentin@ig.com.br)
7
4. Áreas de interesse
O SPSS pode ser utilizado nas mais diversas
áreas do conhecimento e aplicações:
¾ Marketing
¾ Psicologia
¾ Administração
¾ Educação
¾ Ciências Sociais
¾ Serviço Social
¾ Economia
¾ Governamental
¾ Finanças
¾ Saúde Pública
¾ Pesquisa de Mercado
¾ Pesquisa Social
¾ Pesquisa Eleitoral
¾ Pesquisa de Opinião
¾ Pesquisa de Mídia
¾ Investigação cientifica.
8
5. Ambiente de trabalho
5.1 Janelas
Há oito tipos de janelas/windows no SPSS:
Figura 1 – Lista de janelas do SPSS.
9
Data Editor – A janela que apresenta o conteúdo do ficheiro de
dados. Os dados podem ser criados ou modificados
através desta janela. Só é possível ter uma destas
abertas num dado momento. É a primeira janela
que abre quando inicia o SPSS.
Barra de ferramentas
Barra de menus
Barra
de
estado
Figura 2 – Janela de edição de dados
Folha de edição de dados

Modo de visualização de dados
Modo de visualização e definição das variáveis.
10
Viewer (Output) – Janela onde são apresentados todos os
resultados estatísticos, tabelas, gráficos, etc. Abre
automaticamente, sempre que um determinado
procedimento gera resultados. É composto por duas sub-
janelas: à esquerda está um organigrama do output: à
direita estão os resultados propriamente ditos.
Figura 3 – Janela de visualização de resultados.
Draft Viewer – Os resultados podem ser apresentados em forma de

texto (instead of interactive pivot table) no Draft
Viewer.
Pivot Table Editor – permite editar e modificar tabelas (editor da

tabela dinâmica). Pode editar-se o texto,
trocar os dados de linhas com colunas,
adicionar cor, criar tabelas
multidimensionais, etc.
11
Chart Editor – permite editar e modificar gráficos. Podem alterar-
se as cores, seleccionar tipos e tamanhos de letras, trocar os eixos
vertical com horizontal, fazer rotações, etc.
Figura 4 - Janela de edição de gráficos.
Text Output Editor – permite alterar texto que não seja visível no
Pivot Table Editor. Pode alterar-se com o
tipo, tamanho, cor e estilo das letras.
Syntax Editor – Todos os comandos emitidos a partir dos menus

do SPSS podem ser apresentados numa janela de
sintaxe. Para isso, utiliza-se o comando Paste das
caixas de diálogo.
Script Editor – Janela de programação que permite personalizar e

automatizar tarefas do SPSS (pequenos
programas).
12
5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help
Tabela 1 – Menu da Janela de dados

M en u Funcionalidades
Criar, abrir, ler, gravar ou imprimir ficheiros.

File
Modificar, copiar ou colar textos das janelas de
Edit output ou de sintaxe; pesquisa de dados e
parametrização de opções diversas.
Activar diversas barras de ferramentas/botões,
fontes, grelhas, barra de status e mostrar os
View rótulos (labels) definidos.
Alterar globalmente os dados tais como: transpor
variáveis e casos, criar subconjuntos de casos para
Data análise, inserção de dados.
Obs: Estas alterações são temporárias e não
afectam o ficheiro, excepto se for efectuada uma
gravação com estas alterações.
Produzir alterações nas variáveis seleccionadas e,
Transform calcular novas variáveis a partir de valores de
outras já existentes.
Obs: Estas alterações só serão efectivas se forem
gravadas.
Seleccionar vários procedimentos estatísticos como
Analyze a análise descritiva, cruzamento de variáveis,
análise da variância, correlações, regressões,
clusters, séries, amostras, análise multivariada,
estatísticas não paramétricas, etc.
Criar gráficos de colunas, de sectores,
Graph histogramas, diagramas de dispersão, etc.
Obter informação acerca das variáveis, controlar
Utilities lista de variáveis que aparece nas caixas de
diálogos, correr scripts e alterar menus.
Add-ons
Comutar entre as várias janelas do SPSS ou
Windows minimizá-las.
Ajudar o funcionamento do SPSS.
Help Ligar à Página do SPSS na Internet.
13
6. Criação de Ficheiro de dados
6.1 Introdução de dados

Aspectos a considerar:
¾ Muitas das características da Janela do Data Editor do

SPSS são similares às de qualquer folha de calculo em
ambiente Windows, tal como o Excel.
¾ As colunas correspondem às variáveis (ou campos). E as

linhas aos casos (ou registos).
¾ As células podem apenas conter valor (numéricos e não

numéricos); não é possível, tal como se faz nas folhas de
cálculos, definir fórmulas nas células.
Definição das variáveis (Data → Define Variable):
¾ O primeiro caracter deve ser uma letra; os restantes

podem ser numéricos ou não numéricos; ou mesmo
incluir certos símbolos (@, #, _, ou $). Não deve incluir
espaços em branco ou conter os símbolos: &, !,? ou *.
¾ As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT,
AND, NOT, GE, WITH não podem constituir nomes para
as variáveis. Estão reservadas para a Syntax.
¾ Deve indicar o tipo da variável: numérico, textos/não

numéricos (string), data (date), etc; descrever a variável e
dos seus valores (rótulos/labels); e codificar os valores em
falta/sem informação (missing values).
Obs: É recomendável definir uma variável qualitativa como numérica e
depois atribuir os rótulos ou labels. Por exemplo, a variável sexo: digitar 1 para
sexo feminino e 2 para sexo masculino e nos labels colocar a equivalência.
14
Exemplo 1 - Considere um exemplo prático.
Editor de Célula Célula activa

Número de linha Nome da variável
Figura 5 – Introdução de dados
1. Guarde o ficheiro: File → Save → nomeficheiro (osvaldo.sav)

2. Produza: Tabela de frequências para a variável ano.
Analyze → Descriptive Statistics → Frequencies → variável
3. Repita a alínea 2) para as outras variáveis.
4. Feche todas as janelas do SPSS. Abra de novo o SPSS.
5. Abra o ficheiro de dados introduzido anteriormente:
File → Open → nomeficheiro
6. Utilize no menu Edit as opções (copiar, apagar, paste, find, ...)
7. Introduza/Insira 5 novos casos: Data → Insert Case
8. Insira 2 novas variáveis: Data → Insert variable
15
Depois de efectuar o exemplo anterior, faça o seguinte:
9. Seleccione as variáveis sexo, idade, ano e turma e

construa as frequências e os respectivos gráficos de
barras.
Figura 6 – Selecção de variáveis
10. Cruze as variáveis ano e sexo.

Analyze → Descriptive Statistics → Crosstabs
ANO * SEXO Crosstabulation
Count
SEXO
f m Total
7 4 4
8 2 2
ANO
9 2 1 3
10 1 1
Total 4 6 10
Obs: Este resultado foi obtido para 10 casos/indivíduos.
16
11. Repita o procedimento utilizado em 10), separando
os resultados por turma.
¾ Split File: permite dividir uma variável
qualitativa/categórica por grupos.
Data → Split File → Organize output by groups
Figura 7 – Divisão de ficheiro
A seguir, cruze as variáveis ano e sexo.
¾ Para anular o Split File, deve fazer:
Data → Split File → Analyze all cases, do not create groups
12. Seleccione apenas os alunos do sexo feminino.
¾ Select Cases: Selecciona determinados casos.
Data → Select Cases → if condition, is satisfied
17
Figura 8
18
6.2 Transformação de variável (TRANSFORM)
Transform Função Como accionar e os subcomandos
Compute Calcula uma nova Colocar o nome da nova variável

variável a partir de
em target variable. Em numerical
outras já existentes,
expression colocar as variáveis
podendo usar todas existentes e as operações entre
as funções elas. Por exemplo:
matemáticas e soma=a1+a2+a3+a4.
estatísticas Ainda, pode seleccionar casos
utilizando a condição if .
Random Number Serve para gerar um número aleatório
Seed
Recode Recodifica variáveis • Into the same variable: altera
os valores da variável e guarda
as alterações na mesma
variável. Seleccionar a variável
e entrar em Old and new
values, e a cada valor antigo
colocar o valor novo e
adicionar clicando add, no fim
dar continue.
• Into the diferent variable: cria
uma nova variável em função
de uma já existente, seguir o
mesmo esquema do item
anterior.
Rank cases Atribui postos na variável segundo uma outra.
Automatic recode Cria uma nova variável com o mesmo conteúdo da

variável desejada
Run Pending Roda as transformações pendentes
transforms
Create Time Cria séries temporais.
Series
19
7. Importação de ficheiros
O SPSS dispõe de procedimentos de importação de ficheiros criados

noutras aplicações designadamente folhas de cálculo (Lotus 123, Excel),
bases de dados (dBase, Access), ficheiros ASCII (separados por
tabulações, vírgula, espaços), etc.
IMPORTAÇÃO DE FICHEIROS DE EXCEL
File → Open →
Figura 9 – Tipos de ficheiros
Nesta janela deve:
¾ Procurar a pasta onde se encontra o ficheiro;

¾ Especificar Excel e seleccionar a opção (*.xls).
Aparece de seguida uma caixa de diálogo, onde se especifica se as

primeiras células contêm os nomes das variáveis (se sim activar Read
variable names) e o intervalo (rectangular) de células (no exemplo,
A1:B11).
Por último, o SPSS cria um ficheiro com tantas variáveis quantas as

colunas e tantos casos quantas as linhas do bloco especificado. Não se
esqueça de guardá-lo na sua pasta (extensão .sav).
20
8. Análise de estatística de dados (STATISTICS)
¾ O SPSS apresenta um conjunto de funções e

procedimentos avançados para a análise estatística de
dados, os quais se encontram sob o comando Analyze
(Análise de dados).
8.1 Tabelas de Frequência

Antes de dar início à apresentação das diferentes funções
estatísticas, aconselha-se a interpretação das tabelas de
frequência (frequency).
Considere o seguinte exemplo:
Ano de Escolaridade
Valid Cumulative
Frequency Percent Percent Percent
7 18 36,0 36,0 36,0
8 14 28,0 28,0 64,0
Valid 9 11 22,0 22,0 86,0
10 7 14,0 14,0 100,0
Total 50 100,0 100,0
Interpretação:
¾ Dezoito (18) alunos frequentam o 7º ano de escolaridade. Ou

seja, 36% dos alunos estão a frequentar o 7º ano. ... 28% o 8º
ano de estudo. ...
¾ Há 64% de inquiridos estudam o 1º ciclo do ensino

secundário (7º e 8º anos de escolaridade). Por outro lado,
36% frequentam o 2º ciclo (9º e 10º anos de escolaridade).
¾ ...
21
8.2 Análise de Relatórios (Reports)
¾ O SPSS produz pequenos relatórios, contendo medidas
estatísticas. Por exemplo, para seleccionar uma ou mais
variáveis (ou categorias de variáveis), utiliza-se o seguinte
procedimento:
Analyze → Reports → OLAP Cubes...
OLAP: Online Analytical Processing.
Figura 10
• Ainda, pode-se seleccionar diferentes medidas estatísticas,
clicando no Statistics.
Figura 11
22
8.3 Medidas Estatísticas (Statistics)
8.3.1 Descritivas (Descriptives statistics)
¾ O SPSS apresenta as medidas:
Localização Localização/Posição
(Tendência não Central) (Tendência Central)
Figura 12 – Estatísticas Descritiva

Assimetria e
Achatamento/Curtose
Dispersão
(ou variabilidade)
¾ Podem ser obtidas de 2 formas:
Analyze → Descriptive Statistics → Frequencies → Statistics

Ou
Analyze → Descriptive Statistics → Descriptive → Options
23
¾ Medidas de Tendência Central
Mean (Media) – medida de tendência central mais utilizada,

sendo definida como o resultado da divisão da
soma de todos os valores observados pelo número
total de observações.
Median (Mediana) – valor central (meio) de uma

distribuição; divide a distribuição em 2 partes
iguais, tendo assim, 50% dos dados à sua direita
como à sua esquerda.
Mode (Moda) - valor que ocorre com maior frequência

numa distribuição. Ela pode não existir e, quando
existe, pode não ser única.
¾ Medidas de Tendência não Central (ou de ordem)
Quartiles (Quartis) – são 3 pontos (Q1, Q2 e Q3) que dividem

um conjunto de dados em 4 partes iguais: o Q1 (1º
Quartil) é precedido de 25% dos valores e sucedido
por 75%; o Q2 tem abaixo de si 50% dos valores e
acima de si também 50% e, por esta razão, coincide
com a Mediana; o Q3 é antecedido de 75% dos valores
e seguido por 25% dos mesmos.
Cut points for n equal groups – definem outros

separadores: Decis (dividem em 10 partes iguais: D1,
D2,...., D9), Percentis/centis (dividem em 100 partes
iguais: P1, P2 ,....,P99), ....
Percentile(s): permitem especificar o percentil pretendido,

(por exemplo, 67º, 15º, ....)
¾ Medidas de Dispersão (ou variabilidade)
24
Std deviation (Desvio Padrão) – mais importante medida de
dispersão, sendo definida como a raiz quadrada da
variância.
Variance (Variância) – média dos quadrados dos desvios de
cada valor em relação à sua média. Contudo, a sua
utilização como medida descritiva ocasiona alguma
dificuldade (sobretudo de interpretação) visto que se
trata, por definição, de uma média quadrática, não
possuindo a mesma unidade de medida dos dados
originais.
Range (amplitude do intervalo de variação) – diferença entre

os valores máximo e mínimo do conjunto de dados.
Mínino (Minimum) – valor mínimo de uma distribuição.
Máximo (Maximum) – Valor máximo de uma distribuição.
S.E. Mean (Estimativa do Erro amostral) – quociente entre o

desvio padrão e a raiz quadrada da dimensão da
amostra. Indica a variabilidade da média aritmética
entre amostras tiradas da mesma população. Esta
medida permite a construção dos intervalos de confiança
sobre o valor da média da população.
Intervalo Interquartil (Interquartile Range): Q3 - Q1.
¾ Medidas de Assimetria
A medida de assimetria utilizada pelo SPSS é dada pelo

quociente entre o Skewness e o seu Std Error. O resultado
desse quociente deve ser analisado da seguinte forma:
Assimétrica Não rejeitar a Assimetria

negativa simetria positiva
< -2 -2 0 +2 > +2
¾ Medidas de Achatamento (ou curtose)
A divisão do Kurtosis pelo seu Std Error dá o coeficiente de

achatamento (k). Quanto à forma de achatamento, uma
25
distribuição pode ser Mesocúrtica (k igual a 0), Platicurtica
(k menor que -2) e Leptocúrtica (k maior que +2).
Exemplo 4. Considere o seguinte output.
Statistics
IDADE
Valid 50
N
Missing 0
Mean 12,78
Std. Error of Mean ,25
Median 13,00
Mode 14
Std. Deviation 1,80
Variance 3,24
Skewness -,554
Std. Error of Skewness ,337
Kurtosis -1,093
Std. Error of Kurtosis ,662
Range 5
Minimum 10
Maximum 15
Sum 639
25 10,75
Percentiles 50 13,00
75 14,00
IDADE
Valid Cumulative
Frequency Percent Percent Percent
10 12 24,0 24,0 24,0
11 1 2,0 2,0 26,0
12 3 6,0 6,0 32,0
Valid 13 12 24,0 24,0 56,0
14 14 28,0 28,0 84,0
15 8 16,0 16,0 100,0
Total 50 100,0 100,0
26
Interpretação:
¾ A idade média dos inquiridos é de 12,78 anos (Mean).

¾ A mediana ou precentil 50 indica que metade dos alunos tem até 13
anos. Na tabela de frequência, a mediana é a idade que acumula até si
metade (50%) das observações, isto é, a idade que corresponde ao
Cumulative Percent imediatamente superior a 50 (13 ⇔ Cumulative
Percent=56,0), (Median).
¾ O quociente entre o desvio padrão (1,80) e a raiz quadrada da
dimensão da amostra (n=50) é 0,25. Significa que a variação entre a
média calculada (12,78) e a média de outras amostra aleatórias de
igual dimensão é de 0,25 anos (Std Error Mean).
¾ A maioria dos alunos tem 14 anos (Mode).
¾ A variância é de 3,24. O desvio padrão igual a 1,80 denota uma baixa
dispersão (coef.variação, 1,80/12,78=14%). Quanto menos dispersos
estiverem os valores da variável idade relativamente à média, menor
será o desvio padrão, e vice versa (Variance e Std Deviation).
¾ O coeficiente de skewness é de –0.554 e o seu Std Error (estimativa do
erro) é de 0.337. O quociente entre estes dois valores é igual a –1.64.
Como o resultado é negativo e menor que 2, pode-se concluir que a
distribuição é assimétrica negativa. Na prática, faz-se a diferença da
média e da moda e divide-se pelo desvio padrão. Neste caso, esta
diferença é negativa, - 0.68, e a conclusão é a mesma.
¾ Kurtosis/Std Error Kurtosis=-1,65. Como é menor que –2, diz-se que
a distribuição é Platicúrtica (mais achatada do que a normal).
¾ As idades variam entre os 10 (Mínimo) e os 15 (Máximo), sendo a
amplitude do intervalo de variação de 5 anos (Range).
¾ A soma de todas idades é de 639 (Sum).
¾ Percentil 75: Significa que 75% dos inquiridos têm até 14 anos.
27
Distribuição normal
¾ O SPSS apresenta o histograma com a distribuição normal

sobreposta.
¾ Recorda-se que a distribuição normal é:
¾ Teórica, contínua, simétrica e mesocúrtica;
¾ Tem a forma de um sino e é definida com base em dois
parâmetros: média e desvio padrão.
¾ O ponto máximo da distribuição é a média.
¾ Analyze → Descriptive Statistics → Frequencies → Chart
Figura 13 – Histograma com normal sobreposta
¾ Veja o Output:
IDADE
16
14
12
10
4
Frequency
Std. Dev = 1,80

2
Mean = 12,8
0 N = 50,00
10,0 11,0 12,0 13,0 14,0 15,0
IDADE
Figura 14 – Histograma com normal sobreposta
O histograma acima com ajustamento à distribuição normal tem o

aspecto onde sobressai o enviesamento da amostra para a direita em
28
relação à distribuição teórica, bem como um achatamento um
maior que o que seria de esperar.
¾ Opção Explore - calcula as estatísticas, e elabora o gráfico
caule-e-folhas e o gráfico de extremos-e-quartis, muito útil
para analisar a amostra em termos de concentração ou
dispersão dos valores por intervalos quartílicos, bem como a
sua simetria; além disso, é uma boa ferramenta de verificar
se há observações “outliers”, isto é, observações extremas
que se afastam muito da média dos valores da amostra.
Analyze → Descriptive Statistics → Explore
Selecciona-se a variável a analisar (idade), tal como descrito

atrás. De seguida, seleccionar o botão, Statistics.
Figura 15
Faça Continue para voltar ao Explore. Escolha, de seguida a

opção Plots. Seleccione histograma.
Faça Ok e analise o Output.
Figura 16
29
¾ Faça Explore, utilizando o Factor List para a variável Sexo.
Teste de Normalidade
¾ Testa a hipótese de que os dados da amostra estão

normalmente distribuídos.
¾ Analyze → Descriptives statistics → Explore → Plots
Figura 17
A tabela Teste de Normalidade (Tests of Normality) mostra os

resultados do Teste de Kolmogorov Smirnov (K-S). Se a
amostra tiver menos de 50 casos o SPSS também calcula o teste
de Shapiro-Wilk.
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
IDADE ,229 50 ,000 ,824 50 ,010**
**. This is an upper bound of the true significance.
a. Lilliefors Significance Correction
. Um baixo valor de significância (é geralmente considerado

baixo se Sig. < 0.05) indica que a distribuição dos dados difere
significativamente de uma distribuição normal.
30
Intervalos de Confiança sobre a média (IC μ)
Média: 12,78 com o Std Error = 0,25
¾ Níveis: Confiança de 95% ⇒ Significância (risco) de 5%
Figura 18
Resultado: IC95% μ = ] 12,27 ; 13; 29[
Significado: Existe uma probabilidade de 95% para que o valor

desconhecido da média da população pertença ao intervalo
]12,27 ; 13; 29[. Ou seja, com 95% de confiança, a verdadeira
média da população deverá pertencer ao intervalo de 12,27 a
13,29.
Este intervalo de confiança só tem interesse se os valores em

causa são de uma amostra seleccionada aleatoriamente de uma
população mais vasta.
¾ Níveis: Confiança de 99% ⇒ Significância (risco) de 1%
Figura 19
31
Resultado: IC99% μ = ] 12,10 ; 13; 46[
Conclusão: Diminuindo o nível de significância (risco)

implica um aumento do intervalo de confiança.
8.3.2 Análise Inferencial
8.3.2.1 Análise Bivariada: Cruzamentos e Medidas de

Associação (Crosstabs)
"p" (nível de) significância estatística (Asymp. Sig.). – Prob.
Geralmente, em ciências sociais, quando estas probabilidades

(Asymp. Sig.) são inferiores a 5%, ou seja, há menos de 5
possibilidades em 100 de suceder um determinado resultado,
considera-se que são estatisticamente significativas.
Variável Qualitativa – Nominal
Independência Estatística – utiliza-se normalmente o Teste de

Qui-Quadrado de Pearson, χ2.
As hipóteses do Teste de Qui-Quadrado são:
H0 (Hip. Nula): As variáveis turma e sexo são independentes.

Ha (Hip. Alternativa): As variáveis turma e sexo são dependentes
(existe uma relação entre as 2 variáveis).
¾ Analyze → Descriptive Statistics → Crosstabs → Statistics
32
Figura 20
Resultado:
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 36,883a 2 ,000
Continuity Correction
Likelihood Ratio 40,291 2 ,000
Linear-by-Linear
Association
N of Valid Cases 50
a. 2 cells (33,3%) have expected count less than 5. The
minimum expected count is 3,90.
Conclusão:
Como o nível de significância do teste de Qui-Quadrado é de 0,000,

valor inferior a 0,05 (5% de signficância fixada), rejeita-se a
hipótese de serem independentes (H0), ou seja, há
evidência/significância estatística para aceitar a hipótese alternativa
de que são dependentes (existe relação entre 2 variáveis).
Portanto, pode-se inferir a relação de dependência observada na

amostra para o universo/população em estudo.
33
Medidas de Associação – baseadas no Teste de Qui-Quadrado
Symmetric Measures d
Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Phi ,859 ,000
Nominal by Nominal Cramer's V ,859 ,000
Contingency Coefficient ,652 ,000
Kendall's tau-b -,117 ,132 -,893 ,372
Ordinal by Ordinal Kendall's tau-c -,122 ,136 -,893 ,372
Gamma -,162 ,179 -,893 ,372
Measure of Agreement Kappa ,c
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values
of the first variable match the values of the second variable.
d. Correlation statistics are available for numeric data only.
Significado: Todos esses testes indicam que existe uma

associação forte entre as duas variáveis devido aos seus altos
valores. O teste Phi só se aplica para tabelas 2 x 2.
Variáveis Quantitativas
Coeficiente de Correlação de Pearson – aplica-se às variáveis

quantitativas. Varia entre –1 (negativa) e 1 (positiva).
Quanto mais próximo estiver dos valores extremos maior e a

associação linear.
Associação ou Correlação Negativa: variação entre as variáveis

for em sentido contrário (aumento de uma
variável está associada à diminuição de outra).
Associação ou Correlação Positiva : variação entre as variáveis

for no mesmo sentido.
¾ Analyze → Correlate → Bivariate → variáveis
34
Figura 21
Variáveis Ordinais
Coeficiente de Spearman – utiliza-se para as variáveis ordinais.
8.3.2.2 Regressão (Regression)

Modelo estatístico usado para prever o comportamento de uma
variável contínua (variável dependente ou Y) a partir de uma
ou mais variáveis (var. independentes ou X).
Modelo de Regressão Linear Simples (MRLS): Quando existe
apenas uma variável independente.
Modelo de Regressão Linear Múltipla (MRLS): Quando existe

mais do que uma variável independente.
Modelo de Regressão Linear Simples (MRLS): permite encontrar a

recta que melhor representa a relação entre 2 variáveis (X e Y).
35
Y = aX + b,
em que, Y: var. dependente/explicada
X: var. independente/explicativa
a: declive ou inclinação
b: ordenada na origem (CONSTANT)
Para proceder ao cálculo da equação da recta de regressão
linear, deve executar o seguinte procedimento:
¾ Analyze → Regression → Linear
Figura 22
Resultado da regressão linear

Coefficientsa
Standardi
zed
Unstandardized Coefficient
Coefficients s
Model B Std. Error Beta t Sig.
(Constant) ,238 ,276 ,864 ,413
1
ALTURAP ,858 ,154 ,892 5,574 ,001
a. Dependent Variable: ALTURAF
Declive Ordenada na origem

0.01<0.05 ....
Figura 23
H0 é rejeitada para o nível
de significância de 5%
36
Equação da recta ⇒ ALTURAF = 0.858ALTURAP + 0,238
Interpretação:
a = 0,858 - Por cada aumento de uma unidade na

altura dos País (X) implica um aumento de 0.858 na
altura dos Filhos (Y). O valor positivo indica de que a
recta cresce da esquerda para a direita. Se o declive
fosse negativo, a recta decresceria da esquerda para a
direita.
b = 0,238 – Para ALTURAP=0 ⇒ ALTURAF=0,238.
Método utilizado: Mínimos Quadrados (MMQ).
Exercício:
Se um Pai tiver 1,95 m de altura, a altura do Filho

será 1,91, aproximadamente.
Coeficiente de determinação (R2 e R2 Ajustado) – indica a

qualidade do ajustamento da recta estimada aos dados.
Model Summaryb
Std. Error
Adjusted of the
Model R R Square R Square Estimate
1 ,892a ,795 ,770 4,638E-02
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF
Coeficiente de correlação
Coeficiente de determinação
Cerca de 80% (79,5%) da variação da variável dependente

(ALTURAF) em torno da sua média é explicada pela
regressão, ou seja, o modelo explica 80%. Portanto, considera-
se um bom ajustamento.
37
Teste T – testa a hipótese dos parâmetros, individualmente,
serem nulos.
Como o Sig.do Teste T é de 0,01, valor inferior a 0.05 (5%), pode-se

concluir que a variável ALTURAP é diferente de zero, isto é, esta
variável é estatisticamente significativa. Entretanto, a conclusão não
é a mesma para a CONSTANT.
Teste F – valida, em termos globais o modelo, e não cada um

dos parâmetros isoladamente.
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
Regression 6,683E-02 1 6,683E-02 31,072 ,001a
1 Residual 1,721E-02 8 2,151E-03
Total 8,404E-02 9
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF
Como o Sig.do Teste F é de 0,01, valor inferior a 5%, pode-se

concluir que o modelo é adequado para descreve esta relação, ou
seja, o modelo é estatisticamente significativo.
Diagrama de Dispersão (ou de pontos)
I. Graphs → Scatter → Simple → Define

II. Escolha as variáveis dependente e independentes
III. Label Cases by → colocar o nome da variável que

identifique os pontos nos gráficos. Seleccione Options e
active Display chart with case labels.
38
Figura 24
Resultado: Utilizando o ajustamento da recta.

2,0
Elmano, Pedro
1,9
Antonio, Joao
El ton, Elio
Mapa, Melo
1,8 Leao, Santos
Pedr o, Jorge
Tavares, Silva
1,7 Li to, Silva

Montei ro, Pina
ALT URAF
Borges, Elzo
1,6
1,6 1,7 1,8 1,9 2,0
ALTURAP
Figura 25
39
Tabela 2 - Procedimentos de estatística: descritiva, inferencial e
multivariada disponíveis pelo SPSS.
Analyze Sub-comandos Função
Summarize
Descriptives Frequencies Calcula a tabela de distribuição de
statistics frequências.
Descriptives Calcula as principais estatísticas
descritivas.
Explore Faz uma análise completa das
variáveis, podendo ainda repetir
essas análises por outra variável.
Crosstabs Calcula a tabela de distribuição de
frequências cruzadas, calcula o
teste Qui-quadrado e o Coeficiente
de Pearson para associação de
variáveis e outros testes.
List cases Lista casos escolhendo as
variáveis desejadas
Report Summaries Organiza relatórios em linhas,
in Rows segundo uma variável
Compare Means Calcula a média, o desvio padrão,
means soma, etc. das variáveis desejadas.
Independent– Calcula o teste de diferença de
sampled T-test duas médias de populações
independentes
Paired-sampled T- Calcula o teste de diferença de
test duas médias de populações
emparelhadas.
One-Way ANOVA Testa a diferença de médias de
mais de duas amostras
ANOVA Simple factorial Testa a diferença de médias do
models modelo fatorial
General factorial Testa a diferença de médias do
modelo geral
Multivariate Calcula o teste de análise de
variância multivariada
Correlate Bivariate Calcula a matriz de correlação,
tomando as variáveis de duas em
Partial duas.
Distances Calcula o coeficiente de correlação
40
parcial.
Calcula a distância euclidiana entre
os casos.
Regression Linear Ajusta o modelo de regressão
Logistic linear
Probit Ajusta o modelo de regressão
Nonlinear logística
Ajusta o modelo Probit
Ajusta um modelo não linear
Loglinear General
Hierarchical
Logit
Classify K-means cluster Análise de clusters
Hierarchical Análise de clusters hierárquicos
clusters Análise discriminante
Discriminant
Data Factor Análise factorial
Reduction
Scale Reliabity analysis Análise de confiabilidade
Multidimensional
Scaling
Non Chi-square Testes não paramétricos ou de
Parametric Binomial distribuição livre
Test Runs
1-Sample K-S
2-Independent
Samples
k-Independent
Samples
2-Related Samples
K-Related Samples
Survival Análise de sobrevivência
Multiple Análise de respostas múltiplas
response
Obs: As versões mais recentes do SPSS (11.0) apresentam mais

procedimentos estatísticos.
41
9. Análise de gráficos (GRAPHS)
A representação gráfica é uma das possibilidades de análise de dados

sob uma forma ilustrada, produzindo uma visão mais clara e imediata
dos resultados.
• SPSS oferece vários tipos de gráficos:
Graphs Função Tipo de variáveis
Bar Gráfico de barra Qualitativas, discretas de poucos

valores
Line De linha Séries de tempo
Area De área Série de tempo
Pie Circular Qualitativas
Boxplot Da caixa Quantitativas
Scatter De dispersão Relação entre duas variáveis
quantitativas, podendo colorir
segundo outra variável
Histogram Histograma Quantitativa (de preferência
contínua). Tem a opção de
desenhar a curva normal
superposta ao histograma
42

Guia Pratico de SPSS

Uploaded by

Document Information

Original Description:

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Guia Pratico de SPSS

Uploaded by

Copyright:

Available Formats

6. Criação de ficheiro de dados

8. Análise estatística de dados

10. Ajuda - Utilização do tutorial

1.2 Requisitos básicos:

¾ Universidade de Londres nos anos 60. Tornou-se

Além do SPSS, foram desenvolvidos na década de 60

¾ SAS (Statistic Analysis System): foi desenvolvido na

¾ "BMD" (Biomedical Computer Programs):

¾ EPINFO: foi desenvolvido sob os auspícios da ONU,

Alguns endereços estatísticos:

♦ www.statsoft.com — é o site de um pacote

♦ www.ats.ucla.edu/stat/ — é o site sobre

¾ Uma das muitas aplicações para o tratamento

¾ Um software útil para gerir e analisar

Há oito tipos de janelas/windows no SPSS:

Figura 1 – Lista de janelas do SPSS.

Figura 2 – Janela de edição de dados

Folha de edição de dados

Modo de visualização e definição das variáveis.

Figura 3 – Janela de visualização de resultados.

Draft Viewer – Os resultados podem ser apresentados em forma de

Pivot Table Editor – permite editar e modificar tabelas (editor da

Figura 4 - Janela de edição de gráficos.

Syntax Editor – Todos os comandos emitidos a partir dos menus

Script Editor – Janela de programação que permite personalizar e

Tabela 1 – Menu da Janela de dados

Criar, abrir, ler, gravar ou imprimir ficheiros.

6.1 Introdução de dados

¾ Muitas das características da Janela do Data Editor do

¾ As colunas correspondem às variáveis (ou campos). E as

¾ As células podem apenas conter valor (numéricos e não

¾ O primeiro caracter deve ser uma letra; os restantes

¾ Deve indicar o tipo da variável: numérico, textos/não

Editor de Célula Célula activa

Figura 5 – Introdução de dados

1. Guarde o ficheiro: File → Save → nomeficheiro (osvaldo.sav)

9. Seleccione as variáveis sexo, idade, ano e turma e

Figura 6 – Selecção de variáveis

10. Cruze as variáveis ano e sexo.

Obs: Este resultado foi obtido para 10 casos/indivíduos.

Data → Split File → Organize output by groups

Figura 7 – Divisão de ficheiro

A seguir, cruze as variáveis ano e sexo.

¾ Para anular o Split File, deve fazer:

Data → Split File → Analyze all cases, do not create groups

12. Seleccione apenas os alunos do sexo feminino.

¾ Select Cases: Selecciona determinados casos.

Data → Select Cases → if condition, is satisfied

Transform Função Como accionar e os subcomandos

Compute Calcula uma nova Colocar o nome da nova variável

Automatic recode Cria uma nova variável com o mesmo conteúdo da

O SPSS dispõe de procedimentos de importação de ficheiros criados

IMPORTAÇÃO DE FICHEIROS DE EXCEL

Figura 9 – Tipos de ficheiros

Nesta janela deve:

¾ Procurar a pasta onde se encontra o ficheiro;

Aparece de seguida uma caixa de diálogo, onde se especifica se as

Por último, o SPSS cria um ficheiro com tantas variáveis quantas as

¾ O SPSS apresenta um conjunto de funções e

8.1 Tabelas de Frequência

Considere o seguinte exemplo:

¾ Dezoito (18) alunos frequentam o 7º ano de escolaridade. Ou

¾ Há 64% de inquiridos estudam o 1º ciclo do ensino