You are on page 1of 59

APOSTILA DE SPSS

Autor: Yury Vasconcellos1

Juiz de Fora MG Novembro de 2008


1

Especializao em Mtodos Estatsticos Computacionais (ICE/UFJF) e Graduao em Administrao (FEA/UFJF) Professor Assistente do Centro de Ensino Superior Juiz de Fora-MG (CES/JF).

NDICE

PARTE II Mtodos de anlise utilizando o SPSS ................................................. 3 1. Introduo ao SPSS ............................................................................................. 3 1.1. Apresentao do software .............................................................................. 3 1.2. Configurando as variveis .............................................................................. 5 2. Anlise descritiva utilizando SPSS .................................................................... 9 2.1. Tabelas de Freqncias ............................................................................... 11 2.2. Grficos Bsicos ........................................................................................... 13 2.3. Medidas Estatsticas ..................................................................................... 17 3. Manipulao de dados....................................................................................... 21 3.1. Comparando Grupos (comando split file) ..................................................... 22 3.2. Selecionando Casos (comando select case) ................................................ 24 3.3. Recodificando Variveis (comando recode) ................................................. 26 3.4. Calculando Variveis (comando compute) ................................................... 32 3.5. Ordem crescente ou decrescente (comando sort) ........................................ 34 4. Tabela de Contingncia ..................................................................................... 34 4.1. Tabulao Cruzada....................................................................................... 34 4.2. Anlise por linha, coluna e total .................................................................... 36 5. Estimao de Parmetros ................................................................................. 38 5.1. Construindo intervalo de confiana de uma mdia populacional .................. 38 6. Teste de hiptese ............................................................................................... 39 7. TESTE DE ADERNCIA ..................................................................................... 41 8. TESTE DE INDEPENDNCIA ............................................................................. 44 9. COMPARAO DE MDIAS DE DUAS AMOSTRAS ....................................... 51 9.1. Teste de amostras emparelhadas ou pareadas ............................................ 51 9.2. Amostras Independentes .............................................................................. 55

PARTE II MTODOS DE ANLISE UTILIZANDO O SPSS 1. INTRODUO AO SPSS O objetivo dessa etapa do curso oferecer condies ao pesquisador de realizar procedimentos estatsticos para anlise descritiva de um conjunto de dados, tais como elaborao de medidas descritivas, de tabelas de freqncias, tabulao cruzada e grficos bsicos utilizando o SPSS. Alm disso, ser introduzido, de forma bsica, alguns conceitos de teste de inferncia estatstica, tais como: teste de aderncia e teste de independncia. Atualmente, com a popularizao dos computadores pessoais encontram-se disponveis no mercado diversos pacotes estatsticos que auxiliam na anlise e tabulao dos dados de uma pesquisa. Entre eles podemos destacar os mais difundidos; SPSS, Minitab, Excel, SAS, Bioestat entre outros. O SPSS (Statistical Package for the Social Sciences) o mais utilizado para pesquisa de marketing; isso se d no s pela qualidade dos resultados que apresenta, mas principalmente pela facilidade de operao devido a sua interface grfica de fcil acesso e que disponibiliza vrias ferramentas para manipulao dos dados e botes de atalho. O SPSS um programa extremamente robusto, capaz de auxiliar nas tarefas mais simples de uma pesquisa, tais como montagem de tabelas de freqncias e de grficos de barras, at tarefas mais complexas, como as anlise multivariadas, anlise de regresso mltipla, anlise de cluster, anlise fatorial, entre outras. 1.1. Apresentao do software Ao iniciar o programa SPSS aparecer uma janela com o seguinte questionamento: What would you like to do? (O que voc gostaria de fazer?)

FIGURA 1 Caixa de dilogo de abertura do programa Fonte: SPSS v. 15.0 trial Sero disponibilizadas cinco opes de comando, sendo que as mais usadas so Open na existing data source (abrir uma fonte de dados j existente) ou Type in data (digitar dados - abrir um base de dados nova). Selecionar uma das duas opes e clicar OK para executar a ao. No canto inferior esquerdo da tela do SPSS estaro disponveis duas abas, a primeira ser o local em que devero ser lanados os dados (digitados), denominada de data view (visualizao dos dados). A segunda aba dever ser utilizada para configurar as variveis da pesquisa denominada de Variable view (Visualizao das Variveis). A Figura 2 explica de forma geral a tela do data view. Nesta tela, as colunas sero as variveis da pesquisa como, por exemplo, nome, peso, altura, sexo entre outros. As linhas sero os casos ou registros obtidos de cada questionrio, ou seja, ao aplicar 600 questionrios devero ser preenchidas 600 linhas no data view.

FIGURA 2 Tela do data view Fonte: SPSS v. 15.0 - trial

1.2. Configurando as variveis A configurao do SPSS para receber os dados de sua pesquisa tambm comumente chamada de montagem da mascara de dados e est realizada a partir do comando localizado na aba do variable view. Nesta aba, as linhas sero as variveis, as colunas mostraro as opes de configurao de cada varivel, conforme demonstrado na Figura 3.

FIGURA 3 Tela do variable view Fonte: SPSS v. 15.0 - trial Entre as opes de configurao para cada varivel teremos os seguintes itens: name (apelido), type (tipo de entrada de dados), width (nmero mximo de caracteres), decimals (nmero de casas decimais), label (significado da varivel ou ttulo da varivel), value (codificao da varivel), missing (valores invlidos), columns (tamanho da coluna), align (alinhamento) e mensure (nvel de mensurao dos dados) que so definidos como: Name (apelido): neste campo dever conter um apelido da varivel em questo ou um cdigo que possa lembr-lo facilmente do significado daquela varivel, sendo que no possvel utilizao de caracteres especiais e nem espao. Quando trata-se de questionrio com vrias questes aconselhvel a utilizao do nmero da pergunta como name, por exemplo p01, p02, p03, etc., este procedimento facilitar o manuseio de comandos do tipo sintaxe. Vale lembrar que o primeiro caractere do name no poder ser um nmero. 6

Type (tipo de entrada de dados): Neste campo ser informado ao sistema como ser a entrada de dados da varivel. Conforme apresentado na Figura 4, existem vrias maneiras de como os dados podem ser digitados no sistema, porm sero enfatizadas as duas mais utilizadas, numeric (entrada de dados atravs de nmeros) e string (entrada de dados atravs de texto).

FIGURA 4 Caixa de dilogo de Variable Type Fonte: SPSS v. 15.0 - trial O SPSS no trabalha muito bem com variveis string, portanto sempre que possvel a varivel dever ser codificada, ou seja, atribuir um cdigo, normalmente um nmero, varivel. Assim, ao invs do pesquisador digitar o sexo masculino ou feminino de um entrevistado para identific-lo, dar-se- preferncia por sua codifcao, conforme apresentado a seguir: 1 = masculino 2 = feminino

Desta forma, para inserir a palavra masculino no sistema, basta digitar o nmero 1. Neste caso, a entrada de dados numrica, mesmo a varivel sendo qualitativa, portanto deve ser configurada como numeric em type J as variveis string sero utilizadas nos casos em que de interesse do pesquisador escrever textos no banco de dados, como por exemplo, o nome de uma pessoa ou transcrever as respostas abertas de um questionrio, entre outros. Width (nmero mximo de caracteres): Neste campo ser restringido o nmero mximo de caracteres que poder ser digitado no campo. Decimals (nmero de casas decimais): nmero mximo de casas decimais no campo. 7

Label (significado da varivel ou ttulo da varivel): Neste campo ser descrito o que significa a varivel ou o ttulo da varivel. O que estiver escrito neste campo utilizado pelo SPSS como ttulo da varivel na construo de tabelas e grficos. Value (codificao da varivel): Neste campo ser codificado as variveis qualitativas para as quais sero atribudos um nmero para cada categoria de resposta. aconselhvel tambm atribuir nmero para situaes como em branco (no respondeu a pergunta) e nulo (marcou mais de uma opo de resposta).

FIGURA 5 Caixa de dilogo de value labels Fonte: SPSS v. 15.0 - trial

Missing (valores invlidos): Neste campo dever ser informado ao sistema quais foram os cdigos atribudos no value (codificao da varivel) correspondente a categorias invlidas, tais como: em branco (no respondeu a pergunta) e nulo (marcou mais de uma opo de resposta). Conforme demonstrado a seguir, h como nomear at 3 cdigos especficos que sero considerados invlidos pelo sistema ou at mesmo especificar um intervalo de valores que sero considerados como missing (valores invlidos):

FIGURA 6 Caixa de dilogo missing values Fonte: SPSS v. 15.0 - trial Columns (tamanho da coluna): Neste campo especificar o tamanho da coluna da varivel no data view. Align (alinhamento): Neste campo dever ser configurado o alinhamento do texto dentro das clulas daquela varivel. O alinhamento poder ser left (esquerdo), center (centralizado) e right (direito). Mensuare (nvel de mensurao): Neste campo dever ser especificado o nvel de mensurao da varivel. Existem quatro nveis de mensurao que so apresentadas em dois grupos: 1) Variveis qualitativas: nominais e ordinais e 2) Variveis qualitativas: razo e intervalar. O SPSS trata o nvel intervalar e de razo da mesma forma, portanto, denomina ambos de nvel de mensurao escalar (scale). Quanto aos nveis nominais e ordinais no houve alterao pelo SPSS, permanecendo nominal e ordinal.

2. ANLISE DESCRITIVA UTILIZANDO SPSS As ferramentas contidas neste captulo so as mais utilizadas em pesquisa de marketing, pois so as mais bsicas, tais como, elaborao de medidas estatsticas, tabelas de freqncia e grficos. As principais ferramentas da estatstica descritiva encontram-se no SPSS no menu Analyze> Descriptive statistics > Frequencies , conforme apresentado na Figura 7, a seguir.

FIGURA 7 Caixa de dilogo caminho para estatstica descritiva Fonte: SPSS v. 15.0 - trial

Ao abrir a janela frequencies, conforme apresentado na Figura 8, aparecero duas caixas. Na caixa esquerda estar a lista de todas as variveis contidas em sua base de dados. quelas com as quais voc ir trabalhar naquele momento devero ser selecionadas e passadas para a caixa da direita. Desta forma, voc est escolhendo quais as variveis que sero analisadas naquele momento. Para passar uma varivel da caixa da esquerda para caixa da direita dever primeiramente selecionar a varivel desejada e clicar sobre o boto (localizado na regio central desta janela).

FIGURA 8 Caixa de dilogo Frequencies Fonte: SPSS v. 15.0 - trial 10

2.1. Tabelas de Freqncias Para elaborar as tabelas de freqncias referentes s variveis escolhidas deve-se verificar se o marcador com a seguinte frase: Display frenquency tables, localizado na parte inferior esquerda, conforme apresentado na Fugura 16, est ativo antes de clicar no boto OK. Se esse marcador estiver selecionado o SPSS ir gerar uma tabela de freqncia para cada uma das variveis que estiverem na caixa da direita, por outro lado, se este marcador no estiver ativo, o SPSS no far nenhuma tabela de freqncia.

FIGURA 9 - Caixa de dilogo Frequencies Fonte: SPSS v. 15.0 - trial

A seguir, a Figura 10 apresenta como o SPSS apresenta os dados, caso a opo seja uma tabela. Neste caso uma tabela de freqncia do SPSS onde as linhas listam as categorias vlidas, alm dos missing (valores invlidos), se houver. As colunas apresentam as freqncias de cada categoria senso que a primeira coluna demonstra a freqncia absoluta, ou seja, a freqncia observada de cada categoria. A segunda coluna demonstra o percentual de cada categoria, ou freqncia relativa. Caso seja de interesse do pesquisador ter o percentual de cada categoria, mas sem levar em considerao os missing (valores invlidos) poder observar a terceira coluna de dados. A quarta e ltima coluna de dados informar o percentual acumulado de cada categoria sem levar em considerao as categorias que so missing.

11

Sexo Frequency 263 201 464 12 476 Percent 55,3 42,2 97,5 2,5 100,0 Valid Percent 56,7 43,3 100,0 Cumulative Percent 56,7 100,0

Valid

Missing Total

Feminino Masculino Total Branco

FIGURA 10 - Tabela de freqncia do SPSS Fonte: SPSS v. 15.0 - trial

Se for de interesse do pesquisador mudar a aparncia da tabela, poder ser realizada atravs do menu: edit > options e posteriormente dever clicar na aba pivot tables conforme demonstrado na Figura 11, a seguir:

FIGURA 11 Caixa de dilogo Options Fonte: SPSS v. 15.0 - trial

A caixa tableLook lista diversos modelos de apresentao que o SPSS lhe fornece, basta, ento, selecionar aquele de convenincia do pesquisador e clicar em OK. importante ressaltar que uma tabela de freqncia adequada para variveis categricas (qualitativas), sendo que se houver a necessidade de 12

descrever uma varivel quantitativa atravs de uma tabela de freqncia, esta dever ser recodificada criando uma nova varivel categrica. Este processo ser explicado no comando recode.

2.2. Grficos Bsicos O SPSS traz um menu especfico para a criao de grfico, contendo os mais diversos tipos de grficos e para cada tipo traz inmeras variaes e opes de customizao. Aqui sero apresentadas as opes mais utilizadas. Na mesma janela que solicitada a tabela de freqncia possvel solicitar, ao mesmo tempo, grficos bsicos, tais como: de barras, de setores (pizza) e o histograma. Para tanto clique sobre o boto charts conforme apresentado na Figura 12 e, ento, escolha o(s) tipo (s) de grfico entre as opes apresentadas.

FIGURA 12 Caixa de dilogo frequencies: charts Fonte: SPSS v. 15.0 - trial

Caso a escolha recaia sobre o grfico de barras e ou de setores (pizza) voc poder, ainda, nesta mesma janela especificar se a escala que ser utilizada na apresentao do grfico ser em valores absolutos ou em percentual. Se a opo for de apresentar valores absolutos, marcar a opo frenquencies na caixa chart values, localizado na parte inferior desta caixa de dilogo. Se a opo for de apresentar o grfico com os valores em percentual deve-se marcar a opo percentages.

13

2.2.1. Grfico de Barras O grfico de barras utilizado para variveis categricas (qualitativas) e acionado marcando-se a opo bar charts. Para grfico de barras simples o SPSS trar todas as barras da mesma cor conforme apresentado na Figura 13.

FIGURA 13 Grfico de barras do SPSS Fonte: SPSS v. 15.0 - trial

FIGURA 14 Caixa de dilogo properties Fonte: SPSS v. 15.0 - trial

possvel mudar as cores de cada uma das barras dando um duplo click sobre o grfico. Dessa forma, o programa abrir uma nova janela, conforme 14

apresentado na Figura 14, que o Chart Editor. Nesta janela voc dever dar um click simples sobre a barra que tem interesse em alterar a cor a ponto dela ficar selecionada. Posteriormente, dever clicar com o boto direito do mouse sobre a barra selecionada e clicar sobre a opo properties windows. Selecione a aba Fill & Border e altere a cor em Fill para aquela desejada.

2.2.2. Grfico de Setores O grfico de setores (pizza) adequado para variveis categricas (qualitativas) com poucas categorias, cujo objetivo principal do grfico mostrar a proporo de cada categoria em relao ao todo. Para fazer o grfico de setores necessrio marcar a opo pie chart entre as opes apresentas na Figura 12.

FIGURA 35 Grfico de setores do SPSS Fonte: SPSS v. 15.0 - trial

O grfico de setores padro e gerado conforme apresentado na Figura 15, porm possvel fazer algumas modificaes. Dentre essas, pode-se destacar a possibilidade de exibir o valor da freqncia observada ou do percentual de cada categoria (fatia) do grfico e destacar uma categoria (fatia) em relao s demais. Para exibir o valor absoluto ou percentual de cada categoria necessrio dar um duplo click sobre o grfico no intuito de abrir o aplicativo Chart Editor e

15

posteriormente dar um click com o boto direito do mouse sobre o grfico selecionando a opo show data labels. Para destacar uma categoria (fatia) em relao ao grfico necessrio dar um duplo click sobre o grfico no intuito de abrir o aplicativo Chart Editor e posteriormente click com o boto direito do mouse sobre o grfico selecionando a opo explode slice.

2.2.3. Histograma

FIGURA 16 Histograma do SPSS Fonte: SPSS v. 15.0 - trial

O histograma, conforme apresentado na Figura 16, adequado para variveis quantitativas onde o eixo y ser referente freqncia e o eixo x ser referente aos valores da varivel. O SSPS disponibiliza outras informaes importantes junto com o histograma tais como: mean (mdia da amostra) e std. Dev. (desvio padro) e N (tamanho da amostra). O histograma muito til, pois facilmente ilustra como se d a distribuio dos dados e dependendo do tipo de distribuio tambm possvel classificar a 16

distribuio quanto a assimetria e curtose. A assimetria reflete se h uma concentrao de dados em torno da mdia ou se esta concentrao est abaixo ou acima da mesma. A curtose indica se os dados tm uma distribuio leptocrtica (alongada), mesocrtica (normal) ou platicrtica (achatada). No boto chart localizado na janela de frequencies, apresentada na Figura 12, possvel solicitar um histograma. Esse histograma pode vir junto com uma sobreposio de uma curva normal ou no. Esta sobreposio auxiliar o pesquisador a identificar se a distribuio dos dados possui ou no uma aparncia de distribuio normal. Para solicitar ao SPSS que inclua esta sobreposio ao elaborar um histograma deve-se marcar a opo with normal curve

2.3. Medidas Estatsticas Alm de tabelas de freqncias e grficos, atravs do SPSS, pode-se descrever um conjunto de dados quantitativos utilizando as seguintes medidas: tendncia central, posio, disperso e de distribuio. Todas medidas estatsticas abordadas nesta seo podem ser encontradas no menu Analyze > Descriptive statistics > Frequencies. Posteriormente, deve-se clicar sobre o boto statistics, conforme demonstrado na Figura 17.

FIGURA 17 Caixa de dilogo frequencies Fonte: SPSS v. 15.0 - trial

Aps selecionar a opo statistics aparecer a janela apresentada na Figura 18 Esta janela possui 4 quadrantes diferentes contendo as medidas de tendncia central, de posio, de disperso e de distribuio.

17

FIGURA 18 Caixa de dilogo frequencies: statistics Fonte: SPSS v. 15.0 - trial

2.3.1. Medidas de Tendncia Central As medidas de tendncias central so medidas estatsticas que calculam o valor que melhor representa um conjunto de dados. Entre as medidas mais usadas temos: mdia, mediana e moda. A mdia artitmtica uma das mais usadas medidas de tendncia central, porm, fortemente influenciada por valores extremos. Quando h valores extremos aconselhado o uso da mediana em detrimento da mdia aritmtica. J a moda uma medida de pouco uso, pois representa apenas o valor mais freqente de um conjunto de dados. Abaixo apresentam-se a traduo de cada medida de tendncia central: Mean = mdia Median = mediana Mode = moda Sum = soma

18

2.3.2. Medidas de Posio So valores de diviso de um conjunto de dados. A primeira opo que o SPSS oferece, conforme apresentado na Figura 20, so os Quartiles (quartis). Tratam-se de medidas de corte, e em nmero de trs, que dividem um conjunto de dados em 4 partes iguais e servem para verificar em que posio encontra-se um determinado resultado. O diagrama apresentado na Figura 19, ilustra a distribuio dos dados de um conjunto em ordem crescente.

FIGURA 19 Diviso do quartil Fonte: Elaborado pelo autor

Para obteno dos quatis deve clicar na primeira opo da janela caixa de dilogo frequencies: statistics, apresentada na Figura 20.

FIGURA 20 Caixa de dilogo frequencies: statistics Fonte: SPSS v. 15.0 - trial

Na segunda opo dessa caixa de dilogo, o SPSS oferece vrias opes de grupos de dados conforme sua escolha. Assim, possvel criar quais so as medidas de posio para que se divida o conjunto de dados em um nmero X de partes iguais. A terceira opo que o SPSS oferece a opo de criar medidas de posio especficas, atravs dos percentis. Para tanto deve-se marcar a opo percentile(s),

19

insira o nmero do percentil desejado no quadro ao lado e posteriormente click em Add para adicionar o percentil na lista de opes.

2.3.3. Medidas de Disperso So medidas que informam a variabilidade dos dados, entre elas temos: Std. Deviation = desvio padro da amostra Variance = varincia Range = amplitude Minimum = menor valor encontrado no conjunto de dados Maximum = maior valor encontrado no conjunto de dados S.E. mean = Erro padro da mdia

O desvio padro a medida de disperso mais utilizada no e trata-se de uma medida de variao dos dados em torno da mdia. A varincia o desvio padro ao quadrado e no h uma interpretao prtica no nosso dia-a-dia, pois a partir do momento que eleva o desvio padro ao quadrado a unidade de medida da varivel tambm elevada ao quadrado. Assim, no h uma interpretao prtica do que ela significa, mas trata-se de uma medida amplamente utilizada em clculos matemticos. A amplitude trata-se da diferena entre o maior valor encontrado e o menor valor encontrado no conjunto de dados. O erro padro da mdia a medida de variao entre todas as mdias de todas as amostras possveis de acordo com o tamanho da amostra.

2.3.4. Medidas de Distribuio So medidas que classificam um conjunto de dados quanto a sua forma. Esta classificao pode ser quanto assimetria e curtose. Um conjunto de dados pode ser classificado quanto a assimetria em assimtrico negativo, simtrico e assimtrico positivo, de acordo com a concentrao dos dados. Se o conjunto de dados tiver concentrao em valores altos, ou seja, a maior parte dos dados est acima da mdia, a assimetria negativa. Se o conjunto de dados tiver concentrao em valores baixos, ou seja, a maior parte dos dados 20

est abaixo da mdia, a assimetria positiva e se o conjunto de dados tiver concentrao em valores em torno da mdia os dados so simtricos. Para que essa interpretao no seja emprica tem-se o coeficiente de assimetria que auxilia na interpretao quanto a forma da distribuio dos dados. Se o coeficiente de assimetria (skewness) for maior que +1, pode-se dizer que a distribuio assimtrica positiva, se o coeficiente de assimetria (skewness) for menor que -1, pode-se dizer que a distribuio assimtrica negativa e se o coeficiente de assimetria (skewness) estiver entre -1 e +1, pode se dizer que os dados so simtricos, sendo que se for igual a 0 (zero), pode-se dizer que tem-se uma distribuio simtrica perfeita. Outra forma de classificao quanto a distribuio dos dados a curtose que indica o grau de achatamento de uma distribuio de dados. Pode-se ter uma distribuio leptocrtica (alongada), mesocrtica (normal) e platicrtica (achatada). Da mesma forma que assimetria h o coeficiente de curtose (Kurtosis) que indica a classificao dos dados quanto a curtose. Se o coeficiente de curtose (Kurtosis) for maior que +1, pode-se dizer que a distribuio leptocrtica (alongada), se o coeficiente de curtose (kurtosis) for menor que -1, pode-se dizer que a distribuio platicrtica (achatada) e se o coeficiente de curtose estiver entre -1 e +1, pode-se dizer que a distribuio mesocrtica (normal).

3. MANIPULAO DE DADOS Uma das principais vantagens do SPSS em relao aos outros softwares similares no mercado sua facilidade de manipulao dos dados atravs dos comandos que sero aprendidos nesta seo. Com esses comandos ser possvel criar novas variveis atravs de recodificao ou atravs de expresses numricas desenvolvidas pelo prprio pesquisador. Alm destes comandos h outros muito teis para anlise de dados, pois possvel isolar um determinado grupo de casos e analis-lo ou at mesmo comparar uma determinada caracterstica de um grupo de casos com outros grupos.

21

3.1. Comparando Grupos (comando split file) O comando split file, localizado no menu data, muito til para comparao de uma determinada caracterstica presente em todas as categorias de uma mesma varivel. Por exemplo, pode-se comparar a altura mdia (caracterstica) de um grupo de pessoas diferenciando-as pela varivel sexo masculino e feminino (categorias). Para utilizar essa rotina, aps a seleo do menu data > split file, teremos acesso tela apresentada na Figura 21.

FIGURA 21 Caixa de dilogo split file Fonte: SPSS v. 15.0 - trial

A primeira opo que a caixa de dilogo acima lhe fornece Analyze all cases, do not create groups, (analisar todos os casos, no criando grupos), ou seja, o SPSS analisar todos os casos se esta opo estiver ativa, no comparando entre grupos. A segunda opo compare groups (comparar por grupos) possibilita a comparao entre todas as categorias de uma varivel categrica (qualitativa). Assim que ativar esta opo o SPSS tornar ativo a caixa que lhe permitir selecionar a varivel categrica de interesse. A terceira opo organize output by groups (organizar sada de dados por grupos) far a comparao, porm de forma separada, ou seja, fornecer os dados de uma categoria e posteriormente da outra e assim sucessivamente. J na opo compare groups far a comparao utilizando a mesma tabela. 22

As figuras 22 e 23 demonstram as duas sadas que o SPSS pode lhe fornecer na utilizao do comando split file. A figura 22 demonstra as sadas do SPSS utilizando a opo organize output by groups, neste caso o SPSS faz uma tabela para cada categoria. A figura 30 demonstra a sada do SPSS utilizando a opo compare groups, neste caso o SPSS faz a comparao utilizando a mesma tabela.

FIGURA 22 Sadas do SPSS utilizando split file organize outpu by groups Fonte: SPSS v. 15.0 - trial

Statistics Idade do aluno? Branco N Mean Median Std. Deviation Minimum Maximum N Mean Median Std. Deviation Minimum Maximum N Mean Median Std. Deviation Minimum Maximum Valid Missing

Feminino

Valid Missing

Masculino

Valid Missing

9 3 11,22 8,00 5,805 6 21 261 2 18,55 19,00 5,585 8 43 198 3 18,73 18,50 7,165 8 49

FIGURA 23 Sadas do SPSS utilizando split file compare groups Fonte: SPSS v. 15.0 - trial 23

Verifica-se, ento, que, se o objetivo a comparao entre as categorias, a melhor forma de fazer atravs da opo compare groups. Para informar ao SPSS que no mais necessrio a comparao de grupos deve-se ir at o menu data > select case e marcar a opo analyze all case, do not create groups.

3.2. Selecionando Casos (comando select case) Se o objetivo no comparar grupos, e sim isolar um determinado grupo de casos, o comando adequado o select case. Este comando pode ser executado atravs do menu data > select case. Esta ao far aparecer a caixa de dilogo apresentada na Figura 24.

FIGURA 24 Caixa de dilogo select case Fonte: SPSS v. 15.0 - trial

Para isolar os casos de interesse deve-se selecionar a segunda opo if condition is satisfied (se as condies forem satisfeitas) e posteriormente clicar no boto if. Com isso, aparecer uma nova janela conforme apresentado na Figura 25, onde o usurio dever especificar quais as condies que o SPSS deve utilizar para selecionar os casos de interesse.

24

FIGURA 25 Caixa de dilogo select case: if Fonte: SPSS v. 15.0 - trial

Nesta janela utiliza-se o teclado para descrever a expresso numrica que o SPSS deve se basear para selecionar os casos de interesse do pesquisador. A Tabela 1 apresenta a aplicao de cada um desses botes.

TABELA 1 Aplicaes do teclado da caixa de dilogo do select case: if


Boto Significado Adio Multiplicao Menor que Menor ou igual a Igual a E (AB) interseo Potenciao Parnteses Boto Significado Subtrao Diviso Maior que Maior ou igual a Diferente de OU (AUB) - unio Negao (binria) Apagar

Fonte: Elaborado pelo autor

importante salientar que necessrio usar, no momento da montagem da expresso numrica, o mesmo cdigo atribudo a categoria desejada no variable view. Suponha que um pesquisador tem o interesse de selecionar apenas os casos do sexo masculino de um grupo de pessoas para posteriormente elaborar uma tabela ou um grfico. Para utilizar a ferramenta deve-se selecionar a varivel desejada (sexo) e pass-la para a caixa da direita atravs da seta , conforme 25

demonstrado na Figura 25. Posteriormente, deve-se clicar sobre o boto de igual e em seguida digitar o nmero que corresponde ao sexo masculino que foi atribudo a coluna value no variable view.

3.3. Recodificando Variveis (comando recode) Este um dos mais importantes e mais usuais comandos de manipulao de dados do SPSS. Com este comando ser possvel criar novas variveis atravs de variveis antigas. Pode-se, por exemplo, criar uma varivel qualitativa com base em uma quantitativa. Para explicao deste comando ser utilizado um caso prtico de criar uma varivel qualitativa com base em outra quantitativa. Neste exemplo, deseja-se criar uma tabela de freqncia do salrio de todos os funcionrios de uma companhia. Como dito anteriormente no adequado gerar tabelas de freqncias com variveis quantitativas, pois tais tabelas podem ficar muito grandes perdendo assim a capacidade de sntese da tabela, conforme apresentado na Figura 26.
Current Salary Frequency Valid $15,750 $15,900 $16,200 $16,350 $16,500 $16,650 $16,800 $16,950 $17,100 $17,250 $17,400 $17,700 $18,150 $18,450 $18,750 $19,200 $19,650 $19,800 $19,950 $20,100 $20,400 $20,550 $20,700 $20,850 $21,000 $21,150 $21,300 $21,450 $21,600 $21,750 $21,900 $22,050 $22,200 $22,350 $22,500 $22,650 $22,800 $22,950 $23,100 $23,250 $23,400 $23,550 $23,700 $23,850 $24,000 $24,150 $24,300 $24,450 $24,600 $24,750 $24,900 $25,050 $25,200 $25,350 $25,500 $25,650 $25,800 $25,950 $26,100 $26,250 $26,400 $26,550 $26,700 $26,850 $27,000 $27,150 $27,300 $27,450 $27,600 $27,750 $27,900 $28,050 $28,200 $28,350 $28,500 $28,650 $28,800 $28,950 $29,100 $29,160 $29,250 $29,340 $29,400 $29,550 $29,700 $29,850 $30,000 $30,150 $30,270 $30,300 $30,450 $30,600 $30,750 $30,900 $31,050 $31,200 $31,350 $31,500 $31,650 $31,950 $32,100 $32,400 $32,550 $32,850 $33,000 $33,150 1 1 3 1 1 1 1 3 2 1 2 1 2 1 1 2 6 1 2 2 3 1 2 5 2 2 4 3 3 3 5 4 3 6 7 2 2 4 4 2 4 2 2 2 8 4 4 8 2 4 1 4 5 2 4 2 2 4 2 7 4 5 7 2 3 2 5 5 2 7 4 3 1 3 6 1 2 1 5 1 2 1 5 1 1 4 5 2 1 4 1 3 13 3 1 3 3 3 4 4 1 1 3 1 1 1 Percent ,2 ,2 ,6 ,2 ,2 ,2 ,2 ,6 ,4 ,2 ,4 ,2 ,4 ,2 ,2 ,4 1,3 ,2 ,4 ,4 ,6 ,2 ,4 1,1 ,4 ,4 ,8 ,6 ,6 ,6 1,1 ,8 ,6 1,3 1,5 ,4 ,4 ,8 ,8 ,4 ,8 ,4 ,4 ,4 1,7 ,8 ,8 1,7 ,4 ,8 ,2 ,8 1,1 ,4 ,8 ,4 ,4 ,8 ,4 1,5 ,8 1,1 1,5 ,4 ,6 ,4 1,1 1,1 ,4 1,5 ,8 ,6 ,2 ,6 1,3 ,2 ,4 ,2 1,1 ,2 ,4 ,2 1,1 ,2 ,2 ,8 1,1 ,4 ,2 ,8 ,2 ,6 2,7 ,6 ,2 ,6 ,6 ,6 ,8 ,8 ,2 ,2 ,6 ,2 ,2 ,2 Valid Percent ,2 ,2 ,6 ,2 ,2 ,2 ,2 ,6 ,4 ,2 ,4 ,2 ,4 ,2 ,2 ,4 1,3 ,2 ,4 ,4 ,6 ,2 ,4 1,1 ,4 ,4 ,8 ,6 ,6 ,6 1,1 ,8 ,6 1,3 1,5 ,4 ,4 ,8 ,8 ,4 ,8 ,4 ,4 ,4 1,7 ,8 ,8 1,7 ,4 ,8 ,2 ,8 1,1 ,4 ,8 ,4 ,4 ,8 ,4 1,5 ,8 1,1 1,5 ,4 ,6 ,4 1,1 1,1 ,4 1,5 ,8 ,6 ,2 ,6 1,3 ,2 ,4 ,2 1,1 ,2 ,4 ,2 1,1 ,2 ,2 ,8 1,1 ,4 ,2 ,8 ,2 ,6 2,7 ,6 ,2 ,6 ,6 ,6 ,8 ,8 ,2 ,2 ,6 ,2 ,2 ,2 Cumulative Percent ,2 ,4 1,1 1,3 1,5 1,7 1,9 2,5 3,0 3,2 3,6 3,8 4,2 4,4 4,6 5,1 6,3 6,5 7,0 7,4 8,0 8,2 8,6 9,7 10,1 10,5 11,4 12,0 12,7 13,3 14,3 15,2 15,8 17,1 18,6 19,0 19,4 20,3 21,1 21,5 22,4 22,8 23,2 23,6 25,3 26,2 27,0 28,7 29,1 30,0 30,2 31,0 32,1 32,5 33,3 33,8 34,2 35,0 35,4 36,9 37,8 38,8 40,3 40,7 41,4 41,8 42,8 43,9 44,3 45,8 46,6 47,3 47,5 48,1 49,4 49,6 50,0 50,2 51,3 51,5 51,9 52,1 53,2 53,4 53,6 54,4 55,5 55,9 56,1 57,0 57,2 57,8 60,5 61,2 61,4 62,0 62,7 63,3 64,1 65,0 65,2 65,4 66,0 66,2 66,5 66,7

FIGURA 26 Tabela de freqncia de uma varivel quantitativa Fonte: SPSS v. 15.0 - trial

26

Na tabela apresentada na Figura 26, percebe-se que o SPSS elaborou uma tabela de freqncia atribuindo para cada linha desta tabela um valor numrico distinto. Como apresentado fica invivel sua leitura e anlise, pois no sintetiza os dados. Para solucionar este problema tem-se o comando recode que poder, de acordo com os critrios estabelecidos, agrupar dados categorizando-os. A tabela apresentada na Figura 27 lista a varivel salrio anual dos funcionrios de uma determinada empresa. Aps executar as estatsticas descritivas como: mximo, mnimo e amplitude, percebe-se que o menor salrio pago de $15.750,00 e o maior salrio pago de $ 135.000,00, tendo assim, uma amplitude de $119.250,00, conforme apresentado na Figura 27.
Statistics Current Salary N Valid Missing Range Minimum Maximum

474 0 $119,250 $15,750 $135,000

FIGURA 27 Caixa de dilogo select case: if Fonte: SPSS v. 15.0 - trial

Supondo que o interesse do pesquisador seja de criar uma tabela com a faixa salarial de todos os funcionrios dessa companhia e de acordo com os dados acima ele especifica os seguintes intervalos para categorizar os salrios:

TABELA 2 Critrio utilizado para categorizar os dados


Intervalo de Salrio Anual ($) 15.001,00 at 35.000,00 35.001,00 at 55.000,00 55.001,00 at 75.000,00 75.001,00 at 95.000,00 95.001,00 at 115.000,00 115.001,00 at 135.000,00 Categoria Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Grupo 6

Fonte: Elaborado pelo autor

Observa-se que, de acordo com o critrio estabelecido pelo pesquisador, ser elaborado uma tabela de freqncia com 6 classes (linhas), sendo iniciada em 27

$15.000,00 e finalizada em $135.000,00, o que contempla todo conjunto de dados, pois o valor mnimo de $15.750,00 e o mximo de $135.000,00. Para chegar a este esultado existem trs possibilidades de recodificar uma varivel: 1) recode into same variables, 2) recode into different variables e 3) recode automatic variables, o que significa, respectivamente, em 1) recodificar na mesma varivel, 2) recodificar numa varivel diferente e 3) recodificar automaticamente. Recodificar na mesma varivel no muito aconselhvel, pois os dados originais sero sobrescritos e com isso sero perdidos. Recodificar automaticamente aconselhvel quando a varivel origem string (texto) e deseja-se atribuir categoria para cada texto. Recodificar numa varivel diferente a possibilidade mais utilizada, pois nesta, o SPSS cria uma nova varivel, no sobrescrevendo os dados originais. Atravs do menu transform > recode into different variable executado este comando e com isso aparecer a caixa de dilogo apresentada na Figura 28.

FIGURA 28 Caixa de dilogo recode into different variables Fonte: SPSS v. 15.0 - trial 28

Nesta caixa de dilogo, conforme apresentado na Figura 29, dever ser especificado qual ser a varivel de origem e qual ser a varivel de destino. Seguindo o exemplo anterior (relao de salrios de uma emrpesa) a varivel de origem ser salrio atual e a varivel de destino ser uma nova varivel que ser criada. Esta nova varivel, neste exemplo, ter name (apelido) de sal_cat e o seu label (o que significa ou ttulo) ser faixa salarial. Sendo assim, a nova caixa de dilogo ficar da seguinte maneira:

E aps clicar no boto change ficar da seguinte maneira:

FIGURA 29 Caixa de dilogo recode into different variables Fonte: SPSS v. 15.0 - trial 29

Aps clicar no boto change, deve-se especificar quais sero os critrios que o SPSS utilizar para recodificar a varivel. Utilizaremos como exemplos os critrios j definidos na Tabela 2. Na caixa de dilogo apresentada na Figura 30 h algumas definies que so importantes no momento de informar para o SPSS o critrio estabelecido na Tabela 2.

FIGURA 304 Caixa de dilogo recode into different variables: old and new values Fonte: SPSS v. 15.0 - trial Como no exemplo trata-se do agrupamento dos salrios com relao ao salrio atual, ou seja, quem ganha entre $15.001,00 at $35.000,00 pertencer ao Grupo 1, quem ganha entre $ 35.001,00 at $ 55.000,00 pertencer ao Grupo 2 e assim sucessivamente. Deve-se ento marcar em old value a opo range (amplitude ou intervalo) e neste campo especificar o primeiro intervalo e em seguida deve-se especificar o novo valor (cdigo) da nova varivel em new value, aps esta operao deve-se clicar sobre o boto Add para adicionar este critrio. Para a criao de cada categoria deve-se repetir esta operao. A caixa de dialogo ficar conforme apresentado na Figura 31 onde, aps especificar o critrio para cada categoria criada, deve-se clicar em continue e posteriormente em OK.. Esta ao criar uma nova varivel no final da base de dados

30

FIGURA 31 Caixa de dilogo recode into different variables: old and new values Fonte: SPSS v. 15.0 - trial

Aps criada a nova varivel deve-se configur-la no variable view especificando no value o significado para cada nmero que foi criado atravs do comando recode, conforme apresentado na Figura 32.

FIGURA 32 Tela do SPSS do variable view acessando value Fonte: SPSS v. 15.0 - trial 31

No exemplo apresentado na Figura 32, o usurio ter que especificar na nova varivel que o valor 1 significa entre $15.001,00 at $ 35.000,00 e que o valor 2 significa entre $35.001,00 at $55.000,00, e assim sucessivamente Aps todo esse procedimento, finalmente, criou-se uma nova varivel que faixa salarial (categorizada). Pode-se, ento, por exemplo, gerar uma tabela com os dados recodificados apresentado a freqncia desta nova varivel. Esta nova apresentao, conforme apresentado na Figura 33, tem os dados consolidados e em condies de serem utilizados em uma anlise, ao contrrio dos dados da tabela apresentada na Figura 26.
Faixa Salarial Frequency 338 79 40 11 5 1 474 Percent 71,3 16,7 8,4 2,3 1,1 ,2 100,0 Valid Percent 71,3 16,7 8,4 2,3 1,1 ,2 100,0 Cumulative Percent 71,3 88,0 96,4 98,7 99,8 100,0

R$ 15000,00 at R$ 35000,00 R$ 35000,00 at R$55000,00 R$55000,00 at R$75000,00 R$75000,00 at R$95000,00 R$95000,00 at R$115000,00 R$115000,00 at R$135000,00 Total

FIGURA 335 Tabela de freqncia da nova varivel recodificada Fonte: SPSS v. 15.0 - trial

3.4. Calculando Variveis (comando compute) Comando utilizado para criar novas variveis atravs de uma expresso aritmtica (lgica) das variveis j existentes no sistema. Como exemplo pode-se calcular de quanto foi o aumento de salrio mdio entre todos os funcionrios. Para tanto necessrio criar uma nova varivel que representar o aumento de salrio. Para criar essa nova varivel ser necessrio subtrair o salrio atual pelo inicial e este resultado deve ser colocado em uma nova varivel criada que se denominar de aumento. Para iniciar comando compute deve-se ir no menu transform > compute variable e com isso, aparecer a tela apresentada na Figura 34. Em target variable (varivel destino) deve-se especificar o nome (apelido) da varivel que ser criada, em numeric expression (expresso numrica) deve descrever a expresso numrica que o SPSS utilizar para criar a nova varivel. Neste caso, ser salrio atual menos salrio inicial.

32

Ao clicar em Tipe & label uma nova janela, conforme apresentado na Figura 34, pedir o Label (significado ou ttulo) da nova varivel bem como o tipo da varivel, ou seja, se a mesma ser numeric (numrica) ou string (texto).

FIGURA 34 Caixa de dilogo compute Fonte: SPSS v. 15.0 - trial

Da mesma forma que o select case h um teclado que auxiliar na formulao da expresso numrica. O significado o mesmo utilizado para o select case e pode ser demonstrado na Tabela 3.

TABELA 3 - Aplicaes do teclado da caixa de dilogo do compute


Boto Significado Adio Multiplicao Menor que Menor ou igual a Igual a E (AB) interseo Potenciao Parnteses Boto Significado Subtrao Diviso Maior que Maior ou igual a Diferente de OU (AUB) - unio Negao (binria) Apagar

Fonte: Elaborado pelo autor

33

Aps digitada a expresso numrica deve-se clicar em OK e esta ao criar a nova varivel de acordo com as especificaes fornecidas.

3.5. Ordem crescente ou decrescente (comando sort) Comando til principalmente aps a utilizao do comando split file, pois este comando reordena a base de dados conforme a comparao entre as categorias da varivel selecionada. Aps o uso do split file se o pesquisador desejar poder ordenar a base de dados de acordo com o seu interesse. Para tanto, deve-se ir no menu data > sort cases. Desse comando aparecer a tela apresentada na Figura 35 onde dever especificar a varivel que ser utilizada para ordenar e marcar, bem como se a ordem ser ascendente ou descendente.

FIGURA 35 Caixa de dilogo sort Fonte: SPSS v. 15.0 - trial

4. TABELA DE CONTINGNCIA 4.1. Tabulao Cruzada Em pesquisa de marketing esta ferramenta uma das mais usadas, pois relaciona duas variveis categricas (qualitativas). O SPSS monta uma tabela colocando as categorias de ambas as variveis na mesma tabela, sendo as categorias de uma delas nas colunas e da outra nas linhas. Na interseo entre linha e coluna tm-se os valores da freqncia comum a ambas variveis. No exemplo, apresentado a seguir, pode-se visualizar que foram relacionadas duas variveis: sexo e avaliao geral do professor. 34

Numa mesma tabela possvel interpretar os dados de uma varivel ou da outra e, alm disso, pode tambm relacionar as duas variveis. Na tabela apresentada na Figura 36 pode-se verificar que foram aplicados 458 questionrios e entre os respondentes, 306 avaliaram o professor como timo, 128 o avaliaram como bom, 19 como regular e 5 como ruim. Percebe-se, portanto, que foi realizada uma anlise separada para cada varivel utilizando-se a mesma tabela. Pode-se tambm, verificar, por exemplo, que dos 458 questionrios que foram aplicados, 259 dos respondentes so do sexo feminino, e desses, 65 avaliaram em bom a atuao do professor.

Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Count Qual a avaliao geral que voc faz do professor? Ruim Regular Bom timo 1 15 65 178 4 4 63 128 5 19 128 306

Sexo Total

Feminino Masculino

Total 259 199 458

FIGURA 36 Tabulao cruzada do SPSS Fonte: SPSS v. 15.0 - trial

Para fazer uma tabulao cruzada necessrio ter duas variveis categricas e ir no menu analyze > descriptive statistics > crosstabs. Aps esta ao aparecer a caixa de dilogo apresentada na Figura 37.

FIGURA 37 Caixa de dilogo crosstabs Fonte: SPSS v. 15.0 - trial 35

Nesta caixa de dilogo, conforme apresentado na Figura 37, deve-se escolher qual ser a varivel categrica que aparecer nas linhas da tabela, assim como, qual aparecer nas colunas da tabela. Feito a seleo das variveis basta clicar em ok para fazer a tabulao cruzada.

4.2. Anlise por linha, coluna e total Este um recurso permite analisar a tabela por linha, coluna e total atravs das freqncias relativas, ou seja, o SPSS considera o total de cada linha ou total da coluna ou total geral como sendo 100% e de acordo com a freqncia de cada clula o SPSS calcular o percentual equivalente da clula. Para fazer a anlise por linha o usurio deve ir no menu analyze > descriptive statistics > crosstabs e aps selecionar as variveis que sero analisadas deve-se clicar no boto cells e, conforme apresentado na Figura 38, marcar a opo row para linha, column para coluna e total para total.

FIGURA 38 Caixa de dilogo crosstabs: cell display Fonte: SPSS v. 15.0 - trial

A seguir nas Figuras 39, 40 e 41 so apresentados, respectivamente, como ficam as tabelas de contingncia aps cada uma das anlises (linha, coluna e total)

36

Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Qual a avaliao geral que voc faz do professor? Ruim Regular Bom timo 1 15 65 178 ,4% 5,8% 25,1% 68,7% 4 4 63 128 2,0% 2,0% 31,7% 64,3% 5 19 128 306 1,1% 4,1% 27,9% 66,8%

Sexo

Feminino Masculino

Total

Count % within Sexo Count % within Sexo Count % within Sexo

Total 259 100,0% 199 100,0% 458 100,0%

FIGURA 39 Anlise por linha Fonte: SPSS v. 15.0 - trial

Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Qual a avaliao geral que voc faz do professor? Ruim Regular Bom timo 1 15 65 178 20,0% 4 80,0% 5 100,0% 78,9% 4 21,1% 19 100,0% 50,8% 63 49,2% 128 100,0% 58,2% 128 41,8% 306 100,0%

Sexo

Feminino

Masculino

Total

Count % within Qual a avaliao geral que voc faz do professor? Count % within Qual a avaliao geral que voc faz do professor? Count % within Qual a avaliao geral que voc faz do professor?

Total 259 56,6% 199 43,4% 458 100,0%

FIGURA 40 Anlise por coluna Fonte: SPSS v. 15.0 - trial


Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Qual a avaliao geral que voc faz do professor? Ruim Regular Bom timo 1 15 65 178 ,2% 3,3% 14,2% 38,9% 4 4 63 128 ,9% ,9% 13,8% 27,9% 5 19 128 306 1,1% 4,1% 27,9% 66,8%

Sexo

Feminino Masculino

Total

Count % of Total Count % of Total Count % of Total

Total 259 56,6% 199 43,4% 458 100,0%

FIGURA 41 Anlise total Fonte: SPSS v. 15.0 - trial

37

5. ESTIMAO DE PARMETROS 5.1. Construindo intervalo de confiana de uma mdia populacional Para construo de um intervalo de confiana de uma mdia atravs do SPSS deve-se ir no menu Analyze > Descriptive Estatistics > Explore. Com isso aparecer a seguinte janela:

FIGURA 42 Caixa de dilogo Explore Fonte: SPSS v. 15.0 - trial

Selecione a varivel quantitativa e a transfira para Dependent List. Aps realizado isso click sobre o boto statistics e aparecer a janela a seguir:

Insira aqui o nvel de confiana

FIGURA 43 Caixa de dilogo Explore: Statistics Fonte: SPSS v. 15.0 - trial

38

Insira o nvel de confiana desejado, e click em continue e depois em OK. Com isso aparecer a tabela a seguir no Output:

FIGURA 44 Sada com o Intervalo de Confiana Fonte: SPSS v. 15.0 - trial

Para encontrar o erro da pesquisa (E) basta dividir por dois a diferena entre os limites superior e inferior, conforme demonstrado na frmula abaixo:
Ls Li 2

E=

6. TESTE DE HIPTESE O SPSS realiza o teste de hiptese da mdia populacional, porm no o faz para a proporo. Nesse sentido s ser abordado as formas de realizar o teste de hiptese bilateral, assim como unilateral. Para realizar o teste de hiptese deve ir no menu Analyze > Compare means > one sample t test. Neste sentido aparecer a tela a seguir:

39

FIGURA 67 Caixa de dilogo One-Sample T Test Fonte: SPSS v. 15.0 - trial

Bastar ento selecionar a varivel a ser testada posteriormente inserir o valor da afirmao que est sendo testada e clicar em OK. Aparecer a seguinte sada de dados:
One-Sample Statistics Std. Error Mean $784.311

N Salrio Atual 474

Mean $34,419.5675

Std. Deviation $17,075.66146

FIGURA 48 Tabela com as estatsticas descritivas Fonte: SPSS v. 15.0 - trial

Na tabela acima demonstrado as principais estatstica descritivas, tais como N (tamanho da amostra), mean (mdia), std. Deviation (desvio-padro), std erro mean (erro padro da mdia). O erro padro da mdia

e representa a

variao das mdias de todas as amostras possveis que podem ser selecionadas. Alm da tabela anterior, o SPSS tambm fornece o teste estatstico conforme demonstrado a seguir:

40

FIGURA 49 Tabela com o Teste T Fonte: SPSS v. 15.0 - trial

Todas os teste de hiptese realizado pelo SPSS so teste bilaterais, portanto se o pesquisador tiver interesse de encontrar o valor do p-value para um teste unilateral dever dividir por 2 o p-value (sig) apresentado pelo SPSS. Portanto, se for realizado o teste de hiptese para = 33000, com =0,05 com a mesma sada do SSPS descrita acima: H0: = 33000 H1: 33000 H0 no seria rejeitada, visto que p-value (0,071) > (0,05)

Mas se o teste de hiptese fosse > 33000, para =0,05 teramos outro resultado conforme demonstrado abaixo: H0: 33000 H1: > 33000 H0 seria rejeitada, visto que p-value (0,035) < (0,05)

7. TESTE DE ADERNCIA O Teste de aderncia um teste no paramtrico que mede grau de ajustamento de uma distribuio observada em relao a uma distribuio terica.

41

Para execuo desse teste utilizado como ferramenta a prova de qui-quadrado para n 1 (n menos 1) graus de liberdade. Para facilitar o entendimento deste teste o mesmo ser abordado de forma prtica, sem o detalhamento do processo estatstico utilizado para chegar ao resultado final, visto que, a preocupao de apenas operacionalizar o teste atravs do SPSS e como interpret-lo. Imagine que o objetivo de um determinado pesquisador seja verificar qual a interferncia da cor de uma embalagem na preferncia de compra do consumidor. Para tanto, foi realizado o seguinte experimento: colocou o mesmo refrigerante em 4 embalagens com cores diferentes (amarelo, verde, vermelho e preto) e em seguida foi oferecido os 4 refrigerantes a potenciais consumidores em um supermercado, solicitando aos mesmos que informasse qual deles era de sua preferncia. Este experimento foi realizado com 153 clientes e, portanto, normal haver uma pequena diferena quanto a preferncia dos consumidores entre os refrigerantes, visto que, o experimento foi realizado sobre uma amostra, porm, se esta diferena de preferncia for significativa, pode-se concluir que a cor alterou a preferncia dos consumidores. Percebe-se que o valor esperado da preferncia para cada cor deveria ser a mesma, portanto, teoricamente 38,25 clientes devem preferir a cor amarela, 38,25 a cor verde, 38,25 a cor vermelha e 38,25 a cor preta. Esta o valor esperado para cada cor (categoria). Porm a prtica bem diferente, supondo que o valor observado sejam aqueles apresentados na Tabela 3. TABELA 3 - Comparao entre valor esperado e valor observado para cada cor
Cor Amarelo Verde Vermelho Preto Valor terico (esperado) 38,25 38,25 38,25 38,25 Valor observado 29 51 38 35

Fonte: Elaborado pelo autor

Assim, pode-se perceber que, dos 153 consumidores pesquisados, houve uma preferncia com relao a cor verde. Resta saber se esta diferena significativa ou foi fruto do acaso. 42

necessrio, ento, realizar o Teste de aderncia. Para tanto, deve-se ir no menu Analyse > Nonparametric tests > Qui-square , cuja ao abrir a tela apresentada na Figura 50.

FIGURA 50 Caixa de dilogo chi-square test Fonte: SPSS v. 15.0 - trial

Deve-se passar a varivel a ser testada para a caixa test variable list (lista da varivel testada) e observar se a opo all categories equal (todas categorias iguais) est marcada. Esta opo far o teste de aderncia considerando que todas as categorias devem possuir a mesma freqncia esperada. Clicando ok aparecero as sadas de dados apresentadas nas Figuras 51 e 52.
cor amarelo verde vermelho preto Total Observed N 29 51 38 35 153 Expected N 38,25 38,25 38,25 38,25 Residual -9,25 12,75 -,25 -3,25

FIGURA 51 Tabela de comparao do valor esperado e observado Fonte: SPSS v. 15.0 - trial
Test Statistics Chi-Square a df Asymp. Sig. cor 6,765 3 ,080

a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 38,3.

43

FIGURA 52 Resultado da prova de qui-quadrado Fonte: SPSS v. 15.0 - trial

Na tabela apresentada na Figura 51 pode-se visualizar o valor observado, o valor esperado e o valor residual que a diferena entre valor observado e o esperado, entretanto, nesta primeira tabela ainda no d para tirar concluses, visto que, no possvel afirmar se as diferenas entre valores esperados e observados so significativas, visto que, essa afirmao s poder ser feita quando as diferenas entre os valores esperados e observados forem menores que 5%. Assim, a tabela apresentada na Figura 52 complementa as informaes apresentadas na tabela anterior aonde possvel observar o valor do qui-quadrado (chi-square), o nmero de grau de liberdade (df) e a probabilidade de ter ocorrido queles valores observados que foram descritos na Figura 51. Considerando que a seguinte afirmativa seja verdadeira As quatro categorias de cores possuem a mesma preferncia e que a diferena encontrada (valor observado) ocorreu ao acaso igual a 0,08, ou seja, de 8%; o pesquisador pode chegar s seguintes concluses: 1) Caso o pesquisador considere que 8% uma probabilidade pequena de que a preferncia tenha ocorrido ao acaso, poder chegar a concluso que a cor influenciou a preferncia de escolha do consumidor. 2) Caso o pesquisador no considere que 8% uma probabilidade pequena de que a preferncia tenha ocorrido ao acaso, poder chegas a concluso de que a cor no influenciou a preferncia de escolha do consumidor. Entre os pesquisadores de marketing, normalmente, adotado o valor de 5% como uma probabilidade pequena da escolha ocorrer ao acaso. No exemplo apresentado essa probabilidade de 8%. Como um valor maior que 5% pode-se concluir que a probabilidade no pequena o suficiente para ser desconsiderada, portanto, esse resultado ocorreu ao acaso, por se ter trabalhado com uma amostra.

8. TESTE DE INDEPENDNCIA O teste de independncia usa tambm como ferramenta estatstica a prova de qui-quadrado para sua realizao, porm, o enfoque do teste de independncia verificar se duas variveis categricas so relacionadas. Este relacionamento no

44

quer dizer que h uma relao de causa e efeito entre as variveis e sim que existe uma relao entre elas. Para a execuo do teste de independncia entre duas variveis categricas deve-se utilizar o fluxograma abaixo no intuito de orient-lo em sua execuo

FIGURA 53 Fluxograma do teste de independncia Fonte: Elaborado pelo autor

Para realizar o teste de independncia no SPSS deve-se ir at o menu analyze > descriptive statistics > crosstabs . Com esta ao o usurio ter acesso tela apresentada na Figura 54.

45

FIGURA 54 Caixa de dilogo crosstabs Fonte: SPSS v. 15.0 - trial

Deve-se, ento, selecionar as variveis categricas que iro compor a linha e a coluna da tabela de contingncia, conforme apresentado na Figura 54 e, aps a seleo, deve-se clicar no boto statistics no intuito de selecionar os comandos de medidas de associao. A seguir, conforme apresentado na Figura 55, o usurio deve marcar as opes chi-square (qui-quadrado) e contingency coefficient (coeficiente de contingncia).

FIGURA 55 Caixa de dilogo crosstabs: statistics Fonte: SPSS v. 15.0 - trial

Para visualizao e maior entendimento dos resultados deste teste ser utilizado o seguinte exemplo: Suponha que foi aplicada aos 458 alunos de determinada escola a seguinte questo: Qual avaliao geral que faziam do seu respectivo professor? Cujas respostas possveis eram: as seguintes opes: pssimo, ruim, regular, bom e timo. O teste de independncia, aplicado neste exemplo, tem por objetivo verificar se h, ou no, relao entre as variveis sexo e satisfao geral com o professor. Para responder a questo proposta ser necessrio rejeitar ou no a seguinte hiptese: As variveis so independentes, ou seja, no h relao entre elas. 46

Para que o pesquisador possa tomar esta deciso (de rejeitar ou no a hiptese) o SPSS lhe mostrar a probabilidade de cometer o erro ao rejeitar essa hiptese, supondo que a mesma seja verdadeira (no deveria ser rejeitada). Este erro denominado de erro do Tipo 1. Supondo que o SPSS informasse que a probabilidade de que o erro do Tipo 1 fosse de 1%, o pesquisador poderia assumir esse risco, logo ele pode rejeitar a hiptese correndo o risco de 1% de que as variveis so independentes. Porem, se o SPSS informasse que a probabilidade de que o erro do Tipo 1 fosse de 35%, o pesquisador no poderia assumir esse risco, logo, com os resultados deste teste no h como ele rejeitar a hiptese, visto que a possibilidade que o erro do Tipo 1 ocorra significativa 35%. Quando no especificado, geralmente os pesquisadores de marketing adotam como um erro grande quele maior que 5%. A seguir, so apresentada nas Figuras 56, 57 e 58, as sadas do SPSS do teste de independncia, juntamente com a probabilidade associada de cometer o erro do Tipo 1 (rejeitar a hiptese quando a mesma verdadeira).

Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Qual a avaliao geral que voc faz do professor? Ruim Regular Bom timo 1 15 65 178 ,4% 5,8% 25,1% 68,7% 4 4 63 128 2,0% 2,0% 31,7% 64,3% 5 19 128 306 1,1% 4,1% 27,9% 66,8%

Sexo

Feminino Masculino

Total

Count % within Sexo Count % within Sexo Count % within Sexo

Total 259 100,0% 199 100,0% 458 100,0%

FIGURA 76 Tabulao cruzada Fonte: SPSS v. 15.0 - trial

47

Chi-Square Tests Value 8,658a 9,065 ,434 458 df 3 3 1 Asymp. Sig. (2-sided) ,034 ,028 ,510

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

a. 2 cells (25,0%) have expected count less than 5. The minimum expected count is 2,17.

FIGURA 57 Tabela de sada do teste de independncia Fonte: SPSS v. 15.0 - trial


Symmetric Measures Value ,136 458 Approx. Sig. ,034

Nominal by Nominal N of Valid Cases

Contingency Coefficient

a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.

FIGURA 58 Tabela de sada do coeficiente de contingncia Fonte: SPSS v. 15.0 - trial

A tabulao cruzada, apresentada na Figura 55, entre as variveis sexo e satisfao gerou uma tabela 2X4, ou seja, duas linhas e quatro colunas, portanto de tamanho superior a uma tabela 2X2. De acordo com o Fluxograma apresentado na Figura 53, s aconselhvel fazer o teste de qui-quadrado quando menos de 25% das clulas possuem valor esperado menor que 5 que no foi o que ocorreu neste caso. Esta situao pode ser verificada a partir do comentrio apresentado na tabela apresentada na Figura 57: 2 cells (25,0%) have expected count less than 5. The minimum expected count is 2,17 (2 clulas (25,0%) possuem valor esperado menor que 5. O valor esperado mnimo foi 2,17). Assim, aconselhado, de acordo com o Fluxograma apresentado na Figura 53, agrupar as categorias com valor esperado menor que 5. Este procedimento realizado atravs do comando recode do SPSS conforme j explicado anteriormente. Aps o agrupamento executa-se novamente a prova de qui-quadrado obtendo novas tabelas, conforme apresentado nas Figuras 59, 60 e 61.

48

Sexo * Qual a avaliao geral que voc faz do professor? Crosstabulation Qual a avaliao geral que voc faz do professor? Ruim/regular Bom timo 16 65 178 6,2% 25,1% 68,7% 8 63 128 4,0% 31,7% 64,3% 24 128 306 5,2% 27,9% 66,8%

Sexo

Feminino Masculino

Total

Count % within Sexo Count % within Sexo Count % within Sexo

Total 259 100,0% 199 100,0% 458 100,0%

FIGURA 59 Tabulao cruzada Fonte: SPSS v. 15.0 - trial


Chi-Square Tests Value 3,060a 3,073 ,166 458 df 2 2 1 Asymp. Sig. (2-sided) ,217 ,215 ,684

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 10,43.

FIGURA 60 Tabela de sada do teste de independncia Fonte: SPSS v. 15.0 - trial

Symmetric Measures Value ,081 458 Approx. Sig. ,217

Nominal by Nominal N of Valid Cases

Contingency Coefficient

a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.

FIGURA 61 Tabela de sada do coeficiente de contingncia Fonte: SPSS v. 15.0 - trial

Aps o agrupamento das categorias ruim e regular, verifica-se que nenhuma clula possui valor esperado menor que 5 e portanto j possvel realizar a prova de qui-quadrado. Juntamente com o valor do qui-quadrado de 3,06 o SPSS tambm lhe fornece o sig que a probabilidade de se cometer o erro do Tipo 1 no valor de 0,217, ou seja, de 21,7% para 2 graus de liberdade. Conforme orientado 49

anteriormente um erro de 21,7% grande demais para que o pesquisador rejeite a hiptese, com isso acaba-se no rejeitando a hiptese que as variveis so independentes, ou seja, no h relao entre sexo e satisfao com o professor. Observa-se que ao analisar a tabela apresentada na Figura 57 sem realizar o agrupamento obteramos o sig de 0,034 (3,4%), o que levaria a rejeio da hiptese (so independentes) erroneamente. A prova de qui-quadrado evidencia apenas se as variveis so ou no relacionadas, porm, no consegue demonstrar o grau de associao que possuem se as mesma forem relacionadas. A anlise do coeficiente de contingncia permite verificar o grau de associao que a varivel tem se a mesma for dependente (relacionada). Observese na tabela apresentada na Figura 61 a prova de qui-quadrado entre sexo e setor de trabalho em uma determinada empresa.

Chi-Square Tests Value 79,277a 95,463 67,463 474 df 2 2 1 Asymp. Sig. (2-sided) ,000 ,000 ,000

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 12,30.

FIGURA 62 Tabela de sada do teste de independncia Fonte: SPSS v. 15.0 - trial

Symmetric Measures Value ,379 474 Approx. Sig. ,000

Nominal by Nominal N of Valid Cases

Contingency Coefficient

a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.

FIGURA 63 Tabela de sada do coeficiente de contingncia Fonte: SPSS v. 15.0 - trial Observa-se que o sig (jerro do Tipo 1) tende a 0 (zero), o que leva o pesquisador em rejeitar a hiptese, concluindo que existe relao entre setor de 50

trabalho e sexo. Porm, o teste incapaz de fornecer a informao de, em que medida, o setor de trabalho relacionado ao sexo do trabalhador. Para tanto, utiliza-se o coeficiente de contingncia que fornecer o grau de associao entre as duas variveis. Em sua determinao necessrio elevar o coeficiente de contingncia, 0,379 ao quadrado para obter o resultado 0,1436, o que significaria que 14,36% da variao total da alocao do funcionrio pelo setor de trabalho pode ser explicado pelo sexo do entrevistado.

9. COMPARAO DE MDIAS DE DUAS AMOSTRAS Para comparao de mdias entre duas amostras o pesquisador dever ter conhecimento terico desta tcnica estatstica, principalmente no que consiste a identificao das amostras como pareadas ou independentes. Alm disso necessrio adaptar a interpretao das sadas do SPSS quando trata-se de teste unilaterais. 9.1. Teste de amostras emparelhadas ou pareadas Se os dados das amostras n1 e n2 formam pares de dados estes devem ser analisados como pareados. Portanto a digitao dos dados no SPSS tambm dever obedecer esse critrio, sendo digitado os pares de dados em duas variveis, conforme demonstrado na tela descrita a seguir:

51

FIGURA 64 Lanamento de dados para amostras pareadas Fonte: SPSS v. 15.0 - trial

Para melhor exemplificao do processo de comparao de mdias entre duas amostras pareadas, adotaremos o exemplo a seguir: O diretor de um banco deseja verificar se o desempenho dos caixas melhorou aps os mesmos serem submetidos a um curso de reciclagem. Para esta finalidade observou o tempo (minutos) gasto por de 10 caixas no atendimento a clientes, antes e depois do curso de reciclagem, e obteve os resultados conforme demonstrado na tela acima. Para comparao de duas amostras pareadas deve ir no menu Analyze > Compare means > paired-sample t test, conforme demonstrado na tela a seguir:

52

FIGURA 65 Caminho para comparao de mdias pareadas Fonte: SPSS v. 15.0 - trial

Aparecer a tela demonstrada abaixo em que dever selecionar as duas variveis pareadas (do lado esquerdo) que deseja-se realizar a comparao de mdias e pass-las para a lacuna paired variables (lado direito) e posteriomente clicar em OK

FIGURA 66 Caixa de dilogo Paired-Samples T Test Fonte: SPSS v. 15.0 - trial

Com essa ao aparecer 3 tabelas na sada de dados (no output) do SPSS conforme demonstrado abaixo:

53

Paired Samples Statistics Std. Error Mean ,57873 ,64347

Pair 1

Antes Depois

Mean 10,7400 7,5500

N 10 10

Std. Deviation 1,83012 2,03484

FIGURA 67 Comparao da estatstica descritiva de amostras pareadas Fonte: SPSS v. 15.0 - trial

Observa-se pela tabela anterior que so demonstradas as estatsticas descritivas de ambas as amostras, taismo como mdias, tamanho da amostra, desvio padro e erro padro da mdia. Atm disso o SSPS traz uma tabela de correlao, visto que os dados so pareados, conforme demonstrado a seguir:
Paired Samples Correlations N Pair 1 Antes & Depois 10 Correlation -,032 Sig. ,931

FIGURA 68 Coeficiente de correlao de Pearson Fonte: SPSS v. 15.0 - trial

E a ltima tabela, traz a estatstica do teste para a comparao de mdias de amostras pareadas

Paired Samples Test Paired Differences 95% Confidence Interval of the Difference Lower 1,20169 Upper 5,17831 t 3,629 df 9 Sig. (2-tailed) ,005

Mean Pair 1 Antes - Depois 3,19000

Std. Deviation 2,77947

Std. Error Mean ,87895

FIGURA 698 Teste T para comparao de mdias pareadas Fonte: SPSS v. 15.0 - trial

Para sua anlise correta o pesquisador dever primeiramente estipular H0 e H1 e lembrar que o SPSS faz a estatstica do teste supondo teste bilateral. As hipteses do teste so: H0: D 0 ou 1 2 0 ; 54

H1: D > 0 ou 1 2 > 0.

FIGURA 70 Curva Normal com regio crtica Fonte: SPSS v. 15.0 - trial

P-value (Sig bilateral) dado pelo SPSS foi de 0,005 e para acharmos o unilateral deve-se dividir por 2, encontrando um P-value (Sig unilateral) de 0,0025. Como P-value < ento rejeita-se H0. Portanto, pode-se concluir com que houve melhoria no tempo de atendimento aps o treinamento.

9.2.

Amostras Independentes Se as amostras no formam pares de dados, ento deve-se aplicar o teste t

para amostras independentes. Porm antes da anlise deste teste deve-se saber se as varincias entre as amostras so iguais (homocedasticidade) ou diferentes (heterocedasticidade). Para realizao deste teste os dados devem ser digitados no SPSS da forma como demonstrado a seguir, visto que os dados no so pares de dados.

55

FIGURA 71 Lanamento de dados de amostras independentes Fonte: SPSS v. 15.0 - trial

Para melhor exemplificao do teste t para amostras independentes ser utilizado o exemplo a seguir: Um artigo fabricado por certa empresa produzido por duas mquinas. Como uma das mquinas nova, acredita-se que o custo de produo das unidades do artigo produzidas pela mesma seja menor do o custo de produo das unidades produzidas pela mquina velha. Para verificar se isto realmente ocorre, observou-se o custo de produo de 6 unidades produzidas pela mquina velha e de 9 unidades produzidas pela mquina nova obtendo-se os seguintes estimativas da mdia e do desvio padro do custo de produo mquina velha: 0,82 0,83 0,79 0,81 0,81 0,80 mquina nova: 0,79 0,82 0,73 0,74 0,80 0,77 0,75 0,84 0,78 Pode-se afirmar, num nvel de significncia de 5%, que o custo de produo do artigo menor na mquina nova?

56

Para realizao do teste t para amostras independentes deve-se ir no menu Analyze > Compare means > Independent-sample t test, conforme demonstrado na a tela a seguir:

FIGURA 72 Caminho para comparao de mdias de amostras independentes Fonte: SPSS v. 15.0 - trial

Aparecer a seguinte, tela:

FIGURA 739 Caixa de dilogo INdependent-samples T Test Fonte: SPSS v. 15.0 - trial

Na janela anterior dever selecionar a varivel quantitativa que ser aplicado o teste, passando-o para a lacuna test variable(s) e dever passar a varivel que qualitativa que definir as duas amostras a serem comparadas para a lacuna de grouping variable e aps isso dever clicar sobre o boto define groups, que mostrar uma nova janela em que dever digitar o cdigo do grupo 1 e do grupo 2 que foram atribudos no variable view. Aps esse processo dever digitar OK que o SPSS providenciar a sadas dos dados conforme demonstrado abaixo: 57

A primeira tabela demonstrada trar informaes de estatstica descritiva de ambas as amostras, tais como tamanho da amostra, mdias, desvio-padro e erro padro da mdia, conforme demonstrado na tabela a seguir:
Group Statistics Std. Error Mean ,00577 ,01225

Custo

Grupo velha nova

N 6 9

Mean ,8100 ,7800

Std. Deviation ,01414 ,03674

FIGURA 74 Comparao da estatstica descritiva de amostras independentes Fonte: SPSS v. 15.0 - trial

Tambm demonstrar a tabela a seguir, em que dever ser realizadas o teste de igualdade de varincias primeiramente e depois o teste de comparao de mdias de amostras independentes de acordo com o resultado do primeiro teste.

Independent Samples Test Levene's Test for Equality of Variances

t-test for Equality of Means 95% Confidence Interval of the Difference Lower -,00430 ,00022 Upper ,06430 ,05978

F Custo Equal variances assumed Equal variances not assumed 4,527

Sig. ,053

t 1,889 2,216

df 13 11,076

Sig. (2-tailed) ,081 ,049

Mean Difference ,03000 ,03000

Std. Error Difference ,01588 ,01354

FIGURA 75 Comparao de mdias entre duas amostras independentes Fonte: SPSS v. 15.0 - trial

Nas duas primeiras colunas da tabela acima demonstrado o F de Levene e o Sig do teste de Levene, respectivamente. O teste de Levene utilizado para verificar a homogeneidade de varincias (homocedasticidade) entre as duas amostras. Para realizao do teste aplicado o seguinte teste de hiptese:
2 H0: 12 = 2 (igualdade de varincias) 2 H1: 12 2 (desigualdade de varincias)

58

Como o sig do teste de Levene 0,053 ento deve-se no rejeitar H0, o que significa que as varincias podem ser iguais entre as duas amostras. Esse resultado ir definir se o pesquisador ir olhar o teste t na primeira linha em que demonstra o teste t assumindo varincias iguais ou na segunda linha em que demonstra o teste t assumindo varincias diferentes. Como no exemplo anterior H0 no foi rejeitada ento deve-se analisar o teste t na primeira linha. Para anlise do teste t deve-se estipular H0 e H1 As hipteses do teste so: H0: 1 2 ou 1 2 0 ; H1: 1 > 2 ou 1 2 > 0

O SPSS sempre demonstrar o p-value (sig) bilateral que neste exemplo foi de 0,081. O pesquisador para determinar o p-value (sig) unilateral dever dividir o sig-bilateral por 2 o que ocasionar em um valor igual a 0,04

FIGURA 76 Curva Normal delimitando a regio crstica Fonte: SPSS v. 15.0 - trial

Como p-value (unilateral) < (nvel de significncia) deve-se ento rejeitar H0, concluindo que a mquina nova realmente gera menos custo que a maquina velha.

59

You might also like