You are on page 1of 305

Christine P.

Dancey

University of East London

John Reidy
University Sheffield Hallam

.-

ESTATISTICA

.;

SEM MATEMATICA

PARA PSICOLOGIA

Usando

SPss para Windows


3a edic;ao

Traduc;ao, consuItoria e supervisao desta edic;30:


LorfViali
DI73e

Dancey, Christine P.
Estatfstica sem matematica para psicologia I Christine P. Dancey, John
Reidy ; tradu~30 Lori Viali. - Porto Alegre: Artmed, 2006.
608 p. : il. ; 25 cm.

Professor TItular da Faculdade de Matematica da PUCRS


Professor Adjunto do Instituto de Matematica da UFRGS

Reimpressao 2007

ISBN 978-85-363-0688-9
I. Estatfstica - Psicologia. I. Reidy, John. II. Titulo.

CDU 311:159.9
Cataloga~3o na

publica930: Julia Angst Coelho - CRB 1011712

.e
2006

Pearson Education Limitcd 2004


This translation of Sraristics wirhour maths for psychology, 3 edition is published by arrangemcnt with Pearson
Education Limited.

ISBN 0-13-124941-X
Capa: Paola Manica
Prepara~iio

do original: Ktitia Michelle Lopes Aires

Leitura final: Jlilia Angst Coelho


Supervisao editorial: Monica Ballejo Conca
Editora,ao eletronica: Laser House

Reservados todos os direitos de publica,iio, em lingua portuguesa. 11


ARTMED'" EDITORA SA
Av. Jeronimo de Ornelas, 670 - Santana
90040-340 Porto Alegre RS
Fone (51) 3027-7000 Fax (51) 3027-7070

E proibida a duplica,ao ou reprodu,ao deste volume, no todo ou em parte,


sob quaisquer formas ou por quaisquer meios (eletronico, medinico. grava,ao,
fotocopia, distribui,ao na Web e outros), sem permissao expressa da Editora.

sAo PAULO
Av. Angelica, 1.091 - Higienopolis
01227-100 Sao Paulo SP
Fone (II) 3665-1100 Fax (II) 3667-1333
SAC 0800 703-3444
IMPRESSO NO BRASIL
PRINTED IN BRAZIL

Christine dedica este livro a J. Johnstone, pelo amor e apoio nos ultimos J8
anos. tambem para Heike e Heinz Karstens por seu carinhoso apoio.
John dedica este livro para Lisa. Iss)', Ollie e Arsenal. Obrigado a voces
por manter a sorriso em meu rosto.

Agradecimentos

Gostarfamos de agradecer a valiosa contribuir;ao feita as duas edir;oes anteriores do


Estatistica sem matemutica para psiculogia pela equipe do curso de psicologia da Open Uni
versity Psychology e particularmente por Martin Le Voi e Jarrod Hollis. Agradecimentos sao
tambem devidos a Elizabeth Attree, Lisa Heavey, Joan Painter, Mary Fox e Katja Lippert.
Somos gratos a John Todman pelas informar;oes sobre projetos pre e pas-teste e a Barbara
Alexander por nos fornecer os dados originais utilizados no Capitulo 12.
Gostariamos de agradecer, ainda, as seguintes pessoas por suas contribuir;oes para a ter
ceira edir;ao deste livro: Aiden P., Brian Everitt, Dr. Chong Ho (Alex) Yu e aos revisores
anonimos que gastaram seu tempo nos fornecendo urn retorno de grande utilidade.
Christine P. Dancey
John Reidy

Agradecimentos do Editor
Somos gratos as seguintes instituir;oes pela pennissao de reprodur;ao de material prote
gido por direitos autorais:

A. SPSS pela utilizar;ao das imagens do programa. 0 SPSS e uma marca registrada e os
nomes de OUlrOS produtos sao propriedades da SPSS Inc.; aos editores Lawrence Erlbaum
Associados pela tabela da pagina 223 reproduzida de Statistical Powerfor Behavioural Scien
ces, segunda edir;ao, de J. Cohen, 1988. A Sage Publications pela Tabela 6.4 reproduzida do
artigo "Denial of depression as an independent correlate of coronary artery disease" de M. W.
Ketterer e colaboradores, publicado no Journal of Health Psychology, v. I, n. I, de 1996. A
Taylor & Francis Ltda. pela Tabela 7.1 reproduzida do artigo de Maclean e colaboradores, de
2000, publicado no Journal of Reproductive and Infant Psychology, v. 18, n. 2, p. 153-162. A.
Sociedade Britinica de Psicologia e ao autor S. Golombok pela Tabela 8.9 retirada do artigo
"The role of coping strategies in protecting individuals against long-tenn tranquilizer" publi
cado no British Journal of Medical Psychology, v. 69, n. 2, p. 10 1-15 em 1996. A Elsevier
pela Tabela 9.6 reproduzida do artigo "Eating attitudes and the irritable bowel syndrome" de
Sullivan e outros e publicado no General Hospital Psychiatry, v. 19 p. 62-4 em 1997. A. So
ciedade Britanica de Psicologia e a M. R. Kebbell pela Tabela 9.9 reimpressa do artigo ''The
influence of item difficulty on the relationship between eyewitness confidence and accuracy"
publicado no British Journal of Psychology, v. 87, p. 653-62 em 1996. A Taylor & Francis
Ltda. pela Tabela 11.3 reproduzida do artigo publicado no Psychology and Health, v. 12, n.
12, p. 265-275 de Emery e colaboradores em 1997. A. Elsevier Inc. pela tabela da pagina 437
reproduzida do artigo publicado no Psychosomatic Research, v. 45, n. 2, p. 171-178 de Tang
e outros em 1998. A Taylor & Francis Ltda. pela Tabela 15.4 reproduzida do artigo publicado
no Psychology, Health, and Medicine, v. 7, n. I, p. 99-112 de Sher e colaboradores em 1996.
A Sage Publications pela Tabela 15.7 reproduzida do artigo "An academic detailing interven
tion to decrease esposure to HIV infection among health-care workers", publicado no Journal

viii

Agradecimentos

ofHealth Psychology, v. I, n. 4 de Treloan e colaboradores em 1996. A Blackwell Publishing


Ltda., pelo poema ''The problem, the implications ", de Robert Rosenthal, retirado do urtigo
"Cumulating Psychology: an apreciation", de Donald T. Campell, publicado no PsycllOlogi
cal Science, v. 2 de 1991. The Guardian Services Limited, por conteudos do "Labour Website
Spin Like Orwell's 1984". de David Walker, publicado no The Guardian de 08 de outubro de
2002.
Em alguns casos nao conseguimos determinar 0 propriellirio do material protegido por
direitos autorais, e apreciarfamos qualquer informar;:ao que tornasse isto posslve!.

Prefacio aPrimeira Edi~ao

Escrevemos este livro primeiramente para nossos alunos, muitos dos quais nao gostam de
matematica e nao conseguem entender porque precisam aprender formulas quando existem
programas de computador para fazer isto. Eles nao foram convencidos pelo argumento de que
os calculos realizados servem para dar-Ihes urn maior entendimento do teste, alias, nem nos.
Nos queremos que eles tenham urn entendimento conceitual da estatistica e que gostem da
analise de dados. Durante a ultima decada tivemos que adaptar nosso ensino a grandes gru
pos, nos quais uma boa parte das pessoas nao tinha urn treinamento formal em matematica.
Encontramos dificuldade para recomendar a esses alunos alguns dos livros didaticos tradicio
nais de estatistica. Estes textos estavam cheios de formulas matematicas e eram vistos pelos
estudantes como dificeis ou chatos, ou enta~, fomeciam meras "receitas", isto e, mostravam
apenas como fazer os calculos sem fomecer urn entendimento conceitual de estatistica.
Outro problema que tivemos ao recomendar livros-texto de estatistica foi a grande
dependencia dos valores probabilisticos para a interpretar;:ao dos resultados. Encontramos di
ficuldades para convence-los a levar em considerar;:ao 0 tamanho do efeito e os intervalos de
confianr;:a quando os textos disponiveis nao faziam considerar;:5es sobre testes de hipoteses,
mas simplesmente recomendavam que p < 0,05 e significativo e que p > 0,05 nao e! Espera
mos que com este livro os leitores fiquem mais atentos a tais assuntos.
Queremos ainda mostrar aos a1unos como incotporar os resultados das suas analises nos
relatorios laboratoriais e como interpretar a ser;:ao de resultados de artigos de peri6dicos. Ate
recentemente os livros de estatistica ignoravam este aspecto da analise de dados. Eclaro, en
tendemos que a forma que escrevemos nosso exemplo "resultados da ser;:ao" sera diferente da
forma que outros psicologos 0 fariam. Os estudantes podem utilizar esta ser;:ao como forma
de ganhar confianr;:a para escrever seus pr6prios resultados e esperamos que eles 0 far;:am com
o desenvolvimento dos seus cursos.
Tentamos simplificar conceitos complexos, e, algumas vezes, bastante complexos. En
tretanto, ao simplificar existe uma perda de acuracia. Estamos cientes disso e tentamos ser
cuidadosos ao maximo possivel, enquanto tentamos dar, tam bern, a explicar;:ao mais simples
possive!. Alem disso, estamos cientes de que os estudantes nao utilizam 0 SPSS em suas
analises de dados. 0 SPSS, no entanto, e 0 pacote estatistico mais popular para as ciencias so
ciais e e por isso que 0 texto esta tao ligado a esse programa. Os estudantes que nao utilizam
esse pacote deverao achar 0 livro util de qualquer modo.
Esperamos que os estudantes que leiam 0 livro nao apenas aprendam com ele, mas tam
bern apreciem nossas explicar;:5es e exempJos.

Prefacio aSegunda Edi~ao

Prefacio aTerceira Edi~ao

. ---------

,-

Desde que escrevemos a primeira edierao de Estatlstica sem matemlltica para p'\"ic%gia
tivemos muito retorno, tanto em relaeraoao conteudo quanto ao estilo e projeto do livro; como
resultado desse retorno, revisamos e reescrevemos seeroes substanciais deste texlO. Simpli
ficamos e esclarecemos partes do material e acrescentamos tambem novos conteudos. Urn
novo capitulo introduzindo Amilise de Fatores foi adicionado e a estatistica nao-parametrica
tambem ganhou urn capitulo pr6prio. A revisao do livro proporcionou-nos a oportunidade
de corrigir alguns dos erros tipognificos que se infiltraram na primeim edierao. Esta edierao
foi atualizada para 0 uso do SPSSPW versao 10. Esperamos que voce aprecie esta edierao do
Estatlstica sem matematica para psic%gia.
as conjuntos de dados utilizados pelos autores no texto podem ser acessados no endere
ero: www.booksites.netldancey.

Desde a publicaerao da segunda edierao do Estatlstica sem matemlltica para psic%gia,


tivemos urn retorno bastante util dos leitores, sendo alguns an6nimos, outros nao. Boa parte
desse retorno tern side positiva, e isto tern ajudado a confirmar nossa crenera de que este e urn
livro que apresenta urn apelo bastante amplo. Urn livro que objetiva ser simples, e claro, nao
agrada a todos, mas mesmo 0 retorno negativo tern servido de auxiJio para tornar mais clams
explicaeroes de alguns dos conceitos mais complicados. Gostariamos de agradecer a todos
esses leitores pelos seus comentarios; percebemos que 0 texto teve melhorias por forera dos
comentarios de pessoas que lecionam estatistica. Algumas sugestoes que recebemos foram
para aumentar a acuracia matematica. Nos levamos em conta esses conselhos sempre que
possivel, mas em alguns casos seguir as sugestoes significaria aumentar a complexidade das
explicaeroes, 0 que fugiria ao objetivo principal do texto. Em alguns casos, fornecemos refe
rencias para outras fontes, e, em outros, adicionamos notas de rodape. Esempre conveniente
lembrar que alguma precisao matematica pode ser perdida quando sao dadas explicaeroes
conceituais ou quando se simplifica conteudos mais complicados. Esperamos ter conseguido
urn equilibrio razoavel entre os dois prop6sitos. A forma de melhorar 0 entendimento das se
er6es onde os leitores sugeriram melhor c1areza foi incluir exemplos atualizados da literatura
da area da psicologia em conjunto com questoes de multipla escolha ao final de cada capi
tulo. Esta edierao foi, ainda, atualizada com 0 SPSSPW versoes II e 12; contudo, ela ainda e
adequada para uso se voce estiver utilizando a versao 10 do programa. Esperamos que voce
ache utH esta terceira edierao do Estatlstica sem matematica para psic%gia e aumente seu
encantamento com a estatistica e com a pesquisa em psicologia.

Sumario

Variaveis e Projeto de Pesquisa

23

Panorama do capitulo

23

1.1
1.2
1.3
1.4

Por que ensinar estatfstica sem formulas matematicas'!


Variaveis
Planejamento da pesquisa
Delineamentos entre e dentre participantes
SPSS para Windows (SPSSPW)
Resumo
Exercfcios para 0 SPSSPW
Quest6es de multipia escolha
Referencias

23

24

29

36

39

51

52

53

54

Estat[stica Descritiva

56

Panorama do capitulo

56

2.1
2.2
2.3

56

58

63

66

70

80

82

Amostras e popula<;6es
Medidas de tendencia central
Erro amostral
SPSSPW: obten<;ao de medidas de tendencia central
2.4 Descri<;ao grafica dos dados
SPSSPW: gera<;ao de descritivas graticas
2.5 Diagramas de dispersao
SPSSPW: gera<;ao de diagramas de dispersao
2.6 Erro de amostragem e relacionamento entre variaveis
2.7
Distribui<;ao normal
2.8 Varia<;ao ou dispersao de distribui<;6es
SPSSPW: obten<;iio de medidas de varia<;ao
2.9 Outras caracterfsticas das distribui<;6es
2.10 Distribui<;oes nao-normais
SPSSPW; gera<;ao de curvas normais e histogramas
2.11 Obten<;ao de estatfsticas descritivas

84

86

88

90

93

95

95

101

102

14

Sumario

Sumario

Resumo
Exercicios para 0 SPSSPW
Questoes de multipla escolha
Referencias

5
3

Probabilidade, Amostragem e Distribui~oes

108

Panorama do capitulo

108

3.1
3.2
3.3
3.4
3.5

Probabilidade
Distribuir;ao normal padrao
Aplicar;ao da probabilidade a pesquisa
Distribuir;oes amostrais
Intervalos de confianr;a e erro padrao
SPSSPW: obtenr;ao de intervalos de confianr;a
Diagramas de barras de erros
Sobreposir;ao de intervalos de confianr;a
SPSSPW: gerar;ao de diagramas de barras de erro
Intervalos de confianr;a e outras estatisticas
SPSSPW: uso do instrutor de resultados (Results Coach)

108
III
118
118
121
129
131
132
134
137
137

Resumo
Exercicios para 0 SPSSPW
Questoes de multipla escolha
Referencias

139
139
141
142

3.6
3.7
3.8

Teste de Hip6teses e Significancia Estatistica

143

Panorama do capitulo

143

4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12

Outra forma de aplicar probabilidades a pesquisa: teste de hip6teses


Hip6tese nula
L6gica dos testes de hip6teses
Nivel de significiincia
Significiincia estatistica
Interpretar;ao correta do valor p
Testes estatisticos
Erro do Tipo I
Erro do Tipo II
Por que estabelecer Ci. = 0,05?
Testes unilaterais e bilaterais
Hip6teses subjacentes ao uso dos testes estatlsticos
SPSSPW: conselheiro estatistico (Statistics Coach)

143
148
149
151
152
154
155
157
158
160
160
165
169

Resumo
Exercicios para 0 SPSSPW

173
173

176
177

Quest5es de multipla escolha


Referencias

103
104
105
107

Analise de

178
178

5.1

Correlar;oes bivariadas
SPSSPW: correlar;oes bivariadas - 0 r de Pea~on
SPSSPW: obtenr;ao uma matriz de diagramas de dispersao
Correlar;oes de primeira e segunda ordens
SPSSPW: correlar;oes parciais - rde Pearson
Padroes de correlar;oes

178
192
201
205
206
212

Resumo
Exercicios para 0 SPSSPW
Questoes de multi pia escolha
Referencias

213
214
215
218

5.3

de Pearson

Panorama do capitulo

5.2

Correla~ao: 0 ,

15

Analise de Diferen~as entre Duas Condi~oes:

Teste t

219

Panorama do capitulo

219

6.1

Analise de duas condir;5es


SPSSPW: para um teste t independente
SPSSPW: delineamento de medidas repetidas para duas amostras:
.
teste t pareado

220
231

Resumo
Exercicios para 0 SPSSPW
Quest5es de multipla escolha
Referencias

244
244

238

246
248

Questoes de Significancia

249

Panorama do capitulo

249

7.1
7.2
7.3
7.4
7.5
7.6

Criterios de significancia
Tamanho do efeito
Poder
Fatores que influenciam 0 poder
Calculo do poder
Intervalos de confianr;a

250
251
252
253
258
261

Resumo
Questoes de multipla escolha
Referencias

262
263
266

16

Sumario

Sumario

Medidas de Associa~ao

267

Panorama do capitulo

267

8.1
8.2

267
269

10.5
10.6

8.3
8.4

290

Resumo
Exercicios para 0 SPSSPW
Questoes de mUitipla escolha
Referencias

294
294
296
299

Analise de Diferen~as entre Tres ou Mais


de um Fator

Condi~oes:

277

281

334
349
356
364
367
374

Resumo
Exercicios para 0 SPSSPW
Questoes de multipla escolha
Referenc ius

375
376
378

380

Analise de Regressao

381

Panorama do capitulo

381

I 1.1

381
385

I 1.2
300

Yisualizar;ao do delineamento
Significado da analise de variiincia
SPSSPW: execur;ao da ANOYA de uma c1assificar;ao
Estatfsticas descritivas
Comparar;oes planejadas
Controle para multiplos testes
Testes post hoc
ANOYA de medidas repetidas
SPSSPW: instrur;oes para a ANOYA de medidas repetidas

301
302
307
309
311
311
312
315
317

Resumo
Exercfcios para 0 SPSSPW
QuestOes de ml1ltipla escolha
Referencias

323
323
324
328

Analise de Variancia com Mais de uma Variavellndependente

329

Panorama do capitulo

329

10.1

329
330
331
333

Introdur;ao

11

ANOVA

9.1
9.2

10.2 Fontes de variar;ao


10.3 Delineamentos apropriados para uma ANOYA fatorial
10.4 Tenninologia da ANOYA

Duas variaveis independentes entre panicipantes


SPSSPW: analise de dois fatores entre panicipantes
Duas variaveis dentre panicipantes
SPSSPW: ANOYA dentre panicipantes com dois fatores
Uma variavel entre e outra dentre participantes
SPSSPW: ANOYA com um fator entre panicipantes e um dentre panicipantes

284

300

9.5
9.6
9.7

10.7

272

Panorama do capitulo

9.3
9.4

10

Freqiiencias (dados categ6ricos)


Yariavel X2 ou teste de aderencia
2
SPSSPW: X de uma variavel
SPSSPW: X2 de uma variavel, utilizando freqiiencias diferentes das
esperadas sob a hip6tese nula
Teste X2 para independencia: 2 x 2
SPSSPW: X2 2 x 2
Teste de independencia X2: rx c

17

12

Prop6sito da analise de regressao


SPSSPW: trar;ando a linha de melhor aderencia
SPSSPW: analise de regressao linear
Regressao mUlti pia

405

Resumo
Exercicios para 0 SPSSPW
Questoes de multipla escolha
Referencias

415
415
416
419

Introdu~ao

aAnalise de Fatores

Panorama do capitulo
12.1

12.2
12.3
12.4

12.5
12.6
12.7
12.8
12.9
12.10
12.11
12.12
12.13
12.14

398

420
420

Qual e 0 objetivo da amilise de fatores?


Principais tipos de analise de fatores
Uso da analise de fatores na psicometria
Yisualizar;ao de fatores
0 conceito de analise de fatores
Denomina"ao de fatores
Cargas de variaveis em fatores
Matriz das correlar;Oes
Matrizes com rota"ao e sem rotar;ao
Plotagem das variaveis no espar;o dos fatores
Rotar;ao da matriz
Execur;ao da an3.lise de fatores
Uso de fatores ou componentes em outras analises
Significado das cargas negativas
SPSSPW: analise de fatores analise de componentes principais

424
425
427
427
429
431
432
434
435

Resumo
QuestOes de multipia escolha
Referencias

452
452
455

420
422
423

441
442
443

18

13

Sumario

Sumario

Analise de Tres ou Mais Grupos Controlando


Covariavel

Panorama do capitulo
13.1
13.2

14

456
456

SPSSPW: obten"ao de urn diagrama das linhas de regressao


Grupos preexistentes
Delineamentos pre e p6s-testes
SPSSPW: obten"ao de resultados de uma ANCOVA

458
463
470
473

Resumo
Exercfcios para 0 SPSSPW
Quest6es de multipla escolha
Referencias

482
483
484
486

Introdu~ao

it Analise Multivariada de Variancia (MANOVA)

487

Panorama do capitulo

487

14.1
14.2
14.3
14.4
14.5
14.6
14.7

487
488
488
489
491
496
497
499
500

Estatfsticas multivariadas
Por que utilizar a amilise multivariada de variiincia?
Analise multivariada de variiincia
A 16gica da MANOVA
Condi,,6es da MANOVA
Qual 0 valor F?
Post-hoc: analise de variaveis dependentes individualmente
14.8 Variaveis dependences correlacionadas
14.9 Como relatar essas analises
SPSSPW: execu"iio da MANOVA com uma variavel independente entre
participantes e duas variaveis dependentes
14.10 Delineamentos denlre participantes
SPSSPW: uma variavel independente denlre participantes e duas variaveis
dependentes

15

15.2

Efeito de uma

502
504
512

Resumo
Exercfcios para 0 SPSSPW
Quest6es de multipla escolha
Referencias

515
516
518
523

Estatistica Nao-parametrica

524

Panorama do capitulo

524

15.1

525
525

Aternativas ao r de Pearson: 0 p de Spearman


SPSSPW: analise de correla"iio - 0 p de Spearman

15.3

19

Alternativas ao teste t Mann~ Whitney e Wilcoxon


SPSSPW: teste de duas amostras independentes - Mann-Whitney
Exercicios para 0 SPSSPW
SPSSPW: teste de duas amostras paramedidas repetidas - Wilcoxon
Exercfcios para 0 SPSSPW
Alternativas para a A!'!OVA
SPSSPW: teste para amostra~ independentes com mais de duas condi,,6es
Kruskal-Wallis
Exercicios para 0 SPSSPW
SPSSPW: teste de medidas repetidas com mais de duas condi,,6es - teste
de Friedman
,.

528
531
535
539
542
543

Resumo
Exercfcios para 0 SPSSPW
Quest6es de multipla escolha
Referencias

552
552
553
556

Respostas das atividades para 0 SPSSPW, dos exercfcios e


das questOes de multipla escolha

557

Apendice 1: Tabela dos escores z e da propor"iio da distribui"iio


normal padriio

601

Apendice 2: Tabela de r para z,

603

Indice

604

544
548
549

Passeio Guiado pelo Livro e Site*

htatistica DewiliYa

[]...001....
~

Panorama dos

capitulos. UsIa

o que voce deve


entender ao final
de cada capitulo.

__ ..
..

'~~~: .~ ~:::.:

~?~~;~;;~~
.
. ---_.
"-

._"-'-"~
~~-''''~'''---'-.~
~

._

"--

~-:.:::---:::.~--=:"'::::::=:;;;~..=...::

_._ .. __.
~~~~;;~~~
__ . . -..-"""""-_-_I
-------......._.
----_
_...._-__--
.... _. __....._...---._

~=:.~~~

--_. _--
~~--.

.... _-_
.
._'-_----. ---
-._..,-,---_
.. __ ...
------_._---
.-_
.--..
_,..--_
- ...... ---- .. -. __ ._. ..
...

....

_---~_._

-__.---_._._-_
_--------..._._.. _-_
_-_ -

~
_
.
I
.

::.::..=::.....-::~~::::--;.-;::::=

.......

tf..

Caixas de

exemplos.

Destaca as ideiaschave que estao


sendo discutidas
para facilitar 0
entendimento.

........

............

.....-_.~.,._-

....

---------_._
.
---------"'
_----_
-_"-. _
__
'_"_"-."
._--_
.. __
.. --.- ..
------------..
.......
..
_--

...-..... __
.. -..--- ---_
... _----_
. __---.
.. __ . .. _
.. -- . _.. _._
...

0.-

Caixas de
atividades.
Fornece
oportunidades
adicionais para
voce testar sua
compreensao das
teorias e ideias
discutidas,

.-

......

...
~.:.==~.::~=:.~~
..-.
---.---.-.-,,--~._.

Pontos de
discussao.
Explora
diferentes ideias
ou teorias em
detalhe.

.nnw".
I~."'=-:S:-"""2'''''=-;
,..,,~ ."

Exemplos da

'''~~!.-:'

'_M~

:::.=.====.~:;::-:::::

:::-'-:'='::=.::::-=::::::.=::=::

::?S::'=:?=-~~7':::'=--...::

I ~~~i:E"-;:-;;;;~

~"--:....~.:--:.=._

Enri~uece as

~.;::.::::..:;::-=:::=-.-=---:::==-=-

outras areas

de pesquisa ou

::3='':'::-_.==.~-;::=.::...-:-..:.-;:

~l~t~t~

m,""",,

Caixas de

cuidado. AOf-'~'-~

longo do texto
servem de aviso
sobre posslveis

problemas ou
questoes a serem
considerados.

~~=::::-...==

P":::'::..t_.-

_--..----(..,--........

; - ._.i."E==-=.==::
.-. ,.".. ,~.".,

1~1

.-c;.. -c;-...,...,.,c;-:..:-7.
.. "7
.. -;-;.

jail '....... ~-.."., .. -......... ~-~,--

N. de R. No endere'fo www.booksites.netldancey. 0 leitor enconlM materiais para estudo. que incluem: Quest6es de muhipla escolha. que auxi
liam a leslar a aprendizagem: arquivos de dados do SPSSPW; guia de eSludos: e links com oulros sires relevanles. CONTEUDO EM INGLES.

.--

..

::::~~:c:E~~:_=.::

.~.

~==.~~

~~{f~f~~=~~~

_._--------

~=E~::-=-7=~==~

=~~7e=~- i 8

T.".

.._ _..

G" ;=-..r,;;"

.~:-=~-==.:.:~==::-::'::;:-:-':::::

\01

"m...

figuras. Servem
de auxilio ao
entefldimento e a
f1xa~ao do texto.

II::lII :::-----_._._--

Captura de telas
comentadas.~-.. _----=~~'=-'.
Sao dicas visuais
t.=::?

que Ilustram
=-="'=...
exemplos praticos,
g~~

..

"-==,~~---I

__

==c:-t

... -------._._.-1.
.... "_.--.-
.. _-- ...
00

_--~_

..._

.. _ _. _ - -

-_._-_._-"'-~

......

opiniao

~~~=.=--:;;:

i.~1k:~~~
___ . _---_. __ .

===--:-~==:=~-==:
-...-"-------_
.. _-_.

Sumarios de tim ~==-:=:_:.:=-.


de capitulo.
. =~-:-;:---..:=.:.:::
Permitem uma
.
revisao dos
=~--==='':;
pontos principais
:
de cada capitulo.
. ;.=.:~ .-:::-=":~

:=.':::::=:::.==-_._

=:=-:.:::-=-=-.:..-=

_--_ _-----

..---_._
-----------_.
--_
. _.-
...

...

_-_ __
..

_-------
.....-_
"-_._-_._--,-,,,
.. _--
...... --_.. _------
.

~------
_--~-------
~------

_._-----_.

Exerdcios com 0
SPSSPW. Ao final

~~~Q~~
fornecem uma
oportunidade
para teslar a
aprendizagem.

de cada capitulo.
fornecem uma
oportunidade
para testar a
aprendizagem.

c=

M'_._~"_

....,.. _.__..

Questoes
de multi pia
escolha. Ao final

..__

;i(11!!~~~.

....._------

-.. . ---P-

_---~

r-ili-:Fornecem
Referendas.
op<;6es
de leituras
adicionais.

Variaveis e Projeto de Pesquisa

~,::~. ~ 'l:..~-':';'.::2~:"'::'_-::.?:~=.:_

"_._-
-_.---

~':"''''";':'~:::':'';,:,,-=--;::::~-::.-;-;.'----'

_.~-.

.~==-....::=.-
.. .-.-._0 _ _

..

_--

:?:~.~--.:?=-=:

,-

. :--::"":":":'-:::.---:,

_--_

..-----_...

Panorama do capitulo

.::-====--=.-=.::..-=..;

Na tentativa de explicar como utilizar e entender estatistica. talvez seja melhor iniciar com 0
destaque dos principais topicos para 0 delineamento de uma pesquisa. Descreveremos. entao.
os aspectos mais importantes de um projeto de pesquisa com 0 objetivo de mostrar como ele
influencia 0 uso da estatistica. Assim, neste capitulo queremos ensinar a voce 0 seguinte:

variaveis continuas, discretas e categoricas


variaveis dependentes e independentes
projetos correlacionais, experimentais e quase-experimentais
projetos entre e dentre participantes

SPSS data sets


S.IKt ttl' 1000..... '"9 W-, to .cc&ss SPSS tI~t", set' tilE'S ,..I.abl'IO to ttlll th",pter

1.1

;"'~.i~

"'-'""""9 ''',

Arquivos de
dados do
SPSSPW.

' ......... .:>

l _ l - . I P . ... _ l . . . _

........ b".--.L

~-..l!l:rulu-...

...
CD

variables are:

("

something thet can vary In terms of


predslon.

lOomBthlng that we can m.alOure.

(111n11

Questoes de
escolha multipla
adidonais.

Por que ensinar estatistica sem formulas matematicas?

n" .';I>~~ .;......, ~ ,',

A estatistica como urn conteudo tende a despertaf medo em corac;6es e mentes de muitos es
tudantes de ciencias sociais e em muitos palestrantes' tambem. Entender os conceitos estatfsticos
nao deve, no entanto, ser mais dificil do que compreender qualquer outro conceito teorico (por
exemplo, 0 conceito de inteligencia). De fato, alguem poderia pensar que entender um conceito
bastante concreto tal como 0 de m6dia aritmetica seria mais facil do que compreender 0 conceito
psicol6gico, bern mais vago, de "uma atitude". Ainda assim, a cada ano. parece que a maioria
dos estudantes, que aparentemente percebem muitos conceitos nao-estatfsticos como urn caso
consumado, lutam para entender estatfstica. No nosso modo de ver, muitas pessoas temem a
estatfstica porque os conceitos estio perdidos em meio as formulas matematicas. Desta fonna,
procuramos explicar a estatfstica de um modo conceitual, sem confundir os estudantes com
f6nnulas matematicas desnecessarias - isto e, desnecessarias hoje em dia, na era dos pacotes
computacionais. Se 0 estudante quer aprender estas f6nnulas para melhorar 0 seu conhecimento,
que ponto de partida melhor do que um entendimento conceitual da estatfstica?
A estatfstica tende a ter uma ma reputac;ao, como ilustra a maxima de Disraeli": "Existem
tres tipos de mentiras: mentiras, mentiras deslavadas e estatfsticas". Entretanto, 0 problema
nao e da estatfstica, mas sim da fonna como ela e utilizada. Com freqiiencia, particularmente
na polftica, a estatfstica e utilizada fora de contexto. Esse problema e c1aramente ilustrado no
seguinte trecho extrafdo de urn artigo publicado, em 2002, no Guardian ''':

C the meln faaJs of "'SBIII"Ch In sdence.


C'

ell of the above.

N. de T. 0 tenno no original ewcturer que e mna calegoria de professor nas universidades inglesas.

N. de T. Benjamin Disraeli (1804-1881). primeiro min.'lro britanico em 1868 e 1874 a 1880.

...... N. de T. Jomal britanico fundado em Manchester em 1821.

24

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

o site do partido gira como 0 1984, de Orwell'

As variaveis sao 0 foco principal da pesquisa em ciencias_ Uma variavel e simples mente
algo que pode variar, isto e. pode assumir valores ou categorias diferentes. Alguns exemplos
de variaveis sao genero (sexo). velocidade de digita<;ao, velocidade maxima de urn carro.
numero de sintomas registrados de uma doen<;a. temperatura, publico em urn festival de
rock. nfvel de ansiedade. numero de goIs em uma partida de futebol. inteligencia. numero
de encontros sociais ao levar 0 cachorro para passear. quantidade de violencia na televisao,
ocupa<;iio e cores favoritas. Estes sao exemplos de itens que se pode medir e registrar e que
variam de uma situa<;ao ou pessoa para outra.
Por que estamos interessados em variaveis? Geralmente nos interessamos por variaveis
porque queremos enlender 0 motivo da sua varia<;ao. De forma a compreender esta varia
I<ao. devemos ter capacidade de medir e registrar as anera<;5es nestas variaveis em qualquer
situa<;ao dada.

Par David Walker

partido dos trabalhadores tem sistematicamente manipulado dados em sell sile para 1II0S
trar melhorias lIa sa'ide. escolaridade e OIl/ros servifos. de acordo com 11m estudo nao-pllblicado.
.ua prtitica foi iniclada 110 correr das elei~'6es do ultimo ana e tem continuado desde entrio, COlli
a partido dos trabalhadores apresentando ao publico estatfsticas tendellclosas de crimes e deselll
prexo. bem como de gastos com escolas e hospitais.
Os mimeros tem sido maniplliados para fornecer uma melhor impressao sabre a deselllpenlw
do partido elll nivellocal.
111 11111 artigo de pesqlli.w circulando elllre academicos. apos ter sido apreselltado recellte
lIIellle elll '1/I1{/ cOllferencia de lima associa~'rio de estudos polftkos. qllatm renolllwlo.\ ge6grafo.\
se detiveralll nO.\ millleros pllblicados I/O sile para areas locais. Liderados pelos professores DanllY
Dorlillg da Vniversidade de Leeds e par Ron Johnston da Vniversidade de Bristol. a eqllipe verifi
COli qlle 0 partido consistenremenre ajllslOlI e manipulou dados sem conhece-los.
m Vel de fornecer a impressao de lima serie de meias verdades ocasionais. esta comerando
a parecer qlle este sllprimel/IO de valores distorcidos e uma estraregia de longo praw do partido.
disse 0 jomal.
o webmaster do partido e cOlllparado a Winston Smith. persol/agem do livro 1984 de George
Ome!. que passava 0 sell tempo I/O minisrerio do abasteclmento reescrevendo a Ilistoria. Nenil/llll
Illil/lero individllalmenre e falso no sentido estrito da palavra. t afonna como sao agrupados - lIIis
IIIrando e emparelhando areas e anos para dar a impressao de que as coisas me/l/Oraram - qlle luio
esincera como mn todo_
Par meio do codigo postal, as visitantes do site do partido podem. ao que parece. acessar
informafoes detalhadas sabre a local onde vivem. No entanto. alguns dos numeros apresentados
referem-se ao Reillo Vnido all a Inglaterra como um todo, outros a regioes inreiras. alguns a area
de IIl11a cidade all munidpio, mas muitos poucos a uma area especfjica e muito menos a rlla onde
as pessoas viwm.
Os visitanres do site slio infonnados sabre a aumento de enfermeiras sem ser diro qlle os
/IIlmeros se referem as regioes do NHS em vez de hospitais especfjicos. Melhorias na edllcarlio
sao anunciadas sem que a pliblico seja infonnado que se referem a toda uma area educacional- a
qual pode canter ate 20 regioes. As taxas de criminalidade no site nlio slio especfjicas ao codigo
postal. mas a toda uma area policlal. algumas muito grandes au are mesmo a Inglarerra e ao Pais
de Gales como um todo.
(Extraido do Guardian de 8 de outubro de 2002)'

o estudo mencionado nesta reportagem foi de fate publicado em 2002 no The Political
Quarterly (Dorling et al.. 2002).

Este artigo ilustra claramente a importancia de se colocar estatfsticas em urn contexte


correto. Se for dito a voce, por exemplo, que a altura media de urn adulto e 173 cm. isto pode
ser correto para urn homem brasileiro. mas nao necessariamente para urn homem de uma
tribo africana de pigmeus. na qual a altura media pode ser tao baixa quanta 145 cm.

1.2.1

Caracteristicas das variaveis


Pode ser notado nos exemplos de variaveis dados que elas apresentam diferentes carae
terfsticas. Enquanto se pode medir a temperatura em termos de graus Celsius ou Fahrenheit e
atribuir urn valor ao resultado, nao se pode fazer 0 mesmo com 0 tipo de ocupa<;ao. por exem
plo. Isso representa uma caracterfstica importante das variaveis: 0 quao precisamente podem
ser avaliadas. No topo, mais preciso, da escala uma variavel e dita continua, ou seja. ela pode
assumir qualquer valor em urn intervalo dado. Dito de outra forma, a variavel nao varia em
passos discretos. Urn exemplo de variavel contfnua e a temperatura Ela e continua porque se
pode medir a temperatura. digamos. como sendo 40C ou, entao. se pode medi-Ia de forma
mais precisa como 40,2558 c. Outro exemplo, menos 6bvio. e a quantidade de violeneia na
televisao. Pode-se medi-Ia em termos da quantidade de tempo que aparece na tela por dia. Se
avaliada desta forma, isto e. em termos de tempo, a variavel pode assumir qualquer valor em
terrnos de segundos ou partes de segundo, como 1000 s ou 1000.1235672 s por dia. A uniea
Iimita<;ao na precisao da medida de tal tipo de varilj.vel e a acuracia do equiparnento de me
dida. Com variaveis contfnuas. existe a hip6tese implfcita de que seja contfnua mesmo que a
forma de medi-Ia nao 0 seja. Dos exemplos fomecidos anteriormente. temperatura. nivel de
ansiedade. velocidade maxima de urn carro. velocidade de digita<;ao e inteligencia podem ser
consideradas contfnuas. enquanto as demais nao (veja Tabela 1.1).
Uma variavel pode. tambem. ser discreta, ou seja, ela pode assumir somente valores
discretos dentro de urn determinado intervalo. Urn exemplo deste tipo de variavel e 0 nll
mero de sintomas observados de uma doen<;a que uma pessoa possui. IS50 somente pode ser

Tabela 1.1

1.2

Variaveis
Explicamos urn aspecto muito importante das estatfsticas: elas s6 tern sentido em urn
contexto. Mas 0 que e que a estatfstica real mente faz? Essencialmente. a estatfstica nos for
nece inforrna<;5es sobre fatores que podemos medir. Na pesquisa. as coisas que medimos sao
denominadas variriveis.
N. de T. George Orwell (1903-1950), esenlOr ingles.

** N. de T. NHS (Narional Health Service) - Servityo Nacional de Saude.

, Veja pagina 55 do GI/ardian.

25

Exemplos de variaveis continuas, discretas e caleg6rieas

ContfDoas

, DI5c:retaS:

Temperalura

Genero (sexo)

Ocupa~ao
Cor favorila

Numero de sintomas regislrados de


uma doen~a
Velocidade maxima de urn carro Numero de carros possufdos
Numero de gols em uma partida de
Velocidade de digil~ao
fUlebol
Numero de encontros sociais enquanlo
Inleligencia
passeia com 0 cacholTO
Participanles de urn festival de rock
Nfvel de ansiedade
Numero de filhos de uma familia

.cilra6rkas

TIJlO de restaurante

26

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


registrado em termos de presen~a ou nao do sintoma. Outro exemplo seria se escolhessemos
medir a quantidade de violencia na televisao de acordo com 0 numero de incidentes violentos
por semana. Nno podemos medir esta variavel em termos de fra~oes de incidentes violentos
por semana. Assim, 0 numero de incidentes violentos semanais na televisao e uma variavel
discreta. Dos exemplos dados anteriormente, as variaveis discretas mais 6bvias sao 0 numero
de "sintomas registrados de uma doen~a", 0 de "encontros sociais enquanto passeia com 0
cao", 0 de "freqiientadores de urn festival de rock", 0 de "carros possuidos", 0 de "filhos por
familia" e 0 de "goIs em uma partida de futebol".
Quando estudamos variaveis discretas e continuas, existe 0 perigo de confundir a variavel
subjacente - a variavel propriamente dita - com a forma de mensura-Ia. Uma variavel pode
ser teoricamente continua, mas a forma de medi-Ia e sempre discreta, nao importa 0 grau
de precisao da medida utilizada. Poderfamos medir a ansiedade (uma variavel teoricamente
continua) utilizando urn questionario (p. ex., 0 Inventario das Caracteristicas e Estados da
Ansiedade: Spielberger et aI., 1983) no qual 0 escore total no questionario fornece uma
indical.ao do nivel de ansiedade de uma pessoa. 0 escore total pode aumentar somente em
unidades, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensura~ao da ansie
dade e discreta, enquanto a variavel envoi vida e de fato continua.
Ademais, na analise de variaveis discretas, e comum trata-Ias como continuas. Muitos dos
testes estatisticos usados indicam que estamos tratando com variaveis continuas. Freqiiente
mente, quando uma variavel discreta pode assumir urn grande numero de valores dentro de
certo intervalo (p. ex., publico de urn festival de rock pesado), pode, para efeitos praticos, ser
tratada como se Fosse continua na utiliza~ao do teste estatistico.
Outro tipo de variavel e a categ6rica: aquela em que os valores assumidos sao catego
rias. Urn born exemplo e genero, que pode ter apenas dois valores: masculino e feminino.
Variaveis categ6ricas podem, algumas vezes, apresentar muitos valores possiveis, como 0
tipo de ocupa~ao (p. ex.,juiz, professor, advogado, engenheiro. etc.). Quando lidamos com
dados categ6ricos temos urn grande numero de variaveis que gostariamos de investigar. Po
derfamos, se desejassemos, categorizar pessoas com base em "se elas comeram ou nao bolo
de chocolate as 6h30min desta manha' ou talvez (ou pouco mais bizarro) 'se elas deram ou
nao contribuic;oes ao time de futebol Manchester United". Os unicos exemplos 6bvios de
variaveis categ6ricas apresentadas na lista do inicio desta sec;ao sao ocupa~ao, genero e cor
favorita.
Tente se assegurar de que voce entendeu os diferentes tipos de variaveis que esta medin
do. pois isto e importante quando se decidir como analisar os dados.

1.2.2

Dicotomiza~ao

de variaveis continuas e discretas

Existem casos em que os pesquisadores convertem variaveis discretas e continuas em


variaveis categ6ricas. Por exemplo, poderfamos querer comparar a habilidade espacial de
pessoas altas e baixas. Podemos fazer isto comparando pessoas que sao mais altas do que
193 cm com aquelas que sao mais baixas do que 147 cm em urn teste de habilidade espacial.
Desta maneira, escolhemos pontos na escala continua (altura) e decidimos comparar aqueles
participantes que estao acima e abaixo destes pontos (veja Figura 1.1).
Outro exemplo poderia ser a comparac;ao da habilidade de mem6ria de pessoas ansiosas
e nao-ansiosas. Pode-se medir os niveis de ansiedade utilizando urn questionano, isto e, uma

$.

N. de T. STAI (State- Trait Aluiety Inventory).

27

Altura (an)

1001

(y~dit'Vari~W;i co~t1nua)

lIustra~ao

da conversao de variaveis continuas em categ6ricas.

variavel continua medida em uma escala discreta. Por exemplo, a escala hospitalar de ansie
dade e depressao apresenta valores que variam de 0 a 21. Para converte-Ia em uma variavel
categ6rica, iremos simplesmente comparar os escores superiores a certo valor (p. ex., diga
mos, II) com aqueles abaixo deste mesmo valor.
Essa dicotomiza~ao (divisao em duas categoriais) de variaveis discretas e continuas e
comum na psicologia e permite que se encontrem diferenc;as entre grupos que podem estar
nos extremos de variaveis discretas ou continuas, por exemplo, pessoas altas e baixas. No
entanto, nao recomendamos tal pratica, pais ela reduz a sensibilidade da analise estatistica.
Existe uma boa discussao de tais problemas em Streiner (2002) e Maxwell e Delaney (1993).
Mencionamos isto aqui para que voce possa estar ciente do que ocorre na literatura cientffica
e, assim, entenda 0 que 0 pesquisador fez.

PONTO DE D1SCUSSAO:
DICOTOMIZA(;AO DE VARIAvEIS CONTiNUAS
Por que os pesquisadores dicotomizam variaveis? Streiner (2002) ressalta 0 fato de que
muitas decisoes em psicologia, psiquiatria e medicina sao binarias. Neste tipo de decisao.
tem-se apenas duas escolhas. tais como se a pessoa apresenta ou nao problema mental, se
tern ou nao uma determinada doen~a, se precisa ou nao ser hospitalizada. ou se deve ou nao
receber alta do hospital. 0 argumento utilizado e que, se estes profissionais precisam tomar
decisoes binarias, entao e legitimo investigar estes tipos de variaveis. Tal raciocfnio e utiliza
do para dar suporte a pratica disseminada de dicotomizar variaveis continuas.
Streioer argumenta que nao precisamos ver as decisoes que os medicos tomam como
binarias. Ele sugere que seria melhor pensar em uma doenc;a mental, por exemplo, como urn
continuo. Quantos mais sintomas alguem apresenta mais afetado esta. Devemos medir tais

28

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

constructos de forma continua, e nao dieotomiza-Ios. Assim, em vez de se utilizar questio


narios para categorizar pessoas, poderiamos usa-los para obter uma medida na qual estejam
em urn contfnuo. Tal informatrao pode entao ser utilizada na decisao de como tratar certas
pessoas ou de alguma outra forma.
Urn exemplo pode ilustrar melhor a dicotomizatrao. Foi sugerido anteriormente que e
possfvel categorizar pessoas em ansiosas e nao-ansiosas com base em escores obtidos num
questionario. Pesquisadores investigando ansiedade utilizam regularmente questionanos des
ta forma. Aqueles partieipantes que apresentam altos escores sao c1assificados como de alta
ansiedade, enquanto os que tern pouca pontua~ao sao c1assificados como de baixa ansiedade.
o metodo de divisao pela mediana e muitas vezes utilizado com este prop6sito, categorizando
os que ficaram acima da mediana como ansiosos e os que ficaram abaixo como nao-ansiosos
(p. ex., Egloff e Hock, 2003).
Streiner argumenta que a pratiea de dicotomizar variaveis continuas tende a diminuir
o poder da pesquisa (0 poder de urn teste sera tratado nos Capitulos 4 e 7). A razao disto e
que se perdem muitas informarooes sobre os participantes. Por exemplo, suponha que duas
pessoas tenham os escores de 20 e 38 em urn teste de ansiedade e que, quando a variavel for
dicotomizada, eles seriio contados como de baixa ansiedade (os dois estao abaixo da media
na). Em qualquer analise subseqtiente baseada na categorizaroao feita, ambos serao tratados
como se possufssem 0 mesmo nfvel de ansiedade, isto e, serlio considerados nao-ansiosos.
Entretanto, de acordo com os escores originais, 0 nivel de ansiedade entre eles e bastante
diferente. Tratar estas duas pessoas como identieas em termos de nfveis de ansiedade nao pa
rece fazer sentido. Seria mais sensato tentar incluir os valores reais de ansiedade em qualquer
analise estatfstica realizada.
Alem disso. pode-se observar uma diferen~a muito maior entre os nfveis de ansiedade das
duas pessoas c1assificadas como nao-ansiosas do que entre uma c1assificada como ansiosa e
a outra nao. Por exemplo, suponha que a median a fosse 39, entao todos aqueles acima deste
escore seriam classificados como ansiosos e todos os abaixo como nao-ansiosos. Pode-se ver
aqui que uma pessoa nao-ansiosa que tenha urn escore de 38 tern muito mais em comum com
uma ansiosa cujo escore seja 41 do que com outra nao-ansiosa cujo escore seja 20. Ainda em
qualquer analise posterior, os participantes com escores de 20 e 38 sao classificados como
identicos em termos de ansiedade, e estes slio c1assificados como diferentes de uma pessoa
que tenha urn escore de 41. Isso nao faz sentido.
Streiner ainda ressalta pesquisas que mostram que analises utilizando variaveis dicotomi
cas apresentam aproximadamente 67% da eficiencia das que utilizam as variaveis contfnuas
ou discretas originais. Isso e uma grande perda de sensibilidade do estudo. Significa que
voce tern apenas 67% de probabilidade de detectar relacionamentos entre variaveis se estiver
utilizando variaveis continuas ou discretas dicotomizadas. Isso e uma seria desvantagem na
condu~ao de uma pesquisa. Alem do mais, a perda de poder nao e 0 unieo problema que surge
quando variaveis sao dicotomizadas. Maxwell e Delaney (1993) mostraram que esta pratiea
pode levar a achados espurios na analise estatfstica.

Conseqiientemente, aconselhamos a nio dicotomizar variaveis continuas.


~

[~) ~tivid~de 1.1

..'

. .'. .

". '

'Q~a.~s:d~~,~~irit,~:Y.~pa.~iS sao cat~6riql~; d~eta~ ci~~c?'?~n,~~~r


l,. . : Velocid~e

29

do vento... . ' . :. "';'" '". ::.;:<.


"... Tipos detltulos.o:ferecidos por;umauniversidade

'. Nlvelde extroversao


. . ..

... Marcas de carros

Times de futebol .
Numero de pe<;as de xadrez capturadasem um~go ' ..

. Peso de pandas gigantes


.,.. ;

Numero de pinturasexpostas em galerias dearte

'.....

' .. '.. '.

As reSpostas corr~aspodem ser enc6htrada~ n6fincil'~io"liVfb.'; .

1.3

Planejamento da pesquisa
Existem muitas tecnieas estatisticas que podem ser usadas para se analisar dados cole
tados em uma pesquisa. Neste livro serao apresentadas algumas das mais utilizadas. Muilas
destas tecnicas apresentam formulas matematicas complexas para calcular as estatisticas en
volvidas. Estas formulas nlio serlio abordadas, pois preferimos fomecer ajuda para que voce
entenda as tecnieas a partir de urn ponto de vista conceitual.
Urn dos principais fatores na determinaroao de qual teste estatfstico sera utilizado para
analisar os dados e a forma como 0 estudo foi projetado ou planejado. Existem vanas manei
ras de projetar ou planejar urn estudo, e a forma como este e feito exercera grande influencia
nos tipos de procedimentos estatfsticos disponfveis. Algumas vezes, os pesquisadores querem
observar diferenroas entre dois grupos de participantes em uma variavel particular. Em outra
situa~iio pode-se querer verificar se duas variaveis apresentam a1gum tipo de relacionamento.
Urn exemplo de procura de diferenroas entre dois grupos pode ser a pesquisa relatada por Ni
cholas e Collis (2000). No estudo, eles compararam 0 nt1mero de encontros sociais que pessoas
tinham enquanto levavam 0 cao para passear com a quantidade de encontros sociais sem 0 cao.
Constataram que caminhar com 0 clio aumenta 0 numero de encontros sociais. Urn exemplo de
pesquisa correlacional foi relatado por Walsh e Ugumba-Agwunobi (2002). Neste estudo, entre
outras coisas, investigou-se 0 relacionamento entre ansiedade causada pelo estudo da estatis
tiea e a procrastina~ao. Os autores verificaram que existem relaro5es entre vanos componentes
da ansiedade causada pelo estudo da estatistica (doravante denominada ansiedade estatfstica)
(p. ex., temor do professor de estatistica) e a procrastinarolio. Os testes estatisticos que seriam
utilizados nestes exemplos slio denominados de testes de diferent;as e testes correlacionais,
respectivamente. A forma de planejar 0 estudo influenciaci a decislio de qual destes testes sera
utilizado. Nas serooes seguintes serao apresentadas varias maneiras de se planejar estudos e os
tipos de testes disponfveis para que 0 pesquisador analise os resultados.

30

1.3.1

Estatistica sem Matemalica para Psicologia

Christine P. Dancey & John Reidy

Variaveis de confusao'

1.3.2

Caso se pense no exemplo da caminhada com 0 cao, percebe-se que existem outros fatores,
alem da posse do cachorro, que podem afetar 0 numero de encontros sociais das pessoas enquan
to caminham. Alguns destes fatores incluem a timidez de quem esta caminhando, a atratividade,
o genero, a rar;a do cao e diversas outras variaveis. Todos sao fatores que 0 pesquisador nao levou
em considerar;ao, mas que podem ter influenciado a interar;ao social. Esses fatores sao denomi
nados variaveis de confusao. Em qualquer situar;ao de pesquisa, quer em quimica, fisica, quer
em psicologia, deve-se levar em conta a influencia destas variaveis. Se elas forem negligencia
das, as conclusoes obtidas do estudo podem nao ser confiaveis. Assim, no estudo da caminhada
com 0 cachorro, se as variaveis de confusao nao sao controladas, nao e possive! dizer, ao certo,
que as diferenr;as obtidas se devem apropriedade do cachorro. As diferenr;as podem ocorrer por
quaisquer outras combinar;Oes das variaveis mencionadas. A principal razao para se fazer pes
quisa em condir;Oes de laborat6rio e tentar manter 0 controle sobre as variaveis de confusao tanto
quanto possivel. Podera ser notado que muitas das questOes de pesquisa abordadas neste capitulo
foram projetadas com 0 objetivo de reduzir a influencia das vari<lveis de confusao.
Voce deve estar cienle de que para cada varhivel medida existirao varias outras que po
dem estar relacionadas a ela (veja Figura 1.2, por exemplo). Quando um estudo como 0 da
caminhada com 0 cachorro e conduzido, nao e possivel termos certeza se e a existencia ou
nao do cao responsavel pelas diferenr;as na inlerar;ao social. Assim, precisamos tentar elimi
nar as outras variaveis (as de confusao) como possiveis razoes para as alterar;oes observadas.
Fazemos isto tentando controlar estas variaveis. por exemplo, tentar combinar 0 maximo
posslvel os participantes com e sem 0 cao nos aspectos timidez, atratividade e genero. Ainda,
pode-se assegurar que todos os participantes far;am a caminhada com 0 mesmo tipo de cao e
que caminhem nos mesmos hormos e dias da semana. Uma vez que se tenha controlado estas
variaveis, entao e possivel se ter mais confianr;a na conclusao de que caminhar com urn cao
exerce influencia sobre 0 numero de interar;oes sociais que uma pessoa tera.

C:d'~

~"m:!:m~m.
G~

Delineamentos correlacionais
Expusemos que 0 principal objetivo da ciencia e 0 entendimento das variaveis. Mais
especificamente, desejamos entender como e por que certas variaveis estao relacionadas. Tal
vez a forma mais simples de examinar 0 relacionamento entre variaveis seja a utilizar;ao de
delineamentos correlacionais. Em tais projetos, medimos a variavel de interesse e verificamos
como cada variavel se altera em relar;ao as mudanr;as provocadas na variavel de interesse. Urn
exemplo pode auxiliar a entender a situar;ao. Anteriormente, nesta ser;ao, descrevemos, de
forma breve, 0 estudo de Walsh e Ugamba-Agwunobi (2002) investigando 0 relacionamento
entre ansiedade estatistica e procrastinar;ao. Neste estudo, os pesquisadores mediram a ansie
dade estatistica com a Escala de Ordenar;ao da Ansic:dade Estatistica' (Cruise et aI., ! 985).
A escala mede seis componentes da ansiedade estatistica, incluindo medo do professor de
estatlstica, autoconceito de habilidades computacionais, ansiedade em aulas e provas, medo
de fazer perguntas. ansiedade de interpretar;ao e valor da estatistica. Os autores realizaram
uma analise correlacional e descobriram que existem rel~oes entre procrastinar;ao e tres
componentes da ansiedade estatfstica (medo dos professores de estatistica, medo de solicitar
ajuda e ansiedade de interpretar;ao). Os pesquisadores concluiram que as variaveis medo da
estatistica e procrastinar;ao estavam correlacionadas. Isto e, se uma das variaveis mudar a
outra tam bern mudara, ou ainda as duas variliveis covariam. Deve-se notar que os terrnos "re
lacionar", "correlacionar" e "covariar" sao muitas vezes utilizados indistintamente.
Outro exemplo excelente de pesquisa conduzida com a utilizar;ao de desenho correla
cional e a que verifica a relar;ao entre 0 habito de fumar e 0 cancer. Tern side geralmente
verificado que, a medida que aumenta 0 consumo de cigarros. 0 mesmo ocorre com a inciden
cia de cancer. Portanto. existe urn relacionamento entre 0 numero de cigarros consumidos e a
chance de desenvolver cancer.
Se voce usar urn delineamento correlacional, entao 0 tipo de tecnica estatistica provavel
mente utilizada sera 0 coeficiente de correlar;ao momento-produto de Pearson" ou talvez 0
coeficiente de correlar;ao ro de Spearman... Tais coeficientes serao abordados nos Capitulos
5 e 15, respectivamente.

( .:m.",,)
. .:- .
:" .... J.:

sociais em uma

lIustra~ao

<om;........ P;>m"

das variaveis que podem influenciar

numero de

Rela~ao

intera~6es sociais

entre ansiedade estatistica e

procrastina~ao.

de uma

pessoa.
N. de T. Sao lambem ulilizados os Icrmos varia\'cl de confundimento ou confundidora.

31

N. de T. STAR (Statistics Anxiety Ratillgs Scale, Cruise el aI., 1985).

N. de T. Karl Pearson (18571936).

N. deT. Charles Edward Speannan(1863-1945).

32

1.3.3

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Causa~ao

Urn outro exemplo da limila9ao do delineamento correlacional e 0 relacionamento entre


ansiedade e depressao. Muitos estudos mostraram que ansiedade e depressao estao allamente
relacionadas (veja Clark e Watson. 1991). Pessoas que apresentam altos nfveis de ansiedade
tambem apresentam altos nfveis de depressao. Poderfamos dizer. entao. que depressao causa
ansiedade ou ansiedade causa depressao? Nao. nao podemos. E bastante provavel que alguma
variavel interveniente esteja entre estes dois estados de humor. De fato. 0 que se tern veriticado
e que a ansiedade e a depressao apresentam urn elemento angustiante geral em comum. e e ere
que explica 0 alto valor do relacionamento entre as duas variaveis (veja Figura 1.5).
E possfvel estabelecer relacionamento causal utilizando delineamentos correlacionais.
mas estas situa96es sao bern mais complexas do que os delineamentos indicados nesta serrao
e envoi vern a medida das variaveis em varios pontos rlO tempo.

A questao da causarrao problematica em ciencia. ainda mais quando utilizamos deli


neamentos correlacionais. Urn dos principais objetivos da ciencia, e descobrir a causa dos
acontecimentos. Em todos os ramos da ciencia pesquisadores estao tentando determinar
relarr6es causais entre variaveis. Por exemplo. Newton' produziu uma teoria elegante para
explicar 0 que causa a queda de marras. Estabeleceu uma relarrao causal entre a queda das
marras e a gravidade. Em muitas pesquisas psicol6gicas tambern tentamos estabelecer tal re
larrao causal. Quando usamos delineamentos correlacionais. no en tanto. e diffcil estabelecer
se a alterarriio em uma variavel causa a mudanrra em outra variavel. Isso ocorre porque em
tais delineamentos estamos simplesmente observando e registrando mudanrras em variaveis e
tentando estabelecer se elas covariam de alguma forma que farra sentido. Em virtude de que
estarmos apenas observando como as variaveis mudam. e diffcil (para nao dizer impossfvel)
estabelecer a relarrao causal entre elas. Para sermos capazes de fazer isto de forma mais facil.
e necessario manipularmos uma das variaveis (muda-Ia sistematicamente) e entao observar 0
que acontece com a outra variavel. Esta abordagem sera discutida mais tarde nesta serrao.
Uma das regras de ouro do delineamento correlacional e niio se poder inferir causaroo
a partir de uma correlariio. A industria do tabaco tern se valida desta fraqueza da correlarrao
para argumentar que nao existe evidencia de que 0 fumo cause cancer. Estritamente falando,
isso pode estar correto. pois os estudos tern side principalmente correlacionais. Todavia, con
siderado a quantidade de pesquisas feitas corroborando uma relarrao causal entre 0 habito de
fumar e 0 cancer. alguem seria tolo em ignorar as pesquisas e acreditar nas pessoas que estao
tendo lucro com a venda de tabaco.
Descobrir que ansiedade estatfstica e procrastinarrao estao relacionadas nao nos infor
rna muito sobre a relarrao causal entre estas duas variaveis. Pode ser que 0 au men to na
ansiedade estatistica aumente a procrastinarrao. ou entao que alterarr6es na procrastinarrao
causem alterarr6es na ansiedade estatfstica. De forma alternativa. podem existir outras va
riaveis, tais como uma neurose. que pode causar mudanrras tanto na ansiedade estatfstica
quanto na procrastina9aO (veja Figura 1.4). Voce pode ver, portanto. que a existencia de urn
relacionamento entre duas variaveis nao nos informa. necessariamente, muita coisa sobre
causa e efeito.

Neurose

Ansiedade estatistica

.
.._ - - - - - - - - - - -

.:;,

Possivel

rela~ao

causal entre neurose, ansiedade estatistica e

N. de T. Isaac Newton (1642-1727).

Procrastina~ao

procrastina~ao.

33

Angustia

Ansiedade

..

.... - - - - - , - - - - Aqui

Depressao

nao existe uma

conexao causal dii'eta


lIustra~ao do elemento comum compartilhado por ansiedadee depressao e a ausencia
de uma conexao causal entre eles.

1.3.4

Projeto experimental
Para estabelecermos relarr6es causais entre variaveis com mais facilidade, precisamos
manipular uma das variaveis de modo sistematico ever qual 0 efeito obtido na outra variavel.
Tal processo e. essencialmente, 0 realizado no projeto experimental'.
Urn dos delineamentos ou projetos mais utilizado em ciencia e 0 projeto de experimentos.
tambem denominado de experimento verdadeiro. Se voce lembrar de experimentos tipicos que
realizou. na escola. em quimica ou ffsica. percebera que eles representam 0 projeto de experi
mentos. Por exemplo. queremos ver 0 que ocorre com 0 s6dio quandoexpasto ao ar e comparar
isto com 0 resultado de sua exposi9ao aagua. Observarfamos uma rea,?-o lenta na condi9ao "ar"
(a superffcie brilhante do s6dio toma-se opaca) e uma rea9ao rapida nacondir;ao "agua" (0 s6dio
torna-se efervescente e pode entrar em combustao). Em urn experimento temos uma variavel
que estamos mensurando (0 estado do s6dio, denominada de variavel dependente) e queremos
descobrir que efeito sofrera a outra variavel. denominada de variavel independente (par exem
plo, ao que 0 s6dio esta exposto). A variaveI manipulada pelo observador e denominada de
variavel independente. isto e. 0 seu valor nao e dependente das outras variaveis investigadas.
A outra variavel do experimento e denominada de variavel dependente. Ela e denominada de
N. de T. Os termos em ingles sao DOE (Design Of Experiments) e 6pen"memal design (utiliDdo pelos autores). No Brasil sao

ulilizadas as ver.;Oes: projelo de experimentos, de.<enho de experimenlos ou ainda delineamenlode experimentos.

34

Christine P. Dancey & John Reidy


dependente porque depende dos valores da variavel independente. De fato, 0 prop6sito de urn
experimento e comprovar ou descartar tal dependencia.
Podemos conduzir tal pesquisa em psicologia, por exemplo. se quisermos veriflcar que
caminhar com 0 cao de fato influencia 0 numero de encontros sociais. Para conduzirmos tal
eSlUdo. tomamos urn grupo de pessoas e alealoriamenle sorteamos alguns para caminhar com
o cao. enquanto os demais caminham sem 0 cao. Poderiamos preyer que caminhar com 0 cao
acarretara mais enconlros sociais do que caminhar sozinho. Dessa forma, estabelecemos uma
hip6tese que sera testada por meio da estatlstica.
Vamos supor que 0 experimento foi realizado e verificou-se que os que caminharam com 0
cao tiveram mais encontros sociais do que aqueles que caminharam sozinhos. ESle resultado con
firmaria a nossa previsao. Entretanto, exislem varios oulros fatores que podem ler influenciado na
verifica,.ao de uma diferen,.a de encontros sociais entre as duas condir;6es (veja Figura 1.2). Como
saberemos que a diferen,.a observada foi causada pela manipula,.ao da variavel independenle em
vez de uma das possiveis variaveis de confusao? Nao sabemos. 0 que e posslvel fazer. nesle caso,
e tentar limilar 0 impaclo das variaveis de confusao sobre 0 eSludo. pela aloca,.ao aleat6ria dos
participanles as condir;6es da variavel independente. Por meio da aloca,.ao aleal6ria dos partici
pantes as condi,.6es. pode-se reduzir a probabilidade de que os dois gropos diflram em aspectos
como limidez. atratividade. genero e. assim. eliminar estes fatores enquanto causas possiveis da
diferenr;a no numero de encontros sociais entre os dois grupos. Se a aloca,.ao dos participantes as
condir;6es for feita de forma aleat6ria, entao poderemos ler mais confian,.a na nossa habilidade
para inferir urn relacionarnenlo causal entre a variavel independente e a variavel dependente (ca
minhar com ou sem cao e numero de encontros sociais). Ea a1oca,.ao a1eat6ria que toma 0 projeto
de experimentos tao util na delermina,.ao do relacionarnento causal entre variaveis.
Dessa forma, uma das principais caracterislicas definidoras de urn projeto de experimen
tos e a aloca,.ao aleal6ria dos participantes as condir;oes. Para ulilizar a aloca,.ao aleat6ria.
no exemplo mencionado, atribui-se a cada participanle urn numero. ao acaso, gerado em urn
computador. Pode-se, enlao. solicilar a lodos aqueles cujo numero seja inferior a urn determi
nado valor que carninhem com 0 cao e aos demais que caminhem sozinhos. Assim. teremos
alocado aleatoriarnenle os participantes a cada uma das duas condi,.oes do estudo.
E claro que a aloca,.ao aleal6ria e mais ulil para conlrolar fatores inlerpessoais, tais
como limidez. Exislem, entrelanlo, oulros falores relacionados ao projelO de experimenlos
que nao podem ser conlrolados pela aloca,.ao aleat6ria dos participanles as condir;oes. De
uma nova olhada na Figura 1.2 e ira notar que variaveis de confusao. como a hora do dia e
o tipo de cao, nao serao controladas pela aloca,.ao aleal6ria dos participanles as condir;oes
da variavel independenle. Eslas sao quesl6es que deverao ser tratadas por outros aspectos do
projeto de experimentos. como assegurar que variados tipos de cao sejam utilizados no estudo
e que as duas condi,.oes sejam realizadas na mesma hora do dia e no mesmo dia da semana.

Estatistica sem Matematica para Psicologia

os participantes nao sao alocados aleatoriamente as condi,.oes, pois ja sao homens ou mulhe
res. Assim, lemos urn projeto quase-experimental. Se for verificado que as mulheres lem mais
encontros sociais do que os homens, enlao sera possivel argumenlar que 0 falo de ser mulher
encoraje mais a inlera,.ao social.
Urn dos problemas com os projetos quase-experimentais e a aloca,.ao nao-aleat6ria das
varias condi,.oes que conslituem a variavel independente. Nao podemos ler cerleza de que
a manipula,.ao da variavel independente (ou deveriamos dizer pseudomanipula,.ao) e a res
ponsavel pelas diferen,.as enlre as varias condi,.oes. Assim, e mais dificil inferir rela,.oes
causais de projetos quase-experimentais do que de projelos experimenlais. Como ilustra,.ao,
o exemplo anterior pode apresentar algum fator, a1em do genero, que distingue os dois grupos
(lamanho, por exemplo). Pode ser que as mulheres sej;un vistas como menos amea,.adoras em
virtude de serem menores do que os homens. Desta forma, uma variavel de confusao impor
tanle infiltrou-se em nosso eSlUdo. Em virtude do au menlo do risco das variaveis de confusao
estarem associadas com estudos quase-experimentais, os eSludos experimentais devem ser
preferidos sempre que posslvel. Caso voce nao saiba se esta lidando com urn projeto experi
mental ou quase-experimental, observe a a1oca,.ao aleat6ria dos participantes as condi,.oes.
Se ela nao for uma caraclerislica do estudo, enlao e mais provavel que voce esteja lidando
com urn estudo quase-experimental.
Outra razao importante para preferir eslUdos experimenlais e 0 fato de muilas das tecni
cas eslatlsticas utilizadas indicarem que os participantes foram atribuidos aleatoriamente as
condir;6es. Se a alocar;ao nao foi ao acaso, pode-se ter uma redur;ao na validade das conclu
soes baseadas nestas lecnicas estatisticas. Na pralica este nao e urn grande problema, mas
voce precisa estar ciente de que ele existe.
Se voce esta utilizando urn eSludo experimental ou quase-experimental, enlao algumas das
tecnicas disponiveis para voce sao: 0 teste t, 0 tesle U de Mann-Whitney', 0 lesle de Wilco
xon" e a analise de variancia (ANOVA). Todos eles serna abordados mais adiante no livro.

1.3.6

Panorama dos delineamentos de pesquisa


Descrevemos tres dos principais delineamentos de pesquisa e como eles influenciam os
diferentes tipos de analises estatisticas que podemos utilizar. A Tabela 1.2 fomece urn breve
sumario das principais caracteristicas destes delinearnentos em conjunto com os lestes esla
tisticos que seriam apropriados a cada tipo.
Tabela 1.2

Panorama das principais caraclerfsticas dos varios delineamenlos de pesquisa

Deline8!i1ento
Experimental

1.3.5

Projetos quase-experimentais
Muilas vezes em psicologia queremos trabalhar com variaveis que nao podemos manipu
lar diretamente. Se quiserrnos comparar homens e mulheres de alguma forma, nao podemos
manipular 0 grupo ao qual cada participanle pertence. Nao e possivel alocar aleatoriamente
participanles as condi,.6es masculino e feminino. Assim, estrilamenle falando, nao temos urn
projeto experimental. Para ressaltar 0 falo de que tais projelOS nao sao estritamente experi
mentais, sao denominados de projelos quase-experimentais.
Como urn exemplo, suponha que eSlejamos conduzindo 0 eSludo da caminhada com 0
cao mencionado anteriormenle e que desejemos remover 0 genero como variavel de con
fusao. Podemos conduzir urn eslUdo no qual lentamos descobrir se as mulheres lem mais
encontros sociais quando caminham sem cao do que os homens. Pode-se ver que nesle estudo

35

Quase-experimental

Correlacional

~~~i~:~ ;:.', .

.' '.-~:- r "-~ ..

_ Manipula~ao cia variavel independente


- Aloca~ao aleat6ria dos participantes aos diversos grupos
- Analise por compara~ao enlre os grupos
_ Pseudomanipula~ao da variivel independente
- Aloca~ao nao-a1eat6ria dos participantes
- Analise por compara~ao entre os grupos
Investigar 0 grau com que as variaveis co-variam
Nao se pode inferir causa~ao a partir de correla~ao
Analisar por meio de testes de correla~o

N. de T. Henry Berthold Mam (1905-2000) eDonald Ransom Whilney (1915- ).


.. N. de T. Frank Wilcoxon (1892-1965).

.'I'este eStalfstico
_ Testes t
_ ANOVA
_ Teste V de Mann-Whitney
Testes t
_ ANOVA
Teste V de Mann-Whitney
Teste de Wilcoxon
Correla~ao de Pearson
p de Spearman

Christine P. Dancey & John Reidy

36
': :;f'["

jl

~
~.,
'-'

':

~d'Jl~ ':

. ; I.

' . ' '~;''-'/;-~.{

AtlvJdade 12
lo'~~'~
J.

~,

i.

~_

: ,

<

-_.

' .

JI-

.', ,.

"

"01""

',n:

";}:v

' ".

'

:\

' . . . . ,

(J.';" ~'~'1~';'r.,-"t~, !,-~:I"~;i;~J~1.'

, ' " ."

'IIJ'

,-

.4

.; ....\

'r~r. ,-~"r,'
.~) o(.t;:~'_"~'r' -;'
.
I

'I

"OaSsifique OS s~ujntes estuaos em correl~cionak'eltPeifrri'ehfAl~i6~ quas~&rihierl1ais:

j:.

~~ ~

Estatistica sem Matematica para Psicologia

~:'!-'" :/' ". ~;;-.-: .. ".I.,..,,' ' .......-

'"i. ,.' .

~ :'~':'~\'::"~~I: . _

.L;h~;t:'-..\:"';"':;I:tV'''_:;N'IJJiJ~f.4I~1'.fl~~'''Rl,.sh ?';!J,

,(aL~~la~Q ~t!e 0 cOfl@.m~,~~. cafefniJ;.e.a inc.i.Q~p'p~..d!!"d9r< ~,g~, "I1;I};~.;' " ,

,.< J~). Qif~r.en.~ ~I)tre~oll:te(l$;~ inulhe!~!:!~~h~.Qjli!i!~d~yeJ"aL;, ;;j~; .,:f <':,i'''~l~;;'.,:" .. ,, ...

{c),~feito.rw.d~~P~l')h.l:lelTl,um~.

Pf9a. na. g\lakp~rtiqpciQt!!S~'~o.laIQqlj:jos.,~leatoria.> mentea,~~)1;\(:lic;6es seri,!, ru1doe cO,IT,l;~I,tol1lfQ~~"'. .c,"o~';')":'~" ,'i;~-"1;'1','


o'

.'> ."":, ..;.'"

(d).,Oiferen~s na auto~E!Sti!Tla de pessoa.s altas e baix,as


(E!) Relacionarnento entre.~resse e horasgilstas t!i1balhanqo,,;,;.,:,.~,::;."!:;iHF ,:'
(f).. pifE!ren<;a,em.escorespE! .ansiedadE!~tre dois gruposlde',Pilfticjpafl~~~l~t~riamente
. .alocados,considE!randoque umgrup.b aprendeLl ~~nir,a,sq!!.rel~ll1~ot~l~};>;qutro ;n30

1.4

Delineamentos entre e dentre participantes


Dutra caracterfstica importante dos delineamentos de pesquisa e verificar se os partici
pantes fazem parte de mais de uma condi..ao. Retomando 0 exemplo da caminhada com 0 cao
e encontros sociais, temos urn experimento no qual a variavel independente e 0 participante
estar caminhando com 0 cao, e a variavel dependente e 0 numero de encontros sociais.
Como podemos alocar os participantes as condi..6es neste experimento?
Voce deve lembrar que se sugeriu como melhor altemativa a10car os participantes
aleatoriamente as condi..6es de caminhar com 0 cao e sem 0 cao.
Existe, no entanto, a altemativa de que cada participante tome parte nas duas condi..6es.

D primeiro procedimento e denominado de delineamento entre participantes (algumas


vezes tam bern denominado de delineamento independente ou nao-correlacionado); 0 segun
do, de delineamento dentre participantes (algumas vezes denominado de medidas repetidas
ou delineamento relacionado), Para decidir qual destes dois procedimentos utilizar, e preciso
levar em considera..ao as vantagens e desvantagens de cada urn.

1.4.1

Entretanto, nem tudo sao rosas no jardim do delineamento dentre participantes. Se voce
pensar urn pouco sobre 0 estudo da caminhada com 0 cao, sera capaz de identificar alguns
possiveis problemas. Podera ocorrer, se utilizadas as mesmas pessoas em ambos os casos,
que a familiaridade com 0 caminho e com outras pessoas, ja encontradas, encoraje a inte
ra..ao. Assim, na segunda condi..ao os participantes podem ter mais encontros sociais em
virtude desta familiaridade do que pelo fato de ter 0 cachorro. Por outro lado, eles podem
ficar aborrecidos ou cansados quando completarem a caminhada na segunda condi..ao, e
isto, tal vez, afete 0 numero de encontros sociais que teriam. Esses fat ores serao variaveis
de confusao e podem dificultar a interpreta..ao dos dados. Qualquer diferen..a no numero
de encontros sociais detectada entre as duas condi..6es podera ter origem nesses fatores, em
vez da manipula..ao experimental da variavel indepoodente. Esses fat ores sao denominados
de efeitos de ordem.
Uma forma de eliminar os efeitos de ordem e introduzir urn contrabalan..o no estudo.
Para contrabalan..ar, pode-se fazer metade dos participantes completar a primeira condi..ao e
em seguida a segunda condi..ao, enquanto a outra metade segue 0 mesmo procedimento, mas
na ordem contniria. Como fonna de introduzir 0 contrabalan..o no estudo da caminhada com
o cao, e preciso que a metade dos participantes caminhe primeiro com 0 cao e depois sem 0
mesmo, enquanto a outra metade faz 0 contrario. Qualquer efeito como fadiga ou t!:dio sera,
desta maneira, distribuido entre as duas condi..6es da variavel independente e nao sera mais
variavel de confusao (veja Figura 1.6). Voce ainda verificara que cada participante caminhara
sob as duas condi..6es, retendo, assim, as vantagens da utiliza..ao do delineamento dentre
participantes.
Dutra limita..ao do delineamento dentre participantes e a maior probabilidade de os par
ticipantes perceberem 0 objetivo do experimento por terem tornado parte nas duas condi..6es.
Trata-se de urn problema porque os participantes podem querer fazer 0 que 0 experimentador
deseja que fa..am, e nao 0 que nonnalmente fariam. Isso edenominado de efeito de demanda.
E mais provavel que ocorra no delineamento dentre participantes porque cada participante
e exposto a mais condi..6es experimentais do que no delineamento equivalente entre parti
cipantes. Em certo sentido, 0 contrabalanceamento pode reduzir, mas nao necessariamente
eliminar, os efeitos de demanda.
Urn problema adicional associado ao delineamento dentre participantes e a impossibi
lidade de poder utiliza-Io em muitos projetos quase-experimentais. Por exemplo, se voce

Delineamentos dentre participantes


A principal vantagem de utilizannos 0 delineamento dentre participantes e podennos con
trolar muitas das variaveis de confusao interindividuais. Quando utilizamos gropos diferentes
de pessoas em cada condi..ao, corremos 0 risco de que exista alguma variavel, alem da variavel
independente, que influencie na diferen..a entre os gropos. Voce tera, se isto acontecer, uma
variavel confundidora ou de confusao. Quando usamos 0 delineamento dentre participantes te
remos urn controle, muito maior, sobre tais variaveis, Em virtude de tennos as mesmas pessoas
em todas as condi..6es da variavel independente, existirao muito menos varia..6es extemas
entre as condi..6es. Em geral a mesma pessoa trara os mesmos problemas ou vantagens para
todas as condi..6es da variavel independente.
Uma segunda vantagem da utiliza<;ao deste tipo de delineamento e a necessidade de tra
balhar com menos participantes para realizar 0 experimento. Por exemplo, se existirem duas
condi..6es e necessitamos de urn minima de 12 participantes por condi<;ao, 0 total necessario
para completar 0 estudo e de 24 pessoas com 0 delineamento entre participantes, mas apenas
12 no delineamento dentre participantes. Se voce estiver realizando urn estudo em que os cus
tos envolvidos forem altos, entao este delineamento devera ser levado em considera<;ao.

37

. Todos'os
____
.. participantes.

----

.~qs Os efeitos
tge~rd~ na

<:aminhando ,
sem 0 c:ao

:'

,Cl)ndl~

'~ocao

Delineamento dentre participantes sem contrabalanceamento


M~dedos
particillantes .

......

caminhando" ,
semoca~, .

~Q$,~eordem

'i~;:,i1~ndo ,

Metadedos
. '~participantes

. igiialmente as

'~~ondies

caminhando .
sem'ocao,.

Delineamento dentre participantes com contrabalanceamento


lIustra~ao da forma de eliminar efeitos de ordem pela
contrabalanceamento..

utiliza~ao

de

38

Christine P. Dancey & John Reidy

Estatistica sem Matematica para PsicoJogia

quiser comparar encontros sociais de homens e mulheres enquanto estao caminhando, nao
sera possivel a utiliza~ao do delineamento dentre participantes. Nao se pode ter uma pessoa
que seja homem e mulher simultaneamente em duas ocasioes separadas, e uma pessoa nao
pode tomar parte nas duas condi~6es (a menos, e claro, que fa~a uma mudan~a de sexo entre
a participa~ao nas duas condi~6es).

alocar todos os participantes com uma deterrninada caracteristica a urn grupo, e isso talvez
confunda ou mascare os resultados. As tecnicas estatisticas que descrevemos neste livro
darao indica~oes da probabilidade de tais circunstancias aparecerem na nossa pesquisa.
A Tabela 1.3 fomece urn sumario das vantagens e desvantagens dos delineamentos entre
e dentre participantes. Deve ficar claro que as vantagens do delineamento dentre participantes
tendem a ser desvantagens no delineamento entre participantes e vice-versa.
Tabela 1.3

[~) Atividade 1.3


Como voce introduziria

contrabalanceamento no seguinteestudo? ' . ,

Urn estudo e conduzido para testar os efeitos da motivac;ao nq desempenho na tarefa de


desenhar sobre urn espelho. Os participantes sao solicitados a desenhar uma estrela utilizando
o equipamento para desenho sobre 0 espelho. 0 tempo decorrido para desentiar a. estrela e 0
numero de erros sao registrados. Os partidpantes devem,entao. realizar a tarefa nova mente,
mas desta vezganharao R$ 30,00 secompletarem a tarefa mais rapido e coni menDS erros.

1.4.2

Sumario das vantagens e desvantagens dos delineamentos entre e dentre participantcs

. DesvantageDS

Dellneamento

VantagelL'l

Emre panicipanles

Ausencia relativa de efeilos pralicos';


de fadiga
Panicipames menos sujeilos a se com
ponarem de acordo com os objetivos
do estudo

Necessidade de urn numero menor de


panicipames
Grande conlrole das variaveis de confu
sao entre as condi~Oes

Demrc panicipames

Necessidade de urn numero maior de


panicipantes
Inexistencia de muito comrole das va
riaveis de confusio entre condi~Oes

Aumento da probabilidade de efeilos


praticos e de fadiga
Panicipames com maior probabilidadc
de adivinhar os objetivos do estudo

Delineamentos entre participantes


Uma das mais importantes caracterfsticas positivas do delineamento entre participantes
e, em virtude de se ter grupos diferentes em cada condi~ao das VI, cada participante estar me
nos sujeito a ficar chateado, cansado ou frustrado com 0 experimento. Como conseqUencia,
ha maior probabilidade de apresentarem desempenho 6timo. De modo semelhante, 0 experi
mento sera menos suscetivel a efeitos praticos, e os participantes estarao menos propensos a
racionalizar sobre os objetivos do estudo. Esse tipo de delineamento, portanto, reduz os efei
tos de demanda e de ordem, e pode-se, de modo geral, eliminar do experimento esses fatores
como variaveis de confusao.
o fator negativo e a necessidade de urn numero maior de participantes do que em urn
experimento dentre participantes. Ainda. em virtude de cada uma das condi~oes utilizar di
ferentes participantes, perde-se urn certo grau de controle sobre as variaveis de confusao
interparticipantes. Por exemplo, suponha que voce esta conduzindo 0 estudo sobre a cami
nhada com 0 cao descrito previamente como urn delineamento entre participantes. 0 que
ocorre se realmente constatarmos que caminhar com 0 cao leva a mais encontros sociais? An
tes de podermos aceitar isso como verdadeiro, precisamos nos assegurar de que nao existem
variaveis de confundimento. Uma variavel confundidora importante. em tal estudo, talvez
seja a timidez dos que estao caminhando. Pode acontecer, por acaso, de os caminhantes sem 0
cao serem mais timidos, e, desta fonna, 0 menor numero de encontros se deve a esta variavel.
Se tivessemos feito este experimento como urn delineamento dentre participantes, teriamos
condi~oes de controlar essa variavel de confusao, pois cada pessoa caminha com e sem 0
cao. Isso significa que 0 nivel geral de timidez seria 0 mesmo sob as duas condj~6es, e essa
variavel de confusao nao existiria.
Da discussao referida voce pode ver que urn problema do delineamento entre partici
pantes e pessoas diferentes trazerem caracteristicas diferentes as condi~6es do experimento.
Quando estamos aleatoriamente alocando participantes as condi~oes, podemos, por acaso,

39

...

.-:

[~) Atividade 1.4


.

'., .

-~

r~;t~c;':::'- ::.. ~;..'!~~:i


:', '",::

.',:', :,.,";",::. !;:; .. ):<_~_.:;;:o;: .1~:-.':~:;.~t::1

..... ;:. ";.::,"

","

Como vote projetatiCi.uni estl!dopar~ .iny~gcu: .apo$srvet.r.elil~q~ntre cafefna e habili


" , ' . '.. " ' . ' "~"c<"".,,.. ,. ' .
.
dadematematica?
..~ ~::

.. .
~

,<:i'::'~'~<_~:~:~')~':~;.~~~:~~~~;~;:~;:~~~.~{~)~~~~~~;~.~~~:tt~~.

o .SPSS para Wmdows{S'S5PWL':"':'-;::';"7"''''''''':


:.

'.

..

".J ,,',

".

'. .. . :~L~.i;::.:,:",~:j:~;~;~:~ii~~:[~~t~i}~!f~~,

.:

Esta se~ao fomece uma breve introdu~ao ao SPSS para Windows e explica como entrar
e salvar dados em urn arquivo. Explica ainda a diferen~a na entrada de dados para os deline
amentos entre e dentre participantes.

o basico
Primeiro voce deve saber algumas coisas basicas sobre programas. 0 Windows e uma
interface grafica que pennite ao usuano manipular leones e infonna~ao textual na tela. Mui
tos programas, tais como 0 SPSS, apresentam diferentes janelas que voce podera manipular
quando necessario.
Quando voceroda 0 SPSS para Windows vers6es 10, II e 12 (SPSSPW), vera umajanela
perguntando 0 que quer fazer.

40

41

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

'~~ee
,i'edUZiilampllar*

Voce pode pensar que a janela ativa e muito pequena para mostrar loda a informa~io
disponivel. Epossivel aumentar 0 tamanho da janela ativa c1icando nos botOes Minimizar. Re
duzir/Ampliar (-. (J ou OJ no canto superior direito dajanela ativa. Aqui. 0 botao - minimiza a
janela ativa; (J reduz umajanela arnpliada. e 0 aumenta uma janela reduzida. Minimizar a janela
ativa consiste em reduzi-Ia a urn leone que aparecera na parte inferior da tela. Se uma janela esti
ver reduzida. voce podera visualizar mais inforrna~Oes se dicar no botao o. Se aj30elaja estiver
em seu tamanho maximo. entao. para se poder ver mais inforrna~5es. ela devera ser rolada (para
cima ou para baixo) por meio da barra ou setas siluadas no lado direito dajanela.

Entrada de dados
, 'Jlcin:i!se,

I :. - - - setasde

,rolagem,

Antes de executar qualquer analise. voce precisa fornecer os dados. Note que existem
dlulas. que sao 0 encontro das Iinhas com as colunas. Cada Iinhade-aaoos que voce fornecer
representara os dados de urn participante. e cada col una representara os dados de uma variavel.
Por exemplo. suponha que voce deseja rOOar urn estudo que esteja procurando rela~5es da 30
siedade estatistica com a procrastina~ao. Digamos que temos os seguintes dados de entrada:
PI P2 P3 P4 P5 P6
Participantes:
Ansiedade estatistica: 55 59 48 60 62 50
Procrastina~ao:
125 132 94 110 140 96

A primeira decisao que voce precisa tomar e se quer abrir urn arquivo de dados ja existente
ou criar urn novo (entrar com novos dados). Para abrir urn arquivo existente, selecione a o~ao
Open an existing data source (Abrir uma fonte de dados ja existente) da caixa de diaIogo (janela)
What would you like to do? (0 que voce gostaria de fazer?). Voce deve. entao. selecionar 0 arqui
vo de interesse e clicarem OK para continuar. Se quiser inserir dados. entao voce deve selecionar
a o~ao Type in data (digitar dados) e clicar em OK. Feito isso. aparecera a seguinte tela:

A primeira coisa a fazer e declarar as variaveis no SPSSPW. Para determinar 0 nome e


demais caracteristicas das variaveis. e precise selecionar 0 painel Variable View (Visualizar
Variaveis) no final esquerdo da tela. A tela mudara para uma na qual voce podera caracterizar
as variaveis do seu arquivo de dados.

Uma
c~lula

ViJrioiveis=
. colunas.

-t
1 ..__ '-_

---t_L~
___~=-~~~_u_~

Pain~s (orelhas):

oata y,w" (Ver


Dados) e Variable
View (Visualizar

, Variaveis)

-,-:
I

.!

--+-__ ~-_-'--I 1--_


I

!__+

~-tm
j

_:J

'ii

: ------I

I
I
I
:.
-+-+"-~-1-"--~

t---_._+---- :
'Pai~~:Ver
Dados e
Visualizar
VariAveis

'

:'

i'
!-

-~------"----+

I
I
[--,"

" I,

'i

I
--+
-'-----.L
~

L-:
~.:-----1-,
I

"","-.E19.:Fll~!;ffi::ti',~.-<._""U;'-;t' ...........,,.-.:,

...~jIl..~I~~~.u"""'I".lBI&b..

,.

N. de T. Os autores nao falam sobre 0 icone X. que fecha OJ janela ativa e tambem nao mencionam que os baloes de reduzir e am
pJiar sao um s6 c funcionam como uma chave Jigaldesliga.

Na tela de visualiza~ao de variaveis (Variable View). as linhas representarn variaveis. e as


colunas algum tipo de forrnata~ao da variavel. Voce precisa fornecer 0 nome de cada variavel
na primeira coluna. denominada de Name (Nome). Clique na primeira linha desta coluna e
digite 0 nome da variavel. Temos duas variaveis para serem declaradas. a ansiedade estatfstica

42

Christine P. Dancey & John Reidy

e a procrastina~ao. Digite no nome da primeira variavel: statsanxiety. Voce precisa levar em


conta as seguintes regras quando quiser nomear variaveis:
Nao se usa mais do que 16 caracteres. Por exemplo, statsanxiety e valido, mas
statisticsanxiety nao.
Nas versOes anteriores ao SPSS 12,0 nome s6 pode ter ate 8 caracteres.
Nao e posslvel utilizar marcas de pontua~ao ou espa~os. Por exemplo, statsanxiety e
valido, mas stats anxiety nao.
Nao e preciso se preocupar com letras maiusculas, pois 0 SPSSPW convertera todo 0
nome para letras minusculas.
Uma vez que voce tenha digitado statsanxiety na primeira celula, clique na proxima ce
lula abaixo e digite 0 nome da segunda variavel. Lembre que ele so pode ter ate 16 caracteres
(8 para as versiies anteriores ao SPSS 12). Voce podera denomimi-Ia procrastination. Quando
tiver digilado 0 nome da segunda variavel, a tela devera ser semelhante a seguinte.

Os dados da

-ansiedade

estatlstica

. devem ser

digitados

nesta coluna

____
+j=F~+--+'

Os dados da

t=

devem ser

digitados

nesta coluna

'l!i

--l--j

~ ~i

--~ ~-=~-j-~j

---~I'-

procrastina~o

Nomes das
variaveis

43

Estatistica sem Matematica para PsicoJogia

---r ~t-~I-I --~--'


.

T --- ---,

--~=-- --[==~-f=-~--.

.8

Voce podera notar que as duas primeiras colunas estao rotuladas como statsanxiety e
procrastination. Lembre-se que na tela de visualiza~ao de dados (Data View) as colunas sao
variaveis e as linhas sao participantes. Desta forma, todos os dados da ansiedade estatlstica
(statsalLriety) deverao ser digitados na primeira coluna, e os da variavel procrastina~ao (pro
crastination), na segunda. Va adiante e entre com os dados apresentados anteriormente. Uma
vez feito isso, a tela devera ser semelhante aseguinte:

Menu File
(Arquivo)
L..---l
I

As variaveis foram declaradas, entao voce pode agora entrar com os dados. Para fazer
isso, voce precisa selecionar 0 painel (no fundo esquerdo da tela) Data View (Visualizar Da
dos), obtendo a seguinte tela:

.. -r_.-+---jl

---/.-I
I

II

I . _..
~

_.~

+---- +----1--

1-----+
----iii

I --+ - - - - j
_.~--

~->:0"~Rif~~""JII!

Voce pode visualizar aqui os dados que foram digitados.

* N. de T. Se quiser au precisar separar 0 nome de uma variavel. utilize 0 IlIJderJcore ( _ ).

44

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

45

Salvando OS dados
Apos ter fomecido os dados, e uma boa ideia salva-los em urn arquivo. Isso evitara. que
tenha de digita-Ios novamente caso queira realizar outras analises no futuro. Para salvar os
dados, e necessario colocar 0 ponteiro do mouse sobre 0 item de menu File (Arquivo) e c1icar
com 0 botao esquerdo do mouse. 0 seguinte menu sera apresemado.
Digiteo
nome do
arquivo aqui

Selecionea
oposaVe~

(Salvar Como)

Entrando com OS dados para OS delineamentos


dentre e entre participantes

Mova 0 ponteiro do mouse e clique na 0Pl>aO Save ds... (Salvar Como) e entao a se
guinte caixa de diaIogo ira aparecer. Ela e denominada de caixa de dialogo porque e onde
voce diz ao SPSSPW 0 que ele deve fazer. Digite 0 nome do arquivo na linha (em branco)
denominada File !lame (Nome do arquivo) e clique no botao OK. Seus dados estarao salvos
neste arquivo.
Convem lembrar que 0 nome de urn arquivo deve obedecer as seguintes regras:
A primeira parte e urn nome que fal>a sentido para voce (p. ex., statsanxiety).
A segunda parte deve ser sempre SAY para urn arquivo do SPSSPW (esta parte
denominada de extensao do arquivo).
A primeira e a segunda parte serao sempre separadas por urn ponto.'

Assim, 0 nome do nosso arquivo de dados sera statsanxiety.sav. De fato, voce nao digitou
.sav nem precisara faze-Io, pois 0 SPSSPW faz isso automaticamente. Sempre que voce visua
Iizar urn nome de arquivo terminando em .sav, podera ter uma confianl>a razoavel de que ele e
urn arquivo de dados do SPSSPW. Se voce esquecer 0 nome do seu arquivo, procure entre os
que apresentarn a extensao .sav.

N. de T.

Vari~veis

e projelo de pesquisa.

Descrevemos como fomecer e salvar dados no SPSSPW. No entanto, diferentes de


Iineamentos requerem diferentes entradas de dados. A maneira recem descrita e para urn
delineamento correlational. Se voce quiser fomecer dados para os delineamentos entre par
ticipantes, entao 0 procedimento e 0 seguinte. Digamos que voce conduziu recentemente 0
estudo da caminhada com 0 cao com urn delineamento entre participantes. Suponha que os
dados obtidos para a variavel "numero de encontros sociais" sejam os seguintes:
Caminhando com 0 cao: 9 7 10 12
Caminhando sem 0 cao: 4 5 3 6

6
5

8
I

Neste delineamento, caminhar com e sem 0 cao e a variavel independente, e 0 numero


de encontros sociais, a variavel dependente. Quando entrarmos com os dados no SPSSFW,
precisamos determinar uma variavel independente e uma variavel dependente. A primeira
coisa a ser feita e nomear as variaveis, na tela Variable View (Visualizar Variaveis). Quando
se declarar a variavel independente, e necessario prestar atenl>ao, pois e aqui que a maioria
dos erros ocorre. Quando tivermos grupos diferentes de pessoas em cada condil>ao da varia
vel independente, precisamos definir uma variavel de agrupamenlo (grouping variable) no
SPSSPW. Devemos deixar 0 SPSSPW saber em qual dos dois grupos cada participame eSla.
Defina a varia~el conforme a seguinte ilustral>ao:

46

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Clique nas
retic~ncias

:~19~1

; "4
L-~
!

l~'

f=J1"I:~~;
:-~r~:iR"~~l:~
~-~r- f:--~i8

I ~

-!

47

Temos duas condi,.5es para a variavel independente, as quais precisamos atribuir mime
ros. Iremos rotular 0 grupo "caminhando com 0 cao" de grupo leo grupo "caminhando sem
o cao" como grupo 2 (ou vice-versa). Digite I na Iinha (caixa) Value (Valor) e "caminhando
com 0 cao" (Walking with a dog) na linha (caixa) Value LAbel (R6tulo). Feilo isso, clique em
Add (Adicionar), e voce vera que os detalhes aparecem na ultima Iinha (caixa). Agora digite
2 na linha Value e "caminhando sem 0 cao" (Walking without a dog) na linha Value Label e
clique Add. A caixa de dialogo devera ser semelhante a esta:

-- 1
I

1--

---7------,------+------i
~-.--, --1-

---~~-r---

----!----~-~~~---.'__j~ ~:t~ ==t=

-i

._-+-- - ---+-

~--:--.~--1iiI.,~c:,."'In;Qi~::..;.:;~t.'.:."l!\l
..

v...... w- 6ii!1lCC:itt""....

. .~ ~ @

'\l:,,'"

4.----~~1U&itiQh&W,

Se voce deixar as variaveis como definidas pelo software, podera ter dificuldades para
interpreta-las, uma vez que nao havera r6tulos para identifica-Ias de acordo com as diferentes
condi,.5es da VI. Assim, e uma boa ideia detalhar os nomes das condi,.5es da VI. Voce deve
notar que, quando c1ica na primeira celula da coluna rotulada como Values (Valores), reticen
cias aparecem. Isso indica que voce pode fornecer infonna,.5es adicionais para esta coluna.
Clique nas reticencias e obtera a seguinte caixa de dialogo.
Digite 0 numero

do primeiro

grupoaqui

Digite 0 nome

do grupo aqui

OiqueemAdd
(Adicionar) para
confirmar
osdetalhes

~!J

--I.

-~~-

T~-~.~t

ml

.OJ

I"__ +_

w~.~~~~~~t~;~;tJ~~~~

~lf~~~~5i~~~M.~-':'Ill:I~:;t~q'~1~_j

Clique em OK para retornar 11 tela Data View (Ver Dados). Sempre que desejar que 0
SPSSPW saiba os nomes dos gropos, voce pode fazer isso adicionando infonna,.5es na colu
na Values (Valores).
Agora vamos definir as variaveis. Para entrar com os valores reais dos dados, clique no
painel Data View (Visualizar Dados). Quando os dados forem postos na coluna group (gru
po), digite I se a pessoa estiver no grupo com 0 cao e 2 se a pessoa estiver no grupo sem 0
cao. Assim, voce podera verificar que a primeira coluna contera apenas os valores I ou 2. Na
segunda coluna, voce devera entrar com 0 numero de encontros sociais de cada pessoa, como
esta na sua variavel dependente. Voce devera ser capaz, observando a tela de entrada, de ver
que 0 participante numero 4 esta no grupo com 0 cao (grupo I) e que ele teve 12 encontros
sociais. Tambem vera que 0 participante numero 12 esta no grupo sem 0 cao (grupo 2) e que
teve uma caminhada solitaria com apenas urn encontro.

48

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Voce pode estar se perguntando por que temos de entrar com os dados de forma dife
renciada para cada urn dos diferentes delineamentos. Eque cada Iinha da entrada de dados
representa a informalfao de urn participante. Se voce tern urn delineamento entre participan
tes, precisa informar ao SPSSPW qual 0 escore de cada participante e a qual grupo pertence.
Quando 0 delineamento e dentre participantes, cada urn atua sobre as duas condilfOes, e desta
forma, se tern dois escores. Voce precisa fazer com que 0 SPSSPW saiba 0 que ambos estes
escores significam. Em virtude de cada participante atuar nos dois grupos, nao sera neces
sario informar ao SPSSPW 0 grupo, por meio de uma variavel de agrupamento. Voce pode
perceber, assim, a diferenlfa dos delineamentos dentre e entre participantes atraves da varia
vel de agrupamento. Se esta variavel existir, trata-se do delineamento entre participantes.
Voce deve notar, a partir do detalhe da tela, que-definimos duas variaveis, uma para a
condilfao com 0 cao e outra 'para a condilfao sem 0 cao. Ainda, em virtude de nao haver a
variavel de agrupamento, nao temos de atribuir r6tulos de grupos para qualquer variavel na
tela Variable View (Visualizar Variavel). Definir as variaveis para esse tipo de delineamento e,
dessa forma, mais simples do que para 0 delineamento entre participantes.

Va~~~de

agrupamento..
..

'.

';

~-

:"'

V~ri4v'~V'

dependente

--r

49

-+~
I

---+-----1--_J -~-=i-:
I

Utilizando as facilidades da ajuda (Help) do SPSSPW


Delineamentos dentre participantes
Quando ha urn delineamento dentre participantes, temos que entrar com os dados de uma
maneira diferente. Se utilizarmos 0 exemplo anterior, no delineamento dentre participantes
cada pessoa completara a caminhada, tanto na condilfao com 0 cao quanto sem 0 cao. Os
dados para este estudo temo a aparencia mostrada na tela seguinte:

E uma boa ideia praticar utilizando as facilidades da ajuda do SPSS para Windows. Voce
pode iniciar rodando 0 tutorial que esta disponivel para voce. 0 tutorial pode ser iniciado
sempre que se iniciar 0 spsspw. Voce pode notar que a primeira 0plfao na primeira caixa de
dialogo que voce ve no SPSSPW e rodar 0 tutorial (Run the tHtorial).

''i SEilecione esta

tern .
urn escoreiiaS:

,op@opara

<:ada pessOj;

dUas CO'il~i~oes

,'.

'~~I

SOO!

3.00'\

:~;- ----t-----t--~I--

1 _..........

I ==-J__ i

:rOd~ro tutorial

1.00:

---,I

--i-~--

. -1---+---1------1----

I:

t--;---:--

"

- f--- --+-

"-+
i

I
Voce pode acessar 0 tutorial a qualquer hora durante uma sessao. Basta dicar no menu
Ajuda (Help) e selecionar 0 tutorial (Tutorial) a partir dai.

50

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

I.

'., Qi9peno t6pico


Jli!raobter urn'
tutorial sobre ele

1II.1iiiiiiili.i:ii 4
!II. O~~lD
!II.-.oru

!B.

lB.
m.
lB.
lB.
lB.

USing

51

("i",bu'vd A!''1.lIYi,r
( p u Ed,l?!

m,ng !he

Wo....nQ "rIb nIlIQH!

Examln,ng SlmrDary SI;,":;I,,=; for

!r.!.1!'lIdu.al...~~

t"rQ'W,b"la!,Q!] r"bles

0'''' Yalues
1BC!a.J..t.!Og,...4Cl1...E..aI.I.IMa!.U

m.
m.
lB.

Mot1lfyloa

Wq,toflQ ..." Ib SyOlJI!

r""(l

lB.
m ....

<:

dyIng f'tjllyro<

rU$lomt',ng $!ISS
A!!!Qmi'lrq pmdll"lgo

__ . 1

--i-

"_.

-,
--r--

-----t -- _. -"
I

.~

u;~!:

11101) SI:tr1td .... '11-1 <;P50:". T;.,blfts

-l

.J!!l!!!!im"';"I~~!D"!iF lii_........ &VJMId&UW}

Lembre que voce pode chamar 0 tutorial sempre que precisar.

Welcome 10 11'1, SPSS TU'lonal TllIs lU'loni! ...,U show yOll how 10 us. ma"1 of Ihe ""IUI'1I$ Mllabl, Itl
SPSS "'$ CIi!SlI}ned 10 prCMde :II $lep-bJ'-~lep. h~ftd~on 9lJ1fJe AJI OWIlI fUn shown In Ihe enmples
ate II'Isl;,lIed......,h Ihlll.conal so yCu can folcw i1Ilor\9. pl"':lrmlt'lg the sam, analy", and obu,lntnglh.
~i1Ime

Resumo

rt'sulls s~Own he', (You dC:l~ h)\o'e 1'3. eLf }01.l (4on d...-.;antlO)

Il is also desIgned 10 mak, It tn, fOf rou10 slart i1In~ slop anywhere )'ou WJn1 If you W21nl to IUln
about only ill ,...,. spKI6c Inh. lIS. 11'1' Col'JI,l'Jls and Ind,. bul.lons (ned 10 11'1, Back and N....l
bvIlo~)

allh. b'3l1om oflhlS """"~lofintllh. ,,,formalion JOu ~td. 01 simply (!leI<: Ihe N'I' buUon
(i1Ill't/11l' p<llnhng nghl) 10 sl"p ItvOlJ9h all of Ihe hAonlll, /rom begum,ng 10 end

Neste primeiro capitulo expusemos os conceitos basicos para urn entendimento da pes
quisa e do projeto de pesquisa. Voce aprendeu que:
Variaveis se diferenciam em tennos de precisao. Isto e, elas podem ser:
- Continuas quando assumem qualquer valor em dado intervalo (p. ex., 10 ou
10,2365)
Discretas quando assumem apenas certos valores especificados dentro de urn de
tenninado inteIValo (p. ex., 9 ou 10)
Categoricas quando os valores assumidos sao categorias, em vez de valores pura
mente numericos (p. ex., genero: masculino ou feminino).

Bot6es de
navega~ao

Uma vez iniciado 0 tutorial, voce estani na introduerao as facilidades da ajuda do SPSspw.
Voce ira nolar quatro leones no canto inferior direito da tela. Estes leones permitem que voce
navegue da fonna que desejar em torno dos topicos do tutorial. 0 leone com a lupa fornece
urn indice de topicos. 0 leone com a casa leva voce aos conteudos de cada topico, enquanto os
icones com as setas a esquerda e a direita levam para as telas anteriores e posteriores, respec
tivamente. Quando voce c1ica no leone de conteudo (casa), obtem uma Iista de assuntos. Voce
deve entao c1icar no topico desejado para que 0 lutorial possa ajuda-Io.

Existem Ires principais delineamentos de pesquisa:


Delineamentos correlacionais, que examinam as relaer5es entre variaveis e nao
apresentam, num sentido estrito, variaveis dependentes ou independentes. Voce
nao pode inferir causaerao a partir de correlaer6es.
- Delineamentos experimentais, que envolvem a1ocaerao aleatoria de participantes
as condier6es de variavel independente.
Delineamentos quase-experimentais, que envolvem investigar grupos fechados,
tais como homens e mulheres, e, desta fonna, niio utilizam alocaerao aleatoria de
participantes as condieroes.
Nos experimentos, a variavel independente e manipulada pelo pesquisador para veri
ficar como ela afeta a variavel dependente.
Os delineamentos entre participantes sao aqueles nos quais nos temos participantes
diferentes para cada condierao da variavel independente.
Os delineamentos dentre participantes sao aqueles nos quais cada participante e ava
liado sob todas as condier6es da variavel independente.

52

Christine P. Dancey & John Reidy

Exercicios para

SPSSPW

Estatistica sem Matematica para Psicologia

QUESTOES DE MUlTIPLA ESCOlHA


I. Qual das seguintes constitui uma variavel continua'?

As respostas de todos os exercicios e das questoes de esco/ha rnu/tip/a podern ser encon
tradas ern se~iio propria ao final do /ivro.

Exerdcio 1

(a) Numero de vezes que um escore de 180 e al


canc;ado em um jogo de dardos
(b) Genero
(c) Temperatura
(d) Todas as anteriores
2. 0 projeto experimental

A Dra. Genio realizou urn estudo comparando a memorizac;ao de adjetivos com a de


substantivos. Ela alocou aleatoriamente 20 participantes a duas condic;oes. Entao, apresentou
a urn dos gropos de 10 participantes uma lista de 20 adjetivos e ao outro gropo (tambem com
10 participantes) uma lista de 20 substantivos. Em seguida, solicitou a cada grupo que ten
tasse lembrar 0 numero maximo posslvel de palavras apresentadas. Ela obteve os seguintes
resultados:
Adjetivos: 10,6,7,9, 11,9,8,6,9,8
Substantivos: 12, 13, 16, 15,9,7,14,12, II, 13
I. Qual e a variavel independente neste estudo?

2. Qual e a variavel dependente?


3. Este e urn delineamento dentre ou entre participantes?
4.

E urn projeto experimental, quase-experimental ou correlacional?

5. Entre com os dados no SPSSPW de forma apropriada para 0 deJineamento do expe


rimento e salve os dados em urn arquivo.

Exerdcio 2
Utilizando os dados do exercfcio I:
Se voce entrou com os dados como urn delineamento dentre participantes, entre com
os dados agora como urn delineamento entre participantes.
Se voce entrou com os dados como urn delineamento entre participantes, entre com
os dados agora como urn delineamento dentre participantes.
Salve os dados em urn arquivo utilizando urn nome diferente do anterior.

ecaracterizado por:

(a) Menos do que duas condic;oes


(b) Sem controle das condilJoes
(c) AlocalJao aleat6ria dos participantes as condi
lJoes
(d) Nenhuma das anteriores
3. Em um estudo no qual 0 genero
manipulada, a VI e:
(a)
(b)
(c)
(d)

e a variavel a ser

Dentre participantes
Correlacional
Entre participantes
Nenhuma das anteriores

4. Qual das seguintes assertivas


delineamento correlacional?

e verdadeira para 0

(a) Ele nao apresenta variavel independente nem


variavel dependente
(b) Procura relacionamentos entre variaveis
(c) Nao se pade inferir causalJao a partir de cor
relalJ30
(d) Todas as anteriores
5. Qual das seguintes pode ser considerada uma va
riavel categ6rica?
(a)
(b)
(c)
(d)

Genero
Marca de carro
Cor do cabelo
Todas as anteriores

6. 0 delineamento dentre participantes pode ser:


(a)
(b)
(c)
(d)

Tanto quase-experimental quanto experimental


Somente experimental
Somente quase-experimental
Somente correlacional

7. Qual das seguintes declaralJoes


experimentos?

e verdadeira para

(a) A variavel independente e manipulada pelo


pesquisador
(b) A variavel dependente e assurnida como de
pendente sobre a variaveI independente
(c) Os experimentos sao dificeis de serem reali
zados
(d) Altemativas (a) e (b)
8. 0 projeto quase-experimental apresenta:
(a) Uma variavel independente e uma variavel
dependente

53

(b) AlocalJ30 nao-alear6ria dos participantes as


condilJDes
(c) Nem vaJiavel independente nem variavel de
pendente
(d) Allemativas (a) e (b)
9. Qual assertiva descreve uma variavel continua?
(a) Pode assumir certos valores discretos em um
faixa de valores
(b) Pode assumir qualquer valor dentro de uma
faixa de escores
(c) PAlde ser caracterizada par categorias
(d) Nenhuma das anteriores

10. Quais dos seguintes sao problemas associados com


o delineamento dentre participantes?
(a) Exisle uma maior probabilidade de efeitos pra
ticos e de fadiga
(b) Os panicipantes apresentam maior probabili
dade de perceber a natureza do eSludo
(c) Nao pode ser ulilizado com projetos quase
experimentais
(d) Todas as anleriores
II. De acordo com Streiner (2002), qual a eficiencia de
estudos que dicotomizam variaveis quando compa
rados com estudos que llio 0 fazem?
(a) 100%
(b) 95%
(c) 67%
(d) 50%

12. Certo pesquisador acabou de conduzir um eSlUdo


correlacional invesligando 0 relacionamenlo da
quantidade de alcool ingerida par f3s do time da
casa antes de um jogo de futebol e 0 numero de
gols marcados pelo lime. Constatou-se que existe
um relacionamento entre as duas variaveis. Qual
das seguintes afirrnalJOes e vaIida?
(a) A quantidade de alcool ingerido esta relacio
nada com a habilidade do time de fazer gols,
mas nao se pode afirrnar que seja a causa dos
gols man:ados
(b) A habilidade do time da casa de marcar gols
nao est! reIacionada com a quantidade de
alcool ingerida, mas com a quantidade de in
centivo dada pelos lis que bebem
(c) Um aumento na qnantidade ingerida de al
cool causa um aumento no numero de gols
marcados
(d) Todas as anteriores
13. Em um projeto dentre participantes com duas con
dilJoes, se voce nao utilizar 0 contrabalanceamenlo
das condilJOes, seu estudo podera sofrer:
(a) Efeitos de ordem
(b) Efeitos da hora do dia

54

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

(c) Falla de participanles


(d) Todas as anleriores
14. Voce conduziu urn eslUdo mostrando que. quanto
mais cedo as pessoas levantam. mais tarefas elas
conseguem executar. Qual das seguintes conclu
s6es e valida?
(a) Nao exisle necessariamenle uma rela~ao
causal enlre levantar cedo e a quanlidade pro
duzida de lrabalho
(b) Pessoas que levantam cedo precisam lrabalhar
mais
(c) Levanlar cedo e a causa de mais trabalho ser
produzido
(d) As ahemalivas (b) e (c)
15. Com qual dos seguintes projetos (delineamentos)
e menos provavel que se possa estabelecer relacio
namentos causais entre variaveis?
(a)
(b)
(c)
(d)

Projeto experimenlal
Projeto quase-experimental
Projeto correlacional
Delineamento dentre participantes

16. Efeitos de demanda sao possiveis variaveis de con


fusao nas quais:

urn escore sobre 0 quanto roem as unhas.


Apos, classificar os participantes como "de
pressivos" e "nao-depressivos" com base nos
resuhados do questionario. Podemos veriticar.
entao, se existe ou nao diferen~as no quanto
roem as unhas.
(b) Como a silUa~ao (a) acima, mas sem dividir
os participanles em dois grupos. Utilizar os
escores de depressao obtidos e veriticar se
existe uma rela~ao enlre roer as unhas e de
pressao.
(c) Este tipo de estudo e impossivel de ser execu
tado; portanto nao deve ser lenlado.
(d) Nenhuma das anteriores
18. Qual das seguintes seria a variavel independenle
apropriada em urn esludo quase-experimental?
(a) Genero
(b) Se alguem apresenla ou nao dislurbio de an
siedade generalizada
(c) ESludantes verslIs nao-eslUdantes
(d) Todas as anteriores
19. Em urn delineamento denlre participanles, os efei
tos de ordem ocorrem quando:

(a) Os participanles se comportam de acordo com


o que 0 pesquisador quer
(b) Os participantes apresenlam baixo desempe
nho, pois eslao cansados ou chateados
(c) Os participanles apresentam born desempenho,
pois pralicaram as tarefas do experimento
(d) Nenhuma das anteriores

(a) Os participanles ficam cansados nas ultimas

17. Suponha que voce quer conduzir urn eSlUdo para


verificar se pessoas depressivas roem mais as
unhas do que pessoas nao-depressivas. Qual dos
seguintes sera a melhor maneira de proceder?

20. Qual dos seguintes problemas esla associado com


a dicotomiza~ao de variaveis continuas?

(a) Medir a depressao dos participantes com urn


questionario e entao solicitar que alribuam

condi~oes

(b) Os participanles lem 0 mesmo desempenho


em lodas as condi~oes
(c) Os participanles tern problemas para obter be
bida no bar
(d) Nenhuma das anteriores

(a)
(b)
(c)
(d)

Perda de poder experimental


Ocorrencia de efeilos espurios
Existencia de uma seria perda de
Todas as ameriores

inforrna~ao

Referencias
AITKEN, M. A personalily profile of the student procrastinator. Tese de doutorado niio-publicada,
Universidade de Pittsburg. (Dissertation Abstracts Imemational. 43, p. 722-32 A), 1982.
CLARK, L. A., WATSON, D. Tripartite model of anxiety and depression: psychomelric evidence and
taxonomic implications. JOllrnal ofAbnonnal Psychology. v. 100, p. 316-36, 1991.
CRUISE, R., CASH, R., BOLTON, D. Development and validation of an inslrumentto measure
slalislical anxiety. 1985. Artigo apresentado na reuniiio anual da Se~iio de Educa~iio ESlatislica e
reimpresso nas alas da Associa~ao Americana de Estatistica.
DORLING, D. el al. A good place to bury bad news? Hiding the delail in the geography on the Labour
Party's website. The Political Quarterly. v. 73, p. 476-92, 2002.
EGLOFF, B. HOCK, M. Assessing allention allocalion toward lhreat-related stimuli: a comparison of
the emotional Slroop task and the allentional probe lask. Personality and Individllal Differences.
v. 35, p. 475-83, 2003.

55

MAXWELL, S. E.. DELANEY, H. D. Bivariate median splits and spurious stalislical significance.
Psychological BlIlletin. v. 113, p. 181-90. 1993.
McNICHOLAS, J.. COLLIS. G. M. Dogs as catalysts for social interactions: robustness of the effect.
British JOllrllal ofP,\)'chology. v. 91, p. 61-70,2000.
SPIELBERGER, C. D. el al. Manllal for the State- Trait Anxiety Inventory (Forti/ Y). Palo Alto (CA):
Consuhing Psychologisls Press, 1983.
STREINER, D. L. Breaking up is hard to do: the heartbreak of dichotomizing continuous dala.
Canadian JOllrnal ofPsychology. v. 47. p. 262-66, 2002.
WALSH, J. J., UGUMBA-AGWUNOBI, G. Individual differences in stalislics anxiety: the roles of
perfectionism. procrastination and trait anxiely. Personalit), alld Individllal Differences. v. 33. p.
239-51,2002.

Nota
I

Corre~ao do artigo feita pelo Gllardiall (publicado em 10 de outubro de 2(02):

Na nossa reportaxem, "0 site do partido giro como a 1984 de Orwell", pagina 7, de 8 de
olltubro, dissemos: "0 webmaster do partido e comparado a Winston Smith, a personagem do
liVTV 1984 de George Otwell qlle pa,Uava a tempo no millisterio do abastecimell/o reescrel'endo
a hi.Horia". DefalO. WillSton Smith tmhallwva para 0 mini.Herio da verdade. Entre suas tarefas,
eli/retail/(}, estava 0 "reajllstamenlO" dos mlmeros da ministerio do abastecimelllo. "Ndo foi uem
mesmo uma falsificariio. Foi meramellle a substitairdo de uma pera absurda par outra" {pagitlt/
36 da edirdo da Penguin de 1983 i.
No nosso artigo /lOS referimos 00 relatario em discussdo COI/IO "ndo-publicado". De fato,
ele aparecellna edireio de Oil/libra {I'olume 73, /IIimero 4i do Political Quarterly, publicodo pela
Blackwells.

Estatistica sem Matematica para Psicologia

Estatfstica Descritiva

Outra arilostra

possfveI de cinco faces

.Urna amcSStra Passive!


'. de :dntei faCes
,

:9

CJ

'.~

PI""
V::::;J

QQQ.
A

V::::;J

Panorama do capitulo
No Capitulo 1, apresentamos alguns fatores importantes de um projeto de pesquisa. Neste
capitulo iremos explicar as principais maneiras de tratar dados coletados por meio de pesquisa
quantitativa. Sao as estatfsticas desaitivas. Um passe importante para qualquer um que esteja
tentando en tender a analise estatistica e obter uma boa ideia dos conceitos basicos. Por isso,
explicaremos alguns dos conceitos estatisticos fundamentais que servirao de apoio para 0 enten
dimento de analises complexas apresentadas mais tarde no livro. Ao final deste capitulo, voce
devera ter um bom entendimento dos seguintes t6picos:

amostras e popula~6es
medidas de tendencia central (p. ex., media)
tecnicas graticas para descrever os dados (p. ex., 0 histograma)
distribui~ao normal
medidas de variabilidade (p. ex., 0 desvio padrao)

Estes sao conceitos importantes que aparecerao sob varias formas ao lange do texto; por
isso, e importante tentar entende-Ios. Considere-os como os blocos basicos para a compreensao
conceitual da estatistica.

2.1

Amostras

e popula~oes

No Capitulo I, explicamos que estatisticas sao essencialmente maneiras de descrever,


comparar e reIacionar variaveis. Quando estas estatisticas forem produzidas, devemos levar
em conta uma diferenera importante entre amostras e populat;oes. Quando psic610gos falam
sobre populaer5es, nao estao necessariamente se referindo Ii populaerao do pais ou da cidade.
Estao, geralmente, se referindo a gropos distintos de pessoas, por exemplo, todos aqueles
com autismo, ou todos os homens canhotos. Em termos estatisticos, uma populaerao pode ate
mesmo se referir a objetos inanimados, como, por exemplo, a populaerao dos carros de uma
certa marca.
Uma amostra e simplesmente uma seleerao de elementos de uma populaerao (veja Fi
gura 2.1). Os pesquisadores utilizam amostras por varias raz5es, principal mente porque
slio mais baratas, mais rapidas de obter e mais convenientes para examinar do que toda
uma populaerlio. Imagine que queremos verificar se a ansiedade estatistica esta relacio
nada com procrastinaerao, como Walsh e Ugumba-Agwunobi (2002) fizeram. Podemos
simplesmente medir 0 nivel de ansiedade estatistica e de procrastinaerao de todo mundo

,~puljj~Q"
!

de;faces,

lIustra~ao

57

",

.
A
.. A '
'V::::;J.'-d:
,'"

.
.
c./ ~ ./A
~
Q
\~
'v::=:J

,r.:-,
.;::::)
~
'.

.,-_

':)

'.. A'".

,V::::;J
A',
A
~'
\':::::J

~.

\:':::!J

,,
:
,::;.

'

"

"

Outra amostr.i

passivel de cinco faces

de varias amostras de cinco faces retiradas de uma

popula~o

de faces,

e observar 0 quanto estao relacionadas entre si. Isso seria, no en tanto, caro demais. Uma
forma mais conveniente e selecionar urn determinado mlmero de pessoas ao acaso da po
pulaerao e determinar os seus niveis de ansiedade estatistica e procrastinaerao. Podemos,
en tao, generalizar 0 resultado desta amostra para a populaerao. Utilizamos estatistica, mais
especificamente estatistica inferencial, para generalizarmos os resultados obtidos de amos
tras para toda a populaerao.
Quando realizamos uma pesquisa, devemos estar seguros de que sabemos qual e a po
pulaerao estudada e escolher a amostra desta populaerao. E inutil realizar urn estudo com uma
amostra de homens se a populaerao inclui os dois sexos. E sern sentido conduzir urn estudo
com uma amostra de tarantulas se a populaerao alvo e de zebras.
A habilidade para generalizar resultados de uma amostra para a populaerao e de impor
tincia vital em pesquisa. Assim, e precise estar seguro de que qualquer amostra utiIizada e
verdadeiramente representativa da populaerao visada. Urn exernplo simples i1ustra alguns dos
problemas. Imagine que pesquisadores querem realizar urn estudo para saber se caminhar
com 0 dio leva a mais encontros sociais do que caminhar sem 0 cao. Eles decidern se diri
gir ao parque mais pr6ximo e seguir urn determinado numero de propriellirios de ciies e de
nao-proprietarios de dies para contar as interaer6es sociais que tiveram. Os pesquisadores des
cobrem que os que nao possuem cao tiveram mais encontros dos que possuem e concluem,
entao, que possuir urn cao nao e born para a vida social.
Esta conclusao esta correta? De fato, nao sabemos a resposta a partir da pesquisa que foi
feita. Ela pode estar certa, mas nao se utilizou uma amostra correta sobre a qual se pudesse
basear tal concluslio, isto e, pode haver urn problema de amostragem. 0 problema aqui e que
os proprietarios de clies seguidos podem ser todos, por exemplo, muito timidos, e e isso, e
nao 0 fato de possuir 0 clio, que explica a diferenera no numero de encontros sociais. Aqui, e
possivel que exista 0 vies do pesquisador, no qual ele inconscientemente utiliza pessoas que
ajudam a confirmar a sua hip6tese. Pode ser que sejam quest5es Iigadas Ii hora do dia em
que as pessoas caminham com seus caes. Por exemplo, pessoas caminhando bern cedo peJa

58

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

manha, lalvez, eSlejam com pressa para ir ao lrabalho e se lomem menos propensas a encon
lros sociais. Certos tipos de caes intluem nas inlerarr6es sociais (p. ex., caminhar com urn pit
bull). Como pesquisadores, devemos estar cientes dessas possibilidades quando projetamos
nossa pesquisa de forma a nos assegurarmos de que elas nao ocorram. Queremos generalizar
os nossos resultados amostrais para toda a popularrao e queremos evitar problemas com 0
projeto que possam reduzir nossa possibilidade de fazer isso. Muilo dos pontos sutis de urn
projeto de pesquisa sao os que tentam assegurar que possamos generalizar os resultados. Os
pesquisadores, do exemplo acima, podem, e claro, ter ido a muitos parques diferentes e se
guido muitas pessoas em varias ocasi6es diferentes. Desta forma. estarao mais seguros de que
suas amostras representam a popularrao.
o exemplo anterior ilustrou urn ponto importanle: a habilidade de generalizar resultados
de amostras para popularroes e de pendente de amostras que, real mente, representam a popu
larrao visada.
Apresentamos aqui a diferenrra entre amostras e popularroes. Voce ira verificar, quando
ler livros textos de estatfstica, que os estatfsticos possuem maneiras diferentes de descrever
amostras e popularroes. Estritamente falando, estatf.5ticas descrevem amostras. Dessa forma,
quando calcular a media de uma amostra voce tera obtido uma estatfstica. Se, no entanto, for
calculada a media de uma popularrao, voce devera denomina-Ia de parametro. Enquanto esta
tfsticas descrevem amostras, parametros descrevem popularroes. Assim, a media da popularrao
e urn parametro, e a media de uma amostra e uma estatistica. Esta e uma distinrrao tecnica, e
nao deve preocupa-Io demasiado desde que voce tenha em mente as diferenrras entre tecnicas
estatfsticas que descrevem amostras daquelas que descrevem popularr6es. Tipicamenle utili
zamos estatfsticas amostrais para estimar parametros populacionais. Mais especificamente,
devemos utilizar estat{sticas deseritivas para descrever nossas amostras e a estat{stica in/e
rencia/ para generalizar estes resultados para a popularrao.

[~J :Ati~i~a~~~2. .,>.c

2.2.1

59

Media
A media e facilmente calculada por meio da soma de todos os valores da amostra e, en
tao, pela divisao pelo numero total de valores. A media da amostra (5, 6, 9, 2) sera:
5+6+9+2 =5 50

'

Com outro exemplo, se tivessemos 0 seguinte conjunto de dados 2, 20, 20, 12, 12, 19, 19,
25, 20, poderfamos calcular a media como segue:
Somarfamos todos os valores para obter 149...._
Dividirfamos, entao, a soma por 9 (que eo total de valores da amostra) para obter
uma media de 16,56.
2 + 20+ 20 + 12+ 12+ 19+25 + 20 = 16,56
Isso nos da uma indicarrao do escore tfpico da nossa amostra. E bastante diffcil simples.
mente utilizar a media de uma amostra como uma estimativa da media de uma popularrao.
Nunca estamos certos de quao proximos da media da popularrao esta a media da nossa amos
tra, embora existam lecnicas que podemos usar como auxflio (p. ex., intervalos de confianrra,
verp.121).

2.2.2

Mediana
A segunda medida de tendencia central e a mediana, oficialmente definida como 0 valor
que esta no meio da amostra, isto e, que apresenta 0 mesmo numero de valores acima e abai
xo dela. A mediana e calculada com a ordenarrao de todos os valores e com a tomada do valor
que esta no meio. Utilizando os dados 2,20,20,12, 12, 19, 19,25,20 (valores anteriores)
para ilustrar 0 calculo da mediana. primeiro ordenamos os dados em ordem crescente e atri
bufmos urn posco a cada urn. Assim:

se voc~ quer d~o9.~r. qual grupo, os fas de futebol ou de rugbi, e llle"-o~ inteligente,
qual

.'

das.~~uiri.t~alJlo~[as.

seria mais apropriada7 _

' ..._

o escore mediano'

-~'-""y~~~I~~:~~~~~~I:~a~: :Z~:W~~~~~~:~~~lant~._.de.~,~~,!":'~
, ' , . II'.. UlTl ,grupode fasde futebol e outro de fas derugbi
.... ".. . Uri) gruPQ dehomens eoutro de mulheres
.,jJm .gr.upode;est~dantesdepsicologia
' AJmgrupo dechimpanzes. .

Valores:
Postos:

12

12

19

~25

4~7

-- ,,'.
Opcistomediail,o-

2,2

Medidas de tendencia central


A primeira e talvez a forma mais comum de estatfstica descritiva que voce vai enconlrar
sao as medidas de tendencia central. Uma medida de tendencia central de urn conjunto de
dados fomece uma indicarrao do escore tfpico deste conjunto. Existem tres diferentes medidas
de tendencia central tipicamente utilizadas para descrever nossos dados. Vamos iniciar com a
mais popular delas, a media, que tambem e conhecida como media aritmetica.

Voce pode ver que os valores foram ordenados (linha de cima) e a cada urn foi atribufdo
urn posto (rank). Dessa forma, 0 valor mais baixo lem posto urn, 0 proximo posto dois e as
sim por diante.
Estrilamente falando, no entanto, quando livermos dois ou mais valores iguais (como no
exemplo), os postos atribufdos a valores iguais devem ser iguais. Assim, os postos dos dados
apresentados devem realmente ser os seguinles:

60

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Valores:

12

12

19

19

20

20

20

25

Postos:

2,5

2,5

4,5

4,5

Posi<rOes dos postos:

~J

A media de5tes
dois fomec

'

lim' poSta de'2;S"'"

~~J

,!

Postos:
Posi<roes dos postos:

12

19

2,5

2,5

4,5

234

20

20

25

26

10

10

@ (j)

~\

o ponto: medlo
eST:a entre estes '
dois pastos
Neste caso a mediana sera a media entre os dois centrais, isto e,a media entre os valores
que estao na quinta e na sexta posi<rOes. A mediana, neste caso, sera: (19 + 20) + 2 = 19,5.

2.2.3

Moda
A terceira medida de tendencia central e a moda, que e simplesmente 0 valor mais repetido.
No conjunto de valores apresentado acima para ilustrar a media e a mediana, a moda seria 20,
que e 0 valor que mais se repete.

.queM;~I~~~;1i~~~~a
2

12121~~

25

26

.~! :;~ i '

'. _ , .

. . -, .

. _

<'::

- . .

2.2.4

,.:';'~::

,.,:,,:..:,~! . :"".:, ,

,!.'~;1l!,:,~?,.~,61;~1.16,.!~,2~,5.14. 62.:-1~, 12"" . ' . ' ... -:

.......,\,':.

Neste caso e preciso

12

.;.t-i' JJr,.~,t::~;

.[~l:~i;~.i;~.~ .::.~'~o;~~~

clim pdsti:h:rt7

tamar a media destes


dais val ores ~9 meio.

~;

" ,'" . :.. ~::~~:.'~~jft~~~~~'.i~;1~;~~~/j2~~:i

", ~niedi~:~~es
'tr4s fomeee

Voce pode verificar que todos os valores iguais possuem 0 mesmo posto. Atribufmos os
postos, no caso, tomando a media das posi<roes que eles ocupam, como ilustrado acima.
Para encontrar a mediana, precisamos localizar 0 escore que esta no meio da lista dos
postos. Temos nove valores, desta forma, 0 escore do meio e 0 quinto. A mediana e, assim, 0
valor 19, que e 0 quinto valor da lista ordenada dos valores da amostra.
No exemplo acima, foi facil determinar a mediana, pois tfnhamos um numero fmpar de
valores. Quando se tern urn numero fmpar de valores, sempre vai existir um que estara no
meio. Este nao e0 caso, entretanto, quando existir urn numero par de valores. Se agregarmos
o valor 26 no conjunto de dados anterior, teremos agora urn numero par de valores.

Valores:

..

61

'.".,.

Qual medida de tendencia central voce deve usar?


Descrevemos para voce tres diferentes medidas de tendencia central, isto e, tres medidas
de urn valor tfpico em uma amostra. Uma questao permanece, no entanto: qual destas me
didas voce deve utilizar para descrever os seus dados? A resposta a esta questao depende do
conjunto que voce tern.
a ponto importante a ser levado em conta quando for escolher uma medida de tenden
cia central e que ela deve dar a voce uma boa indica<rao do valor tfpico da amostra. Se ha
razoes para suspeitar que a medida de tendencia central que usou nao fomece uma boa indi
ca<rao do valor tfpico do conjunto, entao voce provavelmente escolheu a medida errada.
A media e a medida mais freqiientemente utilizada e e ela que deve ser usada, uma vez
que voce esteja convencido de que ela fomece uma boa ideia do valor tfpico do conjunto. Ea
medida a ser escolhida porque e calculada a partir dos valores reais, e nao a partir dos postos,
como e 0 caso da mediana e da freqiiencia de ocorrencias, a moda.
Existe urn problema com a media, no entanto. Em virtude de utilizar os pr6prios valores
da amostra, e sensfvel a valores extremos. Observe a seguinte amostra:

2 3 4 5

6 7 8 9

10

A media deste conjunto de dados e 5,5 (assim como a mediana). Se alterarmos urn dos
valores aumentando-o razoavelmente, obteremos 0 seguinte conjunto:

2345678920
A media deste conjunto e 6,5, enquanto a mediana permanece 5,5. Se aumentarmos
ultimo valor, obteremos:

2 3 4 5 6 7 8 9 100
Temos, agora, uma media de 14,5, que nao e, obviamente, uma boa indica<rao do
valor tfpico deste conjunto de dados. Como existe 0 mesmo numero de valores em cada
urn destes conjuntos e alteramos somente 0 maior valor de cada urn, a mediana permane
ce como 5,5. A mediana e, assim, uma medida de tendeocia central melhor para os dois
ultimos conjuntos. Este exemplo ilustra a necessidade de checar os dados para verificar
se existem valores extremos (iremos introduzir uma maneira de fazer isto, mais adiante)
antes de decidir que medida de tendencia central utilizar. Na maioria dos casos, voce,
provavelmente, verificara que e aceitavel 0 uso da media como medida de tendencia
central.
Se voce encontrar valores extremos, entao a media nao devera ser utilizada, neste
caso 0 melhor e utilizar a mediana. A mediana nao e sensfvel a valores extremos, como
o exernplo mostrou. Isso ocorre porque ela e 0 valor do meio dos demais quando estes

62

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

sao ordenados. 0 procedimento para localizar 0 valor media no nao depende dos valores
em si, a nao ser do fato de coloca-Ios em ordem. Assim, 0 maior valor no nosso exemplo
poderia ser 10,20, 100 ou 100 milhiies, e a mediana ainda nao se alteraria. E esta insensi
bilidade a valores extremos que faz a mediana util quando nao podemos utilizar a media.
Como a moda e simplesmente 0 valor que ocorre com maior freqiiencia, nao envolve
qualquer calculo ou ordenamento dos dados. Entao, ela pode ser utilizada com qualquer
tipo de dados. Urn dos problemas da media e da mediana e a existencia de certos tipos de
dados em que nao podem ser usadas. Quando temos categorias de uma variavel, tal como
ocupa<rao, nao faz sentido tentar ordena-Ias. Dessa forma, nao podemos utilizar a media
ou a mediana. Se voce tern este tipo de dados, nao tern outra escolha a nlio ser a moda.
Entretanto, quando utilizamos a moda, precisamos ter certeza de que ela esta realmente
fornecendo uma boa indica<rao do valor tipico. De uma olhada nos seguintes conjuntos de
dados:
2
2

2 222 2 2 3 4
2 345 6 7 8 9

Uma forma de estimar a media da popula<rao e calcular as medias de varias amostras e,


entao, calcular as medias destas medias amostrais. Os estatfsticos verificaram que isso forne
ce uma boa aproxima<rao da media populacional.
Por que a media das medias amostrais esta proxima da media populacional? Imagine que
uma amostra de pessoas e selecionada ao acaso e seus quoeficientes de inteligencia (QIs)
sao medidos. Sabe-se que, geralmente, 0 QI medio da popula<rao e 100. Poderia acontecer,
por acaso, que a amostra contivesse apenas genios, e 0 QI medio encontrado fosse de 150,
c1aramente superior ao valor da popula<rao. Se uma outra amostra fosse selecionada, poderia
acontecer de 0 QI medio ser de 75, novamente distante da media populacional. Eevidente, a
partir destes exemplos, que a media da amostra nao precisa estar proxima do valor da media
populacional. Entretanto, se calcularmos a media des~ dois resultados obteremos uma me
Ihor aproxima<rao da media populacional:
75+ 150 = 112,5

5 6 7 8
10 II 12

A media das medias amostrais (112,5) e uma melhor aproxima<rao da media da popu
la<rao (100) do que seriam as medias das amostras individuais (75 e 150). Quando tomamos
vadas amostras de mesmo tamanho de uma popula<rao, algumas terao medias superiores a da
popula<r ao , enquanto outras terao valores inferiores. Se calcularmos a media de todas estas
medias, teremos urn resultado bern proximo do valor 100, que e a media da popula<rao. Essa
tendencia da media das medias amostrais de se igualar ao valor da media da popula<rao e
conhecida nos cfrculos estatfsticos como teorema celltral do limite. Saber que a media das
medias amostrais fornece uma boa aproxima<rao da media da popula<rao e importante para
nos auxiliar a generalizar resultados da amostra para a popula<rao.

Voce deve ter notado que, no primeiro conjunto de dados, 0 valor 2 se repete bern mais
do que qualquer outro. A moda, neste caso, sera uma medida de tendencia central apropria
da, ja que ela e uma indica<rao razoavel do valor tfpico. No segundo conjunto 0 valor 2 sera
novamente a moda, pois e 0 valor que ocorre com maior freqiiencia. No entanto, aqui, ela
nao sera urn born indicador, pois sua freqiiencia de ocorrencia e apenas levemente superior
ao de qualquer outro. Entao, neste caso, a moda nao deveria ser escolhida como medida
de tendencia central. Algumas vezes voce nao teni uma medida de tendencia central apro
priada. Em tais situa<r0es, voce deve aceitar 0 fato de que a amostra nao apresenta urn valor
tfpico.

[~) Ati~i~a~~.2:~~':d'\
_ .,.,';,. ,".'_ .','

,~." . l

2.3

'.' -'
:._ ... '-. l

.'
.':, ,.

..

.. .

. .

(a) 123 "2526

i7 2329

30

-' 1

:, .

:.~ ~

, (d) 1) 011 04 106 .111108 109 200

2.2.5

Media da

Erro amostral
Antes de ler esta se<rao, voce deve completar a Atividade 2.4.

".,

Que medida de tendl!nda eentrall! mais apropriada para os seguintes eo",juntos de dados?

; ,"(Wi .i\.'1 '.P1,1>;,Vl,;f'f1 :2 2'2 2 2 3 34 50


(eLL"2 3 4:1~ 6,5-8345 67

63

popula~o

As medidas de tendencia central que descrevemos sao uteis para dar uma indica<rao do
valor tfpico de uma amostra. Suponha que queremos uma indica<rao do valor tfpico em uma
popula<rao. Podemos, teoricamente, calcular a media da popula<rao (urn parametro) de manei
ra semelhante ao calculo da media da amostra: obter os valores de todos na popula<rao, somar
e dividir a soma pelo tamanho da popula<rao. Na pratica, entretanto, isto nao e, normal mente,
possfvel. Voce poderia imaginar como seria tentar medir 0 nfvel de ansiedade causada pela
estatfstica e a procrastina<rao de cada indivfduo no mundo? Portanto, devemos estimar os
parametros populacionais a partir das estatfsticas amostrais.

64

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Advidade;2.4
. i,; i j ~.;

':,,:

"';:

. Acima tem-se.um diagrama contetidofiguras de'muitos pandas gigantes. Cada panda


gigante terri urn numero que indicasl!lJQI,pai<:l,ih.Jmar os problemas associados com 0 erro
aniostral, voc@ deve cbmpletcitosseguint~pa.!;SOse'entilo ler a ~o erroamostral. Imagine
que esta figura represente a p6pula~bdos pandas gigantes. 0 QI medio desta popula~ao e
100. Queremos que voce selecione dez ambStras ao acaso desta popula~ao. Cada amostra
deve conter somente dois pandas. Para fazer isso, sugerimos que voce balance urn lapis sobre
a figura com os olhos fechados. Com a mao livre, mova 0 livro para os lados. Quando pronto,
, deixe apontado lapis atingir a pagina do Iivro. Veja qual 0 panda selecionado (se voce atingiu
urn espa~o em branco entre os pandas selecione 0 panda que estiver mais pr6ximo do ponto
que o lapis atingiu). Tome nota do QI do pandaselecionado e repita 0 processo duas vezes
para cada amostra. Voce dev!! repetif' eS1:e processodez vezes; de modo a obter dez amostras
retiradas da popula~ao de pandas. Entendemosque i~Sonao fornece uma sel~ao aleat6ria da
popula~ao, mas basta, por ora, para ilustrar 0 WJe queremos mostrar.
Desejamos agora que'voce repita todoo processo, mas, desta vez, selecionando dez pan
das em cada amostra. Umavez sorteadas as'amostras, calcule a media de cada uma das
selecionadas (todas as de dois pandas etodasasde dez pandas);
Voce podeagora continuar a-'era s~ao sabre 0 erroamostral.

65

Consiste em urn dos problemas da amostragem 0 fato de os erros sistematicos poderem


afetar nossa pesquisa e, como conseqiiencia, toma-Ia diffciI de interpretar. POI' esse motivo, 0
erro devido ao processo de amostragem e, talvez, 0 maior problema que enfrentamos quando
estimamos parametros populacionais a partir de estatfsticas amostrais. Sempre que selecio
narmos uma amostra de alguma popula~ao, ini existir incerteza sobre quae representativa a
amostra e realmente. Assim, se caIcularmos uma estatfstica amostral, nunca estaremos segu
ros sobre 0 quanto ela podeni diferir do parametro populacional. a grau com que a estatfstica
amostral difere do parametro populacional equivalente e denominado de erlV amostral. Por
que existe tal erro e como podemos minimiza-Io?
a erro amostral ocorre simplesmente porque nao utilizamos todos os membros da popu
la~ao-alvo. Uma vez que se usem amostras, sempre se-obteni algum grau de erro amostrai.
Por exemplo, suponha que des'ejamos medir 0 QI dos pandas gigantes. Se fOssemos a campo
e testassemos todos os pandas existentes no mundo, caIculariamos 0 QI medio populacional
diretamente. Terramos testado toda a popula~ao e, desta forma, a media que caIculamos seria
a popuiacionai.
Agora, suponha que testamos somente 90% da popula~ao. Efetivamente selecionamos
uma amostra. A media que calculamos desta amostra sera uma boa estimativa da media popu
lacional, mas ela nao sera necessariamente a mesma. Em virtude de nao terrnos testado todos
os pandas, provavelmente subestimaremos ou sobreestimaremos a media popuiacionai.
a fato de termos selecionado tantos pandas significa que, par acaso, temos uma boa
probabilidade de selecionarmos elementos dos dois extremos da distribui~ao. au seja, e
provavel obter tanto pandas inteligentes quanto nao tao inteligentes na nossa amostra. Voce
deve ter visto. ao completar a Atividade 2.4, que, quando selecionou amostras contendo dez
pandas, em todas elas havia pandas cujos Qis estavam abaixo e acima da media. Assim,
com tamanhos amostrais relativamente gran des, nossas amostras terao alta probabilidade
de conter pandas inteligentes e nao tao inteligentes. A media amostral sera, entao, pro
vavelmente uma estimativa bastante boa da media populacionai. Conseqiientemente, se
tomarmos muitas destas amostras. 0 grau de erro amostral para cada uma sera provavel
mente bern baixo.
Digamos agora que temos pesquisadores com uma verba bem reduzida e, como conse
qiiencia, eles podem utilizar somente amostras contendo dois pandas. Que efeito tera esta
redu~ao do tamanho da amostra no grau de erro amostral? Novamente nos referindo 11 Ativi
dade 2.4, voce provavelmente notou que, em algumas das amostras que selecionou, os dois
pandas eram mais inteligentes do que a media popuiacionai. Isso significa dizer que a sua
media amostral e uma sobreestimativa da media populacional. Voce descobriu, ainda, que em
algumas das amostras os dois pandas eram menos inteligentes do que a media popuiacionai.
Sua media amostral, neste caso, ira subestimar a media popuiacionai. Com amostras peque
nas e, entao, mais provavel que na totalidade os ursos sejam ou mais ou menos inteligentes
do que a media populacionai. Em tais casos, a media amostral nao sera uma boa estimativa
da media populacionai. Dessa forma, teremos um erro amostral bem maior com as pequenas
amostras.
A. medida que se amplia a amostra, aumenta a probabilidade de escolha de pandas que temo
QI tanto acima quanto abaixo da media populacionai. Tambem diminui a probabilidade de que
todos os pandas selecionados estejam em um dos extremos da distribui~ao. Desta forma, dimi
nuira 0 grau de erro amostrai. Voce deve ter notado da Atividade 2.4 que as medias calculadas
a partir de amostras de dois pandas variavam bastante, com algumas bem diferentes da media
populacional, enquanto que nas de dez pandas as medias amostrais eram, provavelmente, boas
estimativas da media populacionai. Assim, em geral, quanto maior for 0 tamaoho da amostra
mais proxima a sua media estara da media populacional.

66

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

."

. .'>.,,,.: ..... , "- .." ".k.': ... '.

[Q lSPSSP~:"'9bten~~~e

.,.

. ....

..,'

.'

tllqu~ primeij.ci'

" ..

me~idasde,tendenciacentral;

.... >:~- ..').".. '"

_'d~

iiavaiiiveide' '
. .interesse e.
: depois na setai::

67

ii

~~j~~.f;;.;:

Para obter medidas de tendencia central a partir do SPSSPW, voce deve entrar com os
dados como descrito no Capitulo I e entao clicar no menu Analyze (Analisar) (veja figura
abaixo).

"G, !!/:;""I'~

Clique no menu
Airaljze (Anallsar)

~:.;::~;:-':""""':'7)"",~~~:J.
::""":1

_;"~">'~~~!~ .;:::.... ;"<... [ ~::~., :i;:;.~;~~

. ; .'~~..

:;', ~-~~I: . . ':~: ;-, ':-~,'1.


--"'~

'ni'

~I
""'.

~.'.
~_'IIl(;-:~zc:~.-~

ti...l1
-:---,

---1---

~._-~!

'

.1

I -

iiS5~ilJNOr

- -.... ~1.

.J

-I~t

+----+
i 'I'" 'I
I

,n

. . .'

; . . . ._.

t,-+

.-j----=1~
I
.!f7

..
n~1
j

~~~

;',,,

" .....j,,~'lIjC.Q_,il'"

i----+------1------I---.
+1-------"+ .

I '
_l:::=:::L

I'"

"

.----~--

.... van:/ I.'

~I_ _L. __

'-1' _. -"

,- r-

.I,,,, .. :.:::k~~

Quando 0 menu Analyze (Analisar) aparecer, clique na opc;ao Descriptive Statistics (Esta
tfstica Descritiva) e entao selecione a opc;ao Explore... (Explorar) do menu final. Voce obtera
a seguinte caixa de dialogo.

Existem outras opc;oes para determinar estatfsticas descritivas, mas a opc;ao Explore
(Explorar) e a mais f1exfvel. A opc;ao Explore permite que voce acesse urn grande leque de
tecnicas estatfsticas descritivas e e, desta forma, uma opl;ao util para se utilizar. Voce podera
notar que existem vanas oPc;5es nestajanela de dialogo, incluindo:

lista de variaveis
caixa para variaveis dependentes (Dependent List)
caixa para variaveis de agruparnento (Factor List)

opc;oes de apresentac;ao (Display - embaixo a esquerda)

varias opc;6es de botOes (Statistics - Estatfsticas, Plots - Diagramas, Options


Opc;oes)

Para obter medidas de tendencia central. mova as variaveis de nao-agruparnento para a cai
xa da Iisla das dependentes (Dependent list), selecionando as variaveis de interesse, e clique
na seta preta ~ apontando para a caixa da lista das variaveis dependentes (Dependent List).

68

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

--i

Descriptives (Medidas Oescrilivas)


Statistic
(Estall'tica)

:#a{i~(

-c

---r--ul
-- 'I1.

._\..

" '=J-I

~=~cr--t
.

(:::1

=t- -

'

.1. i

~--~=--t=-----I

WITH DOG Mean (M~ia)


(Com oCao) 95% Confidence
Interval for Me~n

8.6667

(Intervalo de Confian~a
de 95% para a M~ia)
5% Trimmed Mean

Lower Bound
(Limite Inferior)

6.3996

Upper Bound
(Limite Superior)

10.9337

(M~ia

Interna de 5%)

... :

~-

Std. Deviation (Oesvio Padrao)

~rb;~E5~-' 'ckr:=-=;:~
'I.. HlIlifJIlClQ'"",
Para obter as estatfsticas descritivas relevantes, selecione a o~ao Statistics (Estatisticas)
(0 botao do meio da op~ao Display - Mostrar) e clique no botao OK. Feito isso, voce obteni
a seguinte safda do SPSSPW:

6.00
12.00

EXPLORE

Skewness (Assimetria)
Kurtosis (Curtose)

WITHDOG (Com 0 cao)


NODOG (Sem

cao)

Percent
(Percentual)

50.0%

12

100.0%

50.0%

12

100.0%

Percent
(Percentual)

Percent
(Percentua!)

50.0%

50.0%

Total (Tota!)

4.0000

.7303

5.8773

5% Trimmed Mean (Media Interna de 5%)

4.0556

Median (Mediana)

4.5000
3.20
1.7889

Minimum (Mlnimo)

1.00

Maximum (Maximo)

6.00

Range (Amplitude)

Missing Nalores Omissos)

.845
1.741

Upper Bound
(Limite Superior)

Interquartile Range (Intervalo Interquartil)


Valid Niilidos)

.463
-.300

2.1227

Std. Deviation (Oesvio Padrao)

Cases (Casos)

Skewness (Assimetria)
Kurtosis urtose)

3.7500

Lower Bound
(Limite Inferior)

Variance Nariancia)

Case Processing Summary (Sumiirio do Processamento dos Casos)

M4!dia e

Mediana

6.00

Interquartile Range (Intervalo Interquarti!)

(Intervalo de Conr.an~a
de 95% para a M~ia)

2.1602

Maximum (Maximo)

NODOG Mean (M~ia)


(Sem 0 cao) 95% Confidence
Interval for Mean

Std. Error
(Erro Padrao)

4.667

Minimum (Mlnimo)
Range (Amplilude)

8.6296
8.5000

Median (Mediana)
Variance (Variancia)

_I

69

5.00
2.7500
-.943

.845

.586

1.741

Voce notara, a partir da safda do SPSSPW, que existem muitas infonna~6es apresen
tadas. Nao se preocupe se nao entender muitas delas neste estagio; elas serao explicadas
mais adiante no livro. Por enquanto, voce deve perceber que, para as duas variaveis, pode
se ver a media e a mediana. Se desejar a moda, voce deve tentar utilizar 0 Frequencies...
(Freqtiencias), op~ao do menu Analyze... (Analisar), submenu Descriptive Statistics (Es
tatfsticas Descritivas), em vez da op~ao Explore... (Explorar). Uma vez obtida a caixa
de dialogos Frequencies (Freqiiencias), abra-a e clique no botao Statistics (Estatfsticas).
Selecione a moda a partir da pr6xima caixa de dialogo que ira abrir (veja a tela a seguir):

70

Estatistica sem Ma!ematica para Psicologia

Christine P. Dancey & John Reidy

71

pelo sangue, os investigadores solicitaram aos participantes que indicassem, a partir de uma
lista de sete cores, qual a favorita. A Figura 2.2 representa 0 histograma destes dados. Voce
deve ser capaz de ver na Figura 2.2 quantas pessoas escolheram 0 azul como sua cor favorita
com mais freqiiencia e 0 branco como sua cor favorita com menos freqiiencia.
Histogram (Hi'tograma)

80 I

60

'u
c:

.",

,"

Ie. 40
c

OJ

:J

C"

.t

20

~T;'\
i --1-_;
;::=>J.th,,",.
,.,:,.,,'"";,~~~
II'"
. .' 1"~!ll"''lJIfCoq.

N= 181'

o
Vermelho Verde Marrom Preto Branco Azul Amarelo
Favourite Colour (Cor favorita)

2.4

Descri~ao

grMica dos dados

Terminada uma pesquisa. e importante que seus dados sejam analisados. Uma das melho
res formas de fazer isso e por meio da AED (Analise Exploratoria de Dados). A AED consiste.
basicamente, em explorar os dados atraves de tecnicas graticas. Ecomum se obter urn grande en
tendimento de como os participantes do estudo se comportaram. A importiincia de tais tecnicas
graticas foi destacada por Tukey' em 1977, no texto classico denominado de Analise exploratoria
de dados (Exploratory data analysis). Analisar dados graficamente deve ser uma das primeiras
coisas a ser feita. Na proxima se<;ao, mostraremos as principais tecnicas para explorar os seus
dados. come<;ando com 0 histograma de freqiiencias (frequency histogram). Apos, explicaremos
os diagramas de caule e folhas (stem and leaf) e 0 caixa e bigodes (box plots).

2.4.1

Histograma de freqiiencias

o histograma de freqiiencias e uma forma util de ilustrar graficamente os dados. Muitas


vezes os pesquisadores estao interessados na freqiiencia de ocorrencia de valores nas amos
tras de dados. Por exemplo. se voce coletou informa<;6es sobre a profissao das pessoas, pode
estar interessado em descobrir quantos trabalhadores estao em cada uma das categorias de
emprego. Como ilustra<;ao considere 0 histograma de freqiiencias para urn conjunto de dados
coletado em urn estudo de Armitage e Reidy (nao-publicado). Para investigar 0 medo causado
'N. dcT John WildcrTukey (1915-2000).

Histograma mostrando as freqOencias de uma cor que as pessoas escolheram como sua
favorita.

o histograma de freqiiencias e uma boa forma de inspecionarmos os nossos dados visualmen


teo Muitas vezes, desejamos saber se existem alguns valores que podem parecer fora de contexto.
o histograma da Figura 2.3 representa valores hipoteticos de urn questionano sobre depressao.
Voce pode verificar a partir dele que 0 valor final e bern maior do que os demais. Dado que 0
maior valor desta escala de depressao e somente 63, podemos perceber a partir do histograma que
devemos ter cometido urn erro quando registramos os nossos dados. Tais problemas sao faceis
de perceber quando os dados sao postos em gr3.ficos. Voce deve, no entanto, estar ciente de que a
interpreta<;ao do seu histogrnma depende dos intervalos particulares que as colunas representam.
o histograma da Figura 2.3 tem colunas representando intervalos de uma unidade.
o histograma de freqiiencias e tambem utilizado para descobrir outras caracteristicas
importantes dos dados. Por exemplo. voce pode facilmente ver qual e 0 valor modal apenas
procurando pela coluna mais alta. Alem disso, 0 histograma nos da uma boa ideia de como os
valores estao espalhados, isto e, de como eles estao distribuidos. A forma como os dados es
tao distribuidos e importante, como voce podera constatar, quando discutirmos a distribuir;iio
nonnal, mais adiante, neste capitulo. A distribui<;ao dos dados e tambem uma considera<;ao
importante no uso da estatistica inferencial que sera discutida. Podemos ver, a partir do histo
grama dos dados do questionano sobre depressao, que existe uma concentra<;ao de valores na
regiao de 5 a 7 e, ainda, os valores das caudas acima e abaixo destes pontos.
N, de T. 0 SPSSPW Uliliza
(minusculo).

valor N (maiUsculo) para rcprcsenlar 0 tamanho da amostra. enquanto os aUlOres utilizam 0 valor n

72

Christine P. Dancey & John Reidy


20

Estatistica sem Matematica para Psicologia

":,' '. ~:~

!t.

'j .,";,:

~; !~~ti:t;:i~;~~~};~~_ ..:.~;<~i~~~~~~~;~.i~~~~:!~~(/~~..-~

.'

'el ,

., ' ':\~~~i,,~~{U:::l~Y1;~f.'f:S~;!~~!'~~;J;F'

'",',<': ','.., D~tfo o'~al~te'hiSf~~errt~~ndl!r'esia'squlistc5es:'~:~ ,

15

";:',':.:;'7~~~~~:;;?~~;;~~;:)in/:;7~J,;:' ,:,; ;,

'Cl/

.~
~

'",

'u
c;

!t.

~
: .,"j.:: .

,', """~ AtlvldadEr:Z:ii1,';";'::"";~if.f,jj;it:;':;'~j{;''';

",:Moda

73

10

'h"

\;.~:;;}

: ':

Valor" ,

suspeito

OJ
:J

~,

'

;"{

. :~ r~..~:'

~
LL

. 4 ---. ..;: . ;;~.l

~~:

J)_) /, ',1',,1:'
J..
7;3

:"{"

',,'~ ~

8
7

10
9

14

12
11

13

15

16 18 20 22
24-60
17 19 21 23
64

'('

:";.

Depression scores (Estores da depressao)


Histograma dos dados do questionario sobre depressao.

40

....

~i~::ji~.~t~~;':,,:

,".

. : i ~

:,.

.: j' .~.

, JcrQua.'?!tal.~~t~~,~!'11
'f)Q'.'. _~'."".~~W:P,:)""",. :"l!'!t~~.~te
'''1 ,T:'.
- 5?
.' '

_.,d,:<~~~~~:.~~~~~%,~~:~re,Q;~P'

30

'u
c;

."

CT

!t.

2.4.2

20

Diagrama de caule e folhas


Os diagramas de caule e folhas sao semelhantes aos histogramas de freqiiencias no sen
tido de permitirem que se veja como os valores esmo distribufdos. Alem disso, eles retem os
valores das observar;oes individuais. Desenvolvido por Tukey: em 1977, sao mais faceis de
construir manual mente do que urn histograrna. 0 diagrama de caule e folhas para os dados
que utilizamos a fim de ilustrar 0 calculo da media, mediana e moda (2, 12, 12, 19, 19, 20, 20,
20, 25) e apresentado na Figura 2.5.

OJ

:J

LL

10

0-4

5-9

10-14

15-19

20-24

25

59 60-64

Caule

Depression scores (Estores da depressao)

~ma dos dados do questionario sobre depressao agrupados em intervalos de


~ amplitude 5.
A melhor maneira de gerar urn histograma manualmente e, primeiro, ordenar os dados,
como foi descrito anteriormente no capitulo, ao se determinar a mediana. Simplesmente se
conta 0 numero de vezes que cada valor ocorre - esta sera a freqiiencia de ocorrencia de cada
escore. A freqiiencia e, entao, registrada no grafico, como mostrado.

Folhas

;~ejf~

"" o

-----

U~idades

o valor 2

2299
2

o 0 0 5- -

Exemplo de um diagrama de caule e folhas,

N. de T. John Wilder Thkey (191S-2000).

Ovalor 25

74

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Voce ve as semelhaneras entre histogramas e diagramas de caule e folhas se girar 0


diagrama de caule e folhas para 0 lado. Quando fizer isso, teni uma boa representaerao da
distribuierao dos dados.
Voce percebeni, entao, no exemplo da Figura 2.5, que os valores foram agrupados em
dezenas: a primeira linha contern os valores de 0 a 9; a pr6xima, de lOa 19, e a ultima linha,
os valores de 20 a 29. Dessa forma, neste caso, 0 caule indica as dezenas (este valor e cha
mado de tamanho do caule), e asfolhas, as unidades. Voce vera que 0 valor 2 e representado
como 0 na col una das dezenas (0 caule) e 2 na coluna das unidades (a folha), enquanto 25 e
representado como urn caule de 2 e uma folha de 5.
a diagrama de caule e folhas na Figura 2.6 foi construfdo com base nos seguintes dados:

Estes nao seiiam apresentados;ilQS


histogramas. SAo apresentad!iS; .
aqui apenas em caratei' inforrna~o.

/1
I

60-64

Diagrama de caule e folhas para urn grande conjunto de dados.

Voce pode perceber pela Figura 2.6 que 0 diagrama de caule e folhas fomece uma forma
concisa de apresentar urn conjunto grande de dados. Algumas vezes, no entanto, 0 sistema de
agregar os dados em grupos de dez nao e muito informativo. De uma olhada na Figura 2.7,
que mostra 0 diagrama de caule e folhas para os dados da depressao apresentados na forma de
histograma (Figura 2.3) anteriormente.
A Figura 2.7 nao nos da muita informaerao sobre a distribuierao dos valores, a nao ser 0
fato de que eles sao na maioria inferiores a 20. Urn sistema altemativo e juntar os valores em
blocos de cinco (p. ex., 0-4, 5-9, 10-14, 15-19, etc.). No diagrama de caule e folhas da Figura
2.8, a variavel depressao estli agrupada assim. Isso fomece uma melhor indicaerao da distri
buierao dos valores. Veja que utilizarnos urn ponto (.) ap6s 0 caule para representar a primeira
metade do grupo de dez valores (p. ex., 0-4) e urn asterisco (*) para representar a segunda
metade de cada bloco de dez valores (p. ex., 5-9).

Muito mais informativo sobre a


forma da distribui~o

(Bloeos) (Caule)
(Folhas)
Q-4
O.
0000022222222333333333
5-9
0'
555555555555555777777777777799999999
10-14 1.
000000033333
15-19 l'
888
20-24 2.
3

Caule Folhas
o
11222555
1
2222444455588

44444455555558888888
22333344444455555
222334

Valores

I, 1,2,2,2,5,5,5, 12, 12, 12, 12,14, 14,14,14,15,15,15,18,18,24,24,24,24,24,24,25,


25,25,25,25,25,25,28,28,28,28,28,28,28,32,32,33,33,33,33,34,34,34,34,34,34,
35,35,35,35,35,42,42,42,43,43,44.

2
3
4

75

6.

Diagrama de caule e folhas para os dados de depressao agrupados em blocos de dez.

2.4.3

Diagrama de caixa e bigodes


Mesmo que voce perceba que existe urn valor extrema no exemplo da depressao, 0 caso
e que muitas vezes valores extremos nao sao tao 6bvios. Tukey (1977), conlUdo, desenvolveu
uma tecnica gratica denominadade caixa e bigodes' (box plot), que nos fomece uma indica
crao clara dos valores extremos, da mesma forma que 0 histograma e 0 diagrama de caule e
folhas informa como os valores est5.o distribufdos.
Embora voce possa utilizar 0 computador para produzir urn diagrama de caixa e bigodes.
iremos descrever como construir urn a partir dos dados abaixo, de modo que voce saiba como
interpreta-Io (0 diagrama para estes dados esta apresentado na Figura 2.9):

2 20 20

12

12

19

19

25 20

Primeiro, encontre 0 valor mediano como descrito anteriormente. E0 valor da quinta


posierao (0 valor medianoe, neste caso, 019, ap6s os dados terem sido ordenados).

2 12 12

19

20 20 25

A medianae 0 quinto
valor;do conjunto ordenado.

Caule Folhas

0000022222222333333333555555555555555777777777777799999999

000000033333888

Ap6s, calcule os quartis. Sao os valores que separam 0 conjunto em quatro partes
iguais". a primeiro quartil deixa 25% dos valores abaixo dele, eo terceiro quartil,
25% dos valores acima dele. as quartis I e 3 formam os limites inferior e superior da
caixa (veja Figura 2.9). Para determinar 0 valor dos quartis, adicionamos I ii mediana
e entao dividimos por 2 (Iembrar que a mediana esta na quinta posicrao). Assim:

Diagrama de caule e folhas para os dados de depressao agrupados em blocos de dez.

5+1=3

.. N. de T. 0 (erma caua e bigooes para box plOfse explica porTukey larnbC'm terdcnominado esIc diagramade box alld whisker pJo.
** N. de T. Os quanis sao em numero de Ires. 0 segundo quartil coincide com a mediana.

76

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Voce pode ver na Figura 2.9 que a amplitude "h" e indicada pelo tamanho da caixa (de 12 ate

.rep::a~a~
30

20) e que nao existem valores extremos. As Iinhas saindo da caixa sao os bigodes e representam a

viliore!

20

adjiialntes

Quartis
Bigodes
10

caixa
O

N=

Dados

Exemplo de urn diagrama de caixa e bigodes.

amplitude dos valores que ficam abaixo do primeiro quartil e acima do terceiro, mas ainda dentro
dos limites internos. Qualquer valor que esteja fora dos limites internos e denominado de valor
extremo ou ainda de atipico (outlier). Voce pode ver a partir da Figura 2.9 que nao existem valores
fora dos limites internos, que sao 0 e 32. Os limites internos nao sao necessariamente mostrados
no diagrama. 0 maior e 0 menor valor entre os limites internos (escores adjacentes 2 e 25) sao
indicados no diagrama pelas Iinhas transversais em cada urn dos bigodes.
Se agora adicionarmos 0 valor 33 ao conjunto de dados ilustrado na Figura 2.9, 0 dia
grama de caixa e bigodes sera semelhante ao mostrado na Figura 2.10. Voce deve notar que
o valor 10 esta destacado. Isso e para nos infonnar que 0 decimo valor do nosso conjunto de
dados e urn valor extremo (atipico), isto e, ele esta fora da cerca interna do valor 32. Podemos
querer dar uma olhada neste valor para saber por que ele e atipico, pois poderia ser resultado
de urn erro no registro dos dados.
o diagrama i1ustrado na Figura 2.11 representa os dados a partir de escores hipoteticos de
depressao apresentados anterionnente no capitulo. Voce ve a partir dele que 0 valor extremo

40

Os quartis I e 3 sao, portanto, 0 terceiro valor a partir do tim e 0 terceiro valor a partir
do inicio da Iista ordenada, que no exemplo sao 0 20 e 0 12, respectivamente.

Q~cirtis

23~\78

Valores:
Postos:

12

77

@,; ,

2~ @20

010

30

Valor
atlpico

20

10

25

o
-10

Mediana
A partir dos valores dos quartis I e 3, podemos detenninar a amplitude interquartilica
"h", que e a distancia entre os dois quartis. 0 valor do terceiro quartil e 20 e 0 do
primeiro e 12, portanto h = 8 (20 - 8).
Detinimos como urn valor extremo aqueles que caem a uma distancia maior que uma
vez e meia a distancia h contada a partir dos quartis I e 3. Uma vez e meia 0 valor h,
neste caso, e 12 = 1,5 x 8. Assim, qualquer valor que esteja abaixo de 12 -12 =0 ou
acima de 20 + 12 = 32 e c1assiticado como urn valor extremo. Os valores 0 e 32 sao
denominados de limites internos.
Os valores situados entre os quartis I e 3 e os Iimites internos e que estao mais pr6
ximos destes limites sao denominados valores adjacentes. No nosso exemplo sao os
valores 2 e 25, pois 2 esta mais pr6ximo de 0, 0 limite interno inferior, e 25 esta mais
proximo de 32, 0 limite interne superior. Estes valores sao i1ustrados por uma barra
transversal em cada urn dos bigodes.
Qualquer valor extremo (aqueles que ficam fora dos limites internos) sao mostrados
no diagrama de caixa e bigodes.

10
Dados

N=

Diagrama de caixa e bigodes ilustrando urn valor extremo.

70
60
50

40
30

.75

20

1~ ]

-10
N=

~ Valores

atlpicos

~
75
Depressao

Diagrama de caixa e bigodes para urn questionario ilustrando varios valores extremos.

78

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


6bvio (0 escore 64) e representado como tal. Entretanto. existem valores menos 6bvios que
sao extremos. como os valores 18 e 23. Isso mostra que nem sempre e possfvel apontar quais
valores sao atfpicos. e. desta forma. 0 diagrama de caixa e bigodes e uma tecnica bastante util
para a explora<;ao de nossos dados. Voce notara que 0 diagrama apresenta urn bigode vindo
do topo da caixa, Isso significa que existem valores que estao acima do quartil superior. mas
dentro do limite interno (0 valor 13).
Por que e importante identificar valores exlremos? Voce deve lembrar que muilas das
lecnicas estatfsticas disculidas no Iivro envoI vern 0 calculo de medias. Relembre que tambem
foi discutido como a media e sensfvel a valores extremos. Assim. devemos nos preocupar se
nossos dados contern ou nao tais valores extremos. para que possamos tirar conclusoes ade
quadas das analises estalfslicas realizadas.
ESlritamente falando. nao devemos ulilizar a maioria das lecnicas estatfsticas inferen
ciais deste livro se tivermos valores eXlremos em nossos dados. No entanto. existem formas
de se lidar com tais valores. Se voce se deparar com valores atfpicos execute as seguintes
etapas:

.[~)Atl::~::~:;~~t~~!~~~,~ .
'(b):QuantosvaloreSextrembs'exiSfifii1/"\:; ':, "",.' ,"

"'"".',

," c,' '

"i~~ i';:~l;}~':tl~f~/<:ii~;ijti)",~

E claro que. se voce fizer tais ajustes no valor. precisa regislrar exatamente 0

que foi
feito quando for elaborar 0 relat6rio da pesquisa. de modo que os leilores saibam que
as anaJises foram realizadas sobre alguns valores ajustados.

;-.

;.

.
.
;;'~t.~
'r:'~,

40
.

:.

20

Verifique se anolou ou digilou corretamente os dados.


Verifique se nao existe nada diferente do usual com os valores extremos. Por exem
plo. se voce lembra da pessoa que teve tal resultado ter entendido bern as instrur;oes
do lesle. se ela complelou 0 questionario de forma adequada. se existe algum motivo
para pensar que ela nao tenha complelado a tarefa de forma adequada.
- Se houver urn born motivo. entao voce pode remover 0 resultado desla pessoa da
amilise. Entretanto. quando 0 relat6rio for elaborado. voce deve registrar 0 fato e
colocar 0 motivo da remor;ao daquele valor.
Se nao existir nada de especial com 0 participante alem do fato de ele ter apresenta
do urn valor atfpico. provavelmenle. voce deve mante-Io na analise. E legftimo. no
entanto. ajuslar este valor de forma que nao seja lao extrema e assim nao influencie
excessivamente a media. Por que fazer isso?
- Lembre. se estiver ulilizando a media e por que esla inleressado no valor lfpico
do grupo. Claramente. urn valor eXlremo nao e urn valor tfpico. entao e legftimo
ajusta-Io para torna-Io mais de acordo com 0 reslo do conjunto.
- Para fazer isso. ajustamos 0 valor extremo de modo que seja igual a uma unidade
acima do valor mais alto da amostra. mas que nao seja urn valor atfpico. Desta
forma. 0 participante ainda sera reconhecido como 0 valor mais alto do conjunto.
mas a sua influencia sobre a media e sobre a analise estatfstica inferencial sera
menor.
- Como exemplo. vamos nos referir aos escores de depressao ja apresentados (veja
Figura 2.11). Suponha que exista apenas urn valor extrema nesta amoslra (0 valor
64) e que ele e urn escore valido (com 0 objetivo de iluSlra<;aO. vamos ignorar os
dois outros valores alfpicos deste conjunto). Para ajustar este resultado. encon
tramos 0 escore mais alto que nao seja atfpico. Neste caso. 0 valor e 13. Vamos
ajustar 0 escore extrema de modo que ele seja uma unidade apenas maior do que
13. Para esse exemplo, entao. 0 valor ajustado sera igual a 14.

79

10

o I

N='

25,,':

Exemplo da Iiteratura:

comportamento emocional e sindrome do panico

E raro que pesquisadores se refiram a diagramas de caixa e bigodes em pUblicar;oes, em bora


presumamos que de falo os considerem antes de utilizar muitas das tecnicas eSlalfsticas abordadas
neste Iivro. Uma exce<;ao e a publicar;ao recente de Baker e colaboradores. NeSle artigo os aulores
relatam urn estudo conduzido para investigar diferenr;as entre pacientes com sfndrome do panico
e sem a sfndrome. utilizado como controle em seus comportamentos emocionais. Eles concluem
que os pacientes com a sfndrome parecem controlar mais as emor;6es do que os que nao apre
senlam a sfndrome. Uma das medidas de controle emocional utilizadas foi a CECS' (Colirtalild
Emotional Control Scale, de Watson e Greer. 1973). que avalia 0 grau em que os respondentes
tentam controlar os sentimenlos como raiva, ansiedade e felicidade. questionario fornece, ain
da, urn escore IotaI que representa 0 "grau de controle emocional geral" dos respondentes. Na
ser;ao de resultados, os autores apresenlam urn diagrama de caixa e bigodes do escore tOlal da
CECS para 0 grupo com sfndrome do panico e para os dois grupos de controle que eles ulilizaram.
Entretanto, os autores nao comentam em qual diagrama esta sugerida a distribuir;ao dos escores
CECS destes grupos. diagrama de caixa e bigodes mostra que a distribuir;ao dos escores CECS
para os tres grupos sao bastante semelhanles. mas os pacientes com sfndrome do panico tendem a
ter escores CECS tolal mais altos. Adicionalmente, existem alguns escores atfpicos evidentes em
urn dos grupos-controle.

Nao temos condi<;6es de fornecer aqui uma discussao compIeta deste assunto, mas voce
pode encontrar mais informar;oes em Tabachnick e Fidell (2003).
N. de T. Esc.l. de Controle Emocion.1 de Coun.uld.

80

Christine P. Dancey & John Reidy

. ," .:-"::.. ' : '. ::',': ;,.>' >~".: \<.'~

Estatistica sem Matematica para Psicologia

;,~~~~i;:;~J(~>;;;~J;;'~:!.:~<fiifd:,~~ll~}':b;:d;';,;;~~;S~~;:;;';/'-'-:'.:;.~ ~_.

Histogram (Histograma)

"rFl1SPSSPW;'" era ',-cf(fe;:ifescritivss:"'rafitas,'


I

"

2.5

~ . ,'.' .".. :.. "\:,~;,~,::~~:~:t:Ui;'~~.~:1c'1':t'~~L'~1t~!!;.~i : ):~.>L, ;

~ 2,0

...,"
c

Para obter histogramas. diagramas de caule e folhas e diagramas de caixa e bigodes uti
Iizando 0 SPSSPW. voce pode utilizar a caixa de dililogo Explore (Explorar), Proceda como
ja descrito anteriormente para obter as medidas de tendencia central. Se quer obter medidas
de tendencia central e descritivas graficas. deve selecionar a op<;ao BOlh (Ambos) no canto
inferior direito da caixa (op<;ao Display). Se, no entanto. voce quer somente as descritivas
graficas. deve selecionar a op<;ao Plots (Plotar). conforme abaixo:

! 1.5
(j'
~ 1.0
::l

go
u: 0.5

Desvio padrao = 2.16


Media = 8,70
N=6

0.0
6,0

8.0
10,0
12.0
WITH DOG (C~m 0 cao)

Diagrama de caule-e-folhas WITHDOG (Com

5eIedilne;l
o~oPfots

Frequency

Stem and Leaf

(Frequencias)

(caule e folhas)

--f----=f--- t
1~;1~0~:9=f-,---t

(Platar) e

dique no batao
Plots (Platar).

----:----,--------,.

--'--~I--'

l
:. . , .
..
I------l-----l . I
i I -if
~if2(jj~~:a..:~-:' g!~,:~~~'-~~:=;.::~,~~::ta :~::::'_' . ~ .:. 4'~ .~
,
i
I
"--------i,

I
I
! ;
-r--T-

~.~~NI"~~~.t:..Jn

81

....__........ M~1~1!i'ftHil'.~"hjoi'

4,00
2,00

0
1

.
.

6789
02

0 cao)

()iag!CIma de
caule e folhas

Stem width (Tamanho do caule)


Each leaf (Cada folha):

10.00

1 case(s) (1 caso (1))

13,

12

11
10

9
8

Voce deve. entao, c1icar no botiio Plots (Plotar) para especificar que diagrama voce quer.
Surgira a seguinte janela secundliria:

.
--.

~~~

sJ

~~:
:;.lW;F~j~,a~l~>~ffil.W@l"'

_._---_._------~---_.

~~1;~*~~f7j~~~~:;i:rr?~~~T~~;~~~~
~;-;

".' 1"1"

""'<~:.;:I ~-~,..ftr't.t!'lr.[Ji

WITHDOG (Com

....,:.~i:J

~~'

':

,S~~oea

~i~.r-:o~~~~~m
:.;.f.~-~'.:~-~.

~~
_,~~;:
::.::\9

I I ,B=~

~----

j
--i---=.-L__
:==l
;I

. l:j

i.e

~:~~-j'i~X~:~/;.:i:r~tr~~;:~~~~~:~:~~~;'~Z~;;,;~;b~;~-.ti~.~:~

~'.""""'fi,Oi"".~-'41'0.. .......':::11 ...._-........

1.~"llliQ,1II',i...'

N=

~PW fornecendo
~ bigodes.

0 cao)

histograma. e os diagramas de caule e folhas e caixa e

A sele<;ao por omissao (default) e para os diagramas de caixa e bigodes e caule e fo


Ihas. Para obter tambern urn histograma, selecione a op<;ao e entao clique no botao Continue
(Continue). Voce retornara para a janela principal e devera c1icar no botao OK para obter os
graficos desejados. 0 resultado sera 0 seguinte:
Voce obtera urn histograma, seguido de urn diagrama de caule e folhas e final mente de
urn diagrama caixa e bigodes. Apresentamos a saida apenas para a condi<;ao com 0 cao. 0
SPSS fornecera ainda a safda para a condi<riio sem 0 cao. Voce deve notar que 0 SPSS pode
ser configurado para fornecer intervalos diferentes dos demonstrados. Assim. voce precisa
checar qual e 0 tipo de intervalo que 0 SPSS apresenta.

82

2.5

Christine P. Dancey & John Reidy

Estatistica sern Maternatica para Psicologia

Pad;a~ d~pOntosdescendentes

Diagramas de dispersao

. ..

Uma tecnica util para examinar 0 relacionamento entre duas variliveis e fazer urn diagra
ma de dispersao (scattergrams). Urn exemplo de tal tipo de gnifico pode ser visto na Figura
2.13 para as variaveis ansiedade estatfstica e procrastina~iio apresentadas no Capftulo I. Estes
dados sao mostrados novamente abaixo:
Escores para a ansiedade estatfstica:
Escores para a procrastina~ao:

50
96

59 48
132

94

60

62

55

110

140

125

o diagrama de dispersao coloca uma varilivel no eixo dos "x" e a outra variavel no eixo
dos "y". A Figura 2.13 fomece os valores para a procrastina~ao representados no eixo x e a
ansiedade estatfstica no eixo y. Ela da uma boa ilustra~iio de como as duas variaveis estao
relacionadas. A partir do resultado, vemos que, geralmente. a ansiedade estatfstica aumenta
com a procrastina~ao. Assim, parece haver urn relacionamento entre as duas variaveis. Os
escores parecem estar bern pr6ximos de uma Iinha imaginliria que vai do canto inferior direito
ao canto superior esquerdo. Chamamos este tipo de resultado de rela~ao positiva.
Suponha que no seu estudo da ansiedade estatfstica voce achou que, 11 medida que a ansie
dade estatfstica aumentava, a procrastina~ao, diminufa. Como voce imagina que 0 diagrama
de dispersao seni? Voce constatara sua semelhan~a com 0 apresentado na Figura 2.14.
Veja no diagrama de dispersao da Figura 2.14 que, quando a procrastina~ao aumenta, a
ansiedade estatfstica decresce. Os escores parecem estar agrupados em tomo de uma Iinha
imaginaria que vai do canto superior esquerdo ao canto inferior direito. Podemos dizer que
lemos, aqui, uma rela~ao negativa. Como se pareceria 0 diagrama de dispersao se nao exis
lisse urn tipo perceptfvel de rela~ao entre as duas variaveis? 0 gnifico apresentado na Figura
2.15 da uma indica~ao de como ele poderia ser.

quando nos movemos


. para a dii"eita no eixo x

"1

e 60
~

"7

o
o

~ 58

.. 56

i:

.'"

o,~

54

.~

52

:~

50

n;

V; 48

46
60

100
120
Procrastination (Procrastina~ao)

80

Diagrama de dispersao indicando que um decrescimo na ansiedade estatistica corresponde


a um acrescimo na procrastina<;ao.

o padrao se assemelha

a"m

i e5tiltlstica de 55 i!
, prod'ilstina~o de 125
/

64
_ 62

... 58

."

56

c:

46 I
90

D
D
D
D
D

.~

50

soj

<l:

54

V; 48

60

'0;

'x
:ij 52

:E.

."

.~

70

.,.

conjunto,'
aleat6rio de pon~os

.~

:!l

160

140

Ekbre. de ansiedade

~ 60

,83

'';:;

III

100

110
120
130
Procrastination (Procrastina~ao)

140

150

Diagrama de dispersao para os dados da ansiedade estatistica e procrastina<;ao


apresentados no Capitulo 1.

40

90

100

130
120
110
Procrastination (Procrastina~ao)

140

150

Diagrama de dispersao indicando ausencia de relacionamento entre ansiedade estatistica


e procrastina<;ao.

84

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Note que 0 arranjo de pontos do diagrama de dispersao i1ustrado na Figura 2.15 parece
ser aleat6rio. Dessa forma, tais diagramas sao uteis para se examinar 0 relacionamento entre
duas variaveis, como sera discutido com mais detalhes no Capitulo 5.

85

~~~~'.'
5eIecione a opdo
Simple (Simples)

e entia dique em

(~] Ativida:~e2.7.

Define (Define) I

:."
e

Dado 0 seguinte diagrama de dispersao, qual a conclusao rnais


cionamen~o entre 0 pre<;o do petr61eo e a satisfa~o do motcirista7

apropriada sobre 0 rela~


.

':'""_;

o
o

o
o

60

_1_ - - --~_.

-j~,:J

~::_di_"._:~"~~C.~~~.;>k~&::~-:JhtJ~M~~

50

- - _.

--:-~]CFtnTr-i

0-1

--I

,0",

\i\1\IU;;

70
80
.90 /
Price of petrol <Pr~ do petr6!eO)

I
_.AO<t

.iiOOoiit_..~I!l~''''..J:.:.Jl.-_-

1.~""""II""'IiIl'~'-"",

Selecione a 0plfao Simple (que e a opc;ao por omissao) e clique no botao Define. Voce
obtera uma caixa de dia.logos na qual pode selecionar vanas oPC;Oes para 0 gnifico desejado
(veja abaixo).

..

[Q] SPSSPW: gera~o de diagramas.de dispersao,

,~;

,~~~,.

~
'S
,7
-.C'S
~-------

Para obter diagramas de dispersao utilizando 0 SPSSPW, clique no menu Graphs (Gnifi
cos) e entao selecione a 0plfao Scatter. .. (Dispersao). Voce obteni a seguinte janeIa:

-" to
"'.1-1

--12
'-'19
d

,14

" 15
", .16

"'?Tel
:1(1

,~

~~'

I
1
~:
I
I
~;t&";;';:;;,~ki4:;-'.~i'~;~:~~;;;:;lt~;;l;;~~J

~ Ii&''''''I1bI!l.'''';;;CJl.'''''''-",,- ;!II'*f'1i!ilj.:;'1I,fHii'llll'Q".~;

Mova uma variavel para a linha do eixo x e a outra para a linha do eixo y utilizando os
botoes (setas), e clique em OK para obter 0 diagrama de dispersao. 0 grafico sera similar ao
apresentado anteriormente (Figura 2.13).

86

2.6

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

_m

Erro de amostragem e relacionamento entre variaveis


Voce deve lembrar que. anleriormente. explicamos 0 problema associ ado com 0 erro
de amostragem. Comenlamos que. em virtude do erro, a media da amoslra pode nao ser
urn born indicador da media populacional. Voce deve nolar que 0 erro de amostragem nao
esta limitado a circunstancias em que queremos eSlimar a media de uma popula<;ao. Ele
tambem e uma questao importante quando queremos delerrninar 0 relacionamento enlre
duas variaveis. Suponha que realizamos urn esludo relacionando ansiedade eslalistica
e procrastina<;ao e que nao exisla. de falo, relar;ao entre as duas variaveis. A titulo de
ilustrar;ao. vamos supor que temos apenas 50 escores de pessoas na popular;ao. Se voce
retira duas amostras diferenles desla popular;ao, uma conlendo somenle 3 pessoas e a
outra contendo 20 pessoas. poderernos obler diagramas de dispersao que se assemelham
as Figura 2.17 (a) e (b). Nesses diagramas pode-se perceber que aparentemente nao existe
relacionarnento entre as variaveis. Quando a procraslinar;ao aumenla. nao existe urn pa
drao consislenle de variar;ao da ansiedade eSlalistica. Nesse caso. as nossas amoslras sao
boas representantes da popular;ao subjacente.
Se agora selecionarmos mais duas arnoslras (uma contendo 3 e a oulra conlendo 20
pessoas). podemos obter os diagramas mostrados nas Figura 2.18 (a) e (b). Nesse caso. no
diagrama com 3 pessoas podemos concluir que e possivel urn relacionamenlo negativo en
tre as duas variaveis. Quando a ansiedade estalislica diminui, a procraslinar;ao aumenla. Na
amostra com 20 pessoas. enlrelanlo. a sugestao e. novamenle, de que nao exisle relacio
namento aparente enlre as variaveis. Voce pode ver que uma amostra pequena nao retlele
acuradarnente 0 padrao da popular;ao, enquanlo a maior 0 faz.

:j

60

~ 50

1::>

c:

~
.;;;40
c:
$

30
20

c:

.~ 10

.~ 10

Vl

20

40

60

80

....

a
a

1::>

'"

a
a

~ 40
c:

00

50

'"

20

.;:;
~
Vl

60

80

100

E
. 60

:!!

50

'"

40

1::>

1::>

.~

c:

.2 so

1::>

1::>

.~

c:

0
0

[]

40

0
0

..

z;o 30
'x

z;o 30
'x

20

15 20
::l
t;
. 10

Vl

40

60

80

100

.,

10

0
[]

0
20

40

60

80

Procrastination (Procrastinac;ao)

Procrastination (Procraslina~ao)

(a)

(b)

100

Q; 30

'x
c:

.~

40

Diagrama de dispersao ilustrando urn relacionamenlo negativo entre ansiedade estatfstica


e procrastina<;ao sugerida pela amostra de 3 pessoas, mas nao pela de 20 pessoas.

>

c
i

]" 70

20

Procrastination (Procrastina~ao)

60

Vl

a a
a

.,
0

0
I

20

70

100

.,

a
a

Diagrama de dispersao indicando ausencia de relacionamento entre ansiedade eslalistica


e procraslina<;ao sugerida pelas amostras de 3 e 20 pessoas.

Procrastination (Procraslina~ao)

0
0

00
.~,-

.~

e
:;

20

"'

.~

_ 60

30

'"

Vl

1::>

~
;;;40
c:
$

60

~ 50

15

70

_m

87,

a a
10

00

lb a
a

oI
20

a
i

40

60

80

Procrastination (Procrastina~ao)
Diagramas de dispersao da popula<;ao de escores de ansiedade estatfstica e
procrastina<;ao.

100

Finalmenle. se voce selecionar mais duas amoslras. podera obler 0 padrao ilustrado na
Figura 2.19. Aqui voce devera ser capaz de perceber que a amostra de 3 pessoas nao sugere
inferir urn relacionamento enlre as duas variaveis, mas de 20 pessoas sim. Se observar a
Figura 2.19, percebera que parece exislir urn padrao na amos Ira de 20 pessoas sugerindo
que, quando a procraslinar;ao aumenla, a ansiedade estalislica tambem cresce. Nesse caso.
a amostra maior nao representa acuradamenle 0 relacionamenlo existente na popular;ao. ao
passo que a menor sim.
Voce deve notar que e muito menos prov<lvel de se obter uma situar;ao como a iluslra
da na Figura 2.19 do que nas Figuras 2.17 e 2.18. Como indicado anleriorrnenle. amoslras
grandes apresenlam uma probabilidade maior de representar corretamente a popular;ao em
estudo. Embora 0 cenario da Figura 2.19 seja improv<lvel, pode ocorrer. Enlao, voce deve ser
cuidadoso ao generalizar os resultados de arnostras para popula~oes.

88

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

89

M~.

nlecliana
emoda

Diagrama de dispersao ilustrando que existe um relacionamento entre ansiedade estatistica


e procrastina~ao sugerida pelas amostras de 20 pessoas, mas nao pelas de 3 pessoas.
Pelos exemplos, conclui-se que qualquer generalizaitao que se possa fazer a partir de
dados de amostras esta sujeita ao erro amostral. Raramente estaremos certos de que os resul
tados de uma amostra refletem 0 que ocorre na populaitao. De fato, como os diagramas de
dispersao ilustraram, os dados amostrais podem nos enganar. Podem mostrar urn padrao de
valores completamente diferente do padrao da populaitao. Entretanto, quanto maior a amos
tra, maior a probabilidade de que ela reflita acuradamente os resultados populacionais.
__

2,7

Distribui~ao

normal

Agora apresentamos quatro tecnicas uteis para ilustrar graficamente os dados. Por que e
tao importante fazer isso? Certamente nao e para que as grandes companhias de software pos
sam vender cada vez mais pacotes sofisticados, mas sim porque e importante e uti! conhecer a
forma com que os dados se distribuem. Muitos dos testes estatlsticos que serno apresentados
neste livro fazem suposiitoes sobre como os dados estiio distribufdos. Quer dizer, os testes sao
validos somente se os seus dados se distribuem de certa forma. Uma das mais importantes
distribuiitoes de que voce tomara conhecimento e a nonnal.
As curvas i!ustradas na Figura 2.20 sao todas de distribuiitoes normais. Na vida diana,
muitas variaveis, tais como peso, altura, tamanho do sapato, nfveis de ansiedade e resultados
de testes, tendem a ser normalmente distribufdas, isto e, se parecem com as curvas da Figura
2.20. Em nossa pesquisa, podemos utilizar essa informaitao para formular hipoteses sobre a
forma de distribuiitao das populaitoes. Epor esse motivo que muitas das mais poderosas tec
nicas estatfsticas utilizadas por nos consideram que as populaitoes das quais retiramos nossas
amostras sao distribufdas normal mente.
Para que uma populaitao possa ser classificada como normal, deve apresentar as seguin
tes caracteristicas:

A populaitao deve ser simetrica em tomo da media.


As caudas encontram 0 eixo x no infinito.
A populaitao deve ter a forma de sino.

Distribui~6es normais.

Todas as distribuiitOes na Figura 2.20 sao normais; embora nao sejam exatamente as
mesmas, apresentam as caracteristicas descritas. Voce pode ver que diferem em termos de
dispersao e na altura no centro. Observe que, se tivennos uma distribui~o normal, a media, a
mediana e a moda coincidem. Outra caracteristica importante e ser uma funitao da sua media
e do seu desvio padrao (explicaremos 0 desvio padriio mais adiante neste capftulo). 0 que se
quer dizer e que, uma vez conhecidos a media e 0 desvio padriio, podemos desenhar a curva
por meio de sua formula. Nao apresentaremos esta formula aqui; apenas lembre que qual
quer distribuiitao normal pode ser desenhada, uma vez que se saiba sua media e seu desvio
padrao.
Como ja apontarnos, muitas variaveis que ocom:m naturalmente se revelam normais quan
do plotadas. Percebe-se, tarnbem, que, quanto mais valores destas variliveis sao plotados, mais
elas se assemelham a uma normal. Urn exemplo simples pode servir como i!ustraitao. Se voce
selecionar 10 homens e medir suas alturas em polegadas, os histogramas de freqiiencias terno a
aparencia da Figura 2.21 (a). Estli claro que, nesse caso, ela nao lembra muito as distribuiitoes
normais ilustradas na Figura 2.20. Se voce selecionar mais 10 homens e colocar em urn gnifico
todas as 20 alturas em polegadas, a distribui~o resultante podera ser semelhante a da Figura
2.21 (b), que, novamente, nao tern muita semelhanltl com uma curva normal. Voce podera ver,
entretanto, que, a medida que selecionamos mais homens e registramos suas alturas, 0 histo
grama toma-se cada vez mais aproximado de uma di~bui~o normal (Figura 2.21 (c) ate (e)).
Quando selecionamos 100 homens, pode-se perceber que teremos uma distribuiitao normal
quase perfeita. Obviamente, "fabricamos" esses dados para servir de exemplo, mas, em geral,
e 0 que acontece com muitas variliveis com as quais voce lidara.

90

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

(all0 homens

(b) 20 homens

1,8

1,6

3,5

Uma maneira simples de se ler uma indica"ao da dispersao dos valores de uma amostra
ou popula"ao e comparar 0 valor maximo com 0 minimo. Esse resultado e conhecido como
amplitude. A amplitude e simplesmente a diferen"a entre os valores maximo e minimo. Por
exemplo, a amplitude dos escores de depressao na Figura 2.3 e 64, isto e, 64 menos O. Nesse
exemplo, 0 escore mais baixo e 0 e 0 mais alto, 64, de modo que a amplitude e 64.
Embora a amplitude nos informe sobre a varia"ao total do conjunto, nao fornece qual
quer indica"ao do que ocorre no interior do conjunto. Por exemplo, de uma olhada nas duas
distribui"oes na Figura 2.22. Estes histogramas sao gerados a partir de dois conjuntos de
dados que tern a mesma media (16) e os mesmos esCMeS minimos e maximos (5 e 27). Am
bos apresentam, portanto, a mesma amplitude, que e 22 (27 menDs 5), Elas sao, entretanto,
distribui"oes total mente diferentes; os valores da distribui"ao B estao distribuidos em grande
parte pr6ximos da media. enquanto na distribui"ao A estao bern mais espalhados, De forma
ideal, precisamos ter uma ideia da varia"ao total de uma distribui"ao e de quanto os valores
variam em torno da media. Assim, embora a amplitude forne"a uma ideia da varia"ao total
dos valores, ela, de fato, nao nos da uma ideia da forma global da distribui"ao dos valores de
uma amostra.

4.----

'" 1,4

"2 1,2
:~

Amplitude

2.8.1

Nada
parecido com
uma nonnal"

'" 2,5
'2 2

.QI

~ 0,8

'~ 1,5

... 0,6

.::

0,4

0,2

0,5

o
60-61

64-65 68-69

72-73

76-77

(c) 30 homens
5.1 ----
4,5
4
'" 3,5
"2 3
~ 2,5
g 2
.:: 1,5

0,5

ill]

00-61

64-65

60-61

...,"'v'"
!

c:

64-65 68-69 72-73

91

76-77

(d) 50 homens

10.-----

5
4
3

Histogram (Hislograma)

Histogram (Histograma)
30

Desvio padrao = 4,81

Media = 16,0
N = 58

Desvio padrao = 3,54


Media = 16,0
N = 58

1
68-69

IL-U

10

o 60-61

.!!!

64-65 68-69 72-73

76-77

Com 30 homens;

...0g," 20

20

(e) 100 homens


25

..""~

c:

c:

QI

QI

a distribui~ cornl!9l

20

a parecer normal

.;'&rJi\oo'~lhens. temos

'"
'215

...,"

g
"

.::

"

...~ 10

10

'fifieirnk!nte~miidjstribuio

":qlle~piit(cunehie normal

!10

oIii

6,0

9,0

12,0 15,0 18,0 21,0 24,0 27,0

6,0

9,0

VAR00002

12,0 15,0 18,0 21,0 24,0 27.0


VAROOOOI

60-61 64-65 68-69 72-73 76-77

~mas mostrando a progressao para uma distribui~ao normal


~ pesso~s sao adicionadas a amostra.

Conjuntos com mesma media e mesmo valor maximo e minimo, mas que apresentam
diferentes distribui~6es em torno da media.

a medida que mais


2.8.2

2.8

Varia~ao

ou dispersao de distribui~oes

Introduzimos as medidas de tendencia central, que fornecem uma indica"ao do valor


tipico de uma amostra. Outro aspecto importante de uma amostra ou popula"ao de valores
e quao dispersas elas sao. Ou explicitando de outra forma, quanta varia"ao existe em uma
amostra ou popula"ao.

Desvio padrao
Uma medida mais informativa da varia"ao dos dados e 0 desvio padriio. Urn dos pro
blemas da amplitude e que ela nao nos inforrna 0 que esta ocorrendo com os valores entre 0
minimo e 0 maximo. 0 desvio padrao, no entanto, fomece uma indica"ao do que ocorre entre
os dois extremos. A razao do desvio padrao poder fazer isto e ele infonnar 0 quanta os valores
do conjunto variam em tomo da media. 0 desvio padrao urn conceito muito importante e,
por isso, vale 0 esfor"o ernpreendido para compreende-lo. Sua importancia decorre da utili
za"ao como base para muilas das tecnicas de analise de dados.

92

Christine P. Dancey & John Reidy

Estatistica sern Matematica para Psicologia

menos 3,27) e 9.27 (6 mais 3,27). 0 desvio padriio e ulil quando voce quer comparar amostras
que apresenlam a mesma media. Suponha que lenhamos uma segunda amostra que apresenla
urn desvio padrao de 6,14. Se a comPararmos com a do exemplo antetior, que apresenta urn
desvio padrao de 3.27. pode-se perceber que, no exemplo. os dados eslao bern mais pr6ximos
da media do que nesta segunda amostra.

desvio padrao e a medida de quanto os valores da nossa amostra variam em torno da


media. Cada valor de uma amostra tera urn desvio em rela!j:ao 11 media. Se subtrairmos a media
de cada valor, teremos uma indica(,:ao de quao longe cada urn esta dela. Assim como ocorre
com qualquer conjunto. podemos entao calcular a media dos desvios em relac;ao 11 media
denominada de media dos desvios. Para fazer isso, devemos somar todos os desvios e dividir
o resultado pelo mlmero de dados do conjunto. Esse procedimento, entretanto, apresenta urn
problema relacionado com a propriedade de a media ser 0 ponto de equilibrio ou centro de
gravidade do conjunto. Por isso. a soma de todos os desvios em torno dela sera sempre 0, nao
importa 0 tipo de conjunto com 0 qual estejamos trabalhando. Isso esta ilustrado abaixo:

M'~:~

Media

-5

4~911

-2

-I

"""\ I

/o!~ )
/

Desvios a partir.
damedia
--

~ --i~.~~i~i~.

5
-2 -I 0 3
4

9 25

;~:~,~~,o

,,' ..?;.".,
".,''''''''<'

. Se 5Omarmos
. estes valores,
iremos obter zero

Esse resultado, entao, nao sera de utilidade para informar como 0 grupo todo esta se com
portando em relac;ao a media. Uma maneira de resolver 0 problema e elevar cada urn desses
desvios ao quadrado, de modo a eliminar os valores negativos. Feito isso, podemos entao
calcular a media dos desvios ao quadrado para obter uma indica!j:ao da expansao do conjunto
como urn todo. Esse resultado e conhecido como variiincia. Ha urn problema com a varilincia:
baseia-se nos quadrados dos desvios e, assim, nao esta expressa na mesma unidade dos dados
otiginais. Por exemplo. se os nossos valores fossem segundos, a varilincia setia expressa em
segundos ao quadrado. Para obter uma medida compatfvel com os valores otiginais, utilizare
mos a raiz quadrada da varilincia, que e denominada desvio padriio.
Urn exemplo simples ilustra todo 0 procedimento. Suponha que temos 0 seguinte conjun
to de valores coletados de urn estudo sobre 0 mlmero de barras de chocolate consumidas por
semana: 1,4,5,6,9, II. Para calcular 0 desvio padrao, procederemos da seguinte forma:
Ptimeiro calculamos a media, que e6.
Os desvios a partir da media de cada urn dos valores sao: -5, -2, -I, 0, 3, 5 (se voce
somar estes valores, podeni vetificar que 0 resultado eO);
Para eliminar os valores negativos, vamos elevar cada urn destes desvios ao quadrado,
obtendo os seguintes resultados: 25.4, 1,0,9,25.
A seguir, e calculada a media destes resultados, que e 10,67, isto e, 64 + 6, fornecen
do a variancia.
Finalmente, 0 desvio padrao e obtido por meio da raiz quadrada da varilincia, dando
como resultado 0 valor 3,27.

-5

25

;;~~~;:; ;

93

valor de 3,27 do desvio padrao e urn indicativo de quaD pr6ximo os valores estao da
media do conjunto de dados. Em geral, voce vai verificar que aproximadamente 70% dos
dados estao situados em urn intervalo de desvio padrao a contar da media. No exemplo acima,
o desvio padrao e 3,27, indicando que a maioria dos valores desta amostra esti 3,27 unidades
acima ou abaixo da media. Isto e, aproximadamente 70% dos valores estarao entre 2,73 (6

[~I Atividade 2.8

.,'<~,,;,~~:,;,:;;~.i!'~" ;i::~

Se voe~ tem a varianeia de urn eonjUritod~~r6fik}~"~'~~li~~;di!sv. io


Qual(is) das seguintes e(sao) uma defini~raiP4ve1~tf~d~~b'7: : '.

para07
..~. ,

,:,,~~~'~'i=::::~::~:''':;~~tw~""

I'
.

(e) Od~o padr~o e um~' medida ~a vari~ d~ ~i1~:~}~amed~.


(d) 0 desvlo padrao ea, ralz quadr~i!J~a'~~'~{i~'"i!;i4'T:'#l\"#:::~:_>\: :'! .
.
.. ,'. .. -- . ':_"');~>;"-' '-:'':'''>':C. ..... ~ . -~

[~I SPSSPW: obte".~o de m~.i~ffV-~~*~il


Para obter medidas de varia!j:ao utilizando 0 SPSSPW, voce deve seguir as instru!j:oes
apresentadas antetiormente ao se gerar medidas de tendencia central. Se voce dicar na caixa
de dialogos Explore (Explorar), como desctito previamente, obtera uma safda semelhante a
apresentada a seguir:

94

Christine P. Dancey & John Reidy

Estatistica sern Maternatica para Psicologia

EXPLORE

2.9

Case Processing Summary (Sumario do Processamento dos Casos)

N
WITH DOG (Com
NODOG (Sem

0
0

cao)
cao)

6
6

Missing (Valores Omissos)

Percent
(Percentual)

50.0%

50.0%

Total (Total)
N

Percent
(Percentual)

12

100.0%

12

100.0%

Percent
(Percentual)
50.0%
50.0%

Descriptives (Medidas Deseritivas)

WITH DOG Mean (Media)


(Com 0 Cao) 95% Confidence
Interval for Mean

Statistic
(Estatistica)

Std. Error
(Erro Padrao)

8.6667

.8819

Lower Bound
(limite Inlerior)

6.3996

Upper Bound
(limite Superior)

10.9337

5% Trimmed Mean (Media Interna de 5%)

8.6296

Median (Mediana)

8.5000

(Intervalo de Confian~a
de 95% para a Media)

Variance (Varianeia)

4.667

Std. Deviation (Desvio Padrao)

2.1602

Minimum (Minimo)

6.00

Maximum (Maximo)

12.00

Range (Amplitude)

6.00

Interquartile Range (lntervalo rnterquartil)


Skewness (Assimetria)
Kurtosis (Curtose)
NODOG Mean (Media)
(Sem 0 cao) 95% Confidence
Interval for Mean

.845
1.741

4.0000

.7303

5.8773

5% Trimmed Mean (Media Interna de 5%)

4.0556

Median (Mediana)

4.5000

Std. Deviation (Desvio Padrao)

1.00
6.00

Skewness (Assimetria)
Kurtosis (Curtose)

Leptocurtiea

,~M~roa
Distribuic;6es com variac;ao em termos de achatamento e afunilamento.

1.7889

Maximum (Maximo)
Range (Amplitude)

-.

t:=

3.200

Minimum (Minimo)

Interquartile Range (lntervalo Interquartil)

.463

Upper Bound
(limite Superior)

Variance (Variancia)

-.300

2.1227

(Intervalo de Confian~a
de 95% para a Media)

Platicurtica

3.7500

Lower Bound
(limite Inferior)

Outras caraeteristicas das distribui~oes


Agora apresentamos as formas de medir 0 espalhamento das distribui~6es. Outra manei
ra de as distribui~6es diferirem e quanto ao formato do modele ou gniflco: se sao mais ou
menos achatadas. 0 grau de achatamento ou afunilamento de uma distribui~ao e conhecido
como curtose. Se uma distribui~ao tern 0 formato de urn pico (funil invertido). entao ela edita
leptocurtica; se e achatada. platicurtica. As distribui~6es entre os dois extremos sao denomi
nadas de mesocurticas (ver Figura 2.23).
Voce nao precisa se preocupar muito com a curtose neste estagio de inicia~ao na es
tatfstica. Nos a introduzimos aqui por dois motivos--primeiro para que voce tenha uma
boa compreensao das distribui~6es e de como elas podem ser diferentes; segundo, porque
quando voce utiliza 0 SPSSPW para obter medidas descritivas, ve este tipo de medida
entre as demais. Quando isso acontecer, voce sabera ao que elas se referem, quais valores
positivos sugerem que a distribui~ao e leptocurtica e quais valores negativos indicam que e
platicurtica. Urn valor zero informa que voce tern uma distribui~ao mesocurtica.

Cases (Casos)
Valid (Validos)

95

5.00
2.7500
-.943

.845

.586

1.741

Voce pode observar que a safda apresenta os valores da variiincia, do desvio padrao e da
amplitude.

2.1 0

Distribui~oes

nao-normais

Embora muitas variaveis sejam aproximadamente normais, quando plotadas muitas


vezes nao tern esta forma. As vezes, os desvios de normalidade sao conseqiiencia de erros
amostrais. E importante verificar 0 formato da distribui~ao,ja que muitas das tecnicas estatfs
ticas utilizadas neste livro partem do pressuposto de que os dados analisados sao distribufdos
normal mente. Voce pode conferir a forma de uma distribui~ao por meio da constru~ao do

96

Christine P. Dancey & John Reidy

Estatlstica sem Matematica para Psicologia

histograma. Se verificar que os dados diferem acentuadamente de uma distribui"ao normal,


entao considere a utiliza"ao de uma tecnica estatistica que nao precise da suposi"ao da norma
lidade dos dados. Essas tecnicas sao denominadas de distribuiriio livre ou niio-parametrica
e serao abordadas no Capitulo 15. Os dois itens seguintes ilustram as maneiras mais comuns
pelas quais a distribui"ao pode desviar-se de uma normal.

esquerda ou uma distribui"ao com acentuada assimetria negativa. Valores de assimetria em


tome de I (ou -I) indicam desvios da norrnaJidade tao extremos que muitas das tecnicas esta
tisticas apresentadas neste texto nao poderao ser utilizadas.

2.10.2
2.1 0.1

Distribui~oes

, negatMIlriel!te

assim~ca

assimetrica

Desvio padrao = 4,74


Media = 6,6
N = 20

.~

.,".

u..

u..

.
c

Desvio padrao = 4,74


Media = 13,5
N = 20

8
"ut
.!!!

...."Z'
u

,"

'

10

Histogram (Histograma)

Histogram (Histograma)

'"
.~

normal. Se voce se defrontar com tal tipo de conjunto, e conveniente que os dados sejam
examinados de perto, pois pode existir algum fator qu~Ja"a os dados se agruparem em tome
das duas posi,,5es modais. Se nada de diferente estiver ocorrendo, os dados devem ser trata
dos como provenientes de duas popula,,5es distintas. Relate que esta frente a uma distribui"ao
bimodal e registre as duas modas.
Urn born exemplo de dados bimodais e apresentado por Morris e colaboradores (1981). Neste
estudo, eles procuraram rela,,5es entre lembran"as de resultados de partidas de futebol e conhe
cimento de futebol, medidas por meio de uma prova sobre 0 assunto. Quando os pesquisadores
examinaram os resultados desta prow, verificaram que era bimodal. Explicou-se 0 fato pela exis
tencia de duas popula,,5es distintas de pessoas no estudo: uma formada por entusiastas do futebol
e outra nao. Os fiis de futebol se agrupararn prOximos do escore maximo da prova, enquanto os que
nao eram fiis se agruparam pr6ximos do escore mlnimo, formando uma distribui,.ao bimodal.
Agora mostrarnos a voce como e a aparencia de uma distribui"ao normal e algumas formas
de se desviar da normalidade. Em virtude da importancia da distribui"iio normal na estatistica, urn

Distril?ui~

positiVamente

~3

~
~
c

~3

"

~
u..

bimodais

Econhecida como uma distribuiriio bimodal. Esse tipo de distribui"ao e, c1ararnente. nao

. Qist!ib\,i~o .

Distribui~oes

Ocasionalmente, voce pode obler uma distribui"ao como a representada na Figura 2.25.

assimetricas

Uma das principais causas de desvio da normalidade e a resultante da assimetria. As


distribui"oes apresentadas na Figura 2.24 sao assimetricas. Voce pode ver que, quando com
paradas com a normal, nao sao simetricas. A distribui"ao que apresenta uma cauda maior para
a direita e ditapositivamente assimetrica (Figura 2.24 (a)). A distribui"ao que tern uma cauda
maior aesquerda e denominada de negativamente assimetrica (Figura 2.24 (b.
Se uma distribui"ao apresentar acentuada assimetria, voce deve ter muita cautela ao uti
lizar a media como medida de tendencia central, pois os valores das caudas irao distorcer 0
valor da media. Em tais casos, e recomendavel utilizar a mediana ou a moda, que serao mais
representativas do valor tipico da sua amostra.
Como ocorreu com a curtose. a saida dada pelo SPSS para as estatfsticas descritivas
tambem fomece uma medida de assimetria. Aqui, urn valor positivo sugere uma distribui"ao
positivamente assimetrica, enquanto urn valor negativo sugere uma distribui"ao negativamen
te assimetrica. Urn valor 0 informa que a distribui"ao e simetrica. Se voce observar a saida
mostrada na pagina 94, voce vera urn valor de assimetria de 0,46 para a condi"ao "com 0
cao", indicando uma pequena assimetria positiva ou para a direita. Tambem temos urn valor
de -0,94 para a condi"ao "sem 0 cao", indicando uma cauda relativamente grande para a

Desvio padrao
Media = 20,0
N = 40

o
0,0

caudas
Distribui~oes

97

assimetricamente positivas e negativas.

5,0

10,0 15,0 20,0 25,0 30,0 35.0 40,0


VAR00004

__

Distribui~ao bimodal.

= 13,65

98

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

dos principais objetivos da representa~ao gnifica dos dados e verificar se eles sao nonnalmente
distribuidos. Talvez as melhores tecnicas graficas para verificar se os dados sao ou nao nonnal
mente distribufdos sejam os histogramas e os diagramas de caule e folhas. Se voce der uma nova
olhada na Figura 2.21 (e). vera 0 exemplo de urn histograma que mostra uma distribui~ao nonnal.
Por outro lado. a Figura 2.23 e 0 exemplo de uma distribui~ao que apresenta uma assimetria posi
tiva leve. Compare-a com a Figura 2.24 (a) e vera que elas sao semelhantes na fonna.
Uma das limita~Oes do diagrama de caixa e bigodes e a dificuldade de, algumas vezes. a
partir dele. verificar se uma distribui~ao se desvia da nonnalidade. Como indica~ao. as Figu
ras 2.26 (a) e (c) fornecem exemplos de distribui~Oes com dados nonnais e nao-nonnais.

A Figura 2.26 (a) foi gerada a partir de dados nonnalmente distribuidos (I. 2. 2. 3, 3. 3, 4,
4,4, 4. 5, 5. 5. 6, 6. 7). Mostra que a mediana esta no centro da caixa e apresenta dois bigodes
de mesmo tamanho. Nao existem valores atipicos.
A Figura 2.26 (b) foi gerada a partir de dados negativamente assimetricos (I. 2, 3. 3, 3,
4.4, 4, 5. 5. 5, 5.5, 5. 5. 5). Mostra que a mediana esta deslocada para cima e pr6xima ao
limite superior da caixa. Nao existe bigode saindo do topo da caixa. Este e urn exemplo ex
tremo. mas sempre que a mediana estiver mais proxima de urn dos lados da caixa. 0 bigode
daquele lado sera mais curto ou nao existira. Entao voce deve suspeitar de' que possui dados
assimetricos.
Finalmente, a Figura 2.26 (c) foi gerada a partir de dados com distribui~ao bimodal (I,
2, 2. 3, 3, 3, 3, 3.4.4. 5. 5. 5. 5. 5. 6. 6, 7). Surprecndentemente. 0 diagrama parece exata
mente como 0 da Figura 2.26 (a) e e urn born exemplo para i1ustrar que se deve ter muita
cautela quando se tentar verificar a nonnalidade dos dados a partir de urn diagrama de caixa
e bigodes. Isso mostra por que 0 histograma e. de certo modo. 0 diagrama de caule e folhas
fornecem urn melhor indicativo de que os dados estao nonnalmente distribuidos. Felizmente.
dados que apresentam distribui~6es bimodais nao sao muito comuns em pesquisa. e, assim,
o diagrama de caixa e bigodes pode fornecer uma indica~ao razoavel de que os dados estao
nonnalmente distribuidos.

(a) Dados distribuidos normalmente


8

4
2

Bigodes:dO'mesmo;'_
~rnan~~,~~,.,i,I'F
" ~Q~.Iad(l~ ~~"~'~'" ~

[~ )At::::~!~~::~5~~.~~.~~ff:~~j!;:~:~~~~;:

Dados

(b) Dados com assimetria negativa

8
6

I!!I-----

4
2

.' \

_?*,~~~a;
.apresen~~~~~e

j, - , . :

"

..,'"

....

(c) Dados com distribui~ao bimodal

+
Dados

Diagramas de caixa e bigodes ilustrando (a) distribui~ao normal, (b) com assimetria
negativa e (c) dados com distribui~ao bimodal.

"

..~\:

'. <'~"',r.<j:;2 "~'.~'::~

~'.,.~

.. j , -

','

. , .' ~" ..

,"

,"" .\

'J

'"I

.',t:: :::~ ~:::H~;~~fJE~~:~~:1~~~~~?:7~t-:t~~it~~~~:t48~}~;~

~~:,-. ~.~-:::, -.~r.. ::

I:":

,':.:;.
;

"

. ..' ~', ': ~ f

.;' ,: :;' '~~r;' ~~':J:;

Dados

99

\.

~i#;~>

Christine P. Dancey & John Reidy

100

Estatlstica sem Matematica para Psicologia

_~.~~I~z;

. ,:,;'Z:*~~,~~~~}t'~~1~t~S;;~~~~i;~~~~,:~;~:~4~;~[~;~~~~;~~it~TIi~~';';r;:r
.

:,

',-~-"'"

. -_.:-.

'.'" ';;'!::;";'i,t,j

..."r '.

;.,;~~;~;~;;"~r~~~:~;;~;~' ':"f,,,

r,'/"~~~
.~.-.,

"/
f.
. - 1 - ,.-

Ebastante uti! fazer usc do SPSSPW para mostrar uma distribuir;ao normal sobreposta a
urn histograma, de modo a auxiliar a percepr;ao da normalidade dos dados. Infelizmente, nao
eposslvel fazer isso com a caixa de dialogos Explore (Explorar). Para tal, deve-se gerar 0 his
tograma uti!izando 0 menu Graphs (Graticos), em vez do menu Analyze (Analisar). Quando
c1icar no menu Graphs, notara que existe uma opr;ao para todas as tecnicas descritivas que ja
~mostramos a voce:

.j(' ',:.)

r-.":,,;,,:

.~

101

;. -::?~ "~:

Exemplo da literatura:

experiencia de utiliza~o de computadores e atitudes em

<_.It
. (HlstogrImal ;

~
rela~o

t-+-~t

P-;-il

a eles

Mesmo que todos os pesquisadores que utilizam tecnicas estatisticas abordadas neste Iivro
usassem histogramas, na verdade este recurso pouco aparece em relat6rios publicados. Uma
agradavel exce'rao e 0 artigo recente publicado por Garland e Noyes (2004). Neste estudo, os
pesquisadores examinaram aspectos que melhor preveem atitudes em rela'rao ao uso de compu
tadores. Conclufram que os questionlirios atuais que medem a experiencia com computadores
sao inadequados em termos de previsao das atitudes em rela'rao aos mesmos. Parte do questiona
rio que aplicaram aos estudantes universitlirios solicitava informar;oes sobre 0 quanto utilizavam
computadores. Os autores apresentam as analises destas informa'roes utilizando histogramas.
Argumentam que, em virtude de utilizarem uma amostra relativamente grande, seria mais apro
priado usar histogramas para examinar a distribui'rao das respostas do que outras medidas mais
sensfveis de distribui'rao. Sugerem que os anos de uso de computadores declarados pelos partici
pantes e normalmente distribufdo, mas com alguma curtose evidente, refletindo urn pico entre 0
~e 0 lloanos. Indicam, ainda, que 0 mlmero de horas de usc dos computadores e positivamente
assimetrico e com curtose positiva.

Selecione a opr;ao Histogram... (Histograma). Aparecera a seguinte caixa de diaIogo:

102

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Para gerar urn histograma com uma curva normal, voce deve mover a variavel de
interesse para a caixa Variable (Yariavel). Selecione a opr;:ao que diz Display normal
curve (Mostrar curva normal). Quando tiver feito a seler;:ao correta, clique no botao OK
para gerar 0 histograma. 0 grafico resultante contera a curva normal, como indicado pela
Figura 2.27.
Voce pode ver, a partir do histograma, que 0 conjunto de dados que utilizou estli bastante
pr6ximo de uma curva normal.
30

103

o estudo foi realizado com 98 estudantes. Os mlmeros medios de interpretar;:6es


positivas e negativas foram 10,06 e 7,95, respectivamente. 0 nl1mero de interpretar;:6es
positivas e negativas dados por homens e mulheres foram comparados. A Tabela 2.1
mostra as medias e os desvios padr6es para estes dois grupos. Os homens tiveram mais
interpretar;:6es negativas do que as mulheres e aproximadamente 0 mesmo nl1mero de
interpretar;:6es positivas. Os dois generos fomeceram mais interpretar;:6es positivas do
que negativas. Os desvios padr6es mostram que os dois grupos apresentam niveis seme
Ihantes de variabilidade em termos de interpretar;:6es negativas e positivas. 0 exame dos
diagramas de caixa e bigodes revelou que as distribuir;:6es sao aproximadamente normais
e que nao existem escores extremos (atipicos).
Tabela 2.1

Numero medio de interpreta~6es positivas e negativas apresentadas por homens e


mulheres (0 desvio padrao esta entre parenteses)

-:,,~'ftfl~l

20

j;.

;~~~} ;~)' ',::u~ '; L1:~.

Inlerpret~s

positivas
Inlerprelaes negativas

~~; ':~':~:~~:""r~~::~':.~~~:~:~t~~~~~,:~~-~~~.:.~~~~~~~,~:.':~:~ ~::~.~~


10.20 (2,32)
7,27 (2.99)

9.91 (3.01)

8.62 (3,55)

10

Resumo
!

5.0

Desvio padrao = 3,54


Media = 16,0

N = 58

7.5

10.0 12.5 15.0 17.5 20.0 22.5 25.0 27.5

VAROOOOOl

Histograma do SPSSPW mostrando a distribuic;ao normal.

2.11

Obten~ao

de estatisticas descritivas

Embora seja uma boa pnitica examinar a distribuir;:ao dos dados, voce vera que muitos
pesquisadores nao tern 0 habito rotineiro de relatar os achados de tais praticas. Tipicamente,
se a distribuir;:ao se desvia da normalidade, e uma boa ideia relatar 0 fato. Se as distribuir;:6es
sao aproximadamente normais, fica a seu criterio fazer ou nao 0 relato. Registrando ou nao
a forma da distribuir;:ao dos dados, voce deve sempre examina-Ia, uma vez que ela desempe
nha urn papel importante sobre os tipos de tecnicas estatisticas que podem ser utilizados na
analise dos dados.
Se quer mencionar a forma pela qual os dados estlio distribuidos, entao 0 exemplo se
guinte e, talvez, 0 modo de apresentar as estatisticas descritivas. Em urn estudo conduzido
por Reidy e Keogh (1997), pessoas ansiosas e nao-ansiosas foram comparadas sobre como
interpretavam informar;:6es ambiguas. Fez-se, tambem, urn exame sobre a diferenr;:a entre os
generos em tais interpretar;:6es. Voce podeni apresentar as estatisticas descritivas conforme a
seguir:

Neste capitulo, mostramos formas de explorar e descrever os dados. Ressaltamos 0 fato


de que e importante tornar-se familiarizado com os dados utilizando varias tecnicas estatisti
cas descritivas e explicamos como usar e interpretar tais tecnicas. Assim, voce aprendeu:
Como calcular medias, medianas e modas, de forma a obter uma indicatrao do valor
tipico de uma amostra (estas sao medidas de tendencia central).
Que erros amostrais ocorrem quando tomamos amostras de popular;:6es e que, quanto
maior for a amostra que usarmos, menor sera 0 valor do erro amostral.
Que existem varias tecnicas gnificas com a finalidade de auxiliar 0 entendimento
sabre a distribuir;:ao dos dados:
histograrnas de freqiiencias

- diagrarnas de caule e folhas

- diagrarnas de caixa e bigodes (box plot)

- diagrarnas de dispersao (scattergrams)

Como uma distribui,.ao normal se parece e por que ela e importante em estatistica.
Que existem varias maneiras de os dados que coletamos poderem desviar-se de uma
distribuir;:ao normal, incluindo:
- distribuir;:6es negativamente assimetricas
- distribuir;:6es positivamente assimetricas
- distribuir;:6es bimodais
Que uma das mais importantes medidas de qualquer distribuir;:ao e 0 grau com que
os valores se dispersam e que uma das principais formas de medir isso e por meio do
desvio padrao.
Que 0 desvio padrao e 0 grau de variabilidade dos valores de uma distribuir;:ao em
lorno da media.

104

Christine P. Dancey & John Reidy

Estatistica sem MatemMica para Psicologia

(c) Ao quadrado da variincia


(d) A variincia dividida pelo nl1mero de valores

QUESTOES DE MULTIPLA ESCOLHA

Exercicios para 0 SPSSPW

6. Qual a rel~i1o entre tarnanho da amostra e erro


amostral?

I. Qual das seguintes altemativas representa a me


Ihor estimativa da media populacional?

Exercicio 1
Voce recebeu a incumbencia de verificar se a troca das lfunpadas fluorescentes normais
de urn escrit6rio por Ulmpadas vermelhas aumentara a aten,.ao dos digitadores e diminuira 0
numero de erros cometidos por eles. Quando fizer isso encontrara que 20 digitadores dimi
nufram os numeros de erros por dia nas seguintes quantidades:

22,22, 12, 10,42,19,20,19,20,21,21,20,30,28,26, 18, 18,20,21, 19


I. Qual e a VI neste estudo?

(a)
(b)
(c)
(d)

(a)
(b)
(c)
(d)

3. Use 0 SPSSPW para gerar urn diagrama de caixa e bigode para os valores acima:
(a) Os dados sao normalmente distribufdos?
(b) Existem valores atfpicos mostrados pelo diagrama de caixa e bigodes? Se sim,
quais sao eles?
(c) Utilizando 0 SPSSPW, qual e a media do conjunto de valores acima? Qual eo
desvio padrao?

Exercicio 2

A media da amostra
A media de varias medias amostrais
A moda de varias medias amostrais
A mediana de varias medias amostrais

2. Se voce obteve uma amostra de dados que eram


distribuldos de forma aproximadamente normal e
nlio apresentavam valores extremos, que medida
de tendencia central voce usaria?

2. Qual e a VD neste estudo?

Moda
Mediana
Media
Nenhuma das anteriores

3. Qual das seguintes medidas de tendencia central


slio senslveis a valores extremos?
(a) Moda
(b) Mediana
(c) Media
(d) Nenhuma das anleriores
4. Dado 0 seguinte diagrama, como voce descreveria
a distribuirylio?

Urn grupo de estudantes do ultimo ano decide descobrir se as aulas da disciplina do


Dr. Boering poderiam ser mais estimulantes. Concluem que a melhor maneira de isso
acontecer e tomar uma droga alucin6gena durante as aulas. Ao final do semestre, fez-se
urn exame: os estudantes que tomaram a droga durante as aulas obtiveram os seguintes
resultados (%):

Histograma

.~ 4

...c:

!3

10. Se voce seleciona ao acaso uma amostra de 20 pan


das (amostraA) e entio seleciona umaoutra de 300
pandas (amostra B) e caleu1a 0 peso medio para
cada uma, qual e a mais proW-vel de fomecer uma
melhor estirnativa do peso medio da popularylio:

1. Qual e a VI neste estudo?


2. Qual e a VD? A VD e discreta, continua ou categ6rica?
3. Use 0 SPSSPW para obter urn histograma para os dois conjuntos de dados e entiio
responda 0 seguinte:
(a) Os dois conjuntos de dados sao normalmente distribufdos?
(b) Use 0 SPSSPW para calcular a media e 0 desvio padrao para os dois conjuntos
de resultados.

(a)
(b)
(c)
(d)

2,5

5,0
7,5 10,0
VAROO0001

12,5 15,0 17,5 20,0


Desvio padrao = 4,74
M~ia = 13,5
N = 20

Normal
Positivamente assimettica
Negativamente assimettica
Bimodal

5. 0 desvio padrlio e igual:


(a)
(b)

8. No diagrama de caixa e bigode (box plot), urn va


lor extremo e caracterizado COIllO:
(a) 0 valor situado a1em da caixa intema
(b) 0 valor situado entre a caixa intema e os bi
godes
(c) 0 valor que esta situado entre a caixa intema
e 0 valor adjacente
(d) Um valor que estj situado entre os dois bigodes

(b) Simettia
(c) As caudas devem encoDtrar 0 eixo das abscis
sas DO infinito
(d) Todas as anteriores

45,52,68,74,55,62,58,49,42,57

7. Amodie:
(a) A freqiiencia do valor mais comum dividido
pelo numero total de valores
(b) 0 valor do meio ap6s a ordenarylio de todos as
escores
(c) 0 valor que ocorre com mais freqilencia
(d) A soma de todos os valores dividida peto nu
mero de valores

9. A disttibuiryiio nonnal deve possuir qual das se


guintes propriedades?
(a) Forma de sino

Os estudantes que nao tomaram 0 alucin6geno obtiveram os seguintes resultados:

(a) Quanto maior 0 lJIIItanho da amostra, maior 0


erro amostral
(b) Quanto maior 0 tarnanho da amostIa, menor 0
erro amostral
(c) 0 tamanho da amostra e igual ao erro amostral
(d) Nenhuma das anteriores

23,89,62, 11,76,28,45,52,71,28

105

A variincia
A raiz quadrada da variincia

(a) AmostraA
(b) Amostra B
(c) Ambas fomecerio boas estimativas da media
populacional
(d) Nenhuma delas fomecera uma boa estimativa
da media populacional
II. Que tipo de relarylio e indicada por urn diagrama
de dispcnao (scattergram) no qual os pontos se
acumulam ao redor de uma linha imaginaria que
vai do canto inferior esquerdo all! a tapa do canto
superior direito?
(a) Positiva
(b) Negativa

106

(c) Bimodal
(d) Plana
12. Qual e a media do seguinte conjunto de valores: 5.
7, 10, 12. 18,20,24,22,24, 25?
(a)
(b)
(c)
(d)

145
17,2
16,7
167

13. Se voce lem uma


metrica, entao:
(a)
(b)
(c)
(d)

(a) 36
(b) 1296

19. Quais das seguintes declara~Oes sao verdadeiras?


distribui~ao

(a) Parfunetros descrevem amostras, e estatfsticas


descrevem popula~Oes
(b) Estatisticas descrevem amostras e popula~Oes
(c) Parametros descrevem popula~Oes, e estatesli
cas descrevem amostras
(d) Alternativas (a) e (b)

negativamente assi

A media, a mediana e a moda sao iguais


A cauda da direita e estendida
A cauda da esquerda e estendida
Nenhuma das anteriores

(a) Apresenta fonna de sino, e simetrica e possui


caudas que se estendem ate 0 infinito
(b) Esomente aplicavel a pessoas nonnais
(c) Tem media, mediana e moda iguais
(d) Alternativas (a) e (c)
15. Quando voce tern variaveis categ6ricas e esta sim
pJesmente contando a freqUencia de ocorrencia
em cada categoria, entao sua medida de tendenda
cenlral deve ser:
Moda
Mediana
Media
Nenhuma das anteriores

16. Dado 0 seguinte conjunto de dados (8, 7, 9,12, 14,


10, 14, II, 13, 14). quais sao os valores da media,
mediana e moda?
(a) 11,2; 11,5; 14

(b) 112; 12; 14


(c) 5; 14
(d) 10; 12; 14

17. Se uma distribui~ao e descrita como platicllrtica,


entao e:
(a)
(b)
(c)
(d)

18. Tendo calculado a variancia de um conjunto de


dados com 12 participanles como 36, qual sera 0
valor do desvio padriio?

(c) 6
(d) 3

14. Uma distribui~ao perfeitamente normal:

(a)
(b)
(c)
(d)

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Bem pontiaguda
Bem plana
Bimodal
Bem fina

20. Dado 0 seguinte diagrama, como voce descreveria


a distribui~ao?
Histograma

:;

of

....'u"c::

o
0,0

5,0

10,0 15,0 20.0 25,0 30,0 35.0 40,0


VAR000004
Desvio padrao = 13,65
M~ia =20,0
N

(a) Nonnal
(b) Positivamente assimetrica
(c) Negativamente assimetrica
(d) Bimodal

=40

107

Referencias
ARMITAGE, C. REIDY, J. Development and validation of a new measure of blood fear (nao
publicado).
BAKER. R. et al. Emotional processing and panic. Behaviour Research and Therapy v. 42, n. II, p.
1271-87, November 2004.
GARLAND, K. J., NOYES, J. M. Computer eltperience: a poor predictor of computer alitudes.
Computer in Human Behaviour. (aguardando impressao).
MORIS. P. E. et al. Foolball knowledge and the acquisition of new results. British Journal of
Psychology. v. 72, p. 479-83, 1981.
REIDY, J. KEOGH. E. State and trait factors underlying lh>.interpretation of threat/neutral
homophones. Anigo apresentado na British Psychological Society Cognitive Section Annual
Conference. 1997.
TABACHNICK, 8.. ADELL, L. S. Using Multivariate Statistics. Addison Wesley, 4 ed., 2003.
TUKEY, J. W. Eltploratory Data Analysis. Reading (MA): Addison-Wesley, 1977.
WALSH, J. J., UGUMBA-AGWUNOBI, G. Individual differences in statistics anltiety: the roles of
perfectionism, procrastination and trait anltiety. Personality and Individual Differences. v. 33, p.
239-51, 2002.
WATSON, M., GREER, S. Development of a questionnaire measure of emotional control. Journal of
Psychosomalic Research. v. 27, p. 299-305, 1983.

Estatrstica sem Matematica para Psicologia

109

Probabilidade, Amostragem e
Distribui~6es

Panorama do capitulo
Nos capitulos anteriores, foram apresentados aspectos importantes do delineamenlo ex
perimental, assim como os processos iniciais da analise de dados. Neste capitulo, voce sera
apresentado ao processo da analise de dados. Com base no seu conhecimento de amostras e
populac;oes, explicaremos como somos capazes de generalizar e obler conclusoes acerca de uma
populac;ao a partir dos resultados de amostras. Logo, voce estara sendo apresentado it estatis
tica inferencial. Ap6s uma breve introduc;ao ao mundo das probabilidades, mostraremos como
podem ser usadas as distribuic;oes probabilisticas, assim como a distribuic;ao normal padrao para
fazer inferencias sobre os dados da amostra. Em resumo, neste capitulo voce aprendera:

probabilidade e probabilidade condicionada


aplicac;ao da probabilidade it pesquisa
distribuic;ao normal padrao
distribuic;oes amostrais
estimativas por ponto e por intervalo
erro padrao e intervalo de confianc;a
diagrama de barras de erro

Para calcular a probabilidade da ocorrencia de urn evento, como 0 lanc;amento de


uma moeda. simplesmente dividimos 0 numero de ocorrencias dos resultados desejados
pelo numero total de resultados possiveis. Portanto, no caso de urn arremesso da moeda,
existe urn resultado desejado (cara), mas dois resultados possiveis (cara ou coroa). A
probabilidade de dar cara e 1/2 (ou 0,5). Probabilidades tarnbem podem ser expressas em
termos de percentagens. Esse lipo de formato e geralmente mais familiar e ajuda mais
no entendimenlo da probabilidade. Logo, a probabilidade de se obler cara quando arre
messada uma moeda e 50%. A probabilidade 0 e anotada como 0%, e a probabilidade I
como 100%.

3.1

Probabilidade
Para aprender estatistica. e necessmo urn born entendimento do conceito de probabili
dade. Isso nao e tao dificil quanto parece. pois a probabilidade se faz presente no dia-a-dia.
Toda vez que sorteamos cara ou coroa, jogamos urn dado ou compramos urn bilhete de 10
teria, estarnos Iidando com probabilidades. 0 noticimo e uma das fontes mais comuns de
probabilidades: por exemplo, se voce e fumante, e maior a sua probabilidade de desenvolver
cancer de pulmao. Da mesma forma (gosto muito desta probabilidade), se voce bebe cerveja
moderadamente, seu risco de doenc;a cardiaca e reduzido.
Esses exemplos deixam claro que as probabilidades tern urn papel importante na nossa
vida. Entao vamos dar uma olhada mais detalhada nos mesmos. Se voce jogar cara ou coroa,
qual ea probabilidade de dar cara? A probabilidade ede urn para dois se voce lanc;ar a moeda.
Isso que dizer que urn em cada dois arremessos da moeda pode resultar cara. Probabilidades
sao geralmente expressas em forma de numeros decimais, de 0 a 1, onde 0 significa que 0
evento nao aconteceni, e 1 significa que acontecera.

Vamos agora examinar 0 jogo de dados. Quando jogamos urn dado, qual ea probabilidade
de se obler 0 numero 6? Como temos urn resultado desejado (6) e seis resultados possiveis (I,
2,3,4,5 e 6), a probabilidade de se obter urn 6 e de 1 .,. 6 ou 0,1667. Qual e a probabilidade
de obtermos 1 ou 2? Aqui temos dois resultados desejados (l ou 2) e seis resultados possiveis,
logo a probabilidade e de 2 + 6 ou 0.3333.

110

Christine P. Dancey & John Reidy

Estatfstica sem Matem,Hica para Psicologia

Tente achar a probabilidade de se obter urn numero par (a resposta esta na se~ao de Res
postas do livro).

3.1.1

Que conc1us5es podem ser tiradas da seguinte descri~ao de eventos?


Em uma tarde agilada no centro de Woverhampton. um homem foi visto dobrando uma es
quina e correndo em direfiio a avenida principal. Ele estava obviamente com pressa. nem se
importava que estivesse empurrando as pessoas no seu caminho. Momenros depois. uma policial
tambem dobrou a esquina correndo em direfiio a avenida principal.

Probabilidades condicionadas

Vma possivel conclusao a ser inferida dessa descri~ao e que a policial estava tentan
do a\can~ar 0 homem e prende-Io. Na maioria dos casos, esta seria uma dedu~ao razoavel.
Entretanto, e possivel que a policial estivesse seguindo seu colega a paisana e que ambos
estivessem correndo para a cena de urn crime.
Podemos ver como e facil obtermos conc1us9~s erroneas em nosso dia-a-dia. Esse
mesmo tipo de erro pode acontecer na pesquisa psicol6gica, pois estamos tentando inferir
conclus5es a partir de anaJises estatisticas. Lembre-se de que, na maioria das vezes, quando
testamos uma amostra de pessoas, estamos testando conclusoes sobre a popula~ao de onde
a amostra foi extraida. Se quisessemos descobrir se a ansiedade gerada por estatfstica esta
relacionada aprocrastina~ao, selecionariamos aleatoriamente uma amostra e obterfamos os
valores dessas duas variaveis. A partir desses dados, farfamos inferencias sobre a rela~ao
dessas duas variaveis na popula~ao. Para esse tim, USarfamos tecnicas de estatistica infe
feodal. Entretanto, existe a possibilidade de obtermos as conc1usoes equivocadas a partir
de nossas analises estatisticas. Isso acontece porque as tecnicas estatisticas que usamos se
fundamentam em probabilidades. Portanto, e importante estar sempre ciente da falibilidade
de tais tecnicas.

Para a pesquisa em psicologia, e necessario nao somente 0 conhecimento de probabi


lidade, mas tambem de probabilidade condicionada. A probabilidade condicionada envolve
urn evento que depende de outro. Por exemplo, a probabilidade de 0 Arsenal ganhar a final
da Copa Inglesa, deste ano, pode ser de 70% se 0 time jogar contra 0 Enfield Town, mas
pode ser somente de 60% se jogar contra 0 Manchester United. Essas sao probabilidades
condicionadas, pois dependem do time enfrentado pelo Arsenal na final da Copa. Outro
exemplo de probabilidade condicionada e a de alguem comprar esse Iivro de estatistica.
Sabendo que ha provavelmente, pelo menos, 99 outros textos no mercado, a probabilidade
de alguem comprar este Iivro seria de 1/100 (ou 1%). Se 0 professor recomendar 0 livro, a
probabilidade pode mudar para 1/5 (ou 20%). A probabilidade de 1/5 e uma probabilidade
condicionada; e a probabilidade de alguem comprar 0 livro na dependencia da recomen
da~ao do professor. Mencionamos dois exemplos de probabilidade condicionada no infcio
deste capitulo. A probabilidade de contrair cancer caso voce seja fumante e condicionada,
tanto como a probabilidade de doen~a cardiaca caso beba uma quantidade moderada de cer
veja. Eimportante 0 entendimento de probabilidade condicionada, pois ela sera discutida no
Capitulo 4 quando explicarmos 0 teste de hip6teses.

~lJ\fiwi~d~.~:3.

..JJ'i\frt*'~~'~~~ll~f:

111

Exemplo da literatura:

ansiedade estatistica e procrastina~o

Walsh e Ugumba-Agwunobi (2002) usaram tecnicas de estatistica inferencial para avaliar a


ansiedade causada pela estatistica e a procrastinarrao. Noventa e tres pessoas comple
taram urn questionario multidimensional para essa ava1ia~ao. Fazendo usc da tecnica de estatistica
inferencial e do coeficiente de correla~ao de Pearson, os pesquisadores encontraram relarr5es entre
a procrastina~ao e tres componentes da ansiedade gerada pela estatfstica: mOOo de professores de
estatistica, mOOo de pedir ajuda e medo das aulas e dos testes. Essas tecnicas de estatistica perrni
tiram que Walsh e Ugumba-Agwunobi argumentassem que a hip6tese de a ansiedade gerada pela
estatistica estar relacionada aprocrastina~ao possuia sustenta~ao.
rela~ao entre a

"-",

3.1.2

Aplica~o

;.'

da probabilidade na analise de dados: estatlstica inferencial

A estatistica inferencial e uma cole~ao de tecnicas utilizadas para se obterem con


clusoes a partir de urn conjunto de dados. Uma pesquisa e geralmente conduzida com 0
objetivo de extrair conc1usoes a partir de certas observa~oes, isto e, com 0 objetivo de fazer
inferencias. Os estudos das rela~oes entre ansiedade gerada pelo estudo da estatistica e a
procrastinarrao ou entre fumar cigarros e memoria de curto prazo sao feitos para entender
mos melhor tais problemas. Do mesmo modo, conduzimos urn estudo sobre pessoas que
comem pao-de-Io com ketchup as 6h30min da manha apenas para entendermos porque
alguem faria algo tao estranho. Para respondermos tais questoes, precisamos obter conc1u
soes a partir de nossos dados.

3.2

Distribui~ao normal padrao


Voce ja foi apresentado a probabilidade e tambem, no Capitulo 2,

afamIlia das distri

bui~5es conhecidas como distribui~5es normais. Gostarfamos de prosseguir explicando uma


distribui~ao ainda mais importante: a distribui~ao normal padrao (ver Figura 3. I). Como indica

a Figura 3.1, a distribui~ao normal padriio e urna distribui~o com forma normal, de media 0 e
desvio padrao igual a I. Devido a essas e outras caracterfsticas, a distribuirrao normal padriio e
muito uti I. Essa distribuic;ao nos permite comparar valores de amostras diferentes, valores de
uma mesma amostra e muito mais.

112

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

-3

-2

-1

113

~tribUi<;aonormal padrao.
3

-3

Para podermos utilizar a distribuiC;iio normal padriio na anlilise dos nossos dados. e neces
sario transformarrnos os valores das estatisticas amostrais em valores da normal padriio. Esse
processo e realizado por meio da subtraC;iio da media de cada valor e entiio pela divisiio desta
diferenc;a pelo desvio padriio. 0 resultado obtido e denominado de valor z. Ele eo numero de
desvios padroes a contar da media: indica 0 valor de entrada acima ou abaixo da media em
unidades de desvio padriio. Se voce tern urn valor z negativo, seu valor esta abaixo da media;
se 0 valor z e positivo, entiio esta acima da media. Portanto, urn valor z igual a I informa que
ha urn desvio padriio acima da media da distribuiC;iio.
Vsaremos urn exemplo para explicar melhor. A media para valores de QI em testes de in
teligencia e 100, com urn desvio padriio de IS. Se voce tern urn QI de 135. seu valor z seria:

135 -100 = 2,33

IS

Significa que seu QI esta 2,33 desvios padroes acima da media: voce tern urn valor z
de 2,33.
Vma vez convertidos nossos valores z. podemos usar a distribuiC;iio normal padriio de
varias maneiras. A distribuiC;iio normal padriio e uma distribuiflio de probabilidade. 0 en
canto das distribuiC;oes de probabilidade e a existencia de uma associac;iio com cada valor da
distribuiC;iio. Sabemos a probabilidade de selecionar aleatoriamente qualquer valor da distri
buiC;iio. AMm disso, sabemos tambem a probabilidade de se obter urn valor entre quaisquer
dois valores da distribuiC;iio, por exemplo, urn valor entre -I e 1. Vma importante caracte
ristica das distribuic;oes de probabilidade e que a fu"ea abaixo da curva entre quaisquer dois
pontos especificos representa a probabilidade de se obterem valores entre os dois pontos.
Por exemplo, a probabilidade de se obterem valores entre -I e 1 na distribuiC;lio normal
padrlio e de aproximadamente 68% (ver Figura 3.2). Isso quer dizer que 68% da fu"ea total
da curva normal padriio esta situada entre -I e I desvio padriio a contar da media. 13 impor
tante lembrar que a probabilidade referida e a de selecionarmos valores aleatoriamente da
distribuiC;iio. Logo, existe uma probabilidade de 68% de selecionarmos aleatoriamente urn
valor entre -I e 1.
N. de T. A rigor. como so esta falando de uma variAvel conllnu.. 0 que existe t uma probabilidade associada a intervalos da variA
vel, nAo exalamenle a um valor particular. Por simplicidade, os aulores devem estar se re(erindo a esta situa.;3.o.

, &n.eai)f'ob;ibilidacie&i~;H
ao acaso,um, valor,entre.-,dQiS,I!5COle$,:

~ curva normal padrao entre -1 e 1 desvio padrao.

Da mesma maneira, a probabilidade de se obter urn valor entre -1.96 e 1,96 desvio pa
driio e de aproximadamente 95% (ver Figura 3.3).

:;:{!ft'~

3
... .,: .>' :, .,: ';';,::,':<: ~ :;r~:;'~;;~::'~~;;:~:';':I, ...~~,T;.-;"'---:>-';';~~

, 95% ~'a pi~bilidiidede5el~riii~.~:


ao aCaso, u.ri1:"akir entre essescl6k~

_ _ Percentagem da curva normal padrao entre -1,96 e 1,96 desvio padrao.

114

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Devido a essas caracteristicas, podemos utilizar a distribui~ao normal padrao para encon
trar a probabilidade de se obterem valores em qualquer intervalo da distribui~ao. Poderiamos
calcular a probabilidade de se obter urn valor z de 2 ou acima na distribui~ao normal padrao,
ou poderiamos achar a probabilidade de se obter urn valor z entre I e 2. Voce notara que va
lores z extremos, digamos, acima de 2 e abaixo de -2, tern uma chance bern menor de serem
obtidos do que valores no meio da distribui~ao. Devemos entiio concluir que as areas da curva
acima de 2 e abaixo de -2 sao pequenas em compara~ao as areas entre -I e I (ver Figura 3.4).
Vamos relacionar este fato a exemplos mais concretos, como altura de homens. Se conside
rarmos valores acima de 2 e abaixo de -2 como os extremos de medidas de altura de homens,
digamos acima de 2,Om ou abaixo de 1,4m, toma-se evidente que e muito menos provavel
encontrarmos homens acima ou abaixo destas alturas do que homens entre I,65m e 1,83m.
Felizmente, quando trabalhamos com a distribui~ao normal padrao, nao temos que calcu
lar as areas sob a curva, isto e, as probabilidades. Elas ja foram calculadas e convenientemente
colocadas em tabelas para 0 nosso uso. No Apendice I, voce podera encontrar a tabela das
areas sob a distribui~ao normal padrao.
Outro aspecto uti I da distribui~ao normal padrao e podermos utiliza-Ia para calcular a
por~ao da popula~ao que teria urn valor acima ou abaixo do seu escore. Nao esque~a que,
quando falamos em propor~6es, estamos nos referindo a area abaixo da curva normal padrao,
para a qual precisamos consultar a tabela da distribui~ao normal padrao encontrada em mui
tos livros de estatistica (ver Apendice I). Na Figura 3.5, podemos ver que 0 QI de 135 esta a
2,33 desvios padr6es acima da media. A area nao-sombreada representa aqueles que teriam
urn escore maior do que 0 seu.
Para descobrir que propor~ao da popula~ao teria urn escore menor do que 0 seu, basta
consultar a tabela da distribui~ao normal padrao. Essa tabela e apresentada, geralmente, em
diferentes formatos, mas a informa~ao contida e essencialmente a mesma. A Tabela 3.1 apre
senta uma parte do Apendice I.
A iirea do meio ~ n1aior

d6 que ades exuemos

-3

-2

-1

o meio e os extremos da curva normal padrao.

115

:::~;~~~~"'~y

'f}~;~r:~:~d::~a, :
2,33 desvios padr6es
acima da m~ia
......,'1"-.',

I
100

135

QI
Distribui~ao normal da propor~ao da popula~ao com QI menor ou igual a 135 (valor z

de 2.33).

Tabela 3.1

Escores e areas sob a curva nonnal padrao

P~Por~Q:d~ C\Irva ~blllXd do ~ore

Escorezde2,33: .
~1IbBIxo doelicore , ",

. Propo~lIdmado rscore

:-/.'"

0.9896

0,0104

0.9898

0,0102

2,33 .

0,9901

2,34

0.9904

0,0096

2,35

0.9906

0,0094

,..,,0999

Podemos perceber que os valores na coluna denominada "Propor~ao abaixo do escore"


representam a area sob a curva abaixo de qualquer valor z. A tabela nos indica que a propor
~ao que esta abaixo de seu valor z e 0,9901. Isso significa que 99,01 % da area sob a curva
estao abaixo desse escore. Se voce quisesse saber que propo~ao da curva esta acima do
escore, pode simplesmente subtrair essa propor~ao de I (ou 100%). Neste caso, 0,0099 da
area da curva esta acima do escore, ou menos que 1%. Este valor esta na Tabela 3.1 na coluna
"Propor~ao acima do escore".
Note que as tabelas tendem a conter somente valores z positivos, quer dizer, aqueles
que se encontram acima da media. Se voce obtiver urn valor z negativo, utilize a mesma
tabela, mas ignore 0 sinal negativo do valor z para descobrir as areas acima e abaixo do
escore. Entretanto, como 0 escore esta abaixo da media, a propor~ao apresentada na coluna
"Propor~ao abaixo do escore" deve ser Iida como propor~ao da curva que esta acima do
escore (Figura 3.6).

116

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

117

rl~4~~~~

QI

2.33

-2.33

Valor z positivo

QI

3.2.1

Valor z negativo

Proporc;oes da curva abaixo de urn valor z positivo e acirna de urn negativo.

Daremos outro exemplo para esc1arecer 0 calculo das proporcyOes. Digamos que voce
tenha tido urn pessimo dia quando fez 0 seu teste de QI e conseguiu urn resultado de somente
95 pontos. Que percentagem da populacyao esta abaixo do seu escore?
Podemos converter seu escore em urn valor z, portanto:
95 -IDO = -0,33

15

Podemos observar que agora temos urn valor z negativo. Se consultarmos a tabela, vere
mos que a proporcyao de QIs abaixo do seu e 0,3707 (ou 37,07%). A Figura 3.7 mostra que,
como seu escore esta abaixo da media, a porcyao menor sera aquela abaixo do seu escore.
Portanto, a tabela informa que 37,07% da populacyao apresenta escores abaixo, e 62,93%
acima do seu QI. E importante lembrar que, quando consultar 0 Apendice I para valores z
negativos, a proporcyao abaixo do seu escore estara na coluna "Proporcyao acima do escore"
e vice-versa.

.~~~~OJr~;~~.':

M~iade

95

Proporc;ao da populac;ao acirna e abaixo de urn valor de QI de 95.

Compara~o

de popula~oes

.-

Tambem podemos utilizar a distribuicyao normal padrao para comparar diferentes si


tuacyOes. Por exemplo, suponhamos que voce esteja indeciso sobre sua futura carreira, mas
saiba que gosta de fazer ceramica e levantamento de peso. Voce decide fazer urn curso em
cada uma destas areas para avaliar seu desempenho e escolher melhor sua futura carreira.
No tim dos cursos, voce descobre que sua nota foi de 64% para ceramica e de 45% para
levantamento de peso. Com base nestes resultados, poderiamos justiticar sua escolha para
seguir uma carreira como oleiro em vez de urn levantador de pesos. Para ter uma ideia
melhor, voce precisa se comparar com outros em cada urn dos gropos. Voce pode desco
brir que e pior em ceramica em comparacyao ao resto do gropo do que em levantamento
de pesos. Para fazer tais compar~oes, voce precisa converter seus escores em valores z.
Vamos supor que a media e 0 desvio padriio para cerfunica sao 55% e 9%, respectivamen
te, e para 0 levantamento de peso 40% e 4%. Seu valor z para cerfunica seria I, e para 0
levantamento de pesos seria 1,25.
64-55
--=1
9

45-40 = 1,25
4

Valor z para cerfunica

Valor z para levantamento de peso

Assim, voce esta urn desvio padrao acima da media em cerfunica e 1,25 desvio padrao
alem da media no levantamento de peso. Portanto, esta melhor em levantamento de pesos
do que em ceramica. Conseqiientemente. deveria escolher 0 levantamento de peso como
carreira.

100

QI

118

3.3

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Aplica~ao

da probabilidade a pesquisa

Anteriormente esclareceu-se que a probabilidade de urn evento acontecer pode ser expressa
como urn nl1mero decimal ou como uma percentagem. Por exemplo, quando voce joga urn dado
voce tern uma probabilidade de 0,1667 (16,67%) de obter a face I. Da mesma maneira, se houver
uma probabilidade de 0,05 (ou 5%) de voce sofrer urn acidente enquanto dirige, aproximadamen
te uma safda em cada 20 resultaria em acidente. Tal probabilidade pode ser dependente de algum
outro fator, como falar no celular enquanto dirige. Neste caso, diriamos que a probabilidade de
voce sofrer urn acidente, enquanto dirige 0 carro e fala no celular, seria de 5%. Este e urn exemplo
de probabilidade condicional. A probabilidade de 5% de voce ter urn acidente enquanto dirige 0
carro eslli condicionada ao fato de dirigir e conversar no celular ao mesmo tempo.
Voce deve estar pensando que isso tudo parece muito sensato, mas 0 que a probabilidade
tern a ver com 0 usc da estatlstica na pesquisa? Em pesquisa, normalmente generalizamos
resultados de amostras para populac;5es. Como discutido no Capitulo 2, toda vez que utili
zamos amostras corremos riscos de cometer erros (erros de amostragem). Isso significa que
nao sabemos se 0 padrao de resultados que obtivemos em nossas amostras realmente reflete 0
que esta acontecendo nas populac;5es ou se e simplesmente resultado do erro de amostragem.
Seria vantajoso poder calcular a probabilidade de os valores amostrais resultarem de erro
de amostragem. Se existisse somente uma pequena possibilidade de 0 erro de amostragem
produzir 0 padriio de resultados, poderiamos concluir que as amostras refletem acuradamente
as populac;5es.
Uma das maneiras mais simples de aplicar probabilidade a pesquisa e estimar parametros
populacionais a partir de estatlsticas amostrais e calcular intervalos de confianc;a. Nas pr6xi
mas sec;5es, seriio apresentados conceitos necessarios para calcular intervalos de confianc;a e
explicado por que sao importantes para se obterem conclus5es de pesquisas. Descreveremos
as distribuic;5es amostrais e destacaremos suas principais caracteristicas. Em seguida, sera ex
plicado como a distribuic;iio amostral da media pode ser utilizada para deterrninar a qualidade
de nossa estimativa da media amostral, em relac;ao a media populacional, por meio do usc de
intervalos de confianc;a.

119

teressante das distribuic;5es amostrais e 0 fato de, se elas sao deterrninadas a partir de urn nl1
mero bastante grande de amostras, apresentarem uma forma aproximadamente normal. Alem
disso, quanto mais amostras forem utilizadas, mais pr6ximo da normal estara a resultante
distribuic;ao amostral.
Talvez, surpreendentemente, a distribuic;ao amostral da media seja normal, nao obstan
te a forma de distribuic;ao da populac;ao. Esta pode ser de alguma maneira assimetrica ou
bimodal ou meslTlO uniforme, e, ainda assim, podem existir distribuic;oes amostrais quase
normais.
exemplo seguinte serve como i1ustrac;ao. Imagine que, quando voce nasceu, alguem co
mec;ou a jogar urn dado e a anotar 0 resultado. Essa pessoa jogou 0 dado, uma vez a cada dois
segundos por toda sua vida ao lange de 80 anos (algo rfada interessante para alguem fazer, mas
vamos la). Agora, se trac;armos a distribuic;ao de todos os lances do dado (a populac;ao de todos
os lances do dado ao lange da sua vida), sera semelhante adistribuic;ao da Figura 3.8.
Como cada nl1mero do dado tern uma probabilidade igual de acontecer (de I em 6),
espera-se que cada nl1mero tenha aparecido com aproximadamente a mesma freqiiencia ao
lange de sua vida. Portanto, a populac;ao de todas as jogadas do dado, durante sua vida, tern
uma distribuic;ao uniforme. Considerando que os nl1meros ocorreram com igual frequencia,
entao a media da populac;ao de jogadas e 3,5. Se escolhermos aleatoriamente cinco amos
tras de dez lances do dado, dessa populac;ao, poderiamos obter 0 seguinte:

1,5,1,2,6,6,4,1,4,6

" " ,

,.~ 1,2,2,2,6,5,3,3,6,4

media = 3,6
media=3,4

", Lances" _ _ 4, 2, I, 6, 6, 5, 3, 5, 5, 2

media=3,9

~ 3,5,2,4,2,2,1,4,3,4

media = 3,0

4,2,1,1,2,6,6,5,3,4

media = 3,4

dodado :---....

- f "

, M~ia~,
I..

7'

180000000 I

3.4

Distribui~oes

150000000

amostrais

No Capitulo 2, demonstrou-se como a media da amostra pode ser usada para estimar a
media da populac;ao. Alem disso, vimos que, ao formannos varias amostras e, ap6s, calcular
mos a media das medias dessas amostras, 0 resultado sera uma melhor estimativa da media
da populac;ao do que as medias das amostras individuais. 0 teorema central do limite diz
que, conforme aumenta 0 tamanho das amostras selecionadas, mais pr6ximo da media da
populac;ao estarao as medias dessas amostras. Entao, quanto maior for 0 tamanho da amostra
utilizada, melbor sera a estimativa da media da populac;ao.
Quando voce apresenta uma estatistica amostral, calculada a partir de todas as amostras
posslveis retiradas de uma dada populac;ao, como urn histograma de freqiiencias, determina
a distribuic;ao amostral. Portanto, se voce calcular as medias de muitas amostras de uma
populac;ao especffica, tera trac;ado a distribuic;ao amostral da media: Uma propriedade in
N. de T. A (rase aqui nao deve ser ramada aD da lelIa. pois. de fato. a dislribuil;30 amostral 56 ~ oblida se forem retiradas todas
as amostras posstvcis de uma dada populalj3o. Alt!:m disso. a discribuilj80 amostral t: 0 conjunto dos vaJores da eslatrstica amostral
com as respectivas probabilidades.

120000000

'"'"

;~

90000000

r:1"
~
u..

60000000

30000000

3
4
Numero no dado

Histograma da distribui<;ao da popula<;ao de lances de urn dado.

120

Christine P. Dancey & John Reidy

Estat(stica sem Matematica para Psicologia

121

Nota-se que as medias das amostras slio boas aproxima~oes da media 3,5 da popula
embora variem consideravelmente. Entretanto, se a media das medias fosse calculada,
haveria uma aproxima~lio, ainda melhor, da media da popula~lio:
~iio,

(3,6+3,4+3,9+3+3,4) = 346

5
'

Vamos agora plotar as medias das amostras como uma distribui~iio de freqiiencias, isto e,
uma aproxima~lio da distribui~lio amostral (ver Figura 3.9).

tra~ar

2,5

.'"

3.5

2,0

'v

1,5

1,0
0,5

3,0-3,1

3,2-3,3

3,4-3,5

3,6--3,7

3,8-3.9

Medias amostrais dos lances do dado


Histograma da

distribui~ao

das medias de cinco amostras de dez lances de um dado.

Intervalos de

confian~a

e erro padrao

Embora tenhamos conhecimento de que a media da amostra e uma aproxima~lio da


media da popula~lio, geralmente nlio temos muita certeza da precislio desta aproxima~lio.
Os intervalos de confian~a podem nos ajudar nessa duvida.
Por ser a media da amostra urn valor ou ponto de uma varilivel, e conhecida como
estimativa pontual da media da popula~lio. A media da amostra representa urn ponto da
varilivel e por esse motivo nlio sabemos se a nossa media amostral e uma subestima~lio
ou uma sobrestima~lio da media populacional. Alem disso, nlio sabemos realmeote qual
a proximidade da nossa media da amostra com a da popula~lio. Entiio, seria util se ti
vessemos alguma maneira de saber aproximadamente onde esta a media da popula,.lio.
Felizmente, temos uma maneira de descobrir calculando urn intervalo de confian~a. Os in
tervalos de confian~a para a media slio estimativas intervalares para a media populacional.
Isto e, eles nos fomecem urn raio de valores em tomo da media amostral (urn intervalo)
dentro do qual podemos constatar, com determinada confian~a, se ele contem a media da
popula~lio.

A Figura 3.9 mostra que a distribui~iio nlio e plana como a da popula~iio dos lances do
dado. Para melhor ilustrar este contraste, temos que constituir mais amostras de dez lances do
dado. 0 grillco na Figura 3.10 e a distribui~lio amostral de 100 medias amostrais.
Embora a popula~iio tenha uma distribui~iio uniforme, a distribui~lio amostral da media e
aproximadamente normal em formato. Esse seria 0 caso para qualquer distribui~lio amostral
tra~ada.

35
28

'g

41

21

'::J

.... 14

2,4-2,5 2.6-2.7 2.8-2.9 3,0-3.1 3.2-3.3 3,4-3.5 3.6-3.7 3.8-3,9 4,0-4.1 4.2-4.3 4,4-4.5

Medias amostrais dos lances do dado


Distribui~ao

das medias de 100 amostras de dez lances de um dado.

Por exemplo, digamos que apliclissemos a uma amostra de pessoas 0 inventario de


depresslio de Beck (BOI) (Beck et aI., 1961).0 questionmo avalia a depresslio, e os es
cores podem variar de 0 a 63. Digamos que a media da nossa amostra no BOI seja 10,72.
Somente com este exemplo nlio temos como saber a proximidade desse resultado da media
da popula~lio (ver Figura 3.II(a. Seria vantajoso se pudessemos dar uma indica~lio da
proximidade deste numero a media da popula~lio. Pensemos logicamente nessa situa~lio.
Como 0 menor escore no questionmo eO, e 0 maior e 63, podemos ter 100% de certeza
de que a media da popula~lio esta em algum lugar entre estes dois valores (ver Figura
3.11 (b. Esse e urn intervalo de confian~a, embora olio seja muito informativo. Podemos
usar as caracterfsticas das distribui~oes amostrais para estreitar este intervalo, apesar de
tambem podermos estar reduzindo a confian~a de que ele contenha a media da popula~lio.
Geralmente fixamos intervalos de confian,.a de 95%. Voce irli perceber que, freqUente
mente, estes intervalos sao bern estreitos (dependendo do tamanho da amostra utilizada).
No nosso exemplo, nota-se que estamos 95% confiantes de que a media da popula~lio esta
entre 2,72 e 18,72 (ver Figura 3.11 (c. Este resultado e. consideravelmente. mais preciso
do que afirmar que a media esta entre 0 e 63. Ele nos fomece uma n~lio mais precisa de
onde a media populacional possa estar em rela~ao a amostral.
Eimportante lembrar que, devido ao fato de estarmos trabalhando com estimativas, nlio
temos garantia de que 0 intervalo, de fato, envolva a media da popula,.lio. Entlio, devemos
indicar, com nossa confian~a, que 0 intervalo calculado contem a media da popula~o. Daf
o termo "intervalo de confian~a".

122

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

(a)

':,~,:.~,

certezadeque

(b)

. 100% d~
a m6d~
populacional est! entre estes dols pontos

0,

,.. _

, .. ,

J. _

:ain~~;'

(c)

""""A"..~"
18.72

I
I

Ela e sempre aproximadamente uma distribui,.iio nonnal.


Sua media e uma boa aproxima,.ao da media da popula,.iio.

Essas duas caracteristicas significam que podemos plotar uma distribuic,;ao nonnal que
contenha uma boa aproximac,;iio II media da populac,;iio. Podemos, entiio, usar as caracte
rfsticas da distribuic,;iio normal para fazer uma estimativa da proximidade da nossa media
amostral a media da populac,;iio. Vamos considerar a Figura 3.14 como urn exemplo de tal
distribui,.iio amostral.

.. ,c~~5~~~~g~,e,~~!0~;;~~

2.]2

to da popula,.iio, sempre sabemos qual 0 fonnato da distribui,.iio amostral. Isto e importante,


pois nos dli urn born discemimento sobre a popula,.iio a partir das estatfsticas amostrais.
No Capftulo 2, explicamos que a distribui,.iio nonnal e uma ftm,.iio de sua media e desvio
padriio. Isso significa que, sabendo 0 desvio padriio e a media, podemos desenhar qualquer
curva nonnal. Dado que a distribui,.iio amostral da media e normal, ela deve, tambem, ser
uma fun,.iio de sua media e do desvio padriio. Conseqiientemente, se sabemos a media e 0
desvio padriio da distribui,.ao amostral da media, podemos facilmente obter seu grlifico. Po
demos usar essas infonna,.6es, como auxflio, para calcular os intervalos de confian,.a.
Vamos supor que temos a distribui,.iio amostral da Figura 3.12. 0 ponto de interroga,.iio
na figura indica que niio sabemos 0 valor da media da popula,.iio (media das medias das
amostras). Digamos que constitufmos uma amostra obtemos sua media. Como nao sabe
mos a media da popula,.ao, niio podemos ter certeza da localiza,.iio da media amostral na
distribui,.iio: pode estar acima, abaixo ou ser exatamente a mesma da media da popula,.ao
(ver Figura 3.13).
Como resolveremos a diffcil questiio de identificar a proximidade da media da popula,.iio
a media da amostra? Em primeiro lugar, precisamos usar a distribui,.iio amostral da media.
Explicamos previamente duas importantes caracteristicas da distribuic,;iio amostral da media:

-e

63

M~fl(kl'

I
I

II
I
I

f'.

10.:...7.:2

...;:

.....

I
I
I

63

~=)

.';'

.;'J;':i::;' -r':-'~~I': ;.f'::~=::S::( :-:'"f,-j

Este intervalo. d~nde do ".

tain~t1ho da airii:i~' lJtiiiia~d'"


. :. ,;: :
~

123

i1ustra,;ao da forma pela qual intervalos de confian,;a auxiliam na localiza,;ao da media


da popula,;ao em rela,;ao a media da amostra.

Expusemos, anterionnente, que as distribui,.6es amostrais tendem a se comportar nor


malmente. Alem disso, afinnou-se, ainda, que a media da distribui,.iio amostral e uma boa
aproxima,.iio da media populacional. Tal conhecimento significa que, independente do fonna

Distribui,;ao amostral com media desconhecida das medias das amostras .

124

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

125

que vale 99,74%. Entao podemos estar 99,74% certos de que a media amostral estara entre -3 e
3 desvios padroes. Suponhamos agora, como e comum, que queremos estar 95% certos de que
urn intervalo da variavel contem a m6dia amostral. Calculamos a probabilidade novamente, con
siderando as areas sob a curva normal. Na S~iio 3.2 vimos que 95% da area sob a distribui~ao
normal padrlio esta entre -1 ,96 e 1,96 desvio padrlio (ver Figura 3.15). Entao, podemos ter 95%
de confian~ade que a m6dia amostral pode estar no intervalo entre-l,96 e 1,96 erro padrlio.
Para ilustrar, vamos supor que a media amostral esta em algum lugar acima da media da
popula~iio. Se desenharmos a distribui~iio baseada na m6dia amostral em va de na media da
popula~ao, teremos a situa~iio ilustrada na Figura 3.16.

~ii:~~~

, ,;:;.,.

"!. '. '.;",F.-:~'-

A localiza~ao da media da amostra em

"

rela~ao

. ,:",...... ~.i;. ,\-.".

. .-' '._,,~'

a media da popula~ao e desconhecida.


3

A Figura 3.14 indica que a m6dia amostral se encontra a alguns desvios padroes acima ou
abaixo da media da popula~iio. Alem disso, ao examinar a distribui~lio, temos confian~a de que
a nossa media amostral estara no intervalo entre -3 e 3 desvios padr<ies, como ocorre com a
maior parte dos valores da distribui~ao. De fato, se considerarmos os valores z da distribui~ao
normal, podemos calcular a probabilidade de ele estar no intervalo entre -3 e 3 desvios padroes,

~ area da curva esta entre-1,96 e +1,96 desvio padrao.

'~~~~~~;i;;~.~~
/

/
/
/
/
/

/
/
/
/

-3

._.

-2

-1

A media da amostra encontra-se a certo numero de desvios padr6es acima ou abaixo da


media da popula~ao.

----

,/

-3

-2?-1

t
. M6!lia PDPIlIaciOIIiII

Mt<!i;lamost@r
. ...
~

~Localiza~ao da media populacional na qual a distribui~ao e desenhada em torno da


media amostral.

MIiIiIiII

126

Christine P. Dancey & John Reidy

Estatfstica sem Matematica para Psicologia

Podemos agora aplicar a mesma 16gica que usamos a pouco para preyer onde a media
amostral esta em rela~ao a media da popula~ao. Podemos ter bastante confian~a de que a me
dia da popula~ao esta em algum lugar dentre 1,96 desvio padrao abaixo da media amostral.
Da mesma maneira, se a media amostral esta abaixo da media da popula~ao, podemos ter
certeza de que a media da popula~ao esta a 1,96 desvio padrao acima da media amostral (ver
Figura 3.17). Conseqiientemente, podemos estar certos (95% de confian~a) de que a media da
popula~ao esta dentro da regiao a 1,96 desvio padrao acima ou abaixo da media amostral. E
importante ter em mente que 0 desvio padrao ao qual nos referimos aqui e 0 da distribui~ao
amostral, e nao 0 da amostra. Munidos dessa informa~ao, podemos indicar a distancia entre
a media amostral e a media da popula~ao. Tudo que precisamos saber e a media amostral e 0
desvio padrao da distribui~ao amostral.
A curva movl!!l,-54l para baixo a fim
,de flcar
torilo da ml!dia amostral

em:

-- ..... - ,
/

......

\
\
\
\
\
\
\
\
\

-3

-2

-1

Ml!dia amostral

, .....

----

M~ia popuJacjpnal:

Distribui~ao

desenhada em torno da media amostral quando abaixo da media


populacional.

3.5.1

Erro padrao

o desvio padrao da distribui~ao amostral da media e urn conceito importante e e de


nominado de erro padriio. 0 erro padrao fomece uma medida do grau com que as medias
amostrais se desviam da media das medias amostrais. Dado que a media das medias amos
trais e a media da popula~ao, 0 erro padrao da media nos informa, tambem, qual 0 grau com
que as medias amostrais se afastam da media populacional. Conseqiientemente, uma vez que
somos capazes de estimar 0 erro padrao, podemos usar esta informa~ao para descobrir 0 quao
precisa e nossa estimativa da media da popula~ao.
o problema que enfrentamos aqui e parecido com 0 da discussao do ovo e da galinha. Se
soubessemos 0 erro padrao, poderiamos saber a precisao da nossa estimativa da media da po
pula~ao. Entretanto, para podermos calcular 0 erro padrao da media, teriamos que selecionar
muitas amostras da popula~ao e, ap6s, calcular 0 desvio padrao das medias dessas amostras.

127

Isso nao e muito util se queremos simplesmente estimar a localiza~ao da media populacional
em rela~ao a media de uma amostra. Felizmente os estatfsticos descobriram que podemos,
facilmente, estimar 0 erro padriio utilizando a nossa amostra.
Como dito anteriormente, 0 erro de amostragem esta relacionado ao tamanho da amostra.
Quanto maior 0 tamanho da amostra, menor 0 erro amostral. Amostras maiores tendem a ter
medias que melhor estimam as medias da popula~o. Significa que tendem a nao variar tanto
em rela~ao a media da popula~ao quanto as medias das pequenas amostras. E importante
lembrar que a medida do grau de vari~iio da media e 0 desvio padriio e que 0 desvio padriio
das medias amostrais e chamado de erro padriio. Conseqiientemente, para grandes amostras 0
erro padrao tende a ser menor do que para pequenas amostras. Logo, 0 erro padriio esta rela
cionado ao tamanho da amostra. Portanto, para qualqlU!f popula~iio, quanto maior a amostra
selecionada, menor e 0 erro padriio. Para nossa conveniencia, comprovou-se que, dada uma
amostra, se dividirmos 0 desvio padrao dessa amostra pela raiz quadrada do seu tamanho,
teremos uma estimativa do erro padriio.
Podemos calcular a media amostral e 0 desvio padriio de qualquer amostra. Como sabe
mos que 0 erro padrao e aproximadamente 0 desvio padriio dividido pela raiz quadrada do
tamanho da amostra, podemos tambem calcula-Io. 0 erro padriio e 0 desvio padrao da distri
bui~iio amostral da media. As tabelas de distribui~iio normal indicam que 95% dos escores
estiio entre 1,96 desvio padriio acima e abaixo da media. Ao aplicarmos isso a distribui~ao
amostral da media, podemos ter 95% de confian~ de que a media da distribui~iio amostral
esta entre 1,96 desvio padriio da media amostral. Portanto, a media da distribui~iio amostral
deve encontrar-se dentro da regiiio 1,96 x 0 erro padriio e a media amostral. Dado que a media
da distribui~ao amostral da media e uma boa estimativa da media populacional, podemos
estar 95% confiantes, tambem, de que a media populacional estara dentro do intervalo que se
encontra 1,96 vezes 0 erro padriio alem da media amostral.
Urn exemplo pode ilustrar essa situa~ao. Se tivermos os seguintes dados amostrais de
urn estudo (2, 5, 6, 7, 10, 12), podemos calcular a media e 0 desvio padriio, que siio 7 e 3,58,
respectivamente. 0 primeiro passo e calcular 0 erro padriio. Lembre-se de que 0 erro padriio
e simplesmente 0 desvio padriio da amostra dividido pela raiz quadrada do tamanho amostral.
Temos aqui urn tamanho amostral de 6, portanto a raiz quadrada e 2,45. Ao dividir 0 desvio
padriio (3,58) por esse numero, temos 0 resultado de 1,46. Uma estimativa do nosso erro
padriio e, portanto, 1,46. Para calcular 0 intervalo de confian~a de 95%, multiplicamos 0 erro
padriio por 1,96 e obtemos 0 resultado de 2,86. Assim 0 intervalo de confian~a, com 95% de
probabilidade, e 7 2,86, ou ainda, de 4,14 a 9,86 (ver Figura 3.18(a.
Esse intervalo de 95% de confian~a tern uma amplitude muito grande, considerando
que nossos valores variam entre 2 e 12. Trata-se de urn intervalo tao grande porque a amos
tra utilizada e pequena. Para melhor ilustrarmos, vamos imaginar que obtivemos a mesma
media e desvio padriio com uma amostra de 100. Nesse caso, a raiz quadrada de nossa
amostra seria 10. Ao dividirmos 0 desvio padriio (3,58) por este numero, obteriamos urn
erro padriio de 0,358. Para obter nosso intervalo de confian~a de 95%, multiplicarfamos 0
erro padrao por 1,96. Isso significa que nossa media populacional deveria estar na regiiio
entre 0,70 unidades acima e abaixo da media da amostra, que e 7. Portanto, teriamos 95%
de confian~a, de que a media populacional estaria entre 6,30 e 7,70. Seria uma amplitude
bern menor de valores e daria uma melhor indica~iio de onde poderia estar a media popula
cional (ver Figura 3.18 (b.

128

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

~~==

~1WiJ,~~

. ;.~

(a) Amostra de tamanho igual a 6


4.14

..... ' .-- - <:- -

~~

...

129

9.86

'--,'

~;;~,~" .~~

~~g~~;'~"i.

'. :"~~r?7;~~/~""

(b) Amostra de tamanho igual a '00

,;lnteMilo;d~.,

6;3
:.
:

~'~f3?ff~n~,:'; 7;7

.:

--------------i-!-(-:;iM-,,-J-jt'-J-a-.:..---i-I--------
;:a~eZ'
Intervalos de confianc;a com amostras de tamanho 6 e 100.

Podemos ver, portanto, a importAncia do tamanho de nossa amostra quando tentamos es


timar os parametros da popula\;ao utilizando estatisticas amostrais. Geralmente, quanto maior
a amostra, melhor a estimativa do parametro.
resumo a seguir pode explicitar 0 que acabamos de explicar:

--

[~ l't~51~~~:dti~~~}Q$(:~~R:!~";1
E muito simples obter intervalos de confian\;a para a media com 0 SPSSpw. Voc~ deve
seguir 0 conselho dado anteriormente para tecnicas descritivas, selecionando a caixa de dia
logo Explore (Explorar).

A media amostral e uma estimativa por ponto, e sua proximidade da media popula
cional e desconhecida.
Se calcularmos intervalos de confian\;a em tomo da media amostral, podemos ter
uma boa ideia do quaD proxima esta da media populacional.
Para calcularmos intervalos de confian\;a, precisamos fazer uso de distribui\;Oes
amostrais.
Se constituinnos muitas amostras da popula\;ao e plotarmos as medias das amostras como
urn histograma de freqti~ricia, teremos produzido uma distribui\;ao amostral da media.
Distribui\;Oes amostrais tendem a ter formato normal:
A media da distribui\;ao amostral da media produz uma boa estimativa da media po
pulacional.
0 desvio padriio da distribui\;ao amostral da media nos diz 0 quanta as medias amos
trais variam em rela\;ao It media populacional.
0 desvio padrao da distribui\;ao amostra1 e chamado de erro padrao e e aproximada
mente igual ao desvio padriio da amostra dividido pela raiz quadrada do seu tamanho.
Sabemos que urn intervalo de 1,96 desvio padrao da media contem a contas 95% dos
valores de uma distribui\;ao normal padriio.
Usando essa informa\;ao, podemos generalizar resultados para distribui\;Oes amos
trais que tendem a ter uma forma normal.
Podemos dizer, com 95% de confian\;a, que urn intervalo de 1,96 desvio padrao em
tomo da media amostral contern a media populacional.
0 desvio padrao da distribui\;ao amostral e 0 erro padrao, e, se 0 multiplicarmos por
1,96, teremos urn intervalo de 95% confian\;a para a media populacional.
N. de T. Os autores estio se referindo aqui a distribuic,Oes amostrais de m~ias evidenlemenle.

.:.~

.",~,~~:~:.~;;";':i;"';"::c.";?:"

Coloque as variaveis relevantes no painel Dependent List (Lista dependente) e clique


na op\;ao Display Statistics (Mostra estatfstica). Para garantir que a cria\;iio de intervalos de
confian\;a, voce deve clicar no botao Statistics (Estatisticas). A seguinte caixa de diaIogo sera
apresentada.

130

Estatfstica sem Matemiitica para Psicologia

Christine P. Dancey & John Reidy

131

Descriptives (Medidas Descritivas)

Statsanxiety Mean (Media)


(Ansiedade
95% Confidence
Estatistica)
Interval for Mean
(Intervalo de Confian~a
de 95% para a Media)

lower Bound
(Limite Inferior)
Upper Bound
(Limite Superior)

5% Trimmed Mean (Media Interna de 5%)

Median (Mediana)

Variance (Variancia)

Std. Deviation (Desvio Padrao)

Minimum (Minimo)

Maximum (Maximo)

Range (Amplitude)

Interquartile Range (Intervalo Interquartil)

Skevvness (Assimetria)

Kurtosis (Curtose)

Voce deve estar atento ao fato de que 0 SPSSPW esta configurado para gerar intervalos
de confianc;a de 95% por omissao (default). Se quiser gerar intervalos com confianc;a dife
rente de 95%, deve ajustar 0 percentual para 0 desejado. Entretanto. geralmente nao tera de
fazer 0 ajuste. pois se espera que gere intervalos com 95% de confianc;a. Vma vez que tenha
certeza de que selecionou as oPC;Oes corretas. clique em Continue (Continue) seguido de OK
para gerar a saida. Eis urn exemplo de saida:

EXPLORE

3.6

Statistic
(Estatlstica)

Std. Error

(Erro Padrao)

55.6667

2.3190

49.7055
61.6279
55.7407
57.0000
32.267
51)804

.------

48.00
62.00
14.00
11.0000
-.426
-1.832

!'!l';I~lo de
h0:)~lian~

l-)4J~,~~~'lil.63)

.845
1.741

Diagramas de barras de erro


Gerar diagramas de barras de erro constitui uma boa maneira de apresentar intervalos
de confianc;a em pesquisas. A media e exibida como urn ponto sobre uma linha vertical. que
representa 0 intervalo de confianc;a. Quanto maior 0 intervalo. maior a linha que passa pela
media. A Figura 3.19 mostra os diagramas de barras de erro para os intervalos de confianc;a
que acabamos de calcular.
Na Figura 3.19. e facil ver a diferenc;a entre os intervalos de confianc;a quando 0 tamanho
da amostra aumenta de 6 para 100.

Case Processing Summary (Sum~rio do Processamento de (asos)

:';M~ia'

Cases (asos)
Valid (V~lidos)

Statsanxiety
(Ansiedade Estatistica)

Percent
(Percentual)

100.0%

Missing (Valores Perdidos)

Total

11

Percent
(Percentual)

Percent
(Percentual)

.0%

100.0%

"

A diStandaentre 0 .;,
infdo' ~ 0 fim das linhas'.
iglial amplitude .
do interValo
de confian91

7
5

Amostra de 6

Amostra

de 100

Medias e intervalos de confian~a para amostras de 6 e 100.

132

3.7

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia


100

Sobreposi~ao de intervalos de confian~a

Digamos que quisessemos descobrir se duas medias populacionais se diferenciam. Po


derfamos usar intervalos de confian~a para nos guiar. Por exemplo, imagine que voce queira
descobrir se as meninas oblSm melhores resultados do que os meninos em testes de matemli
dca. Voce administra uma prova de matemlitica para duas amostras, uma de meninos e outra
de meninas. Dessas duas amostras, calcula os intervalos de confian~a e obtem 0 diagrama de
barras de erro da Figura 3.20.
o que fazer com isso? Podemos ter 95% de confian~a de que as medias populacionais es
tlio dentro dos intervalos indicados no diagrama. Como existe uma considerlivel sobreposi~lio
entre os dois intervalos de confian~a, nlio podemos ter certeza de que exista diferen~a entre as
medias populacionais. Nlio parece provavel que haja uma diferen~a real nas popula~oes. ou
pelo menos nlio podemos perceber isso por meio de nossas amostras. Pode ser que meninos
tenham uma media populacional maior do que meninas, ou vice-versa. Pode ser tambem que
as medias populacionais de meninos e meninas sejam iguais. Nlio saberemos pelos intervalos
de confian~a apresentados na Figura 3.20 e, portanto, nlio poderemos obter conclus5es com
base nesses dados.
Agora, vamos supor que obtivessemos os intervalos de confian~a mostrados na Figu
ra 3.21. Qual seria a concluslio? Nesse caso, podemos ver que os intervalos de confian~a
nlio se sobrepoem. Podemos ter 95% de confian~a de que ambas medias populacionais
estiio entre os intervalos indicados e, portanto, nlio se sobrepOem. Isso sugere que existe
uma diferen~a real entre as medias populacionais, Parece, portanto, que as meninas se
saem melhor do que os meninos em testes de matematica. Voce pode ver que, examinando
os intervalos de confian~a, obtemos uma ideia clara do padrlio dos valores das medias
populacionais.

50

Meninos

Meninas

Diagrama de barras de erro da nao-sobreposi~ao de intervalos de confian~a para


meninos e meninas em testes de matematica.

,.. - .. ; ' : '

-,

100

50

~;~j;!j~Y>~~

:~~t;;t~:;i~

I
I
I

Meninos

Meninas

"::f:qi-'~:$"

;:i,f'

: ;~

,:~'-~_::"',;~.'t::,~~-

fl~~
',~,::,r,.:;~~'

,(~~,:,~~r
5

o'

133

Diagrama de barras de erro da sobreposi~ao de intervalos de confian~a para meninos e


meninas em um teste de matematica.

I1
~;i~ri~~" ~I_>;\!-.',.

..'

o '(~:J).=);
":-.-.

:'

134

Christine P. Dancey & John Reidy

[Ql'~"

135

Estatistica sem Matematica para Psicologia

Mova as variaveis relevantes para a caixa Error Bar (Barras de Erro), como ilustrado, e
entao clique em OK para gerar urn diagrama de barras de erro. 0 diagrama deve ser parecido
com 0 da Figura 3.22.
12

Para gerar urn diagrama de barras de erro com 0 SPSSPW, voce deve clicar no menu
Graphs (Gnificos) e depois selecionar a op~ao Error Bar... (Diagrama de Barras de Erro). A
seguinte caixa de dialogos sera apresentada:

loJ
;fl"

'"
'"'"
g
"0

... Parao .

d~ineameiitci.

(]

.. deniri! ..

<ft
ltl

p;,r#dA~..

'"

Seleaonl! est.!s

dullS ojJeS .

:J
2

.-

0
N=

6
WITH DOG
(Com

cachorro)

6
NODOG
(Sem

cachorrol

Diagramas de barras de erro para urn estudo de passeio de cachorros com delineamento
dentre participantes.
Voce pode ver no diagrama de barras de erro que existem barras separadas para cada
variavel dentre participantes. Se quer gerar diagramas de barras de erro com de
lineamento entre participantes, deve selecionar as op~oes Simple (Simples) e Summaries for
groups ofcases (Resumos para grupos de casos) na tela de op~oes inicial (ver a seguir):
condi~ao da

Da caixa de dialogo, as o~oes que voce escolher dependerao do delineamento do seu es


tudo. Se tiver usado urn delineamento dentre participantes e quiser comparar duas (ou mais)
variaveis, selecione as o~oes Simple (Simples) e Summaries ofseparate variables (Resumos
de variaveis separadas). Clique em Define (Definir), e a seguinte caixa de dialogos sera apre
sentada:

..

, ,

.Para 0
;dillf/1eamento

r t enir~~itidpantes;
,

seleaone,.estas . .

.dua~oPes
j,":. -.;;.' ...: ':/
~; .~o _~

Clique em Define (Definir), e sera apresentada uma caixa de dialogo urn pouco diferente
daquela apresentada para delineamento dentre participantes:

136

Christine P. Dancey & John Reidy

Estatistica sem MatemiHica para Psicologia

3.8

137

Intervalos de confian~a e outras estatfsticas


Ilustramos intervalos de confian"a em tome da media para demonstrar 0 uso dessa
tecnica. Voce deve notar que nao estamos restritos as medias quando trabalhamos com in
tervalos de confian"a. Podemos calcula-Ios para outras estatfsticas, incluindo 0 tamanho
real da diferenlfa entre duas medias, variincias e coeficientes de correlalflio. Explicaremos
isso em detalhes nos Capftulos 5 e 6. Caso exista uma estimativa por ponto, norrnalmente e
possfvel determinar outra por intervalo.
Eimportante lembrar que, se voce esti investigando diferen"as entre gropos, 0 intervalo
de confianlfa da magnitude da diferenlfa entre os glllPOs e utH. Se 0 intervalo de confian"a
incluir 0 zero, sugere a possibilidade de olio existir diferen"a entre os grupos na populalfaO.
Isso sera explicado com detalhes no Capitulo 6.

Exemplo da literatura:

processamento emotional e sindrome do panico

Voce notara que existe uma caixa para a variavel dependente (Variable - Variavel) e ou
tra para variavel de agrupamento (Category Axis - Eixo das categorias). Coloque a variavel
dependente na caixa Variable e a variavel independente na caixa Category Axis. Clique no
bollio OK para gerar 0 diagrama de barras de erro. Ele deve ser semelhante ao demonstrado
na Figura 3.23.
12
10J

I'j
g

iJ

'#.

:R

4
2.J
0
N=

WITHDOG
(Com 0 cachorro)

NODOG
(Sem 0 cachorro)

GROUP (Grupo)

~rama de barras de erro para 0 estudo de passeio de cachorro com delineamento

.....

ent;e participantes.

No Capitulo 2, descrevemos 0 estudo de Baker e colaboradores (2004), que comparava 0 con


trole emocional de urn gropo de pacientes com sfndrome do panico com 0 de dois gropos de controle
sem sindrome do panico (urn de Landres e outro de Aberdeen). Os pesquisadores concluirarn que
pacientes com sfndrome do panico tendiam a controlar mais suas emO'>Oes do que os dos gropos de
controle. Nesse artigo, os autores colocam os intervaIos de confian"a da magnitUde da diferen"a en
tre os gropos no escore total da Escala de Controle Emocional de Courtauds (CECS). Relatam, por
exemplo, que a diferenlfa da media entre 0 gropo com panico e 0 gropo de controle de Aberdeen foi
de 10,2 pontos, com urn intervalo de confian"a de 95% de 6,0 a 14,3. A diferenlfa da media entre 0
gropo com panico e 0 gropo controle de Londres foi de 13,4, com urn intervale de confian"a de 95%
de 9,9 a 16,8. Finalmente, a diferenlfa de media entre os dois gropos de controle foi de 3,2, com urn
intervalo de confianlfa de 95% de 0,06 a 5,9.

..[al!flf.IWt~~:~!!~

Agora que voce ja estli acostumado a realizar analises usando 0 SPSSPW, gostariamos
de apresentar uma caracterlstica muito uti) desse programa. Tooa vez que estiver com uma
safda do SPSSPW na tela, voce pode se vaIer de urn recurso denorninado Results Coach (ins
trutor de resultados) que serve de aUX11io na interpretalflio dos resultados de uma analise. Urn
dos problemas do SPSSPW enos fomecer, geralmente, mais informalfOes do que, de fato,
precisamos. Tentar decidir 0 que e relevante nos resultados apresentados consiste em uma
dificuldade para alunos sem experiencia com 0 programa. 0 instrutor de resultados pode ser
bastante util nessas situalfoes.
Para ativar 0 instrutor de resultados, e necessario ter algurna saldana tela hemos demons
trar essa caracterlstica com os resultados de uma analise descritiva da variavel "ansiedade
estatfstica" que apresentamos no infcio do capftulo. Com a tabela Descriptives (descritivas) na

138

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

tela, posicione 0 cursor em qualquer lugar sobre a tabela e clique no bomo direito do mouse. Urn
menu de o~i5es deve ser apresentado, como a seguir.

139

Voce pode usar esta caracteristica como ajuda somente com tabelas que 0 SPSSPW pro
duz. Esse recurso oao funcionara com diagramas como os de barras de erro e os de dispersao.
Para fechar 0 instrutor de resultados, clique 00 botao Close Window (fechar janela), que
eo botao x. Isso devera leva-Io de volta para a tela de saida do SPSSpw.

Resumo

...,
51aII1I'*'t

S1d.EnOf
2 )1900

"'ran
95.. ConldlN.

InIIMIbMean

.........

Uppff80und

"

Bl en,

.-

55.""

'~T_....

+11
"'...
o..on
~
i:L~~~~iLa~~~~~~:'~:iL!I_,:~~.;,-~ ~~~
......

31m

SId

z.t~;~""IiIii@'

'Selecione Results
::Coadi.(iilstrutor
. i de,resultados)
~.~i~,pa'rtir ".
. de5te menu

5.68038

".""".

--

.i

_ .. \A,~.....

~~~~!e~~.~",.
.' m9U~'SClbre,~'

'j,'

;<i.,~.~">!!;,,,:
"Ii e'r\b .. ~. .

..

., (.

~ .

._ ".

botio . ~.I.~eito

Voce deve enta~ c1iear na o~ao Results Coach (instrutor de resultados) para ativar 0 ins
trutor. Aparecerao urn exemplo da saida e uma descri"ao do conteudo da tabela. Voce notara
que no canto inferior direito da tela encontram-se os boti5es da navega"ao que descrevemos no
Capitulo I quando mostramos os tutoriais. Se c1iear na seta adireita, sera levado, passe a passo,
pela tabela e tera uma breve descri"ao dos conteudos. Isso pode ser uul para ajuda-io a decidir
em quais infonna"Oes voce precisa prestar mais aten"ao.

Tabela~.pl~
.
' . -".> ...:. - . -'
~'.

....

.....
--

ts"cor*'tl'lU

~.

.......

c:'1 =:
l.oIIIf~
l.JDpIr Ibn:!

1301,112
Ut5.1Kl8

5'10 TrWntr* Me....

5391.553
"-52,751
..-G4,43$

....
-..

sm.8OG

1]38,000

189,531
1119,000

120J,.JM
1113,000

......

1r*l~""RiltlQe

SIcftIone.s

""""'"

Probabilidades podem ser representadas em tennos de razoes (p. ex., I em 5), decimais
(0,2) ou percentagens (20%).
Probabilidades condieionadas sao probabilidades de urn evento que depende da ocor
rencia de outro evento.
Podemos usar a distribui"ao nonnal padrao e os valores z para descobrir a propor"ao
da popula,.ao que esta acima ou abaixo de urn certo valor ou que estci situada entre
dois valores.
Se constituirmos muitas amostras de uma popuIa"ao e plotannos suas medias
como urn histograma de freqiiencias, teremos detenninado a distribui"ao amostral
da media
Quanto mais amostras tivennos e quanto maiores forem, mais provavel e que a distri
bui"ao amostrai da media se aproxime de uma distribui"ao nonnal, nao importando a
distribui~o da popula"ao.
0 desvio padrao da distribui"ao amostral da media e 0 erro padrao da mesma, e esse
valor nos da uma indica"ao de como as medias das amostras variam em rela"ao a
media populacional.
0 erro padrao e aproximadamente igual ao desvio padrao da amostra divido pela raiz
quadrada do tamanho da amostra e deve ser muItiplicado por urn valor z para produ
zir intervalos de confian"a.
Intervalos de confian"a nos dao urn conjunto de valores no qual podemos ter 95% de
confian"a de que contenha a media populacional.
Podemos ilustrar convenientemente intervalos de confian"a usando graficos de barras
de erro.

lns.152

U2Ul,
1211.2

IirfItMI tw Me....

Nesse capitulo, explicamos vanos conceitos importantes, basilares para urn entendimento
completo da estatistica. Sendo mais especificos, voce'deve ter aprendido que:

$8'7.500

11.350.000

$501.500

11.137,000

171."00

12'8.000

Ull7
S 261

1.511
2471

Exercicios para

SPSSPW

'. Breve

: .!;leScri~ao
, dO. conteudo .
~'atiJbeia

,,' 'Botoes de .
_ _~I--- .. n~~ega~ao .

Exercicio 1
Em urn consult6rio de cirurgia dentaria, a enferrneira Nasher e 0 Dr. Payne dec idem
que querem tentar reduzir os niveis de ansiedade de pacientes em tratamento. Decidem
que a melhor maneira de fazer isso seria isolar acusticamente as salas de espera a tim de
que os pacientes que aguardam nao poderem escutar os gritos dos pacientes sendo tra
tados. Para ter certeza de que as paredes prova de som realmente reduzem ansiedade,
isolam acusticamente apenas uma sala de espera e comparam com a ansiedade de pa
cientes que esperam na sala que nao e a prova de som. Pacientes sao colocados nas duas
salas a1eatoriamente quando chegam e preenchem urn questionario enquanto aguardam.

140

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

o questionario fomece urn escore baseado em varios aspectos de ansiedade associ ados it

I. Que tipo de delineamento e este estudo: quase-experimental ou experimental?

ida ao dentista: quanto maior 0 escore, maior 0 nlvel de ansiedade. A enfermeira Nasher e
o Dr. Payne esperam que haja uma diferen~a nos escores de ansiedade entre os pacientes
das duas salas de espera. Abaixo seguem os escores de ansiedade dos pacientes de cada
urna das salas de espera:

2.

f~

~~\-N;
12
II

16

26
20
21
19
20
22
18
20
17

8
4
3

13
10
10

9
II

I. Esse e urn delineamento entre ou dentre participantes?

2. Coloque os dados da tabela acima no SPSSFW e obtenha as seguintes estatlsticas


para cada grupo:



amedia
0 desvio padriio
0 erro padrao
intervalos de contian,.a de 95%

(a) Use SPSSFW para gerar gnificos de barras de erro para cada urn dos grupos.
(b) Converta 0 primeiro escore em cada condi,.ao para urn valor z.

Exercicio 2

o Dr. Doolittle final mente desisliu da ideia de conversar com animais e decidiu tomar-se
urn psic610go experimental de animais. Ele estA particularmente interessado em descobrir se os
gatos sao ou nao mais inteligentes do que os cachorros. Para isso, desenvolve urn teste de inte
Iigencia especffico a esse estudo e testa amoslras de gatos e cachorros. Poi cuidadoso para nao
introduzir qualquer lipo de tendenciosidade no teste e acredita ter criado urn teste dissociado
de especies, que pode ser usado em qualquer esCie. 0 Dr. Doolittle acredita que haveni uma
diferen~a entre os escores de gatos e cachorros. Os escores estlio na tabela a seguir.

Eurn estudo entre ou dentre participantes?

3. Coloque os dados da tabela acima no SPSSPW e obtenha as seguintes estatfsticas


para cada grupo:
a media

~ ~::~a:~ao

intervalos de contian,.a de 95%

(a) Use SPSSPW para gerar graticos de barras de erro para cada urn dos grupos.
(b) Converta 0 primeiro escore em cada conai,.ao para urn valor z.

QUESTOES DE MULTIPLA ESCOLHA


I. Qual e 0 valor da probabilidade I em 5 expressa
como percenlagem?
(a) 14%

(b) 25%
(c) 20%
(d) 32%
2. Qual e a rela~ao entre tamanho amostraJ e erro
amostraJ?
(a) Quanto maior 0 tamanho amostraJ, maior 0
erro amostraJ
(b) Quanto maior 0 tamanho amostraJ, menor 0
erro amostraJ
(c) Tamanho amostraJ e igual a erro amostraJ
(d) Nenhuma das resposlaS esta correia
3. Se tivennos um intervalo de 95% de confian~a de
3 2, 0 que isso significa?
(a) A media populacional esta definitivamente
entre I e 5
(b) Temos 95% de certeza de que a media popu
lacional esta entre 3 e 2
(c) Temos 95% de certeza de que a media popu
laeional esta entre I e 5
(d) Nenhuma das resposlaS esta correta
4. Quais sao os escores na distribuio normal pa

~::\r::s~;il!:~*J:r~~~iE:0; ~'.:;< ~r~/:~~~~


95

116

100
104

112
102

78

96

I~

III

124

89

131

114
102
97

117
107
110

141

delio?
(a) Escores extremos
(b) Valores z
(c) Escores de desvio padrlio
(d) Altemativas (b) e (c)
5. 0 erro padrlio e:
(a) A raiz quadrada da media
(b) 0 quadrado do desvio padrao
(c) 0 desvio padrlio dividido pela media
(d) 0 desvio padrlio dividido pela raiz quadrada
do numero de participantes na amostra

6. Se voce tem uma probabilidade de 33%, como ela


e expressa em decimal?
(a) 0,033
(b) 0,33
(c) 0,23
(d) 0,133

7. 0 erro padrlio nos informa:


(a) 0 grau com que a nossa media amostraJ difere
da media das medias amostrais
(b) 0 grau com que nossa media amostraJ difere
da media populacional
(e) 0 grau com que 0 desvio padrlio difere da me
dia populacional
(d) Altemativas (a) e (b)
8. Pelo que multiplicariamos 0 erro padriio para che
garrnos a intervalos de confian~ de 95%?
(a) 95

(b) Raiz quadrada do tamanho amostraJ


(e) Desvio padrao
(d) 1,96
9. Se voce tivesse urn valor z de 2,33, significaria que:
(a) Seu escore esta 2,33 desvios padrOes acima
da media
(b) Seu escore esta 2,33 desvios padrOes abaixo
damedia
(c) H<i uma probabilidade de 2,33 de obter urn
escore maior do que 0 seu escore
(d) Ha uma probabiIidade de 2,33 de obter urn
escore menor do que 0 seu escore
10. Se urn evento tem uma probabilidade de 95% de
ocorrer, 0 que isso significa?
(a) 0 evento tem a probabiIidade de ocorrer 5 ve
zes a cada 100
(b) 0 evento tern a probabilidade de ocorrer 95
vezes a cada 100
(c) 0 evento tern a probabilidade de ocorrer 95
vezes a cada 95
(d) Nenhuma das resposlaS esta correta

142

Christine P. Dancey & John Reidy

II. Qual carreira voce deve escolher se seus escores


de levanlamento de pesos e ceni.mica sao:
Levanlamento de pesos: escore 52
(media amostral =55, desvio padni.o = 12)
Ceramica: escore 50
(media amostral =58. desvio padrao =32)
(a) Levanlamenlo de pesos
(b) Ceni.mica
(c) Qualquer uma das duas. pois ambas sao igual
menIe boas quando comparadas com suas
respeclivas popula~iies
(d) Nenhuma das duas, pois voce e lerrfvel em
ambas
12. Quais das frases a seguir sao verdadeiras quanto
estatislica inferencial?

(a) Simplesmente descreve nossos dados


(b) E usada para se oblerem conclusiies dos da
dos amostrais sobre popula~iies
(c) E usada para fazer a psicologia parecer cienti
fica
(d) Eusada para se obterem conclusiies das popu
la~iies sobre amostras
13. Se voce obtiver urn escore de 13 em urn ques
lionario sobre ansiedade e souber que a media
populacional e desvio padrao sao 20 e 5. respecti
vamente. qual e 0 seu valor z?
(a) -2.33
(b) -1,4
(c) 1,33
(d) 0

14. Se voce possui uma popula~ao de escores que lem


uma dislribui~ao plana (nao-normal), enta~ a dis
tribui~ao de muilas medias amostrais sen!.:
(a) Plana
(b) Bimodal
(c) Negalivamente assimetrica
(d) Normal
15. Qual das seguintes altemativas da a melhor esti
maliva da media populacional?

(a)
(b)
(c)
(d)

A media amostral
A media de varias medias amostrais
0 desvio padrao
0 erro padrao

Teste de Hip6teses e Significancia


Estatfstica

16. Obtivemos urn desvio padrao de 42 e urn lamanho


amostral de 16 para urn grupo de dados. Qual e 0
erro padrao?
(a) 0.339
(b) 2.95
(c) 21.68
(d) 10.5

17. Se voceconstituir looamostras de uma popula~ao


e plolar lodas as medias como urn hislograma de
freqiiencia. voce oblem:
(a)
(b)
(c)
(d)

Panorama do capitulo

A distribui~ao de medias
Uma distribui~ao assimetrica
A distribui~ao amostral
Nenhuma das respostas esta correIa

No Capitulo 3, mostramos a voce 0 usa da inferencia estatistica. Neste capitulo. iremos urn
pouco alem, a fim de explicar como podemos aplicar nosso conhecimento de probabilidades e
distribui~6es amostrais para testar hipoteses estabelecidas em nossas pesquisas. Especificamente.
explicaremos 0 seguinte:

18. Dado urn erro padrao de 5,2 com uma amostra de


9, qual eo desvio padrao?
(a)
(b)
(c)
(d)

a logica do teste de hipoteses


a significancia estatistica e como ela se relaciona com a probabilidade
como as distribui~6es de probabilidade formam as bases dos testes estatisticos
os problemas associados tomada de probabilidades como base para conclus6es (erros
dos Tipos I e II)
as hipoteses unilaterais e bilaterais, e como se escolhe 0 teste apropriado

1.73
15.6
46.8
0,556

19. Para qual das seguintes allemativas voce nao po


deria gerar intervalos de confian~a?
(a)
(b)
(c)
(d)

Uma media
Urn coeficienle de correla~ao
A diferen~a da media entre escores
Nenhuma das respostas esta correta

20. Se voce tern uma popula~ao negalivamenle assi


metrica, qual e 0 formato da distribui~ao amostral
das medias das amostras dessa popula~ao?
(a) Negativamente assimetrica
(b) Positivamente assimetrica

(c) Normal
(d) Nao e possivel saber

Referencias
BAKER, R. et al. Emotional processing and panic. Behaviour Research and Therapy v. 42. n. II. p.
1271-87, November 2004.
BECK, A. T., et al. An invenlory for measuring depression. Archives of General Psychiatry. v. 4. p.
561-71. 1961.
WALSH. J. J., UGUMBA-AGWUNOBI, G. Individual differences in statistics anlliety: the roles of
perfeclionism. procrastination and trait anlliely. Personality and Individual Differences. v. 33. p.
239-51. 2002.

4.1

Outra forma de aplicar probabilidades

apesquisa: teste de hip6teses

Suponha que estejamos interessados em examinar a rela~ao entre 0 numero de horas de


estudo por semana e a nota de uma prova. Poderfamos, talvez, predizer que quanta maior 0
numero de horas de estudo semanais, maior a nota na prova. Estabelecerfamos, assim, uma
previsao a se testar pela realiza~ao de urn estudo. Neste estudo, sortearfamos aleatoriamente
certo numero de estudantes, registrarfamos quantas horas por semana estudam e verifica
rfamos se estas horas estao relacionadas 11 nota da prova. De acordo com a previsao feita,
esperarfamos que a popula~ao das notas se assemelhasse 11 ilustrada na Figura 4.1. Aqui voce
pode verificar que existe uma tendencia indicando que, quando 0 mimero de horas de estudo
aumenta, ocorre 0 mesmo com a nota. Vamos pressupor que isso ocorra com a popula~ao
subjacente. Na realiza~ao de uma pesquisa, as amostras selecionadas podem nao constituir
uma representa~ao acurada da popula~ao - e urn dos problemas enfrentados. No Capitulo 2,
explicamos que, devido ao erro amostral, a amostra pode nao ser semelhante 11 popula~ao. A
Figura 4.1 ilustra tres amostras retiradas da popula~ao apresentada na mesma figura. Voce
deve notar que, mesmo existindo uma rela~ao positiva entre as duas variaveis na popula~ao,
duas das amostras nao refletem isso. De fato, uma das amostras sugere urn relacionamento
negativo entre as horas estudadas e 0 desempenho na prova (com 0 aumento das horas estu
dadas, 0 desempenho na prova piora). Outra amostra sugere que nao existe relacionamento
algum entre as duas variaveis. A terceira amostra reproduz a popula~ao corretamente, su
gerindo urn relacionamento positivo entre as duas variaveis. Deve-se notar que, embora a
popula~ao apresente urn relacionamento, a amostra constituida pode nao refleti-lo.

144

Christine P. Dancey & John Reidy

Amostras

100

(a)

80
~

!!Q. 60

Popula~ao

)::~

100 I

100

'">e

rP

Q.

'"

0
0

o
o

~
0

00
00

40

0
0

20

00
00 0

30

40

50

60

70

(b)

'"
e
60

-tj

0
00
000

o 0
o
o 0

40

20

000

0
0

00
0

01
0

0
00
o 0

20

Horas estudadas por semana

80
00
0

ODD D

60

10

~
---,

de escores

80

0
00
00
0
00 0
0 00

00

10

20

30

40

50

Horas estudadas por semana

60

70

"00

10

20

30

40

50

I (c)

70

80

e
'"c

60

Horas estudadas por semana

60

o
o

Q.

~
0

40
00

20

o
o

oI
o

10

20

gil

30

40

50

60

70

Horas estudadas por semana

~ de dispersao das possiveis amostras selecionadas de uma popula)ao com um


rela~ionamento positivo entre 0 numero de horas de estudo e a nota na prova.

---

De uma olhada agora na Figura 4.2. Neste exemplo, nao existe relacionamento entre
o numero de horas de estudo e a nota na prova da populaerao. Novamente, apresentamos
tres amostras. Uma vez mais, somente uma das amostras reflete acuradamente a popula
er ao . 0 fato eque, devido ao erro amostral, as amostras que utilizamos podem nao refletir
de forma fiel a populaerao de onde foram retiradas. Para cada populaerao que tivermos,
cada urn dos padroes amostrais apresentados teni uma probabilidade maior ou menor de
ocorrer, e 0 valor desta probabilidade dependeni do tamanho da amostra utilizado. Assim,

Diagrama de dispersao das possiveis amostras selecionadas de uma popula)ao sem


relacionamento entre 0 numero de horas de estudo e a nota na prova.
para a populaerao da Figura 4.1, teremos uma probabilidade maior de observar 0 padrao
da amostra (c) do que nas amostras (a) e (b), particularmente com valores de tamanho
de amostra razoavelmente grandes. Para a populaerao apresentada na Figura 4.2, teremos
uma probabilidade maior de observar 0 padriio da amostra (b) do que nas amostras (a) e
(c). Voce precisa estar ciente de que, algumas vezes, devido ao erro amostral, obteremos
padroes nas amostras que nlio refletem de forma acurada a populaerao de oode as amostras
foram retiradas.

146

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Padrao de valores na amostra


100
D

..e
>

80
D

60

40

c:

D
DD

20

D
D

...l:L......r

0
0

10

20

30

40

50

60

70

Horas estudadas por semana

I
Padrao na

De que popula~ao
e mais provavel que a
amostra tenho side retirada?
(al

popula~ao

Padrao na

100

popula~ao

.e
..
15
>

0-

c:

Dtf'
D

"]
60

D D

DD

'b

>

0-

D
D

.e
.<5.

DD~

D
D

rP
D

D
D

40

80

8
D
D
DD
DD

40

D
DD

DD

DD

20 ~

20

D
D

10

20

30

40

50

60

Horas estudadas por semana

I
70

oI
0

D
DD

10

20

30

40

50

dos valores na amostra e verificar qual 0 mais provavel para a popula<;ao que a fomeceu.
Assim, dado 0 padrao observado na amostra da Figura 4.3, podemos argumentar que 0 padrao
na popula<;ao (b) e mais plausfvel do que 0 apresentado em (a). Nas Figuras 4.1 e 4.2, contu
do, as amostras nao necessariamente refletem de fonna acurada a popula<;ao de onde foram
retiradas. Assim, precisamos de algum meio para avaliar a probabilidade de que a amostra
selecionada seja urn retrato tiel da popula<;ao.
Os testes estatfsticos nos servirao de auxfJio nesta decisao, mas isso ocorre de uma forma
nao de todo intuitiva. 0 que urn teste estatfstico faz e determinar uma probabilidade, deno
minada de valor p. Este valor nos informa sobre a maior ou menor possibilidade de obtennos
o resultado devido ao erro amostral caso nao exista relacionamento entre as variaveis da
popula<;ao. Por exemplo, os valores p informarao a1frobabilidade de obtermos 0 padrao de
valores na amostra da Figura 4.3 na popula<;ao (a). Se 0 padrao em nossa amostra e altamente
improvavel de ser obtido devido ao erro amostral na popula<;ao (a), entao concluiremos que
provavelmente e a (b). Voce deve notar que esta probabilidade e, de fato, condicionada. E a
probabilidade de obtermos a nossa amostra se nao existir relacionamento entre as variaveis
na popula<;ao.
o teste de hip6teses e visto muitas vezes como uma competi<;ao entre duas hip6teses:
entre a nossa hip6tese de pesquisa (de que existe rela<;ao entre as horas estudadas e a nota
na prova) e outra afirma<;ao denominada de hipotese nula (de que nao existe relacionamento
entre as duas variaveis). Assim, 0 processo de teste de hip6teses se assemelha a Figura 4.3.
Precisamos decidir entre a popula<;ao (a) e (b). Nesta situa<;ao, a popula<;ao (a) representa a
possibilidade de a hip6tese nula ser verdadeira, e a popula<;ao (b), de a hip6tese de pesquisa
ser verdadeira. 0 teste estatfstico que utilizamos indica qual e a probabilidade de observar
mos 0 padrao de dados se a hip6tese nula for verdadeira. Na Figura 4.3, provavelmente 0
padrao dos dados amostrais teria uma probabilidade bastante baixa de ocorrer como conse
qiiencia do erro amostral se os dados fossem retirados da popula<;ao (a), na qual nao existe
urn relacionamento entre as duas variaveis. De fato, essa probabilidade menor do que I em
1000. Nesse caso, selia mais sensato conduir que os dados foram retirados de uma popula<;ao
que seja identica 11 (b).
Agora, vejamos 0 cenario representado pela Figura 4.4. Relembre que tudo 0 que esta
acima da linha pontilhada consta em nosso estudo, e tudo 0 que esta abaixo da linha e des
conhecido. Aqui voce devem ser capaz de ver que a amostra parece sugerir a inexistencia
de urn relacionamento aparente entre 0 numero de horas de estudo e a nota na prova. Intui
tivamente, esperariamos que esta amostra tivesse side retirada da popula<;ao (a) em vez da
popula!11io (b). No entanto, apelando novamente para a Figura 4.1, voce deve ser capaz de
ver que, mesmo quando nao existe relacionamento entre as duas variaveis na popula!1ao,
temos a possibilidade de que uma ocorra na nossa amostra. Essa ausencia de relacionamento
na amostra seria uma conseqiiencia do erro amostral. Desta fonna, novamente n6s utiliza
remos os testes estatfsticos inferenciais como auxfJio na escolha entre as duas hip6teses: a
nula, representada pela popula<;ao (a), e a de pesquisa, representada pela popula!1ao (b). 0
teste estatistico informara sobre a probabilidade de obtennos em nossa amostra 0 padrao
ilustrado na Figura 4.4, caso a popula!1ao seja semelhante ao padrao mostrado em (a), isto
e, se a hip6tese nula for verdadeira. Neste caso, M uma alta probabilidade de obter 0 padrao
observado na nossa amostra se a hip6tese nula for verdadeira: existe uma probabilidade de
61 % de obter tal padrao de uma popula~o semelhante a mostrada em (a). Existem outras
quest6es, entretanto, que precisamos considerar antes de podermos chegar a uma conclusao,
como, por exemplo, se existem participantes suficientes na nossa amostra (veja Se<;ao 4.9 e
Capftulo 7).

DDD

DD
i

D
DD
D D

DCD C

D
D

I
0

DD
D

DDD D

60

c:

D
D
D

(bl

100

60

70

Horas estudadas por semana

Diagrama de dispersao das possiveis populac;oes alternativas quando um


relacionamento observado na amostra.

Constitui urn dos problemas enfrentados quando conduzimos uma pesquisa 0 fato de
nao sabennos qual e 0 padrao existente na popula!1ao de interesse. De fato, 0 motive de
realizarmos a pesquisa e, em primeiro lugar, detenninar este padrao. Estamos tentando ob
ter conclus6es sobre a popula!1ao a partir das amostras. Essencialmente, estamos em uma
situa!1ao semelhante 11 i1ustrada na Figura 4.3. Nesta figura, tudo 0 que esta acima da linha
pontilhada tern a ver com 0 que observamos em nosso estudo, e tudo 0 que esta abaixo da
linha e desconhecido. A partir do padrao que observamos na amostra, precisamos decidir
sobre os possfveis padroes que refletem a popula<;ao; contudo, apresentamos apenas dois
deles na figura. A partir da amostra, precisamos decidir acerca de como e a popula<;ao. Aqui
utilizaremos testes estatfsticos inferenciais. Efetivamente, 0 que faremos e observar 0 padrao

147

148

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia


Padrao de valores na amostra

nao existe relacionamento entre ambas. De fonna semelhante, se voce esta interessado em
comparar gropos de pessoas, e a hip6tese de pesquisa declara que ha uma diferen~a entre os
dois gropos, a hip6tese nula afinna que nlio existe diferen~a entre os dois gropos.
Quando ler publica~6es sobre psicologia, encontrara autores que sugerem que a hip6tese
nula nlio pode ser rejeitada. Isso simplesmente significa que a probabilidade calculada indica
que manter a hip6tese nula e a concluslio mais sensata. Se voce ler que 0 pesquisador rejeitou
a hip6tese nula, significa que a probabilidade de abter os resultados encontrados se a hip6
tese nula fosse verdadeira e tao pequena que se torna mais sensato acreditar na hip6tese de
pesquisa (altemativa). Como indicamos anteriormente nesta s~lio, isso ilustra a competi~lio
entre as hip6teses nula e de pesquisa. 0 fato de essa abordagem de pesquisa ser denominada
Testagem da Hip6tese Nula (THN) ou Teste de Signif1cancia da Hip6tese Nula (TSHN) refle
te a importancia da mesma.

100
o

80

'"
e

60

40

>

c..
'c"
0

20

0
0

10

20
30
40
50
60
Horas estudadas por semana

De que

popula~o

e mais provavel que a

70

4.3

amostra tenho side retirada?

Padrao na

popula~ao (a)

Padrao na

100

orP

00

ec..'>"

'"
c

M]

60

formular as hip6teses;
medir as variaveis envolvidas e examinar 0 relacionamento entre elas;
calcular a probabilidade de obter tal relacionamento se nlio existir rela~ao alguma na
popula~lio (se a hip6tese nula for verdadeira);
se esta probabilidade calculada e suficientemente pequena, sugere que 0 padrao en
contrado e improvavel de ter se originado por acaso e, desta forma, provavelmente
reftete urn relacionamento genuine na popula~lio.

rP
80

orP

0
0

z 40

00

00

'"

~
z

0
0

10

0
0

20

20
30
60
40
50
Horas estudadas por semana

00
0

oI

70

0
i

10

00
00 0

ce

o 0
00
o 0

00
00

40

00

0
00

60

00

20 oj

e
c..

0
0

0
0

popula~ao (b)

0
0

Co

00
0

00
I

60
50
20
30
40
Horas estudadas por semana

Diagrama de dispersao das populal;oes alternativas subjacentes quando nao


relacionamento na amostra.

L6gica dos testes de hip6teses


Se voce entendeu a se~lio anterior, nlio tera problemas para entender a 16gica geral por
tras dos testes de hip6teses, que e a seguinte:

100
0

149

70

e observado

Colocando de outra forma, se nlio existe urn relacionamento real na popula~ao, e impro
vavel que voce encontre urn na sua amostra selecionada aleatoriamente. Desse modo, se voce
achar uma rela~o na arnostra, e provavel que ela reflita urn relacionamento na popula~lio. E
importante que voce entenda isso. Assim, va corn calma e tenha certeza de que entendeu 0
que foi exposto ate aqui.
teste de hip6teses nlio se lirnita a investigar 0 relacionamento entre duas variaveis. Se
voce esta interessado ern estudar difere~ entre gropos, pode tarnbem utilizar 0 teste de
hip6teses. A 16gica e mais ou menos a rnesma exposta anteriorrnente. Por exemplo, suponha
que projetarnos urn ensaio no qual oferecemos aos aIunos duas formas de estudo estruturadas,
que se diferenciam apenas na quantidade de horas que precisam estudar. Urn gropo estuda
40 horas por semana, enquanto 0 outro gropo estuda apenas 10 horas por semana (esta a
variavel independente). Vamos supor que os que estudarn 40 homs tenham notas mais altas na
prova do que os demais. Esta sera nossa hip6tese de pesquisa. A hip6tese nula correspondera
it inexistencia de diferen~a entre as medias das notas dos dois gropos. Uma vez coletados os
dados, podemos verificar se existe diferen~a entre as notas medias dos dois gropos. Se tal
diferen~a existir, enta~ precisamos detenninar a probabilidade de que se origine unicamente
do erro amostral, isto e, da probabilidade de obtennos urna diferen~a do tarnanho observado
se a hip6tese nula for verdadeira. Se esta probabilidade e pequena, faz sentido considerar que
as diferen~as se devem it manipula~lio da variavel independente, ern vez de unicamente ao
erro amostral.

4.2

Hip6tese nula
Apresentarnos brevemente urn conceito importante que precisa de explica~Oes adicionais.
A hip6tese nula muito importante para 0 processo da testagem de hip6teses. Explicamos an
terionnente que a probabilidade calculada nos testes estatisticos se baseia na hip6tese de que
nao existe relacionamento entre as duas variaveis na popula~lio. Esta suposi~ao e a hip6tese
nula. Se a hip6tese de pesquisa (as vezes denorninada de hip6tese experimental ou altema
tiva) declara que ha relacionamento entre as duas variaveis, enta~ a hip6tese nula afinna que

150

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

~ri~~~$E5ia~ff

~.~ii;bllf.im;i~~d;'1'11~.~~~~)I!Q!~!:'
.
~i!) i':;'ji1ji!lI~~~'!"tt'1~!{li:f~;.a,%;t'f.;l';!I~ ~.ij~;'~)~~~oIJ<'j:.t.lIi!l-'.A:' ,!. .
: ... :..... . : ~ CX~. ~: I"revEHeOUe exJsta.. u~ (jlter!~. e!1,tre hOmenSi2 mu ~.es. na naB,W ade .espaclal.: .
fit<lPr'f~~~<,,:~:t.'Mx"\'{~t<;:ht:'t. m:ial"t
"tl&?l.U::;nt;l,~~'I1j~I~,.'QC;lJrt 'r'd' ' ' W1 fi(l:"'u:;~ ,,: d'
. :."..,. '.\.:"'.0;''':.' 'l'Tev~Y6ea qua f aae. e~ ~Ol.conslimlaa este.a.re acro.na a:co:o numero e
. ~.;'f ~~~,n~--'""J ~~t- :.,,~~._,;. ~~""...."t~f.';' :r."~ s-tt"-j::J1J.-J!~j/!-i1--1J: etA,(.r) .. "Tt1J~- ...~ "L,;,L1-f' ,..::1"'.. .t..'1:-: .

~. ~~~~~:~.; ~.t:~~.". ~ ~./-<'.-'~i~..,I,~tt~t~~~~~ l~~~~~i;!~. j~~~,~~~ci~: ~:~~k.t::~~l~~~;~.~~.:~.~'~~lt ..~'~:'~j~~:;:;.. :.::l;~;~I~.~~J;;',;/.,~~;.~ ~ .


"~"7 "-~''-~.::'~, '. prev~"q1Je'Os'tempdfae fa.~~~Jam ~.ITeH;;ntes ~n~re:r,artidpameS queestao es
L

L'O~'[{'l~:~~t.,;+:q
>:l. '

!-;;.

~"1. :."

'.

151

~m~r~~-?~rl~~~tJ~~*~t;i~~~~t~j~j.:~:~~~.tit;;

or;

~:J(1;0", I -~

~~~~~~:
:'," ::

;iJ:r.~ i~/~?ri!T~f-{

.'~;;:~::_~~~;~;:~~;~r;:s~t~~~;~~;~~;~:';i:e;;~~:~:~~$I~;~;~;~~~~~:,~~;~i~asouviremos

',,';

PONTO DE DISCUSSAO: CRiTICAS


CONTRA OS TESTES DE HIPOTESES
Embora 0 teste de hip6teses seja a abordagem dominante na psicologia. existe agora
um sentimento crescente de que seja inadequado em tennos de fomecimento de percepc;oes
uteis das variaveis que os psic610gos desejam investigar. Por exemplo, ao referir ao teste de
hip6teses, Loftus (1991) coloca: "Tenho dificuldade em imaginar um meio mais ineficiente
de transitar dos dados para as conclusOes". Loftus (1991, 1996) descreve muitos problemas
associados ao uso dos testes de hip6teses. Queremos destacar dois. Se voce quer saber mais,
existem duas referencias no fim deste capftulo.
Um dos principais problemas destacados por Loftus se relaciona a hip6tese nula. Quando
observamos a diferenc;a entre duas condic;Oes, temos de calcular a probabilidade de obtermos
nossa diferenc;a por acaso, se a hip6tese nula for verdadeira. Lembre que a hip6tese nula de
clara que nao existe diferenc;a entre as duas condic;Oes. 0 problema desta hip6tese e que em
poucos casos, em qualquer ciencia, nao existirao diferenc;as entre duas condic;oes. E pouco
usual encontrar duas coisas que sejam exatamente iguais, mesmo em fisica; dessa forma,
basear nosso julgamento probabilfstico em tal hip6tese nula pode ser seriamente enganoso.
Esse ejustamente 0 ponto essencial da crftica feita por Loftus, e ja serve para ilustrar uma das
objec;Oes que ele faz.
Eis 0 segundo problema destacado por Loftus: embora registremos, com alguma con
fianc;a, que encontramos uma genufna diferenc;a entre nossas duas condic;oes e relatemos a
medida dessa diferenc;a, os psic610gos nonnalmente infonnam pouco sobre as medias das
populac;oes das duas condic;Oes. Loftus argumenta que 0 teste de hip6teses nos desvia de pen
sannos sobre as medias populacionais. Sugere que podemos evitar essa annadilha relatando
de fonna rotineira intervalos de confianc;a em nossos relat6rios de pesquisa.
Mesmo que existam tais tipos de crftica ao procedimento de testar hip6teses, isso nao
significa que tal abordagem deve ser abandonada completamente; melhor, devemos ter um
entendimento completo do seu significado para podennos nos beneficiar desta tecnica. Isso
eo que esperamos dar a voce neste livro. Dessa fonna, em conjunto com os testes estatfsti
cos que nos auxiliam a testar as hip6teses (p. ex., 0 teste t), voce deve, como Loftus sugere,
acrescentar estatfsticas descritivas e intervalos de confianc;a rotineiramente. Uma forma util
de apresentar intervalos de confianc;a e a geraC;ao de diagramas de barras de erro e sua apre
sentac;ao em nossos relat6rios. Mostramos a voce como sao tais diagramas no Capftulo 3.

4.4

Nivel de significancia
Muitos de voces, nesta altura, podem estar pensando que tudo isso e bom e esta bem,
mas como decidimos que a probabilidade que calculamos no teste de hip6teses e suficien
temente pequena para que rejeitemos a hip6tese nula? Essa e uma excelente pergunta que
ainda nao tern uma resposta definitiva Muitos psic610gos e mesmo muitos peri6dicos res
peitaveis da area utilizam a convenC;ao de que uma probabilidade de 5% e suficientemente
pequena para servir como urn ponto de corte. Considerando a hip6tese nula verdadeira, se
a probabilidade de urn dado efeito e menor que 5% (0,05 ou I em 20), entao fomecemos
urn suporte razoavel para a nossa hip6tese de pesquisa. Isso significa que, se voce conduz
o estudo 20 vezes, somente uma vez nestes 20 estudos um relacionamento (ou diferenc;a)
tao grande quanto a que foi observada aparecera por acaso se a hip6tese nula for verdadeira.
Como esta probabilidade ebaixa, podemos concluir com razoavel confianc;a que um relacio
namento (ou diferenc;a) real existe na populac;ao sob investigaC;ao. A probabilidade associada
com cada teste estatfstico e chamada de valor p ou alfa (a): Quando isso e impressa na
safda do SPSSPW, aparece como urn decimal e, como qualquer probabilidade expressa em
decimal, varia no intervalo [0; I].
Em muitos peri6dicos, voce vera os pesquisadores relatando seus achados como signijica
tivos ou niio-signijicativos. Supondo que a hip6tese nula seja verdadeira e que a probabilidade
de se obter urn efeito devido ao erro amostral seja menor do que 5%, entao 0 achado e dito
significativo. Se a probabilidade for maior do que 5%, 0 achado e dito nao-significativo. Essa
fonna de pensar sobre a analise tem, no entanto, despertado uma boa dose de crfticas nos anos
recentes pelas raz<ies discutidas nas paginas 152-153.
N. de T. Os autores nio (azem dife~a entre as duas sicuali-Oes. mas na verdade 0 valor p f. a significancia do resultado. enquanlo
o valor a l. a significinc:ia do teste. AJ duas probabilidades siD, em geral, diferentes.

152

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

153

Ie dizendo que os resultados encontrados foram estatisticamente sigoificativos. Significancia


estatistica e diferente de significancia psicol6gica. S6 porque uma significancia estatisti
ca foi determinada entre duas amostras de valores, nao significa que existe uma grande ou
significativa diferen"a psicol6gica. Por exemplo, no estudo citado acima por Walsh e Ugam
ba-Agwunobi (2002) foi encontrada uma diferen"a estatisticamente significativa entre 0 tra"o
de personalidade ansiosa e procrastina"ao. Entretanto, a sobreposi'<80 entre estas duas varia
veis foi somente de 10%, 0 que nao e necessariamente significativo em termos psicol6gicos
(isto sera mais bern explicado no Capitulo 5).
Ia explicamos que a probabilidade calculada na estatistica inferencial se refere a possi
bilidade de urn dado efeito surgir se nao existir diferen"as entre as popula"oes subjacentes.
Isso nao apresenta necessariamente rela"ao com a importancia psicol6gica do achado. Tal
importancia estara relacionada com a quest1io de pesquisa e com as bases te6ricas dessa
pesquisa. Urn dos principais problemas com 0 valor p se relaciona com 0 tamanho da amos
tra. Se urn estudo tiver urn grande numero de participantes, podera fomecer signific1incia
estatistica por meio de urn efeito muito pequeno (relacionamento entre duas variaveis ou
diferen"as entre dois gropos). Ficara a cargo do autor (e seu publico) determinar a signi
fic1incia psicol6gica de qualquer descoberta. Relembre: signijidincia estatistica niio quer

Atualmente, a abordagem convencional consiste em relatar 0 valor exato da proba


bilidade de uma dada estatlstica (0 valor p) e deixar de lade a questao de pensar nos
resultados como estatisticamente significativos ou nao. Desta fonna, quando voce for
relatar os resultados de uma amilise, apresente 0 valor da probabilidade associado com a
estatlstica (valor p). Descrevemos a classifica"ao significativo/nao-significativo aqui para
que voce possa saber 0 que significa quando encontrar tal tipo de declara"ao em artigos
de algum peri6dico.
Recomendamos que utilize 0 nlvel a de 5% como urn guia para 0 que tern side visto tra
dicionalmente como uma probabilidade aceitavel para 0 erro do Tipo I, isto e, a probabilidade
de se rejeitar a hip6tese nula quando e verdadeira. Desse modo, se encontrar urn valor p que
seja bern menor do que 5%, ten!. confian"a razoavel de que este resultado da suporte a hip6te
se de pesquisa. Entretanto, voce deve relatar 0 valor p encontrado e avaliar os resultados em
termos de dimensOes (veja CapItulo 7) e do diagrama de barras de erro.

dizer signijiccincia psicol6gica.

~
,,:.; '.::: .....

;,:'L:.:'

4.5

Significancia estatfstica
Conforme sugerido anterionnente, quando ler urn artigo de urn peri6dico de psicologia
ou ouvir urn psic610go eminente (ou nao tao eminente) descrevendo suas pesquisas, voce vai
ler/ouvir com freqiiencia a palavra "significativo":
Niveis de efeitos negativos anteriores araiva foram taxados como signijicativamente menores
na situafiio de dirigir um carro do que na de nao dirigir(Parkinson, 2(01)

o grupo com sindrome do panico de fato apresentou dijiculdades de processamento emocio


nal mais signijicativas do que 0 grupo de controle (Baker et al., 2004)
... e a associafiio entre 0 trafo de personalidade ansiosa e procrastinafiio foi tambem signiji
cativo (Walsh e Ugamba-Agwunobi, 2(02)

que queremos com tais tipos de declara"oes? Na linguagem diana, interpretamos a


palavra "significativo" como consideravel, cntico ou importante. Isso significa que Parkinson
encontrou uma diferen"a considerlivel entre a raiva em situa"Oes de dirigir urn carro e outras
em que nao se esta dirigindo? Baker e colaboradores encontraram uma diferen"a cntica en
tre os gropos de controle e com slndrome do panico, ou talvez Walsh e Ugamba-Agwunobi
tenham encontrado uma rela"ao importante entre procrastina"ao e 0 tra"o de personalidade
ansiosa? De fato, os pesquisadores nao querem necessariarnente afinnar isso. Estao meramen-

PONTO DE DISCUSSAO: CRiTICAS


POR QUE REGISTRAR 0 VALOR P EXATO?
Existe urn debate em psicologia a respeito do usc do valor p como criterio de signi
ficancia. 0 modele geralmente aceito (p < 0,05) esta sob cnticas crescentes. Nao existe
nada intrinsecamente errado com 0 ponto de corte de 5%, embora se argumente que a sua
manuten"ao como 0 Santo Graal da psicologia esta distorcendo os objetivos legftimos da
pesquisa psicol6gica. 0 problema do criterio de 5% enos levar a acreditar que urn efeito
e significativo do ponto de vista psicol6gico apenas por ser estatisticamente relevante. De
fato, se observarmos este criterio logicamente, podemos perceber a ingenuidade desta ma
neira de pensar. Suponha, por exemplo, que voce conduziu urn estudo procurando por uma
rela"ao entre ansiedade estatistica e procrastina"ao. A probabilidade de obter tal rela"ao,
se ela realmente nao existir na popula"ao, e de 4,9%. Como este valor e menor do que 0
tradicional 5%, voce conclui que existe uma relacionamento real entre ansiedade causada
pela estatlstica e procrastina"ao. Ent1io. voce realiza urn estudo de continua"ao (sendo 0
born pesquisador que e) e novamente constata urn relacionamento entre as duas variaveis.
Desta vez, voce constata que a probabilidade de tal relacionamento, ja que a hip6tese nula
e verdadeira, e 5, I %. 0 que podemos pensar disso? Voce agora conclui que nao existe urn
relacionamento real entre as duas variaveis? Voce pode ver que existe uma diferen"a de
somente 0,2% nos valores das probabilidades entre os dois estudos. Assim, nao faz muito
sentido declarar que as dimensOes do relacionamento entre dois estudos sao diferentes, em
bora, com toda probabilidade, 0 primeiro destes estudos seja publicado em urn peri6dico de
psicologia, enquanto 0 segundo nao.
Urn dos grandes problemas com 0 valor p e sua rela"ao ao tamanho da amostra. Podemos
ter dois estudos nos quais urn apresenta 0 valor p muito pequeno (p. ex., 0,(01) enquanto 0
outro pode fomecer urn valor bastante grande (p. ex., 0,150). No entanto, nao podemos dizer
que 0 primeiro estudo mostra urn grande efeito (urn forte relacionamento ou grande diferen"a
entre duas condi"oes), e 0 segundo, urn pequeno efeito. De fato, a situa"ao podera ser con
trana em virtude de que 0 primeiro estudo foi realizado com uma amostra bastante grande,

1-'-

154

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

enquanto 0 segundo com uma bern menor. Mesmo efeitos muito pequenos poderao apresentar
significlincia estatlstica quando 0 tarnanho da amostra for bern grande.
Como podemos lidar com esse problema? A melhor abordagem consiste em obter uma
medida da magnitude do efeito experimental, isto e, obter informa"ao sobre 0 valor do
relacionamento entre a ansiedade estatlstica e a procrastina"ao. Se voce esta procurando
por diferen"as entre gropos, devera obter uma medida do tamanho da diferen"a entre os
mesmos. Essa diferen"a e denominada de magnitude do efeito ou tamanho do efeito. Uma
descri"ao mais detalhada do tamanho do efeito podera ser encontrada no Capitulo 7. 0
curso preferido de a"ao quando se relatarn as descobertas da pesquisa e descrever 0 valor
da probabilidade e 0 tamanho do efeito. Por exemplo, voce deve relatar a probabilidade
2
(p.ex., p 0,027) e 0 tamanho do efeito (p. ex., r = 0,70, r = 0,49 e ou d = 0,50). Dessa
forma, quando a1guem ler a sua pesquisa, ten!. urn quadro completo do que foi constatado.
Voce deve ter notado que reo coeficiente de correla"ao e indica a for"a do relacionamento
(linear) entre duas variaveis (explicaremos isso em mais detalhes no proximo capitulo); d
e a medida da magnitude do efeito utilizado por diferen"as entre gropos e e explicado no
Capitulo 7. Existe uma discussao bastante acessfvel sobre as dimensoes do efeito fomecida
por Clark-Carter (2003).

155

Dracup tambem ressalta 0 fato de que muitos textos sobre estatlstica equiparam 0 valor ex
com a probabilidade de que a hip6tese nula seja verdadeira. Isso e falso, como Dracup ilustra
c1aramente: ex e a probabilidade de se obter urn relacionamento de certa magnitude caso a
hipotese nula seja verdadeira; nao e a probabilidade de que esta seja verdadeira.
Uma vez que alguem caia na armadilha de interpretar ex como a probabilidade de que a
hipotese nula seja verdadeira, e relativamente facH e conveniente sugerir que I - ex seja a pro
babilidade de a hipotese de pesquisa ser verdadeira. Assim, se fixarmos ex no nlvel tradicional
de 5% e encontrarmos urn relacionamento significativo. quem seguir essa interpreta"ao afir
mara que existe uma probabilidade de 95% de a hipotese de pesquisa ser verdadeira. Isso e
falso. De fato, nao sabemos qual e a probabilidade de que a hipotese de pesquisa seja verda
deira; nossa probabilidade ex e condicionada ao fato de a hipotese nula ser verdadeira, e nao
tern nada a ver com a falsidade ou veracidade da hipotese de pesquisa.
Importa relembrar que a explica"ao sobre relacionamentos entre variaveis tambem se
aplica a procura por diferen"as entre gropos. Assim, 0 valor pea probabilidade de se en
contrar diferen"a entre dois gropos se a hipotese nula e verdadeira (nao existe diferen"a na
popula"ao).

4.6

Interpreta~ao

correta do valor p

E importante entender que 0 valor p e uma probabilidade condicionada. Considera-se a


probabilidade da ocorrencia de urn evento caso a hipotese nula seja verdadeira. 0 valor p ob
servado em qualquer safda de prograrna computacional representa essa probabilidade. Nao
representa a probabilidade de que 0 relacionarnento observado tenha ocorrido simplesmente
por acaso. Indica a probabilidade de 0 relacionarnento observado ter ocorrido se a hipotese nula
fosse verdadeira. Trata-se de uma probabilidade condicionada. Econdicional sobre a hip6tese
nula ser verdadeira. Urna boa discussao dos problemas causados pela rna interpreta"ao do que
o valor p representa e feita por Dracup (1995). Resumimos os principais pontos na discussao
abaixo. Se voce quiser ler a discussao original, a referencia e dada no final do capitulo.

PONTO DE DISCUSSAO: CRITICAS

MA INTERPRETA~O DO NIVEL DE SIGNIFlcANCIA (0:)

Dracup (1995) fomeceu uma boa discussao do problema, associado com a interpreta"ao
erronea dos fundamentos do teste de hipoteses.
Muitos estudantes sem experiencia em estatfstica (e mesmo aqueles com alguma) equi
param 0 nlvel de significancia (ex) com 0 verdadeiro tarnanho do efeito experimental. Quanto
menor 0 nlvel de significlincia, mais forte seria, por exemplo, 0 relacionamento entre duas
variaveis. Isso nao e 0 que de fato representa a significlincia de urn resultado. 0 valor a for
nece simplesmente uma indica"ao da possibilidade de se encontrar tal relacionamento caso a
hipotese nula seja verdadeira. Talvez, de fato, quanta mais forte 0 relacionamento, mais baixa
a probabilidade de que ele seja encontrado caso a hipotese nula seja verdadeira, mas nao sig
nifica que isso necessariamente ocorrera.

4.7

Testes estatisticos
Imagine que voce esta investigando a rela"ao entre 0 numero de horas de estudo e 0
desempenho em uma prova. Suponha agora que, quando realizou 0 estudo, encontrou urn
padrao de valores semelhante ao apresentado na Figura 4.3. Como voce calcularia a pro
babilidade de que tal relacionamento se devesse ao erro amostral se a hipotese nula fosse
verdadeira? Aqui precisamos utilizar testes estatfsticos inferenciais, tais como 0 coeficiente
de correla"ao momento-produto de Pearson (veja Capftulo 5). Se voce conduzisse urn estudo
para examinar a diferen"a entre duas condi"oes de uma variavel independente, usaria urn
teste como 0 teste-t, a fim de calcular a estatlstica teste, e a probabilidade seria obtida atraves
da distribui"ao t (Student). * No decorrer desta se"ao esperamos promover urn entendimento
conceitual do que os testes fazem de fato.
Quando olhamos para 0 relacionamento entre duas variaveis (p. ex., horas de estudo e
resultado em uma prova), somos capazes de calcular uma medida do tarnanho ou for"a do reia
N. de T. William Sealy Gossel (1876-1937), conhecido COfOO StudenL

156

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

cionamento (isso sera abordado com mais detalhes no pr6ximo capitulo). Uma vez que se tenha
uma medida da fo~a de urn relacionamento, precisamos encontrar a probabilidade de encontrar
tal relacionamento unicamente devido ao erro amostral. Para calcular essa probabilidade, fa
zemos uso das distribui~Oes de probabilidade introduzidas no Capitulo 3 (p. ex., veja a pagina
III). Foi dito anteriormente que a probabilidade de se obler qualquer valor de uma distribuic;ao
e conhecida - por exemplo, a probabilidade de se obter urn valor z de 1,80 ou maior e somente
3,8%. Se pudermos converter a informac;ao que temos sobre a intensidade do relacionamento
em urn valor de distribuic;ao de probabilidade, poderemos delerminar a probabilidade de que tal
valor seja obtido por acaso. Isso indicara a probabilidade de se obler 0 relacionamenlo observa
do em nosso estudo devido ao erro amostra1 (por acaso), se nao existir, de falo, relacionamenlo
na populac;ao. Isso e basicamente urn lesle de hip61eses (significmcia). A transformac;ao dos da
dos de nossa amostra em valores de distribuic;ao de probabilidade permile delerminar qual e a
probabilidade de que esles dados lenham sido obtidos inleiramente por acaso. Podemos ulilizar
essa probabilidade para decidir qual das hip61eses, se a nula ou a experimental, e a escolha mais
razoavel. Deve-se enfatizar que as probabilidades calculadas se baseiam na hip61ese de que as
nossas amostras sao selecionadas alealoriamenle da populac;ao.
A Figura 4.5 mostra a distribuic;ao normal padrao e ilustra que a probabilidade de se
obter urn valor nos extremos (caudas) da distribuic;ao e muilo pequena. Voce deve lembrar
que, quando ulilizamos distribuic;Oes contlnuas, a area sob a curva represenla a probabilidade.
Quanlo maior a area acima de urn valor pOSilivo, maior sera a probabilidade de se oblerem
valores iguais ou superiores a ele. De forma semelhanle, quanlo maior a area abaixo de urn
valor negalivo, maior sera a probabilidade de se oblerem valores iguais ou inferiores a ele.
Assim, uma vez convertido 0 grau de relacionamenlo entre duas variaveis em urn valor de
distribuic;ao de probabilidade, podemos delerminar a probabilidade de obler esle valor ou urn
maior (ou menor) por acaso. Se os valores esllio tanlo em uma ou outra das regiOes indicadas
na Figura 4.5, podemos concluir que tal relacionamenlo e improvavel de ler ocorrido por
acaso - iSlO e, nao poderia ser resultado do erro amostral.

-3

-2

-1

Diagrama dos valores extremos em uma distribui<;ao.

157

E claro que, se eslivermos investigando as diferen~as entre grupos, podemos ulilizar as


distribuic;Oes de probabilidade para calcular a probabilidade de encontrar diferenc;as, dos ta
manhos observados, apenas por falores casuais, se a hip61ese for verdadeira. Em tal caso,
podemos converter a diferenc;a entre os dois grupos de variaveis independenles em urn valor
de distribuic;ao de probabilidade. Podemos, enllio, encontrar a probabilidade de obler lal va
lor devido ao erro amostral, se nao existir diferenc;a na populac;ao. Se esta probabilidade e
pequena, nao faz sentido propor a inexislencia de diferenc;a na populac;ao, e a diferenc;a entre
as amostras resulta unicamenle do erro amostra1. Faz mais sentido sugerir que a diferenc;a ob
servada represenla uma diferenc;a real na populac;ao: a diferenc;a e resultado da manipulac;ao
da variavel independenle.
E importanle nOlar que, quando convertemos n~os dados em urn valor de distribuic;ao
de probabilidade, 0 resullado oblido e denominado de estatistica teste. Por exemplo, se es
tamos inleressados na diferenc;a entre dois grupos podemos converter nossos dados em urn
valor-l (da distribuic;iio t - Sludenl). Esse valor tea nossa eSlatlstica leSle. Enllio, calculamos
a probabilidade de se obler lal valor, ou mais extremos, apenas por falores casuais; isso re
presenta 0 valor p.

4.8

Erro do Tipo I
Suponha que lenhamos conduzido uma pesquisa e constatado que, cODsiderando a hip6
lese nula verdadeira, a probabilidade de se encoDtrar 0 efeilo observado e pequena - como
representado na Figura 4.3. Nesse caso, leriamos confianc;a de que podemos rejeilar a hip6
lese nula. Suponhamos agora que, na verdade. niio exista tal efeilo na populac;ao e lenhamos
encontrado em urn efeilo ocorrido apenas por acaso. Comeleremos, obviarnenle, urn erro se
concluirmos que ha suporte para nossa predic;iio. Os estatlsticos diriam que, se rejeitlissemos
a hip61ese nula, nesle caso, comeleriamos urn erro do TIpo I.
Se a significmcia do lesle (a) e 5%, lemos uma chance de I em 20 de comeler 0 erro
do Tipo I. Isso ocorre porque 0 valor a e a probabilidade de se rejeilar a hip61ese nula, se
verdadeira. E a probabilidade de se obler urn efeilo como resultado somenle erro amostral
se a hip61ese nula e verdadeira. Argumentamos que, se isso e pequeno 0 suficienle, enlao
e improvavel que a hip61ese nula seja verdadeira. Todavia, como 0 caso acima ilustra, po
demos estar errados; podemos comeler 0 erro do Tipo I. Dessa forma, 0 valor p represenla
lambem a probabilidade de se comeler 0 erro do Tipo I. Se 0 valor p for igual a 5%, isso
quer dizer que a probabilidade de se comeler 0 erro do Tipo I e igual a esse valor caso a
hip61ese nula seja rejeitada. Embora a probabilidade seja pequena, e posslvel que 0 even
10 venha a ocorrer. Podemos relacionar isso a 10leria naciona!: Exisle somenle I em 14
milh6es de possibilidades de voce ganhar a 10leria se comprar urn unico bilhele. Mesmo
que a probabilidade de ganho seja mim1scula, ainda exisle, e e por isso que as pessoas
conlinuam aposlando. Enliio fique alenlo: mesmo se encoDtrar urn valor p de 0,001 %,
exisle ainda uma probabilidade muilo pequena de voce comeler urn erro do Tipo I, caso a
hip61ese nula seja rejeilada.

3
N. de T. Esemelhanle Amega-sena, 56 que 0 total de numC20S ~ 49 em vez de 60. assim como 0 mlmero de combin~iles possivei.
~ 13 983 816 em vez dos 50063 860 da mega-sena.

158

Christine P. Dancey & John Reidy

Exemplo da literatura: memoria

desempenho de pessoas ansiosas e nao-ansiosas

Urn exemplo de urn estudo no qual os pesquisadores podem ter cometido urn erro do Tipo leo
de Richards e French (1991). Neste estudo, foi medido 0 desempenho da mem6ria de pessoas an
siosas e nao-ansiosas para palavras negativas. Constatou-se que, em certo tipo de tarefa envolvendo
a memoria, as pessoas ansiosas lembraram de mais informa"ao negativa do que as nao-ansiosas. Os
pesquisadores conclufram que essa diferen"a nao foi devida ao erro amostral e que era de fato uma
diferen"a genuina entre as pessoas ansiosas e nao-ansiosas. Replica"oes posteriores desta pesquisa
realizada pelos mesmos autores falharam, no entanto, em confirmar 0 resultado inicial. Assim, eles
verificaram que 0 resultado encontrado no estudo inicial era espurio: nao existia uma diferen"a real
entre as pessoas ansiosas e nao-ansiosas quanto a este tipo de tarefa de mem6ria.
Os pesquisadores cometeram urn erro do Tipo I, porque provavelmente nao existe uma diferen
"a real quanto a Iembran"as de informa"ao negativa entre pessoas ansiosas e nao-ansiosas. Isso nao
significa dizer que esta foi uma pesquisa ruim. Pelo contnirio, foi urn estudo excelente e serviu para
mostrar que, como nosso julgamento se baseia em probabilidades, estamos algumas vezes amerce
dos fatores casuais.

4.8.1

Replica~ao
Suponha que voce realize urn estudo e observe urn relacionamento com probabilidade de
ocorrencia associada a veracidade da hip6tese nula de 0,0 I (ou 1%). Com boa dose de razao,
voce ficaria feliz em rejeitar a hip6tese nula e dizer que encontrou suporte para a hip6tese de
pesquisa. 0 quae confiante voce pode estar de que exista uma rela"ao genufna na popula"ao?
A resposta para essa questao e diffcil e, em alguns aspectos, depende do contexto da pesquisa
realizada. Se 0 seu estudo foi 0 primeiro neste assunto, e sensato que voce trate os resultados
com certo grau de cautela. Lembre-se: voce esta lidando com probabilidades, nao com cer
tezas. Mesmo que os resultados tenham baixa probabilidade de ocorrencia se a hip6tese nula
for verdadeira, essa probabilidade ainda existe. Quando retiramos amostras de popula"oes,
cada uma e urn pouco diferente, e a diferen"a entre elas resulta no erro amostral (tratamos
disso anteriormente no Capitulo 2). Pode ser que voce tenha side azarado e 0 padrao que s6
acontece uma vez em 100, devido ao erro amostral, tenha justamente ocorrido. Voce estaria
errado, neste caso, em rejeitar a hip6tese nula. Como devemos proceder nesta situa"ao? 0
que voce deve fazer e replicar os resultados, realizando outro estudo. Se encontrar 0 mesmo
padrao com uma probabilidade aproximada de obte-Io caso a hip6tese nula seja verdadeira,
voce podera confiar mais nos resultados obtidos. A replica"ao e uma das pedras angulares da
ciencia. Se voce observa urn fen6meno uma vez, entao pode ter side por acaso; se 0 observa
duas, tres ou mais vezes, pode estar certo de que e urn resultado autentico.

4.9

Estatistica sem Matematica para PsicoJogia

Suponha que pretendamos averiguar se existe relacionamento entre a quantidade de


alcool consumido e a coordena"ao de uma pessoa. Urn estudo e realizado, e verifica-se
que existe uma grande probabilidade. digamos 0,8 (80%), de que a rela"ao observada na
amostra tenha oconido por acaso. Voce concluira, portanto. que nao existe relacionamento
entre quanti dade ingerida de alcool e co:>rdena"ao. Essa sera uma conclusao correta? Ob
viamente e uma conclusao incorreta, pois todas as evidencias apontam 0 contrario. Esse e
o motivo da existencia de leis que profbem de dirigir ap6s beber. Nesse caso, podemos ter
cometido urn erro do Tipo II, isto e, rejeitamos a hip6tese de pesquisa quando ela e de fato
verdadeira.
Os mesmos tipos deerros podem ocorrer quando se investigam diferen"as entre grupos.
Suponha que voce esteja conduzindo urn estudo para erificar se alguem pode percorrer 100
metros nadando em uma piscina mais rapido do que correndo em uma pista de atletismo.
Uma vez analisados os dados, voce verifica que existe uma grande probabilidade, se a hip6
tese nula for verdadeira, de que a diferen"a obtida tenha resultado de erro amostral. Dessa
forma, voce conclui que nao existe diferen"a entre os tempos gastos para completar os 100
metros na terra ou na agua para a popula"ao em geral. Voce cometeu claramente, neste caso,
urn erro do Tipo II.
Nas nossas pesquisas, em virtude de nunca estannos 100% certos de que podemos rejei
tar a hip6tese nula, ou 100% certos de que podemos aceita-Ia, temos sempre a probabilidade
de cometer algum tipo de erro. Esses erros sao do Tipo I ou II. Voce deve lembrar que a pro
babilidade de se cometerem erros do Tipo I e representada por a (alfa). A probabilidade de se
cometerem erros do Tipo n e representada por ~ (beta).
Se voce se encontrar na situa"ao descrita, na qual se cometeu urn erro do Tipo II. convem
se perguntar por que, se existe uma diferen"a real de relacionamento na popula"ao, 0 seu
estudo falhou na sua detec"ao. Existem varios motivos para a ocorrencia desse tipo de proble
ma. No primeiro deles, por pure acaso, voce pode ter selecionado pessoas que possuem uma
grande tolerancia ao alcool (ou pessoas que realmente sao tao rapidas na piscina quanto na
pista). Mais provavelmente, no entanto, voce fez urn estudo maI-projetado, ou os tamanhos
amostrais foram muito pequenos. Esses fatores afetarn a capacidade da pesquisa em detectar
diferen"as reais na popula"ao. A habilidade de urn estudo rejeitar a hip6tese nula quando for,
de fato. falsa e denominado poder do estudo, e sua probabilidade e dada por I - ~. Trataremos
muito mais do podel" no Capftulo 7.

I~IAtivld~~~~,~~J,,;

Erro do Tipo II
Existe urn outro tipo de erro que se pode cometer quando se utiliza a abordagem do teste
de hip6teses em uma pesquisa: erro do Tipo II. Este erro consiste em nao rejeitar a hip6tese
nula quando ela e, de fato, falsa.

159

<,.

''-''-':<\':':':: ../.~-:'.

:'<.'

160

4.10

Christine P. Dancey & John Reidy

Par que estabelecer ~ = 0,05?


Voce pode estar se perguntando por que ha urn ponto de corte (X de 0,05. Quem deter
minou que 0,05 e urn valor de corte mais apropriado para rejeitar a hip6tese nula do que
urn de 0,20 ou de O,ool? Embora seja urn valor arbitrano, nao existe uma razao especifica
para adota-Io. Vamos dar uma olhada nas situa~oes em que estabelecemos (X como 0,20
e 0,00 I, respectivamente. Se defininnos (X como 0,20, significa que vamos tolerar urn
erro do Tipo I de 1 a cada 5. Isso e urn criterio de signifidincia bastante liberal, pois, em
uma vez a cada cinco. podemos rejeitar a hip6lese nula quando. de fato, ela e verdadei
ra. Pelo lado positivo, teremos uma probabilidade bern menor de cometermos 0 erro do
Tipo II. ISIO e, teremos uma menor probabilidade de aceitarrnos uma hip6tese nula falsa.
Com tal criterio liberal de significancia, geralmente vamos rejeilar a hip6tese nula mais
freqiienlemente, e, dessa fonna, e mais provavel rejeita-Ia quando for falsa (bern como e
mais provavel, tambem, rejeila-Ia quando for verdadeira). Isso significa uma probabilidade
menor de erro do Tipo II.
Muito bern, que tal agora eSlabelecer 0 nosso valor (X em O,OOI? Aqui lemos uma pro
babilidade bern menor de cometennos 0 erro do Tipo I. Teremos uma possibilidade em mil
de rejeitarrnos a hip6tese nula quando for verdadeira. Esse e urn criterio de significancia
bastante conservador. Sob essa 6tica, isso parece ser algo born. Niio queremos rejeilar incor
retamente a hip6tese nula, e, entiio, por que niio sennos baslante conservadores no nlvel de
significancia? 0 problema e que, embora reduzamos a probabilidade de cometennos 0 erro
do TIpo I, lambem aumentamos a probabilidade de niio rejeitarrnos a hip6tese nula quando e
falsa. Ampliamos a probabilidade de cometermos 0 erro do Tipo U. Isso ocorre porque, com
urn criterio de significancia tao conservador, existirao poucas possibilidades de rejeitarmos
a hip6tese nula. Dessa forma, aumenlaremos a probabilidade de niio rejeitarmos a hip6tese
nula quando falsa.
Quando estabelecermos nosso criterio para a significancia, devemos, portanto, fazer urn
balan~o entre as possibilidades de cometennos erros dos Tipos I e II. Em muitas situa~oes,
urn (X de 0,05 fomece 0 ponto de equilfbrio. Voce deve nOlar que, algumas vezes, exislem
outras considera~oes que detenninam 0 nivel em que a significancia deve ser estabelecida.
Se vamos teSlar urn remecIio novo, por exemplo, devemos ser muito roais conservadores, pois
as conseqiiencias de comelermos urn erro do TIpo I podem ser bastante serias. As pessoas
podem eslar lomando remedios que apresentem efeitos colaterais perigosos ou que possam
niio ser efetivos no tratamenlo. Outra situa~ao na qual podemos estabelecer diferentes nlveis
de significancia e na condu~ao de vanas an3.lises sobre 0 mesmo conjunto de dados. Isso sera
abordado com mais detalhes no CapItulo 9.

4.11

Estatistica sem Matematica para Psicologia

161

lambem aumenta. Isso e denominado hip6tese unilateral ou IInicaudal. Nesse caso, estamos
seguros sobre a natureza do relacionamenlo e podemos, entio, fazer uma previsao sobre a
dire~ao do mesmo. Entrelanlo, em muilos casos na psicologia (como em outras disciplinas),
niio eslamos seguros sobre a natureza do relacionamento que nos interessa verificar. Supo
nha que desejemos invesligar 0 relacionamento entre ansiedade e lembran~as negalivas. As
pesquisas previas na area levam a resultados contradil6rios. Mogg e colaboradores (1987)
viram que indivlduos ansiosos se lembram de menos palavras negativas do que pessoas nao
ansiosas, enquanlo Reidy e Richards (1997) verificaram que pessoas ansiosas tendem a se
lembrar de mais palavras negativas. Enlao, niio eslamos lotalmenle seguros sobre a dire~ao
do relacionamento entre pessoas ansiosas e lembran~as negativas. Dessa forma, vamos es
labelecer apenas que exiSle uma rela~iio entre as duaY'tariaveis sem, no entanlo. especificar
seu direcionamenlo. Fazendo lal previsao, declaramos que existe urn relacionamenlo. mas
nao eslamos seguros se a ansiedade aumenta quando a lembran~a negativa aumenla ou dimi
nui. Fizemos 0 que e denominado de previsiio bidirecional, mais conhecida como hip6tese
bilateralou bicaudal. Voce pode eSlar pensando que esses sao lermos bizarros para se asso
ciar com lal tipo de hip6teses. Esperamos que tudo fique claro na pr6xima explica~iio. Para
enlender por que ulilizamos os lermos hip6tese uni e bicaudal, voce precisa voltar ao que se
viu sobre distribui~oes.
Anleriormente explicamos que a distribui~ao normal (como outras distribui~Oes de pro
babilidade) possui caudas em suas extremidades (veja Figura 4.5). A probabilidade de se
oblerem valores desses extremos (das caudas) e pequena quando comparada a oblen~ao de
valores do meio da distribui~ao (veja Figura 4.6). Por exemplo, obter a altura de urn homem
com 244 cm e allamenle improvavel. e esse valor eslana na cauda direila (superior) da distri
bui~ao das alturas de lodos os homens.
Agora voce precisa relembrar 0 que se explicou sobre os tesles estatfsticos. Utilizamos as
distribui~Oes de probabilidade como recurso para calcular a probabilidade de uma diferen~a
ou rela~iio ocorrer enquanlo resultado de erro amostral se essa mesma diferen~a ou rela~iio
niio existe na popula~iio. Para exemplificar, mostramos como se pode utilizar a distribui~ao

'~~~~o;;~5~~~1:

Testes unilaterais e bilaterais


Anteriormente descrevemos urn posslvel estudo sobre a rela~ao entre 0 numero de horas
de estudo semanal com a nota na prova (veja S~iio 4.1). Fizemos a previsao (hipotetica) de
que, a medida que as horas de estudo aumentam, da mesma forma aumenla a nota na prova.
Fizemos 0 que se denomina hip6tese direcional. Especificamos a dire~ao do relacionamen
to entre as duas varlaveis: sugerimos que, aumentando as horas de estudo, a nola da prova

-3

-2

-1

Valores nos extremos (caudas) apresentam uma probabilidade de ocorrencia menor do


que os do meio da distribui~ao.

162

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

nonnal padrao nesses casos. Destacamos que, ap6s termos transformado nossa estatistica
amostral em urn valor da nonnal padrao, detenninamos qual a probabilidade de se obter tal
valor ou outro mais extremo como resultado apenas do erro amostral. Se essa probabilidade
e pequena, entao podemos argumentar com alguma confian<;a que temos urn relacionamento
genulno entre as nossas variliveis, isto e, 0 relacionamento nao se deve ao erro amostral.
Se voce observar a Figura 4.7, vera que indicamos as areas na distribui<;ao nas quais a
probabilidade de se obter tal valor e pequena. Esses valores estao localizados nos extremos
(caudas) da distribui<;ao.
Quando utilizamos 0 processo de calcular 0 escore relevante da informa<;ao amostral,
trabalhamos com alguma medida da intensidade do relacionamento entre as duas. Suponha
que tenhamos dois estudos, 0 Estudo leo Estudo 2, ambos investigando 0 relacionamento
entre a ansiedade estatlstica e a procrastina<;ao (veja Tabela 4.1).
Nos dois estudos, queremos verificar se a ansiedade estatistica e a procrastina<;ao estao
relacionadas de alguma fonna. Voce deve notar, a partir da tabela, que, em cada estudo, pa
rece existir urn relacionamento entre ansiedade e procrastina<;ao. No Estudo I, 0 aumento
dos valores da ansiedade levam ao mesmo efeito na procrastina<;ao. Neste caso, quando cal
culamos 0 escore padronizado, obtemos provavelmente urn valor da cauda direita (superior)
da distribui<;ao (veja Figura 4.7). Se, por outro lado, os valores da ansiedade aumentam, mas
os da procrastina<;ao diminuem (como no Estudo 2), 0 escore padronizado resultante deve
estar na cauda esquerda (inferior) da distribui<;ao. Esse exemplo i1ustra 0 fate de a dire<;ao do
relacionamento entre as suas variaveis detenninar a cauda da distribui<;ao na qual 0 escore
padronizado resultante se localiza.
Quando nao prevemos a dire<;ao do relacionamento entre a ansiedade estatistica e a pro
crastina<;ao, prevemos simplesmente que 0 escore calculado pode estar em qualquer uma das
caudas da distribui<;ao. Portanto, fazemos uma previsao bicaudal. Se, por outro lado, preve
mos que, a medida que os escores de ansiedade aumentam, os da procrastina<;ao tambem,

:~esc::

;,~y~tiJii~~~

Tabela 4.1

Dados para a ansiedade estalfslica e a

procraslin~ao

,::)X{ . j~:t;,ti!;~:,~t~~~;:~Wt~fl~~~t~~{:;~~;~:':',:
1
2

3
4

5
6

7
8
9

nos Estudos I e 2

..:. ;;f;';~~~

c;;':.:.." ".

I
2

2
4
6
8
10
12
14
16
18

18

16

14

12

10

3
4

5
6
,-

163

7
8
9

prevemos que 0 escore padronizado pertence II cauda direita da distribui<;ao apenas. Isto e,
prevemos a que cauda 0 escore que calculamos pertence.
Se voce faz uma previsao bicaudal, 0 escore calculado pode pertencer a qualquer uma
das caudas. Suponha agora que convencionamos utilizar 0 nivel de signifidincia de 5% como
nosso ponto de corte para a rejei<;ao da hip6tese nula (nao recomendamos que voce use tal va
lor: apenas 0 utilizamos para ilustrar 0 assunto). Seremos capazes de rejeitar a hip6tese nula
somente se existir uma probabilidade de 5% ou menos de obtennos 0 escore padronizado. A
Figura 4.8 mostra que, em cada cauda, h:i escores calculados com uma probabilidade de 2,5%
de serem obtidos, isto e, 0 valor de 5% e dividido entre as duas caudas.
Se fizennos uma previsao unicaudal, enta~ aceitaremos escores em apenas uma das cau
das. Dessa forma, nossa regiao de 5% de probabilidade esta toda em uma unica cauda: isto
e, ela nao e dividida entre as duas caudas. Isso efetivamente significa que podemos rejeitar a
hip6tese nula para urn numero maior de escores nessa cauda do que no teste bicaudal (veja
Figura 4.9).

~~.,?L

. ~.
~mm':
baiicos~ de,;

-/, ...-:

S~::
. " ~caiKlli: .

_:,2,~~~~;--'

-3
-2
Cauda inferior

-1

lIustrac;ao dos valores nas caudas da distribuic;ao.

2
3

Cauda superior

-3

". 2;5%

-2

-1

As areas coloridas representam as regioes nas quais podem ocorrer escores de hip6tese
bicaudal.

164

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

165

.,.
--

.~

1.:.:"'

:,5%<
", ;'.~-

-3

-2

-1

.~-!~~.<

'.:

~ representam as regioes nas quais podem ocorrer escores de hip6tese


~ unicaudal.
As Figuras 4.8 e 4.9 ilustram a importiincia de se estar segura sobre a realiza,<ao de
uma previsao unilateral ou bilateral. Nos capftulos seguintes, quando serao descritos os pro
cedimentos dos varios testes estatfsticos que utilizam 0 SPSSPW, voce podera notar que
existe uma op,<ao que permite escolher se as probabilidades (valores p) serao unilaterais ou
bilaterais.
Se, entretanto, voce tiver obtido urn valor p para urn teste bilateral e quiser saber 0 valor
correspondente para 0 teste unilateral, tudo 0 que precisa fazer e dividir por dois 0 valor p.
Por exemplo, se voce obteve urn valor p de 0,03 para urn teste bilateral, 0 valor equivalente
para urn teste unilateral sera 0,00 15. De forma semelhante, se for obtido urn valor p para urn
teste unilateral, 0 valor correspondente para 0 teste bilateral sera obtido dobrando-se esse
valor: Observe que 0 que deve ser dobrado e 0 valor p e nao a estatfstica teste (p. ex., coefi
ciente de correla,<ao ou urn valor t). A estatfstica teste (evidencia amostral) sera a mesma em
qualquer urn dos casos para urn mesmo conjunto de dados.
Devemos salientar que, embora tenhamos ilustrado a diferen,<a entre previsOes unilaterais
e bilaterais com referencia ao relacionamento entre variaveis, voce pode tambem ter qualquer
urna das previsOes quando investigar diferen,<as entre condi,<Oes.
Essencialmente, existem duas formas em que quaisquer duas condi,<oes (A e B) podem
diferir, isto e:
Condi,<ao A apresenta valores mais altos do que a condi,<ao B.
Condi,<ao B apresenta valores mais altos do que a condi,<ao A.
Quando feita uma previsao bilateral sobre diferen,<as entre duas condi,<oes, temos
somente que especificar que existe diferen,<a entre elas. Nao precisamos especificar qual
condi,<ao tera valores mais altos. Se fizermos uma previsao unilateral, devemos especificar
qual dos cenarios acima seni mais apropriado, isto e, que condi,<ao devera ter os maiores va
lores. Nao pretendemos detalhar esse assunto aqui, pois ele sera abordado em profundidade
no Capftulo 6.
N. de T. Evidentememe os autores estao referindo-se as dislribuiCjOes sim~tricas. como a nannal e a I (Student).

4.12

Hip6teses subjacentes ao usa das testes estatisticos


Nas se,<oes anteriores e em outros capftulos do livro, introduzimos os conceitos basi
cos da testagem estatfstica. No restante do livro, explicaremos urn grande numero de testes
apropriados para os varios delineamentos possfveis de uma pesquisa. No entanto, esses testes
requerem que algumas hip6teses sejam satisfeitas antes que eles possam ser apropriadamente
aplicados aos dados amostrais.
Muitas das tecnicas estatfsticas que descrevemos no livro requerem a satisfa,<ao de
algumas condi,<Oes pelas popula,<Oes das quais os dados sao retirados. Em virtude de as carac
terfsticas de uma popula,<ao serem denominadas de parametros (veja Capftulo 2), esses testes
freqiientemente sao denominados de testes parametricos. Em virtude dos requerimentos des
ses testes, precisamos assegurar que os nossos dados tambem satisfa,<am certas hip6teses
antes que possamos aplicar tais tecnicas estatfsticas. Essas hip6teses sao descritas nas se,<Oes
seguintes.
Existem tecnicas estatfsticas que nao elaboram hip6teses sobre 0 comportamento da po
pula,<ao da qual os dados sao retirados, mas elas nao sao tao utilizadas quanto as tecnicas
parametricas. Por nao exigirem que a popula,<ao satisf8'<a certas coodi,<Oes, sao muitas vezes
denominadas de testes de distribui~iio livre. Esses testes serno abordados no Capftulo 15.

Hip6teses subjacentes aos testes parametricos


I. A popula,<ao da qual as arnostras sao retiradas deve ser normalmente distribu{da. Os
testes parametricos pressupi>em que Iidamos com dados normalmente distribufdos.
Essencialmente, essa suposi,<ao significa que se deve, sernpre, verificar se os dados
da nossa amostra sao aproximadamente normais antes de se decidir pelo usc de urn
teste pararnetrico. Ja falamos sobre como fazer isso utilizando os diagramas de caixa
e bigodes, caule e folhas e histogramas. Se voce verificar que os dados se desviam da
normalidade, e possfvel transforma-Ios, de forma legftima, de modo que ainda seja
possfvel a utiliza,<ao de urn teste parametrico; como isso esta alem do objetivo deste
texto, voce deve consultar outros mais avan,<ados. Howell (2002) fornece urn panora

~.,...--,

166

rna muito born de tais transforma..6es. Para sua informa..ao, as distribui..6es na Figura
4.10 (a) e (b) sao provavelmente pr6ximas da normalidade para que se utilize urn teste
parametrico. Se os seus dados sao mais parecidos com as Figuras 4.10 (c) e (d), voce
deve considerar uma transforma..ao de dados.
2. A segunda pressuposi..ao indica que as variancias das popula..6es devern ser
aproximadamente iguais. Isso e algumas vezes referenciado como a hip6tese da
homogeneidade das variiincias. Voce deve estar lembrado que, quando explicamos
como calcular 0 desvio padrao no Capitulo 2, afirmamos que 0 calculo da variancia
era urn dos passos necessarios para obte-Io. Especificamente, informamos que 0
desvio padriio e a raiz quadrada da variancia. Na pnitica, nao podemos verificar se
nossas popula..6es apresentam a mesma variancia e, entao, devemos nos assegurar
de que as variancias de nossas amostras sejam aproximadamente iguais. Voce pode
se perguntar: 0 que quer dizer aproximadamente iguais? Eis a regra pratica utiliza
da: se a maior das variancias nao for mais do que tres vezes a menor das variancias,
e possivel admitir que tenhamos variancias aproximadamente iguais. Entendemos
que isso significa 0 mesmo que afirmar que urn homem e uma girafa sao aproxima
damente da mesma altura, mas ilustra a fIexibilidade envolvida em algumas dessas
suposi..6es. Geralmente a viola..ao desse tipo de suposi..ao nao e considerada tao
catastr6fica, contanto que voce tenha 0 mesmo numero de panicipantes em cada
uma das condi..6es. Se voce tiver amostras de tamanhos diferentes, e a suposi..ao de
10

(a)

4,5

3,5
3
2,5
2
1,5

0,5

60-61

64-65

68-69

72-73

76-77

10
9

7
'"
'c" 6
'v
'<1/
5
'J
cr 4
~
.... 3

60-61

64-65

68-69

72-73

76-77

(b)

'"
'c "
'v

.<1/

'J

....

(c)

6
5
4
3
2
1
0
60-61 64-65

'"
'"
'v
~
cr
~

....

68-69

72-73

76-77

10

(d)

'"
'c " 6
'v
.<1/
5
'J

.... W43

1
0
60-61 64-65

68-69

72-73

167

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

76-77

Exemplos de distribui~oes que podem ser consideradas aproximadamente norma is - (a)


e (b) - e aquelas que provavelmente nao podem - (e) e (d).
N. de T. De raID existe urn leste para verificar isso. 0 SPPSPW raz essa verifica~5.o automaticamenle. sempre que se utilizar 0 teste'
para a direren~a entre duas medias.

igualdade de variancias for violada, definitivamente voce deve considerar


urn teste de distribui..ao livre (veja Capitulo 15).

uso de

3. A ultima suposi..ao aponta que nao existem escores extremos (outliers). 0 motivo
dessa suposi..ao e facil de entender quando voce considera que muitos testes para
metricos envolvem 0 calculo da media como uma medida de tendencia central. Se
voce lembrar 0 que foi explicado no Capitulo 2, vera que a media e bastante sen
stvel a valores extremos - quando eles estiverem presentes, e melhor utilizar outra
medida de tendencia central. Se os escores extremos distorcem a media, por con
seqiiencia qualquer teste parametrico que utilize a media ficara tam bern distorcido.
Assim, devemos nos assegurar de que nao e,&stem valores extremos nos dados. Se
voce se deparar com valores extremos, deve voltar ao Capitulo 2 para uma discussao
sabre 0 que deve ser feito com eles.
Dado que existem suposi..6es inerentes ao uso dos testes parametricos, voce pode
ra perguntar-se: por que utiliza-Ios? Os testes pararnetricos sao utilizados com freqiiencia
na pesquisa psicol6gica porque sao os testes mais poderosos. Se existe uma diferen..a nas
popula..6es, ou urn relacionamento entre duas variaveis, os testes parametricos tern maior
probabilidade de detecta-Ias, desde que as suposi~s para a sua utiliza..ao sejam satisfei
tas. Os testes parametricos sao mais poderosos porque usam mais informa..6es dos dados.
Suas f6rmulas envoIvern 0 calculo de medias, desvios padr6es e a1guma medida do erro da
variancia (isso sera explicado nos capitulos pertinentes). Os testes de distribui..ao livre ou
nao-parametricos se baseiam em postos ou freqiiencias de ocorrencia dos dados em vez dos
pr6prios dados. Em virtude de seu maior poder, os testes pararnetricos sao os preferidos, con
tanto que as restri..6es ao seu uso nao sejarn extremarnente violadas.
Neste enos capitulos anteriores, explicamos os conceitos basicos importantes para urn
born entendimento dos testes estatisticos utilizados com maior freqiiencia. Alem disso, apre
sentamos varias tecnicas descritivas e alguns conselhos sobre como utiliza-Ias. 0 paragrafo
anterior tarnbem apresentou alguns criterios para a escolha entre as varias tecnicas estatisticas
inferenciais. Antes de voce estudar os testes estatfsticos propriamente ditos, seria, taIvez, uma
boa ideia revisar todas essas considera..6es. Para tanto, vamos apresenlii-Ias aqui na forma
de urn sumario. A Figura 4.11 fomece uma ilustra~o aproximada da forma como 0 projeto
pode afetar a escolha da estatistica. Deve-se enfatizar que este diagrama de fIuxo representa
uma visao geral dos assuntos abordados nos capitulos precedentes e deve ser utilizado como
tal. Sempre que voce tiver duvidas sobre qual teste pode aplicar de forma legitima aos seus
dados, recomendamos que utilize 0 diagrama em conjunto com as orienta..6es apresentadas
previamente.

168

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

/D
rsi\SS!iWi;.

.... :;/;',;,~t~1~;~{~f~}#;c;

:~.$;/~/

",,-,,
,~;'"

.
.!Q

;.;e;f;
; I;"i'\
.~''g'

i,:;.""'-

'lI!.~
....!. .i'. .0....
-" !l!'

.' ";..:;'
'::I en

'''0;;;''

". .

,~.:.c'.

is

....

(;~:,-'!,:!~;i,~

li", .",.

lea

8.1 =l!/
] '6)~"

... ::::10

'S'lfi ~
...: 'lS'"

"'E' .
/Vi

' \ .....:c.
i.. QJ"'~/
'.

'.

~J.iO ;~>'.

;".'I~.l i~

,l1.~lDi';

,.:..,.....

,,~~&(~.vr2

..;i~ec...;o, '>!!E!I!lli.
~ S ' : S " j,/:T,::;:"
u : S ~'IIlI:
"
'C':' c
Z."'-..,.:
g.oo~.

.ce.!;

'1!

Outra caracteristica 11tH do SPSSPW e 0 conselheiro estatistico. Voce pode utiliza-lo em


vez da Figura 4.11, para verificar que tipo de amUise deveria estar fazendo em seus dados.
Voce inicia 0 conselheiro estatistico por meio do menu Ajuda (Help).

~-Bo:S'...
z

s.c:
':I!';!U,

~ "'s'

c:i

III

;
... IIB.
~.l1.l.ti'.:"
5i
l..~
a~.
:,.'
:
~.'1j'~11"""."'"
E' E. II, !!. 2.'8.ii.'~r i .: ]
.ij'
.~
~;:"'i
g ".~. . :i']~'"
. ,,:I
-8: '~~l .']:'~'i-3'~8
:":; .~;7
":":""7-~

l'i" .. '
'.'j

.r,

'.!!l

,!.j;.!

1:7.]1.-' , .8!.

III

::!

:j;
.J,

:~.
.,\

(Qi

a
',".

,S :Xl:
. i;'S,

;9?2'~ ,(

:~.~~i""

,:~~.'O: ~

~t

E'.!!I~

'

~~;~'

0',

:'!i::!:j8: '8i~'-""
~ ; ~-....:!!.
""m
eli:
.!'.;""" -::s~,~_.r
.g~ ;rK~.
/E';.'
5i;;
ii:!:1lI. .GJ' ,....",

'~':-~~
.!~~
ic'1.!i~'O'
.,.,._
O:'.!f
~ucr~ '5,
, .s
-'-i-'q '1 -.g- ~.,:S, !!l........,'O;; ~;

", ""

~<

....1

~&I

<

Ja'

'6~ ~~'li1V/~:
;~{ts.:,~ "g:~;_
a::~ ~-.. '\ 0 ca.
~

"~'"~!"l ~;z.,
'->?ir",,,{-"'" -gt.g~

........ 1. . .

I!s.....c

:s

ca,

lo! .. ..

'1I0'B. ..
OII'B. l! 'g

:t~..S!

'0

1iJ
E
::J

Q)

'0

B
c:
Q)

a:

.!:

Q)
'0

o
ra
o

'0

.!!!

a.

.
ra

VI

'iij

E
o

'0

ra

.c
(5
u

11l
ra

ra

':;

01

E
o

:.;t
ill~,\.c;!

"",";-,~~.,- ,

l~~~';~
r-ijf~;~'l-':i; ;'"''E~!: ., ..
"'V,--! '

;:":~\i::il!Q:

::J

;;::
Q)

'0

E
~
01

ra

.~VZ~

~tt."'J,

169

is

Clique no Statistics Coach (Conselheiro Estatistico). Vma vez iniciado, sera apresentada
uma tela solicitando 0 que voce quer fazer. Havera vmas o~Oes a disposi~iio, tais como
Summarize (Resumir), Describe or present data (Descrever ou apresentar clados) e Compare
groups for significant differences (Comparar gropos para diferen~as significativas).

170

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

171

Voce deve entao responder as questOes relevantes apresentadas na tela. Apos cada con
junto de op~oes clique no botlio Next (Seguinte) para ir a pr6xima tela. A medida que voce
executa as escolhas, pode notar que os exemplos de saida do SPSSPW no painel esquerdo da
tela se alteram para refletir as escolhas feitas.

:' BOtoes de
:-'naveg~o

No lado esquerdo da tela, sao apresentados exemplos de saidas do SPSS. Na parte infe
rior direita da tela, existem varios botOes para navega~ao por meio do conselheiro estatistico.
Uma vez feita a escolha, clique no botao Next (Seguinte). Aparecerao mais algumas op~oes
relacionadas com 0 que fazer. Como exemplo, selecionamos a o~ao Compare groups for
significant differences (Comparar grupos para diferen~as significativas).

~:~~i::2a

Oique em Next
(Seguinte) para
ir II pr6Ximit tela

Haven! uma serie dessas telas para cada tipo de analise que voce pode querer fazer. Va
respondendo as questoes e c1icando no botlio Next (Seguinte) ate que apare~a uma tela com 0
botlio Finish (Final) em vez do bollio Next (Seguinte).

172

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicol09ia

173

Resumo
Neste capftulo, avanr;amos no terreno da estatfstica inferencial e estabelecemos as fun
dar;oes finais para voce enfrentar as tecnicas estatfsticas inferenciais mais freqiientemente
utilizadas na psicologia. Voce aprendeu que:

Uma vez feita sua ultima seler;ao, clique no botao Finish (Final). 0 SPSSPW saini do
conselheiro estatfstico e retornara para ajanela de dados (Data screen). Voce notara que 0
prograrna selecionou 0 teste relevante a partir dos menus. Havera uma caixa de diaIogos aber
ta para 0 teste que precisa. Tarnbem estara disponfvel umajanela aberta de ajuda que contern
inforrnar;6es relacionadas a esse teste em particular. Por exemplo, neste caso, aparecera uma
caixa de diaIogos do teste t (veja Capftulo 6). Entao, voce pode rodar as anaIises relevantes
nos seus dados.

:.JIWJ;~~~j

:~4~1r~~:

...

Compare Means

-,,-.._._.._
grouP')

Click DefIne (ir~s and Iplc",""a Y1ItvII of

!he groulllngnl1able Ihat dillne lhe rwa groups.

Esperarnos que a esta altura voce tenha urn born conhecimento conceitual das abordagens
descritiva e inferencial para analisar urn conjunto de dados. Nos capftulos restantes, com
excer;ao do Capftulo 7, descreveremos testes estatfsticos especfficos com mais detalhes. No
entanto, voce deve sempre ter em mente quando ler esses capftulos que tais testes se fund a
mentam nos conceitos introduzidos nos capftulos iniciais.

SPSSPW

Exercicio 1

Independent-Slmpl,s TTtsl

nrl'bl.

Podem ser feitas predir;oes unidirecionais (unilaterais) e nao-direcionais (bilaterais)


e como elas estao relacionadas com as distribuir;6es de probabilidade.
Predir;6es bilaterais sao aquelas nas quais prevemos uma diferenr;a entre duas
condir;6es (ou relacionarnento entre duas variaveis), mas nao especificarnos a di
rer;ao da diferenr;a (ou relacionamemo).
Predir;oes unilaterais sao aquelas nas quais especificarnos a direr;ao de uma dife
renr;a ou relacionarnento..

Exerdcios para

sefid on. ormo.. continuous. numlrk Iillt


QfIabllt.A, IIplratel test 18 computed l'or 11th

Select I dlchCltllmous grouping Yltllbll (I

Ha uma 16gica por tras dos testes de hip6teses e significlincia estatfstica.


A hip6tese nula representa 0 contnirio da hip6tese experimental.
Podemos utilizar as distribuir;6es de probabilidade para verificar as chances de que os
efeitos em nossa pesquisa sejam oriundos de erro amostral. caso a hip6tese nula seja
,
verdadeira.
Embora os testes de hip6teses constituam os principais metodos de pesquisa em
psicologia, existe em sentimento crescente de que apresentam Iimitar;6es no estabe
lecimento de conclus6es significativas a partir dos dados.
Como resultado disso, sugerimos vanas forrnas de suplementar os resultados de urn
teste de hip6teses com estatfsticas mais significativas, como, por exemplo, 0 tarnanho
do efeito e os intervalos de confianr;a.
Nos testes de hip6teses, existem dois tipos de erros (erros dos Tipos I e II) que podem
ser cometidos quando obtemos conclus6es a partir dos dados:
- Erro do Tipo Ie rejeitar a hip6tese nula quando verdadeira.
- Erro do Tipo II e aceitar a hip6tese nula quando falsa.

-:y

A professora Yob esta interessada na violencia de massa durante as partidas de futebol.


Ela pensa que a violencia do gropo e resultado dos assentos descoofortaveis do estadio. Por
isso, Yob modifica dois est3dios diferentes na Inglaterra. Em urn esIlidio coloca assentos bern
apertados e desconfortaveis. No outro. instala assentos confortaveis, com muito espar;o para
as pernas e entre os assentos adjacentes. A professora organiza uma competir;ao, de modo
que urn c1ube jogue metade das partidas em urn est3dio e a outra metade no outro est3dio. Ela
acompanha urn gropo de doze ras adolescentes agressivos e grosseiros do c1ube e registra 0
numero de vezes que cada urn e presQ ou expulso do estadio. Preve que 0 numero de pris6es
e expulsoes sera maior no estadio que apresenta os assentos mais desconfortaveis e obtem os
dados da Tabela 4.2.

174

Estat[stica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Tabela 4.2

Numero de ocorreneias envo1vendo os 12 jovens em eada urn dos estadios

'A~~""

.~'~~d;':;'::."": ":'~"~o~~eI

llIbela 4.3 Numero de infinitivos divididos utilizados por pesquisadores antes e depois da sene
Jomada nos Estre/as
.;.:.

1
2
3
4
5

6
7
8
9
10
II
12

8
5
4
6
4
8
9

2
4

6
2
I

10
7

6
3
4

8
6

I
4

I. Este e urn delinearnento entre ou dentre participantes?


2. Que tipo de variavel a professora Yob rnediu, discreta ou continua?
3. (a) Qual e variavel independente?
(b) Qual e variavel dependente?
4. Este e urn teste unilateral ou bilateral?
5. Qual e a hip6tese nula?

175

',0

~~l':i;'/ :'>~:~~J~~nF~#X~t;,,~,~:~~~~,~~!#
.
I

2
3
4
5
6
7
8
9
10
II
12

I. Este e urn delineamento entre ou dentre participantes?


2. Que tipo de variavel 0 professor Pedante rnediu: categoriea, discreta ou continua?
3. (a) Qual e variavel independente?
(b) Qual e variavel dependente?
4. Este e urn teste unilateral ou bilateral?
5. Qual e a hip6tese nula?

6. Insira os dados no SPSSPW e fa<ra 0 seguinte para cada eondi<rlio:


Diagrama de barras de erro
Media
Desvio padrlio
Erro padrlio
Intervalos de eonfian<ra de 95%

6. Insira os dados no SPSSPW e fa<ra 0 seguinte para cada condi<rlio:


Diagrama de barras para 0 erro
Media
Desvio padrlio
Erro padrlio
Intervalos de confian<ra de 95%

7. Converta 0 primeiro escore de cada condi<rlio em urn escore padronizado (valor z).

7. Converta 0 prirneiro eseore de cada condi<rlio em urn escore padronizado (valor z).

Exercicio 2

o doutor Pedante e apaixonado por linguagern e, particularmente, nlio gosta do in


finitivo dividido (p. ex., corajosamente ir onde nenhum homem esteve antes eontern urn
infinitivo dividido e ir corajosamente onde nenhum homem esteve antes nlio contern). Ele
culpa a popularidade da serie Jomada nas Estre/as nos anos de 1970 pela prolifera<rlio do
infinitivo dividido nas publica<roes que relatarn pesquisas. Dessa forma, ele selecionou 12
psic610gos que publicararn pesquisas em periodicos, antes e depois que a serie Jornada
nas Estre/as fosse apresentada na televislio pela prirneira vez. Ele avaliou as ultirnas 20
publica<roes de cada pesquisador, antes e depois que a serie foi televisionada, e contou 0
nurnero de infinitivos divididos utilizados. Previu que 0 nurnero de infinitivos divididos
seria rnaior nas publica<roes feitas ap6s a serie ter tornado-se popular na televislio e obteve
os dados da Tabela 4.3.
* N. de T. Na lingua inglesa. isso faz sentido. pois 0 exemplo dado (10 boldl)' go where no man has gone before) seria urn infinitivo
dividido. isla e. 0 adverbio est:i entre 0 10 e 0 verbo go. J3 em 10 go boldly where no man has gone before 0 adv/!rbio est~ depois do
verbo. Esse tipo de construlJao nao e'lisle na lingua portuguesa.

176

Christine P. Dancey & John Reidy

QUESTOES DE MULTIPLA ESCOLHA


1. Urn erro do TIpo II ocorre quando:
(a) A hip6tese nula nlio e rejeitada quando de
veria ter sido
(b) A hip6tese nula e rejeitada quando deveria ter
side
(c) A hip6tese nula e rejeitada quando nlio deve
ria ter side
(d) A hip6tese nula nlio e rejeitada quando nlio
deveria ter side
2. Qual a base ou a 16gica dos testes estatfsticos infe
renciais?
(a) Deterrninar a probabilidade de se obter urn
efeito devido ao erro amostral quando a hip6
tese nula e verdadeira
(b) Deterrninar a probabilidade de obter urn efei
to devido ao erro amostral quando a hip6tese
nula e falsa
(c) Detenninar a probabilidade de se cometer urn
erro do Tipo II
(d) Todas as altemativas
3. Se voce obtem urn valor-p unilateral igual a 0,02, 0
valor-p bilateral equivalente e:
(a)
(b)
(c)
(d)

0,01
0,04
0,02
0,40

4. Se voce preve que duas variaveis A e B estlio rela


cionadas, qual e a hip6tese nula?
(a)
(b)
(c)
(d)

Que existe relacionamento entre A e B


Que A sera maior que B
Que nlio existe diferen~a entre A e B
Nenhuma das altemativas

5. 0 poder de urn experimento e:


(a)

(b) A habilidade de 0 pesquisador rejeitar a hip6

tese nu)a quando e, de fato, falsa


(c) A sensibilidade dos panicipantes 11 manipula
~lio experimental
(d) Todas as altemativas
6. Quando prevemos que a condi~lio A e maior que a
condi~lio B, fazemos:
(a)
(b)
(c)
(d)

Uma previslio unilateral


Uma previslio bilateral
Uma previslio unidirecional
Altemativas (a) e (c)

7. A probabilidade de que urn efeito surja devido


ao erro amostral caso a hip6tese nula seja verda
deira e:

Estatistica sem Matematica para Psicologia

(a) Desprezivel
(b) a
(c) ~

(d) Nenhuma das altemativas


8. Se voce obtem 0 valor p bilateral de 0,02, 0 valor p
unilateral equivalente sera:
(a) 0,01
(b) 0,04
(c) 0,02

(d) 0,40
9. Se prevemos que existe uma diferen~a entre as
condi~oes A e B, fazemos:
(a)
(b)
(c)
(d)

Uma previslio unilateral


Uma previslio bilateral
Uma previslio nula
Altemativas (b) e (c)

10. Se voce obtem urn

a de 4%, 0 que isso significa?

(a) A probabilidade de que a hip6tese nula seja


verdadeira e 4%
(b) A probabilidade de que a hip6tese nula seja
falsa e 4%
(c) A probabilidade de se obter 0 efeito por erro
amostral se a hip6tese nula for verdadeira e 4%
(d) Todas as altemativas
II. Se voce preve que nlio existe diferen~a entre as
condi~Oes A e B, qual e a hip6tese nula?
(a)
(b)
(c)
(d)

A condi~lio A sera maior do que a condi~lio B


A condi~lio B sera maior do que a condi~lio A
A condi~lio A esta relacionada 11 condi~lio B
Nlio existinl diferen~a entre as condi~Oes A e B

12. Se rejeitarmos a hip6tese nula quando verdadeira:


(a)
(b)
(c)
(d)

Cometeremos urn erro do Tipo I


Cometeremos urn erro do Tipo II
Realizaremos urn progresso cientffico
Altemativas (b) e (c)

13. Quais das seguintes slio hip6teses concementes ao


uso dos testes parametricos?
(a) Os dados devem estar normalmente distri
bufdos
(b) As amostras testadas devem ter aproximada
mente as mesmas variancias
(c) Nlio devemos ter valores extremos
(d) Todas as altemativas
14. Urn erro do Tipo II significa:
(a) Que rejeitamos a hip6tese nula quando ver
dadeira
(b) Que aceitamos a hip6tese experimental quan
do falsa
(c) Que aceitamos a hip6tese nula quando falsa
(d) Nenhuma das altemativas

15. Uma pesquisadora conduziu urn estudo sobre tem


pos de rea~lio com 20 panicipantes em cada uma
das duas condi~Oes. Ela constatou que a varian
cia da primeira condi~lio e de 2 segundos, e a da
segunda, de 14 segundos. Qual das seguinles afir
ma~Oes e verdadeira?
(a) Ela nlio deve utilizar urn teste parametrico
porque a condi~lio da homogeneidade das va
riancias nlio esta satisfeita
(b) EJa satisfez todos os requisitos para 0 uso de
urn teste parametrico
(c) Ela nlio tern homogeneidade de variancias,
mas ainda assim pode utilizar urn teste pa
rametrico, pois possui amostras do mesmo
tamanho
(d) Nenhuma das altemativas
16. Como representamos 0 poder de urn teste?
(a) a
(b) ~
(c) I - a
(d) I ~

177

Emais faci! se oblerem resuhados significati


vos com esse a
(d) Altemativas (a) e (b)

(c)

\8. Quando convertemos nossos dados em urn valor


de uma distribui~o de probabilidade, como e de
nominado 0 resultado obtido?
(a)
(b)
(c)
(d)

Significativo
Nlio-significativo
Estatfstica teste
Poder do estudo

19. lmagille que conduzimos dois estudos. No estudo A,


temos 1000 participantes e obtemos urn valor p de
0,0 I, enquanto no estudo B temos apenas 20 partici
pantes e urn valor p de 0,05. Em qual desses estudos
existe 0 maior efeito?
(a)
(b)
(c)
(d)

Estudo A
Estudo B
0 efeito eo mesmo nos dois estudos
Nlio podemos responder a questlio com base
nas inforrna~Oes dadas

17. Por que nonnalmente utilizamos uma significlincia


deO,05?

20. Se voce constata em urn eSlUdo que 0 valor p e


0,05, qual e a probabilidade de que a hip6tese al
temativa seja verdadeira?

E urn nfvel tradicional utilizado pela maioria


dos psic610gos
(b) Esse valor representa urn born balanceamento
entre a possibilidade de se cometerem erros
dos Tipos I e II

(a) 0,05
(b) I menos 0,05
(c) Nlio podemos determinar a probabilidade de
que a hip6tese altemativa seja verdadeira
(d) Nenhuma das altemativas

(a)

Referencias
BAKER, R. et aI. Emotional processing and panic. Behaviour Research and Therapy v. 42, n. \\, p.
1271-87, November 2004.
CLARK-CARTER, D. Effect size: the missing piece of the jigsaw. The Psychologist. v. 16, p. 636-38,
2003.
DRACUP, C. Hypothesis testing - what it really is. The Psychologist. v. 8, p. 359-62, 1995.
HOWELL, D. C. Statistical Methodsfor Psychology. 5" ed. Wadsworth. 2002.
LOFfUS, G. R. On the tyranny of hypothesis testing in the social sciences. Contemporary
Psychology. v. 36. n. 2, p. 102-05, 1991.
LOFfUS, G. R. Psychology will be a much better science when we change the way we analyze data.
Current Directions in Psychological Sciellce. v. 5, p. 161-71, 1996.
MOGG, K., MATHEWS, A., WEINMAN, J. Memory bias in clinical anxiety. Journal ofAbnonnal
Psychology. v. 96, p. 94-8, \987.
PARKINSON, B. Anger on and off the road. British Journal ofPsychology. v. 92, p. 507-26, 2001.
REIDY, 1., RICHARDS, A. A memory bias for threat in high-trait anxiety. Personolity and Individual
Differences. v. 23, p. 653-63, 1997.
RICHARDS, A., FRENCH, C. C. Effects of eocoding and anxiety on implicit and explicit memory
performance. Personality and Individual Differences. v. 12, p. 131-09, 1991.
WALSH, 1. J., UGUMBA-AGWUNOBI, G. Individual differences in statistics anxiety: the roles of
perfectionism, procrastination and trait anxiety. Personality and Individual Differences. v. 33, p.
239-5 1,2002.

."-_ ..... .

~ ..,.~

Estatistica sem Matematica para Psicologia

Analise de Correla~ao:

o r de Pearson

que co-variam: quando os valores em uma variavel mudam, valores na outra variavel tambern
mudam, de maneira previsivel. Em outras palavras, as duas variaveis nao sao independentes.

5.1.1

Nos primeiros quatro capitulos, apresentamos a estrutura basica necessaria para entender as
analises estatisticas contidas no restante do livro. E importante que voce tenha entendido todos
os conceitos apresentados nos capitulos anteriores. Para verificar seu conhecimento, voce pode
resolver as atividades e quest6es de multi pia escolha presentes no final de cada capitulo. Se achar
que existe algo que ainda nao entendeu, vale a pena voltar ao capitulo em questao e ter certeza
de que compreendeu 0 conceito completamente. Uma vez confiante de que domina todos os
conceitos, estara pronto para lidar com as analises estatisticas mais exigentes apresentadas de
agora em diante. Ter realmente entendido os conceitos anteriores facilitara seu percurso pelo
restante do livro. Nos primeiros quatro capitulos, voce foi apresentado a ideia de observar as
rela~6es entre variaveis, como, por exemplo, entre horas de estudo e desempenho em exames.
as psic6/ogos muitas vezes procuram saber se existe um relacionamento significativo ou uma
associa~ao entre duas variaveis. Esse e0 assunto do presente capitulo.
Voce precisara ter um entendimento do seguinte:
hip6teses uni e bicaudal (Capitulo 4)
significancia estatistica (Capitulo 4)
intervalos de confian~a (Capitulo 3)

analise e relato de estudos usando analise de correlac;ao


r - um tamanho do efeito natural
limites de confianc;a em torno de r

5.1

Correla~oes bivariadas
Denominamos 0 relacionamento entre duas variaveis de correlafuo bivariada. Se as duas
variaveis sao associadas, dizemos que sao co-relacionadas (correlacionadas). Isso significa

Obten~o de

conclusoes a partir da analise de

correla~ao

Urn relacionamento correlacional nao pode ser considerado como se sugerisse causalida
de. Lembre-se de que, no Capitulo I, informamos que voce nao pode sugerir causalidade com
correla<;6es. Se uma associa<;ao significante existe entre duas variaveis, nao quer dizer que x
cause you, alternadamente, que y cause x. Considere 0 seguinte exemplo. 1a se demonstrou
que existe urn relacionamento positivo significante entre os salarios de pastores presbiteria
nos em Massachusetts e 0 pre<;o de rum em Havana. Nesse caso, e obviamente inapropriado
argumentar que uma variavel causa a outra. Como Huff (1973), que providenciou esse exem
plo, observou, nao e necessario inferir causalidade, pois a explica<;ao mais 6bvia e que ambas
as figuras estejam crescendo devido a urn terceiro fator - 0 aumento mundial nos pre<;os de
praticamente tudo!
Portanto, as vezes duas variaveis sao relacionadas estatisticamente, mas nao existe uma
real associa<;ao entre elas. Os resultados significantes refletem a influencia de uma terceira
variavel.
E tambem possivel produzir uma correla<;ao significativa completamente espuria entre
duas variaveis na ausencia de uma terceira que influencie as outras duas. Por exemplo, em
uma ocasiao pedimos aos nossos alunos que fizessem uma analise de correla<;ao de algumas
vari<iveis. Quando fazemos isso no computador, e muito facil cometer 0 erro de incluir varia
veis que nao sao relevantes. Urn de nossos alunos incluiu "numero de participantes" com as
outras variaveis, erroneamente. Mostrou-nos que "numero de participantes" tinha uma alta
correla<;ao positiva com auto-estima, uma das variaveis. Eimportante, portanto, ter em mente
a possibilidade de que urn relacionamento demonstrado por uma analise de correla<;iio pode
ser espurio.
o exame de relacionamentos entre variaveis pode incluir os seguintes passos:

Panorama do capitulo

Neste capitulo, discutiremos maneiras pelas quais podemos analisar relacionamentos ou as


sociac;6es entre variaveis. No capitulo anterior, falamos sobre 0 relacionamento entre tempo de
estudo e desempenho em exames. Para descobrirmos se tal relacionamento existe, tomamos
um numero de alunos e registramos quantas horas por unidade de tempo (p. ex., por semana)
eles passam estudando e depois medimos seu desempenho nos exames. Tivemos, entao, dois
conjuntos de dados (ou duas variaveis). Analises de correlac;ao nos dao uma medida da relac;ao
entre eles. No Capitulo 4, sugerimos que somos capazes de calcular a medida da forc;a desse
relacionamento: a analise de correla~ao nos da tal medida.
Neste capitulo, discutiremos 0 seguinte:

179

I. Inspe<;ao dos diagramas de dispersuo (ver a seguir).


2. Teste estatistico chamado r de Pearson, que nos mostra a magnitude e 0 grau de
relacionamento e a probabilidade de tal relacionamento ocorrer devido ao erro
amostral, dado que a hipotese nula seja verdadeira
3. Limites de confian<;a em tome do teste estatistico r, quando apropriado.

5.1.2

Objetivos da analise de correla~ao

o proposito, portanto, de se fazer uma analise de correla<;ao e descobrir se existe urn


relacionamento entre as variaveis, que e improvavel de acontecer devido ao erro amostral
(considerando a hip6tese nula verdadeira). A hip6tese nula de que nao existe relaciona
mento real entre as duas variaveis. Entretanto, essa nao e a unica inforrna<;ao que a analise de
correla<;ao oferece. Ela tambem nos perrnite determinar:

A dire<;ao do relacionamento - se epositivo, negativo ou zero.


A for<;a ou magnitude do relacionamento entre as duas variaveis - 0 teste estatfstico,
chamado de coeficiente de correlafuo, varia de 0 (nenhuma rela<;ao entre as varia
veis) a I (rela<;ao perfeita entre as variaveis).
Esses dois pontos sao discutidos em mais detaIhes a seguir.

180

5.1.3

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Urn relacionamento positivo perfeito e demonstrado no diagrama de dispersao da Figura


5.1. Eaquele no qual todos os pontos do diagrama encontram-se em linha reta. Por exemplo,
pense na sua idade plotada contra a idade da sua irma (e claro que esse nao e urn exemplo
realista. Ninguem iria realmente querer correlacionar a sua idade com a da irma - e somente
urn exemplo). No exemplo a seguir, considerarnos que sua irma e quatro anos mais velha do
que voce. Designamos a idade da sua irma ao eixo vertical (y) e sua idade ao eixo horizontal
(x) e para cada par de idades colocarnos urn ponto no diagrama de dispersao. Deve ser 6bvio
que 0 relacionamento e positivo: quando voce envelhece, sua irma tambem envelhece. 0 re
lacionamento tambem deve ser perfeito: para cada ana que voce envelhece, sua irma tambem
envelhece urn ano.
Eimportante entender que 0 exemplo mostra qUc!'Voce nao pode inferir causalidade quan
do executa a correla~ao. 0 aumento da sua idade nao causa 0 aumento da idade de sua irma,
nem 0 envelhecimento dela causa 0 seu!

Direc;ao do relacionamento

Positivo
Valores altos em uma variavel (que chamamos de x) tendem a ser associados com valores
altos na outra variavel (que chamamos de y). Ao contrario, valores baixos na variavel x ten
dem a ser associados com valores baixos na variavel y.

Negativo
Valores altos em uma variavel sao associ ados com valores baixos na outra variavel.

Zero
Relacionamentos zero sao aqueles nos quais nao existe urn relacionamento linear (linha
reta) entre as duas variaveis (0 que queremos dizer com 0 termo "relacionamento linear" sera
explicado mais tarde. Agora, vamos supor que a ausencia de urn relacionamento linear signi
fica a ausencia de relacionamento entre as duas variaveis).
Agora pense na dire~ao dos relacionamentos dos exemplos mencionados.

18
16

12

"0

10

Ja se mencionou que, em relacionarnentos positivos, valores altos numa variavel sao as


sociados a valores altos na outra, e vice-versa. Podemos observar esse relacionamento ao
plotarmos os valores em urn grafico chamado diagrama de dispersao (scatterplot). Quando
executamos uma correla~ao bivariada, temos dois conjuntos de valores (escores). Quando
plotamos os valores em urn diagrarna de dispersao, designarnos uma variavel ao eixo horizon
tal- esse chamado de x. Designarnos a outra variavel ao eixo vertical- chamado de y. Nao
importa qual variavel designamos ao x equal ao y.
Para construir urn diagrarna de dispersao, tomamos 0 valor de cada pessoa nos eixos x e
y e os plotarnos para onde os dois se encontram. Cada ponto representa dois valores (x e y).
Voce foi apresentado a constru~ao de diagrarnas de dispersao (usando 0 SPSSPW) na Se~ao
5 do Capitulo 2, mas aqui varnos considerar mais detalhes.

~~

:L
0

5.1.5

Vab- d~i~lf'7.'
.vaJor dl! Y.F; ~~ ..

(dais valores,mas
somente um ponto).

"i

:!2

Relacionamentos positivos perfeitos

CII

Idade de motorista e acidentes de carro

5.1.4

14

'"ro

Era de se esperar que 0 numero de horas de estudo tivesse urn relacionamento positivo
com desempenho em exarnes - quanto mais tempo urn a1uno passa estudando, melhor 0 de
sempenho.

,ro

.~

Numero de horas de estudo e desempenho em exames

A idade do motorista associada a acidentes de carro, mas dessa vez 0 relacionarnento


negativo. Lawon e colaboradores (1997) descobriu que ambos 0 sexo e a idade do motorista
estavam correlacionados com a taxa de acidentes, tendo jovens do sexo masculino maior
probabilidade de sofrer urn acidente.

181

tin~:~~.<

irilli tin~J;~':';

6
8
Suaidade

10

12

14

Sua idade e da sua irma.

Relacionamentos positivos imperfeitos


Vamos imaginar que temos urn numero de a1unos, os quais avaliamos em testes de QI e
notas percentuais em urn exarne. Queremos determinar se existe urn relacionamento entre QI
e notas em exames. Isso nao significa que 0 QI causa as notas nos exames dos alunos, nem
que as notas nos exames afetam os QIs de a1guma maneira. Urn QI alto ou baixo e notas altas
ou baixas poderiam ter side causadas por varios fatores - cursos preparat6rios, pratica em
testes de QI e motiva~ao sao alguns.
Decidimos designar os valores de QI ao eixo vertical (y) e as notas dos exames ao eixo hori
zontal (x). Cada a1uno tern dois escores, urn de QI e uma nota de exame. Entretanto, cada a1uno
contribui com somente urn ponto no diagrama de dispersao, como e possivel ver na Figura 5.2.
o diagrama nos mostra que QIs altos tendem a ser associados com notas a1tas em exames,
e QIs baixos, a notas baixas. Nesse caso a correla~ao nao e perfeita. Entretanto, a tendencia
esta presente, e isso 0 que imporla. Embora os pontos nao estejam em Iinha reta, ainda urn
relacionamento linear positivo, pois formam urn padriio visivel, do canto inferior da esquerda
ao canto superior da direita.

182

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

140

Imagine uma maquina de vendas de chocolate, no qual cada barra de chocolate custa
50 centavos de libra. No inicio do dia, urn representante coloca dez barras de chocolate na
maquina. Levando em consideralfao que ela funciona como deveria (quer dizer, nenhum cho
colate fica preso, a maquina aceita 0 dinheiro, devolve 0 troco correto, etc.; bern, talvez seja
pouco realista, mas vamos acreditar), cada vez que alguem coloca 50 centavos de libra, a
barra de chocolate e ejetada, e uma a menDs fica na maquina.
Como se pode ver, com urn relacionamento linear negativo perfeito, os pontos ainda for
mam uma linha reta, mas dessa vez vao do canto superior esquerdo ao canto inferior direito.

130

., ....

120

. .

5
110

183

100

5.1.7

90
0

10

20

40

30

50

Com urn relacionamento linear negativo imperfeito, os pontos nao comp6em uma linha
reta, mas ainda formam urn padrao visivel, do canto superior esquerdo em direlfao ao canto
inferior direito. Digamos que tivessemos coletado dados de presenlfa aos jogos de criquete
e ocorrencia de chuva. 0 diagrama de dispersao resultante pode parecer algo como 0 da
Figura 5.4.
Geralmente a tendencia e que a presenlfa em jogos de cnquete seja menor quando chove
mais.

Notas na prova
Diagrama de dispersao do QI e notas em uma aprova.

[~)=~de
5.1
;.
....

Relacionamentos negativos imperfeitos

40

....

'.

. ... , . '

;~~;.~.:J~~liiF?lent ;~ pensar em algu~s. relaci~namentos positivos bivariados. 05 seus exemplos t!m a

-:,~ ?,'~~:i~~~.bl"dade de serem POSitIVOS? Discuta seus exemplos comoutros. Voc! c~>ncorda que seus
,_~~~~~Pl.i:is
sejam bons?
d:t::} ~,.~,.. ,;'__ .,~.~~'''~', "--" "
..

v;-

~ 30

U'

c:

5.1.6

Relacionamentos negativos perfeitos

Ii:

Novamente, devido ao fato de configurarem urn relacionamento perfeito, os pontos no


diagrama de dispersao formam uma linha reta. Cada vez que x aumenta, y diminui urn deter
minado valor de forma constante.

20

10
0

6
Precipita~ao

10

10

12

14

(em por mes)

Diagrama de dispersao de presenc;a em jogos de criquete e precipitac;ao.

0u

.s::

5.1.8

0
0,0

0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

Dinheiro (RS)
Grafico do relacionamento entre barras de chocolate na maquina e a quantia de
dinheiro depositada nela.

Relacionamentos nao-Iineares
Note que, se urn relacionamento niio e significativo estatisticamente, pode nao ser apro
priado inferir que niio existe relacionamento entre as duas variaveis. 1550 se deve ao fato de,
como mencionado anteriormente, a analise de correlalf30 testar para ver se existe urn relacio
namento linear.
Alguns relacionamentos nao sao lineares. Urn exemplo de tal relacionamento eaquele en
tre excitalfao e desempenho. Embora antecipassemos que certo nive! de excitalf30 melhorana
o desempenho esportivo, excesso de excitalfao poderia levar a urn detrimento do desempenho.
Tal relacionamento e descrito pela Lei de Yerkes-Dodson (Yerkes e Dodson, !908). Essa lei

184

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

185

:t~~3w.lli'

preve urn relacionarnento curvilfneo invertido entre excitaerao e desernpenho. Com baixos
nlveis de excitaerao, 0 desempenho (p. ex., desempenho atletico) e menor do que quando 0
nlvel de excita~ao esta urn pouco mais alto. Existe urn nlvel de excitarrao "6timo", no qual 0
desempenho e 0 mais alto. Alem desse nlvel, a excitaerao, na verdade, diminui 0 desempenho.
Isso pode ser representado como moslra a Figura 5.5.
o mesmo relacionamento pode ser representado pelo diagrama de dispersao da Figura
5.6, que mostra urn relacionamento curvillneo, no qual x aumenta com y ate certo ponto e
entao diminui. 0 que queremos mostrar e que, sem duvida, existe urn relacionamento entre
x e y, mas 0 coeficiente de correlaerao nao e significativo estatisticamente, pois nao ha urn
relacionamento linear (Iinha reta). Por esse motivo, voce deve sempre verificar 0 diagrama
de dispersao antes de realizar sua analise, para ter certeza de que as variaveis nao sao rela
cionadas dessa maneira, pois, se 0 forem, nao faz sentido utilizar as tecnicas descritas neste
capitulo.

:~i

;1!f1}'''''

-)~Jt.

~fi
;~W)tIJ

Born

.c

t:

III

C.

r; ...

~
~

'. ;~3L::/,~f~~~~~\~

Cl

;'.:
:.: ,- }-~~{fit:!:t:~~';~t1::~.:'~: ;',1.; ( ;

Ruim

Baixo

~.~.....

Alto

.'
:<;~.~

Nivel de excita~ao

""",,-~-(' ,:.::;!? ~.".;ilx"1:I~r/;:; ;~ti\;ji!~L;!':.,,>

_ _ _HiPotese do U invertido (Lei de Yerkes-Dodson, 1908).

5.1.9
14
12

10
y

2
0

10

~ama de dispersao de urn relacionamento curvilineo entre x e y.

12

For91 ou magnitude do relacionamento

o grau de urn relacionamento linear entre duas variaveis e medido por uma estatlstica
chamada coeficiente de correla~iio, tambem conhecido como r, que varia entre 0 e -1 e de
o a 1. De fato, existem vanos tipos de coeficientes de correlarrao: os mais utilizados sao 0
r de Pearson (em nome de Karl Pearson, que criou 0 teste) e 0 p de Spearman (1/2 e 0 V de
Cramer sao os dois mencionados apenas de passagem). 0 nome completo do r de Pearson e
coeficiente de correlaerao momento-produto; e urn teste pararnetrico e sera apresentado nesse
capitulo. Voce deve se lembrar da pagina 155 do Capitulo 4, na qual se explicou que, para se
usar urn teste parametrico, temos de satisfazer certas suposierOes. A suposierao mais impor
tante e a de que os dados sao provenientes de uma populaerao norrnalmente distribuida. Se
voce tern urn grande numero de participantes, essa suposierao sera provavelmente satisfeita.
Se voce tern motivos para crer que esse nao e 0 caso, deve usar 0 equivalente nao-pararnetri
co do r de Pearson, chamado de p de Spearman (ver Capitulo 15).
Na Figura 5.1,0 relacionameoto e representado por + I: sinal de mais porque 0 relaciona
mento e positivo e 1 porque 0 relacionamento e perfeito. Na Figura 5.3, 0 relacionamento e
-1: menos, pois 0 relacionamentoe negativo, e 1, pois 0 relacionamento e perfeito.
Lembre-se: + 1 = relacionarnento positivo perfeito

-1 relacionarnento negativo perfeito

o diagrama na Figura 5.7 mostra os vanos graus dos coeficieotes de correlaerao.

. .. ,_ ... ,_... '"~,

186

Estatfstica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


20

... ........... .. .
..... .. .. ...
.
...
...
. ..

'"

..

.~

'"'"
0

187

10

..
....
..

.~

oS:
C

0
U

.
0
10

20

40

30

60

50

70

Idade
Diagrama de disperso3o da correla,,03o entre idade e conhecimentos gerais numa amostra
de estudantes (n = 143; r = 0,44).
20

.,
'"v

..

......
... ....
.
..
::.:.:-.
. :.. .. .... ....
..: ......
.
.
.

.
.
...
.. - : .... .. -.. .
.. . ....

.>

'2

Intensidade do relacionamento de coeficientes de correla,,03o positivos e negativos.

.
.

10

o diagrama da Figura 5.7 da a ideia de que -I e tao forte quanto +1. S6 porque 0 rela
cionamento e negativo nao significa que seja menos importante ou menos forte do que urn
relacionamento positivo. Como ja dito anterionnente, urn relacionamento positivo simples
mente significa que altos valores de x tendem a se relacionar com altos valores de y. e baixos
valores de x tendem a se relacionar com baixos valores de y. Ja em urn relacionamento nega
tivo, altos valores de x tendem a se relacionar com baixos valores de y.
Pode-se observar que designamos rotulos verbais a numeros - sao somente guias. Uma
correla9ao de 0,9 e forte. Obviamente, quanto mais pr6ximo a I (+ ou -) esta urn coeficiente
de correla9ao, mais forte e 0 relacionamento. Quanto mais proximo a 0 (que significa a au
sencia de relacionamento), mais fraca e a correla9ao. Correla90es de 0,4 a 0,5 sao moderadas.
o coeficiente de correla9ao mede a proximidade dos pontos.

;...JJ1'A"it:.V::-~ ..~.....!.t>-n::;.:;..FJ-;.!"'-~~':

<~<~-'

;.'_:'

~:

I-, .

.~~

"

.'';.:.

''1

',{~};f.~'~~8~~E~:;;:::t;: ,:::t;~~.~ . .; ,= " r'~";~;i' :'i:'


.. ':"''';';W;Uh1f.$fji~h\~ q.ecQirela~o de+O,2~. con~iderado:: "

.
:!!?":

}'~;;~i:~tr~!B~i:~~~~~~yit~~ ~~c~,): . ' .(~}:M~dera~o,; ..... (d):'F9~e":

'-_'. ;;.:1"',

Os diagramas de dispersao das Figuras 5.8 e 5.9 dao uma ideia do significado do coefi
ciente de correla9ao. A Figura 5.8 mostra que existe uma associa9ao positiva moderada entre
idade e conhecimentos gerais.

'i5
c.

-10

I i i

30

40

50

i i i

60

70

80

90

Necessidade de cognisao
Diagrama de disperso3o da correla~o3o entre necessidade de cogni,,03o e impedimenta
cognitivo (n = 143; r = -0,21).
Existe uma varia9ao entre 0 quanto as pessoas gostam de raciocinar e resolver problemas.
Psic61ogos criaram uma escala para medir esse construeto, que e chamado de necessidade de
cognil;iio (Cacioppo e Petty, 1982). As pessoas que gostam de resolver problemas terao uma
necessidade de cogni9ao mais alta do que aquelas que nao gostam. Alem do mais, algumas pes
soas evitarn atividades de resolu9ao de problemas, demonstrando urn impedimento cognitivo.
A correla9ao entre necessidade de cogni9ao e impedimento cognitivo em uma amostra de
estudantes demonstra que existe uma associa9iio negativa fraca entre ambos (ver Figura 5.9).
Se a correla9ao e zero, os pontos podem parecer aleatorios, e nao existe urn padrao dis
cemfvel. Portanto, nao ha urn relacionamento entre x e y.
A Figura 5.10 mostra que nao existe uma associa9ao entre reavalia9ao positiva e neces
sidade de cogni9ao.
Dados correlacionando (n = II, r =+0,68) faltar a escola e ser ca90ado por outros sao
apresentados na Figura 5.11. Existe urn relacionamento positivo moderado entre faltar a es
cola e ser ca90ado.
Existe uma associa9iio positiva forte entre ser ca90ado e sentir-se diferente dos outros
(n = II; r= +0,85) (ver Figura 5.12).

188

... . ....... .
. ......
......
.. ....
.. ......
...
...

.... .....
... . . ........ .... .... ......

.
. .

20

.'.,"

.>

.~

10

a.

,'0"

V'

.!!!
Iii
>

:E

189

Estatistica sem MaternMica para Psicologia

Christine P. Dancey & John Reidy

a::

!, ;"::

-10 I

30

40

50

60

70

80

90

!:-'

:'-'::;-':;':'1"::"

Necessidade de cogni~ao

Relacionamento zero entre reavaliac;ao positiva e necessidade de cognic;ao em uma


amostra de estudantes (n = 143; r = - 0,01).

;;,:

..

;:'.: .... \

".. ..."

'...:,

. ~ "..:

'

.;, >:-.>::.~.::;~~ I~':~"';;

12

. )".

';., .'
-.:... ;",

11
10

'"

"0

:;<
OJ

'"

Iii
u..

9
8

7
6

:'_1'_~A....~. :~~..::.~_.

~!~:l~~;~ljJl!~1

5
4

10

12

Ser ca~oado

Correlac;ao entre ser cac;oado por outros e faltar a escola (n

= 11; r = +0,85).

\~#A{~

.... -..\.....:!..:

- ," ", i:;',,: . ~ -,~

12

10

OJ

C
~

..

'5

e:

.~

C
OJ

Vl

.. ~:-.~'

"."-:

:,,:~-->:4

)"

;:~~-g,.l..

2
2

10

12

. . . . . , -J

,.. ><:;'; >.. ./:


:1:,;,,:

,"

:_.:,'.

, '.'

:'.,";

k-~:~:.:. ;.~.;

~.:

, ..... <\

,:.t~.'?:

:~, ~"-<:'<'~:~-' ~:''' ..'':-'.:


i

.::;

,",::-"

,.

Ca~oado

~orrelac;ao entre ser cac;oado e sentir-se diferente dos outros (n

= 11; r = +0,85).
I

IBS-MS (Irritable Bowel Syndrome _ Misconuprion Scale). Escala de conce~oes en6neas. sobre a srndrorne do inrcstino ini~vel.

190

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Pense nessa questao. Ir a igreja faz com que voce nao fique gravida?
Cerea de I/B.(}()() adolescentes engravidam por ano. e melade de lodos os pais solleiros lem
menos que 25 anos. 0 Reino Unido lem a laxa de div6reio mais alIa da Europa e 0 maior numero
de adolescentes gravidas. embora a laxa de gravidez na adolescblcia em oulros paises eSleja
crescendo rapidamenle. 0 unico rnolivo deleelado pela eslalislica estd relacionado a igreja. A
freqiincia com que as pessoas vao a igreja comel;0u a diminuir no Reino Unido allIes dos oUlros
paises. Em lodo os lugares onde afreqiiencia ii igreja diminui. aumenta a quantidade de div6rcios
e pais solleiros. (Polly Toynbee. Radio TIme. 20-26 de marI;o de /993)

Vamos dar novamente uma olhada em urn relacionamento perfeito (Figura 5.13).

140

,Esc;6redlt

: S6armi~i,

120
100

(~.) EXEMPLO: TEMPERATURA EVENDA DE SORVETES


Vamos imaginar que fizemos uma analise correlacional entre 0 numero de sorvetes
de casquinha comprados em uma camionete estacionada em frente a sua universidade e a
temperatura. Perguntamos ao vendedor, chamado Vendemuito, quantas casquinhas foram
vendidas em cada dia. Coletamos os dados durante urn perfodo de 20 dias. Agora precisa
mos saber se 0 numero de sorvetes vendidos varia com a temperatura. Prevemos que, de
acordo com leitura previa, a venda de sorvete aumentaria com 0 aumento da temperatura.
Essa e uma hip6tese unilateral. Os dados sao apresentados na Tabela 5.1.
Agora fica facil ver como plotar urn diagrama ere-dispersao it mao, embora possa ser
tedioso quando temos muitos escores. Naturalmente, 0 SPSSPW faz esse trabalho melhor
do que n6s! Instru~5es de como obter diagramas de dispersao foram dadas na pagina 82
do Capitulo 2.
Podemos ver no diagrama da Figura 5.14 que a temperatura eo numero de sorvetes de
casquinha vendidos estao relacionados. Obviamente, nao e uma correla~ao perfeita, mas
basta olhar os dados para vermos uma correla~ao positiva.

80

{E

Tabela 5.1

Dados dos nurneros de sorvetes de casquinha vendidos ern dias com diferentes

60

ternperaturas

40

;;ii~C~~1.~!'t'~':",,1\lIIIperatunl "
1000

20

0
0

10

20

30

Teste 1

__

191

Relacionamento linear perfeito.

Imagine que essa figura representa 0 relacionamento perfeito entre os escores em dois
testes, Teste I e Teste 2. 0 fato de essa ser uma correla~ao perfeita signiflca que a posi~ao
relativa dos participantes e exatamente a mesma para cada teste. Quer dizer, se Shannini tern
o melhor escore no Teste I (no exemplo acima e 23), tambern tera 0 melhor escore no Teste
2 (130). 0 contnirio tambem e verdade: 0 participante com 0 menor escore no Teste I teni 0
menor escore no Teste 2.
Como dito anteriormente, relacionamentos perfeitos sao raros, mas 0 mesmo raciocinio
se aplica aos relacionamentos imperfeitos. Para calcular 0 coeficiente de correla~ao, e neces
sario relacionar a posi~ao relativa de cada participante em uma variavel it sua posi~ao relativa
na segunda variavel.

~~~~:_~~::;i~~~;N~~~~:~~:,h.~
550

26
22

950
870
890
886

19
20
19

900

21

560
550

17
16

400
500

12

14
19

600
700

21

750

22

800

22

24

850
950
1050

22
26
26

1000
1000

13

26

1100
1000

'" 900

'"

QI
~

800

"'0

600

500

'"

"'0

700

. .

l:

400
300
10

12

14

16

18

20

22

24

26

28

Temperatura

Diagrama de dispersao dos dados de venda de sorvete de casquinha.

192

Christine P. Dancey & John Reidy

191~ffi~:~~~.~~~~Jl'c,,!,g~1
'", "~

.''::~',

,':,

193

Estatistica sem Matematica para Psicologia

~,'

. ,;l:";::.;~~~':./:._. ','

.,.

p',

'.'~.

)';.;:

~:

'

Agora queremos saber 0 valor do coeficiente de correlar;ao e a probabilidade associada,


portanto vamos ao SPSSPW. Nossos dados ja foram colocados no SPSSFW, entao agora sele
cionamos Analyze, Correlate, Bivariate (Analisar, Correlacionar, Bivaria"ao).

Mude ambas as variaveis do lade esquerdo para 0 lado direito. Tenha certeza de que as
op"Oes Pearson e One-tailed (unicaudal) foram selecionadas. Depois, clique em OK. Serao
obtidos os resultados.
Observemos a sarda do SPSSPW. Os resultados importantes para os seus relat6rios sao
os seguintes:
0 coeficiente de correla"ao (r) mostra 0 grau em que nossas variaveis se relacionam
umas com as outras e em qual dire"ao.
0 nrvel de probabilidade associada fomece a probabilidade de nosso coeficiente de
correla"ao se dar por erro amostral, desde que a hip6tese nula seja considerada ver
dadeira.

-_._._

- -----;- -_.

Os resultados sao apresentados em forma de uma matriz. A matriz e simplesmente urn


conjunto de numeros disposta em fileiras e colunas. A matriz de correla"ao e urn exemplo de
uma matriz quadrada simetrica. Voce deve notar que cada variavel estll. em perfeita correla"ao
com ela mesma (ou entao a1go estll. errado). Alem disso, voce deve notar que os resultados
aparecem duas veres: cada metade da matriz e uma imagem dela mesma. lsso quer dizer que
voce tern de olhar somente uma metade (na diagonal). 0 SPSSPW tarnbem fomece 0 numero
de pares para cada variavel. Voce pode ver na sarda a seguir que 0 ponto no qual a variavel
"SORVETE" encontra a variavel "TEMPERATURA" fomece as informa"Oes que precisa
mos. A primeira linha nos fomece 0 coeficiente de correla"ao - 0 padriio e fomecer esse
coeficiente correto ate dois decimais. 0 nrvel de signifidincia adquirido e dado na segunda
linha, e a terceira confinna quantos pares temos na anlilise. Lembre que, quando 0 SPSSPW
mostra uma fileira de zeros, mude 0 ultimo zero para I e use 0 sinal < (p. ex. p < 0,001, n =
20). Obs~rve que nosso coeficiente de correla"ao e positivo: quando a temperatura aumenta,
aumenta tambem a venda de sorvetes.

--

Correlations (Correla~6es)

Aparece a seguinte caixa de diaIogo.

ice cream Isorvetel


Ice cream ($Orvete)

"'vij~~~:~n~'

, ieressi! dacabCa
da -esqueri:la
, "aqui

temp (temperatura)
-~

'----------'--
I

_,,----+---------."-'

_ _ --_=--+-

!I

I
i

~ c-,---L__
+--.;jl

.~~'.,",'~--

Pearson Correlation
(Correla~o de ""arson)
5ig. (2-tailed)
(5ig. Bilateral)
N

__--.L__ ~._.. .L_. __

:....-_-~;-_..:...._._---_. __ ._....!.._-_ ..

Pearson Correlation
de ""arson)
5ig. (Hailed) I
(5ig. Bilateral)

(Correla~o

1.000 I

.8931
.000

20

20

.8931

t.OOO

.000
20

20

5ig. = 5ignificAncia

"~,.,,~IW.rJ.~;~;~=1}~
Esses resultados indicam que as vendas de sorvete tern urn forte relacionamento positivo
com a temperatura. Podemos relatar a anlilise da seguinte forma:

o relacionamento entre vendas de sorvete e temperatwa ambienle e positivo e forte (r = -Hl,89, P


< 0,(01). Portanto, quando a temperatura aumenta, aumenta tambem a venda de sorvetes.

194

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

195

Isso e tudo 0 que podemos explicar no momento, mas voce vera, a medida que 0 capftulo
avanetar, que ha mais a ensinar sobre esse assunto.

l~'!:

;':;\:'.1".',;.

'l'~~

':',

.~;.1:4i~:)

Desenhamos os cfrculos, representando sol e temperatura, como se fossem independemes,


mas eles nao 0 sao, pois compartilham variancia. Quanta variancia exatamente comparti
Iham? A estalfstica teste, urn coeficiente de correlaetao, forneceni essa resposta. Explicamos
que 0 coeficiente de correla"ao vai de 0 a + I ou de O.a - I. Ao elevar ao quadrado 0 coefi
ciente de correla"ao, voce verifica quanta variancia, em terrnos percentuais, as duas variaveis
compartilham. Veja a Tabela 5.2.

.""Ha6':SJH'ci~)"~'I":IAtJq3!~i~~)
.;:;,;;;Ei:~:~~Q,t;,l ;;{~:'~.~:li't>
"!'.

Tabela 5.2

!:~":<!09,f:;'1~.';3:~p

Co~(r) .

.:,.~;.. ~74.'r:.':;\;.,474

:~i":~~:::-I ";~"'~"'::;2''':,:'j

Tabela demonslraliva do relacionamento entre correla"oes e correla"oes ao quadrado

f:ilooV "i'~01,~~9

, .",' v~;:,L , .', ",~\

Correla~ ao quadrado (,)

0,00
0.01 (1%)
0.04(4%)
0.09 (9%)
0.16(16%)

0.0

0,0
0.1
0.2
0,3
0.4
0,5
0,6
0.7

0.1'

02'
0:3'
0.4'
0,5'
0.6'

0,25 (25%)

0,36 (36%)
0.49 (49%)
0,64(64%)
0.81 (81%)
1.0(100%)

0.7'

0.8

0.8'

0,9
1,0

0,9'
1.0'

Lembre que correla"Oes negativas ao quadrado fomecem uma resposla positiva. Por exemplo,
--0,4 ao quadrado (--0,4 x --0,4) = 0,16. Portanto, 16% da variancia foi explicada pela correlaetao
de - 0,4, da mesma maneira que seria se a correla"ao fosse +0,4. Se voce tern uma correla"ao de
0,9, explicou 81 % da variancia. Urn diagrama de Venn deixara isso mais claro. Se duas variaveis
tivessem uma correlaetlio perfeita, olio seriam independentes, e os dois cfrculos para x e y estariam
urn em cima do outro, exatamente como se houvessem duas moedas empilhadas:

5.1.1 0

Explica~o

da variancia do coeficiente de correla~o

o coeficiente de correlaetao (r) e uma proporetao entre a covariancia (variancia comparti


Ihada pelas duas variaveis) e uma medida das variaet0es separadas.
Agora voce ja deve ter uma boa ideia do que significa urn coeficiente de correlaetao.
Por exemplo, se dissessemos que duas variaveis sao associadas a 0,9, voce provavelmente
poderia desenhar urn diagrama de dispersao. Da mesma maneira, se pedfssemos para dese
nhar urn diagrama de dispersao representando uma associa"ao de 0,1, voce provavelmente 0
faria muito bern. Entretanto, existe outra maneira de visualizar 0 que 0 coeficiente significa;
uma maneira que sera muito util mais tarde, quando come"armos a trabalhar com analise de
regressao. Vamos tomar como exemplo 0 numero de horas de sol e temperatura (exemplo de
AIt, 1990). Essas duas variaveis sao associadas positivamente: quanto mais horas de sol, mais
alta a temperatura. Quando duas variaveis sao correlacionadas, dizemos que compartilham
variancia. Por exemplo, os seguintes cfrculos representam horas de sol e temperatura.

As duas variaveis teriam uma correla"ao de + 1,00, e toda a variancia nos escores de uma
variavel seria explicada pela variancia nos escores da outra variavel. Por exemplo, podemos
supor que horas de sol e temperatura tern urn escore de correla"ao de 0,9 (81 %), I Os dois
cfrculos aparecem da seguinte forma:

9,5%

Este exemp10 ede All (1990).

9,5%

196

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Se 81 % da variiincia e compartilhada entre as duas variaveis, sobram 19% da variancia:


isso e 0 que conhecemos por varilincia exclusiva: 9,5% e exclusiva do sol. e 9,5% e exclusiva
da temperatura. Se a variiincia compartilhada e significantemente mais alta que as varilincias
exclusivas, 0 r tera urn valor alto. Se as varilincias exclusivas forem significantemente mais
altas que a varilincia compartilhada, 0 valor de r sera baixo.
r

medida de variiincia compartilhada

:~(i;~

:~'~t;Jp~~~f~f5~:

197

~ '. '.- ' .....~ -> _ '

= ---------~--medida das variiincias exclusivas

A parte sombreada (81 %) e a variiincia que compartilham. Em outras palavras, 81 % da


variabilidade no numero de horas de sol pode ser explicado pela variabilidade na temperatura.
Da mesma fonna, 81 % da variabilidade na temperatura pode ser explicada pela variabilidade
no numero de horas de sol: 19% nao e explicado, quer dizer, a variiincia nos escores deve-se
a outros fatores tambem.

Diagrama ilustrando a quantia de variancia compartilhada entre duas variaveis.

~,:~~~'~{';
"1~<;;'

[~r~i~,!rco,=
,J;';'49% .

'()~~~\
. AJtu:ni. ~5.S%
-

"

.Aifurci. 25;5%

,.,,-.,~.

Outra ilustra~ao de variancia compartilhada.

Vamos tomar como exemplo 0 caso de ocorrencia de chuva e presencra em jogos de


criquete. Esperariamos urn relacionamento negativo: quanta mais chuva, menos pessoas pre
sentes. Vamos supor que 0 relacionamento e -0,3. Isso significa que 9% (-0,3 x -0,3 = +0,09)
da variiincia foi explicada (ver Figura 5.15).
Como outro exemplo (ver Figura 5.16), vamos supor que medimos e pesamos uma
tunna de criancras e que a altura e 0 peso tern uma correlacrao de 0,7. Quanto da varilincia
foi explicada? Multiplicamos 0,7 por 0,7 = 0,49 (49%): isso significa que praticamen-

te metade da varilincia nos escores de altura pode ser explicada pela varilincia em peso.

Contrariamente, quase metade da variiincia em peso pode ser explicada em referencia it

varilincia em altura.

E claro que isso tambern significa que 51 % da varilincia nao e explicada, quer dizer,
51 % e explicada por outros fatores, como idade, genetica ou elementos do ambiente. 0
coeficiente de correlacrao pode sempre ser elevado ao quadrado para se obter a varilincia
2
explicada (r ao quadrado). Da mesma maneira, se voce sabe 0 r , pode usar 0 botao da raiz
quadrada na sua calculadora para obter 0 coeficiente de correlacrao, 0 r (embora isso nao Ihe
diga a direcrao do relacionamento). Voce deve entender, entao, que a correlacrao de 0,4 nao
e duas vezes mais forte que a correlacrao de 0,2. A correlacrao de 0,4 significa que 16% da
variiincia foi explicada, enquanto a de 0,2 significa que somente 4% foi explicada. Portanto,
a correlacrao de 0,4 e, na verdade, quatro vezes mais forte que a correlacrao de 0,2. Urn co
eficiente de correlacrao e uma boa medida do tamanho do efeito e pode sempre ser elevado
ao quadrado para ver quanto da variiincia dos escores numa variavel pode ser explicada em
referencia a outra variavel.

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

198

[~~ rAliViiiae"5'~~"'v~''T'~'';';''''l
:-.~~~)-,:,: ~~i~i'::.'~-!:<:~::~~;:i~':~';)~';':~': .'. ':. . ,,'
or.....

t~.!o~}~

;.:'

~t

-:' ~":

,,~"'r:~~t"'Bt:.

__ 1$.-r1~j'

i, ' , ' , '.."

"".' ;"

,-,.

'j: '

...-_ .. ....,..-.,.-"7 . --- .. ~.- .~- - . -....... -<:._'-:-..

~.

'

199

C'"

'. -.~;':1:0~:~o~a~~fg~ftt4~e'urtiffi~ffCient~ iie corh!ia~o,~~ i'ri1'poroirit~ '


~~'~"l'~~~~~:i1l~t*~~'~~I'"
""'~~t"~ , \ ' ', . \'\'!~."')
.'~~~'~~~~3;.~~;-:~_";.,':;.-~Z::'.:.;,
. . , "~.";::'
.; " ",:. ':<'\/':;;)ffr!;~:::~}"';~'~',
...\\.

(aJ-~;~

(b}- , ~IJ" -

rrlrltan(!a""

. 1'i;~;fIJ'.

"',.:,.,-,.
Nf:r _._~~ .,.,.. .'~"7T':d~{"
~ ~.~.~.. m~JI.(j,l!P

(c;r~'(ii:

(d); N~taY'n

_. <:.. :~.:.

'.'I:....~~~: ... ::(

__.'1":...I,I'-r._

,t'(:'"

;.,

'

..;'

\;;}~;j~;17X

~:''-~'-

Existe uma correla'rao (talvez fictfcia!) entre a quantidade de sorvete ingerido e 0 sentimen
to de grande felicidade (+0,85). Quanto da varia'rao nos escores da felicidade pode ser explicado
pela quantidade de sorvete ingerido? Quanto da varia'rao perrnanece sem explica'rao?

":'<~'H:,

~: ': ...

",',

. .
,; '"

ri~cE,R~~..J11~' ;,. c.'};.'~ ~,i":~(J">;'"_:'.


.'

5.1.11

Significancia estatistica e importancia psicologica


No passado, algumas pessoas estavam mais preocupadas com a "signifidincia" do que
com 0 tamanho da correla'rao ou a quantia de variancia explicada. As vezes as pessoas afirrna
yam que tinham uma correla'rao ahamente significativa: lembravam 0 valor probabilfstico (p.
ex., 0,(05), mas esqueciam 0 tamanho da correla'rao. 0 valor da probabilidade significa muito
pouco se r nao e relatado. 0 coeficiente de correla'rao indica 0 nfvel de relacionamento das va
riaveis, e 0 valor probabilfstico ea probabilidade de aquele valor ocorrer por erro amostral.
Portanto, quando reportar seus estudos, relate 0 coeficiente de correla'rao e pense se 0 r
e significativo para seu estudo, assim como 0 valor probabilfstico. Nao use somente 0 valor
probabilfstico. Lembre-se: significancia estatistica nao equivale necessariamente a signifi
cancia psicologica (ver Capftulos 4 e 7 para mais inforrna'roes).

(~.) EXEMPLO: REVISITANDO SORVETES ETEMPERATURA


Agora que voce ja sabe sobre variancia explicada, podemos ajustar a parte textual de
seus resultados para incluf-Ia. A analise pode ser a seguinte:
A venda de sorvete de casquinha estava fortemente associada a temperatura: quando a
temperatura aumenta, aumenta tambem a venda de sorvetes. 0 r de 0,89 mostrou que 79% da
variiincia em vendas de sorvete se explicava pela variiincia na temperatura. 0 nivel de probabi
Iidade associado de 0,001 mostrou que e improv3vel que 0 resultado tenha ocorrido por erro na
amostra, considerando a hip6tese nula como verdadeira.

.L,.

". :;,:,: .... ,:, , . ~

0 : 5 , 0 5 , 5 . . 6,0"" :::',.
'---~'

. -

-,

";-\""j~: .:.:'''::

"

..

~ .. ,.~:- .... :~ :~" .."j~;'i/:~'~;~(:: ~<~f: ~_~,~~X~:'- :~:., ~ ~~~,~,:~

,.r

Ell! demonstra'quec1$ villi'v~~iijdicam uma:' .


(a).<ks~ia~h~~tiVafo~e :.... :. ....,

).:~~Z::~~:~~~:~~t~i:aHi~tj~L:.L.~:.':

.. ~

-.,
!

'r

~ EXEMPLO: FUNy\O COGNITIVA


~ EM PESSOAS COM DOENQ'S CR6NICAS
Fez-se urn estudo no qual correla'roes entre variaveis de medidas cognitivas e do
en'r as foram obtidas. As medidas foram as seguintes: QI (de desempenho e verbal),
escore de Stroop,2 dura'rao da doen'ra em anos e medida de depressao. As hip6teses
foram bilaterais. Setenta participantes providenciaram os dados, e os resultados estao
na Tabela 5.3.
A primeira fileira indica os valores de r; a segunda linha fomece os valores de probabi
lidade associados, e a terceira aponta 0 numero de participantes em cada condi'rao.

1 0 tradicionallcsle de Stroop envolve palavras com significado de cores (vennelho. azul. amarelo. verde) escritas tanto numa cor
congruente (p. ex., a palavra vennelho escrita em tiota vennelha) como numa cor incongruente (p. ex., a palavra vennelho escrila
em tinta azul). Os participantes geralmente demoram mais para nomear as cores na situalj30 incongruente. A direrenli3 do tempo de
realjao entre as duas cOlldiljocs romece 0 escore SlI'OOP relatado nesse estudo.

200

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Tabela5.3

Oa

Correla~6es

01 verbal

verbal iq
(01 verbal)

Pea rson Correlation


(Correlay;o de Pearson)

verbal iq
(01 verbal)

performance iq
(01 de
desempenho)

duration of
illness in
years (dura~o da
doen~ em anos)

0.615

-<l.175

0.000

0.148

Sig. (2-tailedl
(Si9. Bilateral)

performance iq
(01 de desempenho)

duration of illness
in years (dura~o
da doen~a em anos)

stroop

depression
(depressao)

Sig.

70

Pearson Correlation
(Correlay;o de Pearson)

0.615

Sig. (2-tailedl
(5i9. Bilateral)

0.000

70

Pearson Correlation
(Correlay;o de Pearson)

depression
(depressao)

-<l.227

-<l.327

0.059

70

70

70

-<l.231

-<l.094

~ot~:

Qlde
desempenho

-<l.ll5

0.043

0.055

0.438

70

70

70

~ ~o~c

'I,~~n:

0.217

}~OO
djo
D~
,0

0.398

DC

~oo

0.724

70

70

Pearson Correiation
de Pearson)

-<l.227

Sig. (2-tailed)
(Si9. Bilateral)

0.059

0.072

0.001

70

70

70

-<l.231

0.217

0.274

0.055

0.072

~D

~~
= ~~

DO

<;to

~OO

foB

as

u::l

8 []

Dc

~o

Y:~m

diD

Depressao

0#
tI
0

"'0

'b

~Do
~o ~ ,~O ~~
0

dadoen~

8j

00

Dura~ao

o~

0.148

q,

.I'

%0

d'

q,

d' %

'i~
"

,,~

000

DO

DO

[] eLl

0.724

oU..o
~O~O

006

0.043

Sig. (2-tailedl
(Si9. Bilateral)

(Correla~ao

stroop

t(~o
~[] a a
"bo

'be

""

70

70

201

Stroop

"

_ _ _Diagrama de dispersao de matrizes para as variaveis cogni~ao e doen~a.


0.022

70

70

70

70

70

Pearson Correlation
(Correlay;o de Pea""n)

-<l.327

-<l.094

0.398

0.274

Sig. (2-tailed)
(S'9. Bilateral)

0.006

0.438

0.001

0.022

70

70

70

70

[~rs~pw:~~_.~~~lsao

70

= SigniflcanCia

Para se obter rnatrizes, abra seu arquivo de dados e selecione Graphs (Graticos), Scatler
(Dispersao).

o relat6rio pode ser escrito assirn:


Como esperado. 0 QI verbal e 0 QI de desempenho tiveram urn relacionamento positivo
forte. e uma correla~ao moderada foi encontrada entre dura~ao da doen~a e depressao. Entretan
to, 0 mais interessante foi descobrir que a depressao estava relacionada ao QI verbal (r '" -0,33.
p '" 0,006), mas nao ao QI de desempenho (r = -0,09. p = 0,44). A depressao tarnbem estava
relacionada II medida de Stroop - quanto mais deprimido 0 paciente, mais incongruentes os seus
escores (r '" 0,27. P =0,022).
Voce pede obter urna rnatriz de diagramas de dispersao corn 0 SPSSPW (ver Figura
5.17). Ern urn prirneiro olhar. pede parecer confuso. Entretanto, e interpretado da rnesrna
rnaneira que a tabela correlacional acirna.
E precise olhar sornente para urna rnetade da rnatriz, pois urna e igual a outra. 0
diagrarna de dispersao para quaisquer duas variliveis rnostrado no quadrado no qual se
encontrarn. Siga urna linha vertical irnaginaria para cirna de "durac;ao de doenc;a"e siga
urna Iinha irnaginaria horizontal de "QI verbal". E isso resultara ern urn diagrama de dis
persao que plota "durac;ao de doenc;a" contra "QI verbal".

IJiI

iii: . . ....---._ *"'-_~

~~.~=---.:

--..

--

u:rt-~[ ~ ~-- --,!~: ~i;-~1!-1~~~:~~--"::~~~_: -~-]


IiIHXI"

II

=_
~

1U!l: "" <lSeD' ~Q"


.
~:: ~:~ :.~:~ -';:~~:i_._~_: -_-_--_-----~

elm'

lUI

_~:

.:":f

1m

:Jim.

ItI'l:

HO,
IiIOCClio\!'I'~
: : - ' D-o_ . . _-;:~

: -

110m:

111J

111m

nm

11M.

~D;
:2.0,

lIUl.

'!II.,

:Mill

'10

!!oliO.

_~~~~.-;::-~ ~ j;: ~ ~,. __i:__;_;~. _::~ __ ~ __ ~.-'ICD


:;

- - : : .

;1)111,

"ll!!'

1.~tIl.
11

II
"

lCO

XI---.03
"

:IlCXI

ilir-'-~D)'
I(D
&HD

1111

'!!lIopn.

:: -:~: -.-- ._-

tGllli

'10)11)'

KDlD-

119m

.JHO'

]Clf

51Jl

':,.
D~
---lll~_-Ji4r---:-")1

JDlt'

SlD

'-1TcO:
"m

II

'e

11.m'
IItli

-.:~ . ~:: -~~---~-~~_.

Zl

-::;--:-::-.-:::" : - : :

:M
:IS

IQ) (i)-' iilm-'Yi2tD . -1-fOO'---,s' '-Iis." - Tm---- -."r

1m
om,
""CD" "'CD.
3Dm:
13:
.U
11m
,.

:-':: ---:-::-I~: ::'


~

~f~~:~

--_.-

Wm, IIU15
1 iJmj. 1I!ii~~~------'--
!lIIm
\1tm
1(1:1
ur
IUl
27m
us
-llae-tito- -'lim:" '~37---'-- ZltiJ- -1II-

-,JJci:I: - I\m~--ii'1il~ 1!.{tI'

11

-~:r-~!-~-~:--::-~'
~~ -~:~~ --~:: -:~

: -";-:r -":::. -i~::-:=--~:j

'IOKf!M~~~~~=~-:i-~~:~~;~~:-.-- ~~-

,..--

- Ig --; -

202

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Depois, selecione Matrix (Matriz), Define (Definir).


' ..

,_

...

.....:.

~lrJ

__

~-.J

~_

[~.I EXEMPLO: QI ENOTAS DE TESTES

,_

~ ~ :I 9!!I!J~~aJi!ElI~.
----_._-_._--~---

..

:~,.-~-----=--~-_.

:::::::!5!!1

.co

lQJ

'~CIJ
11m:

60)

1m

:JIer]'

laf

1m
nD.I5m

lW

IIsm

.-o.-or

woo:
!BOO

6
1

111m"'

sum'

-5im'

IUJ

12"J1

-ii:im~'

IWoo;

Imoo

11100

ItSlJJ
WCO
em

99liJ~

lCO

-.ow
:IIa'-

... 00;
moo'

\Q

11

'OJ
1m

Ym
51JCO

:~

:: ::: :::, :::.

iCDm

IUJlXI
,.,00

12~'
:019
lug
IICi!' il'f . -,lif'

2m

eei:.'

Iii

1m

leo:Om

.-00-

18

IlU

6W

11m

I'

1m

_'!I~.

21

11'11

~
1I
:M

100

,imo
~~

"Om

~m

IW

'963:

900

~lJJ

uf"

lilt

1629.

516;

f5m

31.,;

seo
ICO

117
'56!

1'15
1111

!.t,m
;oJ'

1!J5
III

''>00

11.01

:J!lW
1Ii3~

lJW

!!IoW

89'-

[as-.

1lI"-Io

~m

'--ii;mo
~oo
110m

600

BlW

11100;

U1m

1100

GlW

99w

:11(1)

~m

~m

lID

Qm

1m

~oo

4500

maf -'3500

1~7':_ ~~, . sm, . !'.'ll.


JIU,
~w
:lIW

IUt'
]nj"
JOJm'
i'~

m~!
~~
Ilm
~~"

en

n:8,

:r.SI:

,tv:

18(1)

~!oI:

02!>'

mathemat
(matemati,a)

I'"

lie

~:; ~~:

UOJ

'ID

,Co'

1600

,u

::

:~~:

1(6 I

::"~;"':';~~-::bl<=bi~:~~~F;~2:J::1000

.u:--__ r __

--V'

score 1
(escor.1)

._.if
__

Mude as varhiveis que voce deseja incluir do lado esquerdo da caixa de dialogo para
lado direito usando 0 botao . Clique em OK.
~ ...

(-" , - t"'.

!._-

'if_ ,~ .. '=1.....-

score 2
(escore 2)

~~.::J3!!I!J~.i!I!!!l
. . ~;

score 3
(escore 3)

..

,l:~--'..:..-==--=rr---''--------=""''=---~-'''''''''=---='''=-~-O--~-'''''''''--='=-~
.-'----:-o-~---

--~T-.21 ...

,
1m
100'

elll,

-jar -

10100

1)100'

eof - 1100 - n,tif


:Blii- -Bill" --115m -

. rO:20r-
iOfcD---~-~-~-!-!'-!-!.!-~.~M'i1!-~--!~--II-iII-I-~-~--,

woo' .....-r
-- ,

100500-' 8600"
-.--.~

IlXt-- -ifm --liiii--- .--~ [i]

. 100-

100-

"

!ior - lifaf

:: ::: I::. : :~=::

Il
I)

ICO
IIXl'

I.

IS

100"

iirif

Iilscif -

1I(1)"-

10000-

--moo,

_~-81

Ii

24
25

;'2E~
...
..

.-00--'

-100"

~tit--

Will,

--I

: -:-:--=;~._~~-_-=I f~~~r:f---=-:~~"-"~:~_! ~
~

.As ~ilriaveis

-I

-ir,o-Jii:iji'-~,

:
2J

5i9.

::-

::~-~::

92af tOS-m-,fj,aj"--m-oo ","jiaf


. "iof - D-rrr-.}'IOO-- ""iiitilSllXI"

ioo" -!iim--siti:l--

da~iica'

~~

-.1

100-" Doo-- --il7cii"--lmoo


00
100- -- -'~roo-- - li"lof-- ""iQor~-liQ:j
100om 8100- !'Jar 'ilCii"

100"
'100'-

2(iJ-

1]19-- - )sst"
gEtf
18!o1
---a-05
- -,iD"

Isaf -irjj-;a-Iii"" -72&'

"i'01tD-~oo:

-"-,.'-

--

lall' -

i,-n'

lalXl

-icir'
IHlf

-lim

Isso fornecera as matrizes.

2212
eliS"

jJaiad

'.

;0

l1es"-6(jf--,,-lXI'
-"lill~

-'211ar --1091

-----g-19-liiw:--155'

'h~-~~r~=)~~~::~.;~k.~i~~
"'_11"';"- i~'~
...,M

da~lierda

-------0

1(6~!

".

~
--

.-..wt&

mathernat
(matematica)

score 1
(escore 1)

score 1
(escore 1)

score 1
(escore 1)

1.000

.5741

.0641

.0143

.1428

.002

.383

.474

.253

24

24

24

24

24

.5741

1.000

.0598

.0281

.2502

.002

.391

.448

.119

24

24

24

24

24

.0641

.0598

1.000

.9952

-.2153

.383

.391

.000

.156

24

24

24

24

24

1.000

.2188

N
Pearson Correlation
(Correla,ao de Pearson)

.0143

.0281

.9952

5i9. (2-tailed)
(5iQ. Bilaleral)

.474

.448

.000

N
Pearson Correlation
(Correla,ao de Pearson)

24

24

24

24

24
1.000

.1500'

IQ(QI)

5i9. (2-lailed)
(519. Bilateral)
Pearson Correlation
(Correla,ao de Pearson)
5i9. (2-lailed)
(5i9. Bilateral)

211l
Il3l'
ZJM,
JlIIl
II_S!

am' jIOl
aJiJ"
. 'em -. -';1'

lilli - - ,.:- -1;63-:'- --,-lif' 917-'

100--- -UlOO:
5800-'IIIt

N
Pearson Correlation
(Correla,ao de Pearson)

866

sm

:lIB'

Pearson Correlation
(Correla,ao de Pearson)
5i9. (2-lailed)
(5i9. Bilateral)

71IJ

~oo

lOll

,m"

lm
15m'

~:; I~;; ;:~: ..::

~:.

lI!101

m~

',-m'

Dnl

100

't61

nw

14"11

1J1I'

Joo

3700;

moo

IQ(QI)

~ :~
~ }~~
'-156'

1]111

11.0

11400
IIU"

MatrlHMirtHZ)

.786

11'CO' -

1m

11

. 29C11

Correla~6es

,' ..... ,:<"';.',.~

Seleclone -!.

1)1]

_lCIJl:II: _~e:-!.. .. _~t!l:


UIlOO'

911

maJ
11000

9lIln

ftOJ

'-.,(

2m

Se voce fizer uma analise correlacional de diversas variaveis, obtera uma safda como a
abaixo, que estl'i no forrnato de uma matriz correlacional:

II 50

,.,!
91f

10m

-li-lif

:: :.:: ._~:~ ::: -~=~:_ -~~~)O


11

203

.152

-.1428

-.2502

-.2153

-.2188

5i9. (2-lailed)
(5i9. Bilateral)

.253

.119

.156

.156

24

24

24

24

24

= 5ignifidincia
Embora tenharnos correlacionado cinco variaveis umas com as outras, temos somente
dez correlafi:oes para analisar. Isso ocorre porque ignoramos as correlafi:oes das diagonais:
essas sao r = 1,00, e cada variavel tern uma correlafi:ao perfeita com ela mesma. Alem
disso, cada metade e uma imagem da outra; portanto, precisamos observar somente uma
metade. Colocarnos a metade de cima em negrito para facilitar a visualizafi:ao.
A safda mostra 0 coeficiente de correlafi:ao rea probabilidade de este ocorrer por erro
amostral, supondo que a hip6tese nula seja verdadeira. Tarnbem inforrna 0 mlmero de pares
de observafi:oes.
Nesse exemplo, os escores de matematica tern uma associafi:ao positiva com QI (r =
0,57). E uma correlafi:ao moderada, mas a associafi:ao tern uma probabilidade exata de p =
0,002: existe somente uma pequena chance (0,2%) de que essa correlafi:ao tenha ocorrido
por erro amostraI. 0 mlmero de observafi:oes foi de 24.
Se voce considerar a primeira fileira de cima da matriz, vera que os escores I, 2 e
3 tern coeficientes de correlafi:ao que sao aproximadamente zero. Isso significa que niio
existe urn relacionamento linear entre as variaveis, e isso e confirmado pelos valores de
probabilidade.

204

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Observe agora 0 ponto no qual 0 escore I encontra 0 escore 2. Voce constatara que
existe urn relacionamento forte, quase perfeito, entre eles, demonstrando que esses dois
escores devem estar medindo uma habilidade parecida (r :: 0,9952). 0 nfvel de probabili
dade associado (p < 0,001) mostra que e improvavel que esse valor seja resultado apenas do
erro amostral, supondo que a hip6tese nul a seja verdadeira. 0 SPSSPW calcula os valores
p ate urn certo numero de decimais ap6s a vfrgula (0 usuano pode mudar esses para-metros
para que os valores sejam apresentados com quatro decimais como acima (r :: 0,9952) ou
com tres decimais (r:: 0,995) ou qualquer outro valor. 0 mesmo funciona com valores p.
(Lembre-se de que, quando 0 SPSSPW fomece p, como p :: 0,000, voce precisa mudar 0
ultimo zero para 0 mimero I, e usar 0 sinal de menor: p < 0,00 I).

205

Ate agora falamos sobre a correlaerao entre duas variaveis, sem levar outras variaveis em
consideraerao. Esse tipo de correlaerao e chamado de correla~iio de ordem zero.

5.2

Correla~oes de primeira e segunda ordens


Vamos lembrar do nosso exemplo no qual altura e peso sao altamente correlacionados em
crianeras. Se pararmos urn minuto para pensar, veremos que idade e correlacionada a ambas essas
variaveis. Poderiamos fazer uma analise correlacional nessas !lis variaveis para confirrnar isso.
Correla~6es

5.1.12

Intervalo de confjan~ para'

Heigh (Altura)

Rosnow e Rosenthal (1996) dao 0 procedimento para construir limites de confianera de


95% (bilateral p :: 0,05) para r. As inforrnaer5es que seguem se baseiam em seu texto:

I. Consulte uma tabela para transforrnar r em Z, de Fisher (ver pagina 602) do Apen
dice 2).

Weigh (Peso)

2. Multiplique II ,j(n - 3) por 1,96.


3. Ache 0 limite inferior do intervalo de confianera subtraindo
do valor encontrado em I.

4. Ache 0 limite superior do intervalo de confianera adicionando


rna do valor encontrado em I.

Age (Idade)

resultado em 2 aci

5. Consulte uma tabela similar para transforrnar os valores inferior e superior de Zr


novamente em valores r.

[~.] EXEMPLO
Vamos tentar esse processo para urn coeficiente de correlaerao de +0,29 em uma analise
com 133 pessoas: r:: 0,29, n :: 133.
I. Consultamos a tabela, gue mostra urn r de 0,29 convertido em urn Z, de 0,299.
2. Multiplicamos 1I.J13O por 1,96. Portanto, multiplicamos 1/11,40 por 1,96. Isto
e, multiplicamos 0,0877 por 1,96 = 0,1719.
3. Diminulmos 0,1719 de 0,299 = 0,1271: esse eo limite inferior Z~
4. Adicionamos 0,1719 a 0,299 = 0,4709: esse e 0 limite superior Z~
5. Convertemos os numeros em 3 e 4 para r (de Z,). Consultando as tabelas, ha:

Z, 0,1271 --t r
Z, =0,4709 --t r

=0,126 (limite inferior do intervalo de confianera pra r).

=0,440 (limite superior do intervalo de confianera pra r).

Embora 0 coeficiente de correlaerao amostral seja +0,29, temos 95% de confianera de


que 0 verdadeiro coeficiente de correlaerao populacional esta entre 0,126 e 0,440.

Weight (Peso)

Age (ldade)

Pearson Correlation
Pearson)
Sig. (I-tailed)
(5i9. Unilateral)

1.000

0.834

0.970

0.001

0.000

10

10

10

0.834

1.000

0.802

(Correla~ao de

Pearson Correlation
(Correla~o de Pearson)
Sig. (1 -tailed)
(5i9. Unilateral)
N

resultado em 2 acima
0

Heigh [Altura)

Pearson Correlation
(Correla~ao de Pearson)
Sig. (I-tailed)
(5i9. Unilateral)
N

Correlac;ao e significativa
Sig. = Significancia

0.003

0.001
10

10

10

0.970

0.802

1.000

0.000

0.003

10

10

10

no nivel 0,01 unilateral.

Colocamos em negrito os tres coeficientes de correlaerao. Pode-se ver que as tres varia
veis estao fortemente relacionadas umas com as OUtras.
Se quiserrnos descobrir a associaerao entre altura e peso sem 0 efeito da idade, teriamos
de achar uma amostra de crianeras que nasceram DO mesmO dia. Se isso nao fosse posslvel,
poderiamos nos desfazer do efeito da idade, removendo sua influencia por meios estatisticos.
Isso e conhecido como manutenerao da idade constante. Correlacionamos altura e peso en
quanto nos desfazemos do efeito da idade; r, enta~, indicaria a correlaeriio entre altura e idade
quando a influencia desta e removida.
Podemos explicar isso conceitualmente ao observarmos cfrculos de variancia que coin
cidem. No seguinte diagrama, pode-se ver que 0 relacionamento entre altura e peso (com a
influencia da idade) e +b.

206

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Isso significa a correlar;ao total entre altura e peso. Entretanto, parte do relacionamento
entre essas variaveis se da devido a idade - a parte representada somente por b. Se a influen
cia da idade fosse removida (a area b), a correlar;ao entre altura e peso seria reduzida, pois
seria representada somente por a. Isso e uma correlar;ao parcial: uma correlar;ao entre duas
variaveis, com a influencia de uma (nesse caso) removida. 3

.--;---.--;--l
: ~r -L i~~I_
~.!...--:---,

..

lor spssPw: ~irela~~~~sif~~~:Ii*"ii'>


' .

Com 0 SPsSPW, e facil remover a influencia de uma variavel. As instrur;6es sao as se


guintes. Depois de colocar os dados, escolha Analyze (Analisar), Correlate (Correlacionar),
Partial (Parcial).

207

"1 __._
T- I
'
i I __ ~ !

-I

---Ftt~-~:;J~~
Colocamos altura e peso na caixa Variables (Variaveis) da direita e a variavel que deseja
mos fixar (nesse caso, idade) na caixa Controlling for (Controladas).
Seria util saber 0 valor do coeficiente de correlar;ao para idade e peso sem 0 controle
da variavel idade para podermos comparar os dois. Para efetuar isso, selecionamos Options
(Opr;6es). Onde obtemos a seguinte caixa de dialogo. Marque Zero-order correlations (Cor
relar;6es de ordem zero) e pressione Continue (Continue).

-1
A seguinte caixa de dialogo e obtida.
-------c---

--, ---_:..._---~.-+---+----'
--,- - :-

.' Essa RaO e uma explicac;ao male~lica. mas sim conceitual. Portanlo. a precisao matcmatica e perdida em favor do entendimento
2
conceiluaJ. A f6nnula real para calcular correlaljOes parciais e dada por r = aJ{a + altura) ou a/(a + peso).

_. -- ._. __.- -------,--

Isso nos Iraz de volta a caixa de dialogo Partial Correlations (Correlar;6es Parciais), na
qual voce pode dicar em OK.

208

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

As correlalOOes de ordem zero sao mostradas primeiro:


Partial Correlation Coeficients

(Coeficienles de Correla~6es Parciais)

Zero Order Partials

(Pareiai, de Ordem Zero)

Height
(Altura)

j~.~~veis~mD.

Agel

(ldade)

Como 0 programa (a f6rmula) faz isso? Basicamente. ele correlaciona idade com altura.
Entao correlaciona idade com peso. Esses resultados sao "removidos" da correlalOao altura e
peso. Esse processo remove a influencia da idade do coeficiente de correlalOao.

i4'@vari.ivel<. .

Height (Altura)

Weight (Peso)

Age (ldade)

1.000

.833-2

.9695

002

~01

Pearson Correlation
(Correla~,jo de Pearson)
5ig. (Hailed)
(SiQ. Unilateral)

'{ ~r'_ijaa~':'9".<II"'<i(I'ii~!:bV ':r..;,,'If"J eJI1f;.b.;:t"'~'llt~..illR'rr~~IIJ- ;'>:'.;,,::; .::'.;.' :- ;' :') :


,.~. .:~'~~1i~;h;1~;>r:;:lf;~:~~j;~I~~f~~~:.~I;.;~~~~;;~~~~~!~~fl~~~"~~~:":t';f~,~:;:(

~ :::~~:_:.~~~'~i!'f{~~:~;~~.~r()!lf.!~?i~:~~-;,:::~;~;" :~~f(~{~;; ::~7~1}:;;;;~d)\tc~ ;'i,;;,;;'~/:;-~'~';:r':!';.i';:~~~:~'fi:;:{1,~~:~:~~'~":i1/~


_:~'.: .
'!i::;d:, " :,:;y:

.'
""8 r--.... Acorrela~o
entre
altura.e peso sem
.8020
,

N
Weight
(Peso)

Pearson Correlation
(Correla~,jo de Pearson)
5ig. (Hailed)
(Sig. Unilateral)

.8339

1.000

.002

N
Pearson Correlation
(Correla~,jo de Pearson)
5ig. (Hailed)
(Sig. Unilateral)

ocontrole de outras i

.006

.9695

.8020

1.000

.001

.006

" c)' ;.' 'i;.0iii;199~~!Ve,~seg.l,l'n~~lr~~~.~~.~~~.s!t1~.(.~c;I0}~IP9rP~~#t~!ab<).\'Igq!l!S


.

);}:7J~.p~>-;:";;:.'~~~::;(,~~<_:~i~ - .;:~.'~;rf~;:!~E~';~ '~~/~~l:'i~~;~r~"~:<~:fj?<\:.~.~:-:-:~J-~f;-;)Ji; .:~:,:.~;; -: ,- :.: :>;-." ..... ~.- ,..,.: '-. -;~ :
"Partiai Corielati?ri Coefficients <coeficientlis ci~Co~Paitia!i
i'."
~ert!Order Partia~(Parciais de9tdem ~)."

'.'

. '. ,. Total Illness

;~ai:i.ivi!is Horte: 0,84

<:

!,"

-:71th

.. ;;";

117

i .... :

.4930

Partial Correlation Coeficients


(Coefieientes de Correla~6es Pareiai,)
Control of Age
_----------~
(Controle para: Idade)
..

Pearson Correlation
(Correla~,jo de Pearson)
5ig. (2-tailed)
(Sig. Bilateral)
N

Pearson Correlation
Pearson)
5ig. (2-tailed)
(Sig. Bilateral)
5ig. = 5ignificancia
(Correla~ao de

. ;000

..,,-....,., ....
i17

~~Uijr~tii~;OL1da

Heigh
(Aitura)

Weight

1.000

.3853

(Peso)

.306
0

.3853

1.000

~;T:'(,. . .c
.'~l!~..entre altura e peso
1.9~.c$~s.O.39 <P.9r que

,,:i:~'~~~~:~r~Z~da) .

.306

Podemos ver que a correlalOao entre altura e idade foi reduzida de 0,83 para 0,39 (corri
gido para dois decimais apos a vfrgula). Portanto, nessa amostra pequena, verificamos que a
associalOao entre altura e peso se dava parcialmente devido a idade. Se a correlalOao de 0,83
nao tivesse sido reduzida quando exclufmos a variavel idade, sugeriria que a associa~ao entre
altura e peso nao era afetada pela variavel idade.
Nesse caso, controlamos (exclufmos) somente uma variavel, portanto chamamos de cor
relalOao de primeira ordem. Se excluirmos os efeitos de duas variaveis, estaremos fazendo
uma correlalOao de segunda ordem, e assim por diante.
0&

'.

.000

".":;]:''11-7-',.,

H.. _;'.,.,.....;.::>::~::~l; :..:1

Essa tabela eexatarnente igual a da pl'igina 205, exceto porque 0 programa foi rotulado de
tabela Zero Order Partials (Parciais de Ordem Zero).4 Ela nos dl'i 0 relacionamento entre as
variaveis, com 0 controle das demais.
A saida entao informa a correla~ao entre altura e peso, com controle da variavel idade:

Weight
(Pe,o)

j.'

:;~:k~~;!.~~ . . . ~~.:I.

5ig. = 51gnifieanCia

Heigh
(Altura)

209

117

...... '. '.' '5ig: ;;,.signifidnda.' ,,' '.

. "'j,'

'ii''''",

",;,~,,,:,;.,..;-,c:::o,,:.,

-:-. ::-'

. . . >.:~ ~~~~~~~~I:~~l'"~,d. """"""

.. :'-':' " '.

'YCl'c~'ue V6c~ ~ae'toncluifdiS$()r'

Aqui as numeros Sao dados com quatro decimais.


N. de T. Compromelimenlo da Qualidade de Vida (Compromisses Quality oflive).

210

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Exemplo da literatura: memoria e vocabulario


Muitos pesquisadores utilizam coeficientes de correla~ao para relatar seus estudos, e artigos
cientfficos geralmente incluem matrizes correlacionais para 0 leilor interpretar. Temos aconselhado
voce a relatar valores de probabilidade exatos, mas as vezes os autores nao 0 fazem: relatam ou
o p < OU P > como intervalos. Michas e Henry (1994) testaram 24 meninos e 24 meninas (idade
media de 5,6 anos) por meio de varias medidas. 0 estudo investigou se duas variaveis de mem6ria
fonol6gica, lapsos de repeti~ao e lapsos de mem6ria estavarn relacionadas ao vocabulario adquiri
do. A Tabela 5.4 contern as correla~Oes entre todas as medidas iniciais tanto quanto as medidas de
aprendizagem de palavras.
Note que os pesquisadores nos deram somente metade da matriz de correla~aocompleta. Como
ja dilo, nao precisamos ver as diagonais (todas serao r = 1,00); precisamos somente da metade da
matriz. Note tambem que qualquer correla~ao com * depois dos mlmeros e improvavel de ter acon
tecido devido ao erro amostral, tendo a hip6tese nula como verdadeira (usando urn valor de criterio
de 5%), e qualquercorrela~ao com ** ap6s 0 numero e improvavel de ter acontecido devido ao erro
amostral (usando urn criterio de 1%). Nao nos foram dados os valores de probabilidade exatos;
portanto, nao sabemos se a correla~ao entre idade e lapsos de repeti~ao, por exemplo (0,332*), teve
uma probabilidade associada de 0,049 ou 0,02. Isso e importante? Teremos que ler a discussao cri
tica da pagina 155 para nos decidirrnos.
Eimportante lembrar que os pesquisadores nos derarn os valores de r corretos ate tres decimais.
Nem todos os estudos fazem isso; alguns relatam os mlmeros corretos somente com duas casas
decimais ap6s 0 ponto.

Exemplo da Iiteratura:

cren~as de saude e dor nas costas

Harkapaa e colaboradores (2000) estudaram 0 otimismo quanto a saMe e as cren~as de con


trole para ver se conseguiriam preyer tratamentos bem-sucedidos para pessoas com dor nas costas.
Como parte do estudo, fizeram correla~Oes entre as variaveis, reproduzidas na Tabela 5.5.
Tabela 5.5 Intercorrelalloes (r de Pearson) de valores basicos de idade, sexo, indice de capacidade funcional
(lCF) e variaveis preditoras (otimismo quanto asaude, tres medidas de locus de controle e depressao)
~-

. ~~~~~!".,~.!~)~:~i~~::!~-~~,~~. :~~~):~~~r:~~.",.~.~,:j

Age (Idade)
Sex (Sexo)
FCI (IeF)
Health optimism
Others LOC
(OUlrOS Loa

Inlemal LOC
(LOC inlem(5)

Chance LOC
(LOC casuais)

(Oopressiio)

Matriz de correlalllies momento-produto de Pearson

~f~~~Ai.~~i~ __l~:~"

Age (ldade)
Memory Spatial

(Mem6ria <spacial)

Non-word repetition
(Lapsos de repeti~iio)

Memory span
(Lapsos de mem6ria)

Vocabulary
(Vocabul:irio)

Word Production
(Produ~o

de palavras)

Word comprehension
(Comprccnsao de palavras)

p < 0.05: "p < 0.01.

0.049

,~!:

0.332'

0.158

0.183

-0.023

-0.062

0.169

0.185

0.114

0.211

0.200

-0.111

0.150

0.626"

0.484"

0.303'

0.278

0.391"

0.476"

0.448"

0.291

0.347'

0.279

0.378'

0.376'

0.496"

0.479"
0.489"

-0.23
0.02
0.29

0.18
0.06
-0.15

-0.23
-0.04
0.15

0.18
-0.0 I
-0.1 I

0.10
0.08
-0.35

-0 34

0 51

-0 17

-0 20

(Olimismoquanlo 1Ii s3ude)

Depression

Tabela 5,4

211

" ' - '

-0.13

0.34
0.51

-0.13

0.27

0.43

-0.05

0.20

0.38

-0.09

0.43

0.38

-0.05

-0.09
0.29

0.29

FCI (Functional Capacity Index) (ICF (lndice de capacidade funcional: LOC (L6cus Of Control) (LOC (locus de conlrole.
r> O,208,p< 0,01; r> 0,159, p <0,05.

Exemplo da Iiteratura:
estigma, incapacidade causada por doen~a e
qualidade de vida na sindrome do intestino irritavel
Nesse artigo (Dancey et aI., 2002), probabilidades exatas foram dadas quando possfveis. En
tretanto, como voce ja aprendeu. as vezes 0 SPSSPW imprime uma fileira de zeros (p = 0,000), e a
conven~ao e mudar 0 ultimo zero para I e usar 0 sinal de menor (p < 0,001). Fez-se isso aqui.
A Tabela 5.6 e uma parte dos resultados dados nesse artigo.
Observe a correla~ao entre incapacidade causada por doen~a no papel social e qualidade de
vida das mulheres: r = -0,51. Quando a incapacidade causada por doen~a aumenta no aspecto
social, a qualidade de vida diminui. Essa e uma correla~lio moderada. Entretanto, se excluirrnos a
variancia devido a severidade dos sintomas, a correlaylio diminui (para -0,37). Isso significa que
parte da rela~ao entre incapacidade causada por doen~a com respeito ao papel social se devia na
verdade a severidade dos sintomas.

212

Christine P. Dancey & John Reidy

Estatistica sem MatemAtica para Psicologia

Tabela 5.6 Correlar;iies completas e parciais entre intrusao da doenr;a e subescalas do questionano de
qualidade de vida relatado por sexo (correlar;iies parciais controladas pelo total da severidade dos sintomas)

.)Va;~~~'
:..:; ~ '-,

",.

Social Role
(Popel sociol)

Sleep (Sono)
Physical Role

(Popel fisico)
Mental Heallh
(S8ude menial)
Energy (Energio)
*Exislem

13

-0.64 (p < O.DO I)

-0.58 (p < O.DO I )

-0.51 (p<O.DOI)

-0.37 (p = 0.(02)

-0.36 (p = 0.004)

-0.25 (p = 0.035)

-0.30 (p < O.DO I)

-0.15 (p = 0.13)

-0.55

< O.DO I)

-0.52 (p < O.DO I)

-0.49 (p < O.DO I)

-0.35 (p < O.DO I)

0.70(p<0.DOI)

-0.65 (p < O.DO I )

-0.50 (p < O.DO I)

-0.38 (p < O.DO I)

-0.54 (p < O.DO I)

-0.48 (p < O.DO I)

-0.51 (p < O.DOI)

-0.38 (p < O.DOI)

(p

itens na escala de incapacidade causada por doen~a; reproduzimos apenas 5aqui.

[~I.AtiVidad~~"l~,.~t~i~'~~i~;a~i)~~,

213

Se voce observar cuidadosamente, vera que as variaveis que compartilham a maior parte
da varia-ncia umas com as outras estiio relacionadas a qualidade de vida, satisfa~ao com os
relacionamentos e com a vida. Esse e urn padrao que emerge dos dados. Essas variaveis estao
correlacionadas umas com as outras, formando urn grupo "natural". As outras duas variaveis,
sentir-se triste e ter acessos de choro, tambem estao correlacionadas entre si (0,442), mas nao
com as demais variaveis, demonstrando um segundo padrao. Dessas seis variaveis, podemos
distinguir dois padr6es distintos. Obviamente, nesse exemplo, com poucas variaveis, fica
relativamente facil distinguir os padr5es.
Psic610gos desenvolvendo ou verificando as propriedades de questionarios fazem uso
desse tipo de "padroniza~ao" para agrupar variliveis. Isso e util quando, por exemplo, urn
questionario foi desenvolvido para medir aspectos di1'erentes de, digamos, personalidade ou
qualidade de vida. No exemplo, as variaveis no primeiro grupo sao quest6es que constituem
uma subescala de urn questionano de qualidade de vida. Urn questionano pode incluir ques
toes relacionadas a vida familiar (isto e, uma subescala) e outras relacionadas II situa~ao
financeira e talvez vida sexual. 0 questionano de qualidade de vida consiste em vanas subes
calas diferentes.
o usa de padroes de correla~oes para verificar agrupamentos de perguntas da uma maior
confian~a nos questionanos elaborados por psic610gos. Obviamente eles nao olham somente
para as matrizes correlacionais. Eles usam uma tecnica chamada de Analise Fatorial, que
efetivamente faz a mesma coisa. S6 que melhor! Isso e discutido com mais detalhes no
Capitulo 12.

nas costas). 0 que voce pode diier sobre 0 tamarih6 e9signfficadb'da$vAriasc6rrela~pes7 ...
.""" ')~~r. d:~'

"...

. i:;':i" .;"' .":-

'"

. ..... ,

Resumo

5.3

Pad roes de

correla~oes

Voce deve ser capaz de observar quais padroes de correla~ao ocorrem em uma matriz de
Por exemplo, analise a seguinte situa~ao:

correla~5es.

~~
"~~~

relationship
with spouse
(relacionamento

relationship with spouse


(relacionamento com a esposa)

family relationships

family
other social
re!z!ionships relationships
(relifionamentos (outros relaciona

other social relationships


felt sad (,entir-se Iriste)
satisfied with life
(satisfeito com avida)

had crying spells

(ler crises de choro)

(sentir-se

i~: ~::-

satisfied
had
with life cryi g spells
<satisfeito
ter crises
com a vida)
echoro)

com a esposa)

familia res)

mentos sociais)

Iriste)

1.000

0.672

0.547

0.321

0.500

1.000

0.689

0.236

0.508

0.072

1.000

0.165

0.584

-0.010

1.000

0.224

0.442

1.000

-0.117

<

(relacionamentos familiares)
(outros relacionamentos sociais)

~ felt sad

f~~~n ~;$r::-(..:;,r~{

"

>

0.119

1.000

Se duas variaveis sao correlacionadas, entiio nao sao independentes: quando os esco
res de uma variavel mudam, os escores da outra variavel tambem mudam, de maneira
previslvel.
Correla~6es podem ser positivas (valores altos de x tendem a ser associados a valores
altos de y, tanto como valores baixos de x tendem a ser associados a valores baixos de
y), negativas (valores altos de x sao associados a valores baixos de y) ou zero (ausen
cia de relacionamento linear).
Coeficientes de correla~ao variam de -I (relacionamento negativo perfeito), passan
do por zero, ate + I (relacionamento positive perfeito).
0 r de Pearson e urn coeficiente de correla~ao parametrico; reo efeito natural. Pode
ser elevado ao quadrado para se ter uma medida da varilincia explicada, expressa
como percentagem.
Limites de confian~a podem ser construldos em tome do r de Pearson. Se 0 r da
amostra eO,S, e os limites de confian~a sao 0,4 a 0,6 (Iimites de 95%), voce pode ter
95% de confian~a de que, na popula~ao, r sera encontrado no intervalo 0,4 a 0,6.
Analisar padrOes de correla~oes dentro de uma matriz pode nos mostrar quais varia
veis "ficam juntas", e isso e importante na psicometria.

214

pelos valores de
eada?

5umMio de casos
Illness intrusiveness
(Incapacidade causada pela doen~a)

STIGMA (E,tigma)

(a)
(b)
(c)
(d)

99.00

1.00

30.00

78.00

2.00

23.00

47.00

4.00

43.00

(b) -1.00
(c) +1,00

87.00

3.00

48.00

(d) Zero

20.00

94.00

1.00

39.00

66.00

6.00

40.00

70.00

3.00

25.00

10

67.00

3.00

28.00

11

62.00

4.00

64.00

12

85.00

2.00

33.00

13

78.00

2.00

33.00

14

87.00

3.00

34.00

15

53.00

7.00

73.00

16

79.00

1.00

20.00

17

62.00

5.00

37.00

18

79.00

6.00

20.00

19

83.00

2.00

40.00

20

86.00

2.00

21.00

20

20

20

0.6%

tes. a eorrela~ao entre e1as e:

(a) 25%
(b) 50%
(c) 7~

(a) ...{J,I

(d) Nenhuma das altemativas

2. Se duas variaveis sao eompletamente independen

7. Alguem que fez uma amUise eorrelaeional eneon


trou urn efeito de 64%. Qual e

As questoes 3 II 5 referem-se aos segu;ntes resultados:

2. Obtenha uma correla"ao entre estigma e CQV, mantendo constante os efeitos da


incapacidade causada por doen"a. Use uma hip6tese unilateral.
3. Pense sobre a dire"ao e magnitude dos coeficientes de correla"ao. 0 que voce con
clui dessa analise?
N. de T. Comprometimento da Qualidade de Vida (Comprom;sses Quality of Live).

valor de r obtido?

Correlations (Correla~oe,)

age (idade)

family relationships

age
(idadel

mood
(humor)

quality of
life(Qv)

(relacionamentos familiares)

Pearson Correlation
(Correlacao de Pearson)
5ig. (2-tailed)
(5io. bilateral)

1.000

-0.011

--{).093

-0.106

0.912

0.332

0.264

113

112

111

112

Pearson Correlation
mood (humor) (Correla~ de Pearson) --{).011
5ig. (2-tailed)
0.912
(5ig. bilateral)

1.000

0.463

--{).328

0.000

0.000

112

118

115

117

0.463

1.000

--{).598

Pearson Correlation
quality of life (QV) (Correla~o de Pearson) --{).093
5ig. (2-tailed)
0.332
(5ig. bilateral)

0.000

0.000

111

115

116

115

Pearson Correlation --{).106


(relacionamento5 familiares) (Correla~o de Pearson)
5ig. (2-tailed)
0.264
(5ig. bilateral)

--{).328

--{).598

1.000

0.000

0.000

112

117

115

family relationships

I. Obtenha uma correla"ao de ordem zero entre estigma e CQV.

(a) +0,8
(b) ...{J,8

Analise os dados:

eorrela~ao de

0,5. quanta varianeia nao foi explieada?

26.00

2.00

(c) p=0,9l2

6. Se voce obtem urn eoefieiente de

5.00

68.00

p<O,OOI

(b) p=O,OII
(d) p<O,OI

48.00

(a)

x, quanta varianeia nao foi expli

64%
36%
6%

e 0 nlvel de significi\neia atingido para rela

~5es familiares e humor?

I. Se 36% da varianeia nos valores de y foi explieada

Coloque os seguintes dados no SPsSPW:

QOL(CQVj

5. Qual

QUESTOES DE MULTIPLA ESCOLHA

Exerdcios para 0 SPSSPW

Total

215

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

118

5ig. = 5ignificancia
(c) 0,8, mas nao podemos eoncluir se
positivo ou negativo

3. Das variaveis abaixo, quais demonstrarn 0 relaeio


namento mais fone:
(a)
(b)
(c)
(d)

QV e rela~Oes familiares
QV e idade
humoreQV
humor e idade

4. Qual e a eorrela~ao mais fraea?


(a)
(b)
(c)
(d)

QV e idade
humor e idade
rela~6es familiares e idade
rela~6es familiares e humor

valor

(d) +0.64

8.

Se voce obtem urn eoefieiente de eOITe1a~ao de


0,4, quanta varianeia nao e explieada?
(a)
(b)
(c)
(d)

16%
40%
84%
Nenhuma das altemativas

216

Christine P. Dancey & John Reidy

Estatistica sem Matemiltica para Psicologia

9. Tempo gasto trabalhando na frente do computador


e visao ruim tern uma correla"ao negativa. 0 que
voce deve concluir?
(a) PeSSoaS com a visao ruim tern maior probabi
lidade de passar longas horas trabalhando na
frente do computador
(b) Trabalhar por longas horas pode CaUsar danos
11 visao
(c) Urn tipo especifico de personalidade pode ter
maior probabilidade de ter a visao ruim e de
trabalhar longas horas na frente do computa
dor
(d) Qualquer uma das altemativas, pois correla
"ao nao significa causalidade

Qual e a resposta mais sensata? As variaveis mos


tram uma correla"ao de:
(a) +1,00
(b) -1,00
(c) +0,7
(d)

I J. Observe 0 seguinte diagrama de dispersao:


18

14

w
~

;1!

12

l;;

10
8

140

130
120

.'

....

i '

. ..: .

110

. e.- .

..

10

20
30
MATHEMAT

10

12

14

Qual e a resposta mais sensata? As variaveis mos


tram uma correJa"ao de:
(a) -I,D
(b)

90 I

AGE

100

40

50

(a) relacionamentos familiares e relacionamento


com a esposa
(b) satisfeito com a vida e relacionamentos fami
liares
(c) relacionamentos familiares e OUtrOS relacio
namentos sociais
(d) sentir-se triste e ter acessos de choro
13. Qual correla"ao e a mais fraca?
(a) relacionamentos familiares e relacionamento
com a esposa
(b) relacionamentos familiares e outros relacio
namentos sociais
(c) relacionamentos familiares e ter acessos de
choro
(d) satisfeito com a vida e ter acessos de choro

16

Vi

10. Observe 0 seguinte diagrama de dispersao:

~,7

12. Das seguintes variaveis, quais mostram 0 relacio


namento rnais fone?

14. Uma correla"ao de ~.5 foi obtida entre altura e

peso para urn gropo de crian"as. Quanto da varian


cia em altura pode ser explicada pela variavel peso,
em percentagem?

(a) 5%
(b) 50%
(c) 25%

(d) Nenhumadas altemativas


15. Urn pesquisador deseja investigar 0 relacio

namento enlre motiva"ao e desempenho em


exames. Entrelanto, ele tern motivos para acre
ditar que 0 QI influencia essas variilveis e decide
obter correl<;Qes parciais. Qual das seguintes
0P'<oes e a mais sensata? Ele deve fazer uma cor
rela"ao entre:
(a) ~tiva,,1io e QI, controlando a variavel de
sempenho em exames
(b) Motiva,,1io e desempenho em exames, contro
lando a variavel QI
(c) QI e desempenho em exames, controlando a
variavel motiva"ao
(d) Nenhurna das altemativas e sensata
Quesloes /6 e /7 rrferem-se a seguinte TnQlriz. As eelu
las foram nomeadas:

~,I

(c) +1,00

(d) +0,1
Questoes /2 e /3 estiio relacionadas
de resultados:

a seguinte tabela

a.ul~;~j:,'r--

==

a
i

01

c
i

d
i

Sintomas

Correlations (Correla~6es)
relationship
with spouse
(relacionamento
com a esposa)
relationship
with spouse
(relacionamento
com aesposa)
family
relationships
(relacionamentos
familia res)
other social
relationships
(outros relaciona

1.000

family
relationships

other social
relationships

(relacionamentos

(outros relaciona

satisfied
with life
(satisfeito
com avida)

had cryinPs
spel s
(ter crises
de choro)

mentos sociais)

felt sad
(sentir-se
triste)

0.672

0.547

0.321

0.500

0.119

1.000

0.689

0.236

0.508

0.072

familiares)

1.000

0.165

0.584

-0.010

felt sad (senlir-se


triste)
satisfied with
life (satisfeilo
com a vida)
had crying
spells (ter crises
de choro)

Incapacidade

.r~

Cren~as

mentos sociais)

intrinsecas
1.000

0.224

0.442

1.000

-0.117

Cren~s

1.000

217

extrinsecas

218

Christine P. Dancey & John Reidy

16. Qual celula esta relacionada ao diagrama de disper


sao entre cren~as intrfnsecas e cren~as extrfnsecas?
(a) dl
(b) d2
(c) d3
(d) d4
17. A celula c3 eSla relacionada a:
(a)
(b)
(c)
(d)

Incapacidade e cren~as intrfnsecas


Incapacidade e cren~as extrfnsecas
Incapacidade e sintomas
Depressao e sintomas

18. Urn relacionamento positivo significa que:


(a) Urn relacionamento importante existe
(b) Quando valores em x aumentam, valores em y
diminuem
(c) Quando valores em x aumentam, valores em y

tamb6m aumentam

(d) Valores alios sao freqiientes em x e y

19. Se urn coeficiente de correla~ao tern urn valor de


probabilidade associada de 0,02, entao:
(a) Nossa hip6tese eobviamente verdadeira
(b) Nossos resultados sao importantes
(c) Existe uma chance de somente 2% de
nossos resullados tenham ocorrido por
amostral, se considerarrnos a hip6tese
verdadeira
(d) Existe uma chance de somente 2% de
nossos resultados estejam corretos
20. 0 SPSSPW imprime 0 seguinte: p
isso deve ser relatado?
(a) p < 0,001
(b) p < 0,0001
(c) p>O,OOI

(d) p>O,oool

que
erro
nula

Analise de Diferen~as entre Duas


Condi~6es: 0 Teste t

que

=0,000. Como

Referencias
ALT, M. Exploring Hyperspace. McGraw-Hili, 1990.
CACIOPPO, J. T., PETrY, R. E. The need for cognition. Journal 0/ Personality and Social
Psychology, v. 42, p. 116-31.
DANCEY, C P. et al. Perceived stigma, illness intrusiveness and quality of life in men and women
with irritable bowel syndrome. Psychology, Health & Medicine, v. 7, n. 4, p. 381-95, 2002.
HARKAPAA, K., JARVIKOSKI. A., ESTANDER, A. Health optimism and control beliefs as
predictors for treatment outcome of a multimodal back treatment program. Psychology & Health.
v. 12, n. I, p. 123-34,2000.
HUFF, D. How to lie with Statistics. London: Penguin, 1973.
LAWTON, R., et aI. Predicting road traffic accidents: the role of social deviance and violations.
British Journal 0/ Psychology. v. 88, p. 249-62, 1997..
MICHAS, I. C, HENRY, L. A. The link between phonological memory and vocabulary acquisition.
British Journal o/Developmental Psychology. v. 12, n. 2, p. 147-63, 1994.
ROSNOW, R. L., ROSENTHAL, R. Computing contrasts, effect sizes and countemulls on other
people's published data: general procedures for research consumers. Psychological Methods. v. I,
n.4,p.331-40, 1996.
YERKES, R. M., DODSON, 1. D. The relation of strength of stimulus to rapidity of habit-fonnation.
Journal o/Comparative Neurology and Psychology. v. 18, p. 459-82, 1908.

.-

Panorama do capitulo

Nos capitulos anteriores, voce foi apresentado observa"ao de como os valores de uma
variavel se relacionam com os de outra variavel, e para essa analise aprendeu sobre 0 teste pa
rametrico denominado de r de Pearson. Neste capitulo, voce ira considerar as diferen"as entre
valores em duas condi,,6es. Por exemplo, voce poderia comparar a habilidade de memoria de
pessoas com ou sem fobia de aranhas para ver se ha diferen"a. Tal delineamento e chamado de
entre participantes, independente ou nao-relacionado, pois um grupo de participantes fornece
os valores em uma condi"ao, e um grupo diferente de participantes fornece os valores em outra
condi"ao diferente. Por urn outro lado, um grupo de participantes pode participar das duas
condi,,6es, por exemplo, aprendendo tanto as palavras de alta frequencia quanta as de baixa
frequencia. Estudamos. enta~, 0 numero de palavras lembradas. Esse estudo e chamado de den
tre participantes, medidas repetidas ou relacionado, pois a mesma amostra de pessoas participa
das duas condi,,6es. Neste capitulo, vamos discutir as analises de duas condi,,6es usando 0 teste
parametrico chamado teste t. Estamos interessados nas diferen"as entre os dois grupos, mais
especificamente na diferen.;a entre a media dos dois grupos. Mostraremos como analisar os da
dos desse tipo de delineamento. Como 0 teste t e urn teste parametrico, voce deve lembrar que
os seus dados devem satisfazer as suposi,,6es dos testes parametricos, isto e, os dados devem
ser retirados de uma popula.;ao com uma distribui"ao normal. Temos a tendencia de su por que
esse e 0 caso quando os dados da amostra satisfazem esta condi"ao. Se voce tern motivos para
acreditar que nao e 0 caso, entao precisa utilizar 0 equivalente nao-parametrico do teste t que
e descrito no Capitulo 15.
Para en tender os testes apresentados neste capitulo, voce precisa de um conhecimento dos
seguintes conceitos:






media, desvio padrao e erro padrao (Capitulo 2)


valores z e distribui"ao normal (Capitulo 3)
suposi,,6es que formam a base do uso de testes parametricos (Capitulo 4)
distribui,,6es de probabilidade como a distribui"ao t (Capitulo 4)
hipoteses unilaterais e bilaterais (Capitulo 4)
significancia estatistica (Capitulo 4)
intervalos de confian"a (Capitulo 3)

220

6.1

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

6.1.2

Analise de duas (ondi~6es

Estatisticas descritivas para 0 delineamento de dois grupos

3. Limites de confialll;a em tomo da diferenc,;a entre as medias.

A primeira coisa a fazer e obter as estatfsticas descritivas por meio do procedimento


Explore (Explore) no SPSSPW (ver pagina 68). Voce pode entender melhor os dados obser
vando i1ustrac,;5es graticas, como os diagramas de caixa e bigodes e/ou histogramas. Resumos
estatlsticos, como as medias, os desvios padr5es e intervalos de confianc,;a, estao disponfveis
no SPSSPW, que apresenta os resultados em fonna de tabelas (essas estatfsticas tambem sao
apresentadas como parte da safda na analise dos dados atraves do teste t),
Voce pode ver na Tabela 6.2 que as medias diferem na direc,;ao esperada. Os participantes
na condic,;ao sem barulho lembraram uma media de 13,8 palavras, enquanto os na condic,;ao
com barulho lembraram uma media de 7,3 palavras.As pessoas na condic,;ao com barulho
mostraram maior variabilidade, como indicado pelos desvios padroes.

4. Testes inferenciais - testes t que descobrem qUaD provavel e que a diferenc,;a entre
as condic,;oes possa ser atribufda ao erro amostral, considerando que a hip6tese nula
seja verdadeira.

Tabela 6,2 Media, desvio padrao e limiles de confian~a de 95% para condi~iies com barulho e sem
barulho

A analise de duas condic,;5es inclui:

I. Estat{stica deseritiva, tal como medias e medianas, desvios padr5es; intervalos de


confianc,;a em tomo da media de ambos os grupos separadamente, em que isso e
apropriado; i1ustrac,;5es graficas, como os diagramas de caixa e bigodes e de barras
de erro.
2. Tamanho do efeito, medida do grau no qual diferenc,;as de uma variavel dependente
sao atribufdas a variavel independente.

CoIiI baruIho '

6,1.1

221

Analise de diferen~as entre dois grupos independentes


Vinte e quatro pessoas foram envolvidas em urn experimento para determinar se 0 baru
Iho de fundo (musica, batida de portas, pessoas fazendo cafe, etc.) afeta a mem6ria de curto
prazo (lembrar de palavras). Metade da amostra foi a10cada a1eatoriamente a condic,;ao ba
rulho e metade para a condic,;ao sem barulho. Os participantes na condic,;ao barulho tentaram
memorizar uma lista de 20 palavras em dois minutos, enquanto escutavam, com fones de
ouvido, urn barulho pre-gravado. Os outros participantes utilizararn tarnbern fones de ouvido,
mas sem 0 barulho, enquanto tentavam memorizar as mesmas palavras e no mesmo tempo.
Imediatamente depois, foram testados para ver quantas palavras lernbravam. 0 mlmero de
palavras lembradas por cada pessoa em cada uma das condic,;5es esta na Tabela 6.1.
Tabela 6.1

Dados brutos para condi~Oes com barulho e sem barulho

'. ,-"Cdinbandoo:::-h;CC,;'\';i,,I'.~.;;i~~~~~~~~.lii::~'}":
5,00
10,00
6,00
6.00
7.00
3,00
6,00
9,00
5,00
10,00
11,00
9,00
I: = 87'
7,3"
DP 2,5'

x=

, I: representa 0 total da coluna

" Xrepresenta a media

, DP representa 0 desvio padrao

15,00
9,00
16,00
15,00
16,00
18,00
17,00
13,00
11,00
12,00
13,00
11,00
I: = 166
13,8
DP=2,8

x=

6.1.3

'"Sembandbo' ,

Jl

DesvIo plidrio

IC ddS%

Jl

Demopadrio

ICde9S%

7,3

2,5

5,7 - 8,8

13.8

2.8

12.1- 15.6

Intervalo de confian~ para a media


As medias que voce obteve por sua amostra sao estimativas por ponto. Essas medias
amostrais constituem as melhores estimativas das medias populacionais. Se, entretanto, re
pelfssemos 0 ex peri menlo muitas vezes, verfamos que a media varia de experimento para
experimenlo. Por exemplo, a media da amostra para a condic,;ao sem barulho e 13,8. Se repe
tfssemos 0 experimenlo, poderfamos obler uma media da amostra de 13,3. Se 0 experimento
fosse repetido muilas vezes, a melhor eSlimativa da media populacional seria a media de to
das as medias amostrais. Deve ser 6bvio. no entanto, que nossa estimativa pode ser urn pouco
diferente da verdadeira diferenc,;a media na populac,;ao: portanto, seria melhor, em vez de dar
uma eSlimativa por ponto, fomecer urn intervalo de valores. Seria mais realista.
o intervalo e Iimitado por urn valor inferior (12, I nesse caso) e urn valor superior (15,6,
no exemplo). Esses valores sao denominados de limites de confianc,;a, e os valores entre esses
limiles, de inlervalo de confianc,;a. Voce ja viu isso no Capitulo 3. Os limites de confianc,;a nos
indicam 0 quanlo podemos estar confiantes de que 0 inlervalo contem a media populacional.
Por que os limites de confianc,;a sao importantes? Quando conduzimos experimentos ou
eSludos, queremos ser capazes de generalizar os resultados para a populac,;ao. Tambem que
remos que nossos leitores tenham uma ideia completa e correta dos resultados. Embora a
media amostral da condic,;ao com barulho seja 7,3, informar ao leitor que "temos 95% de
confianc,;a de que nossa media populacional esla entre 5,7 e 8,8" fomece mais informac,;ao e e
mais realisla do que simplesmente infonnar a media amostraI. Intervalos de confianc,;a estiio
sendo fomecidos cada vez mais em artigos cientfficos, e, portanto, e importante que voce os
entenda bern.

222
6.1.4

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Intervalos de confian91 entre as condi~oes com barulho e sem barulho

223

Nesse caso. nossas medias diferem em 2,45 desvios padroes. Esse e urn efeito muito
grande, que nao e freqiientemente encontrado em pesquisas psicol6gicas.

Para a condie<ao com barulho, estimamos (com 95% de confiane<a) que 0 intervalo de 5,7
e 8,8 contem a media populacional. Isso pode ser representado graficamente, como ilustrado
pela Figura 6.1.

6.1.6

o tamanho do efeito
o tamanho do efeito, d, e expresso em desvios padri5es. Imagine a curva normal:

18

16

"j

:;., 12
<7\
QI

I+--

~ 10

8~

6~

d=>

-3

A
-2

I
I
I
I

:
I

-1

68,2%_
,
:
:
:

I
I
I
I

9S,Sro
99,7Vo
0

+1

:
I

"J'.-,..
I
......e:::..
+2

+3

N=

12

12

Com barulho

Sem barulho

Os valores z sao padronizados para que a media seja zero e 0 desvio padrao seja I. Pode
se ver que. se as medias diferissem por 0,1, iriam diferir por somente urn decimo do desvio
padrao. Esse e urn nl1mero muito pequeno na nossa escala de 0 a 3. Se as medias diferissem
em 3 desvios padroes, seria considerado muito em uma escala de 0 a 3. Nao existe uma regra
segura e rapida sobre 0 que constitui urn efeito pequeno ou grande. Cohen (1988) apresenta
a seguinte recomendae<ao:

limites de confian~a de 95% para as condi~6es com barulho e sem barulho.

6.1.5

Medida do efeito
Podemos tambem obter a media de uma para outra, a fim de verificar 0 quanto diferem:

7,3 - 13,8 =--6,5


Esse valor, por si s6, informa muito pouco. Se padronizarrnos, sera muito mais I1til. 0
valor bruto (valor original) e convertido em urn valor z. 0 valor z e urn valor padronizado, que
fomece uma medida do efeito, que e facilmente entendfvel. Essa medida do efeito e denomi
nada de d e mede 0 quanto duas medias di ferem, em termos de desvios padroes. Ecalculada
da seguinte forma:

d=

X I - X2

media dos desvios


Isso significa que subtrafmos uma media da outra (nao importa qual equal - ignore
sinal) e dividimos a diferene<a pelo desvio padrao da media.
Passo I: calcular 0 desvio padrao da media
desvio padrao da condie<ao 1+ desvio padrao da condie<ao 2

2,5 + 2,8

Passo 2: calcular d

x, -x,
= 7,3-13,8 = 2 45

media dos desvios


2,65
'

2 65

'

:.:~:;ii;;'iii~~~~~ti%f~J~;C~~.~!~~!~~1ji;j~~~~gi~;~~.~(%)
Pequeno
Media
Gl1lIlde

0,2
0,5
0,8

85
67

53

Quando existe uma diferene<a pequena entre os grupos, os valores coincidem substancial
mente. Os valores para os grupos podem ser plotados separadamente; por exemplo, os valores
para a condie<ao com barulho podem ser plotados e tendem a ter uma distribuie<ao normal. Os
valores para a condie<ao sem barulho podem tambem ser plotados e tendem a ter, da mesma
forma, uma distribuie<iio nonnal. Se existe pouca diferene<a entre eles, as distribuie<oes tern
grande sobreposie<iio.

224

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Se existe uma grande diferen<;a entre os dois grupos, as distribui<;oes ficam mais separadas.

Eo que queremos dizer por percentagem de sobreposi<;ao. Essa medida do efeito permite
que possamos interpretar resultados de maneira significativa. A extensao exala da sobreposi
<;ao e dada na labela abaixo:
d
0.1
0,2

0.3
0,4

0,5

0.6
0.7
0,8
0,9
1,0
1./

1,2
1.3
1,4
1,5

~cIilsob~('l ;
92
85
79
73
67
62
57
53

48
45
42
37
35
32
29

o tamanho do efeilo e disculido tambem no CapItulo 7.

~!-~iil;~~;iq"j~~~;,
6.1.7

Estatistica inferencial: 0 teste t

o leste I e usado quando lemos duas condi<;oes. Avalia se exisle uma diferen<;a significa
tiva entre as medias das duas condi<;i5es.

225

o lesle I independenle e usado quando os participantes lomam parte em apenas uma de


duas condi<;Oes, iSlo e, urn delineamenlo independente, entre participantes ou nao relaciona
do, Urn lesle I, para dados relacionados ou emparelhados, e ulilizado quando os participanles
lomam parte de ambas as condi<;oes, islo e, urn delineamenlo relacionado, dentre participan
les ou de medidas repelidas.
o lesle I foi criado por William Sealey Gossel em 1908, Gossett trabalhava para a cerveja
ria Guinness, cujos cienlislas nao podiam publicar os resullados de seus trabalhos cienlificos.
Gossett publicou seus resultados usando 0 novo leste sob 0 nome de Sludent (Esludanle),
mOlivo pelo qual voce vera, em livros de estatfslica, referencias ao I de Sludent.
Observe novamenle os dados brulos para as condif;oes com barulho e sem barulho (Tabe
la 6.3). A primeira coisa que voce deve now e que os v~res dos participanles variam denlro
das condi<;oes. Na condic;ao com barulho, os valores variam de 3 a II. Na condif;aO sem
barulho, os valores variam de 9 a 18 (essa variabilidade dentre participantes pode ser visla
como variancia dentro de cada coluna). Voce deve lembrar, do CapItulo 2, que 0 desvio pa
drao e uma medida da variabilidade - quanto maior for 0 desvio padrao maior a variabilidade
dos valores dentro de cada condi<;ao. Os valores dos participanles diferem, tambem, entre as
condif;oes. Voce pode ver que os valores na condif;oo sem barulho, no geral, sao mais altos
do que os valores na condif;ao com barulho - as medias confirmam nossa experiencia visual
com os dados. Essa e a variancia entre participantes e pode ser vista como a variancia entre
as colunas,
Queremos saber se as diferenc;as entre as medias dos grupos sao grandes 0 suficienle
para podermos conduir que as diferenf;as ocorrem somenle devido a influencia da variavel
independenle - quer dizer, pela manipula<;ao das condif;oes com barulho e sem barulho. Con
seguiremos isso fazendo alguns calculos com os dados. A formula para 0 lesle I (nao dada
aqui) resulta numa estatislica lesle, que chamamos de "1".0 lesle Ie basicarnente 0 quocienle
da medida da variancia entre os grupos pela variancia dentro dos grupos. Quanlo maior a va
riancia entre os grupos (colunas), comparada com a variancia denlre os grupos (linhas), maior
sera 0 valor da estatistica I.
Uma vez calculado 0 valor I, podemos (melhor, 0 computador pode) achar a probabi
lidade de obler tal valor por acaso (devido ao erro amostral), considerando a hipOlese nula
verdadeira.
Tabela 6.3 Dados brulos para as condi~Oes de com barulho e sem barulho

". "~~f~~~~~;;~:l~tt~~~:\:~-J ;: :~~:\~~?:(l~;~~ft~~~~~~~~:~


5.00
10,00
6.00
6,00
7,00
3,00
6,00
9.00
5,00
10,00
11,00
9,00

15.00
9.00
16,00
15,00
16.00
18.00
17.00
13,00
11,00
12.00
13.00
11,00

1:=87

1:=166

X=7,3

X=13,8

~=~

~=U

226

Estatfstica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Se niio existissem diferen~as entre a condi~iio com barulho e a condi~iio sem barulho,
qual seria a probabilidade de achar tal valor para t?
Se niio existem reais diferen~as entre as condi~6es com barulho e sem barulho e tinlsse
mos varias amostras, a maior parte das diferen~as estaria em tomo do valor zero (as medias
das condi~6es com barulho e sem barulho seriam praticamente iguais). A.s vezes, entretan
to, encontramos urn valor maior que zero (talvez, por exemplo, participantes na condi~iio
com barulho se saissem melhor do que os participantes na condi~iio sem barulho). A.s vezes
encontramos uma diferen~a grande. Essas diferen~as siio geralmente aleat6rias, existem so
mente porque usamos amostras diferentes a cada vez - dizemos que ocorrem devido ao erro
amostral. As diferen~as que podemos encontrar se considerarmos vanas amostras podem ser
plotadas como mostra a Figura 6.2 (e outro exemplo de distribui~iio amostral).
Se nao existe diferen~a, de fato, entre as medias no nosso experimento, seria mais pro
vavel que 0 valor t estivesse na area central do que em uma das "caudas" da distribui~iio
amostral. Sabemos, por meio do teorema do limite central, que a maior parte dos valores
obtidos estara na regiiio central (ver pagina 113). Seria raro (mas possfvel) encontrar urn
valor t nas caudas, como representado acima, se conduzirmos 100 experimentos repetidos
sobre as condi~6es com barulho e sem barulho, usando amostras diferentes. Em uma pequena
percentagem de experimentos, encontrarfamos urn valor t que estaria nos extremos da distri
bui~ao. Se na pnitica, obtivermos urn valor t que se encontra em uma das caudas, conclufmos
ser improvavel que ele tenha ocorrido somente devido ao erro amostral. Podemos colocar
urn numero nessa "improbabilidade" tambern. Cada valor t obtido vern com urn nfvel exato
de probabilidade associada. Se, por exemplo, nosso valor t tern urn nfvel de probabilidade
associada de 0,03,1 podemos dizer que, considerando a hip6tese nula verdadeira, urn valor
t como 0 obtido em nosso experimento tern a probabilidade de ter ocorrido em 3 ocasi6es
de 100. Portanto, conclufmos que existe uma diferen~a entre condi~6es que nao podem ser
explicadas por erro amostral. Como voce ja viu no Capitulo 4, isso e 0 que queremos dizer
por "significancia estatfstica", 0 que nao quer dizer necessariamente que nossos resultados
sao psicologicamente importantes ou que encontramos urn grande efeito. Temos de levar em
considera~iio as estansticas descritivas e qualquer medida de efeito, intervalos de confian~a,
etc., que tambem calculamos.

:")

~ ';

1 ".,. , .., ,. ",

6.1.8

Saida para 0 teste t independente

,-

Em nosso experimento, a variavel dependente e 0 numero de palavras lembradas corre


tamente, e a variavel independente e barulho (condi~ao com barulho ou sem barulho). Todos
os bons pacotes de programas computacionais, como 0 SPSSPW, dariio as seguintes infor
ma~6es:

As medias das duas condifoes e as diferenfas entre elas: 0 que voce deseja saber e
se a diferen~a entre as duas medias e grande 0 suficiente para ser importante (nao so
mente a "significancia estatfstica", que informa a probabilidade de a estatfstica teste
ser obtida quando a hip6tese nula for verdadeira).
1ll1ervalos de confianfa: 0 SPSSPW, usando 0 procedimento teste t, fomece os limites
2
de confian~a para adiferenfa entre as medias. A diferen~a entre as medias amostrais e
uma estimativa por ponto. Essa diferen~a das medias amostrais e a melhor estimativa
da diferen~a das medias populacionais. Se, entretanto, repetirmos nosso experimen
to muitas vezes, veremos que a diferen~a varia de experimento para experimento. A
melhor estimativa da media populacional seria a media de todas essas diferen~as de
medias. Claramente, e melhor fomecer uma estimativa por intervalo, como explicado
anteriormente. Limites de confian~a nos fomecem 0 quanto esta confiante de que a
diferenfa da media populacional encontra-se em certo intervalo. E uma estimativa
por intervalo para a popula~ao (nao somente para a amostra).
Valor t: quanto maior 0 valor t, maior a probabilidade de que a diferen~a entre os gro
pos nao resulte do erro amostral. Urn valor negativo e tao importante quanto urn valor
positivo. A dire~ao positiva ou negativa dependera de como os gropos tenham side
codificados. Por exemplo, chamamos a Condi~iio I de com barulho e a Condi~ao 2
de sem barulho. Obviamente, isso foi uma decisao arbitrana, pois poderiamos ter
feito ao contrano, 0 que resultaria no mesmo valor absoluto de t, mas com urn sinal
diferente (positivo ou negativo).
Valor p: e a probabilidade de 0 valor t obtido ter ocorrido devido a variabilidade amos
tral ou erro, sendo a hip6tese nula verdadeira. Isso significa que 0 valor t obtido esta
em uma area da curva incomum, isto e, nao seria esperado que tal valor estivesse,
aleatoriamente, nessa regiiio. 0 valor pea probabilidade de isso ter ocorrido devido ao
erro amostral. Por exemplo, p 0,001 significa que existe somente uma chance em mil
de esse resultado ter ocorrido par erro amostral, sendo a hip6tese nula verdadeira.
Grau de liberdade (gl): para a maioria dos prop6sitos e testes (mas nao todos), os graus
de liberdade aproximadamente se equiparam ao tarnanho da amostra. Para urn teste t
relacionado, 0 grau de liberdade e sempre urn a menos que 0 numero de participantes.

Distribui~ao amostral.

\"j".

~:~~.1t~t

227

Psic61ogos geralmente chamam nivel de significancia atingido (NSA). Usaremos esses cermos intercambiavelmenle nesse Iivro,
:!

Emais importante relatar 0


separadamente.

intervalo de confian~a para a direren~ entre as m&lias do que relaLar os inlervalos para as duas medias

228

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Para urn teste 1independente, os graus de liberdade sao (n - I) + (n - 1)/ portanto para
uma amostra de 20 (10 participantes em cada grupo), gl = 18 (p.e. 9 + 9)'. Para urn
delineamento dentre participantes com uma amostra de 200 gl 19. Os graus de li
berdade devem sempre ser considerados em relat6rios ou projetos de laborat6rio, junto
com 0 valor 1, 0 valor p e os limites de confian<;a para a diferen<;a entre as medias. 0
grau de liberdade e geralmente escrito entre parenteses, por exemplo: 1(87) =0,78. Isso
significa que 0 valor 1foi 0,78 para urn grau de liberdade igual a 87.
Desvios padroes: fomece a variabilidade das amostras envolvidas no teste (ver pagi
na 90).
Erro padriio da media (epm): e utilizado no calculo dos intervalos de confian<;a (ver
pagina 126).

Esse e urn termo matematico geralmente usado nas formulas dOS testes estatfsticos. Existem
defini<;Oes matematicas que nao sao uteis para muitos psicologos e outras que sim, como, por exem
plo, a do grau de liberdade, que se refere ao numero de valores individuais que podem variar (serem
livremente alterados) no calculo da variancia da amostra. Alguns exemplos podem ajudar a ilustrar
o conceito. Por exemplo, se pedirmos que escolha dois numeros quaisquer, sem restri<;oes, ha dois
graus de liberdade. Agora, se solicitarmos que escolha dois numeros cuja soma seja 10, entao, uma
vez escolhido 0 primeiro numero, por exemplo, 0 7, 0 outro nao sera mais livre, pois voce necessa
riamente deve escolher 0 3 para que a soma seja 10. Neste caso, voce dispOe de apenas urn grau de
liberdade.
Vamos examinar urn exemplo que nao envolva matematica. Imagine que voce e 0 anfitriao de
urn jantar importante e que precisa alocar 10 pessoas em uma mesa. 0 conhecimento de onde os
primeiros nove irao sentar ira determinar onde a decima pessoa senta. Assim voce tern liberdade de
decidir onde as primeiras nove pessoas iraQ sentar, mas 0 lugar da decima estara automaticamente
determinado pela posi<;ao das primeiras nove (0 gl e, neste caso, 10 - I = 9). Agora imagine que
voce e 0 anfitriao de uma janta II moda antiga, na qual voce tern cinco mulheres e cinco homens e
precisa colocar cada mulher ao lade de urn homem. Nesse caso, sabendo onde os primeiros quatro
pares sentam (oito pessoas), resulta que os lugares do ultimo par (urn homem e uma mulher) estarao
detenninados, isto e, 0 g 10- 2 8).
Isso acontece porque, como visto no exemplo do jantar, temos a liberdade de variar todos os
numeros exceto urn quando formos estimar a variancia da popula<;ao, pois urn dos valores estara
automaticamente determinado pelo conhecimento do valor da media da amostra, isto e, para po
dermos calcular a variancia amostral, precisamos ter calculado primeiramente a media amostral.
Porlanto, 0 conhecimento da media da amostra retira urn grau de Iiberdade no calculo da variancia
dessa mesma amostra.
E claro que os psicologos estao geralmente ocupados com sua profissao, e nao freqiientam
jantares. Portanto, uma maneira mais util de pensar sobre 0 grau de Iiberdade e considera-Io 0
numero de observa<;oes feitas menos 0 numero de parametros estimados. Quando calculamos
testes estatfsticos, geralmente temos de estimar parametros. Uma vez que no teste 1 temos de

n I! 0 numero de participanres em cada grupo.


N. de T. Os autores est30 considerando apenas 0 caso em que os tamanhos amostrais silo iguais. 0 que nao I! obrigal6rio para 0

teste t independenre.

estimar a media para podermos calcular a variiincia da amostra, perdemos urn grau de liberdade.

Por isso e que dividimos a variancia por n - I em vez de n. Quanto mais parametros forem estima

dos, maior sera a redu<;ao do grau de liberdade. 0 gl e resultado tanto do numero de participantes

envolvidos na analise quanto do numero de variaveis. Nao e facil encontrar urn livro de estatfstica

que explique bern 0 que e 0 grau de liberdade ou que mostre sua relevancia. 0 Dr. Chong Ho Yu

oferece uma das melhores explica<;Oes do grau de liberdade que ja vimos, mas boa parte se baseia

em conceitos que voce ira aprender no Capftulo II, enta~ falaremos mais sobre 0 grau de liberdade

quando chegarmos hi. Se voce deseja ver e ouvir 0 tutorial do Dr. Chong Ho Yu sobre 0 grau de

liberdade na Internet, 0 endere<;o do si1e e dado no final deste capftulo (Yu, 2003).

[~IAtI~idade6.3'/

Grau de liberdade

229

\"L

.'..... . Asvezes e fadl ficar confusoqua~d.o o~~sic6Iogos usam variosJlOmesdifere~t~.pa.ra!l .

.; ,ci'neSmi coisa. Quais,sao oS (I0m6)ltemawi:is ~ra urn'delineamentp dentJ'e ~rtiCiparites1('

, ;:'.Quai~Siioos n6m~altemat!V!,~~~p:C!~i~~toentre~rtid~teS7:~~j': 'S:"!. -,' . .','

6.1.9

Suposi~oes que

devem ser satisfeitas no uso do teste t

o teste 1eurn teste parame1rico, 0 que significa que certas condi<;Oes sobre a distribui<;ao
dos dados precisam ser vaJidas; por exemplo, os dados devem ser retirados de uma popula<;ao
de valores normalmente distribufda. Supomos que esse e 0 caso se nossos valores amostrais
sao normal mente distribufdos. Voce pode ver se os seus clados sao assimetricos examinando
o histograma. No passado, para poder realizar urn teste 1, voce seria advertido para utilizar
somente dados intervalares. Entretanto, ha muitos anos os psic610gos tern usado testes 1para
a analise de dados obtidos por meio de escalas do tipo Likert (nas quais variaveis podem ter
sido avaliadas em uma escala de, digamos, I a 7).
o teste 1se baseia na distribui<;ao normal. Portanto, considerarnos que os valores de nossos
grupos, ou condi<;Oes, sao normalmente distribufdos. Quanto maior a amostra utilizada, maior
a probabilidade de se obterem dados normais. Desde que os dados tenham uma distribui<;ao
aproximadamente normal, voce nao precisa se preocupar; mas se eles sao extremamente assi
metricos, entao sera necessaria a utiliza<;ao de urn teste nao-pararnetrico (ver Capftulo 15).
Nesse estligio, recomendamos uma olhada rapida nos histograrnas de cada variavel (eles po
dem ser obtidos com 0 auxflio do procedimento Frequencies (Freqiiencias) do SPSSPW). Voce
deve fazer isso com cada grupo separadamente. As Figuras 6.3 a 6.6 servem como diretrizes.
Lembre que, quando usamos 0 teste 1, comparamos uma diferen<;a de medias. Se nossos
dados sao assimetricos a media pode nao ser a melhor medida da tendencia central.
No passado, os psic610gos erarn aconselhados a aplicar urn teste 1 somente quando as
variiincias entre os dois grupos estivessem pr6ximas. A razao disso e que ao calcularmos
parte da f6rmula (para 0 teste 1), e feita a media das variiincias dos dois grupos envolvidos.
Se as variancias forem muito desiguais, entao 0 resultado obtido nao sera representativo de
nenhuma das duas condi<;Oes. 0 SPSSPW, entretanto, usa urn metodo modificado de calcular
o valor t, no caso de as variancias serem significativamente desiguais, que pennite sobrepor
esta restri<;ao.

230

Christine P. Dancey & John Reidy


Estatistica sem Matematica para Psicologia

0,15
0,10
0,05
0,00 "

,
5

o
_

,
10

.........

15

Assimetria levemente positiva.

Quando temos um numero de participantes diferente nos dois gropos, pode ser enganoso
obter uma media simples das duas variancias, pois seria atribuir pesos iguais aos dois grupos,
quando de fate urn gropo tern urn numero maior de participantes. Nesse caso, deve-se utilizar
a media ponderada. A media ponderada das varilincias amostrais (denominada de estimativa
combinada da variancia populacional) e usada para obter uma estimativa mais precisa da
variancia da popula~ao.
Se os dados apresentarem uma forte assimetria e voce tern urn numero pequeno de parti
cipantes, convem considerar 0 uso de urn teste nao-parametrico (ver Capitulo 15). as testes
nao-parametricos nao necessitam da suposi~iio de normalidade.

6.1.10 0 teste t para amostras independentes

0,15

as

0,10
0,05
0,00" -

o
_

10

~
15

Vamos usar 0 nosso exemplo do experimento com barulho e sem barulho para examinar
de safda do SPSSPW de urn teste t para amostras independentes.

instru~6es

.[~ls~~~,llI~~

Assimetria levemente negativa.

Abra seu arquivo de dados. Primeiro deve montar urn arquivo pr6prio para delineamentos
independentes. Voce aprendeu a fazer isso na s~iio do SPSSPW do Capitulo I; entao, por
favor, refira-se a essa s~ao.

0,15
0,10
0,05
0,00...

o
_

231

,
5

,
10

_
15

Assimetria fortemente positiva.


lUW

110J

0,15

9.00

I
1.00

15.00

2.00

9(1)

2.00

...:~:::I

16.00

0,10
0,05

'irl' "T",

,
i

'

;'1

S.

2.ro

...

:~WI

~::::
~~I

I
I

I
I

I
I

I
I

~~WI

~~!

I
I

I
I

I
I :~

Gi~J~.~~4~;':~~~'::':'::::'~

~OO,

I'"

~~
.

II

IE:ICEr",r.::-:::r::['fF[:'~r--[-f7r;JR'[iTr:-"'f"rcc

----',,:nr_ ... ~~~1.J

\."; .. ,,

232

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

1550 abre a caixa de diaJogos Independent-Samples T Test (Teste t para amostras indepen
dentes), como segue:

Voce precisa dar 0 valor que atribuiu a cada grupo. Por exemplo, se codificou 0 grupo
das mulheres como "0" e 0 dos homens como "I", entao sexo (0, I) e 0 fonnato correto. Em
nosso exemplo, entretanto, nossos grupos foram designados como 1 e 2.
Clique em Continue (Continuar). Essa a~ao 0 leva de volta i\ caixa de dialogo anterior;
entao voce pode clicar em Options (Op~5es), que 0 levaca i\ seguinte caixa de o~Oes. E aqui
que voce pode mudar 0 nfvel de confian~a, de 95% para 90%, por exemplo.
Clique em Continue (Continuar) e ap6s em OK.

I :!)lli)';"q(~e't:~~!-:,"-

- dependentena ~ui!ida '


, na ,listaTe$,v,~rl.lble. ~i'i'Ve1
., 'oIfr.Test..' dl~ndO;s'ok;':;;:':li""~. f"::\
~~~~ 'h, -'," 7'f~~.~~,..".-o:'!.~ ~~~>~.v' :~1J
utihzando (j 1)Otjo~">,,; - ,

1500

200

1600
18m
Doo
.300

200
200
200
200

233

-Pr't\SSione
'.COntinue
(colitinuar)

~-1-_f~t;.:~~~_ Mi~"
::~

'daesquei'lta:p(rchifQiXi
,Va/i;ible (\ia'riiiYelcie;"
... '_

'~,.",:,.~,,;.'

If

Aparece a caixa de dialogo Define Groups (Definir Grupos).

:n
I

'II, ..

11;;;;,Jj

FFPrT.F-:"rT'-fJFi=,rT]7>y.pr::;fi'f'~

'awalE'

~.Ih

. . .'

Os resultados apareceriio na janela de saida. A maioria das safdas fomece muito mais
que voce realmente precisa e pode parecer uma confusao de ntimeros. Entre
tanto, voce aprendera a selecionar 0 que realmente importa para 0 seu experimento ou estudo.
Algumas partes da safda simples mente dirao 0 que voce ja sabel Por exemplo, na primeira
se~ao da safda abaixo obtemos:
infonna~ao do

nome das duas condi~Oes


ntimero de casos em cada condi~ao
a media em cada condi~ao
0 desvio padrao e 0 erro padrao da media das duas condi~Oes

As infonna~Oes mencionadas podem ser vistas rapidamente, pois ja as conhecemos. Uma


vez que sabemos 0 que ignorar. nossa saida sera facil de ler. Essas sao as estatisticas de gropo
que aparecem em primeiro lugar na safda:
Group Statistics (Estatisticas dos grupos)

SCORE
(Escore)

Noise and no noise


(com barulho e sem barulho)

Mean
(Medial

Standard Deviation
(Desvio Padraol

Std. Error Mean


(Ello Padrao da Medial

noise (com barulhol

12

7.2500

2.4909

.7191

12 13.8333

2.7579

.7961

no noise (sem barulhol

Na pr6xima se~ao da safda, encontra-se 0 que realmente nos interessa.

234

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Independent Samples Test (Teste para Amostras Independentes)


levene's Test
for Equality
of Variances
(Teste de

235

de medias entre as condi,Oes foi de 6,58, que e urn grande efeito (d = 2,45); 0 intervalo de confian
,a de 95% para a diferen,a estimada das medias populacionais e 4,36 a 8,81. 0 teste 1 independeme
revelou que. se a hipotese nula fosse verdadeira, tal resultado seria improvavel (1(22) = 6.14; p <
0,001). Portanto, conclui-se que escutar barulho afeta a memoria de curto prazo, pelo menos quan
to a lembran,a de palavras.

t-test for Equality of Means


(Teste t para a Igualdade de Medias)

Levene para

a Igualdade

de Variancias)

Sig.

SCORE Equal Varian(Eseore) ces Assumed .177


(Igualdade de

t Of (gl)

.678 -6.137

Sig.
Mean Std. Error 95% Confidence
(2-tailed) Difference Difference
Interval of the
(5ig. (Diferen~a
(Erro
Difference
Bilateral) das Medias) Padrao da
(IC de 95%
Diferen~a)
para a Diteren~a)
22
.000 -6.5833
1.0728 -8.8082 -4.3585

Variancias

Assumida)
Equal Var;ances Not Assumed (Igualda

de de Variimcias

Naoassumida)

Siq. = Siqnificanc;a

-6.137 21.776

~mosmiquenaci ~dif~

I
.

sig/!ificativaSentie ",,y'lIi3ridas .

p ,;,O.67S;portantolis!lr'nos a parte
.' dil Sa!d;iCham~a lheqiJai Variarices .

BSsumed(~~odevari3nOas ;quaiS);'

corilO indicadopt!io.SPSSPW

~~."

'0 sinal

-6.583~

p:.;:.yonanto'e.~O~~~::

1.0728 -8.8095 -4.3572

fl
~~a'

diteien~

:::i~i:J

Uma das coisas que voce notani e que 0 SPSSPW usa urn teste chamado de teste de
Levene' para a igualdade de variancias (Levene's Test/or Equality a/Variances). E usado
para verificar se as duas condir;oes tern variancias iguais. Quando duas ou mais condi
r;oes apresentarn variiincias iguais, temos a denominada "homogeneidade de variancias".
Alguns testes estatlsticos, como 0 teste t, supoem que as variancias entre os grupos ou
amostras sao iguais. 0 teste de Levene pode ser usado para verificar essa suposir;ao. 0
teste t, realizado pelo SPSSPW, fomece dois conjuntos de resultados _ urn para usar quan
do satisfazemos a suposir;ao (p. ex., as variancias sao iguais) e urn para usar quando nao
conseguimos satisfazer a suposir;ao (p. ex., as variancias sao diferentes). 0 teste de Levene
nos fomece urn valor F, que voce ainda nao aprendeu, mas e urn teste parecido com 0 t: de
2

.JF.

Portanto, se t = 3, voce sabe que isso e igual a urn


fato quando 0 gl = I, t = F ou t =
valor F de 9. Voce aprendeni a estatlstica F mais tarde, no CapItulo 9.
o teste de Levene e urn teste de homogeneidade de variiincias que nao depende da suposir;ao
de normalidade. Quando estamos decidindo se satisfazemos ou nao a suposir;ao de variancias
iguais, precisamos olhar para 0 valor p dado ao Jado do valor F. Para sermos consistentes com
a convenr;ao tradicional, devemos conduir que nossas variancias sao diferentes (desiguais) se
nosso valor p e menor que 0,05. Se 0 valor p e maior que 0,05, admitimos que as variancias sao
aproximadamente iguais. 0 SPSSPW usa 0 criterio de p < 0,05 para decidir se as variancias sao
iguais. Obviamente, essa decisao e sujeita as mesmas restrir;oes delineadas no CapItulo 4 para
teste de hip6teses. Para deixar mais simples, usaremos 0 criterio do SPSSPW, como explicado.
Os resultados podem ser relatados como segue:
Os participantes na condi,ao com barulho lembraram de menos palavras (1(22) = 7,3, desvio
padron =2,5) do que os participantes na condi,ao sem barulho (1(22) =23,8, DP,;, 2,8). A diferen,a

(~.) EXEMPlO: NECESSIDADE DE COGNIc;AO


Algumas pessoas passam bastante tempo engajttdas na resolur;ao de problemas, en
quanto outras nao. Existem grandes diferenr;as individuais na tendencia de pessoas se
engajarem e gostarem de atividades cognitivas. Essa dimensao da diferenr;a individual e
chamada de necessidade de cognir;ao. Na seguinte ser;ao da salda, homens e mulheres fo
ram comparados nessa dimensao. Ha muito mais homens no estudo do que mulheres. Nao
so as medias sao parecidas, como tambem 0 desvio padrao e 0 erro padrao da media.
Group Statistics (Estalistieas dos grupos)
Men and Women
(Homens eMulheres)
Men (Homens)
NECESCOG

Mean
(Media)

Std. Error
(Desvio Padrao)

440

62.4886

9.942

Std. Error Mean


(Erro Padrao da Media)
.474

Women (Mulheres)

290

63.1586

8.484

.498

Aqui esta a proxima ser;ao da saida:


Independent Samples Test (Teste de Amostras Independentes)
levene's Test
t-test for Equality of Means
for Equality of
(Teste t para a Igualdade de Medias)
Variances (Teste
de Levene para
aIgualdade
de Varianeias)
95%
Sig1 t I df (gl) I
Sig'l
Mean Std. Error
(2-tailed) Difference Difference Confidence
(Erro Interval of the
(5ig. (Diferen~
Bilateral)
das Padrao da Difference (lC
deg5% para
Medias) Diferen~)
a Diferen~a)
NECES
Equal
.7101-2.064 1.724
-.941 7281
.3461 -.6700 I
Variances
COG
Assumed
(Assumida a
Igualdade de
Variancias)

Sig.

Equal 114.5771
Variances
Not Assumed
(Igualdade
de Variancias
Naoassumida)
Significancia

.0001-.97 1631.39

.. As variancias:aqui sao significa6varnente)

djfererite(iStO ll, naosa6:iiguais;pgi't<iiifc:(

usamos a linha das vari:lndasnaQ:.Jlomo-'

gl!rieas(equalilariahcesnofassiifnei;j'

N. de T. Howard Levene (1914-2003), professoremc!rito do Departamento de Biologia do Institu(o Polilc!cnico da Virginia _ Blacks
burg. VA - Estados Vnidos.

.330

-.6700

.6881-2.020 1.680

236

Estatistica sem Matemiltica para Psicologia

Christine P. Dancey & John Reidy

Voce pode ver que a diferen~a de media entre as condi~6es e de 0,67. As variiincias
entre os dois grupos sao significativamente diferentes, por isso utilizamos a linha das vari
iincias supostamente diferentes (equal variances not assumed). Isso mostra urn valor t de
--D,97. 0 intervalo de confian~a indica que estamos 95% confiantes de que 0 intervalo de
2.02 a 0.68 contenha a diferen~a das medias populacionais. em outras palavras urn limite
muito amplo. 0 intervalo de confian~a inclui 0 zero. 0 que significa que, se repetirmos 0
estudo com uma amostra diferente. as mulheres podem exibir valores mais altos do que
os homens (como nesse caso. no qual a diferen~a de media e --D.67), os homens podem
exibir valores mais altos que as mulheres. ou pode nao haver diferen~a alguma (zero). Ob
viamente, isso nao e born 0 suficiente. e temos de concluir que os grupos nao diferem em
necessidade de cogni~ao. Afirmamos isso devido ao baixo valor t (0.97) e 0 nlvel de signi
ficiincia associado p = 0.33. Isso quer dizer que. sendo a hip6tese nula verdadeira. temos
uma chance de 33% de obter urn valor t de 0.97.

Medias. desvios padroes e valores de probabilidade para panicipantes no eSludo de Keuerer e


colaboradores (1996)

Tabela 6.4

e-~:=~=~~"~~~~~g!
.."Ai,/Y
Age (Idade)
Education (in years)

Ketterer e colaboradores (1996) observaram fatores psicossociais e doen~as coronarianas.


Apresentaram uma tabela comparativa entre pacientes que completaram 0 estudo e outros que dei
xaram de completar. Os testes t comparam esses dois grupos nas variaveis listadas na Tabela 6.4. Os
resultados sao apresentados como medias e desvios padr6es.
Essa tabela de resultados e muito utH, pois em unico lugar temos as medias para ambos os

grupos (e os desvios padr6es), 0 que nos permite ver a dire~ao da diferen~a. Alem disso, fomece

probabilidades exatas, que oferecern muito mais informa~ao do que urn simples "nao-significati

vo" (voce vera mais tarde que alguns autores nao relatam nlveis de probabilidade exatos, apenas

informam se os resultados foram significativos ou nao. Entretanto. com 0 advento de bons paco

tes estatisticos, voce podera relatar nlveis de probabilidade exatos). A variavel que diferenciou

os grupos em urn nivel significativo foi educa~ao (em anos). Podemos ver pelas medias que os

particip30tes que completaram 0 estudo tinham urn nlvel de escolariza~ao mais alto (em termos

de numero de 3oos) do que os participantes que nao completaram 0 estudo. Entret3Oto, os dois

grupos nao apresentaram diferen~as significativas em nenhuma das outras variaveis. Embora nao

tenhamos os efeitos. podemos calcula-Ios. pois temos todas as inforrna~6es necessanas. Por que

nao tentar?4

4.

Voce pode conferir seus cc1.1culos com as nassos, na pagina 572.

58.9 (11.8)

0.435

13.7 (2.8)

12.6 (3.3)

0.00\

Pack-years of smoking

49.0(44.4)

0.19\

2.1 (4.3)

0.530

42.9 (43.6)

(Macros anuais fumados)

Hours of exercise (per week)

,.

2.4 (4.5)

(Horas de exercfcio por semana)

Caffeine (Carefn.)
Body Mass Index

3.3 (3.9)

3.5 (3.7)

0.668

19.2(2.6)

19.3 (3.3)

0.582

0.5 (1.4)

0.7 (2.2)

0.373

(fndice de I11JlSsa corporal)

Alcoohol (drinks per day)

Exemplo da Iiteratura:

fatores psicol6gicos e doen~s coronarianas

58.0 (10.6)

(Educ3CJ4Q em anos)

(Alcool- drinques por dial

:~~1~1~~~j~~I;'

237

6.1.11

Teste t relacionado

o teste t relacionado tambem e conhecido como 0 teste t pareado. Esses termos sao inter
cambiaveis. Como explicado na pagina 220, 0 teste t relacionado e usado quando os mesmos
participantes tomam parte de ambas as condi~6es. A f6rmula para esse teste e parecida com a do
teste t independente. Entretanto, 0 teste t relacionado e mais senslvel. Isso ocorre porque cada
participante toma parte nas duas condi~6es, e, portanto pode ser testado contra ele mesmo. Se
tivermos 20 pessoas em urn delinearnento relacionado (as mesmas 20 pessoas em ambas as con
di~6es), precisarfamos de 40 em urn delinearnento nao-relaciooado (20 em cada condi~ao). Desse
modo a f6rmula para 0 teste t relacionado leva em considera<ri<> 0 fato de que estarnOS usando os
mesmos participantes. Se voce comparar urn teste t relacionado com urn independente que use 0
mesmo conjunto de dados, descobrirli que 0 teste t relacionado fomece 0 resultado com urn valor
de probabilidade associada mais alta, pais a compara~ao dos participantes consigo mesmos redllZ
a variiincia dentre participantes, levando a urn valor mais alto de t.
Imagine que voce quer descobrir se tipos diferentes de visualiza~ao ajudam no controle
da dor. Para simplificar, vamos supor que existem dois tipos de visualiza~ao:

Imagine-se realizando urn teste t muito excitante (condi~ao estatfstica).


Imagine-se deitado em uma praia ensolarada, bebendo aperitivos (condi~ao praia).

Os participantes sentarn e sao levados pela visualiza~o, enquanto suas maos sao colo
cadas em agua quase a ponto de congelar. Embora nao tenhamos tentado isso, temos certeza
de que deve ser muito dolorido. A variavel dependente e 0 numero de segundos que nossos
participantes agiientarn ficar com as maos dentro da agua. Agora, como estarnos conduzindo
esse estudo com urn delineamento dentre participantes (pois e mais senslvel), nao podemos
simplesmente colocar os participantes em uma condi~ao, e depois noutra (isso pode levar
a efeitos de ordem, ou pode ser que ninguem retome para a segunda condi~ao). Portanto,
metade dos participantes participa da condi~ao A e depois da B, e metade dos participantes
participa da Be depois da A (ver contrabalanceamento no Capitulo I). Algumas pessoas pa
dem pensar que nossa hip6tese e unilateral porque visualizar-se deitado na praia ensolarada
ajudaria mais no controle da dor do que pensar em estatfstica. Entretanto, aconselhamos a
determinar se sua hip6tese e unilateral ou bilateral com base em pesquisas previas, nao s6
baseado em uma opiniao! Como nao existe pesquisa feitacom esse t6pico (que saibamos).
vamos formular uma hip6tese bilateral. Os dados estao na Tabela 6.5.

238

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


Tabela 6.S

239

Tempo (em segundos) que as maos foram manlidas denlro da agua em cada condi<;iio
'~pniIil

Partldpante

, Coadl~ataUstlca, .

2
3

5
7
3

10
4
7
8

9
10

12
12
10
14
13

15

6
7

7
15

6
7

_(Q
J.S,PSSPW: d.elinl!a.. mente) demgdidas repetid~$ paraduas. .
amostras: teste t pareado- .', ,.....
."
Abra seu arquivo de dados, Escolha Paired-Samples T Test (Teste t para amostras empa
relhadas) do menu Compare Means (Compare Medias),

Para selecionar 0 par de variaveis:


I. Clique na primeira variavel.
2. Clique na segunda variaveL
3. Clique em ~ para desloear 0 par.

_..L

~'

-"--,- - - - ,---1-

L;:~ol~OS ;
:dn~a,q~de.

~\tiilf!~n~~~~i
:

-~---+---t--~

--;~-----

,-

I
I

I
I

:'

-\ --.

~h-2=d~~r6:s~~-

r-':

~--=--+

---r

..c:

:.;~_,:'~:~I.-,~;,,~

Clique em Options (OPltoes). Se desejar (ver aeima), clique em Continue (Continuar)


dentro da caixa de dialogo. Seus resultados aparecerlio na janela de safda.
Em primeiro lugar, obtemos as estatfsticas de grupo. Isso nos foroece as estatisticas des
eritivas usuais: a media, 0 mlmero de participantes, 0 desvio padriio eo efTO padriio da media.

240

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

241

Paired Samples Statistics (Estatistiea das Amostras Pareadas)

Pair 1 (Par

1)

Mean (Media)

Standard Deviation
(Desvio Padrao)

Std. Error Mean


(Erro Padrao da Media)

7.3000

10

3.4010

1.0755

10.3000

10

3.3350

1.0546

STATISTI
(Estatistiea)
BEACH
(Praia)

~ EXEMPLO: 0 QI VERBAL E0 DE DESEMP~NHO DE

~ PESSOAS QUE SOFREM DE DOEN~S CRONICAS

Urn estudo foi conduzido comparando 0 QI verbal (QIV) e 0 QI de desempenho (QID)


de pessoas que estao sofrendo de doen~as cronicas. Em uma popula~ao normal, espera-se
que as duas medidas sejam similares. A media populacional de QI e 100.
o SPSSPW fomece uma correla~ao entre as duas condi~Oes:

A proxima se~ao da safda fomece a correla~ao entre as duas condi~Oes:

Paired Samples Correlations (Correla~iies de Amoslras Pareadas)

Paired Samples Correlations (Correla~iies entre as Amostras Pareadas)


N

Pair 1 (Par

1)

STATISTI & BEACH


(Praia e Estatistiea)

Correlation

10

5ig. (Signifieancia)

(Correla~ao)

.070

Pair 1 (Par 1)

.849

Verbal IQ & Performance IQ


(01 verbal e OJ de Desempenho)

Paired Samples Test (Teste das Amostras Pareadas)

STATISTI-BEACH
(Praia-estallstiea)

Mean
(Media)

Std.
Deviation
(Desvio
Padrao)

Std. Error
Mean
(Erro
Padrao
da Media)

-3.0000

~5947

1.4530

"

~.i:~

~:.:-

Sig.

.680

.000

Paired Samples Statistics (Estatistiea das Amostras Pareadas)

Paired Differences (Diferen~a Pareada)

(Correl~o)

40

Como seria esperado, existe urn relacionamento forte positivo entre as duas medidas
de QI. Lembre-se de verificar a primeira parte da saida que confirma quantos pares voce
tern como tambem os nomes das variaveis.

Isso indica que nao existe urn relacionamento entre os valores na condi~ao praia e os
valores na condi~ao estatfstica (r= 0,07, que e real mente muito fraco).
Entao, chegamos as estatfsticas das amostras emparelhadas:

Pair 1
(Par 1)

Correlation

95% Confidence
Inlerval of the
Difference (IC de 95%
para a Diferen~a)
Lower
Upper
(Inferior) (Superior)
-.287

6.287

df
(gl)

Sig.
(2-tailed)
(Sig.
Bilateral)

2.06

.069

.' 0 intervalo d~confian~in~~


. que temos 95% de certeza dE!'
;.;que ~i~ervillllde::..o;287~)c.

p= 0.07

Pair 1
(Par 1)

Verbal IQ (01 Verbal)


Performance IQ
(01 de Desempenho)

Embora se possa ver que os participantes na condi<;ao praia mantiveram suas maos na agua
quase congelada par uma media de 10,3 segundos, enquanto a media da condi<;ao estatislica foi 7,3
segundos, os limites de confian<;a de 95% nos mostram que, se repetfssemos 0 experimento, a di
feren<;a das medias populacionais entre as condi<;oes estaria em algum ponto entre -0,287 e 6,287.
Portanto, nao podemos ler certeza de que, na popula<;ao, a visualiza<;ao da praia teria urn melhor
resultado (t(9) =2,06; P =0,07).

Std. Deviation
(Desvio Padrao)

Std. Error Mean


(ErroPadrao da Media)

94.8750
109.1000

40
40

12.03880
12.86777

1.90350
2.03457

QI verbal do gropo e mais baixo que

QI de de

Paired Samples Test (Teste das Amoslras Pareadas)


Paired Differences (Diferen~a

Pareada)

95% Confidence
Interval of the
Std. Std. Error Difference (lC de 95%
Deviation Mean (Erro
para a Diferen~)
(Desvio
Mean
Padrao
Upper
Lower
(Media)
Padrao)
da Media) (Inferior) (Superior)

;j,.~;". :~t!di~Populaciona!s :Ui

Podemos ver imediatamente que


sempenho,

'~:6;281'ioiitem a:difeien~ d"a$"~,

Embora possamos constatar que os participantes na condi~ao praia realmente mantiveram


suas maos na agua quase congelada por mais tempo (media 10,3 segundos em contraste com
a media da condi~ao estatistica de 7,3 segundos), a amHise resuItou em urn valor t de 2,06, com
urn nfvel de probabilidade associada de 0,069. 0 intervalo de confian~a e amplo (podemos
dizer, com 95% de confian~a que 0 intervalo de -0,287 a 6,827 contem a verdadeira diferen~a
das medias populacionais). Isso significa que nao podemos ter muita certeza, ao repetirmos 0
estudo, de que a visualiza~ao da praia daria urn resuItado melhor. Portanto, temos de concluir
que nao existem evidencias que sugiram que esse tipo de visualiza~ao afete 0 controle da dor.
Parte da analise pode ser assim:

Mean (Media)

Pair 1
(Par 1)

VerballQ & Pertor


mance IQ (01 Verbal
e 01 de Desempenho)

-14.2250 9.98842

Sig.
(Hailed)
(Sig.
t df (gl) Bilateral)

1.57931 -17.4195 -11.0305 -9.007

39

.000

Sig. = Significancia
Nesse caso, a diferen~a em pares da media amostraJ (entre QI verbal e de desempenho)
e 14,23. Em rela~ao 11. diferen~a da media populacional, temos 95% de confian~a de que 0
valor esta entre 11,03 e 17,42.
t (39) = -9,01 tern urn valor p associado de p < 0,001, que significa que, sendo a hip6
tese nula verdadeira, tal valor teria ocorrido menos de uma vez em 1000 vezes. Isso e tao
improvavel, que conclufmos que as diferen~as entre 0 QI verbal e de desempenho do grupo
nao devem ter ocorrido por erro amostral.

242

243

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


:i~

..
:j"<

:~r.r '~

Exemplo da Iiteratura: controle


percebido e sofrimento apes agressao sexual
Frazier (2003) coletou dados de mulheres que sofreram agressao sexual seria, em quatro pontos
ap6s a agressao. Os dados fomeceram informa~oes relacionadas a maneira como cren~as sobre
controle e sofrimento mudam com 0 tempo ap6s a agressao. Essas estatisticas descritivas:

~IIU:: . '::'. ;;.,~~(;t!:;;i'i~~~~',:.' ~=;:.;:,;

(II

2i5emaDas
=88)
Varl4vel

.~;;r_.~"

DesvIo

p~drio

~;

Call/role
. >!,

-:i

.; i'

.~~;.:.:::.y~.'.. >.- i'~:."

%FEU7.~~?~~':'7~....

I'~~:
. '1

Sig;I,J.
:ig,
lIilaleial

Autoculpa comportamental
Culpa ao Estuprador
Controle sobre a recupera~iio
Controle Futuro
FUiura (nao) probabilidade
de agressao
Sofrimenro
Ansiedade
Depressao
Hoslilidade
Sorrimento

3.54
3.85
3.74
4.07
2.40

2.31
2.04
1.58
2.00

1.07
1.15
0.71

3.37
3.65
3.93
4.23
2.63

1.18

0.95
0.77
0.63
0.76

0.85
0.98

1.78

0.90

1.44
1.63

1.64

0.74

1.14
1.16
0.79

0.64

3.07
3.73
3.91
4.13

0.84

2.72

0.98
1.03
0.96
0.85

1.52
1.50
1.31
1.45

2.88

1.10
1.21
0.78

0.75

3.47
4.03
4.12
2.81

0.75

1.01
1.02
1.04
0.92

1.29
1.18
1.03
1.17

0.96

0.94

0.88

0.82

0.72

0.64

Os autores dizem que:

;til.,.
.

Culpa do esluprador foi mais comum que aUlo-culpa comportamenlal. com efeilos pequenos no pe
rfodode duas semanas. 1(87) -f), 78, P 0,08. d 0.19, e dois meses. 1(94) -0.80. P 0,07. d 0.19.
e efeilos medios para 0 periodo de seis meses, 1(84) -4.61. P < 0.001. d 0,50. e doze meses. 1(89)
-4.50. P < O.()()(JI. d = 0,48. ap6s a agressao. De acordo com as convent;oes de Cohen (1992) para laflUl
nho do efeilo de leSles l 0.20 11111 efeilo pequeno. 0.50 um ejeilo medio. e 0,80 urn efeilo grande.

;,'

. -."J.

,,;""." ~.

.:

'.--:/ ,~ .....

~ ,- ~
"

_,,",T.;

......

.. ''':

"

'~':'-

: --'': .~.;

: ..

=
=

Note que os autores conduziram quatro testes t emparelhados. Quer dizer, comparararn indices
de autoculpa cornportamental com indices de culpa do estuprador em quatro pontos do tempo. A
primeira compara~ao foi feita duas semanas ap6s a agressao. Embora as participantes avaliassem
que os estupradores tinham mais culpa do que elas mesmas, a diferen~a entre as duas variiiveis
foi pequena - 0 efeito e dado como 0,19, que e, como os autores nos disseram, urn efeito fraco.
A diferen~a entre as duas variaveis de culpa nesse ponto de tempo tern urn nivel de probabilidade
associada de 0,08. Urn segundo teste t foi conduzido com as mesmas variaveis dois meses ap6s a
agressao - esse efeito tambem foi fraco. Seis meses mais tarde, entretanto, quando se fez urn tercei
ro teste t, a diferen~a entre as condi~oes se tomou mais acentuada. As duas condi~6es aqui diferiram
por rnetade do desvio padrao. No quarto ponto de tempo. a diferen~a foi parecida.

244

Christine P. Dancey & John Reidy

~~1tf:j~:~::~:~~de~

Teste multiplo
Se voce conduzir varios testes dentro de urn estudo ou experimento, algumas das suas anaIises
inferenciais resultarao em baixos nfveis de probabilidade associada (p. ex., 0,001) simplesmente
por eITO amostraI. Para permitir isso, recomendamos que interprete seus resultados com esse co
nhecimento em mente. A maneira mais facH de fazer isso e dividir 0,05 (a tradicional variavel de
criterio para significancia) pelo mlmero de testes que voce conduz (em qualquer estudo) e depois
interpretar os niveis de probabilidade associada (NPA) de acordo.
Entao, se voce realizar tres testes t no seu experimento:
NPA

= 0,05 = 00167
3

Estatistica sem Matematica para Psicologia

'

Qualquer NPA > 0,0 167 pode ter ocorrido por eITO amostral. Lembre-se, entretanto, de que
interpretar niveis de significlincia e s6 uma parte da informa"ao que contribui para a interpreta"ao
dos resultados. Existem tambem os efeitos e intervalos de confian"a.

M
20
8

12
5

M
0
8

W
M
7

~iiii~~tL'}Qi:oJbiidti.ili;:
13
16
7

m
5
10

16

18

15

10

15
18

-- 18
14

17

10

2
10
18

10

13

13
10
16
5

16

14

14

W
10
15
8

Suponha que os dados sao retirados de uma popu(a"ao normalmente distribuida.

Resumo
Limites de confian"a permitem que voce deduza com urn certo grau de confian"a
(geralmente 95%) que urn determinado intervalo contem a media populacional (ou a
diferen"a entre medias).
d,o tamanho do efeito, fomece a magnitude ou diferen"a entre duas medias indepen
dentes, expressa em desvios padrOes.
Testes t permitem avaliar a probabilidade de se obterem por eITO amostral as dife
ren"as observadas entre dois gropos: por exemplo, p = 0,03 significa que, se n6s
repetissemos 0 experimento 100 vezes, usando amostras diferentes sem supor di
feren"as reais entre condi"Oes, esperariamos encontrar 0 padrao de resultados tres
vezes, somente devido ao eITO amostral.
Testes t sao pr6prios para dados retirados de uma popula"ao normal, sao testes para
metricos.

Exerdcios para

I
1
1
I
1
1
I

1
I
I
2
2
2
2
2
2
2
2
2
2

245

SPSSPW

Vinte crian"as em idade escolar (10 meninos e 10 meninas) foram examinadas nas se
guintes variaveis: mlmero de epis6dios de doen"as no periodo de urn ano, desempenho em urn
teste no inicio do ano e desempenho em urn teste similar no fim do ano. Coloque os seguintes
dados no SPSSPW e designe os meninos como Grupo I e as meninas como Grupo 2.

I. Realize urn teste t independente entre meninos e meninas em epis6dios de doen"a e


no teste de fim de ano.
2. Calcule 0 tamanho do efeito, d, quando apropriado.
3. Imagine que seu amigo nao entende a saida que voce obteve nem tern conhecimento
sobre tamanho do efeito ou intervalos de confian"a. Escreva alguns paragrafos ex
plicando 0 significado dos resultados para seu amigo.
4. Realize urn teste t de medidas repetidas para 0 desempenho no teste do infcio do ano
e no teste do fim do ano. Fome"a uma explica"ao, por escrito, do significado de seus
resultados para seu amigo. A previsao e de que 0 gropo tenha melhor desempenho
no fim do ano.

246

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

QUESTOES DE MUlTIPLA ESCOlHA

(a)
(b)
(c)
(d)

I. 0 grau de liberdade. para uma analise de teste t inde


pendente. com 20 participantes em cada condi"ao. e:
(a) 38
(b) 20
(c) 40
(d) 68
2. Para urn lesle t pareado com 40 panicipantes.
grau de liberdade correlO e:

Urn lesle t para gropos independentes


Urn lesle t de medidas relacionadas
0 lesle de Levene
Nenhuma das allemalivas

5. A suposi"ao mais imponanle que temos que salis


fazer quando usamos urn lesle t e:

(a) A variancia dos valores deve ser minima


(b) Os valores devem ser retirados de uma popu
la"ao com dislribui"ao normal
(c) As condi,,6es devem ter medias iguais
(d) Todas as allernativas estao corretas

(a) 20
(b) 39
(c) 38

6. Quanlo mais allo 0 valor t. mais provavel e que as


diferen"as entre gropos:
(a) Sejam resullado de erro amostral
(b) Nao sejam resullado de erro amoslral
(c) Sejam parecidas
(d) Nenhuma das allemalivas

(d) Nenhuma das altemativas


3. Para urn lesle t independente. com 15 panicipanles
em cada condi"ao. 0 grau de liberdade e:
(a) 28

7. Urn valor t de -5 e:

(b) 14
(c) 30
(d) 15

(a)
(b)
(c)
(d)

4. 0 nivel de ansiedade de cern alunos foi testado


anles e depois de uma sessao de lerapia para ansie
dade. Os valores foram retirados de uma popula"ao
com distribui"ao normal. Qual teste eSlalistico se
ria mais apropriado?

Menos imponanle que urn valor de +5


Mais imponante que urn valor de +5
Equivalenle a urn valor de +5
Menos significativo que urn valor de +5

As questiies 8 a 10 referem-se
sultados:

a seguillte tabela de re

Estatisticas do Grupo
SEX (5exo)
total of stigma
(esligma total)

N Mean

(M~ia)

Std. Deviation
(Desvio Padrao)

Std. Error Mean


(Erro Padrao da Media)

1.00

62

33.8710

12.1149

1.5386

2.00

53

34.8302

13.0586

1.7937

Independent Samples Test (Teste para Amostras Independentes)


Levene's Test for
Equality of Va
riances (Teste de
Levene para a Igual
dade de Varianeias)

total of Equal variances


assumed
stigma
(estigma (assumida a igual
tolal) dade de variancias}
Equal Variances
Not Assumed
(Igualdade de
Variancias

Nao-assumida)
Si9. = Significancia

0.755

t-test for Equality of Means


(Teste t para a Igualdade de M~ias)

Mean
Si9
(2-tailed) Difference
(5Ig. (Diferen,a
Bilateral) das Medias)

95% Confidence
Interval of the
Difference
Std. Error
(IC de 95% para
Difference
a Diferen,a)
(Erro
Padrao da Lower Upper
Diferen,a) (Inferior) (Superior)

Of (gl)

0.387 -o.40B

113

0.6B4

-0.9592

2.3493 -5.6136

3.6951

-0.406 107.199

0.686

-0.9592

2.3632 -5.6439

3.7255

5ig.

8. A diferen"a enlre as medias dos grupos e:


(a) 0,41
(b) 0.69
(c) 0,96
(d) 0,76
9. As variancias dos dois gropos sao:
(a) Indeterminadas
(b) Desiguais
(c) Iguais
(d) Assimelricas
10. 0 que voce pode concluir dos resullados?
(a) Nao exislem diferen"as significativas ou dife
ren"as imponanles enlre os dois grupos
(b) Existe uma diferen"a significativa. mas que
nao e imponanle
(c) Exisle uma diferen"a imponanleenlre os dois
gropos. mas nao e significativa
(d) Exislem diferen"as significativas e diferen"as
imponanles enlre os gropos
1I. 0 tamanho do efeilo para gropos independentes, d.
pode ser calculado por:
(a) (media
drOOs
(b) (media
drOOs
(c) (media
(d) (media

I - media 2) I media dos desvios pa


I + media 2) I media dos desvios pa
I - media 2) I erro padrao da media
I + media 2) I erro padrao da media

12. Se os limites de confian"a de 95% em lome da di


feren"a das medias (em urn lesle t) sao 10.5 e 13.0,
podemos concluir que, se repetirmos 0 estudo cern
vezes, entao:
(a) Nossos resultados seriio estatisticarnenle sig
nificalivos 5 veres
(b) Nossos resullados seriio estatisticarnente sig
nificativos 95 vezes
(c) Em 95% das vezes a diferen"a das medias po
pulacionais eSlara entre 10,5 e 13,00; 5% das
vezes a diferen"a das medias populacionais
estara fora desse limile
(d) Em 5% das vezes a diferen"a das medias po
pulacionais estara entre 10,5 e 13,00; em 95%
das vezes a diferen"a das medias populacio
nais eslara fora desse limite
13. Em uma analise que usa urn leste t nao-relaciona
do, voce encontra 0 seguinle resultado:
Tesle de Levene para Igualdade de Variancias:

F= 0,15 p =0,58

Isso moslra que as variancias dos gropos sao:


(a) Dissimilares
(b) Similares
(c) Exalamenle as mesmas
(d) Indeterminadas

247

14. Numa saida do SPSSPW, se p = 0, 000, voce deve


relala-Io como:
(a)
(b)
(c)
(d)

p
p
p
p

= 0,000
= 0,0001
< 0,001
< 0,0001

15. Em urn tesle t independenle, voce usaria a parte


da saida equal variances not assumed (varian
cias nao-homogeneas) quando 0 lesle de Levene
esla:
(a) A(!J"ma de urn dado crilerio de significiincia
(p. ex., p > 0,05)
(b) Abaixo de urn dado criterio de significiincia
(p. ex., p < 0,05)
(c) Quando os numeros de participanles sao desi
guais nas duas condi,,6es
(d) Quando ha dados assimetricos
16. Para urn delinearnenlo dentre participanles que uti
liza 20 pessoas, 0 grau de liberdade e:
(a) 20
(b) 38
(c) 19
(d) 40
17. 0 lesle de Levene e:
(a) Urn teste de helerogeneidade que depende da
suposi"ao de normalidade
(b) Urn leste de homogeneidade que depende da
suposi"ao de normalidade
(c) Urn lesle de heterogeneidade que nao depen
de da suposi"ao de normalidade
(d) Urn leste de homogeneidade de variiincias que
nao depende da suposi"ao de normalidade
Leia a seguinle passagem de uma se,.ao de resultados
de urn artigo cientifico (Ralcliff el a!., 2(03) e responda
a questiio 18:
As mudan"as nos valores das medias em lodos
os lesles enlre Onda 4 e Onda 5 foram signifi
cativos com base num lesle t pareado (lodos os
valores p < 0,001, com exce"ao de MMSE, p =
0,012; aprendizado de palavras em lislas, lem
bran"a relardada, p = 0,009; nomeando Boston,
p=0.019).
18. Por que "todos os valores p" eslao relatados como
p < 0,00 I, quando as outras variaveis citadas foram
relatadas com valores de probabilidade exalos?
(a) as pesquisadores nao conseguiram descobrir
os valores de probabilidade exalos
(b) 0 nivel de significiincia em seu programa de
eslalislica calculou p = 0,000
(c) As variaveis ciladas nao sao significativas
(d) Todas as allernalivas eslao corretas

248

Christine P. Dancey & John Reidy

As quesloes /9 e 20 se referem a seguinIe labela:

Independent Samples Test (Teste para Amostras Independentes)


Levene's Test
for Equality
of Variances
[Teste de Levene
para a Igualdade
de Vari3ncias)

Total of Serious
economic con
sequences (Con
sequencias eco
narnicas serias)

Equal 0.113
variances
assumed
(Assumida a
igualdade de

Si9

T-test for Equality of Means


(Teste t para a Igualdade de M~ias)

Sil
(2-taile )
(Sig.
t Df (gl) 8ilateral)

0.738 0923

106

0.358

95% Confidence
Std.
Interval of
Error
the Difference
Differen
(IC
de
95% para
Mean
a Diferen~a)
Difference ce (Errop
(Diferen~a Padrao da
Upper
Lower
das M~ias) Diferen~a) (Inferior) (Superior)
0.5258 0.56951 -0.60327 1.65494

variancias)

Equal
variances
not assumed
(igualdade

0.882 16.607

0.391

0.5258

0.59644 -0.73481

1.78649

de variancias
nao-assumida)
Sig.

= Significancia

19. Qual fileira

0 pesquisador usaria para interpretar


os resultados do teste 1 independente?
(a) A fileira de variiincias iguais
(b) A fileira de variiincias desiguais

e0 sinal que
esperarfarnos do valor I?
(a) Positivo
(b) Negativo
(c) Poderia ser tanto positivo como negativo

20. Generalizando para a popula<;ao, qual

Referencias
COHEN, J. Statistical Powerfor Behavioral Sciences. New York: Academic Press, 1988. 2"d ed.
COHEN, J. A power primer. Psychological Bulletin. v. 112, p. 155-9, 1992.
FRAZIER, P. A. Perceived control and distress following sexual assault: a longitudinal test of a new
model. Journal ofPersonality and Social Psychology. v. 84, n. 6, p. 1257-69, 2003.
KETERER, M. W. et aI. Denial of depression as an independent correlate of coronary artery disease.
Journal ofHealth Psychology. v. I, n. I, p. 93-105, 1996.
RATCLIFF, G. et aI. Tracking cognitive functioning over time: ten-year longitudinal data from a
community-based study. Applied Neuropsychology. v. 10, n. 2, p. 89-95, 2003.
YU, C. H., HO, W. J., STOCKFORD, S. Using multimedia to visualize the concepts of degree of
freedom, perfect-fitting, and over-fitting. Joint Statistical Meetings, August 200 I, Atlanta (GA).
YU, C. H. Illustrating degrees of freedom in multimedia. Disponfvel em: http://seamonkey.ed.asu.
edul-alexlpub/df/default.htm [acesso em 10 de mar<;o de 2004).

Questoes de Significancia

Panorama do capitulo
Nos ultimos dois capitulos, voce aprendeu nao s6 a descrever e analisar os relacionamentos
entre variaveis. mas tambem a analisar as diferen<;as entre duas condi<;6es. Nesses capitulos,
procuramos encoraja-Io a usar metodos de analise diferentes para obter um sentido dos dados
e oferecer aos seus leitores (geralmente os professores que avaliam 0 seu trabalho) 0 quadro
mais completo possive!. Portanto. procuramos incentiva-Io a descrever seus dados por meio de
ilustra<;6es grMicas, medidas de tendencia central e variancia; oferecemos um metodo simples.
pelo qual voce pode calcular 0 efeito. e apresentamos os intervalos de confian<;a (Ie). Finalmente.
tambem 0 encorajamos a relatar 0 nivel de significancia observado (NSO).
Neste capitulo, trataremos os conceitos mencionados com maior profundidade. Discutire
mos as quest6es que cercam 0 relato de niveis de probabilidade e apresentaremos um conceito
novo - 0 conceito de poder. 0 poder e a habilidade de detectar um efeito significativo. quando
existe. E a habilidade que um teste tem de rejeitar a hip6tese nula corretamente. Eimportante
entender tais quest6es antes de conduzir seus proprios experimentos e estudos. por esse motivo
as apresentamos agora.
Neste capitulo, voce aprendera sobre:

relacionamento entre poder, efeito e niveis de probabilidade


fatores que influenciam 0 poder
quest6es acerca do uso de niveis de significancia de criterio

Para que possa entender as quest6es discutidas neste capitulo. voce precisara ter com preen
dido a analise correlacional (Capitulo 5) e as analises de diferen<;as entre dois grupos com usc do
teste t (Capitulo 6).

250

7.1

Christine P. Dancey & John Reidy


Estatistica sem Matematica para Psicologia

251

(riterios de significancia
Como mencionado anterionnente, foi comum, por muitos anos, a pratica de relatar os
nlveis de probabilidade como < 0,05 ou > 0,05. Essa conven~ao surgiu, em parte. porque
antes do advento dos poderosos pacotes computacionais, como 0 SPSSFW, nao era posslvel
detenninar a probabilidade exata com facilidade. Todavia, existem bons motivos para que a
probabilidade exata deva ser relatada sempre.
Por exemplo, imagine que voce conduz urn experimento, 0 analisa e obtem urn valor de
probabilidade associada de 0,049. Subseqiientemente, decide replicar esse experimento, mas
dessa vez obtem urn nfvel de probabilidade de 0,051. Relatar 0 primeiro estudo como "signi
ficativo" a urn nlvel de 0,05 eo segundo estudo como "nao-significativo" a urn nfvel de 0,05 e
enganoso, em especial porque quando voce conduz urn estudo, existe sempre certa quanlida
de de erro (ver Capftulo 4). Se conduzir 0 experimento novarnente, voce pode obter urn valor
de probabilidade associada de 0,06 ou 0,04. Da mesma maneira, como Howell (2002) nota,
seria razoavel tratar 0.051 e 0,75 como igualmente nao-significativos, sendo maiores de 0,05?
Alem disso, devem 0,049 e 0,0000 I ser considerados igualmente significativos, relalados
ambos como p < O,05?
Outro problema associ ado a abordagem > 0,05/< 0,05 e sua tendencia a levar a uma
visao ortodoxa na qual 0 ponto de corte 0,05 e tido como uma regra que nunca deve ser
quebrada. Conseqiientemente, as pessoas tendem a pensar que se urn resultado esta abaixo
desse limite, deve ser importante e, se esta acima desse limite, nao e de interesse algum. 0
problema e que esse ponto de corte deve ser entendido simplesmente como urn guia, e nao
como uma regra fixa, pois ter signifidincia estatfstiea nem sempre significa ter importiincia.
Isso acontece porque 0 tarnanho da arnostra afeta a significiincia estatfstica, como veremos
mais tarde. Embora valores p exatos fome~arn mais infonna~ao do que 0 relato de < 0,05 ou
> 0,05, a conven~ao de usar criterios de valores de probabilidade tern seus adeptos, muitos
dos quais acreditarn que 0 metodo convencional de relatar valores p fomece urn padrao
comum para avaliar alega~5es estatfsticas. Entretanto, como Rosnow e Rosenthal (1989)
disseram:

i" ,'",

'C

,,:~:'~-' '_'7,,~u:~"~JiS~t;(JN~;l}~~U

,Resultadcis'c:q~o'esseser'iembem.,
Ese foqj~so lima elei~ao?;': ~,

'. N&o'sepreocupe,'estari'ros aJ'riilL ie',

".-

'_Aniensagein:apr.eodenl6~.bemL.. _..

":,;:~;w.';~1~iZ.<,;""

':: Quen6sm6rtliissOm6$ fr6geis', '

:,C, !+MasiqlJ~~~:~bterrl()s,JiitPPr6Xirnctd~ zeiw "

<;.;'~i~
,'.,.-

Com certeza Deus ama 0 0,06 tanlo quanto 0 0,05.

o nfvel de probabilidade exato perrnite que 0 leitor saiba a probabilidade de os resultados


terem sido obtidos por erro arnostraI, tomando a hip6tese nula como verdadeira. 0 nlvel de
probabilidade e uma parte da inforrna~ao a ser considerada na interpreta~ao dos resultados.
Nao estarnos discorrendo contra 0 relato de valores de probabilidade! Macdonald (1997)
argumenta:
Os dados devem ser vistos como provas a serem usadas em argumentos da psicologia, e a
significancia estatistica e somenle uma medida da sua qualidade. Ela impede que 0 pesquisador
obtenha algo em seus achados que poderia ter sido obtido por acaso.

debate relacionado ao uso de niveis de probabilidade exatos ou de criterios de signi


ficiincia e somente uma pequena parte da controversia relacionada ao lugar que os testes de
hip6teses assumem na psicologia. A controversia nao e nova - existe ha mais de 40 anos, e
psic610gos e estatfstieos eminentes podem ser encontrados em ambos os lados do debate.
Existem muitos artigos cientfficos relacionados a esse t6pieo. Se voce quiser mais inforrna
~Oes, sugerimos que leia Kranz (1999) ou Nickerson (2000).

7.2

Tamanho do efeito
Voce aprendeu, nos Capitulos 5 e 6, maneiras de calcular 0 tamanho do efeito. 0 tamanho
do efeito e a magnitude da diferen~ entre condi~oes ou 0 poder de urn relacionarnento. Exis
tern maneiras diferentes de calcula-Io. No Capitulo 5, voce aprendeu sobre urn tamanho do
efeito nalural (urn coeficiente de correla~ao); no Capitulo 6, sobre como calcular 0 tamanho
da diferen~a entre medias, em lerrnos de desvios padroes (d). Quer dizer, as medias se dife
renciaram por quantos desvios padrOes? Lembre-se de Como e facil calcular d:
XI -x~

media dos desvios padr5es


Como mencionamos acima, de a distancia entre as duas medias em termos de desvios
padrOes. Se existe uma area grande sobreposla entre os dois gropos, 0 efeito sera relativamen
te pequeno; se existe uma area pequena sobreposta, 0 efeito sera relativamente grande.

252

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

As vezes, 0 efeito e faeil de calcular (como no caso com duas condi"oes); outras, pode
ser mais difieil. Entretanto, relate 0 efeito quando puder. As vezes, os psic610gos sabem 0
efeito que procuram com base em trabalhos previos na area. Como aprendemos no ultimo
capitulo, os estatlsticos nos deram recomenda"oes (Iembre-se - recomenda"oes, nao regras)
sobre 0 que constitui urn efeito "pequeno" ou urn efeito "grande". Essas sao as recomenda
"oes desenvolvidas por Cohen (1988): I

::7~~~trSI;j~~~~:~~1%t~~
Pequeno

Media
Grande

0,20
0,50
0,80

85
67
53

7.4.1

0, I significa que voce tern somente uma chance de 10% de achar urn efeito, se a1gum
existe. Isso e inutil. Voce consegue se imaginar conduzindo urn estudo (que custa
dinheiro e tempo!) sabendo que teria tal probabilidade de encontrar urn efeito?
0,7 significa que voce tern uma chance de 70% de encontrar urn efeito, se algum exis
teo Portanto, voce tern uma boa chance de encontra-Io. Valeria a pena gastar dinheiro
nesse estudo.
0,9 significa que voce tern 90% de chance de encontrar urn efeito. Isso raramente
acontece em pesquisas na psicologia.
Observa-se que, se 0 seu poder e 0,5, ha somente uma chance de 50:50 de encontrar urn
efeito, se existir algum, 0 que nao e born 0 sufieiente.
Voce pode observar que devemos descobrir nosso nlvel de poder antes de conduzir
urn experimento ou estudo, pois nao ha muito sentido em realizar todo urn trabalho e nao
chegar a nada, percebendo que tfnharnos somente uma chance muito pequena de encontrar
urn efeito.

A tabela que fomece a percentagem de

ma sobreposta para valores d de 0.1 a 0.5 foi dada no Capitulo 6. piigina 224.

poder

voce esta preparado a aceitar que os resultados provavelmente nao sejam resultantes
de erro amostral)
0 nt1mero de participantes no estudo
0 tipo de teste estatlstico usado
Se 0 delineamento do estudo e entre participantes ou dentre participantes
Se a hip6tese e uni ou bicaudal

Tamanho do efeito
Para calcularrnos 0 valor do poder, e necessario terrnos uma ideia do efeito procurado.
Como voce obtem essa informa"ao antes mesmo de conduzir 0 estudo ou experimento? Se
ja existe pesquisa na area, voce pode verificar artigos cientfficos e tentar descobrir os efeitos
encontrados pelos pesquisadores. As vezes, os aUlores terao fomecido os efeitos; outras ve
zes, voce tern de calcula-Ios. Pesquisas ja realizadas sao urn born guia para descobrir 0 efeito
que pode ser encontrado. Se nao existe pesquisa na area (improvavel), voce pode recorrer aos
valores de Cohen (1988). Na psicologia, efeitos pequenos a medios sao mais provaveis do
que grandes efeitos.
Urn efeito grande sera mais faeil de detectar do que urn efeito pequeno. E precise mais
poder para encontrar efeitos pequenos.

Poder
As vezes, voce escutar<i pessoas dizendo coisas do tipo "0 teste t e mais poderoso que 0 de
Mann-Whitney", ou "testes de medidas repetidas tern mais poder", mas 0 que isso realmente
significa? Poder consiste na habilidade de detectar urn efeito significativo, quando existente,
e voce aprendeu que por "efeito" entende-se a diferen"a entre medias ou 0 relaeionamento
entre variaveis. 0 poder e a habilidade que urn teste tern de achar esse efeito. Tarnbem pode
ser descrito como a habilidade de rejeitar a hip6tese nula quando falsa. E medido em uma
escala de a + I, na qual = sem poder a1gum. Se 0 seu teste nao tiver poder, sera incapaz de
detectar uma diferen"a entre medias ou urn relaeionarnento entre variaveis; 0, I, 0,2 e 0,3 sao
baixos valores de poder; 0,8 e 0,9 sao altos valores de poder.
o que os numeros 0, I, 0,2, etc. significarn?

Fatores que influenciam

0 tamanho do efeito esperado


0 nlvel de criterio de signifidincia (p. ex., 0 valor do nfvel de significaneia no qual

~~:1

Existem outras medidas do efeito que serao apresentadas mais adiante. Entretanto, d e
bastante utilizado, entao e importante que voce entenda como calcula-Io e interpreta-Io.

7.3

7.4

253

7.4.2

Criterio de significancia
o criterio de significancia indica 0 nlvel aceitavel de probabilidade de que os resultados
tenharn ocorrido por erro amostral. Digarnos que Betty Beech decide ser razoavelmente estri
ta e somente considerara interpretar os seus resultados se 0 nfvel de probabilidade associada
for 0,02. Se 0 seu nlvel de significancia associada nao atingir esse nlvel, ela interpretara
qualquer efeito como "provavelmente tendo ocorrido por erro amostral". Isso significa que
o seu resultado sera interpretado somente se estiver na cauda da distribui"ao demonstrada na
Figura 7.1.

-3 -2 -1

2
P

= 0.02

~strjbUi<;ao normal, mostrando a area sob a curva.


Adam Ash, entretanto, decide (por motivos que s6 ele sabe) que interpretara seus resul
tados se 0 nlvel de probabilidade associada for 0,16. Se 0 nlvel de significaneia associada

254

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

nao atingir 0 nivel proposto, interpretara 0 resultado como "provavelmente ocorrido por erro
amostral". Isso significa que 0 resultado sera interpretado se estiver na cauda da distribuic;ao
2
demonstrada na Figura 7.2.

255

Group Statistics (Estatis~cas do Grupo)


noise and no noise
(com barulho e sembarulho)
SCORE
(ESCORE)

Mean
(Media)

Std. Error Mean


(Erro Padr';o da Media)

Std. Error
(Erro Padr';o)

noise
(com barulho)

9.5000

0.707

0.500

no noise
(sem barulho)

13.6667

3.786

2.186

Independent Samples Test (Teste para AmOSlras Independentes)

-3 -2 -1

3
Levene's Test
for Equality
of Variances
(Teste de Ll'Vene
para aIgualdade
de Variancias)

p = 0.16

Distribuic;ao normal. mostrando a area sob a curva.

Deve ser evidente que Adam Ash tern uma chance muito mais alta de encontrar urn efei
to, pois foi bern mais f1exivel em seu criterio.
Quando psicologos precisam usar urn criterio de significancia, fazem a escolha com mui
to cuidado. Nonnalmente, 0 criterio varia de 0,0 I a 0,05, podendo chegar a 0,10, dependendo
do tipo de experimento ou estudo conduzido.

SCORE
(ESCORE)

Equal
variances
assumed
(gualdade de

Sig.

ttest for Equality of Means


(Teste t para a 'gualdade de Medias)

5.660 0.098 -1.46

Of
5ig.
Mean
Std. Error
(gl) (2-tailed) Difference Difference
(5ig.
(Diferen~a
(Erro Padr';O
Bilateral) das Medias) da Diferen~a)

95% Confidence
Interval of the
Difference
(I( de 95% para
a Diferen~)

0.239

-4.1667

2.846 -13.225

4.892

-1.86 2.20

0.192

-4.1667

2.242

4.678

vari3ncias

aS5umida)

Equal variances
not assumed
(Igualdade de
variancias nao
assumida)
Sig. = Significancra

>~.

'j-.,-"

7.4.3

-13.012

'"

Numero de participantes
Quanto maior a amostra, maior e 0 poder. Voce ja pode ter escutado que, se tiver uma
amostra grande, tera uma chance maior de obter urn resultado estatisticamente significativo.
]sso parece estranho, pois 0 fato de decIararmos urn resultado como "estatisticamente signi
ficativo" ou nao parece depender do tamanho da amostra. Esse e, obviamente, 0 problema
de depender demais de valores de probabilidade associados em vez de depender de efeitos e
intervalos de confianc;a.
Podemos entender isso melhor usando urn exemplo. Digamos que estamos observando
as diferenc;as entre os gropos com barulho e sem barulho nos exemplos do Capitulo 6, usando
cinco participantes.

: Hip6tese unicaudal.

Existem tao poucos participantes nesse estudo que, embora parec;a existir uma boa diferen
c;a entre as medias (4,17 - na direc;ao esperada), esta pode ter side causada por erro amostral.
Faz sentido pensar que, se repetissemos esse estudo com outros cinco participantes, poderiam
ser encontrados valores totalmente diferentes apenas por acaso. Conseqiientemente, voce tern
que encontrar uma diferenc;a muito maior entre os gropos com esse numero de participantes
para que os seus intervalos de confianc;a sejam mais estreitos e 0 valor da probabilidade as
sociado seja mais baixo. Se usasse urn numero grande de participantes em cada grupo, verla
que 0 teste e declarado como "estatisticamente significativo" com uma diferenc;a menor entre
gropos. No exemplo presente, 0 intervalo de confianc;a e grande. Espera-se que a diferenc;a da
media populacional (com 95% de confianc;a) possa ser encontrada entre -13,225 e +4,892.
]sso significa que estamos confiantes de que, se 0 experimento fosse repetido, a media do gro_
po da condic;ao com barulho pode ser maior que a da condic;ao sem barulho, ou a condic;ao sem
barulho pode ser maior que a condic;ao com barulho, ou podem ser iguais. ]sso se assemelha a
confiar que 0 tempo estara born, ruim ou neutro amanha. Nao nos e muito uti\. Com tao poucos

participantes, temos um poder baixo - se um efeito existe, nao temos muita probabilidade de
encontra-lo, pois qualquer efeito pode ter ocorrido por erro amostral.

256

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

medias seja menor? A resposta e nao. Temos mais confianc;;a na nossa capacidade de fazer
generalizac;;oes pertinentes a populac;;ao usando urn nlimero maior de panicipantes, mas, de
alguma maneira, encontrar uma diferenc;;a com urn nlimero menor de participantes causa maior
impressao. pois e mais dificil achar urn efeito com um nlimero pequeno de participanles. Ob
viamente,o uso de cinco participantes, como no nosso primeiro exemplo, nao so e irreal como
nao e litH - nao podemos generalizar, e 0 uso de tao JlOucos participantes significa que nossos
resultados tem urna chance maior de serem obtidos somente por erro amostral. Demonstrar
que a signifidincia estatistica depende do tamanho da amostra e importante, pois demonstra
que a signifidlncia estatlstica nao e igual aimportancia pratica ou psicologica. Portanto, eis 0
motivo de precisar de outras maneiras de avaliar a importancia do estudo - como 0 efeito e os
intervalos de confianc;;a.

Vamos repetir 0 estudo, mas desta vez usando 216 participantes.


Group Statistics (Estatisticas do Grupo)
noise and no noise
(com barulho e sem barulho)

Mean
(Mt\dia)

Std. Error
(Erro Padrao)

Std. Error Mean


(Erro Padrao da Mt\dia)

noise
(com barulho)

110

9.1364

3.355

0.320

no noise
(sem barulho)

106 12.9623

3.570

0347

SCORE
(E5CORE)

257

Independent Samples Test (Teste para Amostras Independentes)


T-test for Equality of Means
para aIgualdade de Medias)

Levene's Test
for Equality
of Variances

(Teste t

(Teste de Levene

para aIgualdade
de Variancias)

SCORE
(ESCORE)

Sig.

Mean Std. Error 95% Confidence


5ig.
Df
Interval of the
(gl) (2-tailed) Difference Difference
Difference
(5ig. (Diferen~a (Erro Padrao
(IC
de 95% pa,a
Bilateral) das Medias) da Djferen~a)
a Diferen~a)
214

0.000

-3.8259

0.471 -4.755 -2.897

-8.11 211.92

0.000

-3.8259

0.472 -4.756 -2.896

Equal 1.024 0313 -8.12


variances
assumed
(Igualdade de
variancias

,': ,.::. (b) ~$tjupod!!,,~~cjentl!'pa'ia :~CQP~r:.j.jrrt efl!itql;~nto. p~r~e prowvel que:nao"

:: ;:~>ti,i:~::~'~#~~~M~~~},~!~'~)?~:,~~J~~~;~?1'~~~

7.4.4

aS5umida)

Equal variances
not assumed
(Igualdade de

[2!rg:;!~il=~~~o . .

vari3ncias

Significancia

Dessa vez, a diferenc;;a entre as medias e, na verdade, menor: -3,82. Entretanto, 0 uso de
tantos participantes significa que temos uma certeza maior de que 0 resultado nao aconteceu
por acaso ou por erro amostra1. Se repetissemos 0 estudo com outras 216 pessoas, estariamos
muito mais confiantes na obtenc;;ao de resultados semelhantes. Dessa vez os intervalos de
confianc;;a nos mostram que estamos mais confiantes, que a diferenc;;a se encontra entre 4,8
e 2,9 (lembre-se de que, se ambos os sinais forem negativos, podemos ignoni-Ios). Assim,
temos 95% de confianc;;a de que os nlimeros para a populaC;;ao da condic;;ao sem barulho serao
significativamente mais altos do que os da condic;;ao com barulho. Com um numero maior
de participantes, temos uma chance maior de detectar um efeito significativo; estamos mais
certos de que 0 efeito se deve a algo atem do erro amostral.
Entretanto, note que nosso resultado se toma "mais significativo" se analisamos somente
o nlvel de signifidlncia. Ele realmente se tomou mais significativo, embora a diferenc;;a das

"':'," t

7',". ':;.: -'

,."~

Tipos de testes estatisticos


Testes parametricos sao mais poderosos do que os nao-parametricos, desde que se sa
tisfac;;am as suposiC;;c5es. Portanto, urn teste t tem urna probabilidade maior de encontrar urn
efeito do que 0 seu equivalente nao-parametrico (ver Capitulo 15), desde que voce satisfac;;a
as suposiC;;c5es de urn teste parametrico.

nao-assumida)

Sig.

'~J8:~;1~~J1""

7.4.5

DeJineamento
Os delineamentos de medidas repetidas aumentam 0 poder porque reduzem a variabili
dade dentre participantes, pois cada participante atua como 0 seu proprio controle. Considere
a utilizac;;ao de urn delineamento de medidas repetidas em vez de urn delineamento indepen
dente sempre que puder.

7.4.6

Teste unicaudal ou bicaudal


Se urn teste unilateral eadequado, use-o. As hip6teses bilaterais requerem uma amostra
maior do que as unilaterais para poder cornpensar a perda de peder.

258

7.5

Christine P.

Dancey &

John Reidy

Estatistica sem Matematica para Psicologia

De qualquer maneira, por que estudar urn grande numero de participantes quando nao e
necessario? Desde que se lenha urn numero suficiente de participantes em rela~ao ao poder,
nao e preciso mais. Imagine uma pessoa que tenha escutado que "amostras maiores equiva
lem a maior poder" e resolve estudar 2 mil participantes. Nesse caso, urn efeito minusculo
sera declarado estatisticamente significativo com urn p = 0,0001. Esse e urn caso de signi
ficancia estatfstica, mas sem significancia pnilica. Nesses casos, urn efeito muito pequeno
(uma pequena diferen~a entre medias ou urn relacionamento fraco entre variaveis) tera urn
nfvel de probabilidade associada baixo. Por isso, voce precisa observar as medidas dos efeitos
e intervalos de confian~a, tanto quanto os niveis de probabilidade.
Os calculos do poder dados em Howell (2002), por exemplo, permitiriam que voce
determinasse quantos participantes sao necessarios..para varios tipos de amilises estatfsti
cas. Entretanto, uma maneira mais facil, se decidir calcular 11 mao, e consul tar Kraemer e
Thieman (1987), que mostram como calcular 0 numero de participantes necessarios para
varios lipos de analises. De outro lado, os programas que calculam poder estatistico, como
PASS ou GPOWER, nao apresentam problemas. Se voce tern acesso a Inlernet, entao e
capaz de encontrar informa~ao sobre tipos diferentes de pacotes de poder, alguns dos quais
podem ser baixados sem nenhum custo, e outros podem ser usados on-line. Alguns textos
estatfsticos (como Stevens, 2002) fornecem tabelas de poder uteis. 0 SPSSPW fornece va
lores de poder para alguns testes: por exemplo, 0 teste ANOYA fatorial (que voce aprendera
no Capftulo 9) inclui uma estimativa de poder. Todavia, em outros casos, voce provavel
mente precisara usar urn programa como 0 PASS ou GPOWER ou urn calculador de poder
on-line. Para aqueles que gostam de calcular 11 mao, vejam Howell (2002) ou Kraemer e
Thieman (1987).

Calculo do poder

o nivel de poder real (p. ex., 0,7) para urn estudo ou experimento especifico pode ser
calculado pelo:
I. numero de participantes no estudo;
2. tamanho do efeito desejado;
3. criterio de significancia (p. ex., p =0,10);
Digamos que voce decida conduzir urn estudo de amostras independentes para ser anali
sado por urn teste t entre participantes (bilateral). Esta pensando em realizar 0 estudo com dez
participantes em cada grupo e procurando urn tamanho de efeilo medio. Como conhece as op
~5es (I), (2) e (3), pode calcular 0 poder. Esse calculo nao precisa ser feito manual mente, uma
vez que existem programas de compulador ou labelas em Iivros que podem faze-Io (p.ex.,
Stevens, 2002). Para 0 exemplo, como exislem somenle 10 participantes em cada grupo, ha
uma chance de menos de 20% de encontrar urn efeito, se tal existe. Com esse conhecimento,
antes de conduzir 0 estudo, voce pode, se possfvel, aumenlar 0 numero de participantes. Para
ter uma boa chance de encontrar urn efeito (p. ex., poder 0,7), serao necessanos de 100
participantes (50 em cada grupo) para nosso estudo.
De outro lado, se em urn estudo nao se calcula 0 poder e se encontra urn efeito signifi
cativo, e 6bvio que havia poder suficiente. Se nao houvesse poder suficiente, nao teria sido
encontrado urn efeito. Portanto, depois do experimento, 0 conhecimento do poder e mais im
portante quando nao se encontra urn efeito, pois nao se pode ter certeza de que (a) realmente
nao existia urn efeito, ou de que (b) existia urn efeito, mas nao havia poder suficiente para
encontra-Io.
Calculos de poder para todos os tipos de testes estatisticos podem ser encontrados em
Howell (2002). Quanto mais complexa a analise estatistica, mais complexos serao os calculos
para se encontrar 0 poder. Calculos manuais esmo se tomando raros com 0 advento de bons
pacotes estatisticos, especialmente de alguns programas on-line.

7.5.1

Determina~o

Importancia do poder quando nenhum efeito eencontrado

7.5.2

Como mencionamos, 0 poder e especialmente importante quando 0 efeito encontrado e


pequeno ou inexistente, pois nao se consegue ter certeza de que real mente existe urn efeito
e nao se pode encontra-Io. Portanto, quando sao obtidos efeitos pequenos, e preciso relalar
o nivel de poder que havia. Ao relatar os resultados que nao tern significancia estatfstica,
alguns psic610gos revelam quantos participantes seriam necessarios para se encontrar urn
efeilo. Em casos nos quais 0 numero de participantes necessarios para se encontrar urn efei
to e realmente enorme (na maioria dos casos nao seria razmivel esperar que os psic610gos
estudassem milhares de participantes), fica implfcito: 0 efeito e tao pequeno que realmente
nao existe um efeito.

do numero de participantes necessarios

De acordo com 0 que vimos, se voce sabe (a) 0 nivel de poder que deseja, (b) 0 tamanho
do efeito e (c) urn criterio de significancia, podera determinar (d) quantos participantes serao
necessanos para 0 estudo ou experimento que pretende realizar. De fato, 0 conhecimento de
tres de qualquer urn desses quatro parametros pennite que voce calcule 0 quarto. Entretan
to, os a1unos precisam, com mais freqiiencia, calcular 0 numero de participantes para urn
determinado estudo. Pode-se pensar que a melhor ideia e esquecer todos esses calculos e
conduzir 0 estudo com 0 maior numero de participantes possfvel, mas normal mente esse
nao e 0 caso. Muitas vezes nao seria possfvel financiar 0 estudo, outras vezes os seus par
ticipantes sao uma minoria na popula~ao (p. ex., crian~as com danos cerebrais ou pessoas
com problemas de saude incomuns). Nesses casos, toma-se muito diffcil estudar urn grande
numero de participantes.

259

.-: ;.... ;;')


hSJ .Atividatfe'
;:~,':"

~
:

::;F~

::::<:
. .. 'r:. ;'. ';

.~:~~~:~~~~':;~~:S:;i~1!t}f.~~";{~~.;;f~~7\~-;~:',~

'l~';,; ~fS: ~~;r<-~,,\';,:,: ~,:::

.;' ;." >.;..:~:. ~::~1;'~::.t .

b, .:.: :".'.,

~~ :~.~.

'j',

~ ~';;:.

..~; ... -

'

.. ,

-~

.
,:'

-1-.

~"

,.

o'

.,:
',,'.

uSe Un1:IJ1~r;)i$rokg~J)\i~n~ !me!n~ p'ara encontrar alguns p~ogramas que ~Iq.dain


0 pOd~r,~~e~P:?~~ti1:~f::;?:f!'fMO~?-~~~1~~M~!iZ~do~on~"in~:. .....'. ..... '."';' .,J ",

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

260
d

"0

.:l

'u'"c

., .,~~~},:g~;~;.

J:

",';:;'i~1s'i;

"....
.2

;>,

"o

"0

.~

. '. ;

"~ll

:{:,

rr-

M
....

It!;T~:'

C',
OJ

"""
c

C;

'"

'"0
0

0>

00

'"
0

.....

~
0

oo

rr06

oo

,..;

00

"1

I
0>

00

oo
oo

00

vi'

oo

l'

00
M

r!.

'1

vi'

'"
N

00

00

,..;

....

00
00

oo
oo

M
'"
..

'"
00

'"

- - -

..-..

~~~~~~~~

::-=s"':ss-f=Md

0>

2,

r-.

....
..

J:

"'!

'"

"
C

1't

"""'"

."
'C

1:

":>

r---M \00\ coO\O\r--

Mci-o:iciM<:::!r--:~

"'"

M
'"
,..;

..

'~

201)

11~' ;,~'1. ~-t';-1?~i!_


\

""\':;';{~~'

;;:;_.;~~;~,

il:3l~fi~
s .... ,;'

e
"

C"

=i

15-

'"

"
:0

.g
o

'8

,,~

,,-'"
....

0."

E E
"0

"

E"
;:J ci
u

~:C;

.... c
ca ~

'il ~
~

~ ~

i;~'!"t~1
'1.l$
.~.,

.,.j:

.~

o
'f'-

.
~

"H
-a
"E.

u:.

~1l~

oo

q:~r--:dr--:~=t::

oo
"':

00

rf
M

r
....

'" '",..;

"i'

"'!

")

r-

00

0>

r-

"1

..

r-

oo

'"r
I
q
'"
00

~
M

r--: &t'"'l ~

~ -:.

o;;;o-o'i1o~

t'"'l
.r.-

=-~

....

00

0\

,..;

0>
M.

oo

"1

OIi1'OMOMOO::
f"")C'\f"")..q-Mf"')\Or-

';-:SM::::.rJ~Mt

lL)

C'I:S

-0

-0

.2

2 ~
.g ~ ~

E
C

\CSC-.6't.,.ncr--:~

do

.b

OMO=OOOO~

0\0\000\0\-00

rvi'

"i

('<"'I

oo
vi'

,..;

=-

....
a

'"
0

,..;

'"
9

00

;:i;

::::J

E
lL)

g ~ ~ fi ~ ~
a 5 ~ , .~ ~.~
0

1~~8~~~-a&8.8
~ 2 .g ~ ~ ~ "g ~.~ ~

.g

euCc.Joo ... " C o c n a 0 1 0 - - C

::3

~ ~

'C

.g

::"C

.= . .

'0 t:: .9
go
:> iii 0 E; 0 E
' - c.. c.. ca"c;

f"")

C'I:S

c .2
::c '"c

<~CI)"CZo<e+:i"'UJ_<
~

Ir
0

M~""~~CoO~

Ot'lSsc..E-ccuEe

go

0>

~'~~~~8~

lL)

e'u"
::::J [ "C

0>

,..;

-'=

8
~

t.I

II")

'"

Vl

'".suo

'"
~
,5

'S;

""

"0
0

'"

uo

""
t>:
.....

~
0

"0

-0

'"

uo

'"

.g

....

.,

'0

~ 0

~ '~

.~

t.I

~2

~E

3.

t-

::3

e.J

.5

E
"
~.

-i:l t.I
~ '0
.: ,g

~ '0

:i ~
GE

~.g
~~
:a '5
5::::.

>0\
~

.;;; ~ c
~
000

.~

lL)

0-0

It'l:!

50

~:~

8~

~ -v

B. ~

10 0~

:li

c ~
.~ ::

g "5
a"

e :lic::
::::J

~ .~
.~ 5

Q~

~ ~

~ ~

r:!

~::.

'~
Ci'

0-;,
(,I)
(,I)

~
E ~

.[ ~
~ ~

8q

.S ~
]

~ -g

00

Z c

Portanto, puderam calcular (embora nao tenham relatado como) 0 numero de participantes ne
cessarios para se obter urn efeito. 0 fato de precisarem de mais de 1100 participantes para obterem
uma chance de 80% de encontrarem urn efeito demonstra 0 quae pequeno este e - tao pequeno,
concluem, que pode ser negligenciavel.

~
~ ~

~ ~

.c ~

criterio de significancia (0,05)


nivel de poder desejado (80%)
tamanho do efeito (4%)

o .9

"

t>:
"

.~

li .~

**
Vl
~

Vollmer e Blanchard possuiam todas as informa~Oes necessarias para encontrar 0 numero de par
ticipantes que precisariam a tim de terem uma boa chance (80%) de obter urn efeito. Eles tinham:

t:i

~Re~8'~~

"1
-

-g
8'"

<C

A ... compara~ao dascondi~6es TCa e TCI nao foi signilicaliva [F(I,21) = 0.11. P = 0.75).'0 tamanho
do efeito para essa compara~ao indicou que 4% da variancia eellplicada pelas condi~6es de tratamenlo. Uma
equa~ao foi gerada para encontrar 0 lamanho da amostra necessario para se obter uma diferen~a significaliva
enlre os grupos tralados. Com urn poder eSlatfslico de 0,80 e urn nlvel de signilidincia de 0,05. seriam ne
cessarios 1158 pacienles para se obler uma diferen~a signilicaliva entre as condi~6es TCa e TCI. Ponanlo.
parece que os dois lralamenlOS alivos foram equivalenles em elicacia para lodos os prop6silos pr.iticos.

"
.~

_.!.

~ii. ~~7::r ~ ~
~ :Ii U
~

0'8
-CI
',"
..,0_,
.
. -'"

'"

l~
l;j

'"

-o:i 0 -o:i ...: -.:i cS c5 d

"'::S"1J~

i ,; :.~r ':~~ f;-

1- ~ ~ ~
oo
N
..

1I

l'

"'!
"I,\r,.;~,
'<"4'",t
'.. '"

8.1'

'.,

:~~~~_~-!~~(1'~~-\? ;.~',

03

'0

ft.

&:~

["

oo

~ is.~' ,. ,j ", ~ ~ 8 ~ ~ ~ 8

.~

..Cl

r'"

JI~ j;\,~:~~.:~: i

"0

o
u

e- 03 ill..

:J

Vollmer e Blanchard (1998) designaram pacientes com a sindrome do intestino irritavel a tres
tratamento: terapia cognitiva de gropo (TCG), terapia cognitiva individual (TCI) e urn
gropo de controle formado por pacientes em Iista de espera (CLE). Na condi~ao TCG, havia somen
te 3 a 5 pacientes, e a dura~ao do tratamento foi de 10 semanas. Eles comparam os gropos por meio
de varias medidas (p. ex., redu~ao de sintomas). Fez- se uma das compara~oes entre as condi~Oes
TCG e TCI. Calculou-se 0 tamanho do efeito, que era pequeno. Os pesquisadores relataram esses
resultados e os interpretaram da seguinte maneira:
condi~oes de

'0

~
~

.. ,.' ~,.-.:.';.~ . ,:~;~-'< re

Exemplo da literatura:

terapia cognitiva e sindrome do intestino irritavel

.;;;

O=O=O~ON

6"
~

a:l

'"*

&

80 80

1't

oo
'"

'

'"

261

'oct:

C~
~

!'!

!-'

~ ~

7,6

Intervalos de confian~a
Imagine que voce p~a a algumas pessoas para estimarem quantos alunos estao no pri
meiro ano de urn curso de psicologia tipico de gradua~ao. A resposta freqiiente seria algo
como "140 mais ou menos 5". Em outras palavras, essas pessoas produziriam uma estimativa
por ponto e outra por intervalo. 0 numero 140 e a melhor estimativa que tern (Le., uma esti
mativa por ponto), e "mais ou menos 5" e uma tentativa de fomecer urn raio dentro do qual
tern certeza de que 0 numero correto se encontra (L e., uma estimativa por intervalo).
o exemplo mostra que os testes parametricos geralmente implicam 0 calculo de esti
mativas por ponto da media e da variancia populacionais. As medias amostrais obtidas sao
estimativas por ponto das medias populacionais. Todavia, caso se repetisse 0 ellperimento,
e improvavel que se obtessem exatamente as mesmas medias amostrais, e isso, e claro, sig
nifi.ca que as estimativas poderiam ser urn pouco diferentes das medias populacionais reais.
Portanto, seria util obter uma estimativa por intervalo na qual nossas medias populacionais
pudessem se encontrar com razoavel contian~a. Isso e 0 que os intervalos de contian~a em
tome da media, disponiveis sob 0 comando Explore (Explorar) no SPSSPW, fomecem (os
intervalos de confian~a foram apresentados no Capitulo 3, p~ina 121).

......

.\ Fe uma estatrstica que voce aprendera no Capitulo 9.

262

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

No Capitulo 5, voce aprendeu que os intervalos de confianr;a poderiam ser construidos em


tomo do r de Pearson. No Capitulo 6, viu que poderiam ser construidos em tomo de medias
(para 0 teste t independente) e em tomo da diferenr;a entre medias (para 0 teste t relacionado).
No Capitulo II, voce vera que podemos construir intervalos de confianr;a em tomo de linhas
de regressao. Para alguns testes estatisticos, nos quais 0 SPSSPW nao fomece intervalos de
confian~a, nao e facH calcula-Ios. Sugerimos que, nesse estagio, voce nao se preocupe muito
quando perceber que nao consegue calcula-Ios. Todavia, relate-os sempre que puder - serao
muito informativos para os seus leitores.
Obviamente, urn intervalo de confian~a estrito e muito mais utH do que urn amplo.
Quanto mais poder 0 seu teste tiver (como discutido), mais estritos os seus intervalos de
confian~a serao.

Exemplo da Iiteratura:

respostas emocionais de mulheres a tipos de parte

Maclean e colaboradores (2000) compararam quatro grupos de mulheres: aquelas que tiveram
filhos por parto vaginal espontaneo, parto vaginal induzido, parto vaginal instrumental ou cesariana.
Havia 10 participantes em cada grupo. As mulheres foram comparadas em 8 variaveis independen
tes por uma serie de anaIises de variancia de urn fator. Nao e comum encontrar urn artigo publicado
no qual tenham sido incorporados todos os pontos mencionados que consideramos de boa pratica.
Como voce vera na Tabela 7.1, os autores fomecem medias, limites de confianr;a, valores de proba
bilidade exatos e uma medida do efeito (TJ~). Voce notara que utilizaram urn criterio de significancia
contra 0 qual comparar as probabilidade obtidas. Eles nos deram informar;oes completas sobre a
maneira na qual 0 valor do criterio (p < 0,0063) foi determinado. A tabela esta reproduzida por
completo - urn modelo para a boa pratica!

Resumo
Existe urn grande numero de questOes a serem consideradas quando estiver projetan
do e conduzindo seus pr6prios estudos e experimentos. Sao elas: poder, tamanho do
efeito, valor de probabiIidade, numero de participantes, tipo de delineamento e teste
estatfstico.
0 poder e a habilidade que urn teste estatistico tern de achar urn efeito significativo,
quando tal existe. 0 poder esta em uma escala de 0 (sem poder) ate 1,0 (100%).
Portanto. urn poder de 0,5 significa que ha 50% de chance de encontrar urn efeito
significativo. quando tal existe.
Eimportante considerar tais questoes antes de conduzir seu estudo ou experimento, para
que possa maximizar suas chances de encontrar urn efeito. Quanto ao custo, nao vale
a pena conduzir urn estudo que tern poucas chances de encontrar urn efeito significati
YO. Isso significa que voce deve pensar cuidadosamente sobre seu delineamento - por
exemplo, se e urn delineamento independente ou com medidas repetidas - e 0 numero de
participantes potenciais no estudo.
E importante relatar os efeitos e intervalos de confianr;a sempre que puder.

QUESTOES DE MULTIPLA ESCOLHA


I. Quanto mais estreitos forem os intervalos de con
fianeta:
(a) Maior a confianeta nos resultados
(b) Menos se pode depender dos resultados
(c) Maior a chance de os resultados terem ocorri
do por erro amostral
(d) Nenhuma das altemativas
2. A significilncia estatfstica:
(a) Esta diretamente associada 11 importilncia psi
col6gica
(b) Nlio significa necessariamente que os resulta
dos slio psicologicamente significativos
(c) Depende do tamanho da amostra
(d) Altemativas (b) e (c)
3. Considerando tOOas as outras questoes como iguais,
os delineamentos de medidas repetidas:
(a) rem exatamente 0 mesmo poder que os deli
neamentos independentes
(b) Geralmente tern menos pOOer que os delinea
mentos independemes
(c) Geralmente tern mais poder que os delinea
mentos independentes
(d) Nenhuma das altemalivas acima esta corretas
4. Considerando tOOas as coisas iguais:
(a) Quanto maior a amostra, menor 0 poder
(b) Quanto maior a amostra, maior 0 poder
(c) 0 tamanho da amostra nlio esta relacionado
ao poder
(d) Quanto maior a amostra, mais dificil fica de
deterrninar 0 poder
5. 0 poder e a habilidade de detectar:
(a) Urn efeito de significilncia estatfstica, quando
tal existe
(b) Urn efeito de importilncia psicol6gica, quan
do tal existe
(c) Altemativas (a) e (b)
(d) Defeitos de delineamento

263

6. 0 efeito e:
(a) A magnitude da difereneta entre condietOes
(b) 0 poder do relacionamento ou associaetlio
(c) Ambas as altemativas estlio corretas
(d) Nenhuma das altemativas esta correta
7. As medias amostrais slio:
(a) Estimativas por ponto de medias amostrais
(b) Estimativas por intervalo das medias popula
cionais
(c) Estimativas por intervale das medias amos
trais
(d) Es"limativas por ponto das medias populacio
nais
8. Considerando todas as coisas iguais, quanto mais
poder tern urn teste estatistico:
(a) Mais largos slio os intervalos de confianeta
(b) Maior e a probabilidade de 0 intervalo de con
fianeta incluir 0 zero
(c) Mais estreito e 0 intervalo de confianeta
(d) Menor 0 tamanho da amostra
9. 0 poder pOOe ser calculado pelo conhecimento do:
(a) Teste estatistico, lipo de delineamento e efeito
(b) Teste estatistico, nivel de significilncia de cri
terio e efeito
(c) Nivel de significilncia de criterio, efeito e lipo
de delineamento
(d) Nivel de significancia de criterio, efeito e ta
manho da amOSlra
10. 0 nivel de poder de 0,3 significa:
(a) Que ha uma chance de 30% de
efeito
(b) Que ha uma chance de 49% de
efeito
(c) Que ha uma chance de 70% de
efeito
(d) Que ha uma chance de 0,7% de
efeito

detectar urn
detectar urn
detectar urn
detectar urn

II. Observe a seguinte saida para urn teste t indepen


dente:

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

264

Independent Samples Test (Teste para Amostras Independentes)

Independent Samples Test (Teste para Amostras Independenles)


Levene's Test for
Equality of Variances
(Teste de levene para a
Igualdade de Vari.incias)

Sig.

SCORE Equal variances


(ESCORE)
assumed
(lgualdade de

t-test for Equality of Means


Medias)

(Teste t para a Igualdade de

t
-6.807

Sig.
Mean Std. Error
(Hailed) Difference Difference
(Sig. (Diferen~a (Erro Padr.io
Of
(gl) Bilateral) das Medias) da Diferen~a)
38

0.000 -27.7000

Paired DiHefences
(Diferen~s Emparefladas)
Mean
(Media)

95% Confidence
Interval of the
Difference
(lC de 95% para
a Diferen~a)
Lower
(Inferior)

Upper
(Superior)

4.0692 -35.9377 -19.4623

Pair 1 congruent-errors & neutral-errors -0.1500


(erros congruentes e erros neutros)
(Par 1)

4.0692 -36.2169 -19.1831

variancias

Significancia

o,oz

Podemos ter 95% de confian~a de que:


(a) A diferen~a da media populacional e 27,7
(b) A media populacional estara entre 19,18 e

36,21
(c) A media populacional estani entre 19,46 e
35,93
(d) Os resultados serao importantes

Qual e a conclusao mais sensata? ESlamos 95%


confiantes de que a linha de regressao populacio
nal seria:
(a) Positiva (+<1,30)

(b) Zero

(c) Negativa (- 0,2)

(d) Entre - 0,2 e +<1,7

12. Urn pesquisador encontrou urn coeficiente de


correla~ao de r = +<1,30, IC(95%) = -0,2- (+<1,7).

13. Observe a seguinte safda de uma anaJise de teste t


em pares:

Std. Error Mean


(Erro Padr.io da Media)

80

0.2651

2.963E-02

80

0.7111

7.951E-02

15. Em rela~ao a efeitos grandes, efeitos pequenos


sao:

congruent-errors
(erros congruentes)

7.500E-02

neutral-errors
(erros neutros)

0.2250

congruent-errors & neutral-errors


(erros congruentes e erros neutros)

Sig. = SigniflCanCla

14.

E mais

Std. Error
(Erro Padrao)

Mean
(Media)

(a) Mais faceis de detectar


(b) Mais diffceis de detectar
(c) Tlio faceis de detectar quanto os grandes
(d) Tlio diffceis de detectar quanto os grandes

Paired Sample Statistics (Estatisticas de Amostras Emparelhadas)

Pair 1
(Par 1)

(c) A diferen~a da media da amostra e -{l,15, e


temos 95% de confian~a de que a diferen~a
da media da popula~ao estara entre -{l,15 e
-{l,17
(d) Os resultados sao importantes
importante saber 0 poder de urn estudo
quando:
(a) 0 estudo tern urn numero grande de partici
pantes e e estatisticamente significativo
(b) 0 estudo tern urn numero grande de partici
pantes e nao e estatisticamente significativo
(c) 0 estudo tern urn nUmero pequeno de partici
pantes e e estatisticamente significativo
(d) 0 estudo tern urn nUmero pequeno de partici
pantes e nao e estatisticamente significativo

Paired Sample Statistics (Estatisticas de AmostrasEmparelhadas)

Pair 1
(Par 1)

0.7647

(a) A diferen~a da media da amostra e -{l,15, e


temos 95% de confian~a de que a diferen~a
da media da popula~ao estara entre -{l,32 e
0,02
(b) A diferen~a da media da amostra e 0,76, e
temos 95% de confian~a de que a diferen~a
da media da popula~ao estara entre -{l,32 e

nao-assumida)
=

Correlation
(Correlay3o)

Sig.

80

-0.024

0.836

df
(gl)

Sig.

8550E-02 -0.3202
,

0.02 -1.754

79 0.083

Sig. = Significancia

assumida)

Sig.

aDiler~)

Std. Error
Std.
Mean (Erro
Deviation
(Erro Padrao) Padrao da Med,a)

Qual e a resposta mais sensata?

0.000 -27.7000

95% Confidence
Interval of the
Difference
(lc de 95% para

Upper
Lower
(lnleroor) (Superior)

variancias

Equal variances 34.863 0.000 -6.807 19.000


not assumed
(lgualdade de

265

16. Quais sao as chances de encontrar urn efeito (se


existente) quando 0 poder e O,6?
(a) 50:50
(b) 60:40
(c) 40:60
(d) 60:60
17. Os intervalos de confian~a em torno de urn valor
de media nos fomecem:
(a) Urn raio dentro do qual a media populacional
provavelmente sera encontrada
(b) Urn raio dentro do qual a media amostral pro
vavelmente sera encontrada
(c) Uma estimativa por ponto da media popula
cional
(d) Uma estimativa por ponto da media amostral
18. Quando 0 seu teste estatistico se torna mais pode
roso, 0 seu intervalo de confian~a se torna:
(a) Mais largo
(b) Mais estreito

(c) Nao faz diferen~ a1guma


19. Se d= 0,89, 0 efeito e:
(a)
(b)
(c)
(d)

Zero
Fraco
Moderado
Forte

20. Quando 0 conhecimento do poder e mais impor


lante?
(a) Quando voce encontra urn efeito
(b) Quando voce nao encontra urn efeito
(c) Nao faz diferen~ a1guma

266

Christine P. Dancey & John Reidy

Referencias

DCOHEN, J. Statistical Power Analysis Jor the Behavioral Sciences. New York: Academic Press,
1988. 2"" edn.
DUNN, D. J. Multiple comparisons among means. Journal oj the American Statistical Association. v.
56,p.562-64,1961.
HOWELL, D. C. Statistical MethodsJor Psychology. Boston: PWS-Kem, 2002. 5'" edn.
KRAEMER, H. C, THIEMAN, S. How Many Subjects? London: Sage, 1987.
KRANTZ, D. H. The null hypothesis testing controversy in psychology. Journal ojthe American
Statistical Association. v. 94, p. 1372-81, 1999.
MacDONALD, R. On statistical testing in psychology. British Journal ojpsychology. V. 88. p. 333-47. 1997.
MacLEAN. L. I. McDERMOTT, M. R., MAY, C P. Method of delivery and subjeclive distress:
women's emotional responses to childbirth practices. Journal oj Reproductive and InJam
Psychology. v. 18, n. 2, p. 153-62,2000.
NICKERSON, R. S. Null hypothesis significance testing: a review of an old and continuing
conrroversy. Psychological Methods. v. 5, n. 2. p. 241-301, 2000.
ROSENTHAL, R. Cumulating psychology: an appreciation of Donald T. Campbell. Psychological
Science. v. 2, n. 2, p. 213,217-21,1991.
ROSNOW, R. L., ROSENTHAL, R. Statistical procedures and the justification of knowledge in
psychological science. American Psychologist. v. 44, n. 10, 1276-84, 1989.
STEVENS, J. Applied Multivariate StatisticsJor the Social Sciences. New Jersey: Lawrence Erlbaum
Associates. 2002,4'" cdn.
VOLLMER, A. BLANCHARD, E. B. Controled comparison of individual versus group cognitive
therapy for irritable bowel syndrome. Behavior Therapy. v. 29. p. 19-33.

Medidas de Associa~ao

~-

Panorama do capitulo
No Capitulo 5. voce aprendeu como analisar 0 relacionamento entre duas variaveis utilizan
do 0 coeficiente r de Pearson. Esse valor e util para fornecer uma ideia do grau de associa~ao
entre duas variaveis continuas. Voce viu como representar tal relacionamento por meio dos dia
gramas de dispersao. Aprendeu 0 que e um coeficiente de correla~ao e que r e um tamanho
do efeito natural. Neste capitulo, mais uma vez abordaremos relacionamentos, ou associa~6es:
atentaremos para a analise do relacionamento entre variaveis categ6ricas por meio do X20U 0
qui-quadrado.
Voce aprendeu sobre estas variaveis no Capitulo 1. Se. par exemplo, c1assificarmos pessoas
com base na cor da blusa ou camisa que estao usando. trata-se de uma c1assifica~ao em catego
rias. Da mesma forma. se c1assificarmos pessoas por grupos etnicos, religiao ou por pais no qual
vivem, estaremos fazendo julgamentos categ6ricos. Nao faz sentido ordena-Ias numericamente.
Neste capitulo, voce aprendera a:
analisar a associa~ao entre duas variaveis categaricas;
registrar outra medida do efeito (0 Vde Cramer);
relatar os resultados de tais analises.
A analise do relacionamento entre variaveis categ6ricas inclui os seguintes tapicos:
contagem da frequencia sob a forma de uma tabela - isso sera explicado mais adiante;
Testes inferenciais que indicam se 0 relacionamento entre as variaveis pode ter ocorrido
devido a erro amostral. considerando que a hipatese nula seja verdadeira;
0 tamanho do efeito: l (qui-<juadrado) pode ser convertido em uma estatistica denomi
nada Vde Cramer - isso e interpretado da mesma forma que qualquer outro coeficiente
de correla~ao. Felizmente, pode ser obtido com 0 SPSSpw.

8.1

Freqiiencias (dados categ6ricos)


Os testes utilizados ate agora envolveram caIculos sobre conjuntos de valores obtidos
a partir de participantes. Algumas vezes, entretanto, hii dados categ6ricos (isto e, dados na
forma de freqiiencias). Por exemplo, imagine que perguntemos a uma amostra de fazendeiros
(na realidade 544 deles) qual das quatro figuras preferem para ilustrar uma campanha do tipo
"salve 0 nosso bacon". Simplesmente registraremos quantos preferem a Figura 1, a Figura 2,
etc. Os dados serao apenas uma contagem (ou freqiiencias). A Tabela 8.1 mostra urn exemplo
de resultados possiveis.

268

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

269

[~l~~~:~!j~!i~~~~~~~t~t:~~:~~:::.;;,::~J~i":

150

220

60

;f~b~ >j;~'~;~:>';r;.~:, .
-<';-i,'T'-",.-:';:: ,,-,,_"

114

Constata-se que muitos fazendeiros preferem a Figura 2. Essas sao freqiiencias de ocor
rencia e nao faz sentido fomecer qualquer outra estatfstica descritiva.
o exemplo e conhecido como X2 de uma varilivel, por que temos apenas uma varilivel.
Essa varilivel e 0 "tipo de suino" e apresenta quatro nfveis (Figuras I a 4).
Neste caso cada participante s6 pode contribuir com urn valor (contagem) - se voce
prefere a Figura 2, nao pode ser contado em nenhuma outra categoria. Dados categ6ricos
significam pertencer a uma unica categoria e nenhum participante pode pertencer a mais de
uma categoria. Isso faz sentido. Se estivermos falando sobre religiao, ou grupos etnicos, por
exemplo, e uma pessoa e c1assificada como cat6lica, nao poderli ser c1assificada ainda como
pertencente ao exercito da salva'iao.
Com a contagem de freqiiencias, os valores nao sao escores: sao 0 numero de partici
pantes classificados em determinada categoria, e 0
e particularmente apropriado para tais
dados. E uma medida de relacionamento ou associa'iao, desenvolvida por Karl Pearson (1857
1936) em 1900. Permite-nos verificar se as freqiiencias que obtemos quando indagamos aos
participantes a que categoria pertencem sao significativamente diferentes das freqiiencias que
podemos esperar por acaso. I Isso seni c1assificado a seguir.
As medidas de associa'iao que discutiremos neste capftulo sao as seguintes:

8.2

Variavel X au teste de aderencia


Esse teste nos permite descobrir se urn conjunto de freqiiencias observadas difere de
urn outro conjunto de frequencias esperadas. Normalmente as freqiiencias sao aquelas que
encontrarfamos se a hip6tese nula Fosse verdadeira, mas, caso queiramos, podemos comparar
as freqiiencias observadas com qualquer conjunto de freqiiencias: verificaremos entao quaD
boa e a aderencia entre elas. Os detalhes de como fazer isso podem serencontrados na pagina
271. Nesse caso, temos uma unica variavel. Os caIculos para tal caso permitem que se enten
x 2 e das tabelas r xc.
dam os fundamentos da tabela

l2

X de uma varitivel (teste de aderencia) - utilizado quando hli uma unica variavel,
como no exemplo mencionado.
Teste
de independencia: 2 x 2 - utilizado quando se procura uma associa'iao
entre duas variliveis com dois nfveis (p. ex., a associa'iao entre ingerir bebidas
alc06licas [bebedor/abstemio] e fumar [fumante/nao-fumante)), por isso 0 com
plemento 2 x 2.
Teste de independencia: r x 2 - utilizado quando se procura uma associa'iao entre
duas variaveis, na qual uma apresenta dois nfveis (fumantelnao-fumante), e a outra,
mais de dois nfveis (beberrao, bebedor moderado e abstemio). A denomina'iao e r x 2
porque existem vanas linhas, mas apenas duas colunas.

[~.I EXEMPlO: PREFERENCIA POR CHOCOLATE


Em uma amostra, 110 pessoas foram solicitadas a manifestar suas preferencias com
respeito a chocolates. 0 nUmero de pessoas que escolheu entre quatro marcas diferentes
esta na Tabela 8.2.
Queremos verificar se algumas marcas (ou uma marca) sao preferidas em detrimento
de outras. Se nao sao, devemos esperar aproximadamente 0 mesmo mlmero de pessoas em
cada categoria. Com certeza, nao haveni exatamente 0 mesmo numero de participantes em
cada categoria, mas os numeros devem ter uma distribui~o com razoavel proximidade.
Hli outra forma de explicar isso: se a hip6tese nula e verdadeira e algumas marcas nao sao
preferidas, todas devem estar igualmente representadas.
Esperamos aproximadamente 0 mesmo numero de pessoas em cada categoria se a
hip6tese nula for verdadeira.
Tabela 8.2 Preferencias por marcas de chocolate

'7'::~~t~m~r~~~J1':j~~~::~~:~~T~":n:-~6:
20

iJ
:i

0 teste -l pode ser entendido como urn teste de associa~ao ou de diferencras entre categorias _ depende da fonna como 0 problema
c! coloeado.

60

20 + 60 + 10 + 20 = 110 pessoas DO lotal

10

20

270

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

8.2.1

Existem 110 pessoas e 4 categorias. Se a hip6tese nula e verdadeira, devemos esperar


110/4 em cada categoria. Assim:

~;:'~;"~~1f{~!;1~~_~:;",::I;,~J~:f{:f0~~;"i;;~~Y;o'.,>'*~~--

Se os quatro tipos de chocolate tern igual popularidade, devemos esperar aproximada


mente 0 mesmo nl1mero de pessoas em cada categoria (claro que e impossfvel termos 27,5
pessoas, mas, para 0 prop6sito do calculo da estatfstica teste, nao iremos nos preocupar
com esse tipo de detalhe).
As contagens encontradas em cada categoria sao denominadas jreqiiencias observa
elliS. Se a hip6tese nula for verdadeira (todas as marcas sao igualmente populares), devemos
encontrar asjreqiiencias esperadas.
o x2 compara as freqilencias observadas com as esperadas. Se todas as marcas de cho
colate sao igualmente populares, as freqilencias observadas nao deverao diferir muito das
esperadas. Se, por outro lado, as freqilencias esperadas diferem bastante das observadas, e
prov3vel que nem todas as marcas tenham a mesma preferencia. Isso e normalmente diffcil
de ser julgado se consideramos apenas os dados. A distribuilfiio dos dados de preferencia
por chocolate estao listados na Tabela 8.3, que mostra a forma comum de apresentalfao dos
2
dados para uma analise pelo X

20
60
10
20
110

Freqiifndas

~B- __

20
27,5

60
27,5

CbocoIateC
10
27,5

=
=
=
=

-7,5
32.5
-17,5
-7.5

.-

2. Elevar cada diferenlfa ao quadrado:


_7,5 2 = 56,25
2
32,5 = 1056,25
_17,5 2 =306,25
_7,5 2 =56,25

FreqiH!ncias observadas e esperadas de pessoas que preferem diferentes marcas de

_.~~~,:,"._

27.5
27.5
27,5
27,5
110

",":,;,;

Ignoramos 0 sinal (mais ou menos) porque estamos interessados no valor absoluto das
diferenlfas (de fato, elevando os valores ao quadrado, como no passe 2, iremos eliminar os
valores negativos).

3. Divida esses resultados por uma medida de variabilidade (isso e semelhante ao que
acontece no teste t ou no r de Pearson). Neste caso, a medida da variabilidade cor
responde as freqilencias esperadas (27,5).

chocolale

Observadas
E.'peradas

Como descobrir se freqiiencias observadas e esperadas sao similares?


I. Encontre as freqilencias esperadas a partir das freqilencias observadas:

110/4 =27,5

Tabela8.3

271

~teD

20
27.5

56,25 = 205
27,5
'
1056,25 = 3841
27,5
'
306,25 = II 14
27,5
'
56,25 = 205
27,5
'
4. Esses quocientes sao enta~ somados para fomecer:
. ;:'~ ,:' :'

=53,65
Entao, 0 X2 e53,65 (53,7).
o grau de Iiberdade (gl) e igual ao nl1mero de categorias envolvidas no teste menos I.
Assim, gl =4 - I = 3. Precisamos saber disso para podermos comparar esse resultado com 0
2
2
valor te6rico (a distribuilfao de probabilidade X , cujo parametro e 0 gl) do X e verificar quae
Total

provavel de ocorrer seria, por acaso, 0 valor encontrado ou mais extremo.


Assim, 0 valor calculado ou encontrado e 53,65, que ecomparado com 0 valor que seria
esperado (teorico) para urn X2 com 3 graus de Iiberdade, se a hip6tese nula fosse verdadeira
(isto e, se todas as marcas fossem igualmente preferidas). Nao precisamos fazer essa compa
ralfao porque 0 pacote estatistico a faz automaticamente.

272

Christine P. Dancey & John Reidy

t~r~~!~~.l"

Estatistica sem Matematica para Psicologia

"~'"'-~:t~!t~~f:~I'J~;~i.L. ;~. .,

273

Esse procedimento abre a caixa de diaJogos Weight Cases (Ponderar Casos), a seguir.

Se voce dispuser dos dados em uma tabela de freqiiencias, como no exemplo menciona
do, os mesmos podem ser fomecidos ao SPSSPW da maneira a seguir.

i~BJJf:
;iJR;;'if.hf'~'~'::;

~\'l~:~ci'~
par). Mow a
variiWel

1-

-'!---F=-=r-;----t-

fTeqil~cia5'

para
a eaixa Frequency
.Viriable (\tariM!
. Freqilfnda)

Mova jreq (freqiiencias) da caixa esquerda para a caixa Frequency Variable (Varhivel
Freqiiencia) clicando no bollio ~. Oique em OK. Agora clique em Analyze (Analisar), Non
parametric tests (Testes nao-parametricos) e Chi-Square (Qui-quadrado), como a seguir.

'l,

deve-se ponderar os
Sempre que se entrar com os dados dessa forma e se executar 0
casos pelas freqiiencias. Isso e necessario para informar ao software que os dados sao fre
qiiencias em vez de dados brutos. Pode-se fazer como ilustrado a seguir.

...

274

Christine P. Dancey & John Reidy

275

Estatistica sem Matematica para Psicologia

Sera aberta a caixa de dililogos Chi-Square (Qui-quadrado). como na figura.

A segunda se\=ao da safda fomece as estatfsticas do teste:


Test Statistics (Estalist;cas do Teste)

~4J~;sup~n~~:~uea.'i,

CHOCOLAT (CHOCOLATE)

laCleii:a;'nd$SO~lor;

'eIlll0:000'iieter,);

53.636'

Chi-Square (Qui-Quadrado)

df (gl)

Asymp. Sig.'
(Significanda Assint6tica)

.0000

a. 0 cells (.0%) have expected frequencies less than 5.


(a. 0 celulas IO,O%llem !requendas esperadas menores que 5.)

' : ' .... ','

, '.. :~~tfaSJ)~Javras,
ltJ!}iproyayeU.

'

-t

..

.-

The minimum expected cell frequency is 27.5.


(A frequenc;a esperada minima da celula e 27.5.)

Os resultados podem ser relatados da seguinte forma:

'l

o valor do de 53.6 com grau de liberdade de 3 foi encontrado. e a probabilidade a550ciada e


0,0001.1550 5ignifica que. se a hip6tese nula e verdadeira. tal valor raramente vai ocorrer (cerca de
uma vez em 10 mil). Dessa forma. n6s podemos aceitar que existe uma diferem,a significativa entre
as freqiiencias observadas e as esperadas e concluir que as marcas de chocolate nao apresentam 0
mesmo grau de preferencia. A tabela a seguir mostra que mais pessoas preferem 0 chocolate B (60)
a qualquer outra marca.
Clique em Options (Op\Oes) se desejar e entao em OK. Os resultados deverao aparecer
na janeJa de saida.

Freqlleodils .

. OiocoI8t4!c'"
.ChoCoJatd:':-.;'" c~B::J;;;;
. . .

' -.. , . . '

20
27.5

Observadas

8.2.2

Saida para 0 'l de uma variavel

Esperadas

60

10

27.5

27.5

ChocolsteD
20

27,5

Para 0 X de uma variavel. e importante registrar 0 valor da estatfstica teste. os graus de


2
liberdade e a probabilidade associada. No entanto, a primeira s~ao da safda do X confirma
nossos calculos na Se\=ao 8.2.1.
CHOCOLAT (CHOCOLATE)
Observed N (N Observado)

Expected N (N Esperado)

Residual (Residuos)

20

27.5

-7.5

60

27.5

32.5

10

27.5

-17.5

20

27.5

-7.5

Total

110

Embora nossas conclusoes sejam que as pessoas preferem algumas marcas a outras (nem
todas as marcas sao igualmente populares). podemos afirrnar mais do que isso: pela tabela se
veem quais sao as marcas preferidas - ou seja. podemos indicar a dir~ao da diferen\=a. isto e.
que 0 chocolate B e a marca predileta.

. (d) Nenhumadas
illtemiltivas'adina'~' .
.'-

;".

'.

."

\;""

, 0 SPSS [omece agora dois tipos de lesles de significancia para labelas cruzadas e dois (esles nao-paramelricos, A significancia as
sint6tica se fundamenta em grandes amostras. Utiliza-se significancia exata quando 0 conjunto de dados e pequeno. desbalanceado
ou nao atende ~ suposi~ao de normalidade.

276
8.2.3

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Compara~ao de frequencias observadas com qualquer conjunto de


frequencias esperadas
Algumas vezes queremos comparar as freqiiencias observadas com urn conjunto parti
cular de freqiiencias esperadas. Por exemplo. os pesquisadores descobriram que as pessoas
canhotas tern maior predispositrao de apresentar a doentra da inflamatrao intestinal (OIl).
A prevalencia dos canhotos e mais alta do que seria a esperada em uma amostra. Vamos
supor que 150 pessoas com esse tipo de doentra foram testadas. Encontraram-se os seguin
tes dados:

r~~i~_~_ig~ill;~~

Abra 0 arquivo de dados, selecione Data (Oados) e Weight Cases (Pondere Casos):

'
i:L

:-": ~~~~~~t~~g:.\;'\.~~!.i~:L::'f:~~;~:~:.~~
120
75

Observ.das
Esper.d.s sob. hip61ese nul.

277

30

75

-'

TIj
~

Se voce simplesmente dividir 150 por 2 para encontrar as freqiiencias esperadas sob a
hip6tese nula, deve achar 0 valor 75. Toma-se aparente que nao esperamos a existencia do
mesrno numero de pessoas destras e canhotas na populatrao, porque sabemos que existem
rnuito menos canhotos do que destros. As freqiiencias esperadas reais sao as que conhece
mos por pesquisas anteriores. Hli ainda uma diferen~a entre sexos para a tendencia de ser
canhoto. A prevalencia de canhotos e bern maior entre os homens do que entre as mulheres.
Isso significa que homens e mulheres nao podern ser inclufdos juntos em urn unico grupo.
Aproximadamente 10% das rnulheres sao canhotas.
Oecidimos verificar a existencia de uma maior prevalencia de canhotas entre as mulheres
com a sfndrome do intestino irritlivel (SII) do que entre as que apresentam 011. Urn ques
tionlirio foi respondido por 317 mulheres. Verificou-se que 268 eram destras e 49 canhotas.
Como esperamos que 90% das mulheres sejam destras, esperamos que 285,3 das pertencen
tes a amostra estejam nesta situatrao (90% de 317 = 285,3). Isso significa que vamos esperar
que 31,7 sejam canhotas (317 = 285,3 = 31,7)

;;

:;;

'IT
11
;1

,,

';j

;;

;mt:'~,~~~~~:,,;c~:~_{;j;;j'Jn
__-

..... c..

.....

-- -L
I

_.n

Pi'
Sera aberta abre a caixa de dililogos Weight Cases (Pondere Casos).
,~

.:T;':~~:;{ ~~~~ ':~:~({,~J~7'~~;~~_;;~;?::':.: . ;.-,~~


Observ.das
Esperadas

268
285.3

49
31,7

::::=:~-=!f
i mfi':'- ~
~~-:

::0

'--------',

0.-1--.....,._..

fI

9
10
11

,_.__ ,

--

I', --_ ..

,
I
IE

-+-

_ ---------t

"

Realmente apenas 268 eram destras - isso representa 84,5% do total 317. As 49 canhotas
representam 15,5% do total, em vez dos 10% esperados.

__

:~----_.

-- --_.:-.,
-

--

---

R~

2 5---- -

:os

-~-----~

------:-------- ------

'!1-- . - - - - -

"

---;

,. :.~~;;-:.-.;;.;.;;.~~~-::~~:-;-:=-:--~~~;-

*iii

,,

Milva a vari4vel

lIflliill., .1 ..,1,,,1 ~;

.~.}~~~pi~~~::~

~_~--.

~.

'IS.-.....

-~
~:

~Frequency

:,J,'Fr~@OOa)
~ par.! este Iugar
"-t.. '

278

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Marque a o~ao Weight cases by (Pondere casos por) e mova a variavelfrequency (fre
qiiencia) da esquerda para a direita. Isso 0 levara de volta ao arquivo de dados original.
Selecione Analyze (Analisar), Non-parametric tests (Testes nao-parametricos) e Chi
Square (Qui-quadrado):
(Ill. . . . . _

..... _

---r
~~~S

~ ~2~
}Co

....

...

_=::.,=

=-- ::f~i
=E~,:.I~
.

~-

==------
=,-".=:JI=:!-!::::II::::;'~'=:JI~.;'. =TI:..-:r"-=:J::::':-!::::II=:u:r::::;'.'=:J~.".. =cr.

-::--:... .

,,~

-.

--

.........

....
.;

."aJ"

Certifique-se de que a variavel correta (neste caso hand - mao) e movimentada da es


querda para 0 campo Test Variable List (Usta de Variaveis do Teste). Em Expected Values
(Valores Esperados), voce pode escolher All categories equal (Todas as categorias iguais - e 0
padrao) ou Values (Valores - significa que os valores esperados seriio fomecidos). Neste caso,
digite as freqiiencias esperadas da primeira categoria (mao direita ou destros), que e 285,3.
Entao, clique em Add (Adicionar):
II.

0"'-. I''''''.'

(dII

~.....

~ ..~

"11;I1.1~!:J'!iJ.!!l!Jl!I.fl!!!IIIl!Ill!!I~!'
_o"",,"_-:.. .. _-["~_.__ - ,_
_,-..=.-o:-_~-~~"-="-'''''''''''''''''7_._'.-=_-=-_

~~_

r r'--'"
.-

......

.-

279

N'~'

[!J

r~VMr---!

__ '
r:~":1
1: ~.- 1 :

..

,~~

'("AI~'"

rUoo

l_~.

~,,,'

.~~.

"

Ii :-..... 1

1!
,

""
~
;;

:.:- v-.. Jiil"

""

:i!
l!

;;
;;;

"

"

'i
7i

~~.~r:

-r--- -;

"ij

",

----.

11.1l_ _ I..v..-...

"

'i

L~ ......~,~

~"
-~

:1]-_-

-_.--,-. . ._
.___

-L~~:':~=:~-=-:ic

(IlIa_Il........."...

1ft

sera aberta a caixa de diaIogos Chi-SquareTest (Teste Qui-quadrado).


Digite a freqiiencia esperada da segunda categoria (canhotos), que e 31,7, e clique em
f'"l.-:~lICoIl'

__

Add (Adicionar):

~iodIIlP'*""-'~

~!II,Jg.!!l!Jl!I
~Q!!!J,~J
:5:'.
_.
- - -
-

~t--= i=-~_:-: .~
r----,
Ir .........

i~"::',- i
:~

i .::=J

;
i

~
~

._--_._--

wr-

r- r-'"

~~,,=-!
rUoo _ _ 1

~lIi

i&

1 i

;
;

':lob

.~ ....

,....

_
-

~I-;-__

,:=;;-T

~~~~-;SC
.l

--!---- -- -- --_.~

~I:
I

;t~i~1jl;

-- -----------

~~~.(~~~.i'':'l<.~~~~
..... ;.: :-~~~:.iEi::l.".J"",.
" , _ ....,

MUd

..,..,... 9'"'"

~ .......

.....
.....

-~-.

";;

--- -- -

to

"Ial~!~t;:!i:.;!;;;t~_,el_~~_~~

---~-------------_._-

~
-.11----

.... Coli

-----L_

!iiiijiCh

.------.

eM
':!tl1i!:~~.iL2~

---.,rJ

280

Christine P. Dancey & John Reidy

Estatlstica sem Matematica para Psicologia

Finalmente, clique em OK:

8.3

"1&I,aISi ~ sJ.!!ltJ
-_..~;ffiJ!!I.-.mD~,
-_.- _. - -_._- _._ ..

r- r-'"
......

....

CD

r~~!

\1"1,1.--.....

...!!!J

.....

~
~

'i

~~_

-r --.

r-- -r----;
i .

'I .-.. I '

L:...J~ '

: L
,

"

"
"
""
"'"
,.""

~___

..

..

~I
~-

-r~-=':-----'

'1'''_1'

_-~

~I

Teste ''i para independencia: 2 x 2

o permite que se descubra se existe urn relacionamento ou associa"ao entre duas variaveis
categ6ricas (p. ex., a associarrao entre fumar [fumantelnao-fumante1e 0 habito de beber [bebe
dor/abstemioJ). Esses sao dados categ6ricos porque nao estarnos perguntando sobre quantos
cigarros as pessoas fumam ou quanta bebida alc06lica consomem. Estamos apenas perguntando
se elas fumam ou bebem. Tal delineamento sera semelhante ao da Tabela 8.4.
Esse tipo de tabela de contingencia e denominada 2 x 2 porque existern duas linhas e
duas colunas.

... WI '(lIPo " ... , ...." ' _ 1Y'f'r-........ t ' _ .,...~.,.. It4

I~"",---r'

281

--

~ I

Tabela 8.4 Tabela de contingencia 2 x 2


. Debe

:,{.,~ j. _..~'. ;

.. 0.'

t L,NioIaebe

Fuma
N30 furna

Q'"
~~.tw.-~j-.~: --~ .... -:.>.~: >:;':"~:~2,:.i~~
,

i r

..~
'iiiiiiiii'Oi"-r---

[~.I EXEMPLO: ASSOCIAc;Ao ENTRE FUMAR EBEBER


Esse procedimento disponibilizara a seguinte safda:
Existe urn relacionamento entre 0 habito de fumar e 0 de beber entre os estudantes? Se
nao existe uma associa"lio significativa, concluiremos que as variaveis sao independentes
(e posslvel perguntar a cada estudante quantos cigarros fumam por semana e quantas uni
dades de alcool bebem neste mesmo periodo. Nesse caso, podemos utilizar 0 r de Pearson,
pois teremos dados continuos). Voce simplesmente formula as seguintes questOes:

HAND (MAO)
Observed N
(N observado)

Expected N
(N esperado)

Residual
(Residuos)

268
49
317

285.3
31.7

-17.3
17.3

right (direita)
left (esquerda)
Total

A)
B)
C)
D)

Test Statistics (Estatisticas do Teste)

HAND (MAO)
Chi-Square (Qui-Quadrado')
df (grau de liberdade)
Asymp. Sig.
(Significancia Assint6tica)

Quantos de voces fumam e bebem?

Quantos fumam, mas nao bebem?

Quantos nao fumam, mas bebem?

Quantos nao fumam nem bebem?

Voce nao tera dados intervalares ou ordinais. Obtera freqiiencias, ou seja, 0 mlmero de
estudantes em cada grupo. Agora podemos medir a associa'<iio, pois temos dados categ6ri
cos, freqiiencias. Estarnos considerando fumar e beber dados categ6ricos, nao verificamos
quantos cigarros fumam ou quanto de alcool consomem. Simplesmente perguntarnos em
qual das quatro categoriais se enquadram.
Voce pode representar esses resultados em uma tabela 2 x 2. Imagine que tenha feito
tais perguntas a 110 estudantes. Cada estudante estara em apenas urn grupo. Temos quatro
grupos. Podemos contar 0 mlmero de estudantes de cada grupo e rnontar uma tabela (Ta
bela 8.5). Cada "caixa" e denominada uma celula. Codificamos os grupos em: (I) aqueles
que bebem, (2) aqueles que nao bebem; (I) aqueles que fumam, (2) aqueles que nlio fu
mam. Podemos, entretanto, facilmente utilizar qualquer outra codifica"ao; nao precisamos
utilizar ole 0 2 como c6digos. A.s vezes os psic6logos utilizam 0 e I.

10.490
1
.001

a. 0 cells (.0%) have expected frequencies less than 5.


(a. 0 celulas [O,O%J apresentam valores esperados menores do que 5.)

The minimum expected cell frequency is 31.7.

(A frequencia minima esperada de uma celula e de 31.7.)

Isso mostra que existe uma diferen"a significativa entre as freqiiencias observadas e as
esperadas.

'.

282

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicofogia

8.3.1

Tabela 8.5 Tabela de contingencia 2 x 2 codificada com r6tulos

50 (A)
20 (B)

15 (C)
25 (D)

Optamos por identificar as celulas com letras. A celula A e a dos que fumam e bebem;
a celula D, a dos que nao bebem nem fumam. Assim:
Grupo I:
Grupo 2:
Grupo3:
Grupo 4:

50 (celula A)

20 (celula B)

15 (celulaC)

25 (celula D)

Os dados podem ser escritos como na Tabela 8.6.


Tabela 8.6 Dados tabelados com c6digos

~-~:~_.~~1~~t&~~~1~t~~,~~~-;~~,
1

2
2

I
2
I
2

do qui-quadrado 2 X 2

o teste calcula as freqtiencias esperadas nas celulas. Em outras palavras, em uma amostra
de 110 estudantes, calcula-se quantos se espera encontrar em cada celula, caso, de fato, nao
exista relacionamento entre fumar e beber (a hip6tese nula e verdadeira).
As freqtiencias esperadas para cada celula sao calculadas de uma forma semelhante ao X2
de uma variavel, embora, por termos urn numero diferente de pessoas que fum am e bebem, as
freqtiencias esperadas nas celulas sejam diferentes.
o valor do X2 resultante e comparado com 0 valor esperado se a hip6tese nula fosse ver
dadeira (se nao existisse associat;ao entre as duas variaveis). 0 pacote computacional calcula
2
o valor - e 0 significado do valor da probabilidade - que e a probabilidade do valor do X que
voce obteve ter surgido, assumindo que a hip6tese nula seja verdadeira.
As freqtiencias listadas nao sao realistas. Ha mais chance de se obter os valores da Ta
bela 8.7.
o problema e que 0 XZ tern uma restrit;ao: voce nao pode ter menos do que 25% das ce
lulas (nesse caso, 25% de 4 = I) com freqtiencias esperadas menores do que 5. Niio podemos
afirmar, apenas olhando para a tabela, se esta hip6tese e ou nao satisfeita. 0 SPSSPW alertara
para esse problema e prosseguirn, calculando 0 teste da probabilidade exata de Fisher (ainda
bern, pois os calculos sao trabalhosos). 0 teste de Fisher, entretanto, s6 e adequado para ta
belas 2 x 2.
2
Esse teste pode ser utilizado, em vez do X , quando a hip6tese for violada, porque a sua
f6rmula nao e sensfvel a pequenas freqiiencias esperadas.

.:;.:~.~;~~~~~~.~~;]~~~~:i11.~i}_If~~1r~)~:~~1~;r~ij~~~~~)
Bebe (c6digo I)
Nao bebe (c6digo 2)

Fundamenta~ao

283

". f:rec..i~ii1!~:
50
20

15
25

Tabela 8.7 Tabela de contingencia 2 x 2

Assim, na categoria I (dos que fumam) com a categoria I (dos que bebem), existem 50
estudantes. Isso e representado em uma tabela de contingencia 2 x 2, como a celula A.
Observe que nenhum participante pode estar em mais de uma celula. Isso e imponan
teo As categorias sao mutuamente exclusivas.

f~~fit~1~.ik~!~~~~~~:~tf~r~~~~~~:?~:~:~..,.::.:~;:::'\~~~f~~j~~~~.~:~~~~.,:,:~:.:~i~~i:
Bebe
Nao bebe

60
5

34
I

~~#~

.f'".

':.1.<:;'

... j . ; .

,?;:

'''.J

~~ii~~~i

284

Christine P. Dancey & John Reidy

m2r=::
~l.i~J!; .~}~~~.

Jr...:: \)d~;';;:~J

Estatistic.a sem Matematica para Psicologia

~if~!cf'zi;~~!~~'~1

..t- c.:

285

Mova drink (beber) para a caixa denominada row (Iinha) e smoke para a denominada
columns (colunas). Clique em Statistics (Estatisticas). Aparecera a seguinte caixa de dia
logos.

'l

Pondere os casos seguindo as mesmas instru~oes dadas para 0


de uma variavel. Entao
escolha: Analyze (Analisar), Descriptive Statistics (Estatfstica Descritiva) e Crosstabs (Tabu
la~ao cruzada):

Marque a
estatfstica

desejada

------t--I
---+----1----

-+---- --I
Voce pode escolher a estatfstica desejada marcando Chi-Square (Qui-quadrado) e
Cramer's V (V de Cramer, na o~ao Phi and Cramer's V).
Clique em Continue (Continuar). Voce retornara a caixa de dialogo anterior. Se quer
mostrar os conteudos das celulas. clique em Cells (Q!lulas). Aparecera 0 seguinte.

Sera aberta a seguinte caixa de dililogos.

;~~recerao

r-

as freq(j~as
-observadas

..=:r:.:..~

':;'_ .:t- ./:.'_

r,! ~,. 1 ~ -.;

,..

..

_~f:0

I..~:

~~:esperadas

286

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Clique nas o(l<;5es que deseja. Voce pode escolher uma tabela com as freqiiencias obser
vadas e esperadas, ou com os percentuais por linhas e colunas ou total. Clique em Continue
(Continuar). De volta 11 caixa de dialogos Crosstabs (Tabulacrao cruzada), clique em OK. A
safda devera aparecer na janela de resultados. As freqiiencias observadas e esperadas sao
apresentadas a seguir.
DRINK x SMOKE Crosstabulation (Tabula~ao Cruzada de BEBER x FUMAR)

A primeira secrao da saida confinna as categorias e as freqiiencias.

TABULAQ\O CRUZADA: FUMAR x BEBER


Count (Contagem)
do you smoke?
(voce fuma?)

SMOKE (FUMAR)

DRINK
(BEBER)

drink
(bebem)

smoke
(fumam)

don't smoke
(nao fumam)

Total

60

34

94

61.1

32.9

94.0

Expected Count (Esperado)

3.9

2.1

6.0

Count (Observado)

65

35

100

65.0

35.0

100.0

Count (Observado)
Expected Count (Esperado)

don't drink
(nao bebem)

Total

Count (Observado)

Expected Count (Esperado)

do you drink?
(voce bebe?)

E uma medida do efeito utilizado para testes de associacrao. E urn coeficiente de correla
crao, interpretado da mesma fonna que 0 r de Pearson.
Esta saida utiliza os seguintes dados:

50 pessoas que fumam e bebem


15 que bebem, mas nao fumam
20 pessoas que fumam, mas nao bebem
25 pessoas que nao fumam nem bebem

15

65

no (nao)

20

25

45

70

40

110

~:~[1~1;2'

I/

Asymp.Sig.
(2-sided)
(Significancia
~nt6tica Bilateral)

(Valor)~

df
(gl)

12.121"

.000

Continuity Correction'

de Continuidade')

10.759

.001

Likelihood Ration

(Razao de Vero55imilhan~a)

12.153

.000

(Corr~ao

A safda do 'l fomecera infonnacr5es superiores as suas necessidades; assim, como nos
testes anteriores, voce aprendera a selecionar 0 que e importante. A primeira parte da saida
reproduz a tabela 2 x 2. De uma rapida olhada nela para verificar se esta correta.

Vde Cramer

50

Value

Saida para 0 qui-quadrado 2 x 2

o SPSSPW apresenta varias linhas de estatlsticas. Entretanto, voce precisa da primeira


delas. Edenominada de Pearson, e voce precisa registrar 0 valor do 'l, 0 m1mero de graus de
liberdade e 0 nlvel de probabilidade associado.

yes (sim)

-- --

Pearson Chi-Square
IQui-quadrado de Pearson)

no (nao)

A proxima secrao da saida fomece as estatfsticas do teste.

Isso indica que nao respeitamos uma das condicroes do qui-quadrado - a de que nao se
deve ter mais do que 25% das celulas com freqiiencias esperadas menores do que 5. Temos
duas celulas nesta situacrao. Nesse caso, provavelmente precisamos aumentar 0 tamanho da
amostra. Voce devera incluir mais participantes no estudo para contomar 0 problema.

Estatistica

Total

yes (sim)

Total

8.3.2

287

Fisher's Exact Test


(Teste Exato de Fisher)

Exact Sig.
(2-sided)
(Significancia
Exata Bilateral)

.001

Linear-by-Linear Association
(Associao linear por linear)

12.011

N of Valid Cases

(N dos Casos Validos)

110

Exact Sig.
(l-sided)
(Significancia

Exata Unilateral)

.001

.001

a. Computed only for 2 x 2 table. (Caleulado somente para Iabelas 2 x 2.)


b. cells (.0%) have expected count less than 5. The minimum expected count is 16.36.
(0 celulaslO,O%1 apresenlam valores esperados menores do que S. 0 valor minimo esperado e 16.36.)

A linha em negrito e a que nos interessa. Voce precisa ler a linha do Qui-quadrado de Pe
arson, a que esta em destaque. 0 valor dO'l e 12,12; 0 grau de liberdade (gl) e I, e 0 valor p
< 0,00 I. Portanto, a probabilidade de se obter tal valor e tao remota quanto 1 em 1000. Dessa
fonna, pode-se concluir que existe uma associaerao entre fumar e beber entre os estudantes.
A saida tambem fomece 0 V de Cramer: mostra urn tamanho do efeito de 0,33. Se ele
varmos esse resultado ao quadrado, obteremos 0,1089. Assim, aproximadamente 11 % da
variacrao na contagem das freqiiencias dos que furnam pode ser explicada pelos que bebem.

288

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Symmetric Measures (Medidas 5im~tricas)

Temos entao as estatfsticas do teste.


Asymp. Std. Error'
(5ig. Assint6tica
Bilaleral)

Value
(Valor)
Nominal by Nominal
(Nominal versus Nominal)

Interval by Interval
(Inte",alo versus Inte",alo)

Approx. T"
(5ig. Exata
BIlateral)

Approx. Sig
(5ig.
Aproximada)

Phi

.332

.000

Cramer's V

.332

.000

(V de Cramer)

--

Pearson's R
Pearson)

.332

.092

3.657

Spearman Correlation
de Spearman)

.332

.092

3.657

(R de

Ordinal by Ordinal
(Ordinal versus Ordinal)
N of Valid Cases
(N dos casos validos)

289

(Correla~ao

Testes Qui-Quadrado

Value
(Valor)

1--.

df
(gl)

Asymp. Sig.
(2-sided)
(5ig. Assint6tica
Bilateraij

.000'

Pearson Chi-Square'
(Qui-Quadrado de Pearson)

.943b

.332

.000'

(Corr~ao

Continuity Correction'
de Continuidade)
Likelihood Ratio
(Razao de Verossim;lhan~a)

.281

.596

1.057

-~

110

e-

Sig. ; Significancia
a. Not assuming the null hypothesis. (Desconsiderando ahip6tese nula.)
b. Using the asymptotic standard error assuming the null hypothesis. (Utilizando 0 erro padrao assint6tico e <onsiderando a hip6tese nula.)
c. Based on normal approximation. (Com base na aproxima~ao normal.)
No relat6rio as freqiH~ncias podem ser apresentadas na forma de uma tabela de dupla
2
entrada (cruzada) 2 x 2 e ainda com valor do X , graus de liberdade e 0 valor p.
o relat6rio pode ser 0 seguinte:
Uma analise com 0 X' foi executada para descobrir se existe uma rela,.ao significativa entre
os habitos de fumar e beber entre estudantes universit3rios. 0 valor do XZ foi de 12,12 com uma
probabilidade associada (valor-p) de menos de 0,001 para urn grau de Iiberdade de I, mostrando
que tal relacionamento e bastante improvavel apenas como resultado do eITO amostral (ao acaso). 0
V de Cramer obtido foi de 0,33 aproximadamente 11% das varia,.oes das freqiiencias dos fumantes
podem ser explicados pelas varia,.oes das freqiiencias dos que bebem. Assim, e possfvel concluir
que existe uma rela,.ao entre os habitos de fumar e beber.

Voce via/au as condi~6es do X2 ?

Exact Sig.
(2-sided)
(5ig. Exata
Bilateral)

Exact Sig.
(I-sided)
(5ig. Exata
Unilateral)

.662

.312

.304

Fisher's Exact Test


(Teste Exato de Fisher)

Linear-by-Linear Association
(Associa~ao Linear versus Linear)
N of Valid cases
(N dos Casos Validos)

.934

.334

100

5;g. = Significancia
a. Computed only for 2 x 2 table. (Calculado somente para labelas 2 x 2.)
b. 2 cells (50.0%) have expected countless than 5. The minimum expected count is 2.10.
(2 celulas 150,0%1 apresentam valores esperados menores do que 5. Acontagem minima esperada ~ 2,10.)

~:"

c_ . _ ._,

~.

-.

:~;'~~;:' :,(~:;;F

A linha em negrito mostra que a probabilidade de obtennos urn valor de 0,94 quando a
hip6tese nula e supostarnente verdadeira e de 66% para uma hip6tese bilateral e de 31 % para
uma hip6tese unilateral.

Caso tenha violado as condi'rDes de X , 0 teste da probabilidade exata de Fisher aparecer<i


nos seus resultados, e a linha Cells with expectedjrequency < 5 (ceIulas com freqiiencias espe
radas menores do que 5) informara a percentagem de freqiiencias esperadas menores do que 5.
Nesse caso, em vez de relatar os valores do parngrafo mencionado, deve relatar a proba
bilidade exata de Fisher (p. ex., probabilidade exata de Fisher = 0,66). 0 teste de Fisher nao
2
tern urn valor como 0 teste t ou 0 X A proxima saida mostra 0 que se pode esperar se houver
mais do que 25% das celulas com freqiiencias esperadas menoces do que 5.
A primeira se'rao da saida apresenta as categorias e os valores das freqiiencias.

TABULAsAo CRUZADA: FUMAR

Nominal by Nominal
(Nominal verniS Nominal)

Value (Valor)

Approx. Sig
(5ig. Aproximada)

Phi

-.097

.332

Cramer's V
(V de Cramer)

.097

.332

N of Valid Cases

100

(N dos Casos Validos)

Sig. ; Significancia
a. Not assuming the null hypothesis. (Desconsiderando a hip6tese nula.)
b. Using the asymptotic standard error assuming the null hypothesis.
(Utilizando 0 erro padrao assint6tico considerando a hip6tese nUIa.)

BEBER

Count (Contagem)
do you smoke
(voc~ fuma?)
do you drink?
(voce bebe?)

Symmetric Measures (Medidas Sim~ricas)

o relat6rio pode ser 0 seguinte:


Total

yes (sim)

no (nao)

yes (sim)

60

34

94

no (nao)

65

35

100

Como 50% das celulas apresentaram freqiiencias esperadas menoces do que 5, 0 teste esta
tfstico apropriado foi 0 da probabilidade exata de Fisher. Ele fomeceu p = 0,66 para uma hip6tese
bilateral. 0 valor do V de Cramer foi 0,10, mostrando que 0 relacionamento entre fumar e beber
e quase O. A conclusao e que nao existem evidencias de que exista urn relacionamento entre os
habitos de fumar e beber.
2

Total

A execu'rao manual de urn teste X 2 x 2 e f<icil, mas nao vamos solicitar que voce 0 fa'<3.
2
As instrutrDes de como executar uma analise X 2 x 2 no SPSSPW foram dadas na pagina 284.

290

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

291

Lembre-se: gl = (r - I ).(c - I)
Assim: 2x 2 =4
Tambem e posslvel tennos mais de tres nlveis (p. ex., 6 x 4 ou 7 x 3), mas a interpreta9ao.
nesses casos, torna-se problematica. Nao queremos apenas dizer que existe urn "relaciona
mento significativo entre as variaveis A e B". Queremos tambern ser capazes de dizer algo
sobre a direrriio desse relacionamento. Por exemplo, no exemplo de fumar versus beber, ob
servamos, por meio do exame das celulas. que 0 relacionamento significativo entre fumar e
beber e positivo. Quando temos grandes tabelas de contingencia, pode ser diffcil perceber
todos os posslveis relacionamentos.
Ainda, para que a estatlstica teste seja confiavel, ~Iembre:

'!~~1S

Nao mais do que 25% das celulas podem ter freqiiencias esperadas menores do que 5.
Nenhuma celula pode ser zero (se isso ocorrer e necessario agregar celulas; no en
tanto, algumas vezes isso nao sera posslvel por nao possulrem valores suficientes em
comum).

. (r::."'i);(c,i,'l)";' (t':H;;(a:~h:
"

.."

:>.-::.,'"

:<~'

- .

[~)Ati~.da~e-~~~~

Voce pode estar se perguntando 0 porque dessas restri~5es. Isso ocorre em razao de estar
mos assumindo que as nossas amostras sao provenientes de popula~5es normais. Se 0 valor
esperado de uma celula e muito pequeno, e pouco provavel que estejamos retirando amostras
de popula~5es nonnais. A nossa estatfstica teste nao sera confiavel a menos que essas hip6
teses estejam satisfeitas.
Certifique-se de que cada participante tenha side contado em apenas uma das celulas. Lem
bre-se de que e necessario que os participantes em cada celula sejam independentes - obviamente
isso nao vai acontecer se forem os mesmos. Assim, urn mesmo participante s6 pode responder
uma unica vez. 0 total das freqiiencias nas celulas deve ser igual ao numero de participantes.
2
Nao existe nenhuma razao pela qual 0 teste X nao possa ser utilizado com variaveis
quantitativas - e justamente com dados quantitativos que outros testes, tais como os parame
tricos, sao mais poderosos.

. i ~.

. :~)VJ~~:"

>

(b)Unt:';

.... .."c:iJi

. -(cr)Uma

...

8.4

~~l:~t~;0':?':.;1<i;

Teste de independencia X2 : rx c
.' :-: ;.~-:

o que acontece se houver mais do que dois niveis? E perfeitamente posslvel haver
mais linhas e colunas. Ainda trata-se de duas variaveis categ6ricas, mas dessa vez com
mais categorias para escolhennos. 0
pode manejar essa situa~ao facilmente. Vamos
supor que ainda temos 0 exemplo da rela~ao entre fumar e beber, agora com tres nlveis
de fumantes: os que fumam muito, os que fumam pouco e os que nao fumam. Podemos
ter tambem aqueles que bebem muito, os que bebem com modera~ao e os que nao bebem
(veja Tabela 8.8).
Essa e uma tabela de contingencia 3 x 3, por razOes 6bvias. Os calculos sao feitos
exatamente da mesma fonna descrita, para as tabelas 2 x 2, porem 0 grau de liberdade e
diferente.

-::;~,:;.-, ';i>:-:~~ .-~: ~,

"-':'. '":.{".:,:;:"

."

:;

..:", =-.",:

,,~..,,>~ ~:t;_1,-::,U<:-._

.'

\:. --.~.,~
;,~:~~-

"

..

'l

'~:';~:':~f';/%~~~_'~~l;i:~"C"!
Bebem muito

Bebem moderadamente

Naobebem

.~l

.~la:~~~~.i.~~~~:J~~,.:.~

";-'.'

'""-'''k;:"
~:

8.4.1

Tabela 8.8 Tabela de contingencia 3 x 3


'.. .;.~f,~~.;~~\~;~:wiit4k

... ::

..;;.

;:'3:

;:.,

'l: teste uni au bilateral?


Existe urn debate entre os estatfsticos sobre a utiliza9ao de testes unilaterais ou bilaterais.
Voce nao vai errar se utilizar urn teste bilateral porque, nesse caso, teni uma probabilidade
menor de declarar que urn resultado e significativo. Algumas pessoas defendem que sempre
2
devemos utilizar hip6teses bilaterais quando usamos 0 X 0 pr6prio teste, entretanto, e unila
2
teral: 0 valor do X sera sempre 0 mesmo se os valores forem semelhantes a esses:

292

Christine P. Dancey & John Reidy

Estatistica sem Matemtltica para Psicologia

293

IS

140

36

IS

22

40

Tabela 8.9 Resultados do estudo de Bish e colaboradores (1996)

ou esses

36
1

22

comoesses

I 22

40

I 36

15

9 (53~)

Classe media
Classe trabalhadara
7..' = 0, 18 (naa significaliva)

ou esses

~
15

36

5 (38%)
8 (62%)

8 (47'1

Algumas vezes na literatura encontramos pesquisadores que utilizam a correrriio de


continuidade de Yates. Esse e urn pequeno ajustaltrento na f6rmula utilizada quando te
mos pequenas freqiiencias esperadas em uma tabela 2 x 2. No final dos anos de 1980,
os psic610gos foram rotineiramente avisados para utilizar a correrrao de Yates, mas agora
muitos acham que isso nao e razoavel tarnpouco necessario (veja Howell, 2002, para urn
debate sobre 0 assunto). Voce podera notar que, nas safdas do SPSSPW (veja pagina 287
8), tambem e apresentado 0 valor do com a correrrao de continuidade. Recomendamos
que, de infcio, voce nao se preocupe com tal correrrao. Note, entretanto, que alguns artigos
de peri6dicos utilizam a correrrao de continuidade de Yates.

A distribuirrao amostral do X esempre positiva. Isso ocorre porque qualquer valor elevado
ao quadrado e positivo. Isso e 0 que queremos afinnar quando dizemos que 0 pr6prio teste e
unilateral: fomece somente valores positivos - e impossivel obter urn valor X2 negativo.
Entretanto, a hip6tese pode ser bilateral (existe uma associarrao, mas voce nao preve a
sua direrrao) ou, mais provavel, unilateral (voce preve a direrrao da associarrao, p. ex., fumar e
cancer estao relacionados de uma forma positiva, ou a marca de chocolate A e a preferida no
X' de uma variavel). No entanto, testes unilaterais devem ser formulados com base em teorias
previas - nao porque voce acha que 0 chocolate A e melhor do que os outros. Alguns acham
que se utilizarmos urn teste unilateral e 0 relacionamento encontrado for 0 contrano do pre
visto, entao teremos "nos perdido", mas, eclaro, esse e0 caso de qualquer previsao unilateral
(veja Capitulo 4, pagina 160 para mais detalhes).
Se tivermos uma razao para especificarmos a direrrao da associarrao, e valida a utilizarrao
de urn teste de hip6teses unilateral, mas voce deve decidir antes de executar a analise (deve
pensar cuidadosamente se a hip6tese e uni ou bilateral antes de 0 estudo ser feito).
2

Exemplo da literatura:

ciasse social e tranqUilizantes

Bish e colaboradores (1996) queriam saber se a classe social esta associada a freqiiencia do uso
de tranqiiilizantes. Foram c1assificados, quanto a c1asse social, urn gropo de pessoas que tentava
reduzir 0 uso de tranqiiilizantes e outro que nao. Os resultados sao apresentados na Tabela 8.9.
Como se depreende a partir da Tabela 8.9, urn grande percentual do gropo que nao estava
reduzindo a quantidade de tranqiiilizantes era da c1asse trabalhadora. Vma analise pelo X2 , no
2
entanto, mostra que a probabilidade de obtermos urn X de 0,18, dado que a hip6tese nul a e verda
deira (nao existe associarrao), e maior do que seria aceitavel. E enta~ nao se aceita que exista urn
relacionamento significativo entre 0 uso de tranqiiilizantes e a c1asse social. Bish e colaboradores
2
nao forneceram 0 valor da probabilidade associada para 0 X de 0,18 encontrado, mas voce pode
calcula-Io.

Exemplo da Iiteratura: representa~o familiar


em epis6dios de relacionamentos de pacientes bulimicos
Benninghoven e colaboradores (2003) estudaram as form as pela quais pacientes que sofrem
de bulimia nervosa diferem de outros pacientes em psicoterapia e de panicipantes em controle
nao-c1inico em termos das formas de perceberem 0 relacionarnento familiar atual e passado. E
importante mostrar que tais grupos nao diferem em variaveis demognificas - assim, qualquer dife
renrra nas variaveis de interesse (nesse caso, a perce~o do relacionamento) nao deve ser atribuida
a, por exemplo, idade ou status profissional. Benninghoven e colaboradores se preocupararn com
a associarrao entre os diferentes gropos em termos de status profissional. Relataram 0 resultado
2
como na Tabela 8.10. E urn X 3 x 4. 0 grau de liberdade e (n - I ).(n - 2) que e (3 - 1).(4 - I) =
2
6. 0 X =3,5 tern uma probabilidade associada de 0,744. Desse modo, nao existe uma associarrao
entre os tees grupos e 0 status profissional.
Tabela 8.10 Grupos par s;alus profissionaJ: freqiiencias eestatfsticas do X'

:stliii~.'.p:i~-: '.:;~;~;:;:.,::~:~;;~f,~;t~
Trabalhadares
Estagiarias
Esludanles universitarias
Donas de casa

18
12
71
0

N. de T. Frank Yates (1902-1994).

~~~~l;;r:::o
28
II
56
6

15
10
75
0

7..' = 3,5
gl = 3,5
P =0,744

294

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

295

~~::1f~~:~~~~~:~1;~~~~~~:;~~(~:;~~~!'t~I~L!~~ . ~1~~~:~~~.';~'i~~:t~~:;~;~~~~~~

Resumo

10

Para a analise do relacionamento entre variaveis categ6ricas, 0 lea estatfstica infe


rencial apropriada.
2
0 X de uma variavel (ou teste de aderencia) tern uma variavel com varios nfveis. 0
teste mostra se as freqiiencias nas celulas sao significativamente diferentes das que
esperamos, considerando a hip6tese nula verdadeira.
0 teste de independencia mostra se existe uma associar;iio significativa entre duas
variaveis (com dois ou mais nfveis). A estatfstica teste e 0 resultado de urn calculo
mostrando 0 grau de diferenr;a entre as freqiiencias observadas nas celulas e as espe
radas. considerando a hip6tese nula verdadeira (isso e, sem haver relacionamento).
2
0 X tern algumas restrir;6es (ver pagina 281). Se violadas, para uma tabela 2 x 2 0 teste
exato de Fisher pode ser executado. Isso e feito automaticamente no SPSSpw.
2
0 X pode ser convertido no V de Cramer (urn coeficiente de correlar;iio) de modo a
fornecer uma medida do efeito. Isso e executado automaticamente pelo SPSSPW.

I. Quais sao as freqiiencias esperadas para as quatro celulas?


2

2. Qual e 0 valor do X ?
3. Qual e 0 valor da probabilidade?

4. 0 que se pode conciuir desses resultados?

.-

Exercicio 4
Execute urn teste X2 nos seguintes dados:

;.:'."

Exerdcios para

11

...... i,t ;\~. \,~. ,r.:~"-ii

SPSSPW

~<
".

70
7

Bebedor
Abslemio

""

~NNiDante
... .... .,. ..,".,:
. ~

-.::

32
I

Registre os resultados e explique 0 que significam.

Exercicio 1
Utilize os dados de Bish e colaboradores (1996) da pagina 293 e execute urn teste X2 2 x
2 no SPSSPW. 0 que voce nota sobre a analise executada?

Exercicio 2
Execute uma analise 2 x 2 no seu pacote computacional.

PONTO DE DISCUSSAO: -lou TESTE 11


Observe os seguintes recortes de jornais e decida em cada caso 0 que deve ser utilizado:
2
urn X ou urn teste t.
A: Existe uma possibilidade de chuva nas quintas-feiras

l'

:A~~-:;-: ::.~~~:~~:'~'~~_.~."J...-~'.'~~~:::,,~,~,,;':~'~ ~:~~~~~~ ~

Bebedor
Abslemio

Existe urn relacionamento entre beber e fumar na sua sala de aula?


I. Qual e 0 valor do X ?
2

2. Qual e 0 valor da probabilidade?


3. 0 que os resultados estiio Ihe inforrnando?

Do Professor MJ
Senhor, NP (correspondncia de 24 dejulho) tenta explicar a descobena de GN (correspon
dncia de 22 de jlllho) de que quinta1eira e 0 dia mais chuvoso da semana. Nenhuma explicafiio
enecessaria. A variafiio dos nUmeros para os sete dias e puramente casual como qualquer esta
tfstico pode assegurar.
OnUmero total de dias comchuvapara todos ossete dias e938,9. com uma media de 134.13.
Esta media eum valor esperado para cada dia se a chuva for igualmente distribufda sobre os sete
dias. Um teste qui-quadrado pode ser Ulilizado para COmparar os sete valores observados com os
esperados. 0 qui-quadrado resultante de 1,28 para 6 graus de liberdade emuito pequeno para
demonstrar uma diferenfa signijicativa dos valores esperados. De fato, 0 acaso produzira esta
diferenfa pelo menos 95 vezes em cada ]00.
Sinceramente

B: 0 dia mais chuvoso da semana colocado em teste

Exercicio 3
Trinta e tres pessoas receberam urn questionario sobre suas preferencias por animais:
ratos, aranhas, morcegos au cobras. Eis os resultados:

Do Sr. AF
Senhor, parece impertinente que um simples graduado critique a sua correspondncia. mas
seguramente 0 professor MJ utilizou 0 teste estatfstico errado em sua correspondncia (de 27 de
julho). 0 teste qui-quadrado eutilizado para testar freqiincias de ocorrencia. Neste caso, temos

296

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

3. Quantas mulheres estlio no grupo das quartas de


dados intervalares. e 0 teste t IS que deve ser utilizado. requerendo 0 conhecimento do desvio pa
driio dos conjuntos de dados. Afora isso. os resultados provavelmente seriio semelhantes.
manhli?
No meu ponto de vista. quintafeira e 0 dia mais chuvoso como e0 primeiro dia de um cam
(a) 127
peonalO. Os selecionadores utilizam esta informafiio para escolher qu~tro lanfadores rtipidos que
(b) 43
provam ser IOtalmente inadequados para os reSlantes qUa/ro dias secos .
(c) 99

6. 290 pessoas sao questionadas sobre qual rem


geran!e de cola preferem. Os resultados slio os
seguintes:

(d) 210

4. 0 X' de Pearson apresenta urna probabilidade as

Sinceramente

67

sociada de:

(a) Os clilculos do X' slio muito complicados


(b) Hli mais de 25% das celulas com freqiiencias
esperadas menores do que 5 em urn delinea
mento 2 x 2
(c) Hli mais de 25% das celulas com freqiiencias
esperadas menores do que 5 em uma tabela de

contingencia 3 x 2
(d) Hli dados nlio-categ6ricos

TABELA CRUZADA DE DIA DA SEMANA

(b) 0.00004

(a) Urn sinal de vit6ria feito depois de calculado


o teste estatistico de Cramer
(b) Urna medida do efeito baseada em escores pa
dronizados

(c) Uma medida de correla<;lio do efeito converti


da para X'
(d) Uma medida de diferen<;as

I. 0 teste exato de Fisher e utilizado quando:

As questoes 3 a 5 se relacionam com a seguinte

salda:

SEXO

Count (Contagem)

day of week
(dia da semana)

SEX (5EXO)
women (mulheres)

Total

men (homens)
tuesday am
de manha)

21

210

231

wednesday am
(quarta de manha)

43

127

170

evening
(vespertino)

25

99

124

89

436

525

(c)

57

Quais slio as freqiiencias esperadas para as celu


las?

0.00124

(d) Nenhurna delas

(a) 57

5. 0 nurnero de pessoas na analise e:

(b) 58

(a) 231

(c) 290

(b) 170

(d) Nenhuma das altemativas

124
(d) 525

(c)

7. Observe a seguinte saida:

Chi-Square Tests (Testes Qui-Quadrado)

Value (Valor)

df (graus de Iiberdade)

Asymp. Sig. (2-sided)


(5ig. Assint6tic.a Bilateral)

Pearson Chi-Square
(Qui-Quadrado de Pearson)

14.3212

0.00050

Likelihood Ratio
(Razao de Verossimilhan~)

14.3722

0.00004

Linear-by-Linear Association
linear versus linear)

14.3521

0.00005

(Assoeia~ao

Sig. = Significancia

(ter~a

Total

77

83

(a) <0,001

2. 0 V de Cramer e:

QUESTOES DE MULTIPLA ESCOLHA

o X' !em uma probabilidade associada de:


(a) 0,00005
(b) 0.00004
(c) 0,00200

(d) 0.00050

8. Observe a seguinte tabela:


Chi-Square Tests (Testes Qui-Quadrado)
df (grau de liberdade)

Asymp. Sig. (2-sidedl


(5ig. Assint6tiea Bilateral)

19.450'

0.000

Likelihood Ration
(Razao de Verossimilhan~a)

20.208

0.000

Linear-by-Linear Association
linear versus linear)

10.429

0.001

N dos casos Validos

525

Value (Valor)
Pearson Chi-Square
(Qui-Quadrado de Pearson)

(Assoeia~ao

Sig. = Significancia

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 21.02.
(a. 0 eelulas (0.0%) apresentam menos do que valores esperados. 0 valor mlnimo esperado e 21.02)

* N. de T. 0 texto est! se referindo ao jogo de criquete.

297

observed
(observado)
expected
(esperada)

Statistics
(Estatistieas)

Child development
(Desenvolvimento da aian~)

Psychobiology
(Psieobiologia)

Cognitive Psychology
(Psieologia Cognitiva)

72

31

15

50

Qual e 0 valor das freqiiencias esperadas?


(a) 32
(b) 50
(c) 42

(d) 25

298

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

9. Uma variavel X' e tambem denominada:


(a) Teste de aderencia
(b) Teste de independencia X'
(c) X' 4 x 2

14. 0 valor do V de Cramer e:


(a) 0.05
(b) 0.008
(c) 0.099
(d) 0.010

(d) X' 2 x 2

10. 0 valor do X' sera sempre:


(a) Posilivo
(b) Negativo
(c) Alto
(d) Depende da silua~ao

15. Observe a seguinte tabela de contingencia 2 x 2.


construida a partir de 150 participantes:
Bebedi4).I;iBebe'eaI~

II. A corre~ao de Yales e ulilizada algumas vezes por

Sente-se 6limo
Sente-se pc!ssimo

pesquisadores quando:
(a) 0 valor das celulas e enorme
(b) 0 valor das celulas e pequeno
(c) Os dados sao analisados a panir de uma tabela
de contingencia 2 x 2
(d) Altemativas (b) e (c)

70

50

30

80

A~~
57

84

162

Existe algo errado com os valores referidos. Na la


bela, os mlmeros nas celulas devem:
(a)
(b)
(c)
(d)

As questoes de /2 a /4 se referem iI seguinte salda par


cial. resultado de uma andlise X' sobre associar;iio entre
aforma do corpo e 0 tipo de esporte praticado:

Totalizar 150
Totalizar 100
Ser iguais
Ser analisados por urn X2 4 x 3

df (graus de Iiberdade)

22.305'

0.00796

21.516

Om055

12.162

0.00049

Value (Valor)
Pearson Chi-Square
(QuiQuadrado de Pearson)
Likelihood Ratio
(Razao de Verossimilhansa)
Linear-by-Linear Association
(Associa<;ao linear versus linear)

N of Valid Cases
(N dos casos Validos)

(c) 485
17. Para acharmos 0 tamanho do efeilo ap6s realizar
uma analise pelo X'. devemos:
(a) Converter 0 V de Cramer para 0 X'
(b) Converter 0 X' para 0 V de Cramer
(c) Elevar 0 valor do X' ao quadrado
(d) Converter 0 X' para 0 Z de Fisher

(a) 0,0004

(b) 0,05
(c) 0,01055
(d) 0.00796

Nio-aosI05O

210
62

150
52

Ela e denominada de:

0.09943

0.00796

a. Not assuming the null hypothesis. (a. Nao assumindo a hip6tese nu1a.)
b. Using the assymptotic standard error assuming the null hypothesis.
(b. Ulilizando 0 erro padrao assintotico assumindo a hip6tese nula.)

13. 0 valor do X' tern urn nive! de probabilidade de:

Allfdoso

19. 0 objetivo geral da utiliza~ao de uma analise X'


2 x 2 e descobrir se:
(a) Existe uma associa~ao significativa entre duas
variaveis categ6ricas
(b) Existe uma associa~ao entre duas variaveis
continuas
(c) Dois grupos de panicipantes diferem em duas
variaveis

(d) Nenhuma das altemativas


20. Se voce esta executando uma analise X' 4 x 4 e
descobre que as hip6teses nao estao satisfeitas.
precisa:
(a) Executar urn teste exato de Fisher
(b) Verificar 50 e possivel agrupar categorias
(c) Verificar se e possivel aplicar urn teste t
(d) Desistir da analise

Referencias

Cramer's V(V de Cramer)

12. 0 valor do X' e:


(a) 12.162
(b) 21,516
(c) 22,305
(d) 525

88

(b) Tabela de conlingencia 3 x 2


(c) Tlltlela do qui-quadrado I x 2
(d) Tabela do qui-quadrado 2 x 2

Pessimo emprego
6timo emprego

Si9.; Significancia
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 21.02.
a. (0 celulas (0.0%) apresentam valores esperados menores do que 5. A contagem minima esperada e de 21.02).

94

(a) 79
(b) 97

18. Observe a seguinte labela.

525

4r\;---

(a) Tabela de contingencia 2 x 2

Chi-Square Tests (Testes Qui-Quadrado)


Asymp. Sig. (2-sided)
(5i9. Assint6tica Bilateral)

~
. ,. \.:I~

Quais sao as freqiiencias esperadas pam as celulas?

(d) 5

299

16. Pergunta-se a 450 pessoas quais dos 5 tipos de


figuras de passaros escolheriam para colocar em
uma campanha "parem todas as guerras". 0 resul
tado e 0 seguinte:

BENNINGHOVEN. D. et al. Family representantion in relationship episodes of patients with a


diagnosis of bulimia nervosa. Psychology & Psychotherapy v. 76. n. 3, p. 323-36,2003.
BISH, A. et aI. The role of coping strategies in protecting individuals against long-term tranquilizer
use. Britishloumal ofMedical Psychology. v. 69, n. 2, p. 101-15, 1996.
HOWELL, D. C. Statistical Methods for Psychology. Boston: PWS-Kent. 2002. 5' ed.

Estatistica sem Matematica para Psicologia

Analise de Diferen~as entre Tres ou


Mais Condi~6es: ANOVA de urn Fator

9.1

301

Tamanho do efeito - a magnitude da diferenc;a entre duas condic;oes, denominada d, e


uma medida de efeito global 011 1] parcial.
Testes inferenciais - 0 teste estatistico denominado de Analise de Variancia (AN OVA)
avalia quae provavel e que qualquer diferenc;a entre duas condic;oes se deva a erro
amostral

Visualiza~ao

E facH

do delineamento

visualizar uma analise das diferenli=as efltre Ires ou mais grupos pela seguinte

representali=ao.

Panorama do capitulo

Tabela9.1
Nos capitulos anteriores, voce aprendeu a comparar duas condic;oes e a analisar relaciona
mentos entre duas variaveis. Como parte dessas analises, aprendeu a relatar tamanhos de efeito,
intervalos de confianc;a e niveis de significancia obtidos. Agora possui todos os recursos necessa
rios para executar analises mais complexas - a analise de tres ou mais condic;oes. Verificou como
comparar duas condic;oes (no Capitulo 6) e a comparac;ao de tres ou mais e uma extensao disso.
Em vez do teste t para duas condic;oes, usamos a ANOVA (para tres ou mais condic;oes). A ANO
VA e 0 teste parametrico equivalente ao teste t, para tres ou mais grupos. AN OVA um acronimo
para Analysis of Variance (Analise de Variancia). Como ocorre com 0 teste t, e necessario atender
certas condic;oes para se executar uma analise de variancia. Voce reconhecera condic;oes do seu
trabalho com 0 teste t.

Participanles independenles (entre gropos)

.:"
""iJ.i~~;,rJii'~,1.\,
.J?, n~J\;IU. CO""I~I

~~;ir'-'t~~::?rf;~~mx~'~~:N "J;'f~JaturAl'"

Al
PI
P2

PII
PI2

P21
P22

PIO

P20

P30

Os valores devem ser retirados de uma populac;ao com distribuic;ao normal. Conside
raremos isso caso os valores amostrais tenham uma distribuic;ao normal: quanta mais
participantes fizerem parte do estudo, maior sera a probabilidade de que a distribuic;ao
seja normal (veja Capitulo 2, pagina 62).
Deve haver homogeneidade da variancia - as variancias devem ser similares entre os dife
rentes grupos. 0 SPSSPW testa essa condic;ao. No caso da ANOVA independente. 0 teste
eo de Levene*; para a ANOVA de medidas repetidas, eo da razao maxima.
Na analise de medidas repetidas, existe uma restric;ao adicional, a da esfericidade. No
entanto, ha um ajuste utilizado quando essa condic;ao for violada. Esse ajustamento de
nominado de E (epsilon) de Greenhouse-Geisser, rotineiramente fomecido pelo SPSSPW.

A ANOVA relativamente robusta no que diz respeito a essas condic;oes. Pequenas violac;oes
(p. ex., ha dados normalmente distribuidos, um mesmo numero de valores em todas as condic;oes,
mas as variancias nao sao iguais) nao impedem que se siga adiante (a ANOVA dentre participantes
nao e robusta quanta 11 violac;ao da esfericidade; assim, 0 valor da estatistica F deve ser ajustada
para levar isso em conta). Se ha um pequeno numero de participantes, os dados sao assimetricos
e existe um numero diferente de valores em cada condic;ao, deve-se considerar a execuc;ao de uma
ANOVA nao-parametrica, apresentada no Capitulo 15.
Neste capitulo voce ira:



Isso e denominado delineamento de uma classificali=ao, porque temos urn fator - Fator A.

o fatorpossui Ires niveis: AI, A2 e A3. Podemos afirmarquee urn delinearnento entre grupos
porque cada participante aparece somente em urn nivel- por exemplo, 0 participante I (PI)
aparece somente sob a condili=ao A I.
A Tabela 9.2 e tambern delinearnento de urn fator' porque existe sornente urn (denorninado
de A). 0 fator A tern Ires niveis ou condili=Oes (A I, A2 e A3). Voce pode dizer que este deli
neamento e de rnedidas repetidas porque cada participante tern urn valor sob cada nivel - por
exemplo, PI aparece sob AI, A2 e A3, assim como os participantes P2 a PIO.

Tabela 9.2 Medidas repetidas (dentre participantes)


AI:

-~~~\'1~6~~gl~~i;~i.~~--:;.::;

PI
P2

PII
P12

P21
P22

PIO

PIO

PIO

Ganhar um conhecimento conceitual do que significa a analise de variancia


Aprender como analisar dados com usa de ANOVA parametrica
Aprender sobre uma medida global de efeito (1]2 parcial)
Aprender como apresentar graficamente os resultados

As analises de tres ou mais condic;oes inclui:


Estatfsticas descritivas, tais como medias, intervalos de confianc;a quando apropriado, me


diana, desvios pad roes; ilustrac;oes grMicas, tais como os diagramas de caixa e bigodes
I

Howard Levene (1914-2003).

Algumas vczes 0 dclineamento de medidas repetidas de urn falor c! coofundido com 0 de dois fateRS. ISSQ ooom: porque a repeti~o
dos participanles sobre todas as condiC;Qes c! tambem denominada de falor.

302

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

A ANOVA procura veriftcar se existem diferenr;as nas medias dos grupos. Faz isso de
terminando a media geral' e veriftcando 0 quao diferente cada media individual e da media
geral.
Existem dois tipos de ANOVA:

I. ANOVA independente (utilizada quando os participantes sao avaliados em somente


uma de vanas condi~6es, isto e, urn delineamento independente ou entre partici
pantes).
2. ANOVA relacionada (utilizada quando os participantes sao avaliados sob todas as
condi~6es, isto e, urn delineamento dentre participantes).
A ANOVA relaciollada ou illdependente testa se existe uma diferenr;a significativa entre
alguma ou todas as medias das condir;oes. comparando-as com a media global.
A ANOVA e urn teste t generalizado para mais de dois gropos, e, por isso, existe uma
rela~ao direta entre eles: de fato, se voce utiliza a ANOVA em duas condi~6es, os resultados
serao equivalentes aos que seriam obtidos pelo teste t.

9.2

As

varia~6es

entre gropos surgem de:

Efeitos dos tratamentos: quando executamos urn experimento ou estudo, estamos


procurando verificar se as diferen~as entre as medias sao grandes 0 suficiente para
serem de importiincia e se estas diferen~as refletem a manipula~ao experimental. As
diferen~as que refletem a manipula~ao experimental sao denominadas de efeitos dos
tratamentos.
Diferenr;as individuais: cada participante e diferente; cada participante se comporta
de modo diferente, mesmo quando enfrenta uma tarefa. Embora aloquemos parti
cipantes ao acaso a cada uma das condi~6es, algumas vezes podemos verificar, por
exemplo, que existem participantes mais motivados em uma condi~ao ou que tern
mais pnitica naquela situa~ao especifica. Assim, os gropos variam devido as diferen
~as individuais entre os participantes.
Erro experimental: muitos experimentos nao sao perfeitos. As vezes, 0 experimenta
dor falha ao dar a todos os participantes as mesmas instru~6es; as vezes, pode haver
varia~6es nas condi~6es em que uma tarefa e desempenhada. Em outras situa~6es, 0
equipamento utilizado pode falhar ou nao ter 0 mesmo desempenho dos demais, etc.
Diferen~as devidas a esses tipos de falhas contribuem para a variabilidade.

A variiincia entre grupos pode ser pensada como uma


escores mencionados, existe uma varia~ao entre as colunas.

Significado da analise de variancia

303

varia~ao

entre as colunas. Nos

A Amilise de Variancia (ANOVA), como 0 nome sugere, analisa as diferentes fontes de


varia~ao que podem ocorrer em urn conjunto de valores. Observe os valores da Tabela 9.3.
Voce percebe que os valores nao variam na primeira condi~ao. A variancia e maior na

9.2.2

segunda condi~ao e ainda maior na terceira.

9.2.1

Outra fonte de variiincia sao as diferen~as ou varia~6es dentro dos gropos. Isso pode ser
pensado como a varia~ao dentro das colunas. Voce pode ver pelos escores referidos que a
condi~ao I. AI, nao tern varia~ao intema; todos os participantes tiveram 0 mesmo desempe
nho, isto e, 9. A condi~ao 2, A2, tern uma pequena varia~ao. A condi~ao 3, A3, apresenta uma
varia~ao bern maior. Construfmos esses escores com 0 objetivo de ilustrar a varia~ao - nao
queremos executar uma ANOVA em dados como esses porque uma das condi~6es da ANO
VA (veja depois) e que as variiincias de cada gropo sejam iguais. Isso ocorre porque a formula
para a ANOVA toma as variiincias de cada gropo e calcula uma media. Somente tera sentido
utilizar tal media se os gropos tiverem varia~6es semelhantes.
As varia~6es dentro dos gropos surgem de:

Variancia entre grupos


A ANOVA procura por diferen~as entre as medias dos gropos. Quando as medias sao
bern diferentes, existe urn alto grau de varia~ao entre as condi~6es. Se nao existem diferen~as
entre as medias dos gropos, nao existe varia~ao.
Esse tipo de varia~ao e denominado variar;ao entre grupos - por exemplo, pode-se ver
que na Tabela 9.3 as medias variam de 9 ate 22,2.

Diferenr;as individuais: em cada condi~ao, mesmo que os participantes tenham a


mesma tarefa, ainda wo apresentar escores diferentes. Isso ocorre em virtude de
os participantes diferirem entre eles, isto e, possufrem habilidades e conhecimentos
em diferentes nfveis, QI e personalidade diversas, assim por diante. Cada gropo ou
cOlKli~ao deve apresentar variabilidade. Assim, os escores na condi~ao I, A I, nao sao
realistas.
Erro experimental: ja foi explicado anteriorrnente.

Tabela 9.3 Escores de participanles em Ires condi~Oes

Al "
9
9
9
9
9
X=9

AZ

A3

15
15
16
15
16
X= 15,4

21

~:.

25
17

Variiisao dentro do tercelro


"grope> (denatH6)

22
26
X= 22,2

Variancia dentro dos grupos

variasaoen;OS grupos (de 9 cite 22.2)

A media geml e a media das demais medi3.s - por exemplo. (MI + M2 + M3)/3.

9.2.3

Decomposi~ao

da variancia

Como voce sabe, 0 objetivo da ANOVA e descobrir se existem diferen~as entre as medias
de gropos, e isso e feilo pelo caIculo inicial da media geral, procurando verificar 0 quanto
cada media individual difere da media geral. A verifica~ao dessas diferen~as e feita por meio
da partir;iio da variancia, como explicado a seguir. A variabilidade nos escores, tanto dentro
dos gropos quanto entre os gropos, representa a variiincia total. Existem duas fontes que de

304

Christine P. Dancey & John Reidy

Estatistica sem MatemAtica para Psicologia

terrninam essa variabilidade total: as influencias entre os gropos e dentro dos gropos. 0 que
a ANOVA faz e particionar essa variabilidade total em duas componentes. Para fazer isso, e
preciso estimar por quanta variabilidade cada uma dessas componentes e responsavel.

D Variancia entre 05 grupos

IJ IlEI Variancia Total I

Variancia dentro dos grupos

I. Primeiro, a ANOVA calcula a media para cada urn dos tres gropos.
2. Entao ela calcula a media geral (as tres medias sao somadas e divididas por tres).
3. Para cada gropo separadamente, a varia~ao total de cada participante em
media do gropo e calculada. Essa e a variancia dentro dos grupos.
4. Finalmente, a varia~ao da media de cada gropo em
da. Essa e a variancia entre os grupos.

rela~ao

rela~ao

a media geral e calcula

Como voce pode ver, esses c31culos envoI vern a media geral. Por exemplo, a variancia
total de urn gropo descreve a distiincia entre a media geral eo valor mais distante (veja Figura
9.1). A variancia total pode ser particionada na variiincia devido a diferen~a entre as medias
dos grupos (variiincia entre os gropos) e na variiincia devido ao erro casual, isto e, ela nao e
manipulada pelo pesquisador (variiincia dentre participantes ou variiincia dentro dos gropos).
Isso e feito para cada urn dos grupos. Aproximadamente, 0 calculo final envolve encontrar
a media das variiincias dentro dos tres gropos, a variiincia entre os grupos e a variiincia total. A
estatistica Fe a razao da variiincia entre os grupos pela variiincia dentro dos grupos.

Quando conduzimos urn experimento, esperamos que a variiincia dentro dos grupos seja
minima porque assim a razao F sera grande. Quando a variiincia entre os gropos e bern maior
do que a variiincia dentro dos gropos, 0 valor F tambem e grande, e a probabilidade de obte-Io
por erro amostral, pequena.
Na Figura 9.1, voce pode ver que existe uma grande sobreposi~ao entre os grupos 2 e 3,
sugerindo que nao diferem muito entre si. 0 gropo I, entretanto, nao mostra sobreposi~ao
com os gropos 2 e 3. A linha cinza e a media geral (uma adi~ao das tres medias dividida por
tres). A distribui~ao dos valores a esquerda e do gropo I. A variiincia total para este gropo
come~a no limite inferior da distribui~ao e terrnina na media gera!. Isso pode ser dividido
(partido) na variancia entre os gropos (da media do gropo I ate a media geral) e na variiincia
dentro dos gropos (dos limites da distribui~ao ate a ll'lI!dia do grupo).
Voce deve verificar que as variiincias totais para os gropos 2 e 3 sao pequenas. As distiin
cias das medias individuais dos gropos 2 e 3 para a media geral (a variiincia entre gropos) sao
bern menores do que a distiincia da media do gropo I para a media geral.
Na Figura 9.2, voce pode ver que existe uma grande sobreposi~ao entre os tres gropos e
que nenhuma das medias individuais esta longe da media geral. 0 efeito e pequeno.
Na Figura 9.3, voce pode ver que existe uma area bern menor de sobreposi~ao e que as
medias dos gropos individuais estao mais distantes da media geral. 0 efeito e grande.
Quanto maior a variiincia entre gropos em rela~ao a variiincia media dentro dos gropos,
maior e a razao F. Isso nos mostra que uma (ou mais) das medias dos grupos e significativa
mente diferente da media geral. Nao nos inforrna que media difere significativamente, 0 que
requer testes adicionais.

Variiincia entre os gropos I variiincia dentro dos grupos = razao F


Como ja dissemos antes, 0 teste F apresenta uma rela~ao com
tiverrnos apenas duas condi~Oes: l = F.

_.--------

Variancia do
Grupo .1
._._._._.
______

Media

global
.,.

Media 1

- --v~riin~~ -e~tr; gr-;;p~s-


para

teste t. De fato, quando

Variancia
Grupo 2do

Media 2

Media 3

Grupo 1

Representaf)ao esquematica de um pequeno efeito na ANOVA de um fator_

)~ijM~i~~~;J

f~~;;~~~!i;J~P.i?~\~'.~

Projeto de tres grupos mostrando a decomposif)ao da variancia e a distancia da media


global.

N. de T. Os autores estao supondo uma ANOVA balanceada, isto 6, tados os grupos com 0 mesmo tamanho.

305

306

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

'~~.~

Tabela 9.4 Dados em Ires condi~oes de ingestao de alcoal

'>~~~i~~jA~~~~w~~;~~};:~~j ~~}~~!~~.-: :~Ift~::~ill~t~; ':~~:

--_....:...._--

5
10
7
3
5
7
II
2
3
5
6
6
l=70"
X= 5,83 b
DP= 2.69

, M~ias,d~~trt:s. !J~~~;
Representac;ao esquematica de um grande efeito na ANOVA de um fator.

Trinta e seis pessoas paniciparam de urn experimento para descobrir os efeitos do


alcool na habilidade de dirigir. Foram aleatoriamente associados a tres condieroes: pla
cebo (sem wcool), pouco alcool e muito alcoo!. A bebida nao-alc06lica parecia e tinha
o mesmo gosto que as demais. as panicipantes foram pesados e tomaram a quantidade
apropriada de bebida. Assim, 0 delineamento e independente (entre panicipantes). Uma
hora ap6s terem bebido, os panicipantes dirigiram em urn simulador por 10 minutos, e 0
numero de erros cometidos foi automaticamente registrado por urn computador. as dados
estao na Tabela 9.4.

MultoQ~,
8

10

11

15

II

17

II

l = 123.00

X= 10.25

DP= 3,05

[D) SPsSPW: exe(q~Q:~l~Or(tde,~um~I~_$sifica~o


-,

[~.] EXEMPLO: ALCOOL EHABILIDADE DE DIRIGIR

5
7
9
8
2
5
6
6
4
4
8
10
l=74.oo
X=6,17
DP= 2.33

'l=Total
bX=Media

1~IA~~'9.i ~~q~~~;;~:~~.i?~~f

razao para os escoresnasdlVe~s condlC;oes seremdl~tesentre51'?Col'\$!aei'e;.entao;ak


guns motives PE!los quais os partidpantE!5 PQdem vciriardentro decada;grulxl;':~; /::,', ',. ''
- '.;.'
'::...:', ~.'~, ::.:--~ . . ":";.;.,~' -.' -.
. ..;'. ,...,.~.~-~ ,.,:. ;,r~:O;~I.,"i\,.:-:.::.. ~-~~~,r.:,."~:i:".,.~.::.i~""'"::':~!;:_~"~ .r ..:.
..

307

.. 00..

'

'. :-,::

:~~'~:~,~i1~~~~~:~:~1:'Uf~~<~::: ~;~~F~~di~~i~.;: Z"'~:'</:; t" "

Entre com os dados de forma usual. Selecione Analyze (Analisar), Compare Means.
(Compare medias) e One-Way ANOVA (ANOVA de urn fator).

308

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Sera aberta a seguinte caixa de dialogos.

309

Marque 0 teste que voce deseja e clique em Continue (Continuar). Clique em Options
desejar as estatfsticas descritivas para cada condi~o.

(Op~6es) se

;:~A;~:

l;msJ;:
'>";~!r-{,

I "k"__

Se voce deseja testes post hoc, clique no botao Post Hoc (esses testes seriio explicados
na pagina 311).

.~ ",

__

,0

.,.,

Clique em Continue (Continuar) e, depois, em OK. Os resultados apareceriio na janela de


safda (Output window).

9.3

Estatisticas descritivas
A o~iio de estatfsticas descritivas fomece 0 desvio padriio e os limites de confian~a em
tomo da media. Veja Tabela 9.5.
As medias parecem ser diferentes, as variancias sao semelhantes. Vamos observar as medias
colocadas em urn gnifico, com os intervalos de confian~ em tomo delas, conforme a Figura 9.4.
Embora as medias do grupo que usou placebo (5,83) e do grupo com baixo consumo de
alcool (6,17) sejarn levemente diferentes, os intervalos de confian~ apresentam grande sobre
posi~iio. Assim, qualquer diferen~a entre as medias pode ser atribuida ao erro arnostral. Ainda
mais, os Iimites de confian~a para 0 grupo do placebo informam que temos uma probabilidade
de 95% de que a media populacional possa ser encontrada entre 4, 12 e 7,54; os Iimites de con
fian~a para 0 baixo consumo de alcool informarn que existe urna confian~a de 95% de que a
media populacional para esse grupo esteja entre 4,69 e 7,65. Assim, se executarmos novarnen
te 0 experimento com uma arnostra diferente, podemos encontrar as mesmas medias!
Tabela 9.5 Estatfsticas descritivas e limites de confian~a para as tIis condi~Oes de 31cool

:;i~{}:tJ1.~;;r~""~':r~:iPk."
Desvio padriio
Intervalo de confian9a

,--:'; ,- --,

5,83
2,69
4,12 -7,54

'~d~~~t;i~~~i.~~1iiti~
6,17
2,33
4,69-7,65

10,25
3,05
8,31- 12,19

310

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

14

Teste de Igualdade das variancias de Levene'


Variavel dependente: escore da habilidade de dirigir

12

5H

10 -1

.215

8-1

4-'

N=

12

12

Muito alcool

12

Placebo

Pouco alcool

_ _ Limites de confian~a de 95% em torno das medias.


A media para 0 grupo de alto consumo de alcool e bern maior do que as outras duas, mas,
mais importante, 0 intervalo de confianc;a desse grupo nao apresenta valores em comum com
os outros dois grupos. Assim, podemos verificar que qualquer efeito esta entre 0 grupo de alto
consumo de mcool e os OUlrOS dois grupos.
o teste estatistico para a ANOYA independente de uma c1assificac;ao e como segue:
. GR.l1lO ~ alinhadeintenk.PoiS~ as ~.~~;;~~;:~~,;

9.4

<:,rR2~ 33)~ 9:9Fk dOOLlenibre-se doCa'itulO 5 ncr"'li~'"r

":c':~'~lii~~airo:iiii qUadrcidopar:!nOstt.ir':a~::e:~

"vilrlAViiiS respon5.eispelas Vana~6es na outra vanavel.O ~~

q~ ~.um quatllac:ilt. Assjm.nessecaso pod~os simples.~~l


ao l"\ A interp~ d? ~~ parcial, ilessa ~?VA, ind~Cl.~31

."". e:tlng1r ~ deve a condl~o ak06l1ca.doJ)ll1

Souce (Fonte)
Corrected Model
(Modelo corrigido)
Intercept (Intercepto)
GROUP (Grupo)

Error (Erro)
Total
Corrected Total
(Total corrigido)

df2~'"
"
.,r~

33

.808

",'

Ij':~~t\O"' ..

~ ..;r-"'N."I" ""l'~'

Em artigos de peri6dicos, voce vera que 0 valor F (9,9), os graus de liberdade (2,33) e a
probabilidade associada (aqui p < 0,00 I) estao sempr~resentes no texto. E 6tH relatar 0 valor
global das diferenc;as entre os grupos. 0 SPSSPW calcula automaticamente 0 11 2 parcial no pro
cedimento da ANOYA. Aqui esse valor e igual a 0,375. Assim, 37,5% da variac;ao nos valores
na habilidade de dirigir podem ser creditados aquantidade de alcool consumida.
Temos agora uma pequena quantidade de informac;ao sobre os efeitos do a1cool nos erros
ao dirigir. Embora parec;a que as diferenc;as entre os grupos seja entre a alta quantidade de
alcool e os outros grupos (em vez de entre placebo e pouco alcool), a ANOYA nao executa
essas comparac;6es. Apenas nos informa que existe uma diferenc;a entre algumas (ou todas)
as condic;6es, mas e s6 ate esse ponto que chega. Podemos, entretanto, executar testes adicio
nais para confirmar nossa impressao de que as diferenc;as existentes sao entre 0 grupo de alto
consumo de alcool e os demais.
o procedimento de comparac;i>es multiplas e utilizado para verificar que media de grupo
difere das medias de outros grupos.

confian~a

de 95%

,.

Testa a hip6tese nula de que variancias dos erros sao iguais entre os grupos
Sig. = Significancia
a. Projeto: Intercepto+ GRUPO

6-1

limites de

311

Compara~6es

planejadas

Os pesquisadores normalmente podem predizer qual media ira diferir de outras medias, e
muitas vezes as comparac;6es sao planejadas antecipadarnente. Estas comparat;6es sao em geral
executadas depois que a razao F tenha mostrado que existem diferenc;as significativas entre duas
ou mais das medias. Embora existarn testes que realizarn as comparac;6es, recomendarnos que
voce as fat;a utilizando 0 teste t, por ser bern conhecido.

"

Type III Sum f


Squares (Soma des
Ouadrades do Tipe III)

)~f(gl)

Mean Square
(Ouadrados
Ml!dios)

72.583

9.915

0.000

1980.250/

1980.250

270.500

0.000

\0.891

145.167

72.583

9.915

0.000

0.375

241.583

33

7.321

2367.000\

36

145.167'

386.750

'!

1\

Sig. 1\

TI'

35

", ~ Iinh1l ErJ:p cont~m os v"lores rela(:ionile:tos ava",~a~oc:l~~W~;~idi~P;~.t;~~~~.

0.375

9.5

Contrale para multiplos testes


Freqiientemente os pesquisadores querem fazer vanas comparac;6es depois de executarem
a ANOYA de urn fator. Caso fac;a comparac;6es multiplas, enta~, como exposto na pagina 244,
voce aumentara a probabilidade de erro do Tipo I. Para poder considerar mUltiplos testes, voce
precisa ser mais criterioso para declarar urn resultado como estatisticamente significativo. Uma
forma de controlar 0 erro Tipo I quando se realizam multiplos testes e dividir uma probabili
dade aceitavel (p. ex., 0,05) pelo numero de comparac;oes que deseja fazer. Assim, se decidir
fazer tres comparac;oes dois a dois, devera dividir 0,05 par 3.0 calculo fomece urn valor de
0,016. Sera aceito como estatisticamente significativo urn resultado com uma probabilidade
que for igual ou menor do que esse valor. Isso evitara 0 aumento do erro do Tipo I.

312

9.6

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

media da condi~o I - media da condi~o 2


media dos desvios padroes

Testes post hoc


Algumas vezes os pesquisadores exploram diferen~as entre os varios conjuntos de me
dias sem te-Ias explicado em bases te6ricas. Existem muitos testes post hoc disponiveis.
Variam de acordo com 0 poder e a habilidade de se produzir urn erro do Tipo I, isto e,
diferem na extensao em que sao liberais ou conservadores (estes termos foram explicados
no Capitulo 4, pagina 160). Quando executa testes post hoc utilizando 0 SPSSPW, voce
nao precisa adequa-Ios ao erro do Tipo I (como explicado no paragrafo anterior) porque os
testes disponiveis ja foram formulados para levar isso em conta. Quando tiver de fazer urn
grande numero de compara~oes, deve escolher urn teste post que seja mais conservador.
Esse teste e 0 das diferen~as honestamente significativas (DHS) de Tukey. Urn teste que
tende a ser mais liberal e 0 das diferen~as menos significativas (DMS). Uma discussao
completa sobre esses testes nao e de abrangencia deste livro. Os interessados podem con
sultar HowelI (2002) ou procurar na Internet.
Se, em vez de urn pacote estatistico, executarmos 0 DHS de Tukey nos dados da pesquisa
sobre :Ucool, obteremos 0 seguinte quadro:
Multiple comparisons (Compara~oes Multip1as)
Dependent variable: SCORE (Escore da Vari~vel Dependente)
Tukey HSD (DHS de Tukey)
Mean Difference
(Diferen~as de
(I) condition
(condi~ao I)

placebo

low alcohol
(pouco alcoo!)

high alcohol
(mu~o ~lcool)

m~ias)

Std. Error
(Erro
padrao)

Sig.

-.3333

1.1046

.951

-3.0438

2.3771

-4.4167*

1.1046

.001

-7.1271

-1.7062

placebo

.3333

1.1046

.951

-2.3771

3.0438

high alcohol
(muito alcool)

-4.0833*

1.1046

.002

-6.7938

-1.3729

placebo

4.4167*

1.1046

.001

1.7062

7.1271

low alcohol
(pouco ~lcool)

4.0833*

1.1046

.002

1.3729

6.7938

(J)

condition

(condi~o)

low alcohol
(pouco ~lcool)
high alcohol
(muito alcoo!)

95% confidence
interval (lC
de950/0)
Lower Bound Upper Bound
(limite Inferior) (limite Superior)

313

5,83-10,25

media dos desvios padrOes

-4,42

media dos desvios padrOes

Assim, para as condi~Oes I e 3, 0 tamanho do efeito e:

media dos desvios padroes = 2,69 +


2 3,05 =2,87
tamanho do efelto
. _
_ -4";-,4::2::---"'~r"=lf~
__ = I 54
. _1.,,~~:~M1i',
0

2,87

'

Desse modo, as medias das condi~oes placebo e muito :Ucool diferem por 1,54 desvios
padrOes e isso e estatisticamente significativo. Se voce calcular 0 tamanho do efeito para as
condi~Oes de pouco e muito alcool, encontrara tambem uma diferen~a de 1,54. Os c:Uculos
do tamanho do efeito para os grupos que consumiram placebo e pouco :Ucoolleva a urn valor
de 0, 135. Assim, essas condi~Oes diferem por aproximadamente In de urn desvio padrao. Tal
diferen~a pode ser creditada ao erro amostral. Agora temos muitas informa~Oes para elaborar
o relat6rio. A analise pode ser escrita da seguinte forma:
Estat{sticas descritivas (Tabela X)! mostram que mais erros sao cometidos na condi~iio de alto
consumo de 8Jcool do que nas outras duas con~Oes. A an8Jise de variinda de urn Calor mostrou que
qualquer diferen~a entre condi~Oes e improv3vel de ter ocorrido apenas por erro de amostragem,
considerando a hip6tese nula seja verdadeira. F(2. 33) =9,92 e p < 0,001 representarn urn tarna
nho do efeito (11' parcial) de 0.375, mostrando que aproximadamente 38% da vari~o nos erros de
~iio podem ser creditados aos diferentes niveis de 8Jcool. Urn teste post hoc (Newman-Keuls)
confirmou que as diferen~ entre as condi~Oes I e 3. e 2 e 3 (ambas com d = 1,54) tern baixa proba
bilidade de terem ocorrido apenas por erro amosttal. Niio se observou diferen~ significativa entre as
condi~Oes pouco 8Jcool e placebo (d = 0.14)

*The mean difference is significant at the .05 level ("As diferen~s entre as m~ias sao significativas no nlvel de 50/0).
Sig. = Signifidlncia

Isso mostra que existe uma diferen~a estatisticamente significativa entre os grupos
que consumiram placebo e altas doses de alcool, bern como entre grupos que consumi
ram baixas e altas quantidades de :Ucool (em negrito na tabela). Obviamente, nao existe
diferen~as entre os grupos que consumiram placebo e pouco alcool. Agora voce pode
calcular 0 tamanho do efeito, d, para as diferen~as entre as duas condi~oes, exatamente da
mesma forma que fez para 0 teste t (veja pagina 222). Apenas para lembra-Io, a f6rmula
e a seguinte:

) VOC! deve remeter seus leitores l tabela na qual est30 as estatIsticas descritivas.

314

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

315

Exemplo da literatura:

habitos alimentares e a sindrome do intestino irritavel

Exemplo da Iiteratura:

desempenho cognitivo e uso do ecstasy

Esse e urn estudo sobre habitos alimentares e a sindrome do intestino irritavel (SII). Algumas
pessoas pensam que existe uma rela~ao entre disturbios alimentares (tais como bulimia e anorexia)
e a SII. Existem algumas pesquisas que indicam a coexistencia de disturbios alimentares e da do
en~a do intestino inflamado (OIl, de sintomas similares a SII, mas com causas conhecidas). Urn
questionario que mostra a extensao que uma pessoa apresenta de disturbio alimentar e denominado
de teste de habitos alimentares (THA). Sullivan e colaboradores (1997) aplicaram urn THA a quatro
grupos distintos: pessoas com SII, com disturbio alimentar, com 011 e sem qualquer disturbio. A
Tabela 9.6 mostra os resultados.

Or. Parrot e colegas (Parrot et aI., 1998) executaram urn estudo sobre desempenho cognitivo com
usuarios ocasionais de ecstasy. Trabalhos anteriores mostraram deficit de mem6ria em usuarios de
ecstasy. Parrot e colaboradores verificaram 0 desempenho em uma tarefa (velocidade de resposta,
tempo de rea~ao, tempo para a escolha, vigilancia numerica e lembran~a de palavras) em tres grupos
de jovens: 10 usuarios regulares, 10 usuarios novos e lOde um grupo de controle que nunca tomou
a droga. as pesquisadores analisaram os dados com a ANOVA de um fator eo teste de Duncan.~ So
mente duas das tarefas cognitivas geraram um efeito significafrvo: lembran~a imediata de palavras
e lembran~a retardada de palavras, como na Tabela 9.7.
As compara~6es por Duncan mostraram que a diferen~a entre os grupos de controle e novas usu
arios, bern como entre 0 grupe-controle e os usuarios regulares, tanto na lembran~a imediata quanta
retardada de palavras, nao podiam ser atribuidas ao erro amostral, considerando a hip6tese nula ver
dadeira. No entanto, a pequena diferen~a entre os grupos de usuarios novos e de usuarios regulares
pode ter sido obtida em virtude de erro amostral (sabemos disso porque Parrot e colaboradores nao
fomeceram 0 nivel de signifidincia para essa compara~ao; assim, estamos presumindo que ela seja
nao-significativa). Parece que uma diminui~ao cognitiva pode ocorrer em usuarios de ecstasy.

Tabela 9.6 Tabela de resullados por Sulivan e colaboradores (1997)


. -__ ". . . . . . , .

Grupo

- ~-

,','.""".-

~~' ' , : .. :

. ' '.:.:~ T

' i., . -'i. ,'- (,.

511
Oisturbio alimentar
011
Conuoles

- .,.. : . - . . ~".

" .' .

~...,.,,....,.

CGatlItJem'

.... -'-Fs:Qn,M~:. :~;-:;;~1~-iji.W'~~

48
32
31
28

16.67
56.7
10,4
9.6

13.6- 19.7

48.7 -64.8

8.0-12.9

7,2 - 12,0

Tabela 9.7 Tabela de resultados por Sullivan e colaboradores (1997)


.:".,: . -' -"- ..';i>,L',.
:....
":;-',Novos

:.
CoIilrOle - COmroIe ;-;UiAWlos

.
. '._ ,.EfelMsde!; '. -][._ ... i,.:::lIi,; ::if/ .1

,.:

.... ,

Pode-se perceber de imediato que, como esperado, as pessoas com disturbio alimentar
obtiveram valores muito mais altos do que qualquer outro gropo no THA. Oe fato, se esse nao
fosse 0 caso, nao seria urn teste valido.
as intervalos de confian~a mostram que 0 grupo com a doen~a inflamat6ria do intestino
e 0 grupo de controle se sobrepi'ie, indicando que nao existem diferen~as importantes entre
esses dois gropos no THA. a grupo com SI!, entretanto, nao somente tern a media amostral
mais alta do que esses dois gropos, como tambem 0 intervale de confian~a nao se sobrepi'ie a
eles, sugerindo que qUaiquer diferen~a (descontado 0 gropo do disrurbio a1imentar) sera entre
os gropos com SII e OIl gropo de controle. a intervalo de confian~a para 0 gropo de distlirbio
alimentar nao se sobrepi'ie a nenhum dos outros grupos.
Sullivan e colaboradores relataram 0 seguinte: "Quando os quatro gropos foram com
parados utilizando ANaYA (F 93,7217) e urn teste de comp~Oes mUltiplas utilizando a
diferen~ menDs significativa (OMS)4 com uma significancia de 5%, tanto 0 gropo de distlir
bio a1imentar quanto 0 gropo da SII tiveram urn escore THA significativamente mais alto do
que os gropos com OIl e de controle".

.:.,1. ... '....

...t..

".,,; .'-;'

, ... , . :

,."":':~:,:;,, . . -~ .. ~. . <~:.';~~, ~~;.~;;1;:::


Lembran~aimediata

8,2

1.6

5.3

1.1

6.5

1.3

p<O,OOI

p<O,OI

p<O,05

6,9

1.6

4,6

1.0

5.1

1,4

p<O,OI

p<O.OI

p<O.OI

de palavras

Lembran~aretardada

de palavras

9.7

ANOVA de medidas repetidas


A ANOVA de medidas repetidas consiste em medir urn grupo de participantes em todas
as condi~6es. Voce lembrara que, para 0 delineamento independente, dividimos a variancia
em duas partes:
Yariancia entre grupos
Variancia dentro dos grupos
Quando executarmos um delineamento de medidas repetidas, podemos dividir a varian
cia dentro dos grupos da seguinte forma:
I. Variabilidade devido a diferen~as individuais
2. Yariabilidade devido ao erro aleatorio
Variancia entre grupos
Variancia por diferen~as individuais
. . . . o Variancia residual

, 0 DMS e urn dos testes POSI hoc disponiveis no SPSSPW.

'Outro lipo de tcste de comp~ao post hoc.

316

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Podemos medir (I) porque, no delineamento de medidas repetidas, cada participante e


testado sob todas as condi~oes. Dessa fonna, podemos comparar 0 resultado global de cada
participante (a soma dos escores em todas as condi~oes) com os escores globais dos demais
participantes.
Voce provavelmente lembrara que a razao F para 0 delineamentode grupos independen
tes e 0 seguinte quociente:

F=

']i~;~~!~~:

Escolha 0 menu Analyze (AnaJisar), depois General Linear Model (Modelo Linear Ge
raJ) e Repeated Measures (Medidas Repetidas).

variancia entre grupos


variancia dentro dos grupos

A variancia entre grupos e composta dos efeitos dos tratamentos, das diferen~as indivi
duais e do erro experimental. No delineamento de medidas repetidas nao existe varia~ao entre
grupos devido a diferen~as individuais, pois cada participante em cada grupo e unico e 0 mes
mo. A f6nnula para 0 calculo do F no delineamento de medidas repetidas leva em considera~ao
o fato de que cada parlicipante e 0 mesmo em cada condi~ao. A varia~ao devida a diferen~as
individuais (que podemos medir) e removida tanto do numerador quanto do denominador da
equa~ao. Isso tende a fornecer urn teste estatfstico mais sensfvel e com mais poder:

variancia entre os grupos


variancia dentro dos grupos - diferen~as individuais

Vamos agora imaginar uma situa~ao na qual executamos novamente 0 experimento


com a dosagem de alcool como delineamento de medidas repetidas. Isso significa que a
mesma pessoa executara a tarefa nas tres condi~oes (placebo, pouco alcool, muito alcool).
Nao faria sentido para uma pessoa fazer os tres testes em urn unico dia - cada participante
poderia ser testado, por exemplo, na segunda-feira durante tres semanas. Para evitar efeitos
de pratica ou ordem, as condi~oes devem ser contrabalan~adas. Esse e urn delineamento
mais poderoso do que 0 experimento entre participantes, pois cada participante serve como
seu pr6prio controle. Vamos considerar que os resultados, no entanto, sao os mesmos (veja
Tabela 9.8).
Tabela 9.8 Dados dos participantes sob Ires condi~lies alco61icas

t&_~~;~~~~~~;m~iJ~
1
2
3
4
5

6
7
8
9
10
II
12
1:

5
7
9
8
2
5
6
6
4
4
8

10
7
3
5
7
II
2
3
5
6
6
70

A analise inicia da mesma fonna que


cas descritivas e i1ustra~Oes grMicas.

10
8
9
II
15
7
II
8
8
17

10

11

74

123

experimento entre participantes com as estatfsti

317

Aparecera a seguinte caixa de dialogos.

318

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Mude 0 "Fator I" para urn nome adequado - neste caso vamos chama-Io de alcohol (al
cool) - e insira 0 numero de nfveis. Como temos placebo, baixo e alto consumo, 0 numero de
niveis e igual a tres. Entao, pressione 0 botao Add (Adicionar). Clique em Define (Definir).

.. .OS n!veis

Verifique se voce marcou 0 botao Compare main effects (Comparar efeitos principais).
Tern entao uma escolha de tres testes: LSD, Bonferroni ou Sidak. Sugerimos a utiliza~ao do
teste de Bonferroni, que faz a corr~ao para 0 numero de testes pareados que voce esta execu
tando (veja testes multiplos na pagina 244).
Voce pode entao verificar as op~es que voce determinou. Voce solicitou descritivas,
tamanho do efeito, medias e poder. Os intervalos de confian~a sao fomecidos automatica
mente. Pressione Continue (Continuar). 0 prograrna retomara a caixa de dialogos Repetead
Measures (Medidas Repetidas) da ANOVA. Pressione OK. Os resultados estarao impressos
na janela de saida.

sao

;tJ~

.
9.7.1

~ ~ ~ .u. ;. ..v.-. ~ .. ;,u .~ !:'I'u. ~


loIlJO'AIIB/ d,.I"'I"I'llllJ1ll1!lMlilJlil~1

-1

1:.....

~:.

-_os

:I~~~~!~~~--"
~;.~ .

:,r"'F
. - .= -

l!~-:-_::
-il ",::=,":::...
}E: .::;
7m

...

2m

11

:: ::

~.-~?
r"-""sv_
S9*-1I:IoI:

~
--_._--_._---

rr----

e-S~~~
-----

~O'...... J.. _ _ ,.j..._:

'-:"'-'''--''.'~~.-..

B6~fen'oni

~ecionado .

rl,.d.'::
r

-~

'P
;"",.)asserlio

..r

Esfericidade
Na ANOVA, panimos do pressuposto de que todas as condi~oes sao independentes. No
delineamento de medidas repetidas, entretanto, utilizamos os mesmos panicipantes em cada
uma das condi~5es, 0 que significa que deve existir alguma correla~ao entre as condi~6es.
Se voce possui tres condi~5es, existem tres correla~6es bivariadas: condi~6es I versus 2, 2
versus 3 e I versus 3. N6s supomos que estas tres correla~6es sejam similares. Assim, assu
mimos que todas as covariancias sao similares. A suposi~ao de esfericidade e valida quando
a variancia da diferen~a entre as medias estimadas para urn par de gropos e a mesma de qual
quer outro par. Como a satisfa~ao dessa suposi~ao e improvavel e viola~6es da esfericidade
sao prejudiciais a acuracia da ANOVA, recomendarnos que voce interprete rotineiramente a
linha Greenhouse-Geiser da saida do SPSSPW. Em outras palavras, e melhor assumir que a
suposi~ao nao foi satisfeita. 0 Greenhouse-Geiser trabalba (como voce pode ver no pr6ximo
item) ajustando os graus de liberdade. Essa corr~ao na f6nnula faz 0 nosso teste mais rigo
roso, de modo que, se a hip6tese de esfericidade foi violada, ha uma possibilidade menor de
nao aumentar 0 erro do TIpo I.

d~Sujeit~)

Mova as variaveis que estao a esquerda, uma de cada vez, para a caixa Within-Subjects
Variables (Variaveis dentre Sujeitos) a direita. No exemplo,placebo e movido primeiro para a
posi~ao numero I; low (baixo) e movida para a segunda posi~ao, e high (alto), para a terceira.
Isso representa os tres niveis. Entao, pressione Options (Op~5es).
(Ignore os bot5es Between-Subjects Factor(s) e Covariates, pois nao nos interessam nes
sa analise.)
sera abena a seguinte caixa de dialogos.

319

9.7.2

Saidas da ANOVA
Colocarnos em negrito a Iinha de interesse. Os graus de liberdade parecem estranhos
na saida do SPSSPW, uma vez que sao fomecidos com varias casas depois da vfrgula. Os
graus de Iiberdade em vez de serem apresentados como 2 e 22 (como na linha da suposi~ao
de esfericidade satisfeita) sao apresentados como 1,833 e 20,164. Nao utilize tal precisao
quando for relatar os graus de liberdade e tiver utilizado a linha do Greenhouse-Geiser;
arredonde os resultados para valores inteiros, nesse caso, 2 e 20. Aqui voce ve que F =
10,83 e p =0,001. 0 tarnanho do efeito arredondado para cima e 50%. Desta fonna, 50% da
varia~ao nas medidas dos valores da habilidade de dirigir podem ser creditadas as diferentes
quantidades de alcool ingeridas.

320

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

321

Pairwise Comparisons (Comparaes aos Pares)


Measure: MEASURE 1 (Medida: Medida 1)
Measure: MEASURE_l (Medida: Medida_l)

Sig.

7 .583

10.826

.001

.496

1.833

79.194 10.826

.001

.496

145.167

2.000

72.583

10.826

.001

.496

145.167

1.000

145.167

10.826

.007

.496

147.500

22

6.705

Greenhouse
Geisser

147.500

20.164

7.135

Huynh-Feldt

147.500

22.000

6.705

Lower 80und
(Limite Inferior)

147.500

11.000

13.409

df (gl)

Sphericity Assumed
(Esfericidade
Assumida)

145.167

Greenhouse
Geisser

145.167

Huynh-Feldt
Lower 80und
(Limite Inferior)
Error Sphericity Assumed
(ALCOHOl)
(Esfericidade
Erro (Mccoll
Assumida)

Sou rce (fonte)


ALCOHOL
(A1cool)

Mean
Difference (I - J)

/0" ean
Sq are
(Qua rado
da l!dial

Type III Sum


of Squares (Soma
dos Quadrados
do Tipo III)

11

das Ml!dias)

Std. Error
(Erro Pad,ao)

Sig.*

2
3

-.333
-4.417*

.924
1.196

1.000
.011

-2.939
-7.790

2.272
-1.043

1
3

.333
-4.083'

.924
1.033

1.000
.007
.-

-2.272
-6.997

2.939
-1.170

1
2

4.417'
4.083'

1.196
1.033

.011
.007

1.043
1.170

7.790
6.997

Sio. = Sionificancia

(Diferen~s

Based on estimated marginal means. (Baseado nas ml!dias marginais estimadas.)

, The mean difference is significant at the .05 level. (A diferen~ entre as ml!dias e significativa no nivel de 5%.)

a. Adjustment for multiple comparisons: Bonferroni. (Ajustado para compara~oes multiplas: Bonferroni.)
Sig. = Significancia

:},Iotli'ue:~'~~:KO(11

''''im!l:o<...~"., "",~.~.lr~R,: . . :.. :,. c::

9.7.3

(I) FAGORI (J) FAGORl


(Fator lUll
(Fator llJll

95% Confidence Interval for


Difference' (Intervalo de Con
de 95% para a Diferen~)
Lower 80und Upper Bound
(Superior)
(Inferior)
fian~a

A tabela compara cada condit;:ao com qualquer autra, fomecendo a diferent;:a das medias
entre cada par, 0 erro padrao. 0 valor da probabilidade e os Iimites de um intervalo de 95% de
confiant;:a em tome da diferent;:a das medias.
A primeira linha compara I (placebo) com 2 (pouco alcool). A diferent;:a entre as medias
e 0,333. Isso nao e estatisticamente significativo por qualquer criterio. Esta linha compara
ainda 0 nivel I (placebo) com 0 nivel3 (muito alcool). A diferent;:a aqui e de 4,417, eo nivel
de probabilidade associado e 0,0 II. Continue e interprete 0 restante da tabela voce mesmo.

Testes post-hoc
Esta e a safda obtida com a opt;:ao Compare main effects (Comparar efeitos principais),
utilizando Bonferroni.
Estimates (Estimativas)

Measure: MEASURE 1 (Medida: Medida_l)

FAGOR1 (Fator 1)
1
2
3

Mean (Ml!dia)

Std. Errar
(Erro Padrao)

5.833
6.167
10.250

.777
.672
.880

95% confidence interval


(lntervalo de Confian~ de 95%)
Upper Bound
Lower Bound
(Limite Superior)
(Limite Inferior)
4.123
4.687
8.313

7.543
7.646
12.187

A tabela acima mostra 0 valor da media para as condit;:5es mais os limites de urn intervalo
de confiant;:a de 95%.

relat6rio e semelhante ao da ANOVA de gropos independentes. Dessa vel, entretanto,


podemos canstatar:
Uma ANOVA de medidas repetidas foi executada. As hip6teses de nonnalidade, homagenei
dade da variancia e esfericidade foram satisfeitas. Os resultados mostraram ser improvavel que as
difereneras entre as condier6es tenham se originado somente em virtude do erro amostral (F(2, 22)
= 10,83 com p =0,00 I); um tamanho do efeito global de 0,496 (11 2 parcial) mosttou que aproxima
damente 50% da variaerao nos erros cometidos ao dirigir podem ser creditados aos diferentes nfveis
de alcoo!. Comparaer5es emparelhadas mostraram que a diferen<;a entre as condierOes de placebo e
pouco alcool roi minima ( 1%), enquanto a diferenera entre as condierOes de pouco e muito alcool foi
grande (11 2 parcial de 59%); F( I, II) = 15,6, P =0,002. Pode-se conduir que os participantes que
consumiram muito alcool cometeram mais erros ao dirigir do que quando consumiram placebo. 0
intervalo de confianera moslrou que a diferen<;a entre as medias populacionais tem probabilidade de
95% de serencantrada na intervalo 1,18 a 1,05.

322

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Resumo

Exemplo da literatura:

confian~a e acuracia de testemunhas oculares

Kebbell e colaboradores (1996) executaram dois experimentos sobre confianera e acuracia de


testemunhas oculares. Alguns estudos constataram que testemunhas (de acidentes e outros inci
dentes) eram mais acuradas em seus relatos quando estavam absolutamente certas de que tinham
lembrado os eventos corretamente do que quando nao tinham certeza. Outros pesquisadores, en
tretanto, verificaram que existe uma pequena correlaerao entre acuracia e confianera. Kebbell e
colaboradores argumentaram que os pesquisadores nao prestaram muita atenerao a dificuldade do
item - por exemplo, e muito mais facil lembrar que, em urn determinado incidente, a pessoa era
homem ou mulher do que a cor do cabelo.
Kebbell e colaboradores fizeram dois experimentos que mediam 0 quae confiante os parti
cipantes estavam em relembrar informaeroes sobre urn pequeno filme em vfdeo e quae acurada
eram. Primeiro estabeleceram uma escala de itens que c1assificaram como faceis, medios ou diff
ceis. A primeira parte do estudo e que nos interessa aqui. Como declararam no artigo, a pergunta
"que miisica a mulher estava cantando?" era facil; "0 que tinha no prato ao lade do aparelho de
TY?" era media, e "0 que tinha atras do vidro de pimenta localizado na cozinha?" era diffcil. as
pesquisadores precisavam estar seguros de que tinham categorizados os itens corretamente, pois
nao teria utilidade c1assificar a pergunta "que miisica a mulher estava cantando?" como facil se
nenhum participante pudesse lembra-Ia. Dessa forma, os participantes deviam lembrar as ques
toes faceis mais acuradamente do que as c1assificadas como diffceis, se os itens tivessem side
categorizados corretamente.
A variavel dependente e 0 niimero de respostas corretas em cada uma das tres categorias. A
variavel independente e a dificuldade do item com tres nfveis (facil, medio, dificil). Isso pode ser
representado como na Tabela 9.9.
a teste estatfstico mais apropriado e, pois, a ANOVA de urn fator com medidas repetidas, que
Kebbell e colaboradores utilizaram. as pesquisadores fizeram alguns testes adicionais e relataram
o seguinte:

A ANaYA perrnite testar diferem;as entre tres ou mais condier6es.


A ANaYA e apropriada para dados extrafdos de populaeroes norrnais; e urn teste pa
rametrico.
A ANaYA fomece a chance de se obter uma diferenera entre algumas ou todas as
condieroes por erro de amostragem.
Testes post hoc mostram as condieroes que diferem de forma signiticativa de qualquer
outra condierao.
a 11' parcial e urn coeticiente de correlaerao que pode ser utilizado como uma medida
do efeito na ANaYA. Ele nos permite saber, ~ termos percentuais, quanta variancia
nos valores da variavel dependeme pode ser atribufda a variavel independente.

Exerdcios para

PI
P2

P3
P.

PI
P2
P3
P.

'.:

Tabela 9.10

Dados dos grupos de laborat6rio da manha, tarde e noite

",?~

PI
P2
P3
P4
P5
P6
P7
P8

ooicif
PI
P2
P3
P.

SPSSPW

Entre com os dados da Tabela 9. IO no SPSS. Faera a analise com 0 uso da Olle Way (que esta
no menu Compare Means - Comparar Medias) e obtenha os resultados. Faera urn teste post hoc.
Copie as partes importantes da safda. Interprete os resultados em termos do experimento.
Na universidade local, os estudantes foram alocados aleatoriamente a urn de tres gropos
para a realizaerao de urn trabalho de laborat6rio - urn gropo matutino, urn vespertino e urn notur
no. Ao final da sessao, eles responderam a urn questionlirio para verificar 0 quanto lembravam
do que haviam feito. Existem difereneras entre os gropos? Se existirem, qual a direerao?

I1ustracrao do delineamento utilizado por Kebbel e colaboradores (\996)

: .~ : ~ :;~:~~~t!~}~~. t?:~i!~~:~~:1t-~~:.

Exercicio 1

A ANOVA de uma classificacrao com medidas repetidas mostrou urn efeito significativo quanto ao
nivel de dificuldade da questiio sobre 0 numero de respostas correlas (F(2, 88) =591,37, p < 0,0001. Os
testes adicionais (p < 0,005) confinnaram que essas diferencras eslavam na direcrao apropriada; as questoes
fliceis tinham uma probabilidade maior de acertos do que as medias, e estas do que as dificeis. Isso nova
mente validou as categorias de dificuldade dos itens.
Tabela 9.9

323

P9

PIO

15
10
14
15
17
13
13
19
16
16

. ;. ;',,;

~~
PII
PI2
PI3
PI4
PI5
PI6
PI7
PI8
PI9
P20

..,:,.,.;.",

14
13
15
14
16
15
15
18
19
13

'Nolte"
P21
P22
P23
P24
P25
P26
P27
P28
P29
P30

13

12

II

II

14

II

10

10

Exercicio 2
Existem evidencias indicando que fumar maconha leva a perda de mem6ria de curto
prazo e reduerao da habilidade na execuerao de tarefas simples. Sete estudantes fumantes
que normalmente nao consomem maconha foram solicitados a responder questoes diffceis
de aritmetica sob quatro condier6es diferentes. Na condierao I, fumaram uma mistura de ervas
que pensavam ser maconha. Na condi~ao 2, fumaram uma pequena quantidade de maconha,
ampliada para uma media e grande quantidade nas condieroes 3 e 4 respectivamente. as estu

324

Christine P. Dancey & John Reidy

Estatfstica sem Matemiltica para Psicologia

dantes foram solicitados a fumar sozinhos. Para evitar efeitos de pnitica, foram feitos quatro
testes diferentes, todos com 0 mesmo grau de dificuldade. Para evitar os efeitos de ordem e
fadiga, foi contrabalanceada a ordem de aplicaao dos testes. Os resultados sao os seguintes.

t:f~~~~~~~?~~~.~:~t~~'~~;~:
~:;.;~.~~~ka4~~i~~t; .;. ?;:::~,~,
19
14
18
15

2
3
4
5
6
7

16
8
17
16
14
10
9

II

12
II

7
II

3
5
7
8

(a) Existem diferen~as significativas entre os tres


grupos de estudantes quanto ao ENCANTA
MENTO
(b) Existem diferen~as imponantes entre os tres
grupos, mas nao sao significativas
(c) Nao existem diferen~as imponantes ou esta
tfsticas entre os tres grupos
(d) Nenhuma conclusao pode ser obtida
3. A seguinte tabela tambem faz pane da saida do
SPSSPW:

II

Test of Homogeneity of Variances


[Teste de Homogeneidade das Vari~ncias)

ENJOYMENT (ENCANTAMENTO)

Entre com os dados no SPSSPW e execute uma ANOYA de medidas repetidas. Relate os
resultados de maneira apropriada.

se isso se devia ao estilo de ensinar do professor ou


ao conteudo das aulas, que apresentavam algumas
diferem,as. Para seu projeto de final de curso, Ali
ce convenceu tres professores de estatistica a dar a
mesma aula (os dois anteriores mais 0 prof. P. D.
Caju), mas com seus estilos de ensino habituais.
Estudantes do I" ano foram alocados aleatoria
mente a tres aulas de uma hora cada. No tinaJ das
aulas, foram avaliados sobre 0 conteudo apren
dido (CONHECIMENTO) e sobre 0 gosto pela
aula (ENCANTAMENTO). Alice entao U1ilizou a
ANOVA de urn fator para analisar os resultados.
Essa e a safda fomecida pelo SPSSPW para 0 EN
CANTAMENTO:

QUESTOES DE MULTIPLA ESCOLHA


I. A ANOVA pararm:trica e independente de urn fator
e uma generaJiza~ao do:
(a) Teste t emparelhado
(b) Teste t independente
(c)

8
8
6
17
16
9
5

2. Qual e a conclusao mais apropriada?

"I;

(d) r de Pearson
As questaes 2 a 4 se baseiam na seguinte informafiio:

Alice, uma estudante do 3" ano, notou que ela e


seus amigos aprendiam mais estatfstica quando as
sistiam aula com a Madame Pecan do que com 0
professor A. Mendoin. Nao conseguiam determinar
AAOVA
ENJOYMENT (ENCANTAMENTO)
Sum of Squares
(Soma dos Quadrados) df (gl)
Between Groups
94.4308
2
(Entre Grupos)
Within Groups
13798.1240
143
(Dentro dos Grupos)
Total [TotaO
13892.5548
145
Sig. = Significancia

Mean Square
(M~ia dos Quadrados)

Sig.

47.2154

.4893

.6141

96.4904

Sig. = Signific~ncia

o que voce pode concluir?


(a) As variiincias dos grupos sao significativa
mente diferentes
(b) As variiincias dos grupos sao simi lares
(c) As variancias sao heterogeneas
(d) Nenhuma das aJtemativas
4. Aqui estao os resultados para 0 questionano sobre
CONHECIMENTO que os estudantes completa
ram ap6s a aula de uma hora.
ANOVA

KNOWLEDGE (CONHECIMENTO)

Sum f Squares
(Soma dos Quadrados) df (gl)
Between Groups
110.3100
2
(Entre grupos)
Within Groups
144
1482.9689
(Oenlro dos grupos)
Total [Total)
146
1593.2789

Descriptive5 (Oescritrvas)

Mean (M4!dia)

Descriptives (Deseritivas)
ENJOYMENT (ENCANTAMENTO)
(M~ia)

1.00

62.9063

2.00

61.2041

3.00

62.9091

Qual e a conclusao mais adequada?


(a) Existem diferen~as signiticativas entre os
tres grupos de estudantes quanto ao CONHE
CIMENTO: especificamente. 0 grupo do
professor P. D. Caju aprendeu mais do que os
outros dois grupos
(b) Existem diferen~ signiticativas entre os tres
grupos quanto ao CONHECIMENTO; especi
ficamente. 0 grupo da madame Pecan aprendeu
mais do que 0 grupo do professor A. Mendoin
(c) Existem diferen~as signiticalivas entre os tees
g~s quanto ao CONHECIMENTO: espe
cificamente. 0 grupo do professor A. Mendoin
aprendeu mais do que os oulros dois grupos
(d) Nao existem diferen~as significalivas entre os
tees grupos quanto ao CONHECIMENTO
5. 0 valor F e 0 resultado da:
(a) Variiincia dentro dos grupos I variancia entre
os grupos
(b) Variiincia entre os grupos I variiincia dentro
dosgrupos
(c) Variiincia entre os grupos x variancia dentro
dosgrupos
(d) Variiincia entre os grupos + variiincia dentro
dos grupos
6. A rela~ao entre a estatistica F eat e dada por:

(a) t' F
(b)
(c)
F
(d) r' = t

F'=t

e=

(M~ia

Mean Square
dos Quadrados)

Sig.

55.1550

5.3557

.0057

10.2984

Sig. = Significancia

KNOWLEDGE (CONHECIMENTO)

Mean

325

Mendoin

10.5781

Pecan

10.0408

caju

12.3235

A.

7. 0 professor A. Mendoin eSla examinando a


diferen~ entre os escores dos tres grupos de
participanles. Se os grupos mostram homogenei
dade das variiincias, quer dizer que as variiincias
dos grupos:
(a) Sao semelhanles
(b) Nao sao semelhantes
(c) Sao exatamente as mesmas
(d) Sao totalmente diferentes

326

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

8. Diferem,as entre grupos, que resultam de nossa


manipula"ao experimental sao denominadas de:
(a) Diferen"as individuais
(b) Efeitos dos lratamentos
(c) Erro experimental
(d) Efeitos dentre participantes

(a)
(b)
(c)
(d)
(e)

12. A hip6tese de esfericidade significa que:

9. a senhor Nozes esta pensando se deve utilizar urn


delineamenlo relacionado ou niio-relacionado para
urn de seus estudos. Como ja visto. existem van
tagens e desvantagens em ambos. Ele tern quatro
condi,,5es. Se em urn delineamenlo relacionado uti
lizar 10 participantes. quantos precisaria para urn
delineamento niio-relacionado?
(a) 40
(b) 20
(c)

10

(d) 100

10. Diferen"as individuais denlro de cada grupo de


participantes sao denominadas de:
(a)
(b)
(c)
(d)

Efeitos do tratamento
Erro entre participantes
Erro dentre participantes
Vieios individuais

11. a Dr. P. D. Caju aloca aleatoriamente cada urn dos


96 participantes a cada uma de quatro condi,,5es.
Como e muito consciencioso. inspeciona meti
culosamenle os histogramas e outras estatisticas
descritivas e verifica que os dados estao distri
buidos norrnalmente. Para analisar as diferen"as
enlres as quatro condi,,5es. 0 teste mais apropriado
a ser utilizado e:

A ANaVA de urn fator


a teste t
a r de Pearson
Depende da situa"iio
A ANaVA de medidas repetidas

(a) As variancias de todas as amostras devem ser


similares
(b) As variancias dos escores de diferen"as po
pulacionais devem ser os mesmos para duas
condi"iies quaisquer
(c) As varifincias dos escores de todas as diferen
"as populacionais devem ser similares
(d) As variiincias de todas as amostras nao devem
ser similares
13. Se. em uma analise de variancia. voce obtem urn
eta parcial de 0,52. quanto das varia"iies nos es
cores da variavel dependente pode ser atribuido a
variavel independente?
(a) 9%
(b) 52%
(c) 25%
(d) 27%
14. a calculo de quanto da variancia tOlal se deve ao erro
em uma manipula"ao experimental edenominado:
(a) Calculo da variiincia
(b) Parti"fio da variiincia
(c) Produ"ao da variiincia
(d) Resumo da variancia

Mean Difference
(I-J) Difer~as
das Medias (I-J)
Employment
Category
(I) Tipo de trabalho
(I)

Clerical
(Administrativo)

Custodial (limpela)

Manager (Gerencia)

Sig.

Lower
(limite (Inferior)

Upper
(limite (Superior))

Custodial (Limpela)

-$3,100.35

$2,023.76

0.276

-$7,843.44

$1,642.74

Manager (Gerencia)

-$36,139.26

$1.228.35

0.000

-$39,018.15

-$33.260.37

Clerical
(Administrative)

$3.100.35

$2.023.76

0.276

-$1,642.74

$7.843.44

Manager (Gerencia)

-$33,038.91

$2,244.41

0.000

-$38.299.13

-$27.778.69

(Administrativo)

$36,139.26

$1,228.35

0.000

$33.260.37

$39,018.15

Custodial (Limpela)

$33,038.91

$2,244.41

0.000

$27.778.69

$38,299.13

The mean difference is si9nificant at the .05 level.


Si9 = Si9nificancia
*

Std. Error
(Erro Padrao)

Category
Tlpo de trabalho

Clerical

(*

Qual e a afirrna"ao mais adequada?

A diferem;a entre as condif;Oes e represenlada por:

Adiferen~a entre as medias e significativa no nivel de 5%.)

(a)
(b)
(c)
(d)

F(2. 12) =7,82. P =0.007


F(I, 6) =7.82. P =0,030
F(2. 12) 7.82. P 0,030
F(I. 6) = 7,82.p = 0.031

17_ Qual e a resposta mais apropriada? a tamanho do


efeito e:

16. Examine a seguinte saida. que esta relacionada


com uma ANaVA de medidas repetidas com tres
condi,,5es. Suponha que a esfericidade foi violada.

(a) 5,7%
(b) 57%
(c) 0.5.1%
(d) 5%

Test of Within-Subjects Effects (Teste dos Efeitos Dentre Sujeitos)


Measure: MEASURE - 1 (Medida: Medida_1)
Source (Fonte)
FACTOR 1
(Fator 1)

Error
(FACTOR 1)
(Erro - Fator 1)

Type III Sum of


Squares (Soma dos
Quadrados do Tipo III)

df (gil

Mean Squared
(Quadrado
da Media

542.857
542.857
542.857

2
1.024
1.039

271.429
529.947
522.395

542.857

1.000

542.857

416.476
416.476
416.476

12
6.46
6.235

34.706
67.762
66.796

416.476

6.000

69.413

Sphericity Assumed
(Esfericidade assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
(Limite inferior)
Sphericity Assumed
(Esfericidade assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
(Limite inferior)

Sig.

T'l2 Parcial

7.821
7.821
7.821

0.007
0.030
0.029

0.566
0.566
0.566

7.821

0.031

0.566

Sig. = Significancia
As questaes 18 a 20 estiio relacionadas asaido abauo,
que mostra uma ANaVA de medidas repetidas com tres
niveis. Considere que a esfericidade foi violada.
Test of Within-Subjects Effects (Teste dos Efeitos dentre Sujeitos)
Measure: MEASURE- 1 (Medida: Medida- 1)

95% Confidence
Interval (Intervalo de
Confian~a de 95% )

(J) Employment
(I)

Que grupos diferem significativamente urn do outro?


(a) Somente as ocupa,,5es administrativas e de
limpeza
(b) Somente de limpeza e de gerencia
(c) Apenas de gerencia e administrativas
(d) acupa,,5es de gerencia e administrativas mais
geri!ncia e limpeza

15. A seguinle saida esta relacionada a urn teste post


hoc. ap6s a ANaVA de urn fator:

Multiple comparisons (Compara~6es multiplas)


Dependent Variable: Current Salary (Variavel Dependente: Salario Corrente)
Tukey HSD (OMS de Tukeyl

327

Source (Fonte)
COND

Error
(COND)

Sphericity Assumed
(Esfericidade Assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-80u nd
(Limite Inferior)
Sphericity Assumed
(Esferiddade Assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-80und
(Limite Inferior)

Sig. = Significancia

Type III Sum of


Squares (Soma dos
Quadrados doTopo III)

df (gl)

Mean Squaref
(Quadrado
da Ml!dia)

5ig.

521.238
521.238

2
1.073
1.118

260.619
485.940
466.251

5.624
5.624
5.624

0.019
0.051
0.049

521.238

1.000

521.238

5.624

0.055

556.095

12

46.341

556.095
556.095

6.436
6.708

86.406
82.905

556.095

6.000

92.683

521.238

328

Christine P. Dancey & John Reidy

Pairwise comparisons (Compara~6es Pareadas)


Measure: MEASURE_l (Medida: Medida 1)

M~ias(l-J))

Std. Error
(Erro Padrao)

Sig.'

2
3

-11.857
-3.429

3.738
1.494

0.058
0.184

-24.146
-8.339

0.431
1.482

11.857
8.429

3.738
4.849

0.058
0.339

-0.431
-7.514

24.146
24.371

1
2

3.429
-8.429

1.494
4.849

0.184
0.399

-1.482
-24.371

8.339
7.514

(I) COND

(J)COND

1
2
3

Mean
Difference H)
(Diteren~s das

10

95% Confidence Interval


for Difference (Intervalo de
Contian~a de 95% para a Diteren~a)
Lower Bound
Upper Bound
(umite Interior)
(umite Superior)

Panorama do capitulo

Based on estimated marginal means (Baseado em estimativas das m~ias marginais)


a. Adjustment for multiple comparisons: Bonferroni (a. Ajuslamento para compara~Oes multiplas: Bonterroni.)
Sig. = Significancia
18. Qual e a sentenl<a mais adequada?
(a) F(2, 12) =0 5,62, p =0,020
(b) FO, 6) =5,62, p =0,050
(c) F(2,12)=o5,62,p=O,049
(d) F( 1,6) = 5,62, p =0,055
19. Qual das seguintes condil<Oes mostra a maior dife
renl<a?
(a) I e 2
(b) 2 e 3
(c) I e 4
(d) Sao identicas

Analise de Variancia com


Mais de uma Variavellndependente

No Capitulo 9, introduzimos um dos testes estatisticos mais utilizados na psicologia atual


mente, a analise de variancia (ANOVA). Neste capitulo pretendemos:
Ensinar uma extensao da ANOVA. uma c1assifica~ao que inclui duas ou mais variaveis
independentes
- a primeira ANOVA tera duas variaveis independentes entre participantes
- a segunda ANOVA tera duas variaveis independentes dentre participantes
- a terceira tera uma variavel independente entre e uma dentre participantes
Explicar, com todos os delineamentos, como a variancia e alocada entre as varias condi
~6es e como podemos avaliar 0 grau de intera~ao entre as variaveis independentes
IIustrar como podemos decompor os efeitos de intera~ao para encontrar precisamente
como uma variavel independente interage com a outra - tal analise edenominada efeito
simples

20. Considerando que a hip6tese nula seja verdadeira,


a diferenl<a entre as condil<Oes I e 2 tern:
(a) 5% de chance de surgir como
do erro amostral
(b) 6% de chance de surgir como
do erro amostral
(c) 19% de chance de surgir como
do erro amostral
(d) 20% de chance de surgir como
do erro amostral

conseqiiencia
conseqiiencia
conseqiiencia
conseqiiencia

Referencias
HOWELL, D. C. Statistical Metlwdsfor Psyclwlogy. Boston: PWS-Kent, 2002.5'" edn.
KEBBELL, M. R.. WAGSTAFF, G. F., COVEY, J. A.. The influence of item difficulty on the
relationship between eyewitness confidence and accuracy. British Journal ofPsychology. v. 87, p.
653-63, 19%.
PARROT, A. C. at aI. Cognitive perfonnance in recreational users of MDMA or "ecstasy": evidence
for memory deficits. Journal ofPsychopharmacology. v. 12, n. I, p. 79-83,1998.
SULLIVAN, G. et aI. Eating attitudes and the Irritable Bowel Syndrome. General Hospital Psychiatry.
v. 19, p. 62-4,1997.

10.1

Introdu~ao
No Capftulo 9, explicamos como podemos utilizar a ANOVA para testar diferen,.as entre
grupos quando temos mais do que duas condi,.Oes de variavel independente. Urn dos aspectos
mais uteis da ANOVA e pennitir analisar os efeitos de duas ou mais variaveis independentes
sobre uma variavel dependente (VD) em uma analise. Alem disso, podemos utilizar a ANOVA
para verificar se existe urn efeito de intera,.ao das duas variaveis na variavel dependente, isto
e, se uma variavel independente pode comportar-se de forma diferente nas duas condi,.6es
da segunda varilivel independente. Deve-se notar que a ANOVA nao esta restrita a apenas
duas variaveis independentes. Voce pode, se desejar, ter tres ou mais variaveis independentes.
Entretanto, quanto mais variliveis independentes. mais diffcil se toma interpretar qualquer
efeito de interatividade que possa existir entre elas. Uma vez demonstrado como interpretar
intera,.6es, voce percebeni 0 quae dificil efaze-Io se houver muitas variliveis independentes.
Urn exemplo simples deve ilustrar 0 que a ANOVA fatorial oferece. Suponha que con
duzimos urn estudo para investigar 0 efeito do lilcool e da cafefna na habilidade de dirigir.
Podemos fazer varias previS6es para esse experimento:
I. Altos nfveis de lilcool diminuem a capacidade de dirigir.
2. Altos nfveis de cafefna podem melhorar a habilidade de dirigir devido ao efeito es
timulante.

330

Estatistica sem Matematica para PsicoJogia

Christine P. Dancey & John Reidy

Sugerimos anterionnente que a ANaYA pennite analisar mais do que duas variaveis in
dependentes em uma unica analise. Na Figura 10.2, voce pode verilicar como seria dividida
a varia~ao se tivessemos Ires variaveis independentes. Fica aparente, a partir deste diagrama.
que existem bern mais fontes de varia~ao a se identilicar. De fato, com a adi~ao de uma unica
variavel independente dobramos 0 numero de fontes de varia~ao que precisamos analisar.
Assim, a complexidade da analise cresce dramaticamente quando inclufmos mais variaveis
independentes (compare as Figuras 10.1 e 10.2 com 0 diagrama de pizza da Se~ao 9.2.3).
Em tais delineamentos, toma-se muito mais dificil interpretar as intera~oes entre todas as va
riaveis independentes. Assim. para aqueles que estao pensando em realizar urn experimento
sobre os efeitos de idade, genero, c1asse social, ansiedade e inteligencia na habilidade de
praticar rapel e analisar os dados ulilizando uma ANQVA, e melhor repensar a ideia. Tal ana
lise e complicada e seria muito diffcil de interpretar. Existem formas melhores de se analisar
tais dados, por exemplo por meio de regressao multipla (veja Capitulo II), embora existam
problemas mesmo fazendo isso.
Devemos ressaltar que a parti~ao da variiincia ilustrada nas Figuras 10.1 e 10.2 representa
o caso de urn delineamento entre participantes apenas. Quando tivermos qualquer variavel
independente dentre participantes na analise, as coisas licam urn pouco mais complicadas.
Falaremos desse delineamento mais adiante neste capftulo.

3. Dada a antiga premissa de que 0 cafe auxilia a mantenno-nos alertas, podemos pre
ver que urn aumento de cafefna reduz a intluencia do aleool na habilidade de dirigir.
As duas primeiras previsoes sao denominadas de efeitos principais. Referem-se ao
efeito global de cada uma das variaveis independentes sobre a variavel dependente: 0
efeito total do aleool na habilidade de dirigir, nao importando a quantidade de cafeina
ingerida, e 0 efeito total da cafeina na habilidade de dirigir, a despeito da quantidade de
alcoo] consumida. A terceira hip6tese, que preve uma rela~ao entre alcool e cafeina que
pode alterar a habilidade de dirigir, e denominada de interafiio entre as duas variaveis
independentes. Assim, temos tres previsoes nesse estudo, e a ANaYA permite testar todas
em uma unica analise.

10.2

Fontes de

varia~ao

Como 0 nome do teste sugere, utilizamos a ANaYA para analisar todas as possiveis
fontes de varia~ao no estudo. Quando mensuramos os participantes em alguma variavel
dependente, temos varia~oes nos escores. Algumas dessas varia~6es sao atribufdas a va
rilivel independente: algumas, ao efeito de intera~ao entre as variaveis independentes, e
algumas outras, em conseqiiencia de erros. a prop6sito da ANaYA e tentar identilicar
quanto da varia~ao total nos escores pode ser atribufda a cada urn desses fatores (veja
Figura 10.1). A Figura 10.1 mostra que, quando temos duas variaveis independentes. 11
varia~ao na variavel dependente pode ser atribufda as duas variaveis separadamente e 11
intera~ao entre elas. Qualquer varia~ao nao-atribufda a urn desses fatores e denominada de
varia~ao devida ao erro.
No Capftulo 9, explicamos que a ANaYA de urn fator mostra 0 grau pelo qual a varia
~ao entre condi~oes e maior do que a varia~ao dentre ou dentro das condi~oes. Explicamos
que, se a varia~ao entre condi~oes for consideravelmente maior do que a varia~ao dentro das
condi~5es, conclui-se que as diferen~as entre gropos nao se deve ao erro amostral. Sugerimos
que, em tal situa~ao, a diferen~a entre gropos pode provavelmente ser atribufda a manipula
~ao da variavel independente. A 16gica de analisar mais de uma variavel e semelhante a da
ANaYA de urn fator. Essencialmente, dividimos (ou particionamos) a variiincia total nas
representadas pelas duas variaveis em separado e na intera~ao entre elas. Entao, comparamos
essas fontes de variiincia com as da variiincia dentre (dentro) as condi~oes (ou erro). Essas
analises permitem verilicar a possibilidade de que urn efeito em particular tenha ocorrido
apenas devido ao erro amostral.

Erro

VI1
VI2

2e3

Intera~ao

Intera~ao

1e3
Intera~ao

1e 2

VI3

Diagrama de pizza sobre as varias fontes de varia"ao na variavel dependente para um


estudo com tres variaveis independentes.

[~, ).'Ati~i4ad.e, tO~f' ; ; . .


..,

;'':--.7.~~''_',::'"'

-.:; .....

~~>~.:;' .. ,~ . ,...

r~;.

"

~::'i!,:.t,~ .

..'; . "y'~j~ ~e vOc~;podedeS~~biir as~arias fontes de variancia quando tlver quatro variaveis
indepehde~!~;(Vilria~i$A; a.C eO):..
" .
;..".
.

331

. . ".~:

; , . ' r ' ",

.:.. . '

,.

VI1

Intera~ao

VI2

Diagrama de pizza sobre as fontes de varia"ao na variavel dependente para um estudo


com duas variaveis independentes.

10.3

Delineamentos apropriados para uma ANOVA fatorial


Existem varios delineamentos apropriados para uma ANaYA fatorial. A caracteristica
principal de tais projetos e apresentarem apenas uma variavel dependente e duas ou mais va
riaveis independentes. Neste capitulo explicaremos as caracterfsticas de tres tipos de ANOYA
fatorial:

332

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Tabela 10.3 Aloca~ao de participanles as condi~oes em um projelo enlTe participanles (com alcool/
sem alcool) e um dentre participantes (com cafefnalsem cafefna)

Duas vari3.veis independentes entre participantes


Duas variliveis independentes dentre participantes
Duas vari3.veis independentes entre participantes e urna variavel independente dentre
participante

;':.:i;~J;'.:r-~.;;.:l!.~,. :;:'.:.. .\'.:~]%:;,;;~:;L~G:~~m,~gf~~;g:.c:.~;~:.;~j:.; ..'~.~~..


Sem caferna

Todas as analises descritas neste capitulo tern variaveis independentes com duas condi
<roes. Por exernplo, no estudo de a1cool com cafeina rnencionado anteriormente, podernos ter
duas condi<roes de a1cool (sern alcool e alto nfvel de lilcool) e duas condi<roes de cafeina (sern
cafeina e com alto nivel de cafefna). Se esse estudo for urn delinearnento cornpleto entre
participantes, a aloca<riio dos participantes as condi<roes sera algo sernelhante ao i1ustrado
na Tabela 10.1.
Tabela 10.1

Aloca~ao

333

Com cafelna

PI
P2
P3

P4

PI
P2
P3

P4

P5
P6

P5
P6

de participanles as condi~iies em urn projelo entre participanles

.:'-~,~:~~~:?;.i~.~~~~:rii~t~;J~~~~~~~i~t~rg _~~te;tJ~t~:Y:(!~;.~~~f.::.!~l~~.~~~~:.!j
P4

P5

P6

PI

Sem caferna

P2
P3

...
Com caferna

PIO

PII

PI2

P7

P8
P9

Podernos conduzir esse rnesrno estudo por rneio de urn delinearnento total mente dentre
participantes. Em tal estudo, cada participante deverli tornar parte em todas as quatro condi
<rOes (veja Tabela 10.2).
Tabela 10.2
<':":.::;-.:
Sem caferna

Aloca~ao

de participantes as condi~Oes em urn projeto entre participantes

:.: ;: . ".

;:~':~:/~ ~~~~~:~~~:i~~~l1~~~~~~~tIf~~t7~?S;'!' :.-~~~:.


PI
P2
P3

Com caferna

PI
P2
P3

_com~,:::,:"",:"I.:::':',~."

PI
P2
P3
PI
P2
P3

Finalmente, podernos ter urna varilivel independente, digarnos 0 a1cool, como a variavel
entre participantes e a outra, cafeina, como a varilivel dentre participante. A aloca<riio dos
participantes as condi<roes em tal estudo 6 ilustrada na Tabela 10.3.

10.4

Terminologia da ANOVA
Seguindo a Iiteratura, vernos os projetos da ANOVA expressos como urnaANOVA 2 x 2
ou urna ANOVA 3 x 4 ou lalvez urna ANOVA 3 x 2 x 2.
Tal terminologia sirnplesrnente informa quantas variaveis independentes foram usadas e
quantas condi<roes existem em cada urna.
No prirneiro exernplo, existern duas variaveis independentes, cada urna com duas
condi<rOes.
No segundo exernplo, existern duas variaveis independentes, uma com tIts condi<rOes
e a outra com quatro.
No ultimo exernplo, existern tIts variaveis independentes, urna com tIts condi<rOes e
duas com duas condi<rOes.

Duas VIs, cai:la u~cdmd~Cond~

.c\o.,\,.

. ."

2x2ANOVA
3x4ANOVA

.-

."coc_.

;.::~c;:~

3 x2x2ANOVA

T~vkd~~.f~.~~~~~~'
Como voce descreveria a seguiote anlilise: urna ANOVA 4 x 4 x 2 x 2 x 2 x 5 x 6? A
resposta oficial para a questiio 6 que ternos sete variaveis independentes, urna com seis con
di<r oes , urna com cinco condi<rOes, duas com quatro condi<rOes e tres com duas condi<roes.
Entretanto, descreveriarnos tal analise como urna loucura porque seria extremarnente difi
cil interpretar uma intera<riio entre todas essas variaveis independentes. Lernbre, explicamos
que 0 aumento do nurnero de variaveis independentes aurnenta dramaticamente 0 mirnero de
fontes de varia<riio no projeto. Etalvez por essa raziio que raramente nos deparamos com urn
trabalho publicado no qual mais do que tres variaveis independentes forarn analisadas por
meio de urna ANOVA.

334

Devemos notar, ainda, que, com muitas variaveis independemes em uma ANOVA, testa
mos muitos efeitos diferentes contra muitas hip6teses nulas diferemes. Assim, devemos ter
em mente a grande probabilidade de cometer urn erro do Tipo I. Urn exemplo pode ajudar a
entender isso. Suponha que voce conduziu urn estudo com quatro variaveis independentes (A,
B, C e D). Se executou uma ANOVA com esses dados, testou 15 efeitos diferentes contra as
respectivas hip6teses nulas (efeitos principais de A, B, C e D mais II intera"oes entre essas
variaveis independentes). Fazendo isso, voce aumentou drasticamente a taxa de erro de con
junto, ampliando, assim, a probabilidade de se cometer 0 erro do Tipo I. Devemos. ponamo,
apelar para 0 born-senso quando decidimos analisar dados de pesquisas complicadas.

Tabela 10.4 Numero de erros cometidos ao dirigir per eada panieipante em quatro situa~oes (sem
alcool e sem eafefna, eom alcool e sem eafefna, sem alcool e eom eafefna, e, eom alcool e eom eafefna)
::~

" ; ;.l .

~},1i +:.::::.~~~. '~" i:<:~~~';

r"!

Sem caferna

[~).At:iVidade 10.2....<~,;.<;;_: ..
:..>besereva as,~uintesa~Ii~':':-:'f}:"""~<

10.5

Uma ANOVA 6 x 2
Uma ANOVA 3 x 3 ><3 .'
Uma ANOVA 4 x 2 x 4 x 2
Uma ANOVA 2 x 2 x 2 x 2 x 2

Duas variiiveis independentes entre participantes


Vamos voltar ao experimento ja delineado anterionnente envolvendo nfveis de alcool e
cafefna quanto a habilidade de dirigir. Alguns dados artificiais do experimento sao apresen
tados na Tabela 10.4.

10.5.1 Analise inicial


Como foi feito com a ANOVA de urn fat or, e preciso rodar alguns procedimentos de
analise explorat6ria de dados para verificar se as hip6teses da ANOVA estao satisfeitas. Al
gumas analises estatfsticas iniciais (media, desvio padrao e intervalos de confian"a de 95%)
sao apresentadas nos dados da Tabela 10.4. Podemos ver, a partir dessas analises, que existem
poucos erros de dire"ao na condi"ao sem alcool e sem cafefna (media =5,75) e muitos erros
na condi"ao com alcool e sem cafefna (media = 21,25). As medias para as condi"oes sem
alcool e sem cafefna e com alcool e com cafeina estao entre esses dois extremos (medias de
7.92 e 9,00, respectivamente). Podemos ver tambem que os desvios padroes para todas as
condi,,<ies sao bern semelhantes e estar razoavelmente confiantes de que a hip6tese de homo
geneidade da variancia nao foi violada com esses dados.
pr6ximo estagio da nossa analise explorat6ria de dados deve envolver a obten"ao de
algumas representa"iies graficas a fim de detenninar se os dados estao ou nao normal mente
distribuidos. Podemos verificar isso por meio de histogramas, diagramas de caule e folhas e
diagramas de dispersao. Vamos considerar que gerarnos esses diagramas e estamos satisfeitos
com a inexistencia de viola"iies das hip6teses relacionadas ao uso de testes parametricos
(Iembre: a ANOVA e urn teste desse tipo). Assim, podemos continuar a analise dos dados
utilizando aANOVA.

";;:~~~"-,,

-< .. :

9
10
8
6
II

II
11

10
3
10
X =7.92'; DP =3,32
IC de 95%: 5,81 - 1~2

Com caferna

(a)
(b)
(c)
(d)

335

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

t;;~,:',

28
19
22
16
21
25
27
17
21
19
20
20
X= 21,25; DP= 3,72
IC de 95%: 18.89 - 23,61

II

6
8
X = 5.75; DP = 3,28
IC de 95%: 3.67 - 7,82

14
10
8
11
14
8
5
8
X 9,00; DP 3.07
IC de 95%: 7,05 - 10,95

'X=media

[~1:~111i~~'1~'4'~~~' w";~~,.J"~,~~k",,

10.5.2 Fontes de varia~o


Como isolamos as fontes de varia"ao quando existe um delineamento completamente
entre grupos? Se voce olhar para as predi,,<ies, podera ver que ja identificamos tres possfveis
fontes de varia"ao:

1. 0 efeito principal devido ao alcool


2. 0 efeito principal devido

acafefna

3. A intera~ao entre esses dois fatores


Existem outras fontes de varia"ao? Se voce pensar no Capitulo 9, deve lembrar que, para
o delineamento de urn fator entre participantes, existiam duas fontes de varia"ao: entre os
grupos e dentro dos grupos (ou errol. Isto e, temos uma varia"ao devido ao fatorentre os gru
pos e outra devida as diferen"as entre os participantes dentro de cada condi"ao. Nos projetos
de duas variaveis independentes, devemos ainda levar em considera"iio as variancias entre os
participantes e dentro de cada condi"iio. Conseqiientemente, como no projeto de urn fator,
temos uma fonte de varia"iio adicional relacionada com a varia"iio dentro dos grupos ou erro.
Nesse caso, temos as seguintes fontes de varia"ao:
Varia"iio devido ao efeito do alcool na habilidade de dirigir (efeito principal do liIcool)
Varia"ao devido ao efeito da cafefna na habilidade de dirigir (efeito principal da ca
fefna)

336

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Variac<ao devido a interac<ao entre esses dois fatores


Variac<ao devido a diferenc<a entre os participantes dentro de cada condic<ao (variac<ao
do erro)
Quando voce executa uma ANOVA apenas entre gropos, obtem uma saida do SPSSPW
semelhante a expressa a seguir para os dados de alcool e cafeina.
Se observar esses resultados, notara que temos a mesma informac<ao ao lade de cada en
trada, como a ANOVA apresentada no Capitulo 9. Para cada fonte de variancia, temos a soma
dos quadrados, 0 grau de Iiberdade (gl), os quadrados medios, 0 valor F e 0 valor p (signifi
cancia do resultado). Voce deve lembrar que, para calcular 0 valor F, dividimos os quadrados
medios de cada variancia relacionada as variaveis independentes pelo quadrado medio do
erro. Lembre que, no Capitulo 9, explicamos que 0 quadrado medio e simplesmente uma me
dida da variancia. Assim, nessa analise voce pode nolar que, para 0 efeito principal do alcool
quando dividimos 0 quadrado medio (825,02) pelo termo erro (1,26), obtemos a estatistica
F, que vale, neste caso, 73,27. Voce pode, ainda, ver que 0 efeito principal da cafeina tern urn
valor F associado de 58,38 (623,52 + 11,26) e para a interac<ao existe urn valor F associado de
27,09 (305,02 + 11,26)

ANALISE DE VARIANCIA UNIVARIADA


Between-Subjects Factors (Fator entre Sujeitos)

alcohol
(.lleool)

1.00
2.00

caffeine
(cafeina)

1.00
2.00

Value label
(legenda)
No alcohol
(Sem .lleool)
Alcohol
(Com.lleool)
No caffeine
(Sem cafeina)
Caffeine
(Com cafeina)

N
24
24

337

Voce pode perceber a partir das tabelas de saida, que temos uma probabilidade de 0,000
associadas aos efeitos principais tanto do alcool quanto da cafeina e tambem com a interac<ao
(Iembre que urn valor p =0,000 no SPSSPW significa que p < 0,00 1).1550 nos informa que, se
a hip6tese nula fosse verdadeira, seria altamente improvavel se obterem os efeitos principais e
a interac<ao observada. 0 que isso tudo significa? Esempre uma boa ideia tentar entender 0 que
aconteceu nesse projeto experimental complexo ilustrando as medias graficamente. Com base
nas recomendac<Oes de Loftus (1996), geramos urn diagrarna de barras de erro para os dados
desse exemplo, apresentado na Figura 10.3. Voce deve perceber que 0 SPSSPW nao apresenta
Iinhas s61idas para ligar os pares de medias. Fomos n6s que as incluimos como ajuda para urn
melhor entendimento da natureza da interac<ao entre as duas variaveis independentes.
A Iinha superior na Figura 10.3 representa a habilidade de dirigir sem cafeina, e a de baixo,
com cafeina. Podemos imediatamente perceber, a partir desse grafico, que 0 efeito principal
devido a cafeina parece indicar que a habilidade de dirigir e melhor quando tomamos uma dose
de cafeina (Iembre-se de que esses dados sao inventados, nao tente fazer isso em casa). Exis
tern mais erros de direc<ao na condic<ao sem cafeina (Iinha superior) do que na condic<ao com
cafeina (Iinha inferior). Os pontos nos finais a direita nas duas Iinhas representam a condic<ao
com alcool, e os dois a esquerda, a condic<ao sem a1cool. Podemos ver aqui, embora isso nao
seja tao 6bvio (desenhamos gnificos com Iinhas para que isso se tome mais 6bvio, veja Figura
1004), que existem mais erros ao dirigir quando exisle a ingestao de a1cool do que 0 contrario.
Talvez a melhor maneira de visualizar os efeitos principais quando existe urn mlmero igual de
participantes em cada gropo seja marcar urn ponto no meio de cada linha para 0 efeito principal
da cafeina (veja Figura 1004). A diferenc<a vertical entre esses dois pontos representa a di ferenc<a
real entre as medias das condic<Oes com cafeina e sem cafeina, ignorando a varilivel indepen
dente alcool. 1550 representa 0 efeito principal da vanavel independente cafeina. Para a variavel
independente a1cool, voce deve marcar urn ponto no meio dos dois finais das Iinhas a direita
e 0 mesmo para as linhas a esquerda. A diferenc<a vertical entre esses dois pontos representa a
diferenc<a real entre as condic<Oes com consumo de alcool e sem consumo de alcool, ignorando
a variavel independente cafeina 1550 representa 0 efeito principal da varilivel independente

24
30
24

:~

'5 25

.'"
0

Tests of Between-Subjects Effects (Testes dos Efeitos entre Sujeitos)


Dependent Variable: Driving Errors (Vari.lvel Dependente: Erros ao Dingir)

e~ 20

Type III Sum of Squares


(Soma dos Quadrado
do ripe III)

df
(gl)

Mean Square
(Quadrados
Ml!dios)

Sig.

Partial TJZ
(,,' parcial)

Corrected Model
(Modelo Corngido)

1753.562'

5B4.521

51.914

.000

.7BO

Intercept (Intercepto)

57B6.021

57B6.021

513.880

.000

.921

825.021

825.021

73.274

.000

.625

caffeine (cafelna)

623.521

623.521

55.377

.000

.557

alcoholcaffeine
(.lleoolcafeina)

305.021

305.021

27.090

.000

.381

Source (Fonte)

alcohol (.lleool)

e
E 15

."c:

495.417

44

Total

8035.000

48

Corrected Total
(Total Corrigido)

2248.979

47

Error (Erro)

QI

'C

11.259

~ 10
a.
<fl
U'l

en

QI

'C

Cafeina

!:d

I
I

Sem cafeina

Com cafeina

Com alcool

Sem alcool
A1cool

a. R Squared = .780 (Adjusted RSquared = .765) (R' =0.780 IR' ajustado =0.765))
The row that includes the asterisk is for the interaction. (. A linha que inclui 0 asterisco ~ de intera~ao.)
Sig. = Significancia

Diagrama de barras de erro para as condi~6es com alcooVsem alcool e com cafeinalsem
cafeina.

338

30

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

10.5.3

:~

'5
o

~ 20

;p~~~~;;

\; \Efliito ,.".

..Oi

"JI~i'ic;ipal da,'
',l'Jlfelna ,

."

...'5

tt :'.<..... ''''I'''''
,,_.
,~ c~~;;>~.~

E 10

..e

I
I

."z

.... -----O

----------,

__

Sem alcool

Sem cafeina
Com cafeina
Media dos
principais
efeitos

Com alcool

Grafieo de linha sobre 0 principal efeito entre eafeina e alcoo!.

alcool. Lembre-se de que voce pode utilizar essa tecnica visual simples somente quando tiver
amostras do mesmo tamanho. Se houver urn numero diferente de participantes em cada grupo,
tera que calcular as medias dos efeitos principais e representa-Ias no grafico.
Como interpretamos a interalfao? Se voce tern uma interalfao significativa, podeni 11 prin
cipio interpreta-Ia graficamente. A Figura 10.5 mostra que a diferenlfa entre as duas condilfoes
da cafefna sem alcool e muito menor do que a com 3lcool. Parece que a cafefna exerce urn
grande efeito moderado na condilfao com 3lcool. A interpretalfao altemativa indica que, quan
do nao existe cafefna (observe a diferenlfa vertical entre 05 dois finais direitos das linhas), 0
alcool exerce urn efeito prejudicial bern maior na habilidade de dirigir do que quando existe
cafefna (diferenlfa entre 05 finais esquerdos das duas linhas). Essas sao duas form as validas
de se interpretar 05 dados e constatar essencialmente a mesma coisa.

Intera~oes

30[;8 308J 30]

Numero media de erros ao volante

20

duMto~di~6eS .
decaff!l~ .
sem alcoai

'5

~ 20

pifEiren~ entre as

.dulls eondies
de cafefna
com alcool

..Oi

."

....52E

."

o 10

Oi

."z

Sem cafeina

20..

20

': :::===: ': ~ ':'


Sem alcool Com alcool
(al

Sem alcoal Com alcool


(bl

Sem cafeina

*Com cafeina

Sem alcool Com alcoa!

(Cl

GrMieo da falta de intera~ao entre variaveis.

Diii!ren~~tre ~

:~

entre variaveis

Uma das regras de Duro da ANOYA e que, uma vez encontrada uma interalfao significati
va, voce deve seguir adiante para explora-Ia em maior profundidade. 0 que significa ter uma
interalfao entre duas variaveis? Se ha duas variaveis e cada uma apresenta duas condilfoes,
uma interalfao ocorre quando uma variavel se compona de forma diferente em cada condilfao
da outra variavel. Por exemplo, sugerimos anteriormente que a cafeina tinha urn efeito nas
duas condilfoes de alcool. Entretanto, a cafeina apresenta urn efeito bern maior quando existe
alcool no organismo do que quando nao existe. Urn exemplo da literatura e 0 achado de que
pessoas altamente ansiosas tendem a dirigir a atenlfao a estimulos negativos do ambiente,
enquanto as pessoas nao-ansiosas prestam menDs atertt;ao a esses estimulos (Mogg e Bradley,
1999). Aqui existe uma interalfao entre as variaveis ansiedade e atenlfao. Uma forma conve
niente de verificar se existe interalfaO entre duas variaveis e gerar graficos de linhas. Observe
as i1ustralfoes da Figura 10.6.
A Figura 10.6 mostra que, quando nao existe interalfao entre duas variaveis, as linhas
que representam a variavel cafeina sao paralelas. Quando observarmos tais linhas paralelas,
podemos estar seguros de que nao existe interalfao entre duas variaveis. 0 que as linhas para
lelas indicam? Se voce comparar as condilfOes com e sem alcool nos tres exemplos dados na
Figura 10.6, devera constatar que ha mais eITOS ao volante quando 05 motoristas nao tomaram
cafeina do que quando tomaram. Ha 05 mesmos padroes de resultados nas duas condilfoes de
alcool, mas tomar cafeina resulta em menDs erros ao volante.

lA'

'0 ,

339

Sem alcool

Com alcool

* Com cafeina

Grafieo de linha sobre a intera~ao entre as variaveis independentes eafeina e alcoo!.

Como uma interalfao aparece no formato de grafico? De uma olhada nos graficos da
Figura 10.7.
05 graficos na Figura 10.7 ilustram 05 varios padroes de linhas que sugerem a existencia
de interalfao. A principal caracterfstica a ser notada em cada grafico da Figura 10.7 e que as
duas linhas nao sao paralelas. Observando cada urn dos graficos, podemos ver que existem
diferentes padrOes em cada uma das condilfoes de alcool. No grafico (a), podemos notar
que, na condilfao sem alcool, existem mais erros ao volante com cafeina do que sem ela. Na
condilfao com alcool, entretanto, encontramos urn padrao inverso: mais erros sem cafeina.
No grafico (b), nao se observam diferenlfas reais entre as condilfoes com e sem cafeina na
condilfao sem alcool, enquanto na condilfao com alcool a cafeina aumenta 0 numero de erros
ao volante. 0 gnifico (c) mostra 0 oposto do (b), isto e, nao existem diferenrras na condirrao
com alcool, e a cafeina aumenta 05 erros na condilfao sem alcool. Observando 0 grafico Cd),
pode-se ver que nas duas condilfoes, com e sem alcool, tomar cafeina aumenta 0 numero
de erros. Entretanto, 0 grafico mostra que existe urn impacto maior da cafeina nos erros ao
volante na condilfao com alcool. 0 grafico (e) mostra 0 efeito oposto, urn grande impacto da
cafeina na condilfao sem alcool.

340

Christine P. Dancey & John Reidy

Um dos pontos a enfatizarmos nas discussoes dos efeitos simples e que 0 pesquisador deve
examinar os seus dados cuidadosamente. Plotar os dados e analisar 0 significado e importallte,
talvez a pane mais imponante de uma analise apropriada de qualquer conjunto de dados.

Numero media de erros ao volante

3Or;:;l
20

10-1

oI

><
I

::Rl >
30

20j
10

Sem alcool Com alcool

oI

oI

(d)

(c)

30

Sem cafeIna

* Com cafeina

10

Sem alcool Com alcool

Sem alcool Com alcool

20

10

oI

(b)

20

Sem alcool Com alcool

(a)

30

341

Estatistica sem Matematica para Psicologia

oI

le!!!!~f~~.!l~:':'!)'!
"y:~p~:.,,,,;:,.!,,;

","

':30"'~

;';':;~;:'~&~..~20
I

Sem alcool Com alcool


(e)

Grafico dos padroes de linhas de interac;ao.

.. ~>~~::~C~~~~~;
:,:~"9;

10

'.~~j;::::;

-'~::"" :

"'20:.'
~

".,

10H

.--'-

'1

~,:.ic;~;;:jt{;~l~J:fma~lO'~~;m.akDol O'~~(~~tj~

... -.... _-;-...-

._-,~._~

II *

Sem cafeina
Com cafeina

.. ,

",":",,,

Voce deve ter em mente que nao e possfvel, apenas pelo exame dos grillcos, constatar
se a interal>ao e ou nao significativa entre as variaveis independentes. Os graficos de linhas
fomecem um indicativo da interal>ao. Para saber se ela existe, e necessario consultar a tabela
da ANOVA. Assim, os grillcos devem ser utilizados em associal>ao com a tabela da ANOVA
para en tender os padr6es encontrados.

10.5.4

Interpreta~o

do efeito principal quando existem intera~oes significativas

Voce deve ser cuidadoso ao interpretar os efeitos principais quando houver interal>0es
significativas. Os efeitos devem ser interpretados somente se fizerem sentido ou forem in
teressantes no contexto da pesquisa sendo conduzida. Se nao tiverem sentido ou nao forem
interessantes, sera melhor se concentrar na interal>ao. Existem dificuldades para os pesquisa
dores na interpretal>ao de efeitos principais significativos na presenl>a de interal>6es tambem
significativas. Por exemplo, 0 grillco na Figura 10.7 (b) sugere que nao existe um efeito da
cafefna na condil>ao sem aIcool. Na condil>ao com alcool, entretanto, a cafefna tem um efeito
prejudicial sobre a habilidade de dirigir. Nao existe urn efeito evidente da cafefna em todas
as condil>oes. Assim, voce deve ser cauteloso ao interpretar 0 efeito principal. Para que exis
tisse urn efeito global da cafelna, ela deveria exercer influencia na habilidade de dirigir nas
duas condil>oes de aIcool. 0 grillco deveria ser mais parecido com 0 da Figura 10.7 (d). Se
simplesmente confiassemos na safda do SPSSPW, concluirfamos que existe urn efeito global
das duas variaveis independentes, quando, de fato, se a Figura 10.7 (b) fosse a verdadeira, nao
o teriamos. Assim, e importante examinar as i1ustral>0es grillcas dos resultados bem como a
safda do SPSSPW. Citando Howell (2002):

10.5.5 Efeitos simples


Os varios cenarios demonstrados destacam a importincia de i1ustrar graficamente os
dados como auxflio para se entender 0 que esta acontecendo com os efeitos principais e
as interal>0es. Se voce obteve uma interal>ao significativa, precisa descobrir 0 que real
mente esta acontecendo em cada uma das suas condil>6es. Pode-se fazer isso pela analise
dos efeitos simples (algumas vezes denominados de ejeilos principais simples). Um efeito
simples e a diferenl>a entre duas condil>oes quaisquer de uma variavel independente em
uma condil>ao da outra variavel independente. Assim, devemos analisar a diferenl>a entre
as condil>oes com e sem cafefna na condil>ao sem alcool. Isso seria a analise de um efeito
simples. Normalmente, ja teremos feito uma previsao sobre como essas celulas iraQ se
comportar e podemos utilizar essas previs6es como guia para saber que anaIises de efeitos
simples devemos executar. A analise dos efeitos simples e equivalente a testes t, mas envol
ve 0 calculo dos valores F. Voce pode utilizar 0 SPSSPW para calcula-Ios. Entretanto, para
explicarmos como fazer isso, e preciso falar sobre a Iinguagem do SPSSPW. I Tal tarefa esta
alem dos objetivos deste texto, assim, recomendamos que simplesmente use 0 SPSSPW a
fim de calcular os testes t para os efeitos simples desejados, Para os dados apresentados na
Tabela 10.4 (a analise inicial entre participantes que apresentamos neste capftulo), os testes
t para os efeitos simples sao como os seguintes:

Voce pode ulilizar 0 mc!lodo recomendado por Howell (2002). 1550 envolve radar ANOVA, de um falor ,eparadas para cada efeilo
simples e recalcular os vaJores F utilizando 0 erro qaadrado m6dio da analise original no lugar dos ca1culados para os efeitos sim
ples. Veja Howell (2002) para detalhes de como proc<der.

342

Christine

P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

TESTE T
GRUPO DO ALCOOL = SEM ALCOOL

Independent Samples Test' (Te<te p.r. AmOSlr.s Independentes')


Levene's Test

for Equality of

Variances

(Teste de Levene

p.r Igu.ld.de

de V.rionci.s)

Group Statistics' (Est.tistic.s dos Grupos')


Caffeine
(Com c.feina)
Driving errors
(Erros ao dirigir)

No caffeine
(Sem c.fein.)
Caffeine
(Com c.fein.)

a. alcgroup = No alcohol (aleool

Std. Error Mean


(Erro P.drao d. Medi.)

Mean (M<!di.)

Std. Deviation
(Desvio P.drao)

12

7.9167

3.31548

0.95710

12

5.7500

3.27872

0.94648

Driving
errors
(Erros ao
vol.nte)

Independent Samples Test' (Teste p.r. Amostr.s Independentes')

Driving

errors

Equal variances
assumed (lgu.ld.de

Sig.

0.027

0.872

Equal variances not


assumed (Igu.ld.de

t
1.610

Sig.
(Hailed)
Of
(Sig.
(gl)
Bil.ter.1)
22

1.610 21.997

0.122

Mean
Difference
(Diferenc;a

d.s M<!di.s)
2.16667

95% Confidence
Interval of the
Difference (IC de 95%
Std. Error
para a Diferenc;a)
Difference
(Erro P.drao
Lower
Upper
d. Diferen~.)
(Inferior) (Superior)
1.34606 -0.62488

4.958

0.122

2.16667

1.34606 -0.62490

4.958

0.173

0.682

8.792

22

0.000

12.25000

1.39330

9.360

15.140

8.792

21.25

0.000

12.25000

1.39330

9.355

15.145

Equal variances not


assumed (lgu.ld.de
de variancias no3o

30

de variancias nao

30

QI

QI

E.:

::::I::

'E'g' 20

0:0

"'0

:0 I"Cl 10
0.'"
::::ee

~~

'E'g' 20

0:0

"'0

;;; '" 10

N=1212
Sem alcool

(Grupe do aleool = Sem aleool)


Sig. = Significancia

::::::0::::::

0.'"

CAFGROUP

QI"C
"C

aS5umida)

~
~

Sem cafeina

Com cafeina

~g
g: ~ 0

!:! -10

30

/~

;;; '" 10

~~

!:! -10

Caffeine
(Com c.fein.)

Mean (M<!dia)

Std. Deviation
(Desvlo P.drao)

Std. Error Mean


(Erro P.drao d. Medi.)

No caffeine

12

21.2500

3.72034

1.07397

12

9.0000

3.07482

0.88763

(Sem c.fein.)

a. alcgroup alcohol (aleool

= Com alcool)

,I

12

12

Sem alcool

Group Statistics' (Estatislic.s dos Grupos')

Caffeine
(Com cafeina)

I
N= 12

12

Com alcool

:::::::J:::::

~~.g' 20

0:0

----.--

"'0

;;; '" 10

::::::0::::::

0.'"

~~

Sem cafeina
Com cafeina

12
12
Com alcool

30 -,----------

QI

E.:

QI"C
"C

= ALCOOL

"'0

~
~

ALCGROUP
(b)

QI

o:C

N = 12
12
Sem aleool

1212
Com alcool

E.:

'E'g' 20

CAFGROUP

QI"C
"C

ALCGROUP
(a)

A safda acima fomece 0 teste do primeiro efeito simples. Testa a diferen,.a entre as
condi,.Oes com cafefna e sem cafefna somente na condi,.ao sem alcoo!. As medias que esta
comparando sao indicadas na Figura 10.8 (a) pela seta. 0 teste 1 nos diz que a diferen,.a entre
as condi,.oes com cafefna e sem cafefna na situa,.ao sem alcool tern urn valor 1 associado de
1(22) = 1,61, P =0,12, que e nao-significativo,
A segunda analise de urn efeito simples e apresentada a seguir:

Driving errors
(Erros .0 vol.nle)

Lower
Upper
(Inferior) (Superior)

Sig.

E.:

!:! -10

GRUPO DO ALCOOL

para a Diferenc;a)

(Grupo do aleool = Com aleool)


Sig. = Significancia

(Erros ao de variancias assumida)

vol.nte)

Mean
Std. Error
Sig.
Difference
(2-tailed) Difference
Of
(SIg.
(Diferen~.
(Erro P.drao
(gl)
Bil.ter.l) ....d.s Medi.s) d. Diferen~.)

95% Confidence
Interval of the
Difference (lC de 95%

assumida)
t-test for Equality of Means
(Te<le r p.r Igu.ld.de de M<!di.s)

de Variancias)

Equal variances
assumed (Igu.ld.de
de variancias aS5umida)

t-test for Equality of Means


(Teste r p.r Igu.ld.de de M<!di.s)

= Sem aleool)

Levene's Test
for Equality of
Variances
(Te<le de Levene
par Igu.ld.de

343

CAFGROUP

~
~

Sem cafelna
Com cafeina

::::::o::::::~

0.'"
ggg

CAFGROUP

~~ 0

QI"C
"C

-10

N = 12

12

12

Sem aleool

Com aleool

ALCGROUP

ALCGROUP

(c)

(d)

Gratico de barras de erro do teste de varios efeitos simples.

12

~
~

Sem cafeina
Com caferna

344

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Esse teste I nos mostra que, na eondif<3.o com aleool, existe uma diferenf<a signifieativa
entre duas eondif<oes da eafelna. as detalhes relevantes sao t(22) 8,79, p < 0,001. Essa
analise ilustrada na Figura 10.8 (b). Colocamos que 0 valor p e menor do que 0,001 porque
o SPSSPW mostrou urn valor p de 0,000. Isso signifiea que 0 valor p real e menor do que
0,001, mas 0 SPSSPW nao consegue mostrar. Assim, nao podemos apresentar p exato como
o aeonselhamos a fazer nos relatos dos resultados. Quando isso aeonteeer nas suas analises,
relate 0 valor p como fizemos antes.
o teste da diferenf<a entre as duas eondif<oes alc06lieas na presenf<a ou nao de eafefna
e apresentado somente na safda a seguir. Esse teste 1 examina as duas medias ilustradas na
Figura 10.8 (c).

CAFEiNA

345

= CAFEiNA

Group Statistics' (Estatlsticas dos Grupos')


Alcohol
(Com alcool)
Driving errors
(Erros ao volante)

No alcohol
(Sem aloool)
Alcohol
(Comalcool)

a. cafgroup = caffeine (a. cafgroup

N I

Mean (M~ia)

Std. Deviation
(Desvio Padrao)

Std. Error Mean


(Erro Padrao da M~ia)

12 I

5.7500

3.27872

0.94648

12 I

9.0000

3.07482

0.88763

= Com cafelna)

Independent Samples Test' (Teste para Amostras Independentes')

TESTE T
CONDI9\O CAFEiNA = SEM CAFEiNA

levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade
de Variancias)

Group Statistics' (Estatisticas dos Grupos')


Alcohol
(Com alcool)
Driving errors
(Erros ao volante)

No alcohol
(Sem alcool)
Alcohol
(Com alcool)

Mean

12
12

(M~ia)

Std. Deviation
(Desvio Padrao)

Std. Error Mean


(Erro Padrao da M~ia)

7.9167

3.31548

0.95710

21.2500

3.72034

t-test for Equality of Means


(Teste t para a Igualdade de M~ias)

0.810 -2.505

22

0.020

-2.505 21.910

0.020

1.07397

F
Driving Equal variances
errors
assumed (lgualdade

a. alcgroup = No alcohol (a. cafeina = Sem cafeina)

0.059

Sig.
Mean
(2-tailed) Difference
(Sig.
(Diferen~
Bilateral) das M~ias)

Of
(gl)

Sig.

Std. Error
Difference
(Erre Padrao

95% Confidence
Interval of the
Difference (IC de
95% a Diferen~a)

daDifer~)

lower
Upper
(Inferior) (Superior)

-3.25000

1.29758

-5.941 -0.5590

-3.25000

1.29758

-5.942 -0.5583

(Erros ao de varic\ncias assumida)

volante) Equal variances not


assumed (lgualdade
de varic\ncias nao

Independent Samples Test' (Teste para Amostras Independentes')


levene's Test

for Equality of

Variances

(Teste de Levene

para a Igualdade

aS5umida)

t-test for Equality of Means


(Teste t para a Igualdade de M~ias)

de Variancias)

F
Driving Equal variances
errors assumed (Igualdade

0.005

Sig.

a. cafgroup = caffeine (a. cafgroup


Sig. = Significancia

0.945 -9.269

95% Confidence
Interval of the
Difference (lC de 95%
Mean
Std. Error
Sig.
para a Diferen~a)
(2-tailed) Difference Difference
Of
(Sig.
(Erro Padrao
lower
(Diferen~a
Upper
(gl)
(Inferior) (Superior)
Bilateral) das M~ias) da Diferen~)
22

-13.3333

1.43856

-16.317 -10.350

0.000 -13.33333

1.43856

-16.319 -10.348

0.000

(Erros ao de vari~ncias assumida)

volante) Equal variances not


assumed (lgualdade

-9.269 21.714

de varicincias ncio
assumida)

a. cafgroup = (Sem cafeina)


Sig. = Significancia

A safda mostra que existe uma diferenf<a signifieativa entre as duas eondif<Oes envolven
do aleool na presenf<a ou nao de eafefna. as detalhes relevantes sao: 1(22) = 9,27, p < 0,001.
A analise final do efeito simples e apresentada a seguir. Este teste 1examina a diferenf<a
entre as duas eondif<oes de alcool na eondif<ao eafelna (veja Figura 10.8 (d)). A analise sugere
que existe uma diferenf<a signifieativa ente as duas eondif<oes de presenf<a ou nao de alcool.
as detalhes relevantes sao: 1(22) 2,51, p 0,02.

= Com cafeina)

Voce deve ser eapaz de observar que existe urn efeito do aleool nas duas eondif<Oes de
eafefna que niio e provavel ocorrer apenas devido ao erro amostra1, dada a hip6tese nula como
verdadeira. Essas analises eonfinnam que, nesse easo, existe urn efeito principal genufno da
variavel independente aleool. Nao se trata de efeito espurio causado pela interaf<ao entre as
duas variaveis independentes. E urn efeito principal genufno, pois 0 aleool tern urn efeito
signifieativo nas duas eondif<Oes da variavel eafefna. Para a variavel independente eafefna, no
entanto, voce deve ser eapaz de eonstatar que existe somente urn efeito signifieativo na eon
dif<ao com alcool. Isso indica que devemos ser eautelosos sobre 0 efeito principal observado
aeerca da eafelna. Em virtude de niio existir urn efeito da eafefna na eondif<ao sem alcool,
nao podemos declarar que a eafefna, no geral, afeta a habilidade de dirigir. A eafefna pare
ee somente surtir efeito quando os participantes tambem ingeriram aleool. Esses resultados
mostram, c1aramente, a importancia de se investigar qualquer interaf<3.o signifieativa quando
tivennos obtido efeitos principais signifieativos.
Na pratica voce deve ser euidadoso quando eonduzir analise de efeitos simples, pois,
quanto mais efeitos simples forem ealeulados, maior sera a taxa de erro de eonjunto. No
Capitulo 9, explieamos que a taxa de erro de eonjunto (familywise error rate) estli relacio
nada a taxa de erro global que se tern ao eonduzir muitas analises. Ao se realizar urn numero
e1evado de analises, existe urn aumento da probabilidade de se eometer 0 erro do Tipo I, e
voce deve ser seletivo nas analises dos efeitos simples que forem realizadas. Geralmente,

346

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

quando urn experimento de ANOYA fatorial e realizado, voce tera feito alguma especie
de previsao (como fizemos) sobre os efeitos interativos das duas variaveis independentes.
Yoce deve utilizar essas previsoes para guia-Io na escolha das analises dos efeitos simples
que precisam ser realizadas. Tais analises sao geralmente denominadas de comparar;oes
planejadas ou a priori. Quando as comparar;5es sao post hoc, ou voce esta fazendo muitas
comparar;5es, ou precisa fazer alguns ajustes no nfvel de significancia ex (veja a ser;ao sobre
testes post hoc no Capftulo 9). Como examinamos todos os possfveis efeitos simples na
safda do SPSSPW apresentada, 0 nfvel de significancia deve ser estabelecido em 0,0125,
isto e, 0,05 ... 4. Quando fizermos isso, constataremos que 0 efeito simples do aleool na
condir;ao com cafefna nao e significativo (p = 0,02), e, assim, esta diferenr;a sera atribufda
ao erro amostral.

[~) A@=:e~f~~~'~"~S.'O'~"""i.e,
:(~) 'Oiferen91 k~~k~chidete$ enio ~sca~'dli~~te;e~qu~~to

os bebedores e riao~be~ores de ~h('

(b)Diferen~globaleritre

fala .,,'

." .... .

:,'~~~I~~m.~~:~I~~~:;~,:~;~:"rodo
10.5.6

parcial e util como uma medida global de magnitude do efeito. Se, no entanto, voce estiver in
teressado na magnitude da diferenr;a entre duas condir;oes (0 tamanho de urn efeito simples),
pode utilizar 0 d, como sugerido no Capftulo 9.

10.5.7

Escrita das analises


Quando voce tiver realizado a analise, os resultados podem ser relatados da seguinte forma:
As medias e as intervalos de confiam,a de 95% para 0 mlmero de erros ao volante nas condi
,,6es com e sem aleool e com e sem cafefna sao apresentados na Figura 10.9. Sugerem que existe
uma diferen"a consideravel no desempenho ao volantanlre as condi,,6es com e sem cafefna quan
do os participanles ingeriram aleool, mas nao necessariamenle quando nao beberam. Isso indica
que, nas duas condi,,6es de cafefna, a aleooltem urn efeito prejudicial no desempenho ao volante.
Existe a possibilidade de urna intera"ao entre as duas variaveis independenles, mas nao esta claro,
a partir dos valores, quao grande seria essa intera"ao.

o numero de erros ao volante foi estudado por meio de uma ANOYA entre partici
pantes com dois fatores de alcool (com e sem) e dois de cafefna (com e sem). A analise
revelou que os efeitos principais devidos aos fatores de aleool (F(l, 44) = 73,27, p <
0,001) e cafefna (F(l, 44),55,38, p < 0,001) e a interar;ao entre eles (F(l, 44) = 27,09,
p < 0,001, T)2 parcial = 0,38) sao improvaveis de terem ocorrido somente devido ao erro
amostral. Isso sugere que sao cometidos mais erros ao volante quando aleool e ingerido
do que quando nao (medias de 15,13 e 6,83, respectivamente, com T)2 parcial = 0,63).
Alem disso, 63% da variar;ao global dos erros ao volante foram atribufdos a influencia
da variavel independente aleoo!. 0 efeito principal da cafefna indica que existem menos
erros ao volante quando cafefna e consumida do que quando nao (medias de 7,38 e 14,58,

Tamanho do efeito

30

o calculo do tamanho do efeito e semelhante ao caso da ANOYA de urn fator descrito no


Capftulo 9. Como dito previamente, existem vanas medidas do tamanho do efeito nos delinea
mentos da ANOYA; entretanto, 0 SPSSPW apresenta 0 eta parcial ao quadrado (T)2 parcial), 0
unico que sera abordado aqui.
o T)2 parcial e facilmente solicitado ao SPSSPW tanto no delineamento entre partiei
pantes quanto no dentre participantes. Yoce deve notar, a partir da safda, que a estimativa do
T)2parcial nao chega a urn, porque e, de fato, 0 quociente da soma dos quaclrados (SQ) dos
efeitos (tratamentos) dividida pelo efeito da soma dos quadrados dos efeitos (tratamentos)
somada com a soma dos quadrados do erro (dentro):

.~

~ 25

. ~

e
~ 15
."c:
0

~ 10

SQ_

SQ_+SQ=

#.

'".

III

"tl

Para 0 efeito principal do aIcool,


"al
1] parcl

!:1

T)2 parcial (0,625) caleulado e de:

825,021
825,021 + 495,417

Todos os detalhes do T)2 parcial dados na safda da ANOYA na pagina 336 sao calculados
de uma maneira semelhante. Essas analises nos informam que 62,5% da variar;ao nos erros
ao volante podem ser creditados a nossa manipular;ao da variavel independente aleool. 0 T)2

; 20

"tl

Q.

1]' parcial =

347

II

~.mG"M
I
Cafeina

Com cafeina

Com alcool

Sem alcoal
Alcool

.I.

GrMico de barras de erro com medias e intervalos de confianc;a de 95% para


de erros ao volante nas condic;6es com/sem aleool e com/sem cafefna.

numero

348

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy


respectivamente, 11 2 parcial = 0,56). Assim, 56% da varilincia se deve a manipula"ao da
variavel independente cafefna. Finalmente, a intera"ao entre alcool e cafefna foi conside
ravel e representa 38% da varilincia total. Essa intera"ao foi adicionalmente investigada
por meio do uso de testes t. Dado que existem quatro testes de efeitos simples, 0 criterio
de significlincia foi ajustado para 0,0125. As analises mostraram que 0 efeito da cafefna
na condi"ao com alcool foi tal que e improvavel que se deva ao erro amostral (1(22) =
8,79, p < 0,001, d = 3,61). Nao se encontrou urn efeito significativo da cafefna na condi
"ao sem alcool (1(22) = 1,61, P =0,1221, d = 0,66). 0 efeito do alcool na condi"ao com
cafefna tambem e improvavel de ter ocorrido por erro amostral (1(22) =9,27, p < 0,00 I,
d =3,79). Entretanto, nao se verificou efeito da variavel independente alcool na condi"ao
com cafefna (1(22) =2,51, p =0,02, d = 1,02).

;:[~j:~:~!:I!i~:~t::~~e::;ii::~':"

Determina~o

das variaveis

Como em todas as analises, a primeira coisa que voce precisa fazer e entrar com os da
dos. A maneira de fazer isso e i1ustrada abaixo:

:;:: ~~\:?~;,:~:>:,lt~--::h" .:' .

10017.....-001
100

100

Ekeharnmar e colaboradores (2003) examinaram diferen"as de genero no preconceito implfcito.


Nesse estudo, deram a homens e mulheres a tarefa de reconhecer rostos de suecos e de emigrantes
suecos. Entao, detenninararn 0 quanto essa tarefa influenciou 0 grau atribufdo ao carater de uma
pessoa descrita em uma hist6ria. Estavam interessados no grau de influencia que a apresenta"ao do
rosto da pessoa teve na atribui"ao de carater negativo na seguinte hist6ria:
No estlldo os pesqllisadores IItilizaram lima ANOVA 2 (rostos: sllecos versus emigrantes sllecos)x2
(genero do participallte: !zomem versus mlliher) para analisar as respostas em relaflio ao carater na
hist6ria. Nlio encontraram efeitos principais significativos da variavel independente rostos (F(1, 39)
0,94. p = 0,34), sllgerindo qlle no geral nlio existe diferenfa no grail do carater qllando os partici
pantes slio previamente expostos a rostos de sllecos e de emigrantes sllecos. No entanto,foi encontrado
uma interaflio significativa entre as variaveis independentes rostos e genero (F(1. 39) = 5,63, p =
0,02). Realizaram uma analise post hoc dessa interaflio usando 0 teste LDS de Fisher e verificaram
que mostraram as mulheres uma negatividade maior em relaflio ao cardter do que os homens quando
expostas as fotografias dos emigrantes, mas nlio com as dos suecos, sugerindo um grande preconceito
impUcito entre as mulheres.

lii6t~, ~:f>':.

'00
900
10(1)

__._:J

-":~"_'l.>r:\oW~_~I

..... '.I'~ ...

"J~;-i----=~~

~i;:jf--~--i-iii'I--~.t--+---+----+---+----F--=-r-~--

-,

::t--~~I'--~'~j---:
Iml

2001
2.001

1001

200l

m
am

lUI
1m

2m
lOO
2m

1m!

2001

600
6..00
1m

1.11) I

200

8.00 I

1Uli

Hili

~'7I.

Os detalhes estatfsticos podem ser encontrados em Ekeharnmar e colaboradores. Voce pode ver
que eles apresentararn os valores p reais em vez de simplesmente afirrnar que 0 valor p foi maior ou
menor do que 0,05.

:._~'i:.~~ "~~"~/"'

,l-. __

..... '

Exemplo da literatura:
preconceito e diferen~a de genero

349

__

900

(I)!

L..'

"r".
~'J~~_-::'~.~

"

Lembre-se de que, quando for organizar urn banco de dados para uma analise para
duas variaveis independentes entre dois gropos, voce precisara detenninar duas variaveis de
agrupamento contendo os numeros que representam os gropos aos quais os participantes
pertencem. Assim, se 0 participante IS estli no gropo sem liIcoollcom cafefna, tera urn "I"
na coluna alcgroup (grupo do lilcool) e urn "2" na coluna cafgroup (gropo da cafefna). AI
guem no gropo com liIcoollsem cafefna tera urn "2" na coluna alcgroup e urn "I" na coluna
ca/group, e quem estiver no gropo com alcoollcom cafefna tera urn "2" nas duas colunas. A
terceira variavel que vai precisar detenninar e para a variavel dependente, que contera os va
lores de cada uma das pessoas, nesse caso, 0 numero de erros cometidos ao volante.

Obten~o

de estatisticas descritivas para cada grupo de participantes

A parte inicial da analise sera obter as estatfsticas descritivas para cada grupo de par
ticipantes. Temos quatro grupos de participantes, mas nao se trata de urn procedimento
imediato. Para fazer isso, precisarnos dividir nosso arquivo de dados em duas partes, uma
contendo todos os dados da condi"ao sem alcool e a outra contendo os da condi"ao com
alcoo!. Feito isso, temos que rodar 0 procedimento de estatisticas descritivas com os dados
de erros ao volante para cada uma das condi"oes da cafefna. 0 SPSSPW fornecera as es
tatfsticas descritivas para cada uma das condi,,5es da cafefna de cada uma das duas partes

350

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

em que 0 arquivo de dados foi dividido, isto e. para as condi~Oes com e sem alcoo!. Dessa
maneira podemos obter todas as estatfsticas descritivas para cada urn dos quatro grupos de
participantes.
o primeiro passo. portanto, e solicitar que 0 SPSSPW divida 0 arquivo em duas partes.
Voce pode fazer isso c1icando na o~ao Data (Dados), em Split File (Dividir Dados).

351

Voce precisara selecionar a op~ao Organize output by groups (Organize a safda por
grupos) e mover a variavel alcool (alcohol) para a caixa Groups based on (Grupos basea
dos em). Feito isso, clique no botao OK. 0 arquivo estara agora efetivamente dividido
em dois, para a condi~ao sem alcool e para a condi~ao com alcool. Qualquer analise que
realize agora sera executada nos dois arquivos separadamente. Assim, 0 pr6ximo passo e
fazer com que 0 SPSSPW produza as estatfsticas descritivas. Yoce precisa trabalhar com
a caixa de dililogos Analyze (Analisar), Descriptive Statistics (Estatfsticas Descritivas),
Explore (Explorar).

f'

r
+-----J--.

+---1 --- .
---t--+-_.

---t-- -1-----I

Feito isso, sera aberta a seguinte caixa de dialogos.

'~i;~~}tZEr:.~!;}~~

~e.l~io~~~~~c
op~oemova

~~!u1L:;'-'-+1"'!.i!~91--------'

~-iWI:'~h~\Ii'''":?;.1

______.

r.:
Quando 0 SPSSPW executar essas anaIises, produzira dois conjuntos de estatfsticas des
critivas, uma para a condi~ao sem aIcool e outra para a condi~ao com lilcool. Dessa forma,
voce tera obtido as estatfsticas descritivas (incluindo diagramas de caixa e bigodes e histogra
mas) para todos os quatro grupos envolvidos no estudo.
Quando tiver obtido as estatfsticas descritivas para cada urn dos quatro grupos, poderli
realizar a ANOYA nos dados. Yoce precisara solicitar ao SPSSPW para reagrupar os dados
que foram previamente divididos. Se niio fizer isso, vera que 0 software tentarli executar a
analise nas duas partes do arquivo separadamente, 0 que estaria incorreto. Dessa forma, voce
precisa deixar 0 SPSSPW saber que se deve utilizar todos os dados juntos na execu~iio da
ANOYA. Para fazer isso, e precise voltar ao menu Data (Dados), Split File (Dividir Dados),
e selecionar a op~iio Analyze all cases, do not create groups (Analisar todos os casos, niio
criar grupos).

352

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

353

Com a caixa de dililogos Univariate (Univariada) na tela, mova a variavel dependente


e as variaveis independentes para os locais apropriados. Se voce quer informac;Oes sobre 0
tamanho do efeito para cada urn dos efeitos principais e para a interac;ao, deve dicar no botao
Options (Opc;Oes). Fazendo isso, obtera a seguinte caixa de dialogos.

!I '

I I

:~:~t

.(EStirilatiVas .

dO,bmanhO

:'d.,efeito),

"

Execu~o

' . ' JliIl

da ANOVA

Para que 0 SPSSPW execute a ANOYA, voce precisa selecionar as oPC;Oes General Li
near Models (Modelos Lineares Geralizados), Univariate (Univariada), do menu Analyze
(Analisar).

Selecione a opc;ao Estimates ofeffect size (Estimativas do tamanho do efeito) e clique no


botao Continue (Continuar) para retomar acaixa de dialogos principal da ANOYA. Yoce deve
notar que, se selecionar a opc;ao Descriptives Statistics (Estatisticas Descritivas), 0 SPSSPW
apresentara medias e desvios padrOes como parte da saida da ANOYA (e voce nao precisa
dividir 0 arquivo para isso). Clique no botao OK, e a analise sera realizada Yoce obtera uma
saida que e semelhante 3.quelas mostradas na analise original anterior (veja pagina 336).
Para investigar os efeitos simples. voce precisa executar os testes t. No entanto, isso nao
e urn procedimento direto como os testes t simples na variavel dependente entre dois grupos
em carla uma das variaveis independentes. Lembre, na analise dos efeitos simples, estamos
procurando os efeitos de uma das variaveis independentes em uma condic;ao da outra variavel
independente. Assim, os primeiros dois testes t que realizaremos procurarn diferenc;as entre
as duas condic;Oes de alcool nas condic;Oes sem cafefna e com cafeina. Portanto, precisamos
informar ao SPSSPW que queremos dividir 0 arquivo em duas partes novamente. Dessa vez
devemos dividi-Io com base na variavel cafefna e preparar a caixa de dialogos Data (Dados),
Split File (Dividir Arquivo), da seguinte maneira.

354

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

I !

355

~.~~m,::

l:...,-

"(Agriljiado)

eSiJmmilries

forgf'(j!i~of

..,,>;.Ca~s" '.
.. :j$ilnulrio pta

.g~~~,~e.Cils()s) .
I
~-

~_
iii~~
I_J;:i
~-Cllii&YAtGj(~~1
.~ . ~ .... ..;, ; ..... )Il .... n.:_~~'

!i!!Jl_~ta!t9IIi.~~.~_~

Feito isso, clique no botao OK, e 0 arquivo sera dividido novamente. Voce pode rodar
o teste t independente com alcool como variavel independente e erros ao volante como
variavel dependente. 0 SPSSPW conduzira testes t para as condic;:oes com cafefna e sem
cafefna.
Voce precisara realizar mais testes t para examinar as diferenc;:as entre as condic;:oes
com e sem cafefna em cada uma das condic;:oes da variavel independente alcool. Precisara
retomar a caixa de dialogos Data (Dados). Split File (Dividir Arquivo) e mover a variavel
alcool para a caixa Groups Based on (Gropos com base em) em vez da variavel cafefna.
Feito isso, podera realizar 0 teste t independente com a cafefna como variavel independen
te, e erros ao volante como variavel dependente sob as duas condic;:oes da variavel alcool.
Lembre-se, quando voce tiver terminado a analise dos efeitos simples, deve informar ao
SPSSPW para reagrupar novamente 0 arquivo dividido, de modo que qualquer analise subse
qiiente necessaria possa ser feita sobre todos os dados.

Gera~o

i.~.~

Voce precisani selecionar a opc;:ao Clustered (Agrupado) e Summaries for groups of ca


ses (Sumario para grupos de casas) e clicar no botao Define (Definir). Aparecera uma caixa
de dialogos semelhante a mostrada a seguir. Mova a variavel erros ao volante para a caixa
Variable (Variavel), a variavel alcgroup (grupo do alcool) para caixa Category Axis (Eixo das
categoriais) e a variavel cafgroup (grupo da cafefna) para a caixa Define Clusters by (Definir
Agrupamentos por). Clique no botao OK para gerar 0 diagrarna requerido. Voce obtera urn
diagrarna sernelhante ao representado na Figura 10.3 (mas sern as linhas s61idas conectando
as barras de erros).

.-:l:F~~
!i

dos diagramas de barras de erro

Para gerar 0 diagrama de barras de erros apropriado, selecione a opc;:ao Error Bar... (Dia
grama de Erro) do menu Graphs (Gnfficos). Voce obtera a seguinte caixa de dialogos.

-1-.;1
~Nl

J!if,;1iQfj~}t~,~:.[~:s~r5'f~f

356

10.6

Estatfstica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Duas variaveis dentre participantes


Mostramos como a ANOVA pode manejar duas variliveis entre participantes e a intera~ao
entre elas em uma analise. Agora vamos apresentar 0 caso de duas variaveis dentre partici
pantes. Permaneceremos com 0 mesmo estudo e os mesmos dados utilizados para 0 eKemplo
das variaveis entre participantes, de modo que possarnos destacar as diferen~as entre os dois
tipos de delineamentos. A distribui~ao agora e mostrada na Tabela 10.5. Compare isso com 0
delineamento apenas entre participantes anterior (Tabela 10.4).
Voce deve ser capaz de ver que temos 12 participantes tomando parte do estudo, mas
cada pessoa contribuiu com urn escore em cada uma das celulas da tabela, isto e, cada urn
deles tomou parte em cada uma das quatro condi~5es. Obviamente, isso e diffcil de ser eKe
cutado em uma 6nica ocasiao, e, assim, e necessario que os participantes sejam euminados
em quatro oportunidades diferentes.
Tabela 10.5

Distribui,.oes dos escores das condi,.oes em urn projeto dentre participantes

PardJ~~PUj~~iL~~:car~ .
I
2

3
4
5
6
7
8
9
10
11
12

4
9
10
8
6
II
2
II
II
10

3
10

8
4
9
0
8
6
6

3
0
8
9
8

28
22
21
27
21
20
19
16
25
17
19
20

5
6
14
8
14
5
11
8
10
II
8
8

Temos os mesmos dados utilizados na analise anterior (entre participantes), 0 que signi
fica que as hip6teses necessarias para a utiliza~ao de urn teste pararnetrico tarnbem se fazem
necessarias nesse caso. Voce deve nOlar, no entanto, que isso s6 ocorre porque temos apenas
duas condi~5es para cada uma das nossas variaveis independentes. Se tivermos mais do que
duas condi~5es em qualquer uma das variaveis independentes dentre participantes, precisare
mos checar tarnbem se os dados nao violam a hip6tese adicional de esfericidade, consuItando
o teste de Mauchley na safda (tabela) da ANOVA. Lembre: explicarnos que essa e a hip6tese
adicional necessaria quando 0 delineamento e dentre participantes (veja Capitulo 9).

ocorre devido as diferen~as individuais dentro de cada condi~ao foi c1assificada como
variancia do erro. Quando temos urn delineamento dentre participantes, eKiste uma fonte
de varia~ao constante devido ao uso dos mesmos participantes em cada condi~ao (isso foi
eKplicado no Capitulo 9). Em virtude dessa fonte constante de varia~ao, podemos retira-Ia
da variancia do erro, reduzindo, assim, 0 termo erro (algumas vezes denominado de par
cializar). Por que precisamos parcializar os efeitos dos sujeitos do termo erro? Quando
temos urn delineamento dentre participantes, uma das hip6teses dos testes estatfsticos (urn
que nao abordamos por se tratar de f6rmulas) e que os dados de cada condi~ao devem
ser independentes das demais condi~5es. Por isso esse tipo de delineamento e denomi
nado de "independente". Isso simplesmente indica que as condi~5es nao devem estar
correlacionadas. Essa e uma hip6tese razoavel para-ftlis tipos de delineamentos. Nao e, no
entanto, razoavel para urn delineamento dentre participantes. Em tais situa~5es, as con
di~5es tendem a estar correlacionadas. Por eKemplo, aqueles participantes que tern urn
born desempenho no teste de dire~ao na condi~ao sem alcool e sem cafefna tendem a ter
urn born desempenho comparado aos outros nas demais condi~5es. De forma semelhante,
aqueles que tendem a ter urn desempenho fraco em uma condi~ao tendem a manter esse
desempenho nas demais condi~5es. Isso pode nao ser verdadeiro para todos os estudos,
mas e certamente para a maioria. Dessa forma, a hip6tese de independencia de condi~5es
nao se verifica para esse tipo de delineamento.
Como podemos resolver tal problema? A resposta e remover os efeitos regulares dos
participantes ao lange das condi~5es. Se isso for feito, as condi~5es seriio efetivamente in
dependentes umas das outras, e a analise podera continuar. Uma caracterfstica 6tH dessa
manipula~ao estatfstica e tender a reduzir tambem 0 termo erro. Isso significa que, na maio
ria dos casos, 0 quadrado medio do efeito e comparado com urn quadrado medio menor do
erro do que seria 0 equivalente para uma an:ilise entre participantes. A conseqiiencia e que
freqiientemente a an:ilise realizada por meio de urn delinearnento dentre participantes e mais
poderosa do que a equivalente entre participantes.
Voce notara que, na safda da analise dentre participantes, existem mais entradas do que
para uma analise totalmente dentre participantes. Isso ocorre simplesmente porque testa
mos cada efeito principal e a intera~ao contra 0 pr6prio termo erro. No delinearnento dentre
participantes, em virtude de termos os mesmos participantes em todas as condi~5es, ha a
possibilidade de calcularmos 0 grau de erro associado com cada efeito, enquanto no delinea
mento entre participantes podemos calcular somente 0 erro total.

MODELO LINEAR GERAL


Within-Subjects Factors (Fator Dentre Sujeitosl
Measure: MEASURE_l (Medida: Medida_ll
alcohol (com Alcool)

10.6.1

357

Fontes da variancia

Quando conduzimos uma ANOVA, estamos tentando identificar as possfveis fontes


de varia~ao em nossos dados. Se voce repensar 0 que foi dito a respeito quando se tra
tou do delineamento completamente entre participantes, ira verificar que a varHlncia que

caffei ne (com cafeinal


1

2
1

Variavel dependente
noalcnocaff
noalccaff
alcnocaff
alccaff

358

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Multivariate Tests' (Testes Multivariados')

alcohol (A1cool)

Hypothesis df
(gl da Hipotese)

Error df
(gl do Erro)

5ig.

Partial Eta
Squared
(~' Parcial)

Pillai's Trace
(Tra~o de Pilla;)

0.882

82.331'

1.000

11.000

0.000

0.882

Source (Fonle)

Wilks' Lambda
(Lambda de Wilks)

0.118

82.331'

1.000

11.000

0.000

0.882

alcohol (alcool)

Hotelling's Trace
de Hotelling)

7.485

82.331'

1.000

11.000

0.000

0.882

Roy's Largest Root


(Malor Raiz de Roy)

7.485

82.331'

1.000

11.000

0.000

0.882

Pillai's Trace
de Pillai)
Wilks' Lambda
(Lambda de Wilks)

0.767
0.233

36.150'

1.000

11.000

0.000

0.767

Hotelling's Trace
de Hotelling)

3.286

36.150'

1.000

11.000

0.000

0.767

Roy's Largest Root


(Maior Raiz de Roy)

3.286

36.150'

1.000

11.000

Pillai's Trace
(Tra~o de Pillai)

0.696

25.184'

1.000

11.000

Wilks' Lambda
(Lambda de Wilks)

0.304

25.184'

1.000

11.000

0.000

0.696

Hotelling's Trace
(Tra~o de Hotelling)

2.289

25.184'

1.000

11.000

0.000

0.696

Roy's Largest Root


(Maior Raiz de Roy)

2.289

25.184'

1.000

11.000

0.000

0.696

(Tra~o

caffeine (Cafeina)

Test of Within-Subjects Effects (Tesle dos Eteilos Dentre Suieitos)


Measure: MEASURE 1 (Medida: Medida I)
Value
(Valor)

Effect (Eleito)

alcohol' caffeine
(alcool ' cafeina)

Type III Sumo


f Squares (Soma
dos Quadrado
doTipo III)

df
(gl)

Mean
Squaref
(Quadrado
da M~ia)

Sig.

Partial Eta
Squared
(~' Parcial)

Sphericity Assumed
(Esfericidade assumida)

825.021

825.021

82.331

0.000

0.882

Greenhouse- Geisser
Huynh-Feldt

825.021
825.021
825.021

1.000
1.000
1.000

825.021
825.021
825.021

82.331
82.331
82.331

0.000
0.000
0.000

0.882
0.882
0.882

Lower-bound

36.150'

1.000

11.000

0.000

0.767

Error - alcohol
(Erro aleool)

Sphericity Assumed

10.021
10.021
10.021

623.521

623.521

36.150

0.000

0.767

623.521
623.521
623.521

1.000
1.000
1.000

623.521
623.521
623.521

36.150
36.150
36.150

0.000
0.000
0.000

0.767
0.767
0.767

Sphericity Assumed
(Esferieldade assumida)

189.729

11

17.248

Greenhouse-Geisser

189.729 11.000
189.729 11.000
189.729 11.000

17.248
17.248
17.248

Lower-bound

0.000

0.767

caffeine (cafeina)

Sphericity Assumed
(Esfericidade assumida)

0.000

0.696

Greenhouse-Geisser
Huynh-Feldt
Lower-bound
(limite inferior)

Error - caffeine
(Erro cafeina)

Huynh-Feldt
Lower-bound
(Limite inferior)

alcohol'caffeine
(aleool'cafeina)

Sphericity Assumed
(Esfericidade assumida)

305.021

305.021

25.184

0.000

0696

Greenhouse-Geisser
Huynh-Feldt

305.021
305.021
305.021

1.000
1.000
1.000

305.021
305.021
305.021

25.184
25.184
25.184

0.000
0.000
0.000

0.696
0.696
0.696

133.229

11

12.112

133.229 11.000
133.229 11.000
133.229 11.000

12.112
12.112
12.112

Lower-bound

caffeine (Cafeina)
alcohol'caffeine (A1coo"cafeina)

11 .... 10.021

110.229 11.000
110.229 11.000
110.229 11.000

Greenhouse-Geisser
Huynh-Feldt

Mauchly's Test of Sphericity" (Teste de Esfericidade de Mauchly")


Measure: MEASURE_l (Medida: Medida_l)

alcohol (A1cool)

110.229

(Esfericidade assumida>

(limite inferior)

a. Exact statistic (a. Estatistica e""ta)


b. Design: intercept (b. Projeto: Intefcepto)
Within Subjects Design: alcohol+caffeine+alcohol'caffeine (Projeto: dentre sujeitos - alcool+cafeina+aleool'cafeina)
Sig. = Significancia

Within Subjects Effect


(Efeito Oentre Sujeitos)

(Limite inferior)

(Tra~o

(Tra~o

359

Wde
Mauchly

Aprox.
Chi-Square
(Qui-Quadrado
Aproximado)

df
(gl)

1.000
1.000
1.000

0.000
0.000
0.000

0
0
0

(Limite inferior)

Epsilon'

S;g.

GreenhouseGeisser

Huynh-Feldt

Lower-bound
(Umite inferior)

1.000
1.000
1.000

1.000
1.000
1.000

1.000
1.000
1.000

Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is
proportional to an identity matrix (Testa a hipotese nula de que a matriz de covarionela dos erros da variavel dependente transformada
e ortonormalizada e proporcional a uma matriz de identidadeJ

a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the
Tests of Within-Subjects Effects table (a. Pode ser utilizado para ajustar os graus de Iiberdade para 0 teste de significancia ponderado.
Testes corrigidos sao mostrados na tabela dos efeitos dos testes dentre 5ujeitosJ

b. Design: intercept (Projeto: Intercepto) Within Subjects Design: alcohol +caffeine+alcoho"caffeine


(b. Projeto: dentre sujeitos-,jleool+cafeina+alcoo\'cafeina.)
Sig. = Significancia

Error - alcohol' caffeine Sphericity Assumed


(Esferieldade assumida)
(Erro aleool ' cafeina)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
(Limite inferior)
Sig. = Significancla

360

Estatlstica sem Matemiltica para Psicologia

Christine P. Dancey & John Reidy

Para poderrnos calcular 0 valor F no delineamento dentre participantes, temos que dividir
a variancia atribuida a cada efeito (media dos quadrados dos efeitos) pela variancia do erro
(media dos quadrados dos erros) que foi calculada para tal efeito. Assim. da saida, voce pode
verificar que 0 valor F para 0 efeito principal do aIcool e:

Test of Within-Subjects Contrasts (Teste dos Contrastes [)entre SUjeitos)


Measure: MEASURE- 1 (Medida: Medida 1)

Sou rce (Fonte)

alcohol

(~Icool)

Error (alcohol) (Erro - ~Icool)

Type III Sumo 01


Sq ua res (Soma
alcohol caffeine

dos Ouadrados
(~lcool)
(calelna)

do Tipo III)

df
(gl)

Mean
Squared
(Quadrado
da Media)

linear

825.021

825.021

linear

110.229

11

10.021

caffeine (calelna)

linear

623.521

623.521

Error - caffeine (Erro - calelna)

linear

189.729

11

17.248

alcohol"caffeine (~lcooJcalelna)

linear

Linear

305.021

305.021

Error (alcohol" caffeine)

(Erro - ~Icool calelna)

linear

linear

133.229

11

12.112

Sig.

Sig.

Partial Eta
Squared
(Tt' parcial)

82.331

0.000

0.882

36.150

0.000

0.767

25.184

0.000

0.696

Type III Sum of


Squares (Soma dos
Ouadrados do Tipo III)

(91)

Mean Squared
(Ouadrado da Media)

Sig.

Partial Eta
Squared
(Tt' Parcial)

Intercept
(Intercepto)

5786.021

5786.021

1022.772

0.000

0.989

Error (Erro)

62.229

11

5.657

Sig.

df

=82,331

Voce notara, ainda, na safda oferecida, que 0 numero total de graus de liberdade foi re
duzido dos 44 no delineamento entre participantes para II neste caso. A razao disso e que
temos agora apenas 12 participantes, enquanto na situa~ao anterior existiam 48 (12 em cada

10.6.2

Test of Within-Subjects effects (Teste dos Efeitos Dentre Sujeitos)


Measure: MEASURE 1 (Medida: Medida 1)

Transformed Variable: Average (Vari~veJtranslormada: media)

Source (Fonte)

825,021 + 10,021

condi~ao).

= Signilicancia

361

Efeitos simples

o mesmo conselho sobre os graftcos dos dados no delineamento entre participantes e


aplicavel a este caso. Temos os mesmos dados utilizados no delineamento entre participantes,
assim voce deve consultar a Figura 10.3 para 0 diagrama de barras de erro desses dados. Os
calculos para os efeitos simples devem ser guiados pelas instru~Oes ja fomecidas neste ca
pitulo, essencialmente equivalentes aos caIculos dos efeitos simples do delineamento entre
participantes. No entanto, temos que utilizar 0 teste I para amostras relacionadas em vez do
teste para amostras independentes. Os resultados dessas an3.1ises sao apresentados a seguir:
TESTE T

= Significancia

Paired Samples Statistics (Estalislicas para Amostras Emparelhadas)

~~.~~:~~~~~

Essencialmente, em urn projeto dentre participantes, a ANOYA analisa cada efeito prin
cipal como se fosse a ANOYA de uma classifica~ao. Dessa fonna, calcula a quantidade total
de varia~ao associada com cada efeito principal (isso inclui todas as fontes de varia~ao, in
clusive a do erro). A ANOYA subtrai, desta varia~ao global, a variabilidade que pode ser
atribuida ao efeito principal e a quantidade de variabilidade que pode ser atribuida ao efeito
dos participantes. A varia~ao restante e a variancia que nao pode ser explicada, ou seja, 0 ter
mo erro. Esse e exatarnente 0 mesmo procedimento explicado no Capitulo 9 para a ANOYA
dentre participantes de urn fator.
A maneira de calcular a intera~ao e semelhante a explicada para a ANOYA entre par
ticipantes anterionnente. Depois de calculados os efeitos principais e os seus tennos erros,
restara algum efeito que pode ser atribuido a intera~ao com 0 seu tenno erro. Uma vez cal
culada a soma dos quadrados para a pr6pria intera~ao e para 0 seu tenno erro, podemos
calcular a razao F. Como resultado dos calculos necessarios para aANOYA totalmente dentre
participantes, voce notara que na safda existe urn tenno erro separado para efeito principal e
para a intera~ao.

Pair 1
(Par 1)

Pair 2
(Par 2)

Pair 3
(Par 3)

Pair 4
(Par 4)

Std. Deviation
(Oesvio Padrao)

Std. Error
Mean (Erro
Padrao da Media)

12

3.31548

0.95710

5.7500

12

3.27872

0.94648

Alcohol no caffeine
(Com ~Icool e sem calelna)

21.2500

12

3.72034

1.07397

Alcohol caffeine
(Com ~lcool e com caleina)

9.0000

12

3.07482

0.88763

No alcohol no caffeine
(Sem ~lcool e sem calelna)

7.9167

12

3.31548

0.95710

Alcohol no caffeine
(Com ~lcool e sem calelna)

21.2500

12

3.72034

1.07397

No alcohol caffeine
(Sem ~lcool e com caleina)

5.7500

12

3.27872

0.94648

Alcohol caffeine
(Com ~lcool e com cafelna)

9.0000

12

3.07482

0.88763

Mean
(Media)
No alcohol no caffeine
(Sem ~lcool e sem calelna)

7.9167

No alcohol caffeine
(Sem ~Icool e com calelna)

362

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Paired Samples Correlations (Correla~6", das Amostras Emparelhadas)

Pode-se inferir a partir das saidas acima que;

Correlation
N

(Corre'a~ao)

Sig.

-0.353

0.260

Pair I
(Par 1)

No alcohol no caffeine &


No alcohol caffeine
(sem alcool e sem calefna &
(sem alcool e com calefna)

12

Pair 2
(Par 2)

Alcohol no caffeine &


Alcohol caffeine
(com alcool e sem caleina &
(com aleool e com careina)

12

-0.262

0410

Pair 3
(Par 3)

No alcohol no caffeine &


Alcohol no caffeine
(sem alcoal e sem cafeina &

12

-0.J53

0.635

0 efeito simples das condi<tOes da cafeina sem alcool (ver Figura 10.8 (a tern urn
valor I associado de I( II) = 1,38, P =0,194
0 efeito das condi<toes da cafeina com alcool (ver Figura 10.8 (b tern urn valor I
associado de 1(11) 7.84,p 0,001
0 efeito simples das condi<tOes da cafeina sem alcool (ver Figura 10.8 (c tern urn
valor t associado de I( II ) =8,64, p =0,00 I
0 efeito simples das condi<tOes da cafeina sem alcool (ver Figura 10.8 (d tern urn
valor t associado de I( II) =2,85, p =0,016

No alcohol caffeine &


Alcohol caffeine
(sem aleool e com cafeina &
com alcool e com careina)

12

0.225

0.481

Sig. = SignificanCia

Paired Samples Tests (Test'" das AmOSlras Emparelhadas)

Paired Differences (Direren~as Emparelhadas)

Std.
Deviation

Pair 1 No alcohol no caffeine


(Par 1) No alcohol caffeine
(sem alcool e sem caleina (sem alcool e com caleina)
Pair 2 Alcohol no caffeine
(Par 2) Alcohol caffeine
(com alcool e sem cafeina (com alcool e com caleina)
Pair 3 No alcohol no caffeine
(Par 3) Alcohol no caffeine
(sem alcool e sem caleina com alcoal e sem cafeina)
Pair 4 No alcohol caffeine (Par 4) Alcohol caffeine
(sem alcool e com caleina com alcool e com caleina)
Sig. = SignificanCia

95% Confidence
Interval of the
Difference (lC de
Std. Error 95% para a Diferen~a)
Mean
(Erro Padrao
Lower
Upper
da Media) (Inferior) (Superior)

df
(gl)

Sig. (2-tailed)
(5ig.
Bilateral)

5.61317

1.384

11

0.194

8.8110

15.689

7.840

11

0.000

1.54397

-16.73

-9.9351

-8.636

11

0.000

1.14233

-5.764 -0.73574 -2.845

II

0.016

Mean
(Media)

Padrao)

2.16667

5.42441

1.56589

-1.280

12.250

5.41253

1.56246

-13.333

5.34846

-3.2500

3.95716

(Oesvio

Essas analises informam que, com exce<tao de dlla& condi<toes da cafeina na condi<tao sem
alcool, as diferen<tas entre os pares de media sao tais que e altamente improvavel de terem
ocorrido apenas por erro amostral, se a hip6tese nula e verdadeira. No entanto, se utilizarmos
urn criterio de significancia mais conservador de 0,0125 (0,05 + 4), teriamos de admitir que 0
efeito simples final nao e significativo. embora esteja muito perto de ser.
E importante reconhecer que, para delineamentos que incluem fatores dentre partici
pantes. a anaIise dos efeitos simples pode ser complicada. A explica<tao para isso esta al6m
dos objetivos deste texto; assim, por ora, suficiente que voc~ entenda 0 que sao os efeitos
simples. Voce deve tam bern ficar atento para nao realizar muitas analises em urn conjunto de
dados. a fim de manter baixo 0 erro conjunto. Se voc~ quer descobrir mais sobre a determina
<tao dos termos erro para efeitos simples no delineamento dentre participantes, consulte urn
dos textos sugeridos no final deste capitulo.

com alcool e sem cafeina)

Pair 4
(Par 4)

363

10.6.3

Tamanho do efeito
A medida do tamanho do efeito mais apropriada para urn delineamento dentre partici
pantes e novamente 0 1]2 parcial. Voc~ pode verificar a partir da safda da pagina 359 que 0
1]2 parcial para 0 efeito principal da variavel alcool 6 0,88, para 0 efeito principal da variavel
cafefna e 0.77 e para a intera<tao vale 0,70.

10.6.4

Relato das analises

relat6rio das analises desse caso igual ao do exemplo do delineamento entre partici
pantes feito anteriormente neste capitulo. Tudo 0 que voc~ vai precisar alterar 6 a descri<tao
do projeto daANOVA, assim:

numero de eITOS ao volante foi analisado com uma ANOYA de medidas repetidas com dais
fatores de alcool dentre participantes (com versus sem alcool) e cafefna (com verSus sem cafeina) ...

o restante do relato sera 0 mesmo, exceto pela altera<tao dos valores F,p e I.

364

365

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

Exemplo da literatura:

graus de atratividade de formatos de corpos de mulheres

Digitados os dados, clique no menu Analyze (Analisar) e em seguida em General Linear


Model (Modelo Linear Geral) e, apOs, em Repeated Measures (Medidas Repetidas):

Urn estudo relatado por Forestell e colaboradores (2004) investigou os graus de atratividade de
diferentes fonnas de corpos femininos. Os pesquisadores apresentaram aos participantes desenhos
de pessoas com diferentes pesos e raz5es cintura-quadril (CQ).2 Existiam tres diferentes categorias
de pesos (Ieves, moderados e pesados) e cinco diferentes raz5es CQ variando de 0,5 ate 0,9. Pesqui
sas anteriores mostraram que mulheres tendem a achar fonnas com CQ de 0,7 as mais atrativas.

-,-

A taxa de atratividade foi analisada utilizando uma ANOVA de medidas repetidas (dentre parti
cipantes) com peso corporal e CQ como varidveis independentes. A varidvel dependente foi a taxa de
atratividade dada pelos participantes. A andlise revelou efeitos principais significativos tanto do peso
(F(2. 41) = J1,70, p < 0.005) quanto da raziio CQ (F(4, 39) = 29,92, p < 0,001). Foi encontrada ainda
uma interafiio significativa entre as varidveis independentes (F(8. 35) =45,50. P < 0,001). Os pesquisa
dores investigaram essa interafiio utilizando um teste de Bonferonni que comparau vdrios CQ para peso
corporal separadamente. Descobriram que, para todos os pesos, as mulheres com uma taxa de CQ ten
dendo a 0,7 foram consideradas as mais atrativas. Entretanto, para pesos moderados, um grande leque
de CQforam considerados atrativos quando comparados com corpos deformas leves ou pesadas.

-------

-----i~---L--~

~------I--,

.--.-j

'----1P

!Ii!iI......,:;r~i:~~.:i:~~;itpjs~i~~::~l@ii.;"ciI.&*~~~
~:.~:...~1J.~~~-~~_t.E~_4::l~I~aM1~_.

[gj SPSSpW:Af(~A~~~ ~rlidpantei(ij"~i~~~rE'~~i

Selecionado Repeated Measures (Medidas Repetidas), aparecera a seguinte caixa de


diaIogo. Isso deve ser familiar a voce, ja que e 0 mesmo procedimento da ANOVA dentre
participantes de uma c1assificas;ao.

Em urn delineamento completamente dentre participantes, temos quatro escores para


cada pessoa e precisamos definir quatro variaveis no arquivo de dados.

~(1-f{d~t;ri~r~

~J-~~~:t:~!:

'~pa9~tfO:,;

,=

~;,Q~~>~<, .

i!'~r~
400
22.00 I
6.00
9.00

2UDI

14.00

III
8.00
6.001
6,001
3.00
.00
0.00

27.1Il
21JlJ
>J1Il1

a.1Il
14.00
Sill

19.oo\

11.00

16.00
25.00
1700

8.00
10,00
'1.00

a.1Il

>J.1Il

9.001

19.001

li&~;:

'PlIr.i~nflrmar

8,00

a.1Il

t~

I~I

..

I~

.e~7J=~~~:. ::;~
2

Waisl-to-Hip Ratios (WHRs).

Quando atribuir nomes as variaveis dentre participantes, devera lembrar de qual no


meou primeiro, pois isso e importante quando definir cada variavel na caixa de dialogo
seguinte.

366

Christine P. Dancey & John Reidy

'~~~~:~a~~~~~~~1~tk:rit~~~ ,

ao software quais variaveis devem fazer parte de cada teste t (lembre-se de que estamos utili
zando 0 teste t para amostras relacionadas). Se quisermos examinar a diferenr,;a entre os grupos
com e sem alcool na condir,;ao sem cafefna, devemos executar urn teste t relacionado nas varia
veis sem alcool e sem cafefna, bern como com alcool e sem cafefna. Se quisermos examinar as
diferenr,;as entre as condir,;oes com e sem cafefna na condir,;ao com alcool, devemos realizar urn
teste t com as variaveis com alcool e sem cafefna, e com alcool e com cafefna.

10,7

Quando voce move variaveis de uma caixa para outra, precisa faze-Io na ordem correta.
Esse e 0 motivo pelo qual precisa lembrar da ordem em que definiu as variaveis na caixa de
diaIogos anterior. Na caixa de dialogos Within-Subjects Variables (Variaveis dentre Sujeitos),
voce pode ver que cada entrada tern urn codigo de dois dfgitos, por exemplo, (I, 2). Esse
c6digo informa que a entrada em particular representa a primeira condir,;ao da variavel I e a
segunda condir,;ao da variavel 2. Lembre: definimos alcool como a primeira variavel e cafeina
como a segunda. Se voce acha que nao lembra a ordem em que nomeou as variaveis, 0 SPSS
PW fomece uma dica proximo ao topo da caixa de diaIogo. Conseqiientemente, cada codigo
representa as seguintes condir,;oes:

367

Estatistica sem Matematica para Psicologia

(I, I) = sem aIcooV sem cafefna


(I, 2) sem aIcooV com cafefna
(2, I) =com aIcooV sem cafefna
(2, 2) =com aIcooV com cafefna

Portanto, as variaveis precisam ser movidas para 0 local especffico na caixa Within
Subjects Variables (Variaveis dentre Sujeitos). Quando voce tiver movido todas as variaveis
relevantes para 0 local apropriado clique no botao Options (Opr,;oes) e marque a opr,;ao Effect
Size (Tamanho do Efeito), como feito com 0 delineamento entre participantes anterior. Clique
no botao Continue (Continuar) e no botao OK para executar a analise. Voce deve ser apresen
tado a safdas semelhantes as anteriores.
A analise dos efeitos simples e urn pouco mais complicada do que no delineamento an
terior. Nesse caso, nao precisamos solicitar que 0 SPSSPW divida 0 arquivo porque cada
participante fomeceu valores para todas as condir,;oes. Assim, simplesmente temos de informar

Uma variavel entre e outra dentre participantes

a ultimo delineamento abordado neste capftulo e uma mistura dos delineamentos en


tre e dentre participantes. Tal analise e muitas vezes denominada de ANOVA subdividida
(split-plot ANOVAI). Continuaremos com 0 exemplo alcooVcafefnaldirer,;ao, mas dessa vez
vamos considerar que a variavel independente alcool e urn fator dentre participantes, e a
variavel independenle cafefna sera tomada como urn fator entre participantes. A alocar,;ao
dos participantes as condir,;Oes e seus escores na habilidade de dirigir estao apresentados
na Tabela 10.6.
Como estamos utilizando os mesmos dados que as analises anteriores, podemos inferir
que as suposir,;oes necessanas foram satisfeitas. Novamente, esse e 0 caso porque temos
apenas duas condir,;oes na variavel independente dentre participantes. Se tivessemos mais
do que duas condir,;oes, precisarfamos nos assegurar de que a hipotese de esfericidade e
verdadeira.
Como feito com as duas ANOVAs anteriores, a primeira coisa com que devemos nos pre
ocupar sao as possfveis fontes de variar,;ao nesse delineamento subdividido. Voce podera ver
pela safda da analise que a variavel independente entre participantes tern seu proprio termo
erro. A analise de uma variavel independente entre participantes e semelhante a realizar uma
ANOVA de urn fator, ignorando a variavel independente entre participantes.
Tabela 10.6 Distribuir,;ao dos escores as condir,;iies num delineamento de pan:elas subdivididas (split-plot)

.:~:',; ,~';;,'

' "Sem aII~l.

,';n'

""J:~:"c;~']Z::>~i~~~f;'~l~~\t'.i':_~.:>

~:~ :sem~efna'''''':~~~'~-:!~:S=~~~~~B~::
I

2
3
4

5
6
7

8
9
10
11
12

4
9
10

8
6
1\
2
II
II
10
3
10

8
4
9
0
8
6
6
3
0
8
9
8

13
14
15
16

17
18
19
20
21
22
23
24

28

22
21
27
21
20
19
16
25
17
19
20

5
6
14
8
14
5
II
8
10
II
8
8

368

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Test of Within-Subjects Effects (Teste dos Efeltos Dentre Sujeltos)


Measure: MEASURE 1 (Medida: Medida - 1)

MODELO LINEAR GERAL

Within-Subjects Factors (Fatores Dentre Sujeitos)

Medida-Medida-l

nocaffeine (sem eafelna)

caffeine (com cafelna)

cafgroup

cafgroup*alcgroup

WithinSubjects Factors (Fatores Dentre Sujeitos)

alcgroup

1.00
2.00

Value label (R6tulo)

No alcohol (Sem ~lcool)

12
12

Alcohol (Com ~lcool)

Error(cafgroup)
(Erro (eafgroup

Multivariate Tests' (Testes Multivariados')

Efeito
cafgroup

Cafgroup*alcgroup

Pillai's Trace
(Tra~o de Pillai)
Wilks' Lambda
(lambda de Wilks)
Hotelling's Trace
(Tra~o de Hotelling)
Roy's Largest Root
(Maior raiz de Roy)
Pillai's Trace
(Tra~o de Pillai)
Wilks' Lambda
(lambda de Wilks)
Hotelling's Trace
(Tra~o de Hotelling)
Roy's Largest Root
(Maior raiz de Roy)

Hypothesis df
(gl da Hip6tese)

Error df
(gl do Erro)

Sig.

Partial Eta
Squared
(~2 Parcial)

42.474'

1.000

22.000

0.000

0.659

0.341

42.474'

1.000

22.000

0.000

0.659

1.931

42.474'

1.000

22.000

0.000

0.659

Value
(Valor)

0.659

Type III Sum of


Squares (Soma dos
Quadrados do ripe III)

df
(gl)

Mean
Squared
(Quadrado
da M~ia)

Sig.

Partial Eta
Squared
(~' ParciaQ

Sphericity Assumed
(Esferieidade assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
(limite inferior)

623.521

623.521

42.474

0.000

0.659

623.521
623.521
623.521

1.000
1.000
1.000

623.521
623.521
623.521

42.474
42.474
42.474

0.000
0.000
0.000

0.659
0.659
0.659

Sphericity Assumed
(Esfericidade assumida)
Greenhouse-Geisser
Huynh.Feldt
Lower-bound
(limite inferior)

305.021

305.021

20.778

0.000

0.486

1.000
1.000
1.000

305.021
305.021
305.021

20.778
20.778
20.778

0.000
0.000
0.000

0.486
0.486
0.486

Sphericity Assumed
(Esferieidade assumida)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound

322.958

22

14.680

322.958
322.958
322.958

22.000
22.000
22.000

14.680
14.680
14.680

Sig.

Partial Eta
Squared
(~2 Parcial)

Source (Fonte)

Dependent Variable
(Vari~vel Dependente)

cafgroup

(Limite inferior)

Test of WithinSubjects Contrasts (Teste dos Contrastes Dentre Sujeit",,)


Measure: MEASURE 1 (Medida: Medida 1)

Source (Fonle)

cafgroup

Type III Sum of


Squares (Soma dos
Quadrados do Tipe III)

Mean
Squared
(Quadrado

df
(gl)

daM~ia)

42.474'

1.000

22.000

0.000

0.659

cafgroup

Linear

623.521

623.521

42.474

0.000

0.659

0.486

20.778'

1.000

22.000

0.000

0.486

cafgroup*alcgroup

Linear

305.021

305.021

20.778

0.000

0.486

322.958

22

14.680

20.778'

1.000

22.000

0.000

0.486

Error(cafgroup)
(Erro (cafgroup

Linear

0.514
0.944

20.778'

1.000

22.000

0.000

0.486

0.944

20.778'

1.000

22.000

0.000

0.486

Mauchly's Test of Sphericity" (Teste de Esfericidade de Mauchly')


Measure: MEASURE 1 (Medida: Medida- 1)

Sig. = Significancia
Test of Within-Subjects Effects (Teste dos Efeitos Dentre Sujeitos)

Measure: MEASURE_l (Medida: Medida_l)

Transformed Variable: Average (variavel Transfonmada: ml!dia)

Type III Sum of


Squares {Soma dos
Quadrados do ripe III)

df
(gl)

Mean
Squared
(Quadrado
da Ml!dia)

5786.021

5786.021

F
738.106

0.000

0.971

alcgroup

825.021

825.021

105.245

0.000

0.827

Error (Erro)

172.458

22

7.839

intercept (Inlereepto)
Epsilon'

cafgroup

305.021
305.021
305.021

Sig. = Signifidlncia

Source (Fonle)

Mauchly's W
de Mauehly)

Aprox. Chi-Square
(Qui-Quadrado
Aproximado)

df
(gl)

1.000

0.000

(W

1.931

a. Exact statistic (a. Estatistica e""ta)


b. Design: intercept+alcgroup (b. Projeto: Intercepto + alegroup)
Within Subjects Design: cafgroup (Projelo: Oentre Sujeilos - cafgroup)
Sig. = Significancia

Within Subjects Effect


(Eleilo Dentre Sujeilos)

369

Sig.

GreenhouseGeisser

1.000

Huynh-Feldt

Lowerbound
(Limile Inferior)

1.000

1.000

Tests the null hypothesis that the error covariance matrix of the orthonormalised transformed dependent variables is proportional
to an identity matrix (Tesla a hip6lese nula de que a malnz de eovanancia dos erros da vanavel dependente transformada e ortonormalizada ~
proporcional a uma malnz de idenlidade.)
a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected lest are displayed in the Tests of
Within-Subjects Effects table (a. Pode ser ulilizado para ajuslar os graus de liberdade para 0 lesle de signifieancia ponderado. Testes eorrigidos
sao mostrados na labela dos efeilos dos tesles dentre sujeilos.)
b. Design: intercept+alcgroup (b. Projelo: Intereepto+alegroup)
Within Subjects Design: cafgroup (Projelo: dentre sujeilos - cafgroup)
Sig. = Significancia

Sig.

Partial Eta
Squared
(~z Parcial)

Sig. = SignificanCla

A parte da ANOVA dentre participantes edividida em tres: 0 efeito principal da cafefna,


a interac;ao entre os fatores 3lcool e cafefna e 0 terrno erro para esta parte da analise. Assim,
no delineamento das parcelas divididas (split-plot design), temos urn tenno erro para a parte
dentre participantes da an31ise e urn terrno erro para a parte da an31ise entre participantes. A
interac;ao entre alcool (entre participantes) e cafefna (dentre participantes) e parte da saida
dentre participantes porque tern urn componente dentre participantes. Isto e, urn dos terrnos
de interac;ao (cafefna) e dentre participantes.

370

Christine P. Dancey & John Reidy

Estatistica sem Matematica para Psicologia

Voce pode ver, a partir da saida da ANOVA subdividida anteriormente, que 0 efeito
principal do fator a1cooltem urn valor F de 105,25 (825,02 + 7,84) com uma probabilidade
associada de p < 0,001. a efeito principal do fator cafeina tern urn valor F de 42,47 (623,52 +
14,68) com uma probabilidade associada de p < 0,001.

10.7.1

GRUPO DO ALCOOL

371

= ALCOOL

Paired Samples Statistics' (Estatistieas das Amostras em Pares')

Efeitos simples

Pair 1
(Par 1)

A analise dos efeitos simples e semelhante adescrita anteriormente para 0 delineamento


dentre e entre participantes. Mais uma vez, voce deve estar ciente dos problemas com a taxa
de erro de conjunto e de que, em qualquer delineamento com fatores dentre participantes, os
termos erro nao sao simples. Como nos exemplos anteriores, voce deve examinar seus efeitos
simples utilizando testes t. as testes t para esses dados estao apresentados a seguir. Note que
no delineamento subdividido, em virtude de termos variaveis dos tipos entre e dentre, voce
precisara utilizar tanto 0 teste t independente quanto 0 relacionado.

a. alcgroup

Std. Error Mean


(Erro Padr,;o
da Media)

Media

Std. Deviation
(Desvio Padr,;o)

No caffeine
(Sem eafeina)

21.2500

12

3.72034

1.07397

Caffeine
(Com eafeina)

9.0000

12

3.07482

0.88763

= Alcohol (a. alegroup = Com aleool)

Paired Samples Correlations' (Correla,6es de Amoslras em Pares')

Pair 1
(Par 1)

No caffeine & Caffeine


(Sem cafeina/eom cafeina)

a. alcgroup = Alcohol (a. alegroup


Sig. = Significancia

TESTE T

GRUPO DO ALCOOL = SEM ALCOOL

Correla~ao

Sig.

12

-0.262

0.410

= Com aleool)

Paired Samples Test' (Teste para Amostras em Pares')


Paired Differences (Dileren,as em Pares)

Paired Samples Statistics' (Eslatisticas das Amostras em Pares')

Pair 1
(Par 1)

No caffeine
(Sem eafeina)

7.9167

12

3.31548

5.7500

Caffeine
(Com cafeina)
a. alcgroup

Media

Std. Deviation
(Desvio Padr,;o)

Std. Error Mean


(Erro Padr,;o
da Media)
0.95710
0.94648

3.27872

12

Std.
Deviation
(Desvio
Mean
(Media)
Padr,;o)
Pair 1
(Par 1)

= No alcohol (a. alegroup = Sem aleool)

No caffeine & caffeine


(Sem cafeina/Com eafeina)

a. alc9roup = Alcohol (a. aregroup

12.250

5.41253

Std. Error
Mean Erro
(Padrao
da Media)
1.56246

95% Confidence
Interval of the
Difference (IC de
95% para a Diferen,a)
Lower
(Inferior)

Upper
(Superior)

df
(gl)

Sig. (2-tailed)
(Signifie,;neia
Bilaleral)

8.8110

15.689

7.840

11

0.000

= Com aleool)

Paired Samples Correlations' (Correla,oes de Amostras em Pares')

Pair 1
(Par 1)

No caffeine & Caffeine


(Sem eafeina/eom eafeina)

a. alcgroup = No alcohol (a. alegroup


Sig. = Significancia

Correla~ao

Sig.

12

-0.353

0.260

TESTE T

= no aleool)

Group Statistics (Estatistieas des Grupos)

Paired Samples Test' (Teste para Amostras')

alcgroup
Paired Differences (Diferen,as em Pares)

Pair 1
(Par 1)
a. alcgroup

No caffeine & Caffeine


(Sem eafeina/Com cafeina)

Mean
(Media)

Std.
Deviation
{Desvio
Padr,;o)

Std. Error
Mean Erro
(Padr,;o
da Media)

2.167

5.42441

1.56589

= No alcohol (a. alegroup = Sem aleool)

No caffeine
(Sem eafeina)

95% Confidence
Interval of the
Difference (IC de
95% para a Diferen,a)
Lower
(Inferior)

Upper
(Superior)

1.27984

5.61317

df
(gl)

Sig. (2-tailed)
(Signifie,;neia
Bilateral)

1.384

11

0.194

Com caffeine
(Com cafeina)

No alcohol
(Sem aleool)
Alcohol
(Com aleool)
No alcohol
(Sem aleool)
Alcohol
(Com aleool)

Mean
(Media)

Standard
Deviation
(Desvio Padr,;o)

Std. Error Mean


(Erro Padr,;o
da Media)

12

7.9167

3.31548

0.95710

12

21.2500

3.72034

1.07397

12

5.7500

3.27872

0.94648

12

9.0000

3.07482

0.88763

372

Estatistica sem Matematica para Psicologia

Christine P. Dancey & John Reidy

~~i;~

Independent Samples Test' (Teste para Amos"as Independentes)


Levene's Test
for Equality of
Variances
(Teste de Levene
para a Igualdade

t-test for Equality of Means


(Teste I para a Igualdade de Medias)

de Variancias)

F
No
caffeine
(Sem
(afelna)

0.005

Equal variances
assumed (lgualdade

Sig.

0.945 -9.269

Mean
Sig.
(Hailed) Difference
df
(Sig.
(Diferenl;d
(gl)
Bilateral) das Medias)

22

0.000 -13.33333

95% Confidence
Interval of the
Difference (lC de 95%
Std. Error
para a Djferen~a)
Difference
Upper