You are on page 1of 30

AS TECNICAS DE

INTRODUC
AO
PESQUISA
RICARDO S. EHLERS

Departamento de Estatstica
Universidade Federal do Parana

c RICARDO SANDES EHLERS 2003


Sum
ario
1 Introdu
c
ao
1.1 A Natureza da Ciencia . . . . . . . . . . . . . . . . . . . . . . . .
1.2 O Estudo Cientfico . . . . . . . . . . . . . . . . . . . . . . . . .

1
1
1

2 A Pesquisa Cientfica
2.1 Preparacao . . . . . . . . . . . . . . . . .
2.2 O Projeto de Pesquisa . . . . . . . . . . .
2.3 Execucao da Pesquisa . . . . . . . . . . .
2.4 Comunicacao/Divulgacao dos Resultados

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

3
3
3
4
4

3 Refer
encias Bibliogr
aficas
3.1 Livro . . . . . . . . . . . . . . . . .
3.2 Periodicos . . . . . . . . . . . . . .
3.3 Documentos de Eventos . . . . . .
3.4 Glossario de termos e abreviaturas

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

5
5
6
6
6

4 Divulga
c
ao dos Resultados
4.1 Comunicacao Escrita . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Comunicacao Oral . . . . . . . . . . . . . . . . . . . . . . . . . .

9
9
9

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

5 Considera
co
es sobre Assessoria Estatstica
5.1 Problemas . . . . . . . . . . . . . . . . . . .
5.2 Expectativas . . . . . . . . . . . . . . . . .
5.3 Atitudes do Estatstico . . . . . . . . . . . .
5.4 Sobre co-autorias . . . . . . . . . . . . . . .
5.5 Sobre teses e dissertacoes . . . . . . . . . .
6 Erros em Estatstica
6.1 Paradoxo de Simpson . . . . . . . .
6.2 Comparando abacaxi com banana . .
6.3 Testando hipoteses . . . . . . . . . .
6.4 Correlacao nao significa causalidade
6.5 Graficos . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

13
13
14
14
16
16

.
.
.
.
.

17
17
18
19
19
19

7 Vari
aveis
23
7.1 Classificacao de Variaveis . . . . . . . . . . . . . . . . . . . . . . 23
7.2 Relacoes entre Variaveis . . . . . . . . . . . . . . . . . . . . . . . 24
i


SUMARIO

ii

7.3
7.4

7.2.1 Relacao Simetrica .


7.2.2 Relacao Recproca .
7.2.3 Relacao Assimetrica
Variaveis Moderadoras . . .
Variaveis de Controle . . . .

References

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

24
24
25
25
25
27

Captulo 1

Introduc
ao
1.1

A Natureza da Ci
encia

O metodo cientfico e uma forma de producao de conhecimento que se caracteriza pela combinacao entre especulacoes logicas abstratas e verificacoes praticas
concretas. Podemos enumerar as seguintes caractersticas.
um conjunto de paradigmas para a observacao, identificacao, descricao,
1. E
investigacao experimental e explanacao teorica de fenomenos;
2. Envolve tecnicas exatas, objetivas e sistematicas, implementadas atraves
de regras fixas para a formacao de conceitos, para a conducao de observacoes e de experimentos, e para a validacao de hipoteses explicativas;
3. O objetivo maior nao e o de saber como as coisas realmente sao, mas sim
o de desenvolver explicacoes que auxiliem na interacao com o mundo, ou
seja: previsao (o que vai acontecer) e controle (como se pode intervir).
A Ciencia requer obrigatoriamente o uso da Matematica, a sua linguagem
fundamental. Como conseq
uencia, o saber cientfico e caracterizado pela sua
logica, objetividade e verificabilidade logica.

1.2

O Estudo Cientfico

Em um estudo cientfico podemos identificar tres tipos de variaveis que estao


invariavelmente presentes.
Variaveis preditivas (ou independentes ou explicativas). Sao aqueles que
se observa ou manipula para se verificar a relacao entre suas variacoes e
o comportamento de outras variaveis.
Variaveis resposta (ou dependentes). Sao as variaveis de interesse, cujo
comportamento se deseja verificar em funcao de variacoes nas variaveis
preditivas.
Variaveis esp
urias (ou estranhas). Nao sao diretamente objeto de estudo
mas interferem na relacao entre as variaveis resposta e preditivas.
1

CAPITULO 1. INTRODUC
AO

Captulo 2

A Pesquisa Cientfica
De um modo geral podemos identificar as fases de uma pesquisa cientifica como:
preparacao, projeto, execucao e divulgacao dos resultados. A seguir estas fases
sao detalhadas em suas principais caracteristicas.

2.1

Preparac
ao

1. Escolha do tema. Qual sera o objeto de estudo?


2. Delimitacao do problema. Que problemas existem no objeto de estudo?
3. Revisao bibliografica. O que ja foi estudado sobre o tema? Quais os
achados cientficos? Que questoes permanecem em aberto? Qual o estado
da arte?

2.2

O Projeto de Pesquisa

1. Descricao do problema.
(a) Introducao e formulacao da situacao-problema.
(b) Justificativa. Por que estudar este problema? qual a sua relevancia?
quais sao os benefcios esperados?
(c) Objetivos. O que se espera obter?
(d) Formulacao das hipoteses de interesse (geralmente embasadas em
teorias) e descricao das variaveis envolvidas.
(e) Delimitacao do estudo. Limites de tempo, recursos, acesso, etc.
(f) Definir os termos e abreviaturas.
2. Metodologia.
(a) Identificar o tipo de pesquisa.
(b) Populacao alvo, plano de amostragem.
(c) Instrumentacao a ser utilizada.
3

CAPITULO 2. A PESQUISA CIENTIFICA

(d) Plano de coleta de dados, metodos estatsticos para analise dos dados.
3. Cronograma. Estabelecer um cronograma de execucao com datas limites
para a finalizacao de cada etapa.
4. Referencias bibliograficas.

2.3

Execuc
ao da Pesquisa

1. Elaboracao dos instrumentos. Estamos medindo o que realmente queremos medir?


2. Estudo piloto.
3. Coleta de dados.
4. Analise estatstica.
5. Avaliacao das hipoteses de interesse. Aceitacao ou modificacao destas
hipoteses a` luz dos conhecimentos existentes e das analises feitas.

2.4

Comunicac
ao/Divulgac
ao dos Resultados

1. Relatorio de pesquisa.
2. Comunicacao oral.
3. Artigo cientfico, etc.

Captulo 3

Refer
encias Bibliogr
aficas
A indicacao de todas as fontes de informacao efetivamente utilizadas e parte
obrigatoria de qualquer trabalho de pesquisa. Alem disso, as referencias bibliograficas sao um importante indicador da qualidade do trabalho desenvolvido.
Assim, referencias a autores consagrados e trabalhos inovadores naquela area
de pesquisa sao uma indicacao de que o autor fez uma boa revisao bibliografica
do assunto e esta atualizado quanto aos principais inovacoes. A seguir serao
apresentadas as normas para referencias bibliograficas segundo Associacao Brasileira de Normas Tecnicas (ABNT).
As referencias bibliograficas devem ser relacionadas em uma lista propria,
numerada sequencialmente, em ordem alfabetica de sobrenome de autor e ttulo.
Esta lista aparece no final do trabalho com o ttulo de Bibliografia. Geralmente,
cada item da lista se inicia pelo u
ltimo sobrenome do autor seguido dos prenomes (exceto para sobrenomes compostos) e quando nao houver autoria pessoal
inicia-se pelo ttulo. Pode-se utilizar negrito, italico ou sublinhado para o ttulo.

3.1

Livro

Para citacao de um livro ou um captulo de livro podemos usar os seguintes


modelos,
(a) SOBRENOME DO AUTOR, nome. Ttulo do livro: subttulo. Local de
publicacao (cidade): Editora, data. N
umero de paginas ou volumes.
(b) AUTOR DO CAPITULO. Ttulo do captulo. In: AUTOR DO LIVRO.
Ttulo do livro: subttulo. Local de publicacao: Editora, ano. Volume,
captulo. Paginas inicial e final.
Por exemplo,
1. BUSSAB, W.O. e MORETTIN, P.A. Estatstica B
asica.
Atual, 1987.

Sao Paulo:

2. JAMES, B.R. Probabilidade: um Curso em Nvel Intermedi


ario. Rio de
Janeiro: Livro Tecnico, 1981.
5

CAPITULO 3. REFERENCIAS
BIBLIOGRAFICAS

3. GAMERMAN, D. e SMITH, A.F.M. A Bayesian Analysis of Longitudinal


Data Studies. In: Bayesian Statistics 5, ed. J. Bernardo. Oxford: Oxford
University Press, 1996.

3.2

Peri
odicos

Podemos citar um periodico (ou revista) considerado como um todo, i.e. sem
uma referencia pessoal, ou artigos em um periodico. Os seguintes modelos de
citacao podem ser usados,

(a) TITULO DO PERIODICO.


Local de publicacao (cidade): Editor, volume,
n
umero, mes e ano.
(b) AUTOR. Ttulo do artigo. Ttulo do periodico. Local de publicacao, no
fascculo, paginas inicial e final, mes e ano.
Por exemplo,

1. CIENCIA
HOJE. Sao Paulo: Sociedade Brasileira para o Progresso da
Ciencia, v.27, no 160, jun. 2001.
2. CORDEIRO, G.M. e FERRARI, S.L.P. A Modified Score Test Having
Chi-squared Distribution to Order n1 . Biometrika. London, v. 78, p.
573-582, 1991.

3.3

Documentos de Eventos

Trabalhos apresentados em eventos como congressos, seminarios e encontros sao


citados da seguinte forma,
(a) AUTOR. Ttulo do trabalho. In: NOME DO EVENTO, no, data, local.
Anais... ou Resumos... ou Procedings... Local: Editora, data. Paginas
inicial e final do trabalho.
Por exemplo,
1. MIGON, H.S. e LOPES, H.F. Sensibilidade da funca
o de resposta-impulso
a distribuica
o a priori em modelos BVAR: um exerccio usando integraca
o
de Monte Carlo. In: ENCONTRO BRASILEIRO DE ECONOMETRIA,
XVI, 1995, Recife. Proceedings, v. 2. Sao Paulo: Sociedade Brasileira de
Econometria, 1995, p.753-774.

3.4

Gloss
ario de termos e abreviaturas

Alguns termos e abreviaturas ocorrem com certa frequencia em publicacoes


cientficas. A lista a seguir nao pretende ser exaustiva e certamente o leitor ira
se deparar com outros termos ao longo de sua experiencia.


3.4. GLOSSARIO
DE TERMOS E ABREVIATURAS

Anexo, apendice: material suplementar que acompanha o texto de uma


publicacao como esclarecimento ou documentacao, mas que nao constitui
parte essencial do trabalho. Considera-se apendice quando o material
foi elaborado pelo autor, por exemplo a demonstracao de um teorema, e
anexo quando o material se origina de outras fontes.
c. ou cap.: captulo.
cf.: conforme.
ca. ou circa: em torno de.
exempli gratia (e.g.): por exemplo.
id est (i.e.): isto e.
id (idem): do mesmo autor.
inf. ou infra: abaixo.
loc. cit. (loco citado): no lugar citado.
opus citatum (op. cit.): obra ja citada anteriormente.
p.: pagina(s)
p. ex.: por exemplo
palavras-chave: lista com ate seis palavras representativas do tema do
trabalho.
referee (arbitro): avaliador de artigos submetidos a periodicos, congressos,
etc.
seq. (sequentia): que se segue.
sine loco (s.l.): quando falta o local de publicacao da obra.
sine nomine (s.n.): quando falta a editora da obra.
v.: volume.
comum usar a traducao ver.
vide (vid.): ver a citacao ja referenciada. E
videlicet (viz.): a saber.

CAPITULO 3. REFERENCIAS
BIBLIOGRAFICAS

Captulo 4

Divulgac
ao dos Resultados
4.1

Comunicac
ao Escrita

Algumas recomendacoes gerais sao as seguintes.


1. Nao colocar excesso de paragrafos no texto. Lembre-se que um paragrafo
em geral indica mudana de assunto.
2. Na primeira pagina deve constar o titulo do trabalho, seu nome e filiacao,
o resumo e as palavras-chave.
3. As secoes nao podem ser grandes demais nem pequenas demais.
4. Os dados so podem ser divulgados com autorizacao do pesquisador e seu
nome deve ser citado (...estes dados foram gentilmente cedidos por fulano
de tal). Eles devem aparecer no formato de uma tabela em anexo.
5. Substitua as saidas do pacote utilizado por tabelas adequadas e em portugues.
6. Todas as tabelas e figuras devem ser numeradas.

4.2

Comunicac
ao Oral

A ideia de falar em p
ublico deixa qualquer pessoa nervosa. Inibicao, nervosismo, ansiedade, etc ocorrem em maior ou menor grau com qualquer pessoa ao
falar em p
ublico. Este quadro entretanto pode ser controlado, atraves de uma
cuidadosa preparacao.
A preparacao cuidadosa e com a devida antecedencia e o fator mais importante para o sucesso de uma apresentacao oral. Mesmo quando o apresentador
tem muita experiencia com o tema do trabalho. A seguir sao listadadas algumas sugestoes u
teis na elaboracao de material e de comportamento durante a
apresentacao.
9

DOS RESULTADOS
CAPITULO 4. DIVULGAC
AO

10

Elaborac
ao de Transpar
encias
1. Calcule uma transparencia por minuto.
2. Evite excesso de informacao na transparecnia. Sugere-se utilizar 7 linhas
e 7 palavras por linha no maximo.
3. Refaca tabelas publicadas se julgar que sao inadequadas.
4. Nao use letras pequenas demais.
5. Nao inclua tabelas muito grandes. Sugere-se usar no maximo 4 linhas em
tabelas de 2 colunas, e 3 linhas em tabelas de 3 colunas.
6. Use letras min
usculas, exceto no ttulo.
7. Evite abreviacoes.
8. Coloque referencia de dados de outros autores.
9. Nao exagere nas cores. Use cores para destacar informacoes relevantes.
10. Nao transforme a apresentacao em espetaculo pirotecnico! Pode distrair
atencao da plateia.
11. Nao use figuras de fundo.
12. Ha outros meios de destacar informacao importante

Durante a Apresentac
ao
1. Fale devagar, olhando para plateia.
2. Nunca fique de costas para a platleia.
3. Nao exagere nos gestos e mudancas de posicao.
4. Aponte as transparencias para orientar a plateia.
5. Nao fique na frente da projecao e nem andando de um lado para outro.
6. Nao aponte erros nas transparencias.
7. Use as mesmas palavras que usou nas transparencias.
8. Nos graficos, indique sempre o que significam.
9. Faca um encerramento, agradeca.

ORAL
4.2. COMUNICAC
AO

11

Respondendo as perguntas
1. Nao se desespere.
2. Tente responder a`s perguntas.
3. Algumas perguntas sao previsveis, outras ja estao respondidas nas transparencias.
4. Tente responder a`s perguntas mas e impossvel saber responder a toda e
qualquer pergunta.
5. Melhor dizer que nao sabe do que dar um tiro no escuro. A plateia
aceita e compreende que nao sabemos tudo.

Recomendaco
es Finais
1. Escreva a apresentacao
2. Prepare o material com antecedencia
3. Pratique, pratique, pratique.
4. Controle os nervos.

12

DOS RESULTADOS
CAPITULO 4. DIVULGAC
AO

Captulo 5

Consideraco
es sobre
Assessoria Estatstica
Segundo a minha experiencia, podemos comecar pensando em uma assessoria
(ou consultoria) como a aplicacao de conhecimentos de Estatstica em trabalhos
aonde o pesquisador nao ve a Estatstica como ciencia. A seguir serao apontados
alguns problemas e caractersticas associadas a` atividade de assessoria, bem
como algumas recomendacoes u
teis.

5.1

Problemas

Ao longo do processo alguns problemas ocorrem com certa frequencia e devem


ser esperados. Por exemplo,
1. A escolha do metodo de analise pode ser bastante complicada.
2. Erros de estatstica sao relativamente comuns em algumas areas da ciencia.
3. Em geral o pesquisador tem interesse nas conclusoes e nao no metodo
estatstico.
4. Alguns encaram a Estatstica com ma vontade.
5. Alguns so estao ali porque a revista ou o orientador exigiram uma analise
estatstica.
Outros problemas mais serios podem ocorrer tambem, embora com menor
frequencia. Por exemplo,
1. Trabalho de baixa qualidade. Outros podem te associar a este trabalho
ruim mas as vezes nao se pode recursar.
2. Nao reconhecimento pelo seu trabalho.
3. Mau uso do seu nome.
4. Fraudes, trabalhos nao eticos.
13


14CAPITULO 5. CONSIDERAC
OES
SOBRE ASSESSORIA ESTATISTICA

5.2

Expectativas

importante tambem termos uma ideia daquilo que o pesquisador espera obE
ter, i.e. qual a sua expectativa em relacao a` assessoria estatstica. Algumas
expectativas sao naturais e estao corretas, outras podem nao ser muito realistas e devemos estar preparados. Alem da assessoria propriamente dita, as
expectativas mais comuns na minha opiniao sao:
1. Um grande entusiasmo seu pelo trabalho.
2. Repeticao das explicacoes sempre que necessario.
3. Tempo de dedicacao ao trabalho.
4. Todos os calculos feitos.
5. Os resultados prontos para apresentacao.
6. Ajuda na discussao e conclusoes.

5.3

Atitudes do Estatstico

Apos enumerar possveis problemas e alguns fatos associados a` atividade de


assessoria podemos pensar em possveis atitudes do estatstico. Algumas dicas
sao as seguintes.
1. Estabeleca horarios para as reunioes. Como qualquer outro pesquisador
voce deve programar e planejar o seu trabalho.
2. Nunca aceite fazer uma analise por telefone por mais que alguem diga que
e uma coisa simples e so vai levar um minuto.
3. Discuta todos os procedimentos antes de comecar as analises.
4. Voce nao e um assistente de pesquisa.
5. Voce nao e um programador nem um digitador dos dados.
6. Voce nao pode dedicar todo o seu tempo a uma particular assessoria.
Finalmente, algumas recomendacoes mais gerais poderao ser u
teis para que
ambos tenham algum ganho com esta atividade.
1. Seja coerente.
2. Se o trabalho e simples use tecnicas mais simples.
3. Negocie a relacao de trabalho desde o incio.
4. Interacao pessoal pode ser importante.
5. Nao esconda problemas que voce identificou so para agradar o pesquisador.

5.3. ATITUDES DO ESTATISTICO

15

6. Quando necessario faca objecoes ou discuta a validade dos procedimentos.


7. Voce nao tem que saber tudo sobre todos os assuntos de todos os ramos
da ciencia.
8. Procure participar de todas as etapas da pesquisa, ou de tantas quantas
for possvel.
9. Se tiver intencao de usar os dados em outro projeto ou como ilustracao
negocie isto com o pesquisador. Nao use dados sem autorizacao.
E aqui estao tambem algumas recomendacoes quanto a`s reunioes de assessoria. Como este pode ser o u
nico contato com o pesquisador deve-se procurar
aproveita-lo ao maximo. Prepare-se para ouvir frases como o que eu quero e
simples so vai levar dois minutos. Isto pode ser profundamente decepcionante,
criar um sentimento de inutilidade e mesmo uma atitude negativa em relacao
ao trabalho. Nao desanime e tente mostrar que pode nao ser tao simples assim
(e em geral nao e). Outros pontos importantes sao os seguintes.
1. Peca que o pesquisador traga o material ja consultado ou indicado sobre
o assunto. Talvez a resposta esteja bem ali e com o seu treinamento
estatstico voce podera identifica-la.
2. Voce pode ter tanta dificuldade de entender o problema quanto o pesquisador tem de entender estatstica. Alguma dose de paciencia de ambas as
partes e necessario.
3. Entenda bem o problema e os objetivos antes de comecar a analise.
4. Pergunte por que o pesquisador mediu aquelas variaveis.
5. Se for necessario criticar faca-o com muito criterio.
6. Pare e pergunte se voce realmente entendeu o problema e os objetivos.
7. Em geral uma segunda reuniao sera necessaria.
Quanto a` analise estatstica propriamente dita, as seguintes recomendacoes
tambem podem ser u
teis.
1. Nao sofisticar a analise desnecessariamente. Isto pode ser decepcionante
mas em geral e necessario. Seja sofisticadamente simples.
2. O pesquisador precisa entender o que foi feito e saber interpretar corretamente os resultados.
3. Apresente uma solucao mesmo que aproximada para o problema.


16CAPITULO 5. CONSIDERAC
OES
SOBRE ASSESSORIA ESTATISTICA

5.4

Sobre co-autorias

Como qualquer outro pesquisador, o estatstico precisa ter os resultados de sua


atividade de pesquisa publicados. Se um tempo consideravel foi investido e o
grau de envolvimento com o trabalho foi grande o estatistico espera que seja ao
somente neste caso que
menos oferecida co-autoria em caso de publicacao. E
voce deve aceitar responsabilidade sobre o que foi publicado. Um agradecimento
em nota de rodape nao torna voce responsavel.
Na minha opiniao agradecimentos dizendo que voce fez a analise estatstica
devem ser evitados ja que neste caso voce deveria ser co-autor. Alem disso,
voce nao tem controle sobre o que sera publicado ou apresentado. Por outro
lado, nao se deve esperar co-autoria se houve apenas uma orientacao ou ajuda
com estatstica basica.

5.5

Sobre teses e dissertaco


es

Se o trabalho envolve uma tese ou dissertacao, ou mesmo uma monografia, a


minha opiniao e que o estatstico deve dar apenas orientacao. Neste caso o
aluno precisa entender completamente a analise para poder defende-la perante
uma banca. Em particular, e ideal que o orientador do trabalho participe das
reunioes iniciais da assessoria e no caso da analise estatstica ser uma componente fundamental da pesquisa entao o estatstico deve ser indicado como
co-orientador.

Captulo 6

Erros em Estatstica
Os metodos estatsticos, quando utilizados de maneira correta e apropriada,
tem sido extremamente valiosos para a acumulacao de conhecimento cientfico.
No entanto, a correta interpretacao dos dados e resultados de uma analise, e
importante ter em mente e deixar
muito importante para evitar confusoes. E
claro as limitacoes do metodo, as hipoteses subjacentes, as simplificacoes e
aproximacoes muitas vezes necessarias, etc.
Nesta secao serao apresentados alguns exemplos de erros em analises estatsticas e recomendacoes de como tentar evita-los. Naturalmente a lista nao
pretende ser exaustiva, mas apenas apontar os problemas mais comuns. Uma
otima referencia sobre o assunto e Good and Hardin (2003).

6.1

Paradoxo de Simpson

Este exemplo foi extrado de DeGroot (1989). Suponha que foi feito um experimento para comparar um novo tratamento para uma doenca com um tratamento padrao. Um grupo de 40 indivduos recebeu o tratamento padrao
enquanto outro grupo de 40 indivduos recebeu o novo tratamento e apos um
certo perodo de tempo foram observados quantos indivduos em cada grupo
apresentaram melhora. Os resultados para os 80 indivduos estao na Tabela 6.1
abaixo.
Tabela 6.1: Frequencias de melhora para indivduos sob dois tratamentos diferentes.

novo tratamento
tratamento padrao

situacao
melhorou nao melhorou
20
20
24
16

porcentagem
de melhora
50
60

Com base nesta tabela, o novo tratamento parece ser inferior ao tratamento
padrao. Suponha agora que os valores foram desagregados considerando-se
homens e mulheres separadamente e obteve-se a Tabela 6.2 abaixo.
17

CAPITULO 6. ERROS EM ESTATISTICA

18

Tabela 6.2: Frequencias de melhora para indivduos sob dois tratamentos diferentes desagregados por sexo.

homens
novo tratamento
tratamento padrao

situacao
melhorou nao melhorou
12
18
3
7

porcentagem
de melhora
40
30

mulheres
novo tratamento
tratamento padrao

situacao
melhorou nao melhorou
8
2
21
9

porcentagem
de melhora
80
70

Ou seja, esta tabela nos leva a` conclusao oposta de que o novo tratamento
parece ser superior ao tratamento padrao. Este tipo de resultado e conhecido
como paradoxo de Simpson e nao depende do tamanho amostral. O problema
aqui e que, independente do tratamento, a taxa de melhora e muito maior entre
as mulheres do que entre os homens. Como muito mais mulheres receberam
o tratamento padrao e muito mais homens receberam o novo tratamento, os
dados agregados mostram o tratamento padrao com uma taxa de melhora global
maior.
Para que este fenomeno nao ocorresse seria necessario que a proporcao de
indivduos recebendo os dois tratamentos fosse a mesma (ou aproximadamente
a mesma) para homens e mulheres. Porem, nao e necessario que haja o mesmo
n
umero de homens e mulheres. No entanto, mesmo apos tomar estes cuidados
pode ser que existam outras variaveis, e.g. idade ou estagio da doenca, tais que
a desagregacao levaria a conclusoes opostas.

6.2

Comparando abacaxi com banana

Outro problema consiste em tentar comparar coisas que nao sao realmente
comparaveis. Por exemplo, determinadas definicoes mudam ao longo do tempo
e comparar coisas em instantes de tempo diferentes pode levar a conclusoes sem
valor. O objeto de estudo precisa estar claramente definido e a definicao tem
que se manter constante para se fazer comparacoes.
Em alguns experimentos pode ser difcil se fazer observacaes com variaveis
adequadamente controladas. Suponha por exemplo que foi feito um estudo para
medir o efeito da poluicao urbana na reducao do tempo de vida das pessoas.
A ideia era comparar o tempo de vida das pessoas vivendo em grandes centros
urbanos com o das que viviam em zonas rurais. No entanto, seria necessario
garantir que foram observados indivduos destes dois grupos cuja u
nica diferenca
em termos de ambiente e estilo de vida fosse a poluicao. Esta e uma tarefa
quase impossvel ja que teriamos que eliminar o efeito da violencia urbana,
dos tipos de alimentacao, do stresse, etc. A conclusao do estudo, mesmo que


6.3. TESTANDO HIPOTESES

19

estatisticamente significativa, provavelmente nao teria nenhum valor.

6.3

Testando hip
oteses

Da forma como a metodologia classica de testes de hipoteses foi desenvolvida


podemos ter a impressao de que estamos calculando probabilidades a respeito
de uma hipotese. De fato, algumas vezes e incorretamente afirmado que rejeitar
H0 ao nvel indica que a probabilidade de H0 ser verdadeira e menor do que .
Esta interpretacao nao e valida e o p-valor calculado em um teste nao fornece
nenhuma indicacao sobre qualquer probabilidade a respeito de H0 .
Para que esta interpretacao fosse valida teriamos que usar a abordagem
Bayesiana. Basicamente, teramos que atribuir uma probabilidade a priori, i.e.
antes de observar os dados, para a hipotese H0 . Apos a observacao dos dados amostrais esta probabilidade seria atualizada, segundo regras da inferencia
Bayesiana, e teramos uma probabilidade a posteriori para a hipotese H 0 . Este
assunto nao sera tratado nestas notas, para maiores detalhes ver por exemplo
Migon e Gamerman (1999) ou DeGroot (1989).

6.4

Correlac
ao n
ao significa causalidade

Um dos erros de interpretacao mais comuns e assumir que correlacoes significativas necessariamente implicam em uma relacao de causa e efeito entre duas
variaveis. Esta interpretacao e incorreta.
Tambem e preciso ter cuidado ao assumir que existe correlacao somente
porque duas variaveis seguem o mesmo padrao de variabilidade. A correlacao
pode ser devida a uma terceira variavel influenciando as duas primeiras.

6.5

Gr
aficos

A maioria dos pacotes computacionais para analise estatstica oferece facilidades


para construcao de varios tipos de graficos. Alguns cuidados devem ser tomados
para nao gerar dificuldades ou mesmo erros de interpretacao. Aqui veremos
um exemplo de series temporais aonde a representacao grafica dos dados e
fundamental mesmo antes de comecar a analise. Outras referencias sobre o
assunto sao Cleveland (1994) e Chatfield (1995).
Na Figura 6.1 temos a representacao grafica de uma serie temporal classica
com os totais mensais (em milhares) de passageiros em linhas aereas internacionais de 1949 a 1960. Os dados originais estao em Box and Jenkins (1976).
Note que o ttulo descrevendo o grafico nao fornece detalhes suficientes e
o leitor teria que recorrer ao texto para descobrir o que o grafico esta representando. O eixo vertical esta rotulado simplesmente como X, portanto nao
temos informacao sobre a variavel nem sobre a escala de medida. Alem disso, a
escala vertical comeca em 100 ao inves de zero, o que faz com que o crescimento
percentual da serie pareca maior. Outro problema e que o eixo horizontal esta
rotulado simplesmente como um ndice indicando apenas o aspecto temporal
dos dados, mas nada informa sobre a periodicidade da serie. Para acessar a

CAPITULO 6. ERROS EM ESTATISTICA

20

variacao sazonal seria mais u


til ter uma escala horizontal representada em anos
ou em m
ultiplos de 12, ja que os dados sao mensais.
Se o pacote que voce esta utilizando fornece tipo de representacao grafica
da Figura 6.1 como padrao nao se de por satisfeito. Verifique nos manuais se
voce pode alterar as opcoes graficas e nao tenha receio de adotar um metodo
de tentativa e erro. Tente diferentes opcoes de escala, smbolos, etc. e verifique
qual grafico ficou melhor para os propositos do seu trabalho. Se o pacote nao
permite esta facilidade entao a minha sugestao e que voce tente outro pacote.
Uma representacao grafica pobre e incompleta pode levar as pessoas a nao
perceber adequadamente o merito do seu trabalho.
A seguir estao listadas algumas recomendacoes gerais na construcao de um
grafico, seja para representar os dados originais, relacoes entre variaveis ou
resultados da analise estatstica.
1. O ttulo deve ser claro e auto-explicativo.
2. As unidades de medida devem ser claramente especificadas.
3. As escalas devem ser bem escolhidas.
4. Os eixos devem estar rotulados indicando claramente as variaveis.

100

200

300

400

500

600

Figura 6.1: Dados de passageiros.

20

40

60

80

100

120

140


6.5. GRAFICOS

21

Na Figura 6.2 a seguir esta representada a mesma serie temporal da Figura


6.1 com as devidas alteracoes seguindo as recomendacoes acima. Note que o
grafico ficou bem mais informativo, praticamente nao sendo necessario recorrer
ao texto para entende-lo.
Figura 6.2: Totais mensais de passageiros (em milhares) em linhas aereas internacio-

400
300
200
100
0

Nmero de passageiros (em milhares)

500

600

nais de janeiro de 1949 a dezembro de 1960.

1950

1952

1954

1956
Anos

1958

1960

22

CAPITULO 6. ERROS EM ESTATISTICA

Captulo 7

Vari
aveis
O Cambridge Dicionary of Statistics (Everitt, 1998), define uma variavel como
alguma caracterstica que difere de indivduo para indivduo ou ao longo do
tempo ou espaco. De um modo geral uma variavel pode ser vista como um elo
de ligacao entre conceitos em forma de hipoteses e observacoes dos fenomenos
reais. A ideia e que as hipoteses possam ser testadas definindo estes conceitos em
forma de variaveis. Por exemplo, para que se possa testar a hipotese frustracao
produz agressao e preciso observar ou medir estes dois conceitos e isto so sera
possvel se frustracao e agressao forem variaveis cujos valores sao passveis
de mensuracao.

7.1

Classificac
ao de Vari
aveis

Variaveis sao classificadas segundo os possveis valores que podem assumir.


De um modo geral podemos distinguir dois tipos principais. Variaveis que
apenas classificam uma determinada propriedade em tipos distintos em termos
qualitativos sao denominadas vari
aveis qualitativas ou categ
oricas. Pode existir
ou nao alguma ordenacao natural entre as categorias de modo que ainda e
possvel uma subclassificacao em
variaveis nominais, por exemplo sexo (masculino, feminino), classificacao
de fosseis;
variaveis ordinais, i.e. com categorias ordenadas, tais como salinidade
(baixa, media, alta), abundancia (dominante, abundante, frequente, ocasional, raro).
Variaveis quantitativas sao aquelas em que as possveis realizacoes sao n
umeros
resultantes de algum processo de contagem ou mensuracao. Podem ser ainda
subdivididas em,
discretas, i.e. contagens ou n
umero inteiros, por exemplo n
umero de ovos
postos pela tartaruga marinha, n
umero de ataques de asma no ano passado.
contnuas, i.e. medidas numa escala contnua, tais como volume, area,
peso ou massa.
23


CAPITULO 7. VARIAVEIS

24

Na pratica estas distincoes podem ser menos rgidas, embora em geral seja
recomendado manter as variaveis em sua forma original. Por exemplo, normalmente a variavel idade seria tratada como contnua, mas se a idade for
registrada pelo ano mais proximo ela pode ser tratada como discreta. Por outro lado, se os indivduos forem classificados segundo sua idade em criancas,
adultos jovens, adultos e idosos entao teremos faixa etaria como uma
variavel qualitativa ordinal.

7.2

Relaco
es entre Vari
aveis

Em investigacoes cientficas de qualquer natureza e fundamental que o significado das relacoes entre variaveis seja bem entendido. Isto e importante para
que se possa dar prosseguimento a`s investigacoes de forma apropriada. Basicamente, existem tres significados amplos descritos na literatura que serao
apresentados aqui.

7.2.1

Rela
c
ao Sim
etrica

Neste caso, embora se verifique uma relacao nenhuma das variaveis exerce acao
sobre a outra. Alguns exemplos sao os seguintes,
1. Se alunos que obtem bons resultados em matematica tambem alcancam
bons resultados em provas orais nao podemos assumir que a capacidade
matematica explica a capacidade verbal, ou vice-versa.
2. Encontrando-se uma relacao entre transpiracao palmar e batimentos cardacos
nao podemos considerar uma variavel como causa da outra, ambas sao interpretadas como sinal de ansiedade. Para determinar ansiedade podemos
usar uma ou outra variavel.
3. Encontrando-se uma relacao entre frequentar colegio caro e obtencao de
bons empregos nao nos permiter inferir que o preco da escola influencie
a qualidade do emprego. Na verdade ambas as variaveis tem a mesma
causa que e a classe social dos alunos.
Quando duas variaveis sao efeitos de uma causa comum diz-se que as relacoes
entre elas sao esp
urias. Talvez fosse melhor dizer que houve uma interpretacao
esp
uria das relacoes. Seja como for, a identificacao destas relacoes simetricas
pode ajudar no entendimento do fenomeno em questao. Finalmente, pode-se
identificar associacoes completamente fortuitas entre duas variaveis. Seria um
erro metodologico tentar analisar tais associacoes.

7.2.2

Rela
c
ao Recproca

Neste caso, embora seja claro que existem forcas causais nao e possvel determinar de imediato quem causa quem. Na verdade cada uma das variaveis e
alternadamente causa e efeito. Por exemplo,


7.3. VARIAVEIS
MODERADORAS

25

1. o aumento da taxa de desemprego geralmente leva a uma reducao no


volume de vendas, que por sua vez pode causar mais desemprego.
2. Um fenomeno conhecido em propaganda e que os indivduos tendem a
selecionar aquelas que estao de acordo com a sua ideologia (religiosa,
poltica, etc.), o que acaba reforcando a sua posicao ideologia.

7.2.3

Rela
c
ao Assim
etrica

Neste caso, e possvel postular que uma variavel (independente) essencialmente


afeta de algum modo a outra variavel (dependente). Este tipo de relacao e bem
mais frequente nas ciencias sociais do que, por exemplo, em ciencias naturais.
Alguns exemplos sao os seguintes,
1. crises economicas levam a opinioes polticas extremadas;
2. o elogio leva a um melhor desempenho nas tarefas;
3. encontrando-se uma relacao entre o habito de fumar e o cancer do pulmao
e evidente que nao e a doenca que leva ao vcio.
A determinacao de quem e variavel dependente ou independente em um
estudo pode nao ser tao direta. Um dos criterios a ser utilizado se baseia na ordem temporal dos acontecimentos que deram origem a`s variaveis, i.e. a variavel
anterior no tempo e a independente. Por exemplo, se existe uma relacao entre
duracao do noivado e posterior felicidade conjugal e evidente que a duracao do
noivado ocorre antes na sequencia temporal e deve ser a variavel independente.
Em Estatstica estaremos naturalmente lidando com relacoes probabilsticas
ou estocasticas. Assim, dada a ocorrencia de X entao provavelmente tambem
ocorrera Y . Mesmo em outros ramos da ciencia ha hoje uma tendencia em
enunciar as proposicoes em forma probabilstica.

7.3

Vari
aveis Moderadoras

Uma variavel moderadora pode influenciar ou modificar a relacao entre as


variaveis dependente e independente. Neste sentido sua identificacao pode ser
muito importante em um estudo. Por exemplo, suponha que entre estudantes
de mesma idade e inteligencia o desempenho de habilidades esta diretamente
relacionado com o n
umero de treinos praticos, porem esta relacao e mais forte
entre meninos do que entre meninas. Neste caso a variavel sexo e claramente
uma variavel moderadora.

7.4

Vari
aveis de Controle

Basicamente uma variavel de controle e aquela cujo efeito o pesquisador neutraliza propositadamente para que nao interfira na analise da relacao entre as
outras variaveis. Isto ocorre em situacoes complexas, quando se sabe que o
efeito nao tem apenas uma causa mas pode sofrer influencia de varios fatores.

26

CAPITULO 7. VARIAVEIS

No entanto, se o pesquisador nao esta interessado ou se nao e possvel analisar


todos estes fatores no mesmo experimento entao e necessario neutraliza-los.
Voltando ao exemplo anterior, deseja-se estudar a relacao entre desempenho
de habilidades e n
umero de treinos praticos. Sabe-se que a idade e o grau de
inteligencia dos estudantes tem influencia no desempenho de habilidades mas
estas variaveis nao sao de interesse direto para o pesquisador e portanto elas
foram neutralizadas quando foram analisados estudantes da mesma idade e grau
de inteligencia.

Refer
encias
Box, G. E. P. and G. M. Jenkins (1976). Time Series Analysis: Forecasting
and Control (Revised ed.). Holden-Day, Oakland, California.
Chatfield, C. (1995). Problem-Solving: A Statisticians Guide (2nd ed.). London: Chapman and Hall.
Cleveland, W. (1994). The Elements of Graphing Data (2nd ed.). Summit,
NJ: Hobart Press.
DeGroot, M. H. (1989). Probability and Statistics (2nd ed.). Addison Wesley.
Good, P. I. and J. W. Hardin (2003). Common Errors in Statistics (and how
to avlid them). Wiley: London.
Migon, H. S. and D. Gamerman (1999). Statistical Inference: An Integrated
Approach. Arnold.

27