You are on page 1of 68

Estatstica

Aplicada s
Cincias
Sociais

PROFA. DRA. MARIA IVANILDE SILVA ARAJO

2014

Ementa
Estatstica (60 h)

Consideraes Iniciais:
Conceitos Preliminares

Fases do trabalho estatstico

Distribuio de Frequncia

Apresentao Tabular e Grfica

Medidas de Posio e
Variabilidade

Noes sobre probabilidade

Distribuies especiais

Teoria da estimao

Intervalo de Confiana

Noes de Testes de
hipteses

Uso de programas
estatsticos e aplicaes em
cincias sociais

PROF DR MARIA IVANILDE ARAUJO- UFAM

Bibliografia
M. I. Arajo e A. A. Balieiro, Apostila de Bioestatstica. UFAM, 2009.
Bussab W. de O.; Morettin, P. A. Estatstica Bsica - 7 Edio. So
Paulo. Ed. Saraiva, 2011.
VIEIRA, S. Elementos de Estatistica, 4 Edio. Ed. Atlas, 2003.
BARBETA, P.A., Estatstica Aplicada s Cincias Sociais, 7 ed., So
Paulo: LTC, 2010.

PROF DR MARIA IVANILDE ARAUJO- UFAM

Cronograma das aulas


Data

Contedo

17/08/15

Apresentao e discusso do Plano de Ensino, definio


do horrio de atendimento, datas e formato das avaliaes

27/08/15

Conceitos Preliminares. Conceitos Fundamentais da


Estatstica

Horrio
20:20 22:00
20:20 22:00
20:20 22:00
20:20 22:00

05/09/15

Fases do trabalho estatstico: Planejamento, Questionrio,


coleta e apurao

07/09/15

Organizao e apresentao de dados Tabelas e


Anlise Exploratria de Dados - AED

20:20 22:00
20:20 22:00

12/09/15

Pacotes Estatst. e Exemplos prticos de fixao - AED

19/09/15

Organizao e apresentao de dados Gficos e Anlise


Exploratria de Dados - AED

20:20 22:00
20:20 22:00

21/09/15

Distribuio de Frequencia + Banco de dados

26/09/15

Pacotes Estatst.PROF
e Exemplos
prticos
de fixao
DR MARIA IVANILDE
ARAUJOUFAM

Cronograma das aulas


Data

Contedo

Horrio

04/06/14

Moda, Mediana

08:00 10:00

09/06/14

Dia para trabalhar o banco de dados (Exerccios)

10:00 12:00

11/06/14

Medidas de variabilidade: Amplitude, Varincia

08:00 10:00

16/06/14

Desvio Padro, Coeficiente de Variao

10:00 12:00

30/06/14

Dia para trabalhar o banco de dados (Exerccios)

08:00 10:00

02/07/14

2 Avaliao

10:00 12:00

07/07/14

Distribuio Binomial

08:00 10:00

09/07/14

Distribuio Normal

10:00 12:00

14/07/14

Distribuio Normal padro

08:00 10:00

16/07/14

Exerccios

10:00 12:00

21/07/14

Intervalo de Confiana: introduo

08:00 10:00

23/07/14

Intervalo de Confiana para mdia

10:00 12:00

PROF DR MARIA IVANILDE ARAUJO- UFAM

Cronograma das aulas


Data

Contedo

Horrio

28/07/14

Intervalo de Confiana para proporo

08:00 10:00

30/07/14

Dia para trabalhar o banco de dados (Exercciosh

10:00 12:00

04/08/14

Viagem

08:00 10:00

06/08/14

Viagem

10:00 12:00

11/08/14

Teste de hiptese: Introduo

08:00 10:00

13/08/14

Teste de hiptese para mdia

10:00 12:00

18/08/14

Teste de hiptese para proporo

08:00 10:00

20/08/14

Exemplos fixao: Distrib., Estimao (+ banco dados)

10:00 12:00

25/08/14

Exemplos prticos de Teste de Hiptese

08:00 10:00

27/08/14

Dia para trabalhar o banco de dados (Exerccios)

10:00 12:00

08/09/14

Avaliao Final

PROF DR MARIA IVANILDE ARAUJO- UFAM

Conceitos
Estatstica
Estatstica Indutiva e Inferencial
Exemplos de utilizao da estatstica
Populao e amostra
Parmetro e estatstica
Dados primrios e secundrios
Censo
Varivel
PROF DR MARIA IVANILDE ARAUJO- UFAM

Conceitos
Estatstica: a cincia que tem por objetivo planejar,
coletar, tabular, analisar e interpretar informaes
e delas extrair concluses que permitam a tomada de
decises acertadas mediante incertezas.
reas: Estatstica Descritiva e Estatstica Inferencial
ou Indutiva

PROF DR MARIA IVANILDE ARAUJO- UFAM

Conceitos
Populao: o conjunto de elementos (valores, pessoas,
medidas etc.) que tem pelos menos uma caracterstica em
comum.
Alunos de 5 a 12 anos da rede pblica do municpio de
Gurupi-TO (para verificao de parasitas intestinais)
Idosos integrantes da Unati - Universadade Aberta
Terceira Idade (importncia da relao mdico paciente,
percepo sobre a atuao do mdico)
Calendula officinalis L. (ASTERACEA). Influncia do processo
extrativo nas caractersticas fsicas e qumicas dos extratos.
Amostra: um subconjunto de elementos extrados de uma
populao.
PROF DR MARIA IVANILDE ARAUJO- UFAM

PROF DR MARIA IVANILDE ARAUJO- UFAM

10

PROF DR MARIA IVANILDE ARAUJO- UFAM

11

Conceitos
Parmetro: uma medida numrica
caracterstica de uma populao.

que

descreve

uma

Estatstica: uma medida


caracterstica da amostra.

que

descreve

uma

numrica

Dados primrios: dados coletados pelo prprio pesquisador e sua


equipe.
Dados secundrios: no foram obtidos pelo pesquisador e sua
equipe (diversas fontes como artigos em peridicos, institutos de
pesquisa, DATASUS, IBGE, OMS, OPAS).

PROF DR MARIA IVANILDE ARAUJO- UFAM

12

Conceitos
Censo: uma coleo de dados relativos a todos os
elementos de uma populao.
Varivel: a caracterstica de interesse que
medida em cada elemento da amostra ou populao,
podendo ter resultados numricos ou no. Seus
valores variam de elemento a elemento.

PROF DR MARIA IVANILDE ARAUJO- UFAM

13

Variveis - Classificao

Nominal
Qualitativa

Ordinal
Varivel
Quantitativa Discreta

Contnua

PROF DR MARIA IVANILDE ARAUJO- UFAM

14

Tipos de estudo
Estudo observacional: verificamos e medimos caractersticas
especficas, mas no tentamos manipular ou modificar os elementos
a serem estudados.
Estudo transversal: dados so observados, medidos e coletados
em um ponto no tempo.
Estudo retrospectivo ou de caso controle: os dados so
coletados do passado, voltando-se no tempo.
Estudo prospectivo ou longitudinal ou de coorte: os dados so
coletados no decorrer do tempo, de grupos (coortes) que
compartilham fatores comuns.

PROF DR MARIA IVANILDE ARAUJO- UFAM

15

Experimentos
Controlando os efeitos das variveis
Experimentos cegos: o sujeito no sabe se est recebendo o tratamento
ou o placebo.
Planejamento experimental completamente aleatorizado: os sujeitos
so colocados nos tratamentos atravs de um processo de seleo
aleatria.
Planejamento rigorosamente controlado: sujeitos so escolhidos
cuidadosamente de modo que em cada bloco sejam similares.

PROF DR MARIA IVANILDE ARAUJO- UFAM

16

Tipos de estudos

PROF DR MARIA IVANILDE ARAUJO- UFAM

17

Levantamento de dados
Problemas usuais - Representatividade
Fator associado forma de amostragem.
Na seleo da amostra procura-se reproduzir as caractersticas
observveis da populao - uso do critrio de proporcionalidade.
Em caso de desconhecimento da composio da populao deve-se
utilizar algum critrio de aleatoriedade (sorteio).
Amostra tendenciosa concluses sem consistncia.

PROF DR MARIA IVANILDE ARAUJO- UFAM

18

Levantamento de dados
Problemas usuais Fidedignidade
Relacionada preciso ou qualidade dos
dados.
Motivos da falta de preciso:
Falhas nos instrumentos de aferio;
Problemas nos questionrios empregados
obteno dos dados;
Falha humana.

PROF DR MARIA IVANILDE ARAUJO- UFAM

na

19

Levantamento de dados
A importncia da coleta de dados
Cuidado na hora de coletar informaes;
No adianta uma metodologia perfeita e um
bom planejamento se na hora da coleta dos
dados
houver
alguma
influncia
do
entrevistador perante o entrevistado;
As pessoas que so contratadas para fazer
as entrevistas devem passar por um bom
treinamento.

PROF DR MARIA IVANILDE ARAUJO- UFAM

20

Amostragem
Se os dados amostrais no forem coletados de maneira
apropriada, eles podem ser de tal modo inteis que nenhuma
manipulao estatstica poder salv-los.
A aleatoriedade comumente desempenha papel crucial na
determinao de quais dados coletar.

PROF DR MARIA IVANILDE ARAUJO- UFAM

21

Amostragem
Vantagens do levantamento por amostragem: custo
menor, menor tempo e objetivos mais amplos.
Situaes para trabalho com amostras: populao
muito grande, dificuldade de acesso, grande nmero de
variveis.
Tipos
Aleatria
Estratificada
Sistemtica
Conglomerados
Convenincia
PROF DR MARIA IVANILDE ARAUJO- UFAM

22

Distribuies de Frequncias

Etno-Regio
Juru, Juta, Purus, Javari
Marau-Andir
Rio Negro
Solimes
Tapajs-Madeira
Outras regies
Total

n
51
148
315
129
38
13
694

PROF DR MARIA IVANILDE ARAUJO- UFAM

%
7,35
21,33
45,39
18,59
5,48
1,87
100,00
23

Tabelas
Tabela de distribuio de frequncia
Considere o seguinte conjunto de dados:
21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30.
Construa uma distribuio com todas as frequncias.
Soluo:

PROF DR MARIA IVANILDE ARAUJO- UFAM

24

Tabelas
X

fi

fac

fr

far

21

3/17

3/17

22

2/17

5/17

23

2/17

7/17

24

1/17

8/17

25

12

4/17

12/17

26

15

3/17

15/17

28

16

1/17

16/17

30

17

1/17

17/17

17
PROF DR MARIA IVANILDE ARAUJO- UFAM

1
25

Tabelas
Para a construo de tabelas de frequncias para variveis
contnuas, os dados devem ser agrupados em intervalos de
classes.
Para a construo das classes algumas definies so
necessrias:

PROF DR MARIA IVANILDE ARAUJO- UFAM

26

Tabelas
Amplitude Total ou Range (R): a diferena entre o
maior e o menor valor observado.
Ex.: R = 30 - 21 = 9.

PROF DR MARIA IVANILDE ARAUJO- UFAM

27

Tabelas
Intervalos

de

Classe:

Conjunto

de

observaes

apresentadas na forma contnua, sem superposio de


intervalos, de tal modo que cada valor do conjunto de
observao possa ser alocado em um, e apenas um, dos
intervalos.

PROF DR MARIA IVANILDE ARAUJO- UFAM

28

Tabelas
O nmero k de intervalos para cada conjunto de observaes
com n valores pode ser calculado como:
k = 1 + 3,322(log10 n) (frmula de Sturges)
Ex.: para um conjunto com 50 observaes obtemos log10(50)
1,699;
k = 1 + 3,322 x 1,699 6,6 7 intervalos
O tamanho w de cada intervalo obtido pela diviso do valor
da diferena entre o maior e o menor valor, R, pelo nmero de
intervalos k:
w = R/k

PROF DR MARIA IVANILDE ARAUJO- UFAM

29

Tabelas
Etapas para a construo de tabelas de frequncia para
dados agrupados:
1)Encontrar o menor e o maior valor (mnimo e mximo) do
conjunto de dados.
2)Calcular o nmero de classes que englobem todos os dados
sem haver superposio dos intervalos.

PROF DR MARIA IVANILDE ARAUJO- UFAM

30

Tabelas
3) Contar o nmero de elementos que pertencem a cada
classe.
4) Determinar a frequncia relativa de cada classe.

PROF DR MARIA IVANILDE ARAUJO- UFAM

31

Tabelas
Exemplo:
O conjunto de dados abaixo representa as idades de mulheres
responsveis pelos domiclios. Construa intervalos de classes
para o mesmo.
19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27 27 27 29 29
29 29 30 31 31 31 33 33 33 34 37 37 37 37 40 40 40 40 43 43
44 44 47 48 48 48 51 52 52 53

PROF DR MARIA IVANILDE ARAUJO- UFAM

32

Tabelas
Soluo:
se utilizar a frmula de
Sturges
R = 53 19 = 34 e n = 50
Ento:
K = 1 + 3,322 x 1,699
7 intervalos
W = 34/7 5 idades em
cada

Intervalo de
Freqncia
classe
19 |------- 24
8
24 |------- 29
29 |------- 34
34 |------- 39

10
11
5

39 |------- 44
44 |------- 49
49 |------- 54

6
6
4

PROF DR MARIA IVANILDE ARAUJO- UFAM

33

Tabelas

Ou construir intervalos empiricamente:

Intervalo
de classe

Freqncia

10 |------- 20
20 |------- 30
30 |------- 40
40 |------- 50

2
20
12
12

50 |------- 60

PROF DR MARIA IVANILDE ARAUJO- UFAM

34

Tabelas
Os extremos dos intervalos so conhecidos como limites de
classes.
Procedendo-se desse modo, ao resumir os dados referentes a
uma varivel contnua perde-se informaes.

PROF DR MARIA IVANILDE ARAUJO- UFAM

35

Apresentao de dados Tabelas


Componentes

Ttulo
Cabealho

Distribuio dos pacientes segundo as escalas de ABVD e


AIVD, Hopital H, Manaus-AM, 2014
Variveis

f (%)

49
9
4

79,03
14,52
6,45

26
17
19

41,94
27,42
30,65

Atividades Bsica da Vida Diria (ABVD)

Independncia (6 ou mais)

Coluna
Indicadora

Dependncia Parcial (4 - 5)
Dependncia Importante (2 ou menos)

Corpo

Atividades Instrumentais da Vida Diria

Independncia (7 - 9)
Dependncia Parcial (4 - 6)
Dependncia importante (0 - 3)

Rodap:

Clula

f: Freqncia; f(%): Freqncia Relativa


Fonte: Labio

PROF DR MARIA IVANILDE ARAUJO- UFAM

36

Representao tabular
Apresentao de tabelas
A tabela deve ser simple, clara e objetiva. Grandes volumes de dados
devem ser divididos em vrias tabelas.
A tabela deve ser auto-explicativa.
Nenhuma casa da tabela deve ficar em branco, apresentando sempre
um nmero ou um smbolo.
As tabelas, excludos os ttulos, sero delimitadas, no alto e em baixo,
por traos horizontais grossos, preferencialmente.

PROF DR MARIA IVANILDE ARAUJO- UFAM

37

Representao tabular
Apresentao de tabelas
Recomenda-se no delimitar as tabelas direita e esquerda, por
traos verticais.
Ser facultativo o emprego de traos verticais para a separao de
colunas no corpo da tabela.
Deve-se manter a uniformidade quanto ao nmero de casas
decimais.
Os totais e subtotais devem ser destacados.

PROF DR MARIA IVANILDE ARAUJO- UFAM

38

Tabelas de contingncia
Conjugando duas sries em uma nica tabela, obtm-se uma tabela
de dupla entrada.
Distribuio segundo tratamento de diabetes e cultura
No Indgena
Varivel (Mdulo - DIABETES)

Indgena

f (%)

f (%)

No, mas j fez

14,29

14,29

No, nunca fez


Sim, com comprimido

5
10

17,86
35,71

4
8

19,05
38,10

Sim, com insulina

7,14

9,52

Sim, somente com dieta

25,00

Total

28

100,00

21

Est fazendo tratamento


contra Diabetes?

0,99

100,00
19,05

Fonte: Labio
PROF DR MARIA IVANILDE ARAUJO- UFAM

39

Grficos
Os grficos so representaes pictricas dos dados.

Tem por finalidade dar uma ideia, a mais imediata possvel,


dos resultados obtidos, permitindo chegarse a concluses
sobre a evoluo do fenmeno ou sobre como se relacionam
os valores da srie.

PROF DR MARIA IVANILDE ARAUJO- UFAM

40

Grficos
A escolha do grfico mais apropriado ficar a critrio do
analista.
Contudo, os elementos simplicidade, clareza e veracidade
devem ser considerados quando da elaborao de um grfico.

PROF DR MARIA IVANILDE ARAUJO- UFAM

41

Grficos
Grficos para variveis qualitativas
Dentre os grficos para representar variveis qualitativas
temos o grfico de barras e em setores (grfico de pizza).

PROF DR MARIA IVANILDE ARAUJO- UFAM

42

Grficos

PROF DR MARIA IVANILDE ARAUJO- UFAM

43

Grficos

Fonte: questionrio aplicado aos alunos da UFAM, com ingresso no ano de 2003.
*134 alunos no responderam esta questo

PROF DR MARIA IVANILDE ARAUJO- UFAM

44

Grfico
Grfico de composio em setores: Destina-se a
representar a composio, usualmente em porcentagem, de
partes de um todo.
Consiste num crculo de raio arbitrrio,
representando
o todo, dividido e setores, que corresponde as partes de
maneira proporcional.

PROF DR MARIA IVANILDE ARAUJO- UFAM

45

Grficos

PROF DR MARIA IVANILDE ARAUJO- UFAM

46

Grficos
Grfico para variveis quantitativas:
Os tipos de grficos geralmente so utilizados nesse caso:
Grfico de disperso, Histograma, polgono de frequncia e
grfico de linhas.

PROF DR MARIA IVANILDE ARAUJO- UFAM

47

Grficos

Grfico de disperso:
Os valores so representados por pontos ao longo da reta.
Exemplo: Taxa de glicemia dos idosos que procuram atendimento
no Centro de Ateno Integrada da Melhor Idade CAIMI.

PROF DR MARIA IVANILDE ARAUJO- UFAM

48

Grficos

PROF DR MARIA IVANILDE ARAUJO- UFAM

49

Grficos
Histograma:
um grfico de barras contguas, com bases proporcionais
aos intervalos das classes e a rea de cada retngulo
proporcional respectiva frequncia.
Exemplo: Idade dos idosos que procuram atendimento no
Centro de Ateno Integrada da Melhor Idade CAIMI.

PROF DR MARIA IVANILDE ARAUJO- UFAM

50

Grficos
Histograda da Idade

60

49
27

0 20

Frequncia

81

12

60

65

70

75

7
80

3
85

90

Idade
PROF DR MARIA IVANILDE ARAUJO- UFAM

51

Grficos
Polgono de frequncia: um grfico em linha, onde as
frequncias so marcadas sobre perpendiculares ao eixo
horizontal, levantadas pelos pontos mdios dos intervalos de
classe. Para conseguir um polgono, ligamos os extremos da
linha obtida aos pontos mdios da classe anterior primeira e
da posterior ltima, da distribuio.

PROF DR MARIA IVANILDE ARAUJO- UFAM

52

Grficos
Grfico de linhas: indicado para dados coletados ao longo
do tempo, ou de medidas repetidas.
Atravs desse grfico possvel constatar algum tipo de
tendncia e identificar alguns eventos inusitados, como por
exemplo, o surto de uma determinada doena.

PROF DR MARIA IVANILDE ARAUJO- UFAM

53

Grficos

Fonte: Relatrio de Gesto UFAM/2012


PROF DR MARIA IVANILDE ARAUJO- UFAM

54

Distribuies de Frequncias
Exerccio: VARIVEL QUANTITATIVA

Distribuio de frequncia para dados agrupados ou tabulados em classes.

Idade dos socilogos em anos


36
39
40
40
40
42
43
44
44
45
45
45
47
49
49
50
50
51
52
53
55
57
58
59
59

PROF DR MARIA IVANILDE ARAUJO- UFAM

55

Distribuies de
Frequncias
Dados agrupados em classes
Idade de 25 socilogos
Idade
Frequncia
35 I-- 40
2
40 I-- 45
7
45 I-- 50
6
50 I-- 55
5
55 I-- 60
5
Fonte: Dados Fictcios

PROF DR MARIA IVANILDE ARAUJO- UFAM

56

Medidas de tendncia central


Valor do ponto em torno do qual os dados se
distribuem

PROF DR MARIA IVANILDE ARAUJO- UFAM

57

Medidas de tendncia central

PROF DR MARIA IVANILDE ARAUJO- UFAM

58

Medidas de tendncia central

PROF DR MARIA IVANILDE ARAUJO- UFAM

59

Medidas de tendncia central

PROF DR MARIA IVANILDE ARAUJO- UFAM

60

Medidas de tendncia central

PROF DR MARIA IVANILDE ARAUJO- UFAM

61

Medidas de tendncia
Mdia aritmtica: Clculo da mdia de dados em Tabela de
central
Distribuio de frequncia
Classe

Ponto Mdio

Frequncia

1,5 2,0

1,75

2,0 2,5

2,25

16

2,5 3,0

2,75

31

3,0 3,5

3,25

34

3,5 4,0

3,75

11

4,0 4,5

4,25

4,5 5,0

4,75

n=100
Mdia (X): ponto mdio de cada classe x respectiva frequncia dividido pelo n

X = 1,75x3 + 2,25x16 + ... + 4,25x4 + 4,75x1 = 300 = 3


100
100
PROF DR MARIA IVANILDE ARAUJO- UFAM

62

Medidas de Variabilidade

PROF DR MARIA IVANILDE ARAUJO- UFAM

63

Medidas de Variabilidade

PROF DR MARIA IVANILDE ARAUJO- UFAM

64

Medidas de Variabilidade
Medida de disperso: indicadores do grau de variabilidade dos
indivduos em torno das medidas de tendncia central
Varincia: Medir os desvios em relao a mdia

No h mdia dos desvios pois sua soma igual a zero


Ex.: 0,4,6,8,7
X (mdia) : 0+4+6+8+7 = 25 = 5
5
5
X X (desvio em relao a mdia)

0
4
6
8
7

5
5
5
5
5

=
=
=
=
=

-5
-1
1
3
2

A soma dos desvios igual a zero


(-5 + -1)+1+3+2= - 6 + 6 = 0
PROF DR MARIA IVANILDE ARAUJO- UFAM

65

Medidas de Variabilidade
Varincia: Soma dos quadrados dos desvios
Dados
X

Desvios
(X X)

Quadrado dos desvios


(X X) 2

-5

25

-1

x=5

(x x) = 0

(x x) 2 = 40

A soma do quadrado dos desvios no usada como medida de


disperso, porque o seu valor cresce com o n de dados
PROF DR MARIA IVANILDE ARAUJO- UFAM

66

Medidas de Variabilidade
Varincia

Ento, para medir a disperso dos dados em relao


mdia, usa-se a varincia (S2) que leva em considerao
on
S2 = soma dos quadrados dos desvios
n1
Para os dados: 0, 4, 6, 8 e 7 a S2 = 40 = 40 = 10
5 1 4

PROF DR MARIA IVANILDE ARAUJO- UFAM

67

Medidas de Variabilidade
Desvio Padro
Raiz quadrada da varincia, sendo representava por S; tem a mesma
unidade de medida dos dados
Ex.: 0,4,6,8,7. S2 (varincia) = 10
s (desvio padro): 10 = 3,16
Coeficiente de varincia (CV)
Razo entre o desvio padro e a mdia x 100
CV = 6 x 100
X
Ex.: Grupo I: 3,1,5 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,7%
Grupo II: 55,57,53 anos (x = 55 anos; s2 = 4; s = 2) : CV = 3,64%
Vejam disperso dos dados em ambos os grupos a mesma, mas os
CV so diferentes (no grupo I a disperso relativa ALTA)
PROF DR MARIA IVANILDE ARAUJO- UFAM

68

You might also like