Bioestatistica basica

AULA 2
Conteúdo:
Apresentacao de dados (Craficos)
Nedidas de posicao
Nedidas de dispersao
aracteristicas
importantes dos dados
Centro: Um valor representativo ou médio,
que indica onde se localiza o meio do
conjunto de dados.
variacao: Uma medida de quanto os valores
dos dados variam.
istribuicao: A natureza ou forma da
distribuicao dos dados (ex. uniforme, sino,
assimétrica).
"utliers ou valores discrepantes: valores
amostrais que se localizam muito longe da
grande maioria dos outros valores amostrais.
'empo: aracteristicas dos dados que
mudam com o tempo.
Apresentacao grafica
de dados
iagrama de Barras
Usado para apresentar variáveis
qualitativas e quantitativas discretas.
As barras do diagrama podem ser
verticais ou horizontais.
Variáveis qualitativas - ilustrar
comparações entre categorias.
Variáveis quantitativas discretas -
barras do diagrama devem ser
verticais.
iagrama de Barras ·
Exemplos
Taxas de mortaIidade peIos cânceres mais comuns, sexo
feminino. Estado de São PauIo, 1992.
0
2
4
6
8
10
12
14
mama estômago cólon/reto pulmão colo/útero
Tipo de Câncer
Ó
b
i
t
o
s

/

1
0
0
.
0
0
0

h
a
b
i
t
a
n
t
e
s
onte: onte: Ministério da Saúde (1994)
onte: onte: SP / undação Seade
iagrama de Barras ·
Exemplos
ncidência de efeitos coIaterais devido ao uso
de um novo agente anti-hipertensivo
0
5
10
15
20
25
30
1 2 3 4 5
número de efeitos coIaterais
f
r
e
q
ü
ê
n
c
i
a
Apresentacao grafica
de dados
Gráfico de setores
Usado para representar variáveis
qualitativas.
Cada categoria corresponderá a uma
divisão ou a um setor de um círculo.
Geralmente utilizado quando se pretende
comparar o total de cada categoria com o
conjunto total.
Neste tipo de gráfico, um círculo de raio
qualquer vai representar 100% dos
dados (360
o
).
$uando usar a freqüência relativa no
grafico, colocar o N.
Crafico de Setores ·
Exemplo
ráfico em setores da distribuição da tubercuIose (Dawson, 2003,
p.43)
Negros não-
hispânicos
37%
Brancos não-
hipânicos
35%
Asiáticos ou
habitantes das ilhas
do Pacífico
11%
Americanos nativos
1%
Hipânicos
16%
Apresentacao grafica
de dados
istograma
Adequado para ilustrar o comportamento de
valores agrupados em classes.
É um gráfico de colunas composto por vários
retângulos adjacentes, representando a
tabela de freqüência.
As classes são colocadas no eixo horizontal e
as freqüências no eixo vertical.
Na construção devem ser empregadas de 5 a
20 classes.
Interpretação: Centro, variação, forma
e 4:907 Não é apropriado para
verificar se há mudanças ao longo do
tempo.
istograma - Exemplo
PercentuaI de Iinfócitos em pacientes com
Ieucemia Iinfóide
Percentual de linfócitos reqüência
10 |- 12 5
12 |- 14 6
14 |- 16 5
16 |- 18 1
18 |- 20 2
20 |- 22 1
total 20
istograma · Exemplo
PercentuaI de Iinfócitos em pacientes com Ieucemia Iinfóide
0
1
2
3
4
5
6
7
11 13 15 17 19 21
percentuaI de Iinfócitos
f
r
e
q
ü
ê
n
c
i
a
Apresentacao grafica
de dados
#oligono de freqüência
Utilizado na representacao de variaveis
quantitativas continuas.
Usa segmentos de reta ligados a
pontos localizados diretamente acima
dos valores dos pontos médios de
classe.
Os segmentos sao estendidos a direita
e a esquerda de forma que o grafico
comece e termine no eixo horizontal.
Exemplo: tabela usada para construcao
do histograma
#oligono de freqüência
Exemplo
PercentuaI de Iinfócitos em pacientes com Ieucemia Iinfóide
0
1
2
3
4
5
6
7
9 11 13 15 17 19 21 23
percentuaI de Iinfócitos
f
r
e
q
ü
ê
n
c
i
a
Apresentacao grafica
de dados
"giva de Calton
um grafico de linha que representa
as freqüências acumuladas.
O grafico se inicia com a fronteira
inferior da primeira classe e termina
com a fronteira superior da última
classe.
Exemplo: tabela usada para construcao
do histograma
Ogiva de Calton ·
Exemplo
PercentuaI de Iinfócitos em pacientes com Ieucemia Iinfóide
0
5
10
15
20
25
10 12 14 16 18 20 22
percentuaI de Iinfócitos
f
r
e
q
ü
ê
n
c
i
a

a
c
u
m
u
I
a
d
a
Apresentacao grafica
de dados
%amo·e·folha
%epresenta dados separando cada valor
em duas partes: o ramo (digito mais a
esquerda) e a folha (digito mais a direita).
#ode ser expandido ou condensado.
Ao virar o ramo·e·folhas de lado podemos
ver a distribuicao dos dados.
vantagem: os dados originais podem ser
recuperados.
Usar de S a 20 classes.
%amo·e·folha -
Exemplo
57 63 66 70 74 81 87 94
59 63 68 71 75 83 88 95
60 63 69 72 75 85 88 101
60 64 69 72 77 86 89 107
62 66 70 73 78 86 91 119
iametros abdominais de 40 individuos
%amo·e·folha -
Exemplo
#amo (dezena) olhas (unidades)
5 7 9
6 0 0 2 3 3 3 4 6 6 8 9 9
7 0 0 1 2 2 3 4 5 5 7 8
8 1 3 5 6 6 7 8 8 9
9 1 4 5
10 1 7
11 9
iametros abdominais de 40 individuos
Apresentacao grafica
de dados
iagrama de dispersao
É a melhor maneira de visualizar o
relacionamento entre duas variáveis.
A representação gráfica é feita no
mesmo sistema de coordenadas, em
que uma das variáveis é colocada no
eixo x e outra no eixo y.
gráfico de dispersão é utilizado para
interpretar o relacionamento entre duas
variáveis (direção, forma e intensidade
do relacionamento).
iagrama de
ispersao · Exemplo
ndice de massa corporaI (C) e percentuaI
de gordura de 10 universitárias. BrasiI, 1997
ndivíduo MC Percentual de gordura
1 21,5 29
2 20,7 25
3 21,3 26
4 19,0 23
5 21,2 25
6 18,6 23
7 16,8 18
8 20,7 28
9 30,8 46
10 18,3 22
onte: dados fictícios
iagrama de
ispersao · Exemplo
#eIação entre C e percentuaI de gordura de 10 universitárias.
BrasiI, 1997
0
10
20
30
40
50
0 5 10 15 20 25 30 35
C
P
e
r
c
e
t
u
a
I

d
e

g
o
r
d
u
r
a
Boxplot - após N#
Nedidas de centro
valor no centro ou no meio do conjunto
de dados.
Nedidas: média, mediana, moda e
ponto médio.
Nédia
Nédia amostral Nédia populacional
n
x
X
n
i
i

x
n
i
i

3
Nédia · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de centro
Nediana
Para calcular a mediana devemos
primeiro colocar os valores em ordem
crescente (ou decrescente) e, em
seguida, aplicar um dos dois processos
abaixo:
Se o número de valores é ímpar, a
mediana é o número localizado
exatamente no meio da lista.
Se o número de valores é par, a mediana
é a média dos 2 valores do meio.
Nediana · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de centro
Noda (N)
o valor que ocorre mais
freqüentemente.
Uma distribuicao pode ser unimodal,
bimodal, multimodal ou amodal.
Noda
5 5 5 3 1 5 1 4 3 5
1 2 2 2 3 4 5 6 6 6 7 9
1 2 3 6 7 8 9 10
Noda · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de centro
#onto médio
o valor a meio caminho entre o maior
valor e o menor valor da série.
#onto médio ·
exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de centro
Nédia de uma distribuicao de
freqüência

n
i
i
n
i
i i
n
n x
X

Nédia de uma
distribuicao de
freqüência · Exemplo
PercentuaI de Iinfócitos em pacientes com
Ieucemia Iinfóide
Percentual de linfócitos reqüência
10 |- 12 5
12 |- 14 6
14 |- 16 5
16 |- 18 1
18 |- 20 2
20 |- 22 1
total 20
Assimetria
A distribuicao de dados é assimétrica quando
se estende mais para um lado que para o
outro.
Uma distribuicao de dados é simétrica se a
metade esquerda do seu histograma é
praticamente uma imagem espelhada de sua
imagem direita.
Separatrizes
Separatrizes
"uartiI: ivide a distribuição em 4
partes iguais em um conjunto
ordenado de valores.
PercentiI: ivide a distribuição em
100 partes iguais em um conjunto
ordenado de valores.
DeciI: ivide a distribuição em 10
partes iguais em um conjunto
ordenado de valores.
Separatrizes
Separatrizes
bservação:
ntervalo interquartil = Q
3
÷ Q
1
ntervalo semi-quartil = (Q
3
÷ Q
1
) / 2
Quartil médio = (Q
1
+ Q
3
) / 2
Amplitude de percentis 10-90 = P
90
÷ P
10
Separatrizes ·
Exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
alcule $1, $2, $3, #10 e 3
Apresentacao grafica
de dados
Boxplot ou diagrama em caixa ou
diagrama de caixa e bigode
%esumo dos cinco números: minimo,
$1, $2, $3 e maximo.
um grafico de um conjunto de dados
que consiste em uma linha que se
estende do valor minimo até o valor
maximo, em uma caixa com linhas
tracadas em $1, $2 e $3.
Utilizacao: comparacao entre
conjuntos de dados.
Apresentacao grafica
de dados
Construcao de um diagrama de
caixa
Ache o resumo dos cinco números.
onstrua uma escala com valores que
incluam o maximo e o minimo dos dados.
onstrua uma caixa retangular
estendendo·se de $1 a $3, e trace uma
linha ns caixa no valor de $2.
Trace linhas estendendo·se da caixa até
os valores minimo e maximo.
Boxplot · Exemplo
igure 1. Effect of Newly iagnosed elicobacter pylori !nfection
on Thyrotropin Levels in #atients with Nultinodular Coiter Treated
with Thyroxine. The box plots show levels of thyrotropin in
patients who received no treatment with thyroxine, in patients
receiving thyroxine treatment (median dose, 1.S6 microg per
kilogram per day) and in whom a low level of thyrotropin (0.0S to
0.20 mU per liter) was stably achieved, in patients with . pylori
infection (with no change in the dose of thyroxine), and in patients
after the eradication of . pylori infection (median dose, 1.70
microg per kilogram per day).
Nedidas de dispersao
A dispersão fornece uma medida da
proximidade da série de dados em
torno de um valor de tendência central,
tomado como comparação.
Medidas para avaliar a dispersão de
um conjunto de dados: mpIitude
TotaI, Desvio Fdio, Variância,
Desvio Padrão e Coeficiente de
Variação.
Nedidas de dispersao
mpIitude totaI
maior amplitude total F maior
dispersão.
Problema: somente são usados os
extremos do conjunto (medida
instável).
Elemento auxiliar na análise F mostra
a faixa de variação onde encontramos
todos os elementos do conjunto.
2Jn x 2Ex x AT
Amplitude · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de dispersao
Desvio mFdio
a média aritmética dos desvios
absolutos dos elementos da série,
tomados em relacao a média.
x x d

d
DM
i


43/0

esvio médio ·
exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de dispersao
esvio padrao
&tiIização
Verificação da dispersão ou espalhamento de
um conjunto de dados;
Permite distinguir numericamente conjuntos
de dados de mesmo tamanho e mesma
média, mas que são visivelmente diferentes.

n
x
n
i
i

3
9

n
X x
s
n
i
i
Nedidas de dispersao
Desvio padrão - nterpretação
Uma pergunta que pode surgir é se
um desvio padrão é grande ou
pequeno; dependendo da ordem de
grandeza da variável.
Comparação de séries F menor
desvio F padrão mais homogênea
ou menos dispersa.
esvio padrao ·
Exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de dispersao
esvio padrao de uma distribuicao de
freqüência
#opulacao Amostra

n
X x n
s
n
i
i i

n
x n
n
i
i i

3
9
esvio padrao de uma
distribuicao de
freqüência · Exemplo
PercentuaI de Iinfócitos em pacientes com
Ieucemia Iinfóide
Percentual de linfócitos reqüência
10 |- 12 5
12 |- 14 6
14 |- 16 5
16 |- 18 1
18 |- 20 2
20 |- 22 1
total 20
Nedidas de dispersao
variancia
Medida direta da dispersão F
conjunto com os dados mais dispersos
terá maior variância.
Medida em unidade quadrada
(exemplo: anos
2
) F o que dificulta a
sua interpretação.

n
x
n
i
i

3
9

n
X x
s
n
i
i
variancia · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Nedidas de dispersao
Coeficiente de variação
É uma medida de dispersão relativa
(%) que mede a variação do desvio
padrão em relação à média aritmética.
X
s
CJ L
Nedidas de dispersao
Série Média esvio padrão
A (t) 80,8 t 10,0 t
B (cm) 450,0 cm 10,0 cm
C (
o
C) 32,6
o
C 4,2
o
C
(
o
C) 30,0
o
C 2,6
o
C
E (t) 8200 t 700,0 t
Coeficiente de variacao
1) Qual a série mais homogênea: a série A ou
a série B?
2) A série C ou a série ?
3) A série A ou a série E?
oeficiente de
variacao · exemplo
variacao de freqüência cardiaca com a respiracao
profunda numa amostra aleatória de 18 pacientes
!dentificacao
do individuo
variacao da
freqüência
cardiaca
1 13,2
2 S1,3
3 33,1
4 86,7
S 23,1
6 4S,3
7 14,4
8 67,1
3 64,8
10 1S,3
Banco de dados ·
onolulu
oencas ardiacas - 7.683 casos
coletados no avai em 1363
Tamanho da amostra: 100
Universo: omens doentes com idade
entre 4S e 67 anos.
ator de exposicao: fumante
Nédia de !dade da populacao: S4,36
anos
Banco de dados ·
onolulu
variaveis Codificadas:
1) Educatio: nivel de instrucao
Utilizando similar brasileiro:
1 = nenhuma
2 = primeiro grau incompleto
3 = primeiro grau completo
4 = segundo grau completo
S = curso técnico
6 = curso superior
2) Weight : peso em Kg
3) eight : altura em cm
4) Age : idade em anos
Banco de dados ·
onolulu
variaveis Codificadas:
S) Smoking: status de fumante
0 = nao
1 = sim
6) #hisical : atividade fisica
1 = sedentario
2 = moderada
3 = alta
7) Clucose: nivel de glicose no sangue em
miligramas percentuais
8) holest: nivel de coleterol sérico em
miligramas percentuais
10) #ressure: pressao sanguinea sistólica em
mmg
Banco de dados ·
onolulu
#rocedimentos · 'abelas (#lanilha:
quali. cont. graf.)
variaveis nivel educacional, umo e
Atividade isica - construcao de tabela
usando comando freqüência.
Banco de dados ·
onolulu
#rocedimentos - Craficos (#lanilha:
quali. cont. graf.)
variaveis Nivel Educacional, umo e
Atividade isica - construcao de
diagrama de barras (barras e colunas)
e diagrama circular.
Banco de dados ·
onolulu
#rocedimentos · Nedidas
alcular média, mediana, moda,
amplitude total, desvio médio, desvio
padrao, variancia para as variaveis
massa, estatura, glicose, colesterol e
pressao.
Uso das funcoes estatisticas do EXEL.
Uso da ferramenta analise descritiva do
menu erramentas.
Banco de dados ·
onolulu
#rocedimentos · Nedidas
Uso das funcoes estatisticas do EXEL.
!nserir F uncao F Estatistica F nome
da funcao (planilha: medidas)
Banco de dados ·
onolulu
#rocedimentos · Nedidas
Nome das funcoes
Nedida uncao
Nédia Nédia
Noda Nodo
Nediana Ned
$uartil $uartil
#ercentil #ercetil
Amplitude total Naximo - minimo
esvio médio esv.médio
esvio padrao esvpad
variancia var
Banco de dados ·
onolulu
erramentas F Analise de dados F
Estatistica descritiva (planilha: dados)

Sign up to vote on this title
UsefulNot useful