Curso de Pós Graduação em Gestão de Saúde Pública com ênfase em PSF

BIOESTATÍSTICA

Eduardo Arrudas Ornelas
Biólogo Mestre em Medicina Veterinária UFMG á

Métodos estatísticos

Estatística Descritiva

Estatística Inferencial

Estatística descritiva: Reúne um conjunto d té i R ú j t de técnicas para sumarizar os d d i dados (tabelas, quadros e gráficos) e medidas descritivas que permitem tirar muitas informações contidas nos dados dados.

Inferência estatística : Produzir afirmações sobre uma dada característica da população, na qual estamos interessados, a partir de informações colhidas de uma parte dessa população. ç p p p ç

Estatística Descritiva • Envolve –Coletar dados C l d d –Apresentar dados –Caracterizar dados • Finalidade –Descrever dados

Estatística Inferencial • Envolve –Estimativas –Teste de hipótese Teste • Finalidade –Tomar decisões sobre características da população de uma coleta.

População e Amostra • População (ou universo): todos os N membros de uma classe ou grupo. – Ex.: todos os alunos de pós graduação da DOCTUM • Amostra é uma parte da população população, denotada por n. – Ex.: todos os alunos de pós graduação em saúde pública com ênfase em PSF PSF.

Características importantes dos dados 1. Localização: Um valor representativo ou médio p indica onde se situa o centro dos dados. 2. Variação: Uma medida do 2 V i ã : Um m did d quanto os valores d t l da amostra variam entre si. 3. Distribuição: A natureza ou a forma de distribuição dos dados (tal como em forma de sino, uniforme ou assimétrica) 4. 4 Tempo: Algumas características podem se alterar ao longo do tempo.

Importante!!! Imp t t !!!

POPULAÇÃO

AMOSTRAGEM

N

n

Distribuição de Freqüência lista dos valores dos dados (ou individuais ou por grupos de intervalos), i t l ) juntamente j t t com as correspondentes freqüências ou contagens.

Os dados t bé O d d também podem ser resumidos d id construindo uma tabela de distribuição de freqüências. f üê i

Distribuição de freqüências d uma variável é Di t ib i ã d f üê i de iá l uma lista dos valores que a variável pode assumir, com as respectivas f i ti freqüências d üê i de ocorrência.

Tabelas de contingência

Tabela de contingência Em estatística as tabelas de contingência são usadas para registar e analisar o relacionamento entre duas ou mais variáveis variáveis, normalmente de escala nominal. Suponhamos que temos duas variáveis sexo (masculino ou variáveis, feminino) e mão com que escreve (destro ou canhoto). Observamos os valores de ambas as variáveis de uma amostra casual d 100 pessoas. U l de Uma t b l d contingência pode ser usada tabela de ti ê i d d para expressar o relacionamento entre estas duas variáveis, como se segue:
MASCULINO DESTROS 43 CANHOTOS 44 TOTAL 87 FEMININO 9 4 13 TOTAL 52 48 100

Tabela d T b l de contingência ti ê i

VARIÁVEIS C D TOTAL

A AC AD AC + AD

B BC BD BC + BD

TOTAL AC + BC AD + BD A + B + C + D= N

Freqüência Freqüênc a Freqüência absoluta (fa): o resultado do número de vezes (fa) que o valor é observado na população. Freqüência relativa (f ) o resultado obtido d d ê l (fr): l d d da divisão entre a freqüência que o valor é observado na população e a quantidade de elementos da população população. Geralmente é apresentada na forma de porcentagem.

fa (Skol)=9 ( ) fr(Skol)=9/25 = 0,36 ou 36%

A interpretação da freqüência e distribuição da amostra • Quando se faz inferências estatísticas do ponto de vista da freqüência, nós assumimos que nossos dados são amostras de uma população inteira. • A população é descrita pela média e variância da é â população que são desconhecidas. • A amostra é descrita pela média e variância da amostra. – A média e variância da amostra provêm estimativas m a ar ânc a a pro m st mat as sobre a média e variância da população inteira. – As estimativas são conhecidas com um grau de incerteza.

Variáveis Quantitativas: Medidas de Posição: •Máximo •Mínimo Mí i •Moda •Média •Mediana •Quartil,Percentil, Decil Q , , Medidas d Dispersão M did de Di ã •Amplitude •Intervalo Interquartil Intervalo •Variância •Desvio Padrão •Coeficiente de Variação

MEDIDAS DE POSIÇÃO ÇÃ

Medidas de tendência central As medidas d tendência central são did da dê i l ã p parâmetros que permitem que se tenha q p q uma primeira idéia, um resumo, de como se distribuem os dados de um experimento.

Medidas de posição Máximo (Max): a maior observação Mínimo (Min): a menor observação Moda (Mo): é o valor (ou atributo, caractrerística) que ocorre com maior frequencia frequencia. Dados: 5,3,4,3,9,4,5,6,6,5,6,6,8,8 Max = 9 Min = 3 Mo = 6

Média É a soma das medidas (resultados) dividida l ú di idid pelo número d casos . de

É a medida mais utilizada no entanto utilizada, sofre bastante influência de valores extremos. È uma medida i t did irreal. l

Mediana É o valor da variável a partir da posição central de um conjunto de dados n (dados ordenados) na qual a metade dos casos s encontra acima d l e a metade s encontra abaixo. s s se t i dele t d se t b i Obs: se o número de observações for ímpar, a mediana será o ç p , valor central da distribuição; Se o número for par a mediana será a média dos valores centrais. centrais Pouco afetada por valores discrepantes existentes no p p conjunto (que costuma distorcer substancialmente o valor da média) Posição da mediana = n+1 / 2

cv cv cv cv cv

cv cv

cv

cv

cv

cv

cv

Medidas separatrizes Permitem identificar a posição de um valor(caso) em relação ao conjunto de observações, além de possibilitar comparações entre diferentes séries de dados. •Quartil •Decil •Percentil

Quartil (Q) São representados pelo 1° (Q1) 2 °(Q2) 3°(Q3) 1 (Q1), (Q2),3 (Q3). O 2°(Q2) quartil indica que abaixo existem 50% 2 (Q2) da distribuição, logo, acima estão os outros 50% dos dados os quartis dividem a base em 4 partes.

Decil (D) ( )
São representados por por um conjunto de dados ordenados D1 D2 D3 d d D1,D2,D3........e D9 d il decil. O 1° decil (D1) de um conjunto de dados informa que abaixo estão localizados 10% dos dados do conjunto de observações e , assim sendo, acima estão os 90% restantes. Os outros decis são representados de p forma semelhante. 5° decil (D5)= valor Mediano (Md).

Percentil (P)
São Sã representados por um conjunto d d d t d j t de dados ordenados d d P1,D2,D3........e P99 percentil. O 1° percentil (P1) informa que 1% dos dados estão p ( ) f m qu localizados abaixo desse valor, e, por seguinte os 99% restantes estão acima. A interpretação dos demais é feita de forma análoga análoga. Percentil (P50)= mediana ou segundo quartil (Md) Percentil (P25)= primeiro quartil (Q1) Percentil (P25)= primeiro quartil (Q1) Percentil (P75)= terceiro quartil (Q3) Percentil (P10)= primeiro decil (D1)

POPULAÇÃO Ç μ δ P AMOSTRA
X

S p p´

Média Definição Existência Leva em conta  todos os dados p Afetado por  valores  discrepados Vantagens Soma das medidas  divida pelo número  de casos. de casos Sempre existe. Sim Sim Usado em muitos  métodos  estatísticos.

Mediana Valor do meio. Sempre existe. Não Não Menos sensível a  valores  discrepados.

Moda Valor mais  freqüente. Pode existir, pode  haver mais de uma. Não Não

Apropriada a dados  qualitativos.

MEDIDAS DE DISPERSÃO Ã

Medidas de variabilidade (dispersão) Tem como finalidade encontrar um valor que resuma a variabilidade de um conjunto de dados. •Amplitude de variação (A) Amplitude •Amplitude interquatil •Desvio Padrão (s ou DP) Desvio •Variância (s2) •Coeficiente de variação (CV) Coeficiente •Erro padrão (se ou e)

Amplitude
É a diferença entre o maior (Máximo) e o menor (Mínimo) valor que foi observado para a variável servindo para variável, caracterizar a abrangência do estudo. Amplitude de Variação(A) Diferença entre o mínimo e o máximo do conjunto de dados. d d Amplitude interquartil É a diferença entre os valores correspondentes ao 1°(Q1) e 3°(Q3) quartil (percentil (P25) e (P75). Esta medida não q p considera os valore extremos do conjunto de dados.

Desvio Padrão (s) É uma estimativa da variabilidade dos escores de um grupo (amostra) em torno da média.

O desvio padrão (s ou DP) é a raiz quadrada da variância.
A unidade do desvio padrão é igual a unidade de medida das observações.

Variância (s2) É a soma dos quadrados dos desvios de cada ponto em torno da média aritmética. Caracteriza a dispersão dos pontos de uma amostra potencializando as diferenças.

Expressa a média aritmética dos quadrados. É o desvio padrão elevado ao quadrado.

Coeficiente de variação (CV) É uma medida de dispersão relativa que indica a variabilidade da amostra em relação a média média. Resultado do desvio padrão dividido pela média transformando em percentual.

Permite comparar a dispersão de diferentes distribuições (com diferentes médias e desvios padrões. Elimina o efeito da magnitude dos dados.

cv cv cv cv cv

cv cv

cv

cv

cv

cv

cv

Erro padrão (se ou e) Quociente entre o desvio padrão e a raiz quadrada do tamanho da amostra. É uma mediada de variabilidade entre a média aritmética dos dados e a média que poderia ser encontrada em outras amostras do mesmo tamanho, na mesma população.

O erro amostral: informa sobre o quanto d erro nossas observações i f b de b õ apresentam sobre a realidade pesquisada. A estatística baseia-se na medição do erro que existe entre a estimativa de quanto uma amostra representa adequadamente a p p ç população da qual foi extraída. Assim o conhecimento de q teoria de conjuntos, análise combinatória e cálculo são indispensáveis para compreender como o erro se comporta e a magnitude d mesmo. É o erro ( it d do (erro amostral) que t l) define a qualidade da observação e do delineamento experimental. experimental

Obrigado!!! Ob i d !!!

Eduardo Arrudas Ornelas ornelasea@hotmail.com