You are on page 1of 26

Bioestatística

Aula 09
Resumo da última aula – Aula 08
• Teste-t
• Unilateral x Bilateral
• Testes paramétricos x não-paramétricos

• Testes de hipótese não-paramétricos


• Distribuição qui-quadrado
o variáveis qualitativas arranjadas em duas ou mais categorias
o fornece a probabilidade com que as diferenças entre os valores
observados e esperados ocorreriam somente em razão do acaso
Aula de hoje – Aula 09
• Aula 09
• Testes de Rastreamento Diagnóstico
• Testes para variáveis ordinais
o Teste U de Wilcoxon-Mann-Whitney (WMW)
o Teste t de Wilcoxon
Relembrando
• Testes paramétricos:
• Exigem que a(s) amostra(s) tenha(m) uma distribuição normal, especialmente
se tiverem uma dimensão inferior a 30
• Nas amostras de dimensão superior a 30, a distribuição aproxima-se da
distribuição normal e também se aplicam os testes t
• Testes não paramétricos:
• Não necessitam de requisitos tão fortes, como a normalidade, como os testes
paramétricos, para serem usados. São também indicados quando as amostras
são pequenas
• São usados quando a amostra tem uma distribuição que não é normal ou
quando, apesar da amostra ter uma dimensão superior a 30, se opta por
conclusões mais conservadoras
• A desvantagem destes testes é que não são tão potentes quanto os testes
paramétricos, ou seja, com os testes não paramétricos não se encontram tantas
diferenças entre os dados, quando essas diferenças realmente existem
Testes de normalidade
• Kolmogorov-Smirnov (n > 50)
• Shapiro-Wilk (n < 50)
• https://www.youtube.com/watch?v=yr7eGbBvpvw
Testes de Rastreamento Diagnóstico
• Também conhecidos como screening test, os testes de
rastreamento têm sido largamente empregados como
estimadores de doenças em estudos de pesquisas
epidemiológicas e clínicas, de modo a oferecer uma forma
segura para o processo de tomada de decisão se um
determinado procedimento diagnóstico deve ou não ser
aplicado para uma dada população
Indicadores de testes de diagnóstico
• Sensibilidade (S)
• Refere-se à capacidade do teste em detectar a doença que está
sendo investigada quando ela está de fato presente. Ou seja, de
ser positivo nos pacientes que realmente têm a doença. A
sensibilidade expressa a porcentagem dos pacientes com a
doença, cujos resultados do exame foram positivos
• Se o teste apresentar alta sensibilidade, raramente deixará de
diagnosticar indivíduos com a doença. Por outro lado, se o teste
não é sensível, ele não detectará a doença em alguns dos
indivíduos doentes. A proporção destes indivíduos é chamada de
taxa de erro falso-negativo (EFN)
Indicadores de testes de diagnóstico
• Especificidade (E)
• Refere-se à capacidade do teste em identificar os indivíduos que
não têm a doença investigada quando, de fato, ela não está
presente. Ou seja, de ser negativo nos pacientes que realmente
não têm a doença. A especificidade expressa a porcentagem dos
pacientes sem a doença, cujos resultados do exame foram
negativos
• Se o teste apresentar alta especificidade, raramente classificará
como doente um indivíduo sem a doença. Por outro lado, se o
teste não é específico, ele indicará, erroneamente, a presença da
doença em alguns dos indivíduos não-doentes. A proporção destes
indivíduos é chamada de taxa de erro falso-positivo (EFP)
Testes para variáveis ordinais
• Pré-requisitos dos Testes paramétricos
o variável medida numa escala dimensional contínua e apresente, a princípio,
uma distribuição normal e variâncias iguais (homocedasticidade)
• Exemplos de testes paramétricos
o teste t-student, anova
• Pré-requisitos dos Testes não paramétricos
o não exigem a estimação da variância, da média populacional ou da distribuição
da variável estudada
• Em razão de sua pouca exigência, estes testes são chamados de
testes de distribuição livre
• Exemplo:
o Qui-quadrado
Teste U de Wilcoxon-Mann-Whitney (WMW)
• Também chamado de teste da soma de postos (Wilcoxon rank-sum
test)
• Na estatística inferencial o teste U de Wilcoxon-Mann-Whitney é um
dos mais conhecidos entre todos os testes de significância não-
paramétricos, sendo utilizado para comparar se duas amostras
independentes e de tamanhos iguais provêm de uma mesma população
• Para que o teste possa ser utilizado, é necessário que as duas amostras
sejam aleatórias e as observações independentes, tanto dentro de cada
amostra como entre as amostras estudadas, ao mesmo tempo em que a
variável considerada seja mensurada em escala ordinal, isto é, que seja
apresentada do menor para o maior valor (rank)
Teste U de Wilcoxon-Mann-Whitney (WMW)
• Ex.1: conjunto de seis valores já ordenados: {9; 15; 17; 17; 21; 23}.
Os respectivos postos serão: {1; 2; 3,5; 3,5; 5; 6}

• Ex.2: Uma empresa lançou uma campanha publicitária há algum


tempo e pretende avaliar se existe suficiente evidência estatística
(para um nível de significância de 5%) de que as vendas de uma
determinada linha de produtos aumentaram (ou diminuíram) em
consequência. Após uma pesquisa na base de dados, as vendas
verificadas durante estes períodos encontram-se representadas no
próximo quadro (ordenadas cronologicamente e ajustadas da
sazonalidade e da tendência)
Teste U de Wilcoxon-Mann-Whitney (WMW)

• À primeira vista é-se tentado a concluir que as vendas aumentaram pois a média de
vendas depois (15,9 unid./sem) é superior à média de vendas antes (11,4 unid./sem.)
• Contudo, pode não existir evidência estatística suficiente para tirar tal conclusão,
devendo-se aqueles valores apenas à aleatoriedade dos dados. Neste caso, para
obtermos uma resposta com um certo nível de confiança, realizamos um teste estatístico
não-paramétrico – já que, à principio, desconhecemos os parâmetros das leis de
distribuição daquelas duas populações – designado “método de Wilcoxon”
Teste U de Wilcoxon-Mann-Whitney (WMW)
• Solução
• SPSS
o Observação, o PSPP não realiza análise para amostras independentes,
contudo o SPSS realiza
o Analyse >> Non-parametric >> Legacy dialogs >> 2 independente samples
Teste U de Wilcoxon-Mann-Whitney (WMW)
• For example, a neurologist might collect data to investigate
the depressant effects of certain recreational drugs. She
tested 20 clubbers in all: 10 were given an ecstasy tablet to
take on a Saturday night and 10 were allowed to drink only
alcohol. Levels of depression were measured using the Beck
Depression Inventory (BDI) the day after and midweek. The
data are in Table 15.1.
• (Discovering statistics using spss pag 541)
Teste U de Wilcoxon-Mann-Whitney (WMW)
Participant
1
Drug
Ecstasy
BDI (Sunday)
15
BDI (Wednesday)
28 • Analyse>> Descriptive Statistics
2 Ecstasy 35 35
3 Ecstasy 16 35 >> Frequencies >> (Statistics –
4
5
Ecstasy
Ecstasy
18
19
24
39 Median)
6 Ecstasy 17 32
7
8
Ecstasy
Ecstasy
27
16
27
29
• (lembrar de separar os grupos)
9 Ecstasy 13 36
10 Ecstasy 20 35
11 Alcohol 16 5
12
13
Alcohol
Alcohol
15
20
6
30
• Analyse >> Non-parametric >>
14
15
Alcohol
Alcohol
15
16
8
9
Legacy dialogs >>
16 Alcohol 13 7
17 Alcohol 14 6 2 independent samples
18 Alcohol 19 17
19 Alcohol 18 3
20 Alcohol 18 10
Teste U de Wilcoxon-Mann-Whitney (WMW)
• Resultado:
• Depression levels in ecstasy users (Mdn =17.50) did not differ
significantly from alcohol users (Mdn =16.00) the day after the
drugs were taken, U =35.50, z = −1.11, p=.269. However, by
Wednesday, ecstasy users (Mdn =33.50) were significantly more
depressed than alcohol users (Mdn =7.50), U = 4.00, z = −3.48, p
<.001.
• U = Mann-Whitney’s U. Pode ser substituído pelos valores de
“Wilcoxon W”: Ws = 90.50, e Ws = 59.00
Teste t de Wilcoxon
• É um teste de hipótese não-paramétrico utilizado para
amostras pareadas, isto é, para comparar dois tratamentos
em duas amostras relacionadas (amostras pareadas) ou para
comparar os resultados de uma mesma medida quando esta
é repetida em uma mesma amostra (teste pareado)
• Este teste pode ser usado como uma alternativa ao teste t de
Student pareado quando a população estudada não assume o
padrão da distribuição normal gaussiana, sendo a variável
medida em uma escala intervalar ou ordinal
Teste t de Wilcoxon
• Ex.: Análise Sensorial é uma ciência que utiliza os sentidos
humanos para avaliar as características organolépticas de um
alimento, constituindo uma poderosa ferramenta frequentemente
utilizada pelas indústrias alimentícias para o desenvolvimento e
otimização da qualidade de seus produtos. Uma empresa realizou
uma análise sensorial para comparar o sabor de duas diferentes
formulações para um determinado produto. Foram realizadas duas
análises para cada provador: a primeira, com a formulação normal;
a segunda, com a fórmula modificada. Os escores, medidos de zero
a 10, estão apresentados na Tabela 17.3
Teste t de Wilcoxon
Teste t de Wilcoxon
• PSPP - PSPP: Analyse – Non-Parametric Statistics – Two related
samples
• Conclusão: Aceita-se H0.
• Conclui-se que os escores da análise sensorial relatados pelos
provadores para a formulação normal não diferiram dos escores
relatados para a formulação modificada
Análise multivariada
• Análise Conceitual Multivariada
• nos modelos de estudo multivariado, o pesquisador estuda a
influência relativa simultânea de duas ou mais variáveis preditoras,
possivelmente causais, sobre uma única variável resposta, a qual é
tomada como desfecho
Bases conceituais da estatística multivariada
• Ex.: Suponha que, após uma longa viagem turística de ônibus, um
passageiro queira mensurar o seu grau de satisfação com a referida
viagem, isto é, se ela deve ser classificada como excelente, boa,
média ou ruim. Com vistas a este objetivo, ele considera que alguns
fatores inerentes à viagem contribuíram de forma efetiva para sua
classificação. São eles: o conforto do ônibus, o preço da passagem,
o tempo de viagem e o roteiro turístico
• Neste caso, podemos afirmar que o conforto, o preço, o tempo e o
roteiro são as variáveis preditoras (independentes), que atuaram
conjuntamente, modificando o desfecho da variável resposta
(dependente) grau de satisfação
• Grau de satisfação ≈ Conforto + Preço + Tempo + Roteiro
Objetivos da estatística multivariada
• Testar se existe, de fato, uma associação verdadeira entre cada uma das
variáveis preditoras (x) estudadas e a variável resposta analisada (y). Ou
seja, é verificar se a correlação entre cada uma das variáveis preditoras
e a variável resposta não ocorreu por puro acaso
• Verificar se existe uma interação entre as diversas variáveis preditoras
(x) na determinação da variável resposta (y). A interação está presente
quando uma das variáveis preditoras influencia a maneira pela qual
outra variável, também preditora, explica o comportamento da variável
resposta
• Caso exista interação entres as variáveis preditoras, compreender quão
importante são estas variáveis preditoras (x), tanto individual como
conjuntamente, para explicar a variação da variável resposta (y)
• Determinar qual das variáveis independentes é a mais forte ao predizer
o comportamento da variável resposta, ou como interage com as outras
variáveis na sua capacidade para a predição
Atividade 4
• No Classroom na próxima quarta. Envio até 17/04 as 08:15hs.
Próxima aula
• I – O Planejamento da pesquisa experimental
• II – Introdução à estatística descritiva
• III – Testes de hipótese paramétricos
• IV – Testes de hipótese não-paramétricos
• V – Análise multivariada

• Aula 10 – Análise de Variância


(One way Anova)

You might also like