You are on page 1of 18

Prof. Lorí Viali, Dr.

http://www.pucrs.br/famat/viali/
viali@pucrs.br
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Objetivos

A Análise de variância (ANOVA) É


utilizada para mostrar os efeitos principais de
variáveis categóricas independentes
(denominadas de fatores) sobre uma variável
quantitativa dependente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Um “efeito principal" é um efeito direto


O Modelo Linear Geral (GLM -General de uma variável independente sobre a variável
Linear Model) suporta, também, variáveis dependente. Um “efeito de interação” é o
efeito de duas ou mais variáveis
categóricas dependentes.
independentes sobre a variável dependente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

1
Objetivos

Os modelos de regressão não podem


Existe uma variante para a utilização
manejar interações a menos que um termo de
de variáveis de controle quantitativas
produto cruzado seja explicitamente
denominada de ANCOVA (Analysis of
adicicionado. A ANOVA mostra efeitos de
Covariance).
interação como resultado da própria técnica.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Existe, também, para o caso de


A estatística teste na ANOVA é a F
múltiplas variáveis dependentes a
(de Snedecor) que testa a diferença entre as
MANOVA (Multiple analysis of Variance) e
finalmente existe uma combinação das duas médias grupos. A distribuição F é assim
denominada de MANCOVA. denominada em homenagem a Sir Ronald
(MANOVA + ANCOVA). Aylmer Fisher (1890 – 1962).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ela testa se as médias dos grupos


Se as médias dos grupos não diferem
formados pelos valores da variável
significativamente então pode-se assumir que
independente (ou combinação de valores
a variável independente não tem efeito sobre
para as múltiplas variáveis independentes)
a variável dependente.
pode ter ocorrido por acaso.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

2
One-Way ANOVA

Testa a diferença entre uma única


É também conhecida cono
variável quantitativa dependente contra
ANOVA univariada, ANOVA de
dois, três ou mais grupos formados pelas
classificação simples ou ANOVA de
categorias de uma uma única variável
um fator.
categórica independente.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Two-Way ANOVA
Two-

A Two-way ANOVA analisa uma


variável quantitativa dependente em A Two-way ANOVA é também
termos de categorias (grupos) de duas comnhecida como Análise de Variância de
variáveis qualitativas independentes, uma dupla classificação.
das quais pode ser considerada como
variável de controle.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

n-Way ANOVA ou MANOVA

Generaliza a ANOVA lidando com “n”


Três variáveis independentes
variáveis independentes. Note-se que o
apresentam três interações de primeira
número de interações cresce neste caso. Duas
ordem (AB, AC, BC) e uma de segunda-
variáveis independentes apresentam uma
ordem (ABC), ou seja, quatro no total.
única interação de primeira ordem (AB).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

3
Quatro variáveis independentes
apresentam seis interações de primeira à medida que o número de interações
ordem (AB, AC, AD, BC, BC, CD), três de aumenta, torna-se bastante difícil
segunda-ordem (ABC, ACD, BCD) e uma interpretar o modelo.
de terceira ordem (ABCD). Dez no total.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O Modelo: Y ij = µ i + U ij

Cada valor obsevado da variável


quantitativa dependente Y ij é dado pela
soma da média (µi) da população de onde
este valor foi retirado mais um erro aleatório
(Uij).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Suposiç
Suposições:
ões:

1) Os erros são variáveis aleatórias com média


zero, isto é, E(Uij) = 0, para i = 1, 2, ..., k 3) Os erros apresentam variância constante,
e j = 1, 2, ..., n; isto é, E ( U 2ij ) = σ 2 , para i = 1, 2, ..., k e
2) Os erros são variáveis aleatórias j = 1, 2, ..., ni ;
independentes, isto é, E(Uij.Uhl) = 0, se i ≠h e 4) Os termos erro Uij seguem uma normal.
j ≠ l;

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

4
Resumindo:
Resumindo: Metodologia:
Metodologia:

Supõem-se que os valores Yij são valores Fazendo µi = µ + αi, onde os αι são os
que resultam da adição de um valor médio µi efeitos dos tratamentos, o modelo fica:
com um termo erro Uij que são variáveis
Y ij = µ + α i + U ij
aleatórias independentes com distribuição
normal de média zero e variância constante Os αι, estão sujeitos a restrição Σniα i = 0.
1
igual a σ2. Então de µi = µ + αi, segue que: µ = ∑n i µi
n i

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Fazendo mi indicar as estimativas de µi


Dados os valores Yij com i = 1, 2, ..., k e
(i = 1, 2, ..., k). Tem-se que:
j = 1,2, ..., ni, de acordo com o Método dos
Y ij = m i + E ij Mínimos Quadrados, as estimativas de mi são
os valores que minimizam a soma dos
Onde E ij é o desvio da j-ésima observação
quadrados dos desvios ou soma residual, dada
em relação a estimativa da média do
por:
tratamento i.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

ni
k ni k ni Segue, então: n i m i = ∑Y
= ∑ ∑ ( Y ij −m i )
2
Q = S .Q .R = ∑ ∑ E 2ij ni j
ij
i j i j
Ou ∑ Y ij
j
Derivando e igualando a zero, tem-se: m i = = Y i
ni

∂Q ni Isto é, o estimador de Mínimos Quadrados


= 2 ∑ ( Y ij − m i )( − 1 ) = 0
∂m i j para a média do i-ésimo tratamento é a média
aritmética das observaçoes deste tratamento.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

5
As Somas dos Quadrados
Indicando por Ai o total do i-ésimo k ni k ni
ij −m i ) = ∑ ∑( Y ij −Y i )
2 2
S .Q .R = ∑ ∑( Y
tratamento, isto é, fazendo: i =1 j =1 i =1 j =1
ni
Ai = ∑Y ij Elevando o binômio ao quadrado, segue:
j =1
Tem-se:
Ai k ni k ni k
2
mi = Y i = S .Q .R = ∑ ∑Y 2ij − 2 ∑Y ∑Y ij + ∑n i Y
ni i i
i =1 j =1 i =1 j =1 i =1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pela definição, tem-se:


Substituindo as expresssões anteriores e
simplificando, tem-se: k ni 2
S .Q .Total = ∑ ∑( Y ij −Y )
i =1 j =1
k niA2i k
S .Q .R = ∑ ∑Y − ∑ 2
ij
i =1 j =1 i =1 n i
Onde: 1 k ni
Y = ∑ ∑Y ij
n i =1 j =1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Pode-se verificar, também: Pela definição, a soma de quadrados dos


2 tratamentos é:
i G k n
S .Q .Total = ∑ ∑ Y 2ij − k
n 2
i j S .Q .Trat . = ∑ n i ( Y i −Y )
Onde: i

k ni k Lembrando que:
G = ∑ ∑ Y ij = ∑ A i A k
i j i mi = Y i = i e ∑α i = 0
ni i= 1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

6
2 2
Tem-se: S .Q .Trat . = k A i − G Esta expressão mostra que a Soma dos

i ni n Quadrados Totais é composta de duas
Juntando os resultados, segue que: parcelas: A Soma dos Quadrados dos
Tratamentos (variação entre tratamentos) e a
Soma dos Quadrados dos Resíduos (variações
S.Q.Res. = S.Q.Total - S.Q.Trat. ou
dentro de tratamentos).
S.Q.Total = S.Q.Trat. + S.Q.Res.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Exemplo:
Exemplo: Tem-se:
Am. 1 Am. 1 Am. 1 n1 = 5, n2 = 6 e n3 = 7 n = 18 e k = 3
10 15 20
Considere- A1 = 55, A2 = 87 e A3 = 119
09 13 19
se os valores Yij 12 12 17 Y 1 = 11; Y 2 = 14 ,5 ; Y 3 = 17 e Y = 14,5
de três amostras 11 17 15 k ni G2
S .Q .Total = ∑ ∑ Y 2ij - = 160 ,50
supostamente 13 14 16
i j n
55 16 18
independentes:
87 14 A2i G 2
k
S.Q .Trat. = ∑ − = 3889 ,50 − 3784,5 = 105
119 i ni n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Espectância da Somas de Quadrados


A soma dos resíduos vale: 2 2
Temos: E ( Y ij ) = µ i e E( Y ij ) = µi + σ 2
A2i
k ni k
S .Q .R = ∑ ∑Y − ∑ = 2
Então: E ⎛⎜
k i n ⎞ k
ij 2⎟= µ 2i + n σ 2
i =1 j =1 i =1 n i

∑ ∑ Y ij ⎟
∑ n i
⎝ i j ⎠ i =1
= 3945 − 3889 ,50 = 55 ,50
ni
Como: Ai = ∑Y ij
S.Q.Total = S.Q.Trat. + S.Q.Res. j =1

Assim: 160,50 = 105 + 55,50 De acordo com o modelo, tem-se:


Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

7
ni
A i = n i µ i + ∑ µ ij Com l ≠ j, segue:
j =1 ni 2 ni ni
2
Segue, então: 2 E( ∑ µ )
ij = E( ∑ µ ij + ∑ µ ij µ il ) = n i σ 2
ni ⎛ ni ⎞ j =1 j =1 l
+ 2 n i ν i ∑ µ ij + ⎜⎜ ∑ µ ij ⎟⎟
2
A 2i = n 2i µ i
j =1 ⎝ j =1 ⎠ Daí: E ( A2i ) = n 2i µ 2i + n i σ 2
Mas:
⎛ ni ⎞ k k ni
E ⎜ ∑ µ ij ⎟ = 0 Como: G = ∑ n i µ i + ∑ ∑ µ ij
⎜ j =1 ⎟ i =1
⎝ ⎠ i =1 j =1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

2
Segue: k ni k ni
2
k k ni ni
E( ∑ ∑ µ )
ij = E( ∑ ∑ µ ij + ∑ ∑ ∑ ∑ µij µhl ) = n σ 2
k 2 k k ni k ni 2 i =1 j =1 i =1 j =1 i =1h =1 l =1 j =1
G 2 = ( ∑ n i µi ) + 2.( ∑ ni µi )( ∑ ∑ µij ) + ( ∑ ∑ µij )
i =1 i =1 i =1 j =1 i =1 j =1 k 2

k ni Assim: E( G2 ) = ( ∑n i µi ) + n σ 2
i =1
Mas: E ( ∑ ∑ µ ij ) = 0
i =1 j =1 Portanto:
2
k 1 k
E( S .Q .Total ) = ∑ n i µ 2i − ( ∑ni µi ) +( n −1 ) σ 2
E com h ≠ i e/ou l ≠ k, segue i =1 n i =1

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ou: E( S .Q .Total ) = W + ( n − 1 ) σ 2
Para os tratamentos, tem-se:
2
2 k 2 1 k
k 1 k E( S .Q .Trat .) = ∑ ( n i µ i + σ 2 ) − ( ∑n i µi ) − σ 2 =
W = ∑ n i µ 2i − ( ∑ n i µ i ) i =1 n i =1
i =1 n i =1
k k 2
2 1
k = ∑ n i µ i − ( ∑n i µ i ) + ( k − 1 ) σ 2
Ou: W = ∑ ni ( µi − µ )
2
i =1 n i =1
i =1
Ou
A expressão mostra que W = 0, apenas se E( S .Q .Trat .) = W + ( k − 1 ) σ 2
µ1 = µ2 = ... = µk = µ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

8
Os Quadrados Médios
Causa da Soma dos Espec. da Esp. da Soma Consideremos a hipótese de nulidade:
Variação Quadrados Soma (sob H0)
H0: µ1 = µ2 = … = µk
Tratamentos k
A2 G2 W + (k - 1)σ 2 (k - 1)σ 2
∑ i - Isto é, consideremos a hipótese de que as
i ni n
médias das “k” populações sob análise sejam
Resíduo k ni k A2 (n - k )σ 2 (n - k )σ 2 idênticas.
∑ ∑ Y 2ij - ∑ i
i=1 j=1 i=1 ni
Sob esta hipótese, o valor W, definido
Total k ni G 2
(n - 1 )σ 2 (n - 1 )σ 2
∑ ∑ Y 2ij - anteriormente é igual a zero. Então, tem-se:
i j n

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

(S.Q.Res)/σ2 tem uma distribuição Qui-


E(S.Q.Total) = (n – 1)σ2 e ainda que; Quadrado com “n – k” graus de liberdade.
E(S.Q.Trat.) = (k – 1)σ2 Além disso, pode-se demonstrar que sob H0:
(S.Q.Trat.)/σ2 tem uma distribuição Qui-
Pode-se mostrar que se, os µij são variáveis Quadrado com “k – 1” graus de liberdade e
aleatórias independentes com distribuição (S.Q.Total)/σ2 tem uma distribuição Qui-
normal de média “zero” e variância σ2 então: Quadrado com “n – 1” graus de liberdade e as
três distribuições são independentes entre si.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por definição o Quadrado Médio é o Substituindo alguns resultados


quociente entre a Soma dos Quadrados pelo anteriores, tem-se:
respectivo “N
Número de Graus de Liberdade”.
Liberdade E(Q.M.Trat.)= σ2 + W/(k – 1) e
Desta forma, o Quadrado Médio dos
E(Q.M.Res.) = σ2
Tratamentos é:
Q.M.Trat = (S.Q.Trat.)/(k – 1) A tabela, seguinte, resume alguns
Q.M.Res. = (S.Q.Res.)/(n – k) resultados.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

9
A Tabela da ANOVA
Causa da Grau de Soma dos Espec. Do Esp. da
Variação
Variaç Liberdade Quadrados Quadrado Soma (sob
(G.L.) (S. Q.) Médio H0 ) Causa da Grau de Soma dos Quadrado F
Variação Liberdade Quadrados Médio
Tratamentos k-1 k A 2i G2 W + σ2 σ2
∑ -
i ni n k -1 Tratamentos k-1 SQTrat. MQTrat. MQTrat.
MQRes
Resíduos n–k k ni
∑ ∑ Y 2ij - ∑
k A2
i σ2 σ2 Resíduos n–k SQRes. MQRes
i=1 j =1 i=1 n i
Total n–1 SQTotal
Total n–1 k ni 2
G
∑ ∑ Y 2ij -
i j n

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O Teste F A Distribuiç
Distribuição F (de Snedecor)
Pode-se demonstrar que se X1 e X2 são Uma variável aleatória X tem uma
variáveis aleatórias independentes com distribuição “F” ou de Snedecor se sua fdp for do
distribuições Qui-Quadrado de g1 e g2 graus de tipo:
m n m
m + n 2 2 2 -1 m+n
liberdade, respectivamente, então a variável Γ( )m n x ( n + mx ) - 2
2
resultante do quociente: (X1 /g1)/(X2 /g2) f( x )= m n
se x > 0
Γ ( ) Γ( )
apresenta uma distribuição F com g1 e g2 2 2
0 se x ≤0
graus de liberdade. Anota-se F(g1 ; g2).

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Expectância e Variância Diagramas


fdp de
m é o grau de 1,0

m liberdade do 0,8
F(1, 3)
E (X )= numerador e n F(2, 5)
m -2 0,6

do denominador 0,4
F(5, 10)
F(20, 20)
2 (m + n - 2 ) - m 2 0,2

Var(X) =
m(n - 2 )(n - 4 ) 0,0
0 1 2 3 4 5 6 7 8

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

10
Planilha Exemplo

O que é tabelado é a área à direita de cada (a) Dada uma distribuição F com
curva (funç
(função direta), isto é, dado um certo parâmetros g.l. do numerador = 3 e g.l.
valor de “f”, tem-se: P[F(m, n) ≥ f] = α, ou do denominador igual a 5, determinar
dado uma área à direita α pode-se determinar o P(F ≥ 2,5)
valor “f” que satisfaça P[F(m, n) ≥ f] = α
(b) O valor de “f” tal que P(F ≤ f) = 80%.
( funç
função inversa).
inversa).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Item (a) Item (b)

Então, o valor de “f” tal que,


Então P(F ≥ 2,5) = 17,39% P(F ≤ f) = 80% é f = 2,25.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Exercí
Exercício Dados
Com base em um teste preliminar um grupo
Ótimo Bom Regular Fraco
de alunos foi classificado de acordo com o 9,4 7,5 7,0 6,8
desempenho em: Ótimo, Bom, Regular e Fraco. 9,0 6,8 7,3 7,0
Para verificar se este teste era útil como previsor 8,5 7,7 7,6 7,2
da média final dos alunos, amostras de cada 8,0 8,3 7,8 6,5
grupo foram selecionadas. Teste se existe 8,8 8,0 7,4
6,8 6,5
diferença entre as médias dos grupos ao nível de
6,5
1% de significância.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

11
Intervalos de confianç
confiança
Um intervalo de confiança de (1 – α)
Um intervalo de confiança de (1 – α) para a para a diferença nas médias de dois
média do i-ésimo tratamento µi é dado por: tratamentos µi - µj também pode ser
determinado.
MQR es MQR es O estimador de µi - µj é Y i-Y j e a
Y i − tn−k ≤ µ i ≤ Y i + tn−k
ni ni variância desse estimador é:
σ2 σ2 1 1
V ( Y i -Y j )= + = σ2( + )
ni n j ni n j
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Uma Medida de Associaç


Associação
Utilizando MQRes para estimar σ2
então o intervalo de confiança para a A rejeição da hipótese nula na ANOVA
diferença entre as médias de dois tratamentos indica que existe uma diferença significativa
será: entre as médias populacionais. No entanto,
MQR es MQR es MQR es MQR es
Y i -Y j -tn -k
ni
+
nj
≤µi - µ j ≤Y i -Y j + tn -k
ni
+
nj
com grandes amostras, estas diferenças podem
ter pouca significância prática.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Uma medida da força da associação entre


Esta medida é análoga ao coeficiente de
a variável independente e a variável
determinação (r2) na regressão. A expressão
dependente na ANOVA é w2 (ômega dois).
para o cálculo do w2 é dada por:
Este coeficiente indica a proporção da
variância da variável dependente que é SQT k - 1 ) MQR
rat . - ( es .
w2=
explicada pelos níveis da variável SQT otal + MQR es .

independente.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

12
Comparações Múltiplas
Comparaç

Quando rejeitamos a hipótese nula em As comparações múltiplas também são


uma ANOVA, estamos admitindo que as conhecidas como Análise Post Hoc. A vantagem
médias não são todas iguais. do uso deste tipo de comparação ao invés de
A estatística F, no entanto, não fornece vários testes t é que ela mantém a probabilidade
orientações sobre qual é (ou quais são) a média de erro do tipo I a mesma taxa α, mesmo
(tratamento) responsável pela diferença. fazendo várias comparações entre as médias.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por exemplo se tivermos cinco grupos A probabilidade de Erro do Tipo I, neste


(tratamentos) para serem comparados, teremos caso, será dada por:
10 comparações diferentes de médias para αf = 1 – (1 – α)c, onde:
serem feitas. Algumas são: média 1 com média α = probabilidade de erro I em cada
2, média 1 com média 4, etc. comparação;
c = número de comparações.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O método de Tukey
Assim se tivermos cinco grupos e dez O método de Tukey é também denominado
comparações o nível de significância final , de Teste DHS (Diferenças Honestamente
considerando cada teste com 5% de Significativas – Honestly Significant
significância, será de: Difference). Ele foi projetado para manter a
αf = 1 – (1 – α)c = 1 – (1 – 0,05)10 = taxa de Erro do Tipo I a um nível de
= 40,13% significância α.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

13
A distribuiç
distribuição Q
A hipótese nula para cada para sendo
A distribuição Q é denominada de
comparado é:
Distribuição da Amplitude Estudentizada
H0: µi = µj para i ≠ j, (Studentized Range Distribuition).
Isto é, cada par das médias populacionais
Suponha que se tenha n observações
são iguais. A estatística teste Q é definida
independentes y1, ..., yr retiradas de uma
por: Xi– X
Q =
j distribuição normal com média µ e desvio σ.
EMQ/n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Seja w a amplitude desta amostra, isto é, A amplitude estudentizada é definida por:


w = máx(y1, ..., yr) - mín(y1, ..., yr) .
Qr, ν = w/s
Suponha agora que nós temos uma
Esta distribuição já foi tabelada e aparece
estimativa s2 da variância σ2, que é baseada
em vários livros de Estatística. É possível
em “ν” graus de liberdade e independente de
yi. consultar seus valores on-line pela Internet.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Por exemplo seja r = 5 e ν = 10. A distribuição Q foi desenvolvida para


determinar a diferença mínima entre a maior e
O percentil 95% da distribuição será:
a menor média em um conjunto de k médias
Q0,95(10, 5) = 4,65.
que é necessário para rejeitar a hipótese que as
Isso significa que: médias correspondentes na população são
P(w/s ≤ 4,65) = 95% iguais.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

14
No desenvolvimento da distribuição Q o Esta expressão é válida quando a
número de grupos variou, mas o número de ANOVA é balanceada, isto é, todos os grupos
observações em cada um dos grupos k é o
apresentam o mesmo tamanho.
mesmo. Isto e ni = n é o mesmo para os k
Quando os grupos diferem uma versão
grupos. Os valores críticos são dependentes do
número de grupos comparados k e o gl modificada é utilizada. Neste caso o teste é
associado com a estimativa da variância da denominado de método de Tukey-Kramer
população EQM, isto é, Q(n-k, k). (TK).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Exemplo:
Exemplo:
A expressão para o cálculo da estatística Suponha que um método de produção
de TK é dada por: Xi– X
possa ser executado de 4 formas diferentes:
j
Q = A, B, C e D. A tabela da ANOVA é dada
1/ n i + 1 / n j
EMQ( )
2 (próxima lâmina). Como o valor F(3, 29) é
A distribuição amostral é Q e é dada em 2,93 e o Fc = 10,47 é significativo, determinar
função (para 5% e 1%) do grau de liberdade através do método de TK quais diferenças de
(gl) e de k = número de tratamentos. médias são significativas.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Tabela da Anova
Grupo A B C D O valor da estatística Q para o método
21,86 23,00 17,29 16,80
TK é encontrado através de tabelas. Neste
ni 7 9 7 10
Resumo da ANOVA caso, r = 4 e v = 29 o valor para uma
Causa GL SQ MQ F F0,05 significância de 5% é 3,86.
Trat. 3 255,45 85,15 10,47 2,93
Assim µ1 é diferente de µ3 e µ4.
Resíduo 29 235,89 8,13
Total 32 491,34 E µ2 é diferente de µ3 e µ4.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

15
Relação entre a ANOVA e o teste t
Cálculos do valor Q utilizando o método TK

Q 1-2
21,86 - 23,00
= - 1 ,12 23,00 - 17,29 Ao testar a hipótese H0 para amostras
Q 2 -3 = - 5 ,62 *
1/7 + 1/9 1/9 + 1/7
8,13( ) 8,13( ) independentes pode ser utilizado tanto o teste
2 2

21,86 - 17,29 23,00 - 16,80 t quanto a Análise de Variância. Os dois


Q 1-3 = - 4 ,24 * Q 2 -4 = - 6 ,69 *
1/7 + 1/7 1/9 + 1/10
8,13(
2
) 8,13(
2
) procedimentos são equivalentes. A estatística
Q 1- 4
21,86 - 16,80
= -5 ,09 * 17,29 - 16,80 teste t para um grau de liberdade de n –k = n -
1/7 + 1/10 Q 3- 4 = - 0 ,49 *
1/7 + 1/10
8,13(
2
) 8,13(
2
) 2, mantém a seguinte relação: t2 = F e t 2c = Fc

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

ANOVA: medidas repetidas

O delineamento de medidas repetidas A soma total dos valores SQT é


envolve medir um mesmo sujeito duas ou mais particionada em em três componentes: (1) a
vezes na variável dependente. variação entre sujeitos - SQI (2) a variação
Em virtude desta dependência as entre duas ocasiões sucessivas – SQT e (3) a
variações precisam ser ajustadas de modo que variação restante que é denominada de
o valor F adequado seja calculado. residual – SQR.

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Os quadrados médios são calculados da


Este é o efeito de maior interesse
mesma forma que a anterior, isto é, pela divisão
(principal).
da Soma dos Quadrados pelo número de graus
Se quisermos testar a diferença entre os
de liberdade adequado.
sujeitos é só fazer; MQI/MQR.
O erro quadrado médio da variação residual
A tabela para a ANOVA de medidas
(QMR = SQR/glR) é utilizado para testar o
repetidas fica então:
efeito entre as repetições do tratamento.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

16
ANOVA de medidas repetidas Hipóteses da ANOVA MR:
Causa da Grau de Soma dos Quadrado F 1. As amostras são aleatórias;
Variação Liberdade Quadrados Médio
Sujeitos MQ 2. A variável dependente é normalmente
k-1 SQI MQI I/MQR
distribuída;
Ocasiões l–1 SQO MQT MQ
T/MQR 3. As variâncias das repetições são
Resíduo (k-1)(l-1) SQR MQR homogêneas;
4. Os coeficientes de correlação entre os pares
Total n–1 SQT
de repetições são iguais.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Exemplo: Dados
Sujeito Teste 1 Teste 2 Teste3
A 6 12 18
Um teste foi aplicado a um conjunto de B 9 14 16
10 pessoas em três ocasiões diferentes. A C 4 8 15
D 3 10 12
variável dependente é o desempenho nos testes E 1 6 10
nas diferentes ocasiões. O interesse é verificar F 7 15 20
G 6 8 15
se existe diferença entre os testes. H 9 11 18
I 8 12 13
J 6 10 16
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Solução:
k l G2
SQT = ∑ ∑ Y 2
ij - k = número de repetições (tratamentos)
i=1 j=1 n
l = número de pessoas em cada repetição (casos)
k A2 G2
SQ = ∑ i -
T
i= 1 l n n = total de dados ⇒ n = k.l
Ai = soma de cada repetição (tratamentos)
l 2 G2
SQ I = ∑ B i - Bi = soma dos resultados do i-ésimo caso (linhas)
i= 1 k n
G = soma de todos os valores = ΣAi = ΣBi
SQR = SQT - SQI - SQO
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

17
Resumo:
k m G2 Causa da Grau de Soma dos Quadrado F
SQT = ∑ ∑ Y 2ij - = 4054 - 3413 ,33 = 640 ,67
i=1 j =1 n Variação Liberdade Quadrados Médio
l B 2i G 2 Sujeitos 10 – 1 = 9 167,33 18,59 6,68
SS I = ∑ - = 3580 ,6667 - 3413 ,333 = 167 ,33
i= 1 k n Testes 3–1=2 423,27 211,64 76,09
Resíduo (3-1)(10-1) 50,07 2,78
k A 2i G 2
SQ T = ∑ - = 3836 ,60 - 3413 ,33 = 423 ,27 = 2.9 = 18
i=1 l n
Total 30 – 1 = 29 640,67
SQR = SQT - SQI – SQO = 50,07
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Conclusão:

1. Existe diferença entre sujeitos pois a


significância do F = 6,68 encontrado é
p = 0,03%
2. Existe diferença entre as repetições
(tratamentos) pois a significância do
valor F = 76,09 encontrado é p = 0,00%

Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

18