Documentos

ISSN 1517-8498
Novembro/2003
163
Agrobiologia
Técnicas Experimentais aplicadas às Ciências
Agrárias
µ
República Federativa do Brasil
Luiz Inácio Lula da Silva
Presidente
Ministério da Agricultura, Pecuária e Abastecimento
Roberto Rodrigues
Ministro
Empresa Brasileira de Pesquisa Agropecuária - Embrapa
Conselho de Administração
José Amauri Dimárzio
Presidente
Clayton Campanhola
Vice-Presidente
Alexandre Kalil Pires
Dietrich Gerhard Quast
Sérgio Fausto
Urbano Campos Ribeiral
Membros
Diretoria Executiva da Embrapa
Clayton Campanhola
Diretor Presidente
Gustavo Kauark Chianca
Herbert Cavalcante de Lima
Mariza Marilena T. Luz Barbosa
Diretores Executivos
Embrapa Agrobiologia
José Ivo Baldani
Chefe Geral
Eduardo Francia Carneiro Campello
Chefe Adjunto de Pesquisa e Desenvolvimento
Rosângela Straliotto
Chefe Adjunto Administrativo
Documentos 163
ISSN 1517-8498
Novembro/2003
Empresa Brasileira de Pesquisa Agropecuária
Centro Nacional de Pesquisa em Agrobiologia
Ministério da Agricultura, Pecuária e Abastecimento
Técnicas Experimentais aplicadas às Ciências
Agrárias
Janaína Ribeiro Costa
Seropédica – RJ
2003
Exemplares desta publicação podem ser adquiridas na:
Embrapa Agrobiologia
BR465 – km 7
Caixa Postal 74505
23851-970 – Seropédica/RJ, Brasil
Telefone: (0xx21) 2682-1500
Fax: (0xx21) 2682-1230
Home page: www.cnpab.embrapa.br
e-mail: sac@cnpab.embrapa.br
Comitê Local de Publicações: Eduardo F. C. Campello (Presidente)
José Guilherme Marinho Guerra
Maria Cristina Prata Neves
Verônica Massena Reis
Robert Michael Boddey
Maria Elizabeth Fernandes Correia
Dorimar dos Santos Felix (Bibliotecária)
Expediente:
Revisor e/ou ad hoc: Guilherme Montandon Chaer
Normalização Bibliográfica: Dorimar dos Santos Félix
Editoração eletrônica: Marta Maria Gonçalves Bahia
1ª impressão (2003): 50 exemplares
© Embrapa 2003
COSTA, J. R. Técnicas experimentais aplicadas às ciências agrárias.
Seropédica: Embrapa Agrobiologia, 2003. 102 p. (Embrapa Agrobiologia.
Documentos, 163).
ISSN 1517-8498
1. Agricultura. 2. Ciência agrária. I. Embrapa. Centro Nacional de
Pesquisa de Agrobiologia (Seropédica, RJ). II. Título. III. Série.
CDD 630
6. Referências Bibliográficas
BANZATTO, A. D.; KRONKA, S. do N. Experimentação agrícola.
Jaboticabal: FUNEP, 1989. 249 p.
BEARZOTI, E.; OLIVEIRA, M. S. Estatística básica. Lavras: UFLA,
1997. 191 p.
FISHER, R. A. The design of experiments. Edinburgh: Oliver and
Boyd, 1935.
HINKELMANN, K.; KEMPTHORNE, O. Design and analysis of
experiments. New York: J. Wiley, 1994. 631 p.
MEAD, R.; CURNOW, R. N. Statistical methods in agriculture
and experimental biology. New York: Chapman and Hall, 1983.
335 p.
NOGUEIRA, M. C. S. Estatística experimental aplicada à
experimentação agrícola. Piracicaba: USP-ESALQ, 1997. 250 p.
PIMENTEL GOMES, F. Curso de estatística experimental. 13. ed.
Piracicaba: Nobel/USP-ESALQ, 1990. 468 p.
RAMALHO, M. A.; FERREIRA, D. F.; OLIVEIRA, A. C. de. A
experimentação em genética e melhoramento de plantas.
Lavras: UFLA, 2000. 326 p.
STEEL, R. G. D.; TORRIE, J. H.; DICKEY, D. A. Principles and
procedures of statistics. 3. ed. New York: McGraw-Hill, 1997. 666
p.
Autor
Janaína Ribeiro Costa
Pesquisadora da Embrapa Agrobiologia.
E-mail: janaina@cnpab.embrapa.br
102
Obtenção da produção máxima de milho (ton/ha)
Aqui cabe esclarecer que o sinal da estimativa do coeficiente
2
â determina se a variável dependente y (no exemplo, produção),
terá um valor máximo ou mínimo. Se
2
â é negativo, y terá um
máximo; caso contrário, se
2
â for positivo, y terá um mínimo. No
exemplo 5.7.3.1), para obtenção da produção máxima de milho é
necessário antes maximizar a função de regressão polinomial
quadrática, ou seja, derivar esta equação e igualar a zero:
2
i i i
0,00050X 0,0950X 8,8421 yˆ − + ·
i
i
i
0,00100X 0,0950 0
dX
yˆ d
− + ·
0 0,00100X 0,0950 0 0
dX
yˆ d
i
i
i
· − + ⇒ ·
95
0,00100
0,0950
X
i
· · kg/ha (Dose de adubo nitrogenado que levará a
uma produção máxima).
Substituindo X
i
= 95 na equação de
i
yˆ obtém-se a produção
máxima de milho:
2
i
5) 0,00050.(9 ) 0,0950.(95 8,8421 yˆ − + ·
2
i
5) 0,00050.(9 ) 0,0950.(95 8,8421 yˆ − + ·
3546 , 13 yˆ
i
· ton/ha (produção máxima de milho para dose de
adubo nitrogenado de 95 kg/ha).
101
1,0400
3.(10)
31,2
] (2) (1) (0) 1) ( 3.[(-2)
(2).37,8 (1).42,6 (0).37,5 1).32,0 ( 2).27,5 (
) (X P 3
).y (X P
b
ˆ
2 2 2 2 2
i
5
1 i
2
1
i i
5
1 i
1
1
· ·
+ + + − +
+ + + − + −
·


·
·
·
,4523 0
3.(14)
19,0 -
] (2) (-1) (-2) 1) ( 3.[(2)
(2).37,8 (-1).42,6 (-2).37,5 1).32,0 ( (2).27,5
) (X P 3
).y (X P
b
ˆ
2 2 2 2 2
i
5
1 i
2
2
i i
5
1 i
2
2
− · ·
+ + + − +
+ + + − +
·


·
·
·
Lembrando que:
P
1
(X
i
) = 2
30
X
30
60 X
x
i i
i
− ·

·
P
2
(X
i
) = 2 2
30
X
12
1 n
x
2
i
2
2
i

,
`

.
|
− ·


Portanto:
) X ( P b
ˆ
) X ( P b
ˆ
b
ˆ

1 2 2 1 1 1 0 i
+ + ·
]
]
]
]


,
`

.
|
− −
,
`

.
|
− + · 2 2
30
X
4523 , 0 2
30
X
0400 , 1 8267 , 11 yˆ
2
i i
i
Resolvendo a equação acima tem-se:
2
i 2 i 1 o i
2
i i i
X â
ˆ
X â
ˆ
â
ˆ

0,00050X 0,0950X 8,8421 yˆ
− + ·
− + ·
(Equação da Regressão Quadrática)
Os valores observados (y
i
) e estimados

) yˆ (
i
para cada dose de
adubo nitrogenado estão apresentados a seguir:
Xi yi
i

0 27,5 8,8421
30 32,0 11,2421
60 37,5 12,7421
90 42,6 13,3421
120 37,8 13,0421
Apresentação
A preocupação crescente da sociedade com a preservação e a
conservação ambiental tem resultado na busca pelo setor produtivo de
tecnologias para a implantação de sistemas de produção agrícola com
enfoque ecológicos, rentáveis e socialmente justos. O enfoque
agroecológico do empreendimento agrícola se orienta para o uso
responsável dos recursos naturais (solo, água, fauna, flora, energia e
minerais).
Dentro desse cenário, a Embrapa Agrobiologia orienta sua
programação de P&D para o avanço de conhecimento e
desenvolvimento de soluções tecnológicas para uma agricultura
sustentável.
A agricultura sustentável, produtiva e ambientalmente equilibrada
apoia-se em práticas conservacionistas de preparo do solo, rotações de
culturas e consórcios, no uso de adubação verde e de controle
biológico de pragas, bem como no emprego eficiente dos recursos
naturais. Infere-se daí que os processos biológicos que ocorrem no
sistema solo/planta, efetivados por microrganismos e pequenos
invertebrados, constituem a base sobre a qual a agricultura
agroecológica se sustenta.
O documento 163/2003 atende uma demanda daqueles que atuam na
pesquisa agropecuária, principalmente estudantes e profissionais
recém ingressados na área, disponibilizando, de forma objetiva e
prática, conceitos de estatística aplicados à experimentação em
Ciências Agrárias. Na verdade, existem poucas publicações sobre o
referido tema e este documento serve de roteiro para orientar aspectos
básicos do planejamento da experimentação de campo e análise dos
resultados obtidos.
100
S U M Á R I O
1) Noções básicas de experimentação agrícola.......................................................... 7
2) Distribuição de freqüências ..................................................................................... 10
2.1) Definição............................................................................................................. 10
2.2) Freqüência.......................................................................................................... 10
2.3) Natureza da distribuição...................................................................................... 19
3) Estatísticas descritivas ............................................................................................ 20
3.1) Medidas de posição............................................................................................. 20
3.2) Medidas de dispersão.......................................................................................... 23
3.3) Medidas de assimetria e curtose.......................................................................... 27
4) Testes de comparações múltiplas ........................................................................... 29
4.1) Contrastes ortogonais de médias......................................................................... 29
4.2) Teste t de Student ............................................................................................... 33
4.3) Teste de Tukey ................................................................................................... 39
4.4) Teste de Duncan................................................................................................. 41
4.5) Teste de SNK (Student Newman Keuls)............................................................... 43
4.6) Teste de Scott-Knott............................................................................................ 46
5) Análise de variância....................................................................................................... 54
5.1) Princípios básicos da experimentação ................................................................. 54
5.2) Pressuposições básicas da análise de variância .................................................. 55
5.3) Delineamento Inteiramente Casualizado (DIC) ..................................................... 56
5.4) Delineamento em Blocos Casualizados (DBC) ..................................................... 61
5.5) Experimentos fatoriais ......................................................................................... 66
5.6) Experimentos em parcelas subdivididas............................................................... 74
5.7) Análise de regressão........................................................................................... 87
6) Referências Bibliográficas............................................................................................. 102
FV GL SQ QM F Prob>F
(Doses) 4 45,3160 11,3290 13,122 0,0005
Regressão Linear 1 32,4480 32,4480 37,586 0,0000
Regressão Quadrática 1 8,5952 8,5952 9,956 0,0100
Desvio 2 4,2728 2,1364 2,475 0,1340
Erro 10 8,6333 0,8633
Total 14
CV (%) = 7,86
Média geral: 11,83 Número de observações: 15
Observa-se no quadro anterior que tanto a regressão linear quanto a
quadrática foram significativas ao nível de significância estabelecido
de 5% (Prob<0,05). O coeficiente de determinação (R
2
) para a
regressão linear e quadrática foram respectivamente:
71,6% .100
45,3160
32,4480
(Linear) R
2
· · ;
19,0% .100
45,3160
8,5952
a) (Quadrátic R
2
· · .
Apesar do R
2
da regressão quadrática ter sido baixo (19%), deve-se
observar o valor de Prob>F do Desvio. Se este valor for maior que
0,05, indicando que o desvio foi não significativo, deve-se, portanto,
considerar a equação de regressão significativa de maior grau, no
caso, a quadrática:
) X ( P b
ˆ
) X ( P b
ˆ
b
ˆ
X
ˆ
X
ˆ ˆ

1 2 2 1 1 1 0
2
2 1 0 i
+ + · β + β + β ·
em que:
8267 , 11
15
4 , 177
5 x 3
y
y b
ˆ
5
1 i
i
o
· ·

· ·
·
99
Para cada nível de X tem-se então:
Níveis Dose de adubo Totais yi (das 3 repetições) P1(Xi) P2(Xi)
1 0 27,5 -2 +2
2 30 32,0 -1 -1
3 60 37,5 0 -2
4 90 42,6 +1 -1
5 120 37,8 +2 +2
Total 177,4
As somas de quadrados (SQ’s) da regressão linear e quadrática são
dadas por:
SQRegressão 1(Linear) =
) (X P 3
).y (X P
i
5
1 i
2
1
2
i i
5
1 i
1

,
`

.
|

·
·
=
32,4480
3.(10)
973,44
] (2) (1) (0) 1) ( 3.[(-2)
(2).37,8] (1).42,6 (0).37,5 1).32,0 ( 2).27,5 [(
2 2 2 2 2
2
· ·
+ + + − +
+ + + − + −
SQRegressão 2 (Quadrática) =
) (X P 3
).y (X P
i
5
1 i
2
2
2
i i
5
1 i
2

,
`

.
|

·
·
=
8,5952
3.(14)
361
] (2) (-1) (-2) 1) ( 3.[(2)
(2).37,8] (-1).42,6 (-2).37,5 1).32,0 ( [(2).27,5
2 2 2 2 2
2
· ·
+ + + − +
+ + + − +
SQDesvio = SQ Doses – SQRegressão 1 – SQRegressão 2
= 45,3160 – 32.4480 – 8,5952 = 4,2728
O quadro de análise de variância com o desdobramento dos graus
de liberdade da fonte de variação ‘doses’ em graus de liberdade
devido a regressão polinomial está apresentado a seguir.
Técnicas Experimentais aplicadas às
Ciências Agrárias
Janaína Ribeiro Costa
1. Noções básicas de experimentação agrícola
A Estatística Experimental é a ciência que tem como objetivo
estudar experimentos (ensaios), englobando etapas como o
planejamento, execução, coleta e análise dos dados experimentais
e interpretação dos resultados obtidos. Ela foi proposta inicialmente
na área de ciências biológicas por Ronald A. Fisher em 1919. Fisher
propôs o uso da análise de variância (ANAVA) como ferramenta
para análise e interpretação de dados. A ANAVA permite a
decomposição do grau de liberdade e da soma de quadrados total
em somas de quadrados correspondentes às fontes de variação
previamente definidas no planejamento do experimento.
A fase de planejamento do experimento merece considerável
atenção por parte do pesquisador pois dela dependerá o sucesso da
análise e interpretação dos resultados sendo, portanto,
recomendável uma consulta a um estatístico antes da instalação do
experimento.
O planejamento envolve etapas como:
a) Formulação de hipóteses
A hipótese estatística formulada é denominada hipótese de nulidade
e é simbolizada por H
o
. Suponha que se deseja estudar qual estirpe
de bactéria diazotrófica endofítica (considerando, por exemplo, três
estirpes diferentes) proporcionará maior peso da parte área de
cana-de-açúcar. No exemplo, H
o
seria: não existem diferenças
significativas entre os efeitos das estirpes (ou seja, qualquer
diferença observada é devida a fatores não controlados). H
o
poderá
ser aceita ou rejeitada; caso seja rejeitada, aceitaremos uma
07 98
hipótese denominada alternativa, simbolizada por H
1
que no
exemplo seria: os efeitos das estirpes diferem significativamente
entre si (ou as estirpes se comportam de modo diferente quanto ao
peso da parte aérea).
b) Escolha dos fatores e seus respectivos níveis
Fatores (ou tratamentos) são aqueles que o pesquisador tem
interesse em estudar o seu efeito sobre as variáveis respostas. As
subdivisões de um fator são os níveis dos mesmos. Por exemplo, se
o interesse for planejar um experimento para se estudar o efeito de
6 tipos diferentes de rotações de cultura, o fator em estudo é
rotação e os níveis deste fator são os 6 tipos de rotação.
Em alguns casos, como por exemplo nos experimentos fatoriais ou
em parcelas subdivididas, dois ou mais fatores são estudados.
Suponha que se deseja estudar o efeito de 2 variedades de cana de
açúcar e 3 doses de nitrogênio; neste caso se trata de um
experimento em fatorial 2x3, em que se tem dois fatores (variedade
e dose de nitrogênio); 2 níveis do fator variedade e 3 níveis do fator
dose de nitrogênio.
Um fator pode ser classificado em:
b.1) Qualitativo: quando os níveis do fator são categorias, atributos.
Por exemplo: nome de variedades de cana de açúcar (SP701143 e
SP813250); métodos de extração de DNA (Cullen, Smalla, Sebach);
origem de solos (MG, RJ, BA, SP); etc.
b.2) Quantitativo: quando os níveis do fator são mensurações de
valores reais. Normalmente os níveis são valores numéricos
acompanhados de uma unidade de medida. Por exemplo: dose de
nitrogênio (0, 25 e 50 Kg/ha); concentrações de antibiótico (25, 50,
100, 200 µg/ml), etc.
c) Escolha da parcela (unidade experimental)
Parcela é a unidade experimental que receberá o tratamento. A
parcela pode assumir diferentes formas e tamanhos. Por exemplo,
uma parcela poderá ser constituída por uma ou várias plantas; um
vaso contendo uma ou mais plantas; uma placa de Petri com
tem-se que P
1
(X
i
) = x
i
; em que
30
60 X
q
X X
x
i i
i

·

·
com i =1, 2, ...,
5. Portanto,
2
30
60 0
0) (X P
1 1
− ·

· ·
1
30
60 30
30) (X P
2 1
− ·

· ·
0
30
60 60
60) (X P
3 1
·

· ·
1
30
60 90
90) (X P
4 1
+ ·

· ·
2
30
60 120
0) 12 (X P
5 1
+ ·

· ·
e tem-se que P
2
(X
i
) = 2 )] (X [P
12
1 5
_ )] (X [P
12
1 n
x
2
i 1
2
2
i 1
2
2
i
− ·

·


com i =1, 2, ..., 5. Portanto,
2 2 ) 2 ( 0) (X P
2
1 2
+ · − − · ·
1 2 ) 1 ( ) 30 (X P
2
2 2
− · − − · ·
2 2 ) 0 ( ) 60 (X P
2
3 2
− · − · ·
1 2 ) 1 ( ) 90 (X P
2
4 2
− · − + · ·
2 2 ) 2 ( ) 120 (X P
2
5 2
+ · − + · · .
97 08
A análise de variância para os dados do exemplo 5.7.3.1) é:
FV GL SQ QM F Prob>F
Doses 4 45,3160 11,3290 13,122 0,0005
Erro 10 8,6333 0,8633
Total 14
Rejeita-se H
o
, concluindo-se pela existência do efeito de doses
crescentes de adubo nitrogenado sobre a produção do milho (Prob
< 0,05).
Considerando o modelo de regressão polinomial de 2
O
grau a
seguir, foi realizada a análise de regressão:
i
2
i 2 i 1 o i
å X â X â â y + + + ·
reescrevendo este modelo pela expressão alternativa:
y
i
= b
o
+ b
1
P
1
(X
i
) + b
2
P
2
(X
i
) + ε
i
; i =1, 2, ...,5.
As hipóteses testadas no modelo de regressão adotado são:
i) H
o
: b
1
= 0 vs H
1
: b
1
≠ 0.
ii) H
o
: b
2
= 0 vs H
1
: b
2
≠ 0.
Para obtenção das somas de quadrados das regressões linear e
quadrática é necessário antes calcular os coeficientes dos
polinômios P
1
(X
i
) e P
2
(X
i
).
Seja:
60 ) 120 90 60 30 0 (
5
1
X
n
1
X
n
1 i
i
· + + + + · · ∑
·
;
q = 30 (correspondendo a 30-0 ou 60-30 ou 90-60 ou 120-90)
determinado meio de cultura; uma área com várias plantas; um
animal; etc.
d) Escolha do delineamento experimental
Delineamento experimental é o plano de distribuição dos
tratamentos na área experimental. Como exemplo de delineamentos
tem-se o delineamento inteiramente casualizado (DIC), o
delineamento em blocos casualizados (DBC), o delineamento em
quadrados latinos (DQL), os delineamentos em blocos incompletos
(por exemplo, os látices, blocos aumentados, etc.).
e) Escolha das variáveis a serem analisadas
Variáveis respostas ou variáveis dependentes ou simplesmente
variáveis são características obtidas em cada parcela. Os dados
(observações) são realizações de uma variável e serão analisados
para verificar se há diferença entre os níveis dos fatores
(tratamentos). Assim, exemplos de variáveis são: produção de grãos
de feijão; altura de plantas de milho; pH, teor de Ca, Mg e P em
amostras de solo; número de plantas de cana-de-açúcar atacadas
por cercosporiose; etc.
Uma variável também pode ser classificada, semelhantemente aos
fatores (tratamentos), em:
e.1) Qualitativa
e.1.1) Nominal: quando são categorias, atributos, sem uma
ordenação natural. Por exemplo: cor dos grãos do feijoeiro (marrom,
preto, branco); textura do solo (arenoso, argiloso, silte); etc.
e.1.2) Ordinal: quando são atributos com uma ordenação natural.
Por exemplo: suscetibilidade do cafeeiro à ferrugem (alta, média,
baixa); nota para o ataque de cercosporiose em cana-de-açúcar
(escala de 1, para ausência da doença, até 9, para o máximo de
doença); etc.
e.2) Quantitativa
e.2.1) Discretas: quando são contagens de números inteiros
positivos com uma ordenação natural. Por exemplo: número de
09 96
chuvas em 2002 superior a 80 mm/h (ex. 20 chuvas); número de
plantas atacadas com a broca do fruto do cafeeiro (ex. 200 plantas);
número de minhocas encontradas em determinada amostra de solo
(ex. 50 minhocas).
e.2.2) Contínuas: quando são mensurações de valores reais;
normalmente existe uma unidade de medida acompanhando a
variável. Por exemplo: produtividade (100,0 kg/ha); renda
(R$2050,73/mês); altura (2,5 m); diâmetro (8,18 cm); peso (98,5 g);
pH (5,5); teor de P, Ca, Mg, K, matéria orgânica, etc.
f) Análise dos dados obtidos com o experimento.
2) Distribuição de freqüências
2.1) Definição
Consiste em uma função que associa os valores que uma variável
assume com suas freqüências de ocorrência, podendo ser elas
absolutas, relativas ou porcentuais.
2.2) Freqüência
É uma medida que quantifica a ocorrência dos valores de uma
variável.
2.2.1) Freqüência absoluta (fa) é o número de observações
ocorridos em cada classe da variável estudada.
2.2.2) Freqüência relativa (fr) é dada pela divisão da fa pelo
número total (n) de dados ou observações:
n
fa
fr ·
.
2.2.3) Freqüência porcentual (fp) é dada pela multiplicação de fr
por 100:
fr.100 (%) fp · .
) (X P r
).y (X P
k o SQRegressã
i
n
1 i
2
k
2
i i
n
1 i
k

,
`

.
|

·
·
·
, associada a 1 grau de liberdade.
O coeficiente de determinação (R
2
) em experimentos com repetição
é dado por:
100 .
to SQTratamen
k gressão Re SQ
(%) R
2
·
, 0 ≤ R
2
≤ 100.
5.7.3.1) Exemplo de análise de regressão em dados com
repetição: modelos de regressão polinomial
Um experimento foi instalado conforme o delineamento inteiramente
casualizado, com três repetições para testar o efeito de 5 doses de
adubo nitrogenado (0, 30, 60, 90 e 120 kg/ha). Os resultados
obtidos em ton/ha de milho são:
Rep\Doses 0 30 60 90 120
1 8,6 10,5 12,5 12,6 13,7
2 9,5 10,0 12,8 15,1 12,8
3 9,4 11,5 12,2 14,9 11,3
Total 27,5 32,0 37,5 42,6 37,8
O modelo do exemplo anterior adotado foi:
ij i ij
d y ε + + µ · ; i =1, 2,..., 5 e j = 1, 2, 3.
em que y
ij
é o valor observado referente a i-ésima dose de adubo
nitrogenado na j-ésima repetição; d
i
é a i-ésima dose de adubo
nitrogenado e ε
ij
é o erro experimental associado a y
ij
com ε
i
∩ N (0,
σ
2
) e independentes.
As hipóteses testadas na análise de variância são:
H
o
: d
1
= d
2
= ... = dn = 0 ; i=1, 2, ..., n
H
1
: pelo menos um d
i
difere de 0.
10 95
P
2
(X
i
) =
12
1 n
x
2
2
i


;
P
3
(X
i
) =
i
2
3
i
x .
20
7 n 3
x

− ;
P
4
(X
i
) =
560
) 9 n )( 1 n ( 3
x .
14
13 n 3
x
2 2
2
i
2
4
i
− −
+

− ;
P
5
(X
i
) =
i
2 4
3
i
2
5
i
x
1008
407 230n 15n
.x
18
7) 5(n
x
+ −
+

− ;
em que,
X
i
são os níveis da variável independente;
∑ ·
·
n
1 i
i
X
n
1
X é a média dos níveis de X;
q é amplitude entre dois níveis consecutivos de X;
n é o número de níveis da variável independente (X).
O estimador de quadrados mínimos de b
k
, é dado por:
) X ( P r
y ). X ( P
b
ˆ
i
n
1 i
2
k
i i
n
1 i
k
k


·
·
·
,
em que,
P
k
(X
i
) são os coeficientes do polinômio ortogonal de grau k
associado ao nível do fator;
y
i
é o total do nível i da variável dependente (y);
r é o número de repetições.
A hipótese de nulidade é H
o
: b
k
= 0 e a hipótese alternativa é H
1
: b
k
≠ 0. A soma de quadrados da regressão de grau k, na análise de
variância, é dada por:
Exemplo 1. No quadro a seguir está disposta a atividade agrícola
predominante em cada uma das 20 propriedades rurais do
município Vida Alegre.
Milho Soja Olericultura Leite
Soja Soja Milho Milho
Leite Cana-de-açúcar Trigo Milho
Milho Leite Soja Trigo
Milho Laranja Milho Olericultura
A variável em estudo, atividade agrícola, é classificada como
qualitativa nominal. Uma maneira mais informativa de descrever o
conjunto de dados do Exemplo 1 é através da distribuição de
freqüências das categorias desta variável, podendo ser feita por
meio de representação tabular ou gráfica.
a) Representação tabular:
Tabela 1. Distribuição de freqüência das atividades agrícolas de 20
propriedades rurais do município de Vida Alegre
Atividade predominante fa fr fp (%)
Milho 7 0,3500 35,0
Soja 4 0,2000 20,0
Leite 3 0,1500 15,0
Trigo 2 0,1000 10,0
Olericultura 2 0,1000 10,0
Cana-de-açúcar 1 0,0500 5,0
Laranja 1 0,0500 5,0
Total 20 1,0000 100,0
Fonte: Apostila de Estatística Básica (Bearzoti & Oliveira, 1997).
11
94
b) Representação gráfica:
Gráfico é uma figura para ilustração de fenômenos ou tendências
onde existem escalas definidas.
Para a representação gráfica de variáveis qualitativas, como é o
caso do Exemplo 1, os gráficos mais utilizados são:
• Gráfico de linhas: possui dois eixos, com fa ou fr ou fp
disposta no eixo vertical e as classes (categorias) da variável
dispostas no eixo horizontal.
0
0.1
0.2
0.3
0.4
M
i
l
h
o
S
o
j
a
L
e
i
t
e
T
r
i
g
o
O
l
e
r
i
c
.
.
.
C
a
n
a
.
.
.
L
a
r
a
n
j
a
Atividade
fr
Figura 1. Gráfico de linhas representando a distribuição de freqüência relativa referente à
atividade agrícola predominante em propriedades do município de Vida Alegre.
Análise de regressão em dados com repetição: modelos de
regressão polinomial
O modelo de regressão polinomial de grau p, para uma única
variável independente é representado por
i
p
i p
3
i 3
2
i 2 i 1 o i
å X â ... X â X â X â â y + + + + + + · (i)
com i = 1, 2, ..., n ; ε
i
∩ N(0, σ
2
) independentes. β
0
, β
1
, ..., β
n
são
parâmetros da regressão a serem estimados.
Considerando n pares de dados (y
1
, X
1
), (y
2
, X
2
), ..., (y
n
, X
n
) em que
n>p e que os níveis referentes a variável X são todos eqüidistantes,
ou seja, X
1
=X
1
; X
2
=X
1
+q, X
3
=X
2
+q , ..., X
n
=X
n-1
+q, o modelo em (i)
pode ser reescrito como:
Y
i
= b
o
+ b
1
P
1
(X
i
) + b
2
P
2
(X
i
) + ...+ b
p
P
p
(X
i
) + ε
i
com i = 1, 2, ..., n ; ε
i
∩ N(0, σ
2
) independentes. b
0
, b
1
, ..., b
n
são
parâmetros da regressão a serem estimados e P
k
(X
i
) sendo um
polinômio ortogonal de ordem k = 1, 2, ..., p que deve atender às
seguintes restrições:
i) P
0
(X
i
)=1;
ii) 0 ) (X P
i
n
1 i
k
· ∑
·
;
iii) 0 ) (X ).P (X P
i K' i
n
1 i
k
· ∑
·
para k ≠
'
k ;
iv) 0 ) X ( P
i
n
1 i
2
k
≠ ∑
·
.
Os valores de P
k
(X
i
) (k =1, 2, ...,p), quando os níveis da variável X
são eqüidistantes, podem ser obtidos através das seguintes
expressões:
P
1
(X
i
) = x
i
; em que
q
X X
x
i
i

· ;
12 93
i 1 o i
X b
ˆ
b
ˆ
yˆ + ·
em que
( )
10
325
55 ... 15 10
10
) 577 , 12 ).( 325 (
) 139 , 1 .( 55 ... ) 426 , 1 .( 15 ) 388 , 1 .( 10
b
ˆ
2
2 2 2
1
− + + +
− + + +
·
-0,0073
2062,5000
15,0875 -
2062,5000
408,7525 393,6650
b
ˆ
1
· ·

·
(estimativa de b
1
),
1,4950 0,2373 1,2577
10
325
0,0073). (
10
12,577
b
ˆ
o
· + ·
,
`

.
|
− − ·
(estimativa de b
o
).
O modelo de regressão ajustado (estimado) é:
i i
X 0073 , 0 4950 , 1 yˆ − · .
O R
2
foi de:
% 90 100 .
1255 , 0
1104 , 0
R
2
· ·
indicando que 90% da variação na densidade do solo é explicada
pelo modelo de regressão utilizado.
No quadro a seguir para cada valor de X
i
tem-se o valor observado,
o estimado e o desvio correspondente.
Xi yi (valores observados)
i

(valores estimados) yi -
i

10 1,388 1,422 -0,034
15 1,426 1,386 0,040
20 1,393 1,349 0,044
25 1,341 1,313 0,029
30 1,26 1,276 -0,016
35 1,16 1,240 -0,080
40 1,177 1,203 -0,026
45 1,153 1,167 -0,014
50 1,14 1,130 0,010
55 1,139 1,094 0,045
Total 12,577 12,577 0
Média 1,2577 1,2577 0
• Gráfico de barras ou colunas: semelhantes aos gráficos de
linhas, com a diferença que são usadas barras (colunas) ao
invés de linhas.
0
0.1
0.2
0.3
0.4
M
ilh
o
S
o
j
a
L
e
it
e
T
r
ig
o
O
le
r
ic
.
.
.
C
a
n
a
.
.
.
L
a
r
a
n
ja
Atividade
fr
Figura 2. Gráfico de barras verticais representando a distribuição de freqüência relativa
referente àatividade agrícola predominante em propriedades do município de Vida Alegre.
• Setograma (gráfico circular ou gráfico de setores): gráfico
circular no qual os setores correspondem as categorias com
áreas proporcionais as freqüências de cada classe. Para
construção do setograma é necessário obter o ângulo
referente ao setor de cada categoria, por meio de uma regra
de três. Por exemplo, para a atividade milho do Exemplo 1,
tem-se a regra de três para as freqüências porcentuais dada
por:
100%
______
360
o
35%
______ X
x = 126
o
.
E assim por diante são calculados os outros ângulos
correspondentes aos setores das outras categorias que serão
traçados no gráfico.
13 92
Laranja
Cana
Olericultura
Trigo
Leite
Soja
Milho
Figura 3. Setograma representando a distribuição de freqüência relativa referente à
atividade agrícola predominante em propriedades do município de Vida Alegre.
Exemplo 2. O quadro seguinte apresenta o número de lagartas
rosca encontradas em cada um dos 16 canteiros de um viveiro de
mudas de eucalipto.
1 1 3 5
4 2 4 4
3 1 2 1
5 0 0 4
A variável número de lagartas rosca é classificada como quantitativa
discreta. A distribuição de freqüências para variáveis quantitativas
discretas são semelhantes à das variáveis qualitativas, como no
caso do Exemplo 1, com os valores inteiros que a variável assume
podendo ser considerados como “categorias” ou “classes naturais”.
a) Representação tabular:
Tabela 2. Distribuição de freqüência do número de lagartas rosca
em canteiros de um viveiro de eucalipto
N
o
de lagartas rosca fa fr fp (%)
0 2 0,1250 12,5
1 4 0,2500 25,0
2 2 0,1250 12,5
3 2 0,1250 12,5
4 4 0,2500 25,0
5 2 0,1250 12,5
Total 16 1,0000 100,0
Fonte: Notas de aula.
H
1
: b
1
≠ 0.
As somas de quadrados para o exemplo anterior foram:
SQRegressão =
( )
10
325
55 ... 15 10
10
) 577 , 12 ).( 325 (
) 139 , 1 .( 55 ... ) 426 , 1 .( 15 ) 388 , 1 .( 10
2
2 2 2
2
− + + +
]
]
]

− + + +
SQRegressão =
[ ]
0,1104
2062,5000
-15,0875) (
2062,5000
408,7525 6650 , 393
2 2
· ·

SQTotal =
10
) 577 , 12 (
139 , 1 ... 426 , 1 388 , 1
2
2 2 2
− + + +
SQTotal = 15,9436 – 15,8181 = 0,1255
SQDesvios = 0,1255 – 0,1104 = 0,0151
O Quadro de análise de variância resultante é:
FV GL SQ QM F Prob>F
Regressão 1 0,1104 0,1104 58,105 0,0001
Desvios 8 0,0151 0,0019
Total 9 0,1255
Da Tabela de F tem-se que F
(0,05; 1; 8)
é 5,32 e como 58,105 > 5,32,
rejeita-se H
o
ao nível de 5% de significância. Atualmente, os
programas computacionais apresentam uma coluna a mais no
quadro de análise de variância correspondente a Prob>F, não
havendo a necessidade de procurar o valor de F em Tabela.
Quando Prob>F for menor que 0,05, significa que o teste F foi
significativo, ou seja, o pesquisador poderá rejeitar H
o
e aceitar H
1
.
No exemplo, conclui-se então que as densidades (g/cm
3
) em
diferentes profundidades X (cm) podem ser explicadas por meio do
seguinte modelo de regressão linear:
91
14
SQDesvios = gessão Re SQ SQTotal ) yˆ y (
2
i
n
1 i
i
− · − ∑
·
, associada a (n-
2) graus de liberdade.
A decisão de rejeitar H
o
ao nível α de significância se dará se
QMDesvios
gressão Re QM
= F ≥ F
(α, 1, n-2)
em que F
(α, 1, n-2)
é o valor tabelado obtido através da Tabela de F-
Snedecor para o nível α de significância, 1 e (n-2) graus de
liberdade.
O coeficiente de determinação (R
2
) é a estatística dada por:
100 .
SQTotal
gressão Re SQ
(%) R
2
· , 0 ≤ R
2
≤ 100.
O R
2
procura quantificar a proporção da variação da variável y que é
explicada pelo modelo de regressão. Quanto mais próximo de 100
estiver R
2
, melhor a qualidade de ajuste do modelo de regressão
aos dados.
5.7.2.1) Exemplo de análise de regressão em dados sem
repetição
Um estudo foi realizado sobre zonas de compactação em perfis de
um solo, obtendo-se os seguintes dados de densidade (g/cm
3
) em
diferentes profundidades X (cm)
Total
X (cm) 10 15 20 25 30 35 40 45 50 55 325
y (g/cm
3
) 1,388 1,426 1,393 1,341 1,260 1,160 1,177 1,153 1,140 1,139 12,577
O modelo adotado foi:
y
i
= b
0
+ b
1
X
i
+ ε
i
, i=1, 2, ..., 10 e ε
i
∩ N (0, σ
2
).
E as hipóteses testadas foram:
H
o
: b
1
= 0
A representação gráfica também é semelhante àdo Exemplo 1, com
os valores inteiros no eixo horizontal, representando as classes da
variável (número de lagartas).
Exemplo 3. Considere os valores a seguir referentes ao diâmetro à
altura do peito (DAP), em cm, de 54 árvores de um talhão
10,7 17,2 21,2 22,9 24,2 25,9 28,8 32,8 36,1
12,4 17,6 21,6 23,3 24,4 26,1 29,5 33,6 37,5
13,8 18,8 21,8 23,5 24,4 26,1 30,2 34,2 38,1
14,6 19,2 22,2 23,8 24,6 26,8 30,9 34,5 39,0
16,1 20,5 22,3 23,9 24,8 27,5 31,3 34,7 39,7
16,8 20,9 22,8 24,2 25,5 28,1 32,0 35,5 41,2
A variável DAP é classificada como quantitativa contínua. A
distribuição de freqüências para variáveis quantitativas contínuas
são diferentes daquelas discretas e das variáveis qualitativas.
Primeiramente, para a realização de uma distribuição de freqüências
de uma variável contínua, os dados devem ser ordenados em ordem
crescente para uma melhor manipulação dos mesmos.
Depois segue-se a um algoritmo para a obtenção da distribuição de
freqüências. Neste algoritmo, alguns passos são diferenciados se os
dados são referentes a uma população ou a uma amostra.
i) Para população: escolher um número de classes (k) entre 5 e 20.
Para amostra:
Tamanho da amostra (n) Número de classes (k)
Até 100
n
> 100 5 log10 n
ii) Calcular a amplitude total (A) dos dados:
A = MVO – mvo
15 90
em que MVO é o maior valor observado e mvo é o menor valor
observado;
iii) Calcular a amplitude de classe (c):
k
x A
c
∆ +
· (população) ou
1 k
x A
c

∆ +
· (amostra)
em que ∆x é a precisão de medida (menor valor detectável pelo
instrumento ou método de medição). O valor de c deverá ser
arredondado para o mesmo número de casas decimais dos dados;
iv) Calcular o limite inferior da 1
a
classe (LI
1
):
2
x
mvo LI
1

− · (população) ou
2
c
mvo LI
1
− · (amostra);
v) Calcular o limite superior da 1
a
classe (LS
1
):
LS
1
= LI
1
+ c
LS
1
além de limite superior da 1
a
classe, também é o limite inferior
da 2
a
classe:
LS
1
= LI
2
LS
2
= LI
2
+ c
e assim sucessivamente até terminar as k classes;
vi) Calcular as freqüências absolutas (fa) e, opcionalmente, as
relativas (fr) e porcentuais (fp) de cada classe:
Aplicando-se então o algoritmo nos dados do Exemplo 3,
considerando que eles são referentes a uma população tem-se:
i) Escolhe-se, por exemplo, k = 10 classes;
ii) A = 41,2 – 10,7 = 30,5;
iii) ) do arredondan ( 1 , 3 06 , 3
10
1 , 0 5 , 30
c · ·
+
· ;

,
`

.
|

,
`

.
|
∑ ∑
− ∑
·
·
·
· ·
·
n
1 i
2
n
1 i
i
2
i
n
1 i
n
1 i
i i
n
1 i
i i
1
n
X
X
n
y X
y X
b
.
A partir destes estimadores tem-se o modelo de regressão linear
simples estimado (ajustado):
i 1 o i
X b
ˆ
b
ˆ
yˆ + · .
5.7.2) Análise de regressão em dados sem repetição
Seja a hipótese de nulidade em uma análise de regressão H
o
: b
1
= 0
e a hipótese alternativa H
1
: b
1
≠ 0, o esquema da análise de
variância da regressão para se testar estas hipóteses é:
FV GL SQ QM F
Regressão 1 SQRegressão SQRegressão/1 QMRegressão/QMDesvios
Desvios n-2 SQDesvios SQDesvios /(n-2)
Total n-1 SQTotal
Em que as somas de quadrados (SQ’s) são dadas pelas seguintes
expressões:
SQTotal =

,
`

.
|

− · − ∑
·
·
·
n
1 i
2
n
1 i
i
2
i
2
n
1 i
i
n
y
y ) y y (
, associada a (n-1) graus de
liberdade.
SQRegressão =
· − ∑
·
2
n
1 i
i
) y yˆ (

,
`

.
|


]
]
]
]
]
]

,
`

.
|
∑ ∑
− ∑
·
·
· ·
·
n
1 i
2
n
1 i
i
2
i
2
n
1 i
n
1 i
i i
n
1 i
i i
n
X
X
n
y X
y X
, associada a 1 grau de
liberdade.
89 16
A princípio, qualquer relação funcional entre um conjunto de
variáveis regressoras e um conjunto de variáveis dependentes,
representada por y = f(X
1
, X
2
, ..., X
k
), pode ser chamada de modelo
de regressão, sendo tal modelo fixo para determinado conjunto de
dados.
Normalmente esta relação funcional é desconhecida e uma função
alternativa pode ser usada para aproximar f como, por exemplo, os
modelos polinomiais que estão incluídos entre os tipos de modelos
de regressão linear simples e são amplamente utilizados (Nogueira,
1997).
Um modelo de regressão linear é dito simples quando envolve
somente uma variável regressora X. Os exemplos anteriores a) e c)
se enquadram em casos de regressão linear simples. Já o exemplo
b) é típico de regressão linear múltipla pois envolve mais de uma
variável regressora (no caso, duas). O exemplo d) é um caso de
regresão linear múltipla multivariada (múltipla pois apresenta 3
variáveis regressoras e multivariada pelas duas variáveis respostas,
y
1
e y
2
, utilizadas).
Sejam n pares de dados de duas variáveis (X
i
, y
i
) com i = 1, 2, ..., n.
Admitindo que a relação entre y
i
e X
i
é uma reta, tem-se o modelo
de regressão linear simples:
y
i
= b
0
+ b
1
X
i
+ ε
i
em que ε
i
é o erro experimental associado a observação y
i
; b
0
e b
1
são parâmetros correspondentes ao coeficiente linear ou termo
constante (intercepto da reta) e coeficiente angular ou de regressão,
respectivamente. Os estimadores de quadrados mínimos de b
0
e b
1
são dados por:
X b y
n
X
b
n
y
b
1
n
1 i
i
1
n
1 i
i
o
− ·

,
`

.
|



·
· ·
Observação: Note que, como os dados têm apenas uma casa
decimal após a vírgula, o ∆x é 0,1, se houvesse 2 casas após a
vírgula, ∆x seria 0,01 e assim por diante.
iv) 65 , 10
2
1 , 0
7 , 10 LI
1
· − ·
v) LS
1
= 10,65 + 3,1 = 13,75
LI
2
= LS1 =13,75
LS
2
= 13,75 + 3,1 = 16,85 e assim por diante.
a) Representação tabular:
Tabela 3. Distribuição de freqüência do diâmetro à altura do peito
(DAP), em cm, de 54 árvores de um talhão
Classes de DAP Ponto médio fa fr dfr fp (%)
[10,65; 13,75) 12,2 2 0,0370 0,0119 3,70
[13,75; 16,85) 15,3 4 0,0741 0,0239 7,41
[16,85;19,95) 18,4 4 0,0741 0,0239 7,41
[19,95; 23,05) 21,5 9 0,1667 0,0538 16,67
[23,05; 26,15) 24,6 14 0,2592 0,0836 25,92
[26,15; 29,25) 27,7 4 0,0741 0,0239 7,41
[29,25; 32,35) 30,8 5 0,0926 0,0299 9,26
[32,35; 35,45) 33,9 5 0,0926 0,0299 9,26
[35,45; 38,55) 37,0 4 0,0741 0,0239 7,41
[38,55; 41,65) 40,1 3 0,0555 0,0179 5,55
Total
_
54 1,0000
_
100,00
Fonte: Notas de aula.
b) Representação gráfica:
Normalmente em gráficos de distribuição de freqüências de
variáveis quantitativas contínuas usa-se no eixo vertical do gráfico a
densidade de freqüência (df) de cada classe dada por:
17 88
densidade de freqüência (df) =
classe da amplitude
classe da freqüência
Assim, pode-se usar a densidade de freqüência absoluta (dfa) ou a
relativa (dfr) ou, ainda, a porcentual (dfp) obtidas, respectivamente,
por:
c
fa
dfa · ;
c
fr
dfr · ;
c
fp
dfp · .
Na Tabela 3 foram apresentadas as dfr´s (com c=3,1). O uso de df
se torna importante nas situações onde as amplitudes de classes (c)
são desiguais e, também, permite o cálculo de freqüências a partir
de áreas do gráfico. Mas se c é igual para todas as classes pode-se
utilizar, no eixo vertical do gráfico, tanto freqüências como
densidades de freqüência.
Visto o conceito de df, os dois gráficos mais usais para distribuição
de freqüências de variáveis contínuas são o histograma e o polígono
de freqüência.
b.1) Histograma: é semelhante ao gráfico de barras, com barras
dispostas lado a lado, e larguras iguais às amplitudes de classes.
0
0.02
0.04
0.06
0.08
0.1
1
0
.
6
5
1
3
.
7
5
1
6
.
8
5
1
9
.
9
5
2
3
.
0
5
2
6
.
1
5
2
9
.
2
5
3
2
.
3
5
3
5
.
4
5
3
8
.
5
5
4
1
.
6
5
DAP
dfr
Figura 4. Histograma de distribuição de freqüência relativa referente ao diâmetro à
altura do peito (DAP), em cm, de 54 árvores de um talhão.
Os resultados do teste de Tukey comparando as médias das
Variedades para 1 e 2 linhas de irrigação está apresentado a seguir:
Variedades\Linhas
'
1
T
'
2
T
T1 17,80 c 17,40 b
T2 19,10 bc 19,10 ab
T3 20,50 ab 19,80 a
T4 21,18 a 17,40 b
Médias seguidas de mesma letra não diferem entre si pelo teste de Tukey (Prob > 0,05).
5.7) Análise de regressão
5.7.1) Características
Na pesquisa agropecuária é freqüente o interesse no estudo de
relações funcionais entre variáveis quantitativas, como por exemplo:
a) Estudar a resposta na produção de grãos (y) em função de
doses (X) de nitrogênio aplicadas ao solo, simbolizado por y =
f(X);
b) Estimar o volume de madeira (y) em árvores de um povoamento
florestal sem ter que derrubá-las, através da medida de seus
diâmetros (X
1
) e alturas (X
2
), simbolizado por y = f(X
1,
X
2
);
c) Expressar a curva de crescimento (y) de aves em função do
tempo (X), simbolizado por y = f(X)
d) Determinar como o número de brotos (y
1
) e seu peso seco (y
2
)
são afetados pelas doses de meio de cultura MS (X
1
), de
sacarose (X
2
) e pH (X
3
), simbolizado por y
1
, y
2
= f(X
1
, X
2
, X
3
).
As variáveis y’s dos exemplos anteriores que se deseja descrever
são chamadas variáveis dependentes ou respostas e as variáveis
X’s são denominadas independentes ou regressoras.
Na natureza, certamente uma variável y que se deseja descrever, é
determinada por um conjunto de outras variáveis, X
1
, X
2
, ......, X
k
.
87 18
Variedade 2/ Linha 1 =
_______
'
1 2
T T = 10 , 19
4
4 , 76
·
Variedade 3/ Linha 1 =
_______
'
1 3
T T = 50 , 20
4
0 , 82
·
Variedade 4/ Linha 1 =
_______
'
1 4
T T = 18 , 21
4
7 , 84
·
- Comparando Médias de T para
'
2
T :
Variedade 1/ Linha 2 =
_______
'
2 1
T T = 40 , 17
4
6 , 69
·
Variedade 2/ Linha 2 =
_______
'
2 2
T T = 10 , 19
4
4 , 76
·
Variedade 3/ Linha 2 =
_______
'
2 3
T T = 80 , 19
4
2 , 79
·
Variedade 4/ Linha 2 =
_______
'
2 4
T T = 40 , 17
4
6 , 69
·
Teste de Tukey:
r
Médio QMErro
q DMS ·
sendo q

para α=0,05; I = 4 tratamentos principais (Variedades) e
GLErro Médio =
'
n = 21 ⇒ q = 3,95:
00 , 2
4
0207 , 1
95 , 3 DMS · · .
b.2) Polígono de freqüência: quando as amplitudes de classe (c) são
iguais, o polígono é obtido pela união dos pontos médios das
classes, nas alturas correspondentes às df’s.
O polígono deve ser unido, no eixo horizontal, nos pontos:
2
c
LI
1
− e
2
c
LS
k
+
em que LS
k
é o limite superior da última classe (k). No Exemplo 3 os
pontos de união ao eixo horizontal são:
1 , 9
2
1 , 3
65 , 10 · − e 2 , 43
2
1 , 3
65 , 41 · + .
dfr
0
0.02
0.04
0.06
0.08
0.1
9
.
1
1
2
.
2
1
5
.
3
1
8
.
4
2
1
.
5
2
4
.
6
2
7
.
7
3
0
.
8
3
3
.
9
3
7
4
0
.
1
4
3
.
2
DAP
Figura 5. Polígono de freqüência relativa referente ao diâmetro àaltura do peito (DAP),
em cm, de 54 árvores de um talhão.
2.3) Natureza da distribuição
O objetivo da distribuição de freqüência é descrever o
comportamento da variável. A natureza desse comportamento pode
ser simétrica, assimétrica à direita ou à esquerda, como pode ser
visualizado na Figura 6. Adiante será visto como se quantifica a
assimetria.
19 86
i)
Simétrica
ii) iii)
Assimétrica à direita
Assimétrica à esquerda
Figura 6. Natureza da distribuição dos dados i) simétrica, ii) assimétrica àdireita ou
iii) assimétrica àesquerda.
3) Estatísticas descritivas
3.1) Medidas de posição
Definição: é um número que descreve um conjunto de dados, pela
indicação da posição que o conjunto ocupa na escala de valores
possíveis que a variável em questão pode assumir.
3.1.1) Média Me) ou X (
Me =
N
X
N
1 i
i

·
.
( )
16
(294,8)
6 , 69 79,2 76,4 69,6
4
1
T/T SQ 2 /Linha Variedade SQ
2
2 2 2 2 '
2
− + + + · ·
'
2
T/T SQ = 5449,4800 – 5431,6900 = 17,7900.
Para certificar se o cálculo das somas de quadrados do
desdobramento Variedades dentro de Linhas foi realizado
corretamente basta verificar:
SQ T + SQ T x
'
T =
'
2
'
1
T / T SQ T / T SQ +
26,9635 + 17,9184 = 27,0919 +17,7900
44,8819 = 44,8819 ok!
A análise de variância para o desdobramento T/T’ é:
FV GL SQ QM F Prob>F
'
1
T/T (I-1) = 4-1 =3 27,0919 9,0306 8,848 0,0005
'
2
T/T (I-1) = 4-1 =3 17,7900 5,9300 5,810 0,0047
Erro Médio 21 - 1,0207
Da análise de variância anterior observa-se que houve diferença
significativa entre efeitos de Variedades (T), no comprimento da
banana, tanto para 1 linha de irrigação quanto para 2 linhas de
irrigação (Prob < 0,05). Podemos então utilizar, por exemplo, o teste
de Tukey para comparar as médias de T (Variedades) para
'
1
T (1
linha de irrigação) e também para
'
2
T (2 linhas de irrigação)
.
Médias:
- Comparando Médias de T para
'
1
T , do Quadro 3 pode-se obter:
Variedade 1/ Linha 1 =
'
1
T T
= 8 , 17
4
2 , 71
· 0
85 20
Linha 1/ Variedade 4 = 21,18 a
Linha 2/ Variedade 4 = 17,40 b
d) Comparações entre médias de tratamentos principais dentro de
cada nível de tratamento secundário (médias de Variedades dentro
de cada Linha – T/T’):
Esta comparação envolve os dois erros por meio de um erro médio,
sendo portanto um pouco mais complicada que as demais.
K
) b ( QMErro ). 1 K ( ) a ( QMErro
Médio QMErro
− +
·
0207 , 1
2
0403 , 1 ). 1 2 ( 0011 , 1
Médio QMErro ·
− +
· .
O número de graus de liberdade (n’) associado a este Erro Médio é
calculado de modo aproximado pela fórmula de Satterthwaite:
) b ( GLErro
)] b ( QMErro ) 1 K [(
) a ( GLErro
] ) a ( QMErro [
)] b ( QMErro ). 1 K ( ) a ( QMErro [
n
2 2
2
'

+
− +
·
12
] 0403 , 1 ). 1 2 [(
9
] 0011 , 1 [
] 0403 , 1 ). 1 2 ( 0011 , 1 [
n
2 2
2
'

+
− +
·
= 20,67 ≈ 21 (arredondando).
Observação: GLErro (a) ≤
'
n ≤ [GLErro (a) + GLErro (b)].
Do Quadro 3 obtém-se:
( )
16
(314,3)
7 , 84 0 , 82 4 , 76 71,2
4
1
/T T SQ 1 /Linha Variedade SQ
2
2 2 2 2 '
1
− + + + · ·
'
1
T/T SQ = 6201,1225 – 6174,0306 = 27,0919;
Para o Exemplo 3 a média é:
54
2 , 41 7 , 39 4 , 12 7 , 10
Me
+ + + +
·
L
= 25,9.
Propriedades da média:
i) Somando-se uma constante K a todos os dados, a média (Me)
também é acrescida de K:
K ) x ( Me ) K x ( Me + · + ;
ii) Multiplicando-se K a todos os dados, a média também é
multiplicada por K:
Me . K ) K . x ( Me · ;
iii) A soma dos desvios (d
i
’s) em relação a média é zero:
di = Me x
i
− ;
Exemplo 4. Para as N = 3 observações (x
i
) a seguir, os desvios d
i
em relação a média são:
xi di
3 3-5 = -2
5 5-5 = 0
7 7-5 = 2
Média (Me) = 5 ∑
·
N
1 i
i
d = 0
iv) A média minimiza a soma dos quadrados dos desvios (SQD), ou
seja, o valor da SQD seria aumentada se colocássemos qualquer
outro valor que não Me.
SQD = [ ]
2
N
1 i
i
Me x ∑ −
·
.
21 84
Observações: A média é muito influenciada por valores
discrepantes, extremos. Ela é a medida de posição mais utilizada.
3.1.2) Mediana (Md)
É o valor que é precedido e seguido pelo mesmo número de
observações, em um conjunto de dados ordenados.
Exemplo 5. Para as N = 5 observações (x
i
) a seguir, a mediana é:
x1 x2 x3 x4 x5
8 9 10 15 40
Md = 10 (este valor é precedido e seguido por duas observações).
Observação: Se o número de observações (N) for par, toma-se a
média dos dois valores centrais.
Exemplo 6. Para as N = 4 observações (x
i
) a seguir, a mediana é:
x1 x2 x3 x4
9 10 14 20
Md = 12
2
14 10
·
+
.
Propriedades da mediana:
i) Md (x+K) = Md (x) +K;
ii) Md (x.K) = K.Md (x);
iii) A mediana é o valor que minimiza a soma dos módulos dos
desvios:
a x
i
− ∑ é mínima se a = Md(x).
Observação: A Md é uma medida de posição para medidas
assimétricas.
Da análise de variância anterior observa-se que houve diferença
significativa entre efeitos de Linhas (T´), no comprimento da banana,
somente para a Variedade 4 (Prob < 0,05). Para as demais
variedades T
1
,T
2
e

T
3
não houve diferenças significativas (Prob >
0,05) entre 1 e 2 linhas de irrigação no comprimento do fruto central
da terceira penca de banana. Podemos então utilizar, por exemplo,
o teste de Tukey para comparar as médias de T´ (1 e 2 Linhas de
irrigação) para T
4
(Variedade 4).
Médias:
Linha 1/ Variedade 4 =
_______
4
'
1
T T = 18 , 21
4
7 , 84
·
Linha 2/ Variedade 4 =
_______
4
'
2
T T = 40 , 17
4
6 , 69
·
Teste de Tukey:
r
) b ( QMErro
q DMS ·
sendo q para α=0,05; K = 2 tratamentos secundários (Linhas) e
GLErro (b) = 12 ⇒ q = 3,08:
57 , 1
4
0403 , 1
08 , 3 DMS · · .
O contraste entre
'
1
T

e
'
2
T para T
4
é:
78 , 3 40 , 17 18 , 21 T T yˆ
'
2
'
1
· − · − · .
3,78 > 1,57 portanto
'
1
T ≠
'
2
T para T
4
. Ou seja, para Variedade 4 (T
4
),
1 linha de irrigação (
'
1
T ) proporcionou significativamente maior
comprimento (cm) do fruto central da terceira penca de banana do
que 2 linhas de irrigação (
'
2
T ). Colocando as letras do teste:
83 22
1
'
/T T SQ = 2478,4000 – 2478,0800 = 0,3200;
( )
8
(152,8)
76,4 76,4
4
1
/T T SQ 2 /Variedade Linha SQ
2
2 2
2
'
− + · ·
2
'
/T T SQ = 2918,4800 – 2918,4800 = 0,0000;
( )
8
) 2 , 161 (
2 , 79 0 , 82
4
1
T / T SQ 3 Variedade / SQLinha
2
2 2
3
'
− + · ·
·
3
'
T / T SQ 3249,1600 – 3248,18 = 0,9800;
( )
8
) 3 , 154 (
6 , 69 7 , 84
4
1
T / T SQ 4 Variedade / SQLinha
2
2 2
4
'
− + · ·
4
'
T / T SQ = 3004,5625 – 2976,0613 = 28,5012.
Para certificar se o cálculo das somas de quadrados do
desdobramento Linhas dentro de Variedades foi realizado
corretamente basta verificar:
SQ
'
T + SQ T x
'
T =
4
'
3
'
2
'
1
'
/T T SQ /T T SQ /T T SQ /T T SQ + + +
11,8828 + 17,9184 = 0,3200 + 0,0000 + 0,9800 + 28,5012.
29,8012 = 29,8012 ok!
A análise de variância para o desdobramento
'
T /T é:
FV GL SQ QM F Prob>F
1
'
/T T (K-1) = 2-1 =1 0,3200 0,3200 0,308 0,6347
2
'
/T T (K-1) = 2-1 =1 0,0000 0,0000 0,000 0,9975
3
'
/T T (K-1) = 2-1 =1 0,9800 0,9800 0,942 0,4341
4
'
/T T (K-1) = 2-1 =1 28,5012 28,5012 27,397 0,0346
Erro (b) 12 12,4838 1,0403
3.1.3) Moda (Mo)
É o valor mais freqüente no conjunto de dados.
Exemplo 7. Para as N = 5 observações (x
i
) a seguir, a moda é:
x1 x2 x3 x4 x5
8 9 9 12 18
Mo = 9 (valor mais freqüente; apareceu duas vezes no conjunto de
dados).
Propriedades da moda:
i) Mo (x+K) = Mo (x) +K;
ii) Mo (x.K) = K.Mo (x).
Observações: A Mo também é uma medida de posição para
medidas assimétricas. Ela é ainda menos afetada por valores
extremos do que a mediana. Para variáveis contínuas, onde é difícil
encontrar um mesmo valor repetido duas ou mais vezes, a moda é
calculada de outra maneira, através do denominado método de
Czuber; porém, tal método não será discutido neste material.
3.2) Medidas de dispersão
Definição: grandeza numérica que descreve a variabilidade em um
conjunto de dados.
3.2.1) Amplitude (A)
A = MVO - mvo
Trata-se da diferença entre o maior valor observado (MVO) e o
menor valor observado (mvo) como já foi visto anteriormente.
23 82
Exemplo 8. Considere dois conjuntos de dados (X e Y) medidos em
metro (m):
Totais
X 6 16 16 16 41 95
Y 6 11 21 31 41 110
A (X) = 41 – 6 = 35;
A (Y) = 41 – 6 = 35.
X e Y apresentam mesma amplitude (A), portanto o conjunto X
apresenta claramente menor variabilidade (maior uniformidade) que
o conjunto Y.
Observação: A amplitude é muito influenciada por valores extremos,
uma vez que é calculada a partir deles. Assim, a medida que
aumenta N, aumenta a chance de encontrar valores extremos,
aumentando, portanto, a amplitude.
3.2.2) Variância (Var) e Desvio padrão (DP)
São medidas baseadas em todos os dados, a partir dos desvios em
relação a média.
• Variância (Var ou σ
2
): média dos quadrados dos desvios
(também chamada de quadrado médio), cuja expressão é
dada por:
[ ]
N
Me x
2
N
1 i
i
2
∑ −
· σ
·
(população) ou
[ ]
1 n
Me x
ˆ
2
n
1 i
i
2

∑ −
· σ
·
(amostra).
Ou ainda, pelas expressões alternativas:
2
N
1 i
N
1 i
i
2
i
2
N
N
x
x ∑

,
`

.
|


· σ
·
·
(população) ou
2
n
1 i
n
1 i
i
2
i
2
1 n
n
x
x
ˆ

,
`

.
|


· σ
·
·
(amostra).
|-1,5|=1,5 < 1,56 portanto
1
T
=
2
T
e assim continua as
comparações entre as outras médias de variedades duas a duas.
b) Comparações entre médias de tratamentos secundários (médias
de Linhas -
'
T ):
Comparando a média de
'
1
T com a de
'
2
T pelo teste de Tukey, do
Quadro 3 pode-se obter:
64 , 19
4 x 4
3 , 314
rI
T
T
'
1
T '
1
· · ·
e
43 , 18
4 x 4
8 , 294
rI
T
T
'
2
T '
2
· · ·
I . r
) b ( QMErro
q DMS ·
sendo q

para α=0,05; K = 2 tratamentos secundários (Linhas) e
GLErro (b) = 12 ⇒ q = 3,08:
78 , 0
4 . 4
0403 , 1
08 , 3 DMS · ·
O contraste entre
'
1
T

e
'
2
T

é:
21 , 1 43 , 18 64 , 19 T T yˆ
'
2
'
1
· − · − · .
1,21 > 0,78 portanto
'
1
T ≠
'
2
T .
c) Comparações entre médias de tratamentos secundários dentro de
cada nível de tratamento principal (médias de Linhas dentro de cada
Variedade -
'
T /T):
Do Quadro 3 obtém-se:
( )
8
(140,8)
69,6 71,2
4
1
/T T SQ 1 /Variedade Linha SQ
2
2 2
1
'
− + · ·
81 24
Ti
T e
' Ti
T : total do tratamento principal i e do tratamento
secundário
'
i , respectivamente.
i
T e
'
i
T : média do tratamento principal i e do tratamento
secundário
'
i , respectivamente.
As comparações de médias que o pesquisador pode ter interesse
em um experimento em parcelas subdivididas são as seguintes:
a) Comparações entre médias de tratamentos principais (médias de
Variedades - T):
Comparando, por exemplo, a média de T
1
com a de T
2
pelo teste de
Tukey, do Quadro 3 pode-se obter:
6 , 17
2 x 4
8 , 140
rK
T
T
1
T
1
· · ·
e
1 , 19
2 x 4
8 , 152
rK
T
T
2
T
2
· · ·
K . r
) a ( QMErro
q DMS ·
sendo q

para α=0,05; I = 4 tratamentos principais (Variedades) e
GLErro (a) = 9 ⇒ q = 4,41:
56 , 1
2 . 4
0011 , 1
41 , 4 DMS · · .
O contraste entre
1
T
e

2
T
é:
5 , 1 1 , 19 6 , 17 T T yˆ
2 1
− · − · − · .
Lembrando a interpretação do teste Tukey:
Se |
yˆ |≥ DMS ⇒ as médias dos dois tratamentos em comparação
podem ser consideradas estatisticamente diferentes.
• Desvio padrão (DP ou σ): é a raiz quadrada da variância,
cuja expressão é dada por:
2
σ · σ (população) ou
2
ˆ ˆ σ · σ (amostra).
Observações: Quanto maior σ
2
ou
2
ˆ σ , maior a variabilidade do
conjunto de dados. O DP tem a vantagem, em relação a Var, de
possuir a mesma unidade dos dados (por exemplo, se a unidade de
medida dos dados é kg, a do DP também será kg enquanto que a
da Var será kg
2
), facilitando, assim, a visualização do quanto, em
média, os dados se desviam da média.
Para o Exemplo 8 tem-se:
Var(X) = 00 , 136
5
1805 2485
5
5
) 95 (
41 16 16 16 6
2
2 2 2 2 2
·

·
− + + + +
m
2
;
Var(Y) =
00 , 164
5
2420 3240
5
5
) 110 (
41 31 21 11 6
2
2 2 2 2 2
·

·
− + + + +
m
2
;
DP(X) = 66 , 11 136 · m;
DP(Y) = 81 , 12 164 · m.
Propriedades da variância e do desvio padrão:
i) Somado-se uma constante K a todos os dados, a Var e o DP não
se alteram:
) x ( Var ) K x ( Var · + ;
) x ( DP ) K x ( DP · + ;
ii) Multiplicando-se K a todos os dados, a Var fica multiplicada por K
2
e o DP por K.
Var(x.K) = K
2
[Var(x)];
DP (x.K) = K [DP (x)];
25 80
iii) O DP em relação a média é mínimo ao invés de qualquer outro
valor devido ao fato da média ser o valor que torna mínima a soma
de quadrados do desvio (SQD).
3.2.3) Coeficiente de Variação (CV)
100 .
Me
DP
(%) CV
,
`

.
|
· .
O CV é uma medida relativa, porcentual, pois o desvio e a média
possuem a mesma unidade.
Exemplo 9. Considere os pesos (Kg) de animais de dois rebanhos
diferentes:
Rebanho A Rebanho B
70 490
90 510
80 480
100 500
Me 85 495
DP 11,18 11,18
É claro que pelos valores de pesos tratam-se de rebanhos de idades
diferentes. Os rebanhos A e B possuem o mesmo DP, porém, é
óbvio que diferenças de 5 kg, por exemplo, possuem um peso
relativo muito maior no rebanho A do que no rebanho B. Assim,
poderíamos afirmar que a variabilidade do rebanho A é maior do
que a do rebanho B. Isto pode ser comprovado pelos valores de CV
dos dois rebanhos:
CV (Rebanho A): % 15 , 13 100 x
85
18 , 11
· ;
CV (Rebanho B):
% 26 , 2 100 x
495
18 , 11
·
.
FV GL SQ QM F Prob>F
Bloco 3 15,7535 5,2512 5,245 0,0229
Variedades (T) 3 26,9635 8,9878 8,978 0,0045
Erro (a) 9 9,0102 1,0011
Parcelas 15 51,7272
Linhas (
'
T )
1 11,8828 11,8828 11,422 0,0055
T x
'
T
3 17,9184 5,9728 5,741 0,0338
Erro (b) 12 12,4838 1,0403
Total 31 94,0122
CV (a) (%) 5,26
CV (b) (%) 5,37
Média geral ) y ( : 19,0
Número de observações: 32
Nos experimentos em parcelas subdivididas tem-se dois
coeficientes de variação (CV):
Para parcelas:
% 26 , 5 100 .
0 , 19
0011 , 1
100 .
y
) a ( QMErro
) a ( CV · · · ;
Para subparcelas:
% 37 , 5 100 .
0 , 19
0403 , 1
100 .
y
) b ( QMErro
) b ( CV · · · .
Considere:
I: número de tratamentos principais, I = 4 variedades;
K: número de tratamentos secundários, K = 2 linhas de irrigação;
r: número de blocos, r = 4 blocos;
79 26
51,7272 11593,8378 - 1645,5650 1 Parcelas SQ · · ;
SQ Erro (a) = SQ Parcelas – SQ Blocos – SQ Variedades
SQ Erro (a) = 51,7272 – 15,7535 – 26,9635 = 9,0102.
É necessário também fazer um outro quadro auxiliar com a
combinação entre os níveis dos dois fatores (variedades e linhas de
irrigação) para o cálculo da soma de quadrados do tratamento da
subparcela (linhas de irrigação) e da interação variedades x linha
(T x T´).
Quadro 3. Quadro auxiliar com os totais de todas as repetições para
cada combinação entre os níveis dos fatores T e T´.
Linhas\Variedades T1 T2 T3 T4 Totais
'
1
T 71,2
(4)
76,4 82,0 84,7 314,3
(16)
'
2
T 69,6 76,4 79,2 69,6 294,8
Totais 140,8
(8)
152,8 161,2 154,3 609,1
Do Quadro 3 é possível obter:
11593,8378 - ) 294,8 (314,3
16
1
Linhas SQ
2 2
+ ·
SQ Linhas = 11605,7206 – 11593,8378 = 11,8828;
SQLinhas Variedades SQ C - ) 69,6 ... 69,6 (71,2
4
1
) T x (T Linhas x Variedades SQ
2 2 2 '
− − + + + ·
SQ Variedades x Linhas (T x
'
T ) = 11650,6025 – 11593,8378 – 26,9635 –
11,8828 = 17,9184;
SQ Erro (b) = SQ Total – SQ Parcela – SQ Linhas – SQ Variedades x
Linhas
SQ Erro (b) = 94,0122 – 51,7272 – 11,8828 – 17,9184 = 12,4838.
E o quadro de análise de variância para os dados do exemplo 5.6.5)
conforme o esquema em parcela subdividida é:
Observação: O CV por ser adimensional é útil na comparação entre
conjuntos de dados com mesma unidade mas permite, também, a
comparação da variabilidade entre conjuntos de dados referentes a
diferentes características.
3.3) Medidas de assimetria e curtose
Em estatística, freqüentemente é interessante saber se a população
da qual a amostra foi coletada pode ser descrita por uma curva
normal. Isso pode ser verificado por meio das seguintes medidas:
3.3.1) Coeficiente de assimetria (As): medida que quantifica o
distanciamento de um conjunto de dados em relação à simetria. O
coeficiente As é dado por:
3
3
2 2
3
d
m
d d
m
As · ·
sendo
( )
n
x x
m
n
1 i
3
i
3
∑ −
·
·
e d
2
= σ
2
(variância populacional) ou
2
ˆ σ (variância amostral).
¹
¹
¹
¹
¹
'
¹
·
<
>
normal). ão distribuiç
uma de vinda a considerad ser pode (amostra simetria uma indica : 0) (As zero
esquerda, à assimetria uma indica : 0) (As negativo
direita, à assimetria uma indica : 0) (As positivo
é As Se
Na Figura 6 pode ser visto a natureza do comportamento de uma
variável, se simétrica, assimétrica à direita ou assimétrica à
esquerda.
Observação: Na prática os valores de As dificilmente serão zero,
podendo ser próximos de zero.
3.3.2) Coeficiente de curtose (K): medida que quantifica o grau de
achatamento da distribuição de freqüência de um conjunto de
dados, tendo a curva normal como referência. O coeficiente K é
dado por:
27 78
4
4
2 2
4
d
m
d . d
m
K · ·
sendo
( )
n
x x
m
n
1 i
4
i
4
∑ −
·
·
e d
2
= σ
2
(variância populacional) ou
2
ˆ σ (variância amostral).
¹
¹
¹
'
¹
·
<
>
a. mesocúrtic chamada normal a semelhante ão distribuiç uma indica : 3
ca, platicúrti chamada achatada ão distribuiç uma indica : 3
ca, leptocúrti chamada afiada ão distribuiç uma indica : 3
é K Se
Figura 7. Gráfico dos diferentes graus de achatamento relativos a uma distribuição de
freqüência
Exemplo 10. Seja as seguintes N = 4 observações, a média ( x ) e a
variância (d
2
)destas observações dadas por
x1 x2 x3 x4 x d
2
2 15 16 17 12,5 37,25
Considerando que a unidade de cálculo é a subparcela, do Quadro
de dados podemos tirar:
C =
32
) 1 , 609 (
2
= 11593,8378;
SQ Blocos = 8378 , 11593 ) 0 , 155 6 , 142 1 , 155 4 , 156 (
8
1
2 2 2 2
− + + +
SQ Blocos = 11609,5913 – 11593,8378 = 15,7535;
SQ Total = 19,0
2
+ 17,1
2
+ . . . + 16,4
2
+ 18,6
2
– 11593,8378
SQ Total = 11687,8500– 11593,8378 = 94,0122.
Para o cálculo da soma de quadrados de parcelas, é necessário
fazer um quadro auxiliar com os totais das parcelas.
Quadro 2. Quadro auxiliar com os totais das parcelas
Tratamentos Repetições
T1 T2 T3 T4
Totais
1 37,9
(2)
39,0 41,5 38,0 156,4
(8)
2 34,7 37,8 42,2 40,4 155,1
3 32,4 36,8 36,0 37,4 142,6
4 35,8 39,2 41,5 38,5 155,0
Totais 140,8
(8)
152,8 161,2 154,3 609,1
Do Quadro 2 calculamos:
11593,8378 - ) 154,3 161,2 152,8 (140,8
8
1
Variedades SQ
2 2 2 2
+ + + ·
SQ Variedades = 11620,8013 – 11593,8378 = 26,9635;
11593,837 - ) 38,5 37,4 ... 34,7 (37,9
2
1
Parcelas SQ
2 2 2 2
+ + + + · 8
77 28
fruto central da terceira penca de banana estão dispostos na Tabela
8 a seguir.
Tabela 8. Comprimento (cm) do fruto central da terceira penca de
banana para um experimento em blocos casualizados (DBC), com 4
repetições, em esquema de parcela subdividida com 4 variedades
de banana (T
1
, T
2
, T
3
e T
4
) nas parcelas e 2 linhas de irrigação (
'
1
T =
1 linha e
'
2
T = 2 linhas) nas subparcelas
Tratamentos
T1 T2 T3 T4
Repetições
'
1
T
'
2
T
'
1
T
'
2
T
'
1
T
'
2
T
'
1
T
'
2
T
Totais
1 19,0 18,9 19,2 19,8 20,8 20,7 21,1 16,9 156,4
2 17,1 17,6 19,5 18,3 20,9 21,3 22,7 17,7 155,1
3 17,5 14,9 17,5 19,3 18,6 17,4 21,0 16,4 142,6
4 17,6 18,2 20,2 19,0 21,7 19,8 19,9 18,6 155,0
Totais 71,2 69,6 76,4 76,4 82,0 79,2 84,7 69,6 609,1
5.6.6) Croqui de campo
T2 T4 T1 T3
BL I
'
2
T
'
1
T
'
2
T
'
1
T
'
1
T
'
2
T
'
1
T
'
2
T
T3 T1 T2 T4
BL II
'
1
T
'
2
T
'
2
T
'
1
T
'
1
T
'
2
T
'
2
T
'
1
T
T4 T3 T1 T2
BL III
'
1
T
'
2
T
'
1
T
'
2
T
'
1
T
'
2
T
'
2
T
'
1
T
T1 T2 T3 T4
BL IV
'
2
T
'
1
T
'
1
T
'
2
T
'
2
T
'
1
T
'
1
T
'
2
T
252
4
1008
4
) 5 , 12 17 ( ) 5 , 12 16 ( ) 5 , 12 15 ( ) 5 , 12 2 (
m
3 3 3 3
3
− ·

·
− + − + − + −
·
;
563 , 3188
4
25 , 12754
4
) 5 , 12 17 ( ) 5 , 12 16 ( ) 5 , 12 15 ( ) 5 , 12 2 (
m
4 4 4 4
4
· ·
− + − + − + −
·
;
1,108
d
m
25 , 37 25 , 37
252
As
3
3
− · ·

·
(As < 0 → Assimetria a esquerda);
2,30
) 25 , 37 ).( 25 , 37 (
563 , 3188
K · ·
(K < 3 → Distribuição platicúrtica).
4) Testes de comparações múltiplas
4.1) Contrastes ortogonais de médias
Definição: São combinações lineares dadas por:
Y
1
= a
1
m
1
+ a
2
m
2
+ ...+ a
n
m
n
Y
2
= b
1
m
1
+ b
2
m
2
+ ...+ b
n
m
n
M
Y
I-1
= c
1
m
1
+ c
2
m
2
+ ...+ c
n
m
n
sendo a soma dos coeficientes de cada contraste igual a zero:
0 c b , a
n
1 i
n
1 i
i i
n
1 i
i
· ∑ ∑ ∑
· · ·
L ,
em que:
a
1
, b
1
, c
1,
..., a
n
, b
n
, c
n
são os coeficientes dos contrastes;
m
1
, m
2
,

..., m
n
são médias dos tratamentos 1, 2, ...,n.
Dois contrastes são ditos ortogonais quando há uma independência
entre suas comparações, ou melhor, quando a variação de um
contraste é independente da variação do outro. A exigência para
29 76
que dois contrates sejam ortogonais é que a covariância (Cov) entre
eles seja nula:
Cov(
i
Y
,
' i
Y
) = 0.
Seja
2
i
s a variância do tratamento i e r
i
o número de repetições do
tratamento i, a covariância entre dois contrastes é dada por uma das
seguintes expressões:

Se
2
1
s ≠
2
2
s ≠...≠
2
n
s e r
1
≠ r
2
≠...≠ r
n :
Cov(Y
1
, Y
2
) =
2
n
n
n n 2
2
2
2 2 2
1
1
1 1 2
i
n
1 i
i
i i
s
r
b a
s
r
b a
s
r
b a
s
r
b a
+ + + · ∑
·
L .

Se
2
1
s =
2
2
s =...=
2
n
s e r
1
≠ r
2
≠...≠ r
n
:
Cov(Y
1
, Y
2
) =
n
n n
2
2 2
1
1 1
n
1 i
i
i i
r
b a
r
b a
r
b a
r
b a
+ + + · ∑
·
L .

Se
2
1
s =
2
2
s =...=
2
n
s e r
1
= r
2
=...= r
n
:
Cov(Y
1
, Y
2
) =
n n 2 2 1 1
n
1 i
i i
b a b a b a b a + + + · ∑
·
L .
A variância (Var) de um contraste Y é:
Var (Y) =

·
n
1 i
i
2
i 2
r
c
s (se
2
1
s =
2
2
s =...=
2
n
s =s
2
)
ou
Var (Y) =
2
i
n
1 i
i
2
i
s
r
c

·
(se
2
1
s ≠
2
2
s ≠...≠
2
n
s ).
O erro padrão do contraste Y é:
s(Y) = ) Y ( Var .
5.6.3) Desvantagem
Há uma redução do número de graus de liberdade do erro,
comparativamente ao esquema fatorial, redução esta decorrente da
existência de dois erros, o erro (a) referente às parcelas e o erro (b),
correspondente às subparcelas dentro das parcelas.
5.6.4) Modelo estatístico do experimento em parcela
subdividida
O modelo a seguir corresponde a um modelo de um DBC em
esquema de parcela subdividida:
ijk ik k ij i j ijk
e ) ( ì y + αγ + γ + δ + α + β + ·
em que
ijk
y é o valor observado referente a parcela que recebeu o i-
ésimo nível do tratamento principal α e o k-ésimo nível do
tratamento secundário γ no j-ésimo bloco; µ representa uma
constante geral associada a esta variável aleatória; β
j
é o efeito do j-
ésimo bloco; α
i
é o efeito do i-ésimo nível do tratamento principal; δ
ij
= (αβ)
ij
é o efeito residual das parcelas, caracterizado como
componente do erro (a); γ é o efeito do k-ésimo nível do tratamento
secundário; (αγ)
ij
é o efeito da interação do i-ésimo nível do
tratamento principal α com o k-ésimo nível do tratamento secundário
γ e e
ijk
representa o efeito residual das subparcelas, caracterizado
como componente do erro (b).
Sobre as distribuições de δ
ij
e e
ijk
pode-se considerar as seguintes
pressuposições: i) δ
ij
∩ N(0,
2
δ
σ ); ii) e
ijk
∩ N(0,
2
σ ); iii) δ
ij
e e
ijk
são
não correlacionados.
5.6.5) Exemplo de parcela subdividida
Foi realizado um experimento em blocos casualizados com 4
repetições, no esquema de parcelas subdivididas. Os tratamentos
das parcelas foram 4 variedades de banana (T
1
, T
2
, T
3
e T
4
) e os
tratamentos das subparcelas foram uma e duas linhas de irrigação
(
'
1
T = 1 linha e
'
2
T = 2 linhas). Os dados do comprimento (cm) do
75 30
5.6) Experimentos em parcelas subdivididas
5.6.1) Características
O esquema experimental em parcelas subdivididas se caracteriza
como sendo uma variação do experimento fatorial com dois fatores
(Steel et al., 1997). A principal característica destes experimentos é
que as parcelas são divididas em subparcelas. Os tratamentos das
parcelas são chamados de primários ou principais e são dispostos
segundo um tipo qualquer de delineamento, sendo os mais usados
os delineamentos em blocos casualizados, com o objetivo de
procurar controlar a variabilidade que possa haver no material
experimental. Os tratamentos das subparcelas são chamados
secundários e são dispostos aleatoriamente dentro de cada parcela.
Assim, cada parcela funciona como um bloco para os tratamentos
secundários. Primeiro casualizam-se os níveis do fator primário nas
parcelas de cada bloco; em seguida, casualizam-se os níveis do
fator secundário nas subparcelas de cada parcela. Pimentel Gomes
(1990) e Hinkelmann & Kempthorne (1994), dentre outros autores,
são unânimes em afirmar a maior precisão existente no teste de
tratamentos secundários.
5.6.2) Vantagens
Os experimentos em parcelas subdivididas apresentam uma grande
utilidade na pesquisa agropecuária, além de outras diversas áreas.
Tais experimentos são úteis em situações como: a) quando os
níveis de um dos fatores exigem grandes quantidades de material
experimental (por exemplo, níveis de irrigação), devendo ser
casualizados nas parcelas; b) quando informações prévias
asseguram que as diferenças entre os níveis de um dos fatores são
maiores que as do outro fator; c) quando se deseja maior precisão
para comparações entre níveis de um dos fatores; d) quando existe
um fator de maior importância (que deverá ser casualizado na
subparcela) e outro de importância secundária, sendo este incluído
para aumentar a extensão dos resultados e e) nas situações
práticas, onde é difícil a instalação do experimento no esquema
fatorial.
Observações: Em um experimento com I tratamentos, o número
máximo de contrastes ortogonais possíveis é dado por I-1
comparações. Os contraste são formulados de acordo com o
interesse do pesquisador.
Exemplo 11. Considere as médias de produtividade de grãos (t/ha)
de 4 cultivares de milho:
2 , 5 mˆ
1
·
3 , 3 mˆ
2
·
0 , 4 mˆ
3
·
0 , 9 mˆ
4
·
r
1
= r
2
= r
3
= r
4
= 5

e
2
1
s =
2
2
s =
2
3
s =
2
4
s =
2
s = 0,19.
i) Escolher os (I-1) = 4-1 = 3 contrastes:
Y
1
= m
1
+ m
2
– m
3
– m
4
em que a
1
=1, a
2
=1, a
3
= -1, a
4
= -1
Y
2
= m
1
– m
2
em que a
1
=1, a
2
= -1, a
3
= 0, a
4
= 0
Y
3
= m
3
– m
4
em que a
1
= 0, a
2
= 0, a
3
= 1, a
4
= -1.
ii) Verificar se o somatório dos coeficientes de cada contraste é igual
a zero:
. 0 1 1 0 0 c Y
0 0 0 1 1 b Y
0 1 1 1 1 a Y
4
1 i
i 3
4
1 i
i 2
4
1 i
i 1
· − + + · ∑ ⇒
· + + − · ∑ ⇒
· − − + · ∑ ⇒
·
·
·
31 74
iii) Verificar se a covariância entre dois contrastes é igual a zero:
) Y
ˆ
, Y
ˆ
( v oˆ C
2 1
= 0 ). 1 ( 0 ). 1 ( ) 1 .( 1 1 . 1 b a
4
1 i
i i
− + − + − + · ∑
·
= 0
) Y
ˆ
, Y
ˆ
( v oˆ C
3 1
= ) 1 ).( 1 ( 1 ). 1 ( 0 . 1 0 . 1 c a
4
1 i
i i
− − + − + + · ∑
·
= 0
) Y
ˆ
, Y
ˆ
( v oˆ C
3 2
= ) 1 .( 0 1 . 0 0 ). 1 ( 0 . 1 c b
4
1 i
i i
− + + − + · ∑
·
= 0.
iv) Calcular a variância de cada contraste:
) Y
ˆ
( r aˆ V
1
= ∑
·
n
1 i
i
2
i 2
r
a
s =

,
`

.
| − + − + +
5
) 1 ( ) 1 ( 1 1
19 , 0
2 2 2 2
= 0,1520
) Y
ˆ
( r aˆ V
2
= ∑
·
n
1 i
i
2
i 2
r
b
s =

,
`

.
| + + − +
5
0 0 ) 1 ( 1
19 , 0
2 2 2 2
= 0,0760
) Y
ˆ
( r aˆ V
3
= ∑
·
n
1 i
i
2
i 2
r
c
s =

,
`

.
| − + + +
5
) 1 ( 1 0 0
19 , 0
2 2 2 2
= 0,0760.
v) Calcular o erro padrão de cada contraste:
3899 , 0 1520 , 0 ) Y
ˆ
( r aˆ V ) Y
ˆ
( s
1 1
· · · t/ha
2757 , 0 0760 , 0 ) Y
ˆ
( r aˆ V ) Y
ˆ
( s
2 2
· · · t/ha
2757 , 0 0760 , 0 ) Y
ˆ
( r aˆ V ) Y
ˆ
( s
3 3
· · · t/ha.
vi) Calcular as estimativas destes contrastes:
1
Y
ˆ
= 5,2 + 3,3 – 4,0 – 9,0 = -4,5 t/ha
2
Y
ˆ
= 5,2

– 3,3 = 1,9 t/ha
3
Y
ˆ
= 4,0 – 9,0 = -5,0 t/ha.
Aplicando o teste de Scott-Knott para variedades dentro de cada
nível de inoculante tem-se:
- Variedade dentro do inoculante 1:
Variedade Médias Resultado do teste
1 231,4 b
2 385,3 a
A variedade 2 apresentou peso do colmo estatisticamente superior
ao da variedade 1 quando foi utilizado o inoculante 1 (Prob<0,05).
- Variedade dentro do inoculante 2:
Variedade Médias Resultado do teste
1 209,0 b
2 374,8 a
A variedade 2 apresentou peso do colmo estatisticamente superior
ao da variedade 1 quando foi utilizado o inoculante 2 (Prob<0,05).
- Variedade dentro do inoculante 3:
Variedade Médias Resultado do teste
1 244,3 b
2 379,3 a
A variedade 2 também apresentou peso do colmo estatisticamente
superior ao da variedade 1 quando foi utilizado o inoculante 3
(Prob<0,05).
73 32
- Inoculante dentro da variedade 2:
Inoculantes Médias Resultado do teste
1 385,3 a
2 374,8 a
3 379,3 a
Também não houve diferenças significativas (Prob>0,05) com
relação ao peso do colmo entre os 3 inoculantes utilizados para a
variedade 2.
b) Estudar o comportamento das variedades para cada inoculante
Do Quadro 1 tem-se:
SQ Variedade / I
1
=
8
) 4 , 2466 (
) 0 , 1541 4 , 925 (
4
1
2
2 2
− + = 47370,4200
SQ Variedade / I
2
=
8
) 8 , 2334 (
) 0 , 1499 8 , 835 (
4
1
2
2 2
− + = 54979,2800
SQ Variedade / I
3
=
8
) 2 , 2494 (
) 1 , 1517 1 , 977 (
4
1
2
2 2
− + = 36450,0000.
FV GL SQ QM F Prob>F
Variedade / I1 1 47370,4200 47370,4200 25,700 0,0001
Variedade / I2 1 54979,2800 54979,2800 29,828 0,0001
Variedade / I3 1 36450,0000 36450,0000 19,775 0,0005
Erro 15 27648,1067 1843,2071
Neste segundo desdobramento da interação (variedade dentro de
inoculante) conclui-se que as duas variedades apresentaram pesos
de colmos diferentes (Prob<0,05) para cada inoculante utilizado (I
1
ou I
2
ou I
3
).
vii) Conclusões dos contrates:
a) ·
+

+
·
2
mˆ mˆ
2
mˆ mˆ
Y
ˆ
4 3 2 1 '
1
-2,25 t/ha
O contraste Y
1
nos indica que o grupo das cultivares 1 e 2 produz
em média 2,25 t/ha a menos que o grupo das cultivares 3 e 4.
b) 9 , 1
1

1

Y
ˆ
2 1 '
2
· − · t/ha
O contraste Y
2
nos indica que a cultivar 1 superou em média a
produção da cultivar 2 em 1,9 t/ha.
c) 0 , 5
1

1

Y
ˆ
4 3 '
3
− · − · t/ha.
O contraste Y
3
nos indica que a cultivar 3 produziu em média 5,0
t/ha a menos que a cultivar 4.
4.2) Teste t de Student
4.2.1) Teste t para contrastes ortogonais
Considerações:
- O teste t pode ser usado para contrastes ortogonais, sugeridos
pela estrutura dos tratamentos.
- De acordo com Banzatto & Kronka (1989), deve-se escolher os
contrastes antes de avaliar os dados ou, se possível, na fase de
planejamento do experimento para evitar que sejam escolhidos
contrastes correspondentes as maiores diferenças observadas entre
médias, o que aumentaria, assim, a probabilidade de erro tipo I (α).
O α consiste no erro que se comete ao rejeitar Ho, sendo que ela é
verdadeira.
Dada uma hipótese de nulidade (H
o
) e sua hipótese alternativa (H
1
)
dada por:
33 72
H
o
: Y= 0, ou seja, as médias ou grupos de médias comparadas no
contraste não diferem entre si.
H
1
: Y≠ 0, ou seja, pelo menos uma média difere das demais ou um
grupo de médias difere de outro grupo.
A estatística t é calculada por:
) Y
ˆ
( s
0 Y
ˆ
) Y
ˆ
( V
ˆ
0 Y
ˆ
t

·

·
sendo Y
ˆ
a estimativa do contraste de interesse e ) Y
ˆ
( s a estimativa
do erro padrão do contraste.
A estatística t é comparada (em valor absoluto) com um valor
tabelado (t
t
), procurando-se na Tabela de t (encontrada em livros de
estatística) o número de graus de liberdade (GL) associado a
variância e o nível de significância α. Se |t |< t
t
, aceita-se a
hipótese H
o
e conclui-se que as médias ou os grupos de médias em
comparação são iguais; caso contrário, se |t |≥ t
t
,

rejeita-se a
hipótese H
o
e conclui-se que as médias ou o grupo de médias em
comparação são diferentes.
Exemplo 12. Aplicar o teste t nos contrates Y
1
, Y
2
e Y
3
do Exemplo
11, considerando que o GLErro da análise de variância é 16.
Y
1
= m
1
+ m
2
– m
3
– m
4
1
Y
ˆ
= -4,5 t/ha ) Y
ˆ
( s
1
= 0,3899 t/ha
Y
2
= m
1
– m
2
2
Y
ˆ
= 1,9 t/ha ) Y
ˆ
( s
2
= 0,2757 t/ha
Y
3
= m
3
– m
4

3
Y
ˆ
= -5 t/ha ) Y
ˆ
( s
3
= 0,2757 t/ha
- Teste t para Y
1
:
541 , 11
3899 , 0
0 5 , 4
t
) Y ( c
1
− ·
− −
·
) Y ( t
1
t

para α=0,05 e GL Erro=16 ⇒
) Y ( t
1
t = 2,12
variedades e inoculantes, recomenda-se proceder o desdobramento
da interação V x I para certificar tal informação.
O desdobramento, no caso deste exemplo com dois fatores, pode
ser realizado das seguintes maneiras:
a) Estudar o comportamento dos inoculantes para cada variedade
Do Quadro 1 tem-se:
SQ Inoculante / V
1
=
12
) 3 , 2738 (
) 1 , 977 8 , 835 4 , 925 (
4
1
2
2 2 2
− + +
= 2555,5617;
SQ Inoculante / V
2
=
12
) 1 , 4557 (
) 1 , 1517 0 , 1499 0 , 1541 (
4
1
2
2 2 2
− + +
= 221,9017.
FV GL SQ QM F Prob>F
Inoculante / V1 2 2555,5617 1277,7808 0,693 0,5110
Inoculante / V2 2 221,9017 110,9508 0,060 0,9427
Erro 15 27648,1067 1843,2071
Neste primeiro desdobramento da interação (inoculante dentro de
variedade) conclui-se que tanto para variedade 1 quanto para a
variedade 2, não há diferença significativa (Prob>0,05) no peso do
colmo entre os três inoculantes aplicados.
Aplicando o teste de Scott-Knott para inoculantes dentro de cada
nível de variedade tem-se:
- Inoculante dentro da variedade 1:
Inoculantes Médias Resultado do teste
1 231,4 a
2 209,0 a
3 244,3 a
Realmente, não houve diferenças significativas (Prob>0,05) com
relação ao peso do colmo entre os 3 inoculantes utilizados para a
variedade 1.
71 34
SQ Variedades x Inoculantes = 140612,1900 - 137834,7267– 1812,4900 =
964,9733.
E o quadro de análise de variância para os dados do exemplo 5.5.5)
conforme o esquema fatorial 3x2 é:
FV GL SQ QM F Prob>F
Bloco 3 3806,8083 1268,9361 0,688 0,5730
(Tratamentos) (5) (140612,1900) 28122,4380 15,257 0,0000
Variedades (V) 1 137834,7267 137834,7267 74,780 0,0000
Inoculantes (I) 2 1812,4900 906,2450 0,492 0,6211
V x I 2 964,9733 482,4867 0,262 0,7731
Erro 15 27648,1067 1843,2071
Total 23 172067,1050
CV (%) = 14,12
Média geral: 303,98 Número de observações: 24
Aplicando o teste de Scott-Knott para variedades (pois esta fonte de
variação foi significativa: Prob<0,05) tem-se:
Variedades Médias Resultado do teste
1 228,2 b
2 379,8 a
Aplicando o teste de Scott-Knott para inoculantes, apesar de seu
efeito ter sido não significativo (Prob>0,05), tem-se:
Inoculantes Médias Resultado do teste
1 308,3 a
2 291,8 a
3 311,8 a
Embora a interação V x I não seja significativa (Prob > 0,05),
indicando não haver uma dependência entre os efeitos dos fatores
Como|
) Y ( c
1
t |>
) Y ( t
1
t ⇒ |-11,541| > 2,12 ⇒ rejeita-se H
o
: Y
1
= 0 e
portanto m
1
+ m
2
≠ m
3
+ m
4
(os dois grupos de médias de cultivares
diferem entre si ao nível de 5% de significância)
- Teste t para Y
2
:
892 , 6
2757 , 0
0 9 , 1
t
) Y ( c
2
·

·
) Y ( t
2
t

para α=0,05 e GL Erro=16 ⇒
) Y ( t
2
t = 2,12
Como|
) Y ( c
2
t |>
) Y ( t
2
t ⇒ 6,892 > 2,12 ⇒ rejeita-se H
o
: Y
2
= 0 e
portanto m
1
≠ m
2
(a média da cultivar 1 difere da cultivar 2 ao nível
de 5% de significância)
- Teste t para Y
3
:
136 , 18
2757 , 0
0 0 , 5
t
) Y ( c
3
·
− −
·
) 3 Y ( t
t

para α=0,05 e GL Erro=16 ⇒
) Y ( t
2
t = 2,12
Como| ·
) Y ( c
3
t |>
) 3 Y ( t
t ⇒ 18,136 > 2,12 ⇒ rejeita-se H
o
: Y
3
= 0 e
portanto m
3
≠ m
4
(a média da cultivar 3 difere da cultivar 4 ao nível
de 5% de significância).
4.2.2) Teste t para comparação de duas médias
Passos para realização do teste:
i) Definir a hipótese de nulidade: H
o
:
1
y =
2
y ;
ii) Estabelecer o nível de significância (α);
iii) Calcular a média de cada grupo (
i
y );
iv) Calcular a variância de cada grupo ) s (
2
i
;
35 70
v) Calcular a variância ponderada
2
p
s
,
por meio da expressão:
2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
p
− +
− + −
· ;
vi) Calcular a estatística t, por meio da expressão:
2
p
2 1
2 1
s
n
1
n
1
y y
t

,
`

.
|
+

· ;
vii) Encontrar o valor Tabelado de t (t
t
) procurando na Tabela de t o
valor correspondente a combinação entre o nível de significância
estabelecido, α, e o grau de liberdade (GL) dado por n
1
+ n
2
–2;
viii) Concluir o resultado do teste:
Se |t |< t
t
, aceita-se a hipótese H
o
e conclui-se que as duas médias
em comparação são iguais;
Se |t |≥ t
t
,

rejeita-se a hipótese H
o
e conclui-se que as duas médias
em comparação são diferentes.
Exemplo 13. Foi avaliado o volume estimado (em m
3
/ha) de
madeira produzida por 2 espécies de eucalipto. Verifique se há
diferença entre as médias das 2 espécies por meio do teste t.
Espécie Volume (m
3
/ha)
1 24
1 26
1 29
1 32
1 38
2 60
2 63
2 71
SQ Bloco =
2150 , 2217619 ) 8 , 1731 4 , 1802 7 , 1941 5 , 1819 (
6
1
2 2 2 2
− + + +
SQ Bloco = 2221426,0233 – 2217619,2150 = 3806,8083.
2150 , 2217619 ) 1 , 1517 0 , 1499 0 , 1541 1 , 977 8 , 835 4 , 925 (
4
1
Tratamento SQ
2 2 2 2 2
− + + + + + ·
SQ Tratamento = 2358231,4050 – 2217619,2150 = 140612,1900.
SQ Total = 238,1
2
+ 223,6
2
+ . . . + 298,4
2
+ 363,8
2
– 2217619,2150
SQ Total = 2389686,3200 – 2217619,2150 = 172067,1050.
SQ Erro = 172067,1050 – 3806,8083 – 140612,1900 = 27648,1067.
Deve-se montar um quadro auxiliar com os totais de todas as
repetições para cada combinação entre os níveis dos fatores.
Quadro 1. Quadro auxiliar com os totais de todas as repetições para
cada combinação entre os níveis dos fatores.
I1 I2 I3 Totais
V1 925,4
(4)
835,8 977,1 2738,3
(12)
V2 1541,0 1499,0 1517,1 4557,1
Totais 2466,4
(8)
2334,8 2494,2 7295,4
()
os valores dentro de parênteses correspondem ao número de parcelas que deu origem a cada total.
Do Quadro 1 obtém-se:
SQ Variedades = 2150 , 2217619 ) 1 , 4557 3 , 2738 (
12
1
2 2
− +
SQ Variedades = 2355453,9417 – 2217619,2150 = 137834,7267.
SQ Inoculantes = 2150 , 2217619 ) 2 , 2494 8 , 2334 4 , 2466 (
8
1
2 2 2
− + +
SQ Inoculantes = 2219431,7050– 2217619,2150 = 1812,4900.
SQ Variedades x Inoculantes = [SQ V, I – C] – SQ Variedades – SQ
Inoculantes
4900 , 1812 7267 , 137834 2150 , 2217619 ) 1 , 1517 4 , 925 (
4
1
s Inoculante x Variedades SQ
2 2
− −
]
]
]

− + + · L
69 36
peso do colmo (ton/ha). Os dados estão apresentados na Tabela 7 a
seguir.
Tabela 7. Peso do colmo (ton/ha) para os 6 tratamentos de um
experimento em blocos casualizados (DBC), com 4 repetições, em
esquema fatorial 2x3
Repetições
Tratamentos
1 2 3 4
Totais
1 – V1I1 238,1 256,0 267,7 163,6 925,4
2 – V1I2 223,6 217,0 184,7 210,5 835,8
3 – V1I3 286,8 205,8 231,6 252,9 977,1
4 – V2I1 347,5 403,9 347,0 442,6 1541,0
5 – V2I2 351,2 452,5 396,9 298,4 1499,0
6 – V2I3 372,3 406,5 374,5 363,8 1517,1
Totais 1819,5 1941,7 1802,4 1731,8 7295,4
5.5.6) Croqui de campo
BL I 2 4 1 3 6 5
BL II 5 2 6 1 4 3
BL III 3 4 5 2 1 6
BL IV 6 1 3 4 5 2
Assim, os valores das somas de quadrados para o exemplo 5.5.5)
são:
C =
24
) 4 , 7295 (
2
= 2217619,2150.
i) Hipótese de nulidade: Ho:
1
y =
2
y ;
ii) α=0,05;
iii) ·
1
y 29,80 e ·
2
y 64,67;
iv) ·
2
1
s 30,20 e 33 , 32 s
2
2
· ;
v)
2 3 5
33 , 32 ). 1 3 ( 20 , 30 ). 1 5 (
s
2
p
) 2 , 1 (
− +
− + −
· = 30,91;
vi)
91 , 30
3
1
5
1
67 , 64 80 , 29
t
) 2 , 1 (

,
`

.
|
+

· = -8,588;
vii) t
t(1,2)
para α=0,05 e GL = 5 + 3 –2 = 6 ⇒ t
t(1,2)
= 2,447;
viii) Comparando a média da espécie 1 com a média da espécie 2
de eucalipto:
|t
(1,2)
|> t
t(1,2)
|-8,588|= 8,588 > 2,447 ⇒ Rejeita-se H
o
⇒ Portanto
1
y ≠
2
y (a
média da espécie 1 de eucalipto difere da média da espécie 2 de
eucalipto ao nível de 5% de probabilidade).
4.2.3) Teste t para comparação de duas médias em uma análise
de variância
A diferença mínima significante (DMS ou LSD-Least Significant
Difference) entre duas médias pelo teste t de é dada por:
r
QME . 2
t DMS
t
·
em que t
t
é o valor de t tabelado, o qual corresponde o valor obtido
da combinação entre o nível de significância estabelecido (α) e o
grau de liberdade do erro (GLE) da análise de variância, na Tabela
unilateral de t. O QME é o quadrado médio do erro da análise de
variância e r é o número de repetições de cada tratamento.
37 68
Quando o valor absoluto da diferença entre duas médias for igual ou
maior que a DMS, as médias podem ser consideradas
estatisticamente diferentes.
Exemplo 14. Foi realizada a análise de variância para os dados de
porcentagem de absorção de água de 5 linhagens de feijão, com 3
repetições por linhagem. O valor do grau de liberdade do erro (GLE)
foi 10 e o quadrado médio do erro (QME) foi 4,08. Compare as
médias dos tratamentos a seguir pelo teste t:
1
y = 95,5
2
y = 87,8
3
y = 86,9
4
y = 26,3
5
y = 108,2
i) t
t
para α=0,05 e GLE = 10 ⇒ t
t
= 2,228;
ii)
3
) 08 , 4 .( 2
228 , 2 DMS · = 3,67;
iii) Coloque as médias em ordem decrescente e faça a diferença
entre elas duas a duas, começando da diferença entre a maior e a
menor média e assim por diante:
5
y =108,2
1
y = 95,5
2
y = 87,8
3
y = 86,9
4
y = 26,3
5.5.3) Desvantagens
como os tratamentos correspondem a todas as combinações
possíveis entre os níveis dos fatores, o número de tratamentos a ser
avaliado pode aumentar muito, não podendo ser distribuídos em
blocos completos casualizados devido à exigência de
homogeneidade das parcelas dentro de cada bloco. Isto pode levar
a complicações na análise, sendo preciso lançar mão de algumas
técnicas alternativas (como por exemplo, o uso de blocos
incompletos).
A análise estatística e a interpretação dos resultados pode tornar-se
um pouco mais complicada que nos experimentos simples.
5.5.4) Modelo estatístico do fatorial
O modelo a seguir corresponde a um modelo de um delineamento
em blocos casualizados (DBC) em esquema fatorial com 2 fatores
(α e γ), mas pode ser estendido para os casos em que há mais
fatores, incluindo os fatores isolados e as interações duplas, triplas e
outras entre os fatores.
ijk ik k i j ijk
e ) ( ì y + αγ + γ + α + β + ·
em que,
ijk
y é o valor observado referente a parcela que recebeu o
i-ésimo nível do fator α e o k-ésimo nível do fator γ no j-ésimo bloco;
µ representa uma constante geral; β
j
representa o efeito do j-ésimo
bloco; α
i
representa o efeito do i-ésimo nível do fator α; γ representa
o efeito do k-ésimo nível do fator γ; (αγ)
ik
representa a interação
entre o efeito do i-ésimo nível do fator α e o efeito do do k-ésimo
nível do fator γ e e
ijk
representa o erro experimental associado à
observação y
ijk
, suposto ter distribuição normal com média zero e
variância comum.
5.5.5) Exemplo de fatorial
Em um experimento em blocos casualizados com 4 repetições, no
esquema fatorial 2x3 foi avaliado o efeito de 2 variedades de cana-
de-açúcar (V
1
e V
2
) e 3 tipos de inoculantes (I
1
, I
2
e I
3
) quanto ao
67 38
5.5) Experimentos fatoriais
5.5.1) Características
Em alguns experimentos, o pesquisador avalia dois ou mais tipos de
tratamentos e deseja verificar se há interação entre estes tipos. Tais
experimentos são denominados experimentos fatoriais e os tipos de
tratamentos são denominados fatores. As categorias (subdivisões)
de cada fator são ditas níveis do fator. Como exemplo, considere um
experimento em que se comparou o efeito de 3 estirpes de rizóbio
(BR 9001, BR 9004 e BR 4812) e o efeito de um determinado fungo
(presença e ausência do fungo) na variável número de nódulos
produzido pelo feijão. Neste caso, existem dois fatores: estirpe de
rizóbio e a ocorrência do fungo. Os níveis do fator estirpe são 3 (BR
9001, BR 9004 e BR 48122) e do fungo são 2 (presença e
ausência).
Costuma-se representar o fatorial pela multiplicação dos níveis. No
exemplo anterior o fatorial é 3x2 (fatorial 3 por 2), assim fica claro
que existem dois fatores, o primeiro fator com 3 níveis de estirpe e o
segundo com 2 níveis de fungo. O número total de tratamentos
avaliados também é dado pela multiplicação dos níveis, ou seja, no
exemplo são avaliados 3x2 = 6 tratamentos avaliados (1: BR 9001
na presença do fungo; 2: BR 9004 na presença do fungo; 3: BR
4812 na presença do fungo; 4: BR 9001 na ausência do fungo; 5:
BR 9004 na ausência do fungo; 6: BR 4812 na ausência do fungo.
Se fossem, por exemplo, 3 fatores com 5, 2 e 3 níveis para cada
fator respectivamente, a representação seria: fatorial 5x2x3, sendo
avaliado um total de 30 tratamentos e assim por diante.
Vale lembrar que os experimentos fatoriais não são delineamentos e
sim um esquema de desdobramento de graus de liberdade de
tratamentos, e podem ser instalado em qualquer dos delineamentos
experimentais, DIC, DBC, etc. (Banzatto & Kronka, 1989).
5.5.2) Vantagens
- Permite estudar os efeitos principais dos fatores e os efeitos das
interações entre eles.
5
y -
4
y = 108,2-26,3 = 81,9 ⇒ 81,9 > 3,67 ∴ ∴
5
y ≠
4
y ;
5
y -
3
y = 108,2-86,9 = 21,3 ⇒ 21,3 > 3,67 ∴ ∴
5
y ≠
3
y ;
5
y -
2
y = 108,2-87,8 = 20,4 ⇒ 20,4 > 3,67 ∴ ∴
5
y ≠
2
y ;
5
y -
1
y = 108,2-95,5 =12,7 ⇒ 12,7 > 3,67 ∴ ∴
5
y ≠
1
y ;
1
y -
4
y = 95,5-26,3 = 69,2 ⇒ 69,2 > 3,67 ∴ ∴
1
y ≠
4
y ;
1
y -
3
y = 95,5-86,9 = 8,6 ⇒ 8,6 > 3,67 ∴ ∴
1
y ≠
3
y ;
1
y -
2
y = 95,5-87,8 = 7,7 ⇒ 7,7 > 3,67 ∴ ∴
1
y ≠
2
y ;
2
y -
4
y = 87,8-26,3 = 61,5 ⇒ 61,5 > 3,67 ∴ ∴
2
y ≠
4
y ;
2
y -
3
y = 87,8-86,9 = 0,9 ⇒ 0,9 < 3,67 ∴ ∴
2
y =
3
y ;
3
y -
4
y = 86,9-26,3 = 60,6 ⇒ 60,6 > 3,67 ∴ ∴
3
y ≠
4
y ;
iv) Coloque letras iguais para médias semelhantes e letras distintas
para médias que diferem entre si e interprete o teste.
5
y =108,2 a
1
y = 95,5 b
2
y = 87,8 c
3
y = 86,9 c
4
y = 26,3 d
A linhagem 5 foi a que apresentou maior porcentagem de absorção
de água diferindo das demais linhagens (Prob < 0,05).
4.3) Teste de Tukey
A diferença mínima significante (D.M.S.) entre duas médias pelo
teste de Tukey é dada por:
39 66
r
QME
q DMS ·
em que q é um valor tabelado, o qual corresponde o valor obtido da
combinação entre o número de tratamentos (I) e o grau de liberdade
do erro (GLE) da análise de variância, para um nível de significância
estabelecido (α). O QME e r já foram descritos no teste t.
A interpretação é a mesma do teste t, ou seja, quando o valor
absoluto da diferença entre duas médias for igual ou maior que a
DMS, as médias podem ser consideradas estatisticamente
diferentes.
Exemplo 15: Compare as médias dos tratamentos do Exemplo14
pelo teste de Tukey.
i) q

para α=0,05; I = 5 tratamentos e GLE = 10 ⇒ q = 4,65;
ii)
3
08 , 4
65 , 4 DMS · = 5,42;
iii)
5
y -
4
y = 81,9 > 5,42 ∴ ∴
5
y ≠
4
y ;
5
y -
3
y = 21,3 > 5,42 ∴ ∴
5
y ≠
3
y ;
5
y -
2
y = 20,4 > 5,42 ∴ ∴
5
y ≠
2
y ;
5
y -
1
y = 12,7 > 5,42 ∴ ∴
5
y ≠
1
y ;
1
y -
4
y = 69,2 > 5,42 ∴ ∴
1
y ≠
4
y ;
1
y -
3
y = 8,6 > 5,42 ∴ ∴
1
y ≠
3
y ;
1
y -
2
y = 7,7 > 5,42 ∴ ∴
1
y ≠
2
y ;
2
y -
4
y = 61,5 > 5,42 ∴ ∴
2
y ≠
4
y ;
2
y -
3
y = 0,9 < 5,42 ∴ ∴
2
y =
3
y ;
3
y -
4
y = 60,6 > 5,42 ∴ ∴
3
y ≠
4
y ;
SQ Bloco = 3205 , 70460 ) 0 , 215 8 , 218 0 , 249 7 , 250 6 , 253 (
4
1
2 2 2 2 2
− + + + +
SQ Bloco = 70815,7225 – 70460,3205 = 355,4020.
SQ Tratamento = 3205 , 70460 ) 6 , 259 6 , 291 8 , 343 1 , 291 (
5
1
2 2 2 2
− + + +
SQ Tratamento = 71188,7140 – 70460,3205 = 728,3935.
SQ Total = 72,8
2
+ 58,3
2
+ . . . + 27,4
2
+ 39,0
2
– 70460,3205
SQ Total = 73209,0700 – 70460,3205 = 2748,7495.
SQ Erro = 2748,7495 – 355,4020 - 728,3935 = 1664,9540.
E o quadro de análise de variância para os dados do Exemplo 5.4.5)
é:
FV GL SQ QM F Prob>F
Bloco 4 355,4020 88,8505 0,640 0,6441
Cobertura morta 3 728,3935 242,7978 1,750 0,2100
Erro 12 1664,9540 138,7462
Total 19 2748,7495
CV (%) = 19,83
Média geral: 59,4 Número de observações: 20
Como Prob > 0,05 para cobertura morta, conclui-se que as quatro
coberturas mortas tiveram influência semelhante no peso seco do
brócolis. Neste caso, não há necessidade de aplicação de um teste
de comparação múltipla.
Observação: Se o valor de F para tratamento for significativo a
determinado nível α de significância, o pesquisador pode usar um
teste de comparação múltipla para comparar as médias dos
tratamentos (caso este seja qualitativo), diz-se então que o teste
usado é protegido; caso contrário, se F for não significativo, o
pesquisador poderá optar ou não pelo uso do teste e, então, diz-se
que o teste é não protegido.
65 40
5.4.7) Esquema de análise de variância do DBC com fontes de
variação e graus de liberdade
Considerando a mesma representação da Tabela 5, porém aqui, as
repetições representam os blocos, o quadro de análise de variância
para os dados de um delineamento em blocos casualizados (DBC) é
expresso de uma maneira geral por:
FV GL SQ QM F
Bloco J-1 C B
I
1
J
1 j
2
j
− ∑
·
SQBloco/GLBloco QMBloco/QMErro
Tratamento I-1 C T
J
1
I
1 i
2
i
− ∑
·
SQTrat./GLTrat QMTrat./QMErro
Erro (I-1)(J-1)
SQTotal -SQBloco-
SQTrat.
SQErro/GLErro
Total IJ-1 C y
J , I
1 j , i
2
ij
− ∑
·
CV(%)=
y
QMErro
.100
J . I / y y
J , I
1 j , i
ij
∑ ·
·
No exemplo 5.4.5) tem-se:
- Delineamento: DBC;
- Tratamentos: I = 4 tipos de cobertura morta (sorgo, crotalária,
milheto e vegetação espontânea);
- Repetições: J = 5;
- Variável a analisar: peso seco (g/parcela).
Assim, os valores das somas de quadrados para o exemplo 5.3.5)
são:
iv)
5
y =108,2 a
1
y = 95,5 b
2
y = 87,8 c
3
y = 86,9 c
4
y = 26,3 d
4.4) Teste de Duncan
A diferença mínima significante (DMS) entre duas médias pelo teste
de Duncan é dada por:
r
QME
z DMS
n
· .
No teste de Duncan, se estão envolvidos I tratamentos no estudo, é
necessário calcular I-1 DMS’s. O que diferencia uma DMS da outra
é o valor de z
n
que é um valor tabelado, o qual corresponde ao valor
obtido da combinação entre o número de médias ordenadas
abrangidas na comparação (n), e o grau de liberdade do erro (GLE)
da análise de variância, ao nível de significância estabelecido (α). O
QME e r já foram descritos nos testes anteriores.
Para realização deste teste deve-se também ordenar as médias em
ordem decrescente e ir fazendo a diferença sempre entre a maior e
menor média, observando assim, o número (n ) de médias
ordenadas abrangidas na comparação.
A interpretação é a mesma dos testes anteriores, ou seja, quando o
valor absoluto da diferença entre duas médias for igual ou maior que
a D.M.S, as médias podem ser consideradas estatisticamente
diferentes. A única diferença é que na comparação entre duas
médias deve-se considerar o valor de DMS correspondente ao n em
questão. Com o exemplo seguinte ficará mais fácil o entendimento.
41 64
Exemplo 16: Compare as médias dos tratamentos do Exemplo 14
pelo teste de Duncan.
i) Como no exemplo tem-se I=5 médias de tratamentos é necessário
calcular z
5,
z
4
, z
3
, e z
2
, ou seja, é necessário o cálculo de z
I
= z
5
até
z
2
:
z
5


para α=0,05; n = 5 e GLE = 10 ⇒ z
5
= 3,430;
z
4


para α=0,05; n = 4 e GLE = 10 ⇒ z
4
= 3,376;
z
3


para α=0,05; n = 3 e GLE = 10 ⇒ z
3
= 3,293;
z
2


para α=0,05; n = 2 e GLE = 10 ⇒ z
2
= 3,151;
ii) Calcula-se então as I-1= 4 DMS’s:
00 , 4
3
08 , 4
430 , 3 DMS
5
· · ;
94 , 3
3
08 , 4
376 , 3 DMS
4
· · ;
84 , 3
3
08 , 4
293 , 3 DMS
3
· · ;
. 67 , 3
3
08 , 4
151 , 3 DMS
2
· ·
iii) Lembrando que as médias colocadas em ordem decrescente
são:
5
y =108,2
1
y = 95,5
2
y = 87,8
3
y = 86,9
4
y = 26,3
Tabela 6. Peso seco (kg/parcela) de brócolis em um experimento
em blocos casualizados (DBC) com 5 repetições em que foi avaliada
a influência de 4 tipos de cobertura morta (1: sorgo, 2: crotalária; 3:
milheto e 4: vegetação espontânea)
Rep. \ Trat. 1 2 3 4 Total
1 72,8 69,0 45,3 66,5 253,6
2 58,3 64,1 60,9 67,4 250,7
3 50,4 72,1 67,2 59,3 249,0
4 51,6 73,6 66,2 27,4 218,8
5 59,0 65,0 52,0 39,0 215,0
Total 292,1 343,8 291,6 259,6 1187,1
Média 58,4 68,8 58,3 51,9 59,4
Correção (C) C = (1187,1)
2
/20 = 70460,3205
n n = 4.5 = 20
5.4.6) Croqui de campo
BL I 2 3 1 4
BL II 4 1 2 3
BL III 2 1 4 3
BL IV 3 2 1 4
BL V 1 4 3 2
A disposição dos tratamentos é realizada de forma aleatória dentro
dos blocos.
63 42
5.4.2) Vantagens
- Controla diferenças nas condições ambientais de um bloco para
outro.
- Leva a uma estimativa mais exata da variância residual (
2
ˆ σ
), uma
vez que a variação ambiental entre blocos é isolada.
5.4.3) Desvantagens
- Há uma redução no número de graus de liberdade do erro pois o
DBC utiliza o princípio do controle local.
- O número de tratamentos a ser utilizado é limitado pela exigência
de homogeneidade dentro dos blocos, não podendo ser muito
elevado.
5.4.4)Modelo estatístico do DBC
ij i j ij
e t b ì y + + + ·
em que,
ij
y
representa a observação do i-ésimo tratamento no j-
ésimo bloco; µ representa uma constante geral associada a esta
variável aleatória; bj representa o efeito do j-ésimo bloco; ti
representa o efeito do i-ésimo tratamento; e eij representa o erro
experimental associado a observação yij, suposto ter distribuição
normal com média zero e variância comum.
5.4.5) Exemplo de DBC
Estudou-se a influência de 4 tipos de cobertura morta (sorgo,
crotalária, milheto e vegetação espontânea) no peso seco de
brócolis. O experimento foi instalado em DBC com 5 repetições. Os
dados de peso seco estão dispostos na Tabela 6 a seguir.
E as diferenças entre elas duas a duas:
5
y -
4
y = 81,9 ⇒ n = 5 ∴ ∴compara-se 81,9 com a DMS5 ⇒ 81,9 > 4,00 ∴ ∴
5
y ≠
4
y ;
5
y -
3
y = 21,3 ⇒ n = 4 ∴ ∴compara-se 21,3 com a DMS4 ⇒ 21,3 > 3,94 ∴ ∴
5
y ≠
3
y ;
5
y -
2
y = 20,4 ⇒ n = 3 ∴ ∴compara-se 20,4 com a DMS3 ⇒ 20,4 > 3,84 ∴ ∴
5
y ≠
2
y ;
5
y -
1
y = 12,7 ⇒ n = 2 ∴ ∴compara-se 12,7 com a DMS2 ⇒ 12,7 > 3,67 ∴ ∴
5
y ≠
1
y ;
1
y -
4
y = 69,2 ⇒ n = 4 ∴ ∴compara-se 69,2 com a DMS4 ⇒ 69,2 > 3,94 ∴ ∴
1
y ≠
4
y ;
1
y -
3
y = 8,6 ⇒ n = 3 ∴ ∴compara-se 8,6 com a DMS3 ⇒ 8,6 > 3,84 ∴ ∴
1
y ≠
3
y ;
1
y -
2
y = 7,7 ⇒ n = 2 ∴ ∴compara-se 7,7 com a DMS2 ⇒ 7,7 > 3,67 ∴ ∴
1
y ≠
2
y ;
2
y -
4
y = 61,5 ⇒ n = 3 ∴ ∴compara-se 61,5 com a DMS3 ⇒ 61,5 > 3,84 ∴ ∴
2
y ≠
4
y ;
2
y -
3
y = 0,9 ⇒ n = 2 ∴ ∴compara-se 0,9 com a DMS2 ⇒ 0,9 < 3,67 ∴ ∴
2
y =
3
y ;
3
y -
4
y = 60,6 ⇒ n = 2 ∴ ∴compara-se 60,6 com a DMS2 ⇒ 60,6 > 3,67 ∴ ∴
3
y ≠
4
y .
iv) Coloque letras iguais para médias semelhantes e letras distintas
para médias que diferem entre si e interprete o teste.
5
y =108,2 a
1
y = 95,5 b
2
y = 87,8 c
3
y = 86,9 c
4
y = 26,3 d
4.5) Teste de SNK (Student Newman Keuls)
A diferença mínima significante (DMS) entre duas médias pelo teste
de SNK é dada por:
43 62
r
QME
q DMS
n n
· .
O procedimento para a realização deste teste é bastante
semelhante ao do teste de Duncan. A diferença é que nas DMS’s do
SNK são usados os valores tabelados de q
n
ao invés de z
n
, ou seja,
deve-se procurar o valor tabelado na Tabela de q ao nível de
significância estebelecido (α), correspondente a combinação entre o
número de médias abrangidas na comparação (n) e o grau de
liberdade do erro (GLE) da análise de variância.
Exemplo 17. Compare as médias dos tratamentos do Exemplo 14
pelo teste de SNK.
i) Como no exemplo tem-se I=5 médias de tratamentos, é
necessário calcular q
5,
q
4
, q
3
, e q
2
, ou seja, é necessário o cálculo
de q
I
=

q
5
até q
2
:
q
5


para α=0,05; n = 5 e GLE = 10 ⇒ q
5
= 4,65;
q
4


para α=0,05; n = 4 e GLE = 10 ⇒ q
4
= 4,33;
q
3


para α=0,05; n = 3 e GLE = 10 ⇒ q
3
= 3,88;
q
2


para α=0,05; n = 2 e GLE = 10 ⇒ q
2
= 3,15;
ii) Calcula-se então as I-1= 4 DMS’s:
42 , 5
3
08 , 4
65 , 4 DMS
5
· · ;
05 , 5
3
08 , 4
33 , 4 DMS
4
· · ;
52 , 4
3
08 , 4
88 , 3 DMS
3
· · ;
. 67 , 3
3
08 , 4
15 , 3 DMS
2
· ·
E o quadro de análise de variância para os dados do Exemplo 5.3.5)
é:
FV GL SQ QM F Prob>F
Variedades 3 13019,0330 4339,6776 5,668 0,0056
Erro 20 15314,0178 765,7009
Total 23 28333,0508
CV (%): 18,41
Média: y :
150,31 Número de observações: 24
Como Prob < 0,05 (valor fornecido por alguns programas
computacionais de análise de variância), conclui-se que há
diferença estatística significativa entre as médias de peso seco da
parte aérea das quatro variedades de cana-de açúcar. Deve-se
então aplicar algum dos testes de comparação múltipla nestas
médias.
5.4) Delineamento em Blocos Casualizados (DBC)
5.4.1) Características
Os tratamentos são distribuídos aleatoriamente em blocos (princípio
do controle local) de modo que haja maior uniformidade possível
dentro de cada bloco.
O número de parcelas por bloco é igual ao número de tratamentos,
ou seja, cada bloco deverá conter todos os tratamentos.
O DBC possui os três princípios básicos da experimentação:
casualização, repetição e controle local e, portanto, as repetições
são organizadas em blocos.
Normalmente, é o delineamento mais utilizado em condições de
campo. A eficiência do DBC depende da uniformidade dentro de
cada bloco, podendo haver heterogeneidade entre blocos. Os
blocos podem ser instalados na forma quadrada, retangular ou
irregular, desde que seja respeitada a uniformidade dentro do bloco.
61 44
O quadro de análise de variância para os dados da Tabela 5 é:
FV GL SQ QM F
Tratamento I-1 C T
J
1
I
1 i
2
i
− ∑
·
SQTrat./GLTrat. QMTrat./QMErro
Erro I(J-1) SQTotal –SQTrat. SQErro/GLErro
Total IJ-1 C y
J , I
1 j , i
2
ij
− ∑
·
CV(%)=
y
QMErro
.100
J . I / y y
J , I
1 j , i
ij
∑ ·
·
No exemplo 5.3.5) tem-se:
- Delineamento: DIC;
- Tratamentos: I = 4 variedades de cana-de-açúcar (A, B, C, D);
- Repetições: J = 6;
- Variável a analisar: peso seco da parte aérea (g/parcela).
Assim, os valores das somas de quadrados para o exemplo 5.3.5)
são:
SQ Tratamento =
25 , 542207 ) 59 , 922 87 , 1011 30 , 1005 59 , 667 (
6
1
2 2 2 2
− + + +
09
SQ Tratamento = 555226,28389 – 542207,2509 = 13019,0330.
SQ Total = 113,83
2
+ 133,89
2
+ . . . + 922,59
2
+ 153,77
2
– 542207,25
SQ Total = 570540,3017 - 542207,2509 = 28333,0508.
SQ Erro = 28333,0508 – 13019,0330 = 15314,0178.
iii) Lembrando que as médias colocadas em ordem decrescente
são:
5
y =108,2
1
y = 95,5
2
y = 87,8
3
y = 86,9
4
y = 26,3
E as diferenças entre elas duas a duas:
5
y -
4
y = 81,9 ⇒ n = 5 ∴ ∴compara-se 81,9 com a DMS5 ⇒ 81,9 > 4,65 ∴ ∴
5
y ≠
4
y ;
5
y -
3
y = 21,3 ⇒ n = 4 ∴ ∴compara-se 21,3 com a DMS4 ⇒ 21,3 > 4,33 ∴ ∴
5
y ≠
3
y ;
5
y -
2
y = 20,4 ⇒ n = 3 ∴ ∴compara-se 20,4 com a DMS3 ⇒ 20,4 > 3,88 ∴ ∴
5
y ≠
2
y ;
5
y -
1
y = 12,7 ⇒ n = 2 ∴ ∴compara-se 12,7 com a DMS2 ⇒ 12,7> 3,15 ∴ ∴
5
y ≠
1
y ;
1
y -
4
y = 69,2 ⇒ n = 4 ∴ ∴compara-se 69,2 com a DMS4 ⇒ 69,2 > 4,33 ∴ ∴
1
y ≠
4
y ;
1
y -
3
y = 8,6 ⇒ n = 3 ∴ ∴compara-se 8,6 com a DMS3 ⇒ 8,6 > 3,88 ∴ ∴
1
y ≠
3
y ;
1
y -
2
y = 7,7 ⇒ n = 2 ∴ ∴compara-se 7,7 com a DMS2 ⇒ 7,7 > 3,15 ∴ ∴
1
y ≠
2
y ;
2
y -
4
y = 61,5 ⇒ n = 3 ∴ ∴ compara-se 61,5 com a DMS3 ⇒ 61,5 > 3,88 ∴ ∴
2
y ≠
4
y ;
2
y -
3
y = 0,9 ⇒ n = 2 ∴ ∴compara-se 0,9 com a DMS2 ⇒ 0,9 < 3,15 ∴ ∴
2
y =
3
y ;
3
y -
4
y = 60,6 ⇒ n = 2 ∴ ∴compara-se 60,6 com a DMS2 ⇒ 60,6 > 3,15 ∴ ∴
3
y ≠
4
y .
45 60
v) Coloque letras iguais para médias semelhantes e letras distintas
para médias que diferem entre si e interprete o teste.
5
y =108,2 a
1
y = 95,5 b
2
y = 87,8 c
3
y = 86,9 c
4
y = 26,3 d
4.6) Teste de Scott-Knott
O procedimento de Scott e Knott (1974) utiliza a razão de
verossimilhança para atestar a significância de que os n tratamentos
podem ser divididos em dois grupos que maximizem a soma de
quadrados entre grupos (Ramalho et al., 2000).
Seja por exemplo 3 tratamentos, A, B e C. O processo consiste em
determinar uma partição, em dois grupos, que maximize a soma de
quadrados. Veja que nesse caso são possíveis 2
n-1
grupos, isto é, A
vs B e C, B vs A e C e C vs A e B. Com um número pequeno de
tratamentos como o do exemplo, é fácil obter todos os grupos.
Contudo, quando o número (n) de tratamentos é grande, o número
de grupos cresce exponencialmente, dificultando a aplicação do
teste. Para atenuar esse problema, basta ordenar as médias dos
tratamentos. Nessa situação, o número de partições possíveis
passa a ser obtido por n-1. Uma vez ordenada as médias, procede-
se do seguinte modo, fazendo inicialmente o número de tratamentos
envolvidos no grupo de médias considerado(g) igual ao o número
total de tratamentos (n).
i) Determinar a partição entre dois grupos que maximiza a soma de
quadrados (SQ) entre grupos. Seja T
1
e T
2
os totais
A disposição das repetições de cada tratamento é realizada de
forma totalmente aleatória às parcelas.
5.3.7) Esquema de análise de variância do DIC com fontes de
variação e graus de liberdade
Imagine um experimento com I tratamentos e cada tratamento com
J repetições representado na Tabela a seguir.
Tabela 5. Representação esquemática dos dados de um
delineamento inteiramente casualizado
Rep. \ Trat. 1 2 3 L I
1 y11 y21 y31 L yi1
2 y12 y22 y32 L yi2
3 y13 y23 y33 L yi3
M M M M M M
J y1J y2j y3j L yij
Total T1 T2 T3 L TI ∑ · ∑
· ·
I
1 i
ij
I
1 i
i
y T
Média
1
y
2
y
3
y
L
I
y J . I / y y
J , I
1 j , i
ij
∑ ·
·
Correção (C) J . I / y c
2
J , I
1 j , i
ij

,
`

.
|
∑ ·
·
n n=IJ
59 46
5.3.5) Exemplo de DIC
Suponha que foi avaliado o peso seco da parte aérea (g/parcela) de
4 variedades de cana-de-açúcar. O experimento foi instalado em
casa de vegetação. O delineamento foi o inteiramente casualizado
com 6 repetições. Cada parcela era constituída de 1 vaso com 3
plantas. Os dados de peso estão dispostos na Tabela a seguir:
Tabela 4. Peso seco da parte aérea (g/parcela) de 4 variedades de
cana-de-açúcar (A, B, C e D) em um delineamento inteiramente
casualizado com 6 repetições
Rep. \ Trat. A B C D
1 113,83 174,94 213,39 166,76
2 133,89 168,76 86,69 131,17
3 96,15 156,35 157,65 177,88
4 101,22 144,89 174,44 121,23
5 95,16 181,57 187,00 180,94
6 127,34 178,79 192,70 144,61
Total 667,59 1005,30 1011,87 922,59 3607,35 (total geral)
Média 111,27 167,55 168,65 153,77 150,31 (média geral)
Correção (C) C = (3607,35)
2
/24 = 542207,2509
n n = 4.6 = 24
5.3.6) Croqui de campo
C A B B
D D C A
C A D B
B C B A
C A D B
A C D D
dos dois grupos com k
1
e k
2
tratamentos em cada um, a soma de
quadrados B
o
é estimada por:
2 1
2
2 1
2
2
2
1
2
1
o
k k
) T T (
k
T
k
T
B
+
+
− + ·
∑ ·
·
1
k
1 i
) i ( 1
y T e ∑ ·
+ ·
g
1 k i
) i ( 2
1
y T
em que
) i (
y é a média do tratamento da posição ordenada i.
Os dois grupos deverão ser identificados por meio da inspeção das
somas de quadrados das g-1 partições possíveis, sendo g o número
de tratamentos envolvidos no grupo de médias considerado.
ii) Determinar o valor da estatística λ:
2
o
o
B
.
) 2 ( 2 σ − π
π
· λ
)
em que
2
o
σ
)
é o estimador de máxima verossimilhança de
2
y
σ dado
por:
]
]
]

∑ + −
+
· σ
·
g
1 i
2
y
2
) i (
2
o
s . v ) y y (
v g
1 )
em que v é o grau de liberdade do erro associado a este estimador,
y é a média das médias dos g tratamentos e
r
QME
s
2
y
·
é o
estimador não viesado de
2
y
σ , sendo QME o quadrado médio do
erro e r o número de repetições.
iii) Se
2
)) 2 /( g ; ( − π α
χ ≥ λ rejeita-se a hipótese de que os dois grupos são
idênticos em favor da hipótese alternativa de que os dois grupos
diferem.
2
)) 2 /( g ; ( − π α
χ é um valor tabelado obtido na Tabela de
47 58
Qui-quadrado (encontrada em alguns livros de estatística),
correspondente a combinação entre o nível de significância
estebelecido (α) e o valor dado por g/(π-2) .
iv) No caso de rejeitar esta hipótese, os dois subgrupos formados
serão independentemente submetidos aos passos i) a iii), fazendo
respectivamente g=k
1
e g=k
2
. O processo em cada subgrupo se
encerra ao se aceitar H
o
no passo iii) ou se cada subgrupo contiver
apenas uma média.
Exemplo 18. Agora vamos aplicar o algoritmo do teste de Scott e
Knott nas médias do Exemplo 14 em que o quadrado médio do erro
foi de 4,08 com 10 graus de liberdade, e as médias das 5 linhagens
de feijão estimadas a partir de 3 repetições foram:
4
y =
) 1 (
y = 26,3
3
y =
) 2 (
y = 86,9
2
y =
) 3 (
y = 87,8
1
y =
) 4 (
y = 95,5
5
y =
) 5 (
y = 108,2
lembrando que
) i (
y é a média do tratamento da posição ordenada i,
com i = 1,..., 5.
i) SQ da partição (1) vs (2), (3), (4) e (5)
5
) 2 , 108 5 , 95 8 , 87 9 , 86 3 , 26 (
4
) 2 , 108 5 , 95 8 , 87 9 , 86 (
1
3 , 26
B
2
2 2
o
+ + + +

+ + +
+ ·
B
o
= 691,6900 + 35796,6400 - 32756,4180 = 3731,9120;
alternância das parcelas evita-se uma possível vantagem de algum
tratamento. A instalação do DIC no campo experimental exige uma
certa homogeneidade das condições ambientais (como por exemplo
quanto a fertilidade do solo, distribuição uniforme de água, etc.).
5.3.2) Vantagens
- Possui grande flexibilidade quanto ao número de tratamentos e
repetições, sendo dependente, entretanto, da quantidade de
material e área experimental disponíveis.
- Pode-se ter DIC não balanceado, ou seja, com números de
repetições diferentes entre tratamentos, o que não leva a
grandes alterações n
- a análise de variância; mas os testes de comparações múltiplas
passam a ser aproximados e não mais exatos. O ideal é que os
tratamentos sejam igualmente repetidos.
- Considerando o mesmo número de parcelas e tratamentos
avaliados, é o delineamento que possibilita o maior grau de
liberdade do erro.
5.3.3) Desvantagens
- Exige homogeneidade das condições experimentais. Se as
condições não forem uniformes, como se esperava antes da
instalação do experimento, toda variação (exceto à devida a
tratamentos) irá para o erro, aumentando sua estimativa e
reduzindo, portanto, a precisão do experimento.
5.3.4) Modelo estatístico do DIC
ij i ij
e t ì y + + ·
em que,
ij
y representa a observação do i-ésimo tratamento na j-
ésima repetição; µ representa uma constante geral associada a esta
variável aleatória; t
i
representa o efeito do i-ésimo tratamento; e e
ij
representa o erro experimental associado a observação y
ij
, suposto
ter distribuição normal com média zero e variância comum.
57 48
5.2.4) Homogeneidade: os erros devem apresentar variâncias
comuns (homogeneidade = homocedasticidade de variâncias).
Estas pressuposições visam facilitar a interpretação dos resultados
e testar a significância nos testes de hipóteses. Na prática, o que
pode ocorrer é a validade aproximada e não exata de alguma (s)
destas pressuposições; neste caso, o pesquisador não perderia
tanto com a aproximação visto que os testes aplicados na análise de
variância são robustos quanto a isto. A homogeneidade de
variância é que, na maioria das vezes, é necessária pois, caso não
seja verificada, o teste F e de comparações múltiplas poderão ser
alterados.
Quando alguma (s) das pressuposições da análise não se
verifica(m), existem alternativas que podem ser usadas, entre elas a
transformação de dados com a posterior análise de variância
destes dados transformados; ou a utilização dos recursos da
estatística não paramétrica.
Feitas as considerações iniciais necessárias para o entendimento
dos próximos assuntos, iniciaremos agora os conceitos e exemplos
dos delineamentos mais usuais.
5.3) Delineamento Inteiramente Casualizado (DIC)
5.3.1) Características
- Os tratamentos são distribuídos nas parcelas de forma
inteiramente casual (aleatória).
- O DIC possui apenas os princípios da casualização e da repetição,
não possuindo controle local e, portanto, as repetições não são
organizadas em blocos.
- Normalmente é mais utilizado em experimentos de laboratório;
experimentos em vasos ou bandejas em casa de vegetação, onde
há possibilidade de controle das condições ambientais. Nos
experimentos em casa de vegetação recomenda-se constantemente
mudar as parcelas de posição para evitar diferenças ambientais
devido a posição da parcela na casa de vegetação. Com esta
SQ da partição (1) e (2) vs (3), (4) e (5)
5
) 2 , 108 5 , 95 8 , 87 9 , 86 3 , 26 (
3
) 2 , 108 5 , 95 8 , 87 (
2
) 9 , 86 3 , 26 (
B
2
2 2
o
+ + + +

+ +
+
+
·
B
o
= 6407,1200 + 28324,0833 - 32756,4180 = 1974,7853;
SQ da partição (1), (2) e (3) vs (4) e (5)
5
) 2 , 108 5 , 95 8 , 87 9 , 86 3 , 26 (
2
) 2 , 108 5 , 95 (
3
) 8 , 87 9 , 86 3 , 26 (
B
2
2 2
o
+ + + +

+
+
+ +
·
B
o
= 13467,0000 + 20746,8450 - 32756,4180 = 1457,4270;
SQ da partição (1), (2), (3) e (4) vs (5)
5
) 2 , 108 5 , 95 8 , 87 9 , 86 3 , 26 (
1
2 , 108
4
) 5 , 95 8 , 87 9 , 86 3 , 26 (
B
2
2 2
o
+ + + +
− +
+ + +
·
B
o
= 21978,0625 + 11707,2400 - 32756,4180 = 928,8845.
A partição (1) vs (2), (3), (4) e (5) foi a que maximizou a soma de
quadrados entre grupos (B
o
= 3731,9120).
ii) Considerando g=5, v=10 e
94 , 80
5
2 , 108 5 , 95 8 , 87 9 , 86 3 , 26
y ·
+ + + +
·
tem-se:
]
]
]

+ − + + −
+
· σ
3
08 , 4
. 10 ) 94 , 80 2 , 108 ( ... ) 94 , 80 3 , 26 (
10 5
1
2 2 2
o
)
269,1208 13,6000] 4023,2120 [
15
1
2
o
· + · σ
)
1208 , 269
9120 , 3731
.
) 2 ( 2 − π
π
· λ =19,0806.
49 56
O valor de
2
)) 2 /( 5 ; 05 , 0 ( − π
χ =
2
) 380 , 4 ; 05 , 0 (
χ é 10,089. Como λ > 10,089
rejeita-se H
o
, ou seja dois grupos são formados ao nível de 5%, o
grupo 1 com apenas o tratamento (linhagem) 4=(1) e o grupo 2 com
os tratamentos 3=(2), 2=(3), 1=(4) e 5=(5).
Deve-se então repetir o algoritmo apenas para os subgrupos que
contém mais de um tratamento, no caso apenas para o grupo 2.
i) SQ da partição (2) vs (3), (4) e (5)
4
) 2 , 108 5 , 95 8 , 87 9 , 86 (
3
) 2 , 108 5 , 95 8 , 87 (
1
9 , 86
B
2
2
2
o
+ + +

+ +
+ ·
B
o
= 7551,6100 + 28324,0833 - 35796,6400 = 79,0533;
SQ da partição (2) e (3) vs (4) e (5)
4
) 2 , 108 5 , 95 8 , 87 9 , 86 (
2
) 2 , 108 5 , 95 (
2
) 8 , 87 9 , 86 (
B
2
2
2
o
+ + +

+
+
+
·
B
o
= 15260,0450 + 20746,8450 - 35796,6400 = 210,2500;
SQ da partição (2), (3) e (4) vs (5)
4
) 2 , 108 5 , 95 8 , 87 9 , 86 (
1
2 , 108
3
) 5 , 95 8 , 87 9 , 86 (
B
2
2
2
o
+ + +
− +
+ +
·
B
o
= 24336,0133 + 11707,2400 - 35796,6400 = 246,6133.
A partição (2), (3) e (4) vs (5) foi a que maximizou a soma de
quadrados entre grupos (B
o
= 246,6133).
seria possível realizar testes de hipóteses. O uso de um número
adequado de repetições, possibilita uma boa estimativa do erro
experimental, melhorando as estimativas de interesse. No entanto, o
número de repetições pode ser limitado, por exemplo, pelo número
de tratamentos que serão comparados, pela disponibilidade de
material e de área experimental, entre outros fatores.
5.1.2) Casualização: refere-se à distribuição aleatória dos
tratamentos às parcelas de modo que todas as parcelas tenham a
mesma chance de receber qualquer um dos tratamentos. Com isso,
a casualização evita que determinado tratamento seja favorecido e
garante que os erros sejam independentes (Mead & Curnow, 1983).
Alguns programas computacionais elaboram planilhas de campo já
com os tratamentos aleatorizados, como por exemplo o MSTAT,
SISVAR e outros.
5.1.3) Controle local: a idéia básica do controle local é a partição
do conjunto total de parcelas em subconjuntos (blocos) que sejam
os mais homogêneos possíveis. Para Hinkelmann & Kempthorne
(1994), o princípio do controle local é o reconhecimento de padrões
supostamente associados às parcelas. Este princípio é utilizado
para atenuar problemas de heterogeneidade ambiental (por exemplo
de solo, de distribuição de água no caso de experimentos irrigados,
etc).
5.2) Pressuposições básicas da análise de variância
Para realização de uma análise de variância deve-se aceitar
algumas pressuposições básicas:
5.2.1) Aditividade: os efeitos de tratamentos e erro devem ser
aditivos;
5.2.2) Independência: os erros devem ser independentes, ou seja,
a probabilidade de que o erro de uma observação qualquer tenha
um determinado valor não deve depender dos valores dos outros
erros;
5.2.3) Normalidade: os erros devem ser normalmente distribuídos;
55 50
ii) Teste de Tukey:
2
QME
.
r
1
r
1
q DMS
i' i

,
`

.
|
+ ·
iii) Teste de Duncan:
2
QME
.
r
1
r
1
z DMS
i' i
n

,
`

.
|
+ ·
iv) Teste de SNK:
2
QME
.
r
1
r
1
q SNK
i' i
n

,
`

.
|
+ ·
com r
i
e
' i
r sendo o número de repetições do tratamento i e
'
i ,
respectivamente.
5) Análise de variância
A análise de variância (ANAVA) é um dos métodos para análise dos
dados que visa decompor a variação total entre parcelas em fontes
(causas) de variação devidas a efeitos principais dos fatores, efeitos
de interações entre fatores, efeitos de aninhamento e resíduo (erro).
Para facilitar o entendimento, antes de partirmos para exemplos de
análises de variância, é necessário fazer alguns comentários sobre
os princípios básicos da experimentação e também sobre as
pressuposições da análise de variância.
5.1) Princípios básicos da experimentação
Os delineamentos experimentais clássicos são baseados nos três
conceitos a seguir, estabelecidos por Fisher (1935).
5.1.1) Repetição: refere-se ao número de parcelas que receberão
um mesmo tratamento. Os tratamentos devem ser repetidos,
possibilitando, assim, estimar o erro experimental sem o qual não
ii) Considerando g=4, v=10 e 60 , 94
4
2 , 108 5 , 95 8 , 87 9 , 86
y ·
+ + +
·
tem-se:
]
]
]

+ − + + −
+
· σ
3
08 , 4
. 10 ) 60 , 94 2 , 108 ( ... ) 60 , 94 9 , 86 (
10 4
1
2 2 2
o
)
21,7786 13,6000] 291,3000 [
14
1
2
o
· + · σ
)
7786 , 21
6133 , 246
.
) 2 ( 2 − π
π
· λ =15,5810.
O valor de
2
)) 2 /( 4 ; 05 , 0 ( − π
χ =
2
) 504 , 3 ; 05 , 0 (
χ é 10,253. Como λ > 10,253
rejeita-se H
o
, ou seja dois grupos são formados ao nível de 5%, o
grupo 1 com os tratamentos (linhagens) 3=(2), 2=(3) e 1=(4) e o
grupo 2 com apenas o tratamento 5=(5).
Deve-se então repetir o algoritmo apenas para o grupo 1.
i) SQ da partição (2) vs (3) e (4)
3
) 5 , 95 8 , 87 9 , 86 (
2
) 5 , 95 8 , 87 (
1
9 , 86
B
2
2
2
o
+ +

+
+ ·
B
o
= 7551,6100 + 16799,4500 – 24336,0133 = 15,0417;
SQ da partição (2) e (3) vs (4)
3
) 5 , 95 8 , 87 9 , 86 (
1
5 , 95
2
) 8 , 87 9 , 86 (
B
2
2
2
o
+ +
− +
+
·
B
o
= 15260,0450 + 9120,2500 – 24336,0133 = 44,2817;
A partição (2) e (3) vs (4) foi a que maximizou a soma de quadrados
entre grupos (B
o
= 44,2817).
51 54
ii) Considerando g=3, v=10 e ,07 90
3
5 , 95 8 , 87 9 , 86
y ·
+ +
· tem-se:
]
]
]

+ − + − + −
+
· σ
3
08 , 4
. 10 ) 07 , 90 5 , 95 ( ) 07 , 90 8 , 87 ( ) 07 , 90 9 , 86 (
10 3
1
2 2 2 2
o
)
,4836 4 13,6000] 6867 , 44 [
13
1
2
o
· + · σ
)
4836 , 4
2817 , 44
.
) 2 ( 2 − π
π
· λ = 13,5896.
O valor de
2
)) 2 /( 3 ; 05 , 0 ( − π
χ =
2
) 628 , 2 ; 05 , 0 (
χ é 7,136. Como λ > 7,136 rejeita-
se H
o
, ou seja dois grupos são formados ao nível de 5%, o grupo 1
com os tratamentos (linhagens) 3=(2), 2=(3) e o grupo 2 com
apenas o tratamento e 1=(4).
Deve-se então repetir novamente o algoritmo para o grupo 1.
i) SQ da partição (2) vs (3)
2
) 8 , 87 9 , 86 (
1
8 , 87
1
9 , 86
B
2
2
2
o
+
− + ·
B
o
= 7551,6100 + 7708,8400 – 15260,0450 = 0,4050;
Neste caso, a partição (2) vs (3) por ser única foi a que maximizou a
soma de quadrados entre grupos (B
o
= 0,4050).
ii) Considerando g=2, v=10 e ,35 87
2
8 , 87 9 , 86
y ·
+
· tem-se:
]
]
]

+ − + −
+
· σ
3
08 , 4
. 10 ) 35 , 87 8 , 87 ( ) 35 , 87 9 , 86 (
10 2
1
2 2 2
o
)
,1671 1 13,6000] 4050 , 0 [
12
1
2
o
· + · σ
)
1671 , 1
4050 , 0
.
) 2 ( 2 − π
π
· λ = 0,4775.
O valor de
2
)) 2 /( 2 ; 05 , 0 ( − π
χ =
2
) 752 , 1 ; 05 , 0 (
χ é 5,458. Como λ < 5,458 aceita-
se H
o
, ou seja, os dois grupos são idênticos ao nível de 5%,
formando um único grupo com os tratamentos (linhagens) 3=(2) e
2=(3), finalizando assim o algoritmo.
Colocando letras diferentes para médias distintas e letras iguais
para médias semelhantes por meio do teste Scott e Knott tem-se
então:
4
y =
) 1 (
y = 26,3 d
3
y =
) 2 (
y = 86,9 c
2
y =
) 3 (
y = 87,8 c
1
y =
) 4 (
y = 95,5 b
5
y =
) 5 (
y = 108,2 a
Observações: Nestes exemplos os resultados de todos os testes
realizados foram iguais mas poderiam ter diferenciado entre um ou
outro teste. Quando o número de repetições é diferente entre os
tratamentos as DMS’s podem ser calculadas por:
i) Teste t:
.QME
r
1
r
1
t DMS
i' i
t

,
`

.
|
+ ·
53 52

República Federativa do Brasil Luiz Inácio Lula da Silva Presidente Ministério da Agricultura, Pecuária e Abastecimento Roberto Rodrigues Ministro Empresa Brasileira de Pesquisa Agropecuária - Embrapa Conselho de Administração José Amauri Dimárzio Presidente Clayton Campanhola Vice-Presidente Alexandre Kalil Pires Dietrich Gerhard Quast Sérgio Fausto Urbano Campos Ribeiral Membros Diretoria Executiva da Embrapa Clayton Campanhola Diretor Presidente Gustavo Kauark Chianca Herbert Cavalcante de Lima Mariza Marilena T. Luz Barbosa Diretores Executivos Embrapa Agrobiologia José Ivo Baldani Chefe Geral Eduardo Francia Carneiro Campello Chefe Adjunto de Pesquisa e Desenvolvimento Rosângela Straliotto Chefe Adjunto Administrativo

ISSN 1517-8498 Novembro/2003
Empresa Brasileira de Pesquisa Agropecuária Centro Nacional de Pesquisa em Agrobiologia Ministério da Agricultura, Pecuária e Abastecimento

Documentos 163
Técnicas Experimentais aplicadas às Ciências Agrárias

Janaína Ribeiro Costa

Seropédica – RJ 2003

Exemplares desta publicação podem ser adquiridas na: Embrapa Agrobiologia BR465 – km 7 Caixa Postal 74505 23851-970 – Seropédica/RJ, Brasil Telefone: (0xx21) 2682-1500 Fax: (0xx21) 2682-1230 Home page: www.cnpab.embrapa.br e-mail: sac@cnpab.embrapa.br
Comitê Local de Publicações: Eduardo F. C. Campello (Presidente) José Guilherme Marinho Guerra Maria Cristina Prata Neves Verônica Massena Reis Robert Michael Boddey Maria Elizabeth Fernandes Correia Dorimar dos Santos Felix (Bibliotecária)

Expediente: Revisor e/ou ad hoc: Guilherme Montandon Chaer Normalização Bibliográfica: Dorimar dos Santos Félix Editoração eletrônica: Marta Maria Gonçalves Bahia 1ª impressão (2003): 50 exemplares

COSTA, J. R. Técnicas experimentais aplicadas às ciências agrárias. Seropédica: Embrapa Agrobiologia, 2003. 102 p. (Embrapa Agrobiologia. Documentos, 163). ISSN 1517-8498 1. Agricultura. 2. Ciência agrária. I. Embrapa. Centro Nacional de Pesquisa de Agrobiologia (Seropédica, RJ). II. Título. III. Série.

CDD 630
© Embrapa 2003

6. Referências Bibliográficas
BANZATTO, A. D.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 1989. 249 p. BEARZOTI, E.; OLIVEIRA, M. S. Estatística básica. Lavras: UFLA, 1997. 191 p. FISHER, R. A. The design of experiments. Edinburgh: Oliver and Boyd, 1935. HINKELMANN, K.; KEMPTHORNE, O. Design and analysis of experiments. New York: J. Wiley, 1994. 631 p. MEAD, R.; CURNOW, R. N. Statistical methods in agriculture and experimental biology. New York: Chapman and Hall, 1983. 335 p. NOGUEIRA, M. C. S. Estatística experimental aplicada à experimentação agrícola. Piracicaba: USP-ESALQ, 1997. 250 p. PIMENTEL GOMES, F. Curso de estatística experimental. 13. ed. Piracicaba: Nobel/USP-ESALQ, 1990. 468 p. RAMALHO, M. A.; FERREIRA, D. F.; OLIVEIRA, A. C. de. A experimentação em genética e melhoramento de plantas. Lavras: UFLA, 2000. 326 p. STEEL, R. G. D.; TORRIE, J. H.; DICKEY, D. A. Principles and procedures of statistics. 3. ed. New York: McGraw-Hill, 1997. 666 p.

Autor

Janaína Ribeiro Costa
Pesquisadora da Embrapa Agrobiologia. E-mail: janaina@cnpab.embrapa.br

102

derivar esta equação e igualar a zero: ˆ y i = 8. ˆ Substituindo Xi = 95 na equação de y i obtém-se a produção máxima de milho: ˆ y i = 8. se â 2 for positivo.8421 + 0.7.00100X i dX i ˆ dy i =0 dX i Xi = ⇒ 0 + 0.(95) 2 ˆ yi = 13.00100X i = 0 0. Se â 2 é negativo.00100 uma produção máxima).0950 = 95 kg/ha (Dose de adubo nitrogenado que levará a 0.8421 + 0.0950 − 0.0950 − 0. y terá um máximo.00050.(95) − 0. produção).Obtenção da produção máxima de milho (ton/ha) Aqui cabe esclarecer que o sinal da estimativa do coeficiente â 2 determina se a variável dependente y (no exemplo.00050.(95) 2 ˆ y i = 8.(95) − 0.00050X i2 ˆ dy i = 0 + 0.0950.8421 + 0.3.1). y terá um mínimo. ou seja.0950.3546 ton/ha (produção máxima de milho para dose de adubo nitrogenado de 95 kg/ha). No exemplo 5. caso contrário. 101 . terá um valor máximo ou mínimo.0950X i − 0. para obtenção da produção máxima de milho é necessário antes maximizar a função de regressão polinomial quadrática.

A agricultura sustentável.42.5 + (−1). disponibilizando.5 + (1). constituem a base sobre a qual a agricultura agroecológica se sustenta. de forma objetiva e prática.8421 11.4523 3.2 = = 1. principalmente estudantes e profissionais recém ingressados na área.27.5 + (-1).y i 3∑ P (X i ) i =1 2 1 5 5 = (−2).5 42.2421 12.0 37.6 37. efetivados por microrganismos e pequenos invertebrados.37.19.5 32. O enfoque agroecológico do empreendimento agrícola se orienta para o uso responsável dos recursos naturais (solo. produtiva e ambientalmente equilibrada apoia-se em práticas conservacionistas de preparo do solo.0 + (0).8 100 ˆ yi 8.ˆ b1 = i =1 ∑ P1 (X i ).0950X i − 0.0400 i − 2  − 0. existem poucas publicações sobre o referido tema e este documento serve de roteiro para orientar aspectos básicos do planejamento da experimentação de campo e análise dos resultados obtidos. a Embrapa Agrobiologia orienta sua programação de P&D para o avanço de conhecimento e desenvolvimento de soluções tecnológicas para uma agricultura sustentável.5 + (−1). rotações de culturas e consórcios.8267 + 1. bem como no emprego eficiente dos recursos naturais.8 31.37.(10) 3.37.4523 i − 2  − 2 y  30     30   Resolvendo a equação acima tem-se: ˆ y i = 8.7421 13.32. Infere-se daí que os processos biológicos que ocorrem no sistema solo/planta.00050X 2 i (Equação da Regressão Quadrática) ˆ ˆ ˆ ˆ y = â +â X − â X2 i o 1 i 2 i ˆ Os valores observados (yi) e estimados (y i ) para cada dose de adubo nitrogenado estão apresentados a seguir: Xi 0 30 60 90 120 yi 27.8 . flora.0 = = −0. ˆ b2 = i =1 ∑ P2 (X i ).32. rentáveis e socialmente justos.3421 13. energia e minerais).[(2) 2 + (−1) 2 + (-2) 2 + (-1) 2 + (2) 2 ] 3. fauna. no uso de adubação verde e de controle biológico de pragas.37.8421 + 0. água.(14) Lembrando que: P1(Xi) = x i = 2 i X i − 60 X i = −2 30 30 2 n 2 −1  Xi  P2(Xi) = x − = − 2 − 2 12  30  Portanto: ˆ ˆ ˆ ˆ y i = b 0 + b1 P1 (X1 ) + b 2 P2 (X1 ) 2   X X   ˆ i = 11. conceitos de estatística aplicados à experimentação em Ciências Agrárias.[(-2)2 + (−1) 2 + (0) 2 + (1) 2 + (2) 2 ] Apresentação A preocupação crescente da sociedade com a preservação e a conservação ambiental tem resultado na busca pelo setor produtivo de tecnologias para a implantação de sistemas de produção agrícola com enfoque ecológicos. Na verdade.0 + (-2).42.6 + (2).y i 3∑ P (X i ) i =1 2 2 5 5 = (2).0400 3. O documento 163/2003 atende uma demanda daqueles que atuam na pesquisa agropecuária.27.6 + (2). Dentro desse cenário.0421 .

.. indicando que o desvio foi não significativo....................................5952 4...................................................... considerar a equação de regressão significativa de maior grau.....................................5) Experimentos fatoriais .......................... O coeficiente de determinação (R2) para a regressão linear e quadrática foram respectivamente: R 2 (Linear) = 32....3) Delineamento Inteiramente Casualizado (DIC) .. 4) Testes de comparações múltiplas ............................................ deve-se... 2............5952 ........ 4........................................................................6% ......122 37............ deve-se observar o valor de Prob>F do Desvio.......7) Análise de regressão. 4........... 2.3160 R 2 (Quadrática) = Apesar do R2 da regressão quadrática ter sido baixo (19%)............................... no caso.......................................... portanto............4) Delineamento em Blocos Casualizados (DBC) ........... 2...........................................................................................................SUMÁRIO 1) 2) Noções básicas de experimentação agrícola ............ 3) Estatísticas descritivas .........................................2) Teste t de Student ...2) Pressuposições básicas da análise de variância ............................................................1) Definição....... 3............ 5............475 Prob>F 0................... 4.. 5...............................1364 0.......................................................................0% ......................3160 32................... 3.......1340 Número de observações: 15 Observa-se no quadro anterior que tanto a regressão linear quanto a quadrática foram significativas ao nível de significância estabelecido de 5% (Prob<0............................ 45.6) Experimentos em parcelas subdivididas......................4480 8...........................5952 2.. 5.........6333 QM 11.......................8267 15 99 .......................586 9.......................4480 .........................................5) Teste de SNK (Student Newman Keuls)......... 5..2728 8.....3) Natureza da distribuição .............................................................. 45..................................3290 32..................................................4 = 11.........................................................................................................1) Medidas de posição..........3) Teste de Tukey ................. Se este valor for maior que 0.................... 5) Análise de variância............ 3.................3) Medidas de assimetria e curtose........ 6) Referências Bibliográficas......................4) Teste de Duncan.....................................2) Medidas de dispersão.86 11.....05.05).......................................................................... 5................................... 4................................. 4...................................................................3160 8..................................................8633 F 13.....................................................100 = 19...... Distribuição de freqüências........................83 SQ 45.....................................................0005 0......................4480 8..100 = 71........................... 5................0000 0..1) Princípios básicos da experimentação .........956 2......................2) Freqüência. 4.................... 5.............. a quadrática: ˆ ˆ ˆ ˆ ˆ ˆ ˆ y i = β 0 + β1 X + β 2 X 2 = b 0 + b1 P1 (X 1 ) + b 2 P2 (X 1 ) em que: 5 ˆ bo = y = i =1 ∑ yi 3x 5 = 177................................ 7 10 10 10 19 20 20 23 27 29 29 33 39 41 43 46 54 54 55 56 61 66 74 87 102 FV (Doses) Regressão Linear Regressão Quadrática Desvio Erro Total CV (%) = Média geral: GL 4 1 1 2 10 14 7..............0100 0...................6) Teste de Scott-Knott.................................1) Contrastes ortogonais de médias.......

37.8] = 973.4480 – 8.y   2 i i  i =1  2 5 SQRegressão 2 (Quadrática) = 3∑ P22 (X i ) i =1 5 = [(2).5 + (-1).2728 O quadro de análise de variância com o desdobramento dos graus de liberdade da fonte de variação ‘doses’ em graus de liberdade devido a regressão polinomial está apresentado a seguir.8 177.0 + 2(0).5 42.[(-2) + ( −1) + (0) + (1) + (2) ] 5  ∑ P (X ).5 + (1). Suponha que se deseja estudar qual estirpe de bactéria diazotrófica endofítica (considerando. recomendável uma consulta a um estatístico antes da instalação do experimento. 98 .37.4480 2 2 2 2 3. No exemplo. Ho seria: não existem diferenças significativas entre os efeitos das estirpes (ou seja. Ho poderá ser aceita ou rejeitada.3160 – 32.32. Fisher propôs o uso da análise de variância (ANAVA) como ferramenta para análise e interpretação de dados. por exemplo.42.5952 = 4. Ela foi proposta inicialmente na área de ciências biológicas por Ronald A. coleta e análise dos dados experimentais e interpretação dos resultados obtidos.0 37.(10) 3.6 + (2). três estirpes diferentes) proporcionará maior peso da parte área de cana-de-açúcar. englobando etapas como o planejamento.0 + (-2).5 + (−1).44 = 32. A fase de planejamento do experimento merece considerável atenção por parte do pesquisador pois dela dependerá o sucesso da análise e interpretação dos resultados sendo. Fisher em 1919.(14) SQDesvio = SQ Doses – SQRegressão 1 – SQRegressão 2 = 45.y   1 i i  i =1  2 3∑ P12 (X i ) i =1 2 = [(−2).32. portanto. O planejamento envolve etapas como: a) Formulação de hipóteses A hipótese estatística formulada é denominada hipótese de nulidade e é simbolizada por Ho.42.5952 2 2 2 2 2 3.37.6 + (2).6 37. Noções básicas de experimentação agrícola A Estatística Experimental é a ciência que tem como objetivo estudar experimentos (ensaios).27. caso seja rejeitada. A ANAVA permite a decomposição do grau de liberdade e da soma de quadrados total em somas de quadrados correspondentes às fontes de variação previamente definidas no planejamento do experimento.27.5 + ( −1). execução.4 P1(Xi) -2 -1 0 +1 +2 P2(Xi) +2 -1 -2 -1 +2 Técnicas Experimentais aplicadas às Ciências Agrárias Janaína Ribeiro Costa 1.5 32.[(2) + ( −1) + (-2) + (-1) + (2) ] 3.37.8] 2 361 = = 8. qualquer diferença observada é devida a fatores não controlados). aceitaremos uma 07 As somas de quadrados (SQ’s) da regressão linear e quadrática são dadas por: SQRegressão 1(Linear) = 5  ∑ P (X ).Para cada nível de X tem-se então: Níveis 1 2 3 4 5 Total Dose de adubo 0 30 60 90 120 Totais yi (das 3 repetições) 27.

origem de solos (MG. Por exemplo: nome de variedades de cana de açúcar (SP701143 e SP813250). 200 µg/ml). q 30 5. Suponha que se deseja estudar o efeito de 2 variedades de cana de açúcar e 3 doses de nitrogênio. uma parcela poderá ser constituída por uma ou várias plantas. c) Escolha da parcela (unidade experimental) Parcela é a unidade experimental que receberá o tratamento.... b. se o interesse for planejar um experimento para se estudar o efeito de 6 tipos diferentes de rotações de cultura. BA. um vaso contendo uma ou mais plantas. uma placa de Petri com 08 tem-se que P1(Xi) = xi. . 2. em que se tem dois fatores (variedade e dose de nitrogênio). Por exemplo: dose de nitrogênio (0. b) Escolha dos fatores e seus respectivos níveis Fatores (ou tratamentos) são aqueles que o pesquisador tem interesse em estudar o seu efeito sobre as variáveis respostas.2) Quantitativo: quando os níveis do fator são mensurações de valores reais. Por exemplo. neste caso se trata de um experimento em fatorial 2x3. . 50. concentrações de antibiótico (25. SP). o fator em estudo é rotação e os níveis deste fator são os 6 tipos de rotação. RJ. Em alguns casos. Sebach). etc. 5. P1 (X1 = 0) = 0 − 60 = −2 30 30 − 60 = −1 30 60 − 60 =0 30 90 − 60 = +1 30 120 − 60 = +2 30 n2 −1 52 −1 = [P1 (X i )] 2 _ = [P1 (X i )] 2 − 2 12 12 P1 (X 2 = 30) = P1 (X 3 = 60) = P1 (X 4 = 90) = P1 (X 5 = 120) = e tem-se que P2(Xi) = x i2 − com i =1. simbolizada por H1 que no exemplo seria: os efeitos das estirpes diferem significativamente entre si (ou as estirpes se comportam de modo diferente quanto ao peso da parte aérea).hipótese denominada alternativa. 2 níveis do fator variedade e 3 níveis do fator dose de nitrogênio. Por exemplo. Portanto. A parcela pode assumir diferentes formas e tamanhos.. 2. 97 . P2 (X1 = 0) = (−2) 2 − 2 = +2 P2 (X 2 = 30) = (−1) 2 − 2 = −1 P2 (X 3 = 60) = (0) 2 − 2 = −2 P2 (X 4 = 90) = (+1) 2 − 2 = −1 P2 (X 5 = 120) = (+2) 2 − 2 = +2 . etc. Normalmente os níveis são valores numéricos acompanhados de uma unidade de medida. como por exemplo nos experimentos fatoriais ou em parcelas subdivididas. 25 e 50 Kg/ha). atributos. 100. em que x i = X i − X = X i − 60 com i =1.. Smalla. As subdivisões de um fator são os níveis dos mesmos. dois ou mais fatores são estudados.1) Qualitativo: quando os níveis do fator são categorias. Portanto. métodos de extração de DNA (Cullen. Um fator pode ser classificado em: b..

altura de plantas de milho. semelhantemente aos fatores (tratamentos). blocos aumentados.0005 determinado meio de cultura. média. H1: b2 ≠ 0. i =1.3160 8.1. As hipóteses testadas no modelo de regressão adotado são: i) Ho: b1 = 0 ii) Ho: b2 = 0 vs vs H1: b1 ≠ 0. Para obtenção das somas de quadrados das regressões linear e quadrática é necessário antes calcular os coeficientes dos polinômios P1(Xi) e P2(Xi). o delineamento em quadrados latinos (DQL). Por exemplo: número de 09 Rejeita-se Ho. Considerando o modelo de regressão polinomial de 2O grau a seguir. argiloso.1) Qualitativa e.1) Discretas: quando são contagens de números inteiros positivos com uma ordenação natural. Por exemplo: cor dos grãos do feijoeiro (marrom. etc. 2. preto. n i =1 5 q = 30 (correspondendo a 30-0 ou 60-30 ou 90-60 ou 120-90) 96 .6333 QM 11. textura do solo (arenoso. d) Escolha do delineamento experimental Delineamento experimental é o plano de distribuição dos tratamentos na área experimental. os látices. pH. Mg e P em amostras de solo. o delineamento em blocos casualizados (DBC). etc.3.122 Prob>F 0.3290 0.05). em: e. os delineamentos em blocos incompletos (por exemplo. nota para o ataque de cercosporiose em cana-de-açúcar (escala de 1. para ausência da doença. sem uma ordenação natural. concluindo-se pela existência do efeito de doses crescentes de adubo nitrogenado sobre a produção do milho (Prob < 0.8633 F 13. foi realizada a análise de regressão: y i = â o + â 1 X i + â 2 X i2 + å i reescrevendo este modelo pela expressão alternativa: yi = bo + b1P1(Xi) + b2P2(Xi) + εi . . até 9. Os dados (observações) são realizações de uma variável e serão analisados para verificar se há diferença entre os níveis dos fatores (tratamentos). etc. etc. Seja: X= 1 n 1 ∑ X i = (0 + 30 + 60 + 90 + 120) = 60 . para o máximo de doença).2) Ordinal: quando são atributos com uma ordenação natural. um animal.A análise de variância para os dados do exemplo 5. Por exemplo: suscetibilidade do cafeeiro à ferrugem (alta.2) Quantitativa e. teor de Ca.7..). atributos.5. uma área com várias plantas..2. branco). Como exemplo de delineamentos tem-se o delineamento inteiramente casualizado (DIC). Uma variável também pode ser classificada. e. silte).1.1) Nominal: quando são categorias. etc.1) é: FV Doses Erro Total GL 4 10 14 SQ 45. Assim. exemplos de variáveis são: produção de grãos de feijão. e) Escolha das variáveis a serem analisadas Variáveis respostas ou variáveis dependentes ou simplesmente variáveis são características obtidas em cada parcela. número de plantas de cana-de-açúcar atacadas por cercosporiose.. baixa). e.

.8 12. σ2) e independentes.3.2) Freqüência É uma medida que quantifica a ocorrência dos valores de uma variável.. número de plantas atacadas com a broca do fruto do cafeeiro (ex. fp (%) = fr..7. 3. matéria orgânica. com três repetições para testar o efeito de 5 doses de adubo nitrogenado (0.chuvas em 2002 superior a 80 mm/h (ex..5 90 12.1) Definição Consiste em uma função que associa os valores que uma variável assume com suas freqüências de ocorrência.8 11.2.5 10. Mg. Ca.9 42.6 120 13.2. 2. 200 plantas). As hipóteses testadas na análise de variância são: Ho: d1 = d2 = . peso (98.1) Exemplo de análise de regressão em dados com repetição: modelos de regressão polinomial Um experimento foi instalado conforme o delineamento inteiramente casualizado. 2. número de minhocas encontradas em determinada amostra de solo (ex. e.5 m).5 g).. 60. 10 95 . 50 minhocas).100 .0 11.. normalmente existe uma unidade de medida acompanhando a variável.6 15. renda (R$2050.1) Freqüência absoluta (fa) é o número de observações ocorridos em cada classe da variável estudada.5 32. altura (2. podendo ser elas absolutas. n H1: pelo menos um di difere de 0. 2.3 37. . = dn = 0 . 2.0 60 12. 5 e j = 1.5 12. associada a 1 grau de liberdade.5 30 10.100 . SQTratamen to 5.7 12.2.5 9.4 27.2. K. teor de P.0 kg/ha).5). 20 chuvas). relativas ou porcentuais..2) Freqüência relativa (fr) é dada pela divisão da fa pelo número total (n) de dados ou observações: fr = fa .2) Contínuas: quando são mensurações de valores reais. diâmetro (8.y   k i i  .8 2) Distribuição de freqüências 2.18 cm).2 37. 0 ≤ R ≤ 100.. pH (5. i=1.1 14. 2. 2. di é a i-ésima dose de adubo nitrogenado e εij é o erro experimental associado a yij com εi ∩ N (0. f) Análise dos dados obtidos com o experimento.. SQRegressão k =  i =1 n 2 r ∑ Pk (X i ) i =1 2 O coeficiente de determinação (R2) em experimentos com repetição é dado por: SQ Re gressão k 2 R 2 (%) = .3) Freqüência porcentual (fp) é dada pela multiplicação de fr por 100: em que yij é o valor observado referente a i-ésima dose de adubo nitrogenado na j-ésima repetição.6 9. i =1. Por exemplo: produtividade (100. 30. n O modelo do exemplo anterior adotado foi: y ij = µ + d i + ε ij . etc. 2. Os resultados obtidos em ton/ha de milho são: Rep\Doses 1 2 3 Total 0 8. 90 e 120 kg/ha). n  ∑ P (X ).73/mês).

X= 1 n ∑ X i é a média dos níveis de X.0 q é amplitude entre dois níveis consecutivos de X. atividade agrícola. yi é o total do nível i da variável dependente (y). a) Representação tabular: Tabela 1.3500 0. 18 1008 Xi são os níveis da variável independente.x i .0 20. 2 3n 2 − 7 . podendo ser feita por meio de representação tabular ou gráfica. 11 .0000 fp (%) 35. n é o número de níveis da variável independente (X).0 10. Fonte: Apostila de Estatística Básica (Bearzoti & Oliveira.0 10. Pk(Xi) são os coeficientes do polinômio ortogonal de grau k associado ao nível do fator. 12 P3(Xi) = x 3 − i P4(Xi) = x i4 − P5(Xi) = x 5 − i em que.x i + 14 560 5(n 2 − 7) 3 15n 4 − 230n 2 + 407 . Milho Soja Leite Milho Milho Soja Soja Cana-de-açúcar Leite Laranja Olericultura Milho Trigo Soja Milho Leite Milho Milho Trigo Olericultura 3n − 13 2 3(n − 1)(n − 9) . n i =1 A variável em estudo.y i r ∑ Pk2 (X i ) i =1 n n . é dada por: 94 i =1 ∑ Pk (X i ).0500 0.0500 1.1500 0. é classificada como qualitativa nominal. A hipótese de nulidade é Ho: bk = 0 e a hipótese alternativa é H1: bk ≠ 0. 20 2 2 Exemplo 1.0 5.1000 0. Uma maneira mais informativa de descrever o conjunto de dados do Exemplo 1 é através da distribuição de freqüências das categorias desta variável.2000 0. . 1997).0 5. é dado por: ˆ bk = em que. na análise de variância.1000 0.0 15.0 100.2 P2(Xi) = x i2 − n − 1 . Distribuição de freqüência das atividades agrícolas de 20 propriedades rurais do município de Vida Alegre Atividade predominante Milho Soja Leite Trigo Olericultura Cana-de-açúcar Laranja Total fa 7 4 3 2 2 1 1 20 fr 0.x i + xi . r é o número de repetições. O estimador de quadrados mínimos de bk. A soma de quadrados da regressão de grau k. No quadro a seguir está disposta a atividade agrícola predominante em cada uma das 20 propriedades rurais do município Vida Alegre.

εi ∩ N(0. X1=X1.+ bpPp(Xi) + εi com i = 1. ii) ∑ Pk (X i ) = 0 . 0. βn são parâmetros da regressão a serem estimados. b0. para uma única variável independente é representado por y i = â o + â 1 X i + â 2 X i2 + â 3 X 3 + . Considerando n pares de dados (y1. σ2) independentes. La ra nj a M ilh o Le ite So ja Tr iv) ∑ Pk2 (X i ) ≠ 0 . 2.. 2. (yn..4 0.PK' (X i ) = 0 para k ≠ k . X1)... i =1 Os valores de Pk(Xi) (k =1. os gráficos mais utilizados são: • Gráfico de linhas: possui dois eixos.. i =1 n ' iii) ∑ Pk (X i ).. o modelo em (i) pode ser reescrito como: Yi= bo + b1P1(Xi) + b2P2(Xi) + . . em que x i = Xi − X .. . X2=X1+q. i =1 n n Atividade Figura 1. como é o caso do Exemplo 1. q 12 93 . Xn) em que n>p e que os níveis referentes a variável X são todos eqüidistantes. 2.. p que deve atender às seguintes restrições: i) P0(Xi)=1.. .1 0 fr Análise de regressão em dados com repetição: modelos de regressão polinomial O modelo de regressão polinomial de grau p.. Xn=Xn-1+q.2 0. β0..b) Representação gráfica: Gráfico é uma figura para ilustração de fenômenos ou tendências onde existem escalas definidas.... ig o O le ric ... εi ∩ N(0. X2)... Para a representação gráfica de variáveis qualitativas. n .3 0.. . b1.. Gráfico de linhas representando a distribuição de freqüência relativa referente à atividade agrícola predominante em propriedades do município de Vida Alegre. bn são parâmetros da regressão a serem estimados e Pk(Xi) sendo um polinômio ortogonal de ordem k = 1.. com fa ou fr ou fp disposta no eixo vertical e as classes (categorias) da variável dispostas no eixo horizontal. (y2. . quando os níveis da variável X são eqüidistantes. 2.. n .. .. X3=X2+q .. . + â p X ip + å i i (i) com i = 1.. C an a.p)... β1. podem ser obtidos através das seguintes expressões: P1(Xi) = xi . . σ2) independentes.... ou seja. .

388 1.139) − 10 + 15 + .386 1.153 1.393 1.014 0.094 12.080 -0.1104 . com a diferença que são usadas barras (colunas) ao invés de linhas.0073).240 1.1255 2 Atividade ˆ y i = 1.029 -0.. 13 O le ric .044 0.15.5000 2062..0073 (estimativa de b1).1 0 fr (325)2 − 10 Tr ig o 12.. tem-se a regra de três para as freqüências porcentuais dada por: 100% 35% ______ ______ 1..5000 .010 0.7525 . 0.(1.4950 − 0. Figura 2.100 = 90% 0. Gráfico de barras verticais representando a distribuição de freqüência relativa referente à atividade agrícola predominante em propriedades do município de Vida Alegre.203 1.388) + 15.0875 ˆ b1 = = = -0.14 1.2577 + 0.  = 1.. Xi 10 15 20 25 30 35 40 45 50 55 Total Média yi (valores observados) 1.2 0.577  325  ˆ bo = − (−0. 2062. Por exemplo. No quadro a seguir para cada valor de Xi tem-se o valor observado.3 0.034 0.276 1.ˆ ˆ ˆ y i = b o + b1X i em que ˆ b1 = 10.313 1.045 0 0 Setograma (gráfico circular ou gráfico de setores): gráfico circular no qual os setores correspondem as categorias com áreas proporcionais as freqüências de cada classe.(1.577 1.341 1..4 0. por meio de uma regra de três. Para construção do setograma é necessário obter o ângulo referente ao setor de cada categoria.16 1.2373 = 1. + 55.y i ˆ -0.016 -0.040 0.0073X i .(1.130 1.2577 92 x = 126 o. 10  10  O modelo de regressão ajustado (estimado) é: O R foi de: R2 = 0.(12.577 ) 10 Gráfico de barras ou colunas: semelhantes aos gráficos de linhas. + 55 2 2 2 • (325). C an a. o estimado e o desvio correspondente.139 12. para a atividade milho do Exemplo 1. E assim por diante são calculados os outros ângulos correspondentes aos setores das outras categorias que serão traçados no gráfico.577 1.6650 − 408. • indicando que 90% da variação na densidade do solo é explicada pelo modelo de regressão utilizado.2577 ˆ y i (valores estimados) yi .426) + . .422 1.426 1.4950 (estimativa de bo). 360 o X La ra nj a M ilh o Le ite So ja 393..167 1.349 1.26 1.026 -0.177 1.

1255 SQDesvios = 0.577) 10 SQTotal = 15.2500 0.32.0 12.Laranja Cana Olericultura Trigo Leite Milho H1: b1 ≠ 0. 1 4 3 5 1 2 1 0 3 4 2 0 5 4 1 4 SQTotal = 1.5 100. O quadro seguinte apresenta o número de lagartas rosca encontradas em cada um dos 16 canteiros de um viveiro de mudas de eucalipto. o pesquisador poderá rejeitar Ho e aceitar H1. No exemplo. com os valores inteiros que a variável assume podendo ser considerados como “categorias” ou “classes naturais”. SQRegressão = [393.(12.426 2 + ..0151 0.0 Da Tabela de F tem-se que F(0.0151 O Quadro de análise de variância resultante é: FV Regressão Desvios Total GL 1 8 9 SQ 0.1255 QM 0..05. 14 91 .1104 0.. + 55..5 12. a) Representação tabular: Tabela 2. 1. Atualmente.1255 – 0.1250 0.(1.5000 = (-15.1104 0.32 e como 58.139 2 − (12.8181 = 0. ou seja. conclui-se então que as densidades (g/cm3) em diferentes profundidades X (cm) podem ser explicadas por meio do seguinte modelo de regressão linear: Fonte: Notas de aula. não havendo a necessidade de procurar o valor de F em Tabela. significa que o teste F foi significativo.5 25.426) + .577)   10. como no caso do Exemplo 1.2500 0.1250 0.105 > 5.1250 1.1250 0.(1. + 55 − 10 2 Soja Figura 3. + 1.9436 – 15.1104 2062.139) −  SQRegressão =  10   (325)2 2 2 2 10 + 15 + . rejeita-se Ho ao nível de 5% de significância.0875) 2 = 0. A distribuição de freqüências para variáveis quantitativas discretas são semelhantes à das variáveis qualitativas. os programas computacionais apresentam uma coluna a mais no quadro de análise de variância correspondente a Prob>F. Distribuição de freqüência do número de lagartas rosca em canteiros de um viveiro de eucalipto No de lagartas rosca 0 1 2 3 4 5 Total fa 2 4 2 2 4 2 16 fr 0.(1.0019 F 58...0 12.05.7525]2 2062.5 25. As somas de quadrados para o exemplo anterior foram: (325).1104 = 0.388) + 15.5000 2 Exemplo 2.6650 − 408.0000 fp (%) 12. Quando Prob>F for menor que 0.388 2 + 1. 8) é 5.105 Prob>F 0. Setograma representando a distribuição de freqüência relativa referente à atividade agrícola predominante em propriedades do município de Vida Alegre.0001 A variável número de lagartas rosca é classificada como quantitativa discreta.

5 23. 5. alguns passos são diferenciados se os dados são referentes a uma população ou a uma amostra.9 26.1 37.8 29.0 39.9 24. Considere os valores a seguir referentes ao diâmetro à altura do peito (DAP). representando as classes da variável (número de lagartas). Neste algoritmo. associada a (nˆ i =1 n 2) graus de liberdade.8 22.5 20.4 24.260 1.100 .9 31.7 12.426 1.8 19.177 1.1 26.8 25.9 23. Quanto mais próximo de 100 estiver R2. ii) Calcular a amplitude total (A) dos dados: A = MVO – mvo E as hipóteses testadas foram: 90 15 .2 24.2 22.1 26.. Para amostra: Tamanho da amostra (n) Até 100 > 100 Número de classes (k) n 5 log10 n O modelo adotado foi: yi = b0 + b1Xi + εi . 10 e Ho: b1 = 0 εi ∩ N (0. obtendo-se os seguintes dados de densidade (g/cm3) em diferentes profundidades X (cm) Total X (cm) y (g/cm3) 10 15 20 25 30 35 40 45 50 55 325 1.388 1.7 41. os dados devem ser ordenados em ordem crescente para uma melhor manipulação dos mesmos.5 34.3 23.8 27.8 14. 1. n-2) QMDesvios em que F(α.2 34.7.2 24.2 QM Re gressão = F ≥ F(α. O coeficiente de determinação (R2) é a estatística dada por: R 2 (%) = SQ Re gressão . melhor a qualidade de ajuste do modelo de regressão aos dados. SQTotal O R2 procura quantificar a proporção da variação da variável y que é explicada pelo modelo de regressão.3 32.1) Exemplo de análise de regressão em dados sem repetição Um estudo foi realizado sobre zonas de compactação em perfis de um solo. 1 e (n-2) graus de liberdade.5 30.5 28.2. de 54 árvores de um talhão 10.5 36.SQDesvios = ∑ ( y i − y i ) 2 = SQTotal − SQ Re gessão . Exemplo 3.139 12. A distribuição de freqüências para variáveis quantitativas contínuas são diferentes daquelas discretas e das variáveis qualitativas. Primeiramente. ..1 16.0 32.5 25. Depois segue-se a um algoritmo para a obtenção da distribuição de freqüências.1 28.4 13.6 16.393 1.9 21. i=1. 1.6 24.140 1.8 33. σ2).6 21. com os valores inteiros no eixo horizontal. n-2) é o valor tabelado obtido através da Tabela de FSnedecor para o nível α de significância.577 A variável DAP é classificada como quantitativa contínua.7 35. para a realização de uma distribuição de freqüências de uma variável contínua.2 17. 2.3 22.8 22.6 34.153 1. i) Para população: escolher um número de classes (k) entre 5 e 20.1 39.4 24.8 17.2 30.. em cm.8 23.5 38.6 18. A decisão de rejeitar Ho ao nível α de significância se dará se A representação gráfica também é semelhante à do Exemplo 1.2 21.2 20.160 1. 0 ≤ R2 ≤ 100.341 1.

10 liberdade. associada a 1 grau de SQRegressão = ∑ ( y i − y) = ˆ     i =1 n ∑ X   i n  i =1  2 ∑ Xi − i =1 n 2 2 30.2 – 10.5 + 0. associada a (n-1) graus de i =1 i =1 n liberdade. o esquema da análise de variância da regressão para se testar estas hipóteses é: FV Regressão Desvios Total GL 1 n-2 n-1 SQ SQRegressão SQDesvios SQTotal QM SQRegressão/1 SQDesvios /(n-2) F QMRegressão/QMDesvios LI1 = mvo − ∆x c (população) ou LI1 = mvo − (amostra). ii) A = 41. 2 2 LS1 = LI1 + c v) Calcular o limite superior da 1a classe (LS1): LS1 além de limite superior da 1a classe. por exemplo.5.2) Análise de regressão em dados sem repetição Seja a hipótese de nulidade em uma análise de regressão Ho: b1 = 0 e a hipótese alternativa H1: b1 ≠ 0. k = 10 classes. iv) Calcular o limite inferior da 1a classe (LI1): A partir destes estimadores tem-se o modelo de regressão linear simples estimado (ajustado): ˆ ˆ ˆ y i = b o + b1 X i . 16 89 .   n X n y  ∑ i ∑ i  n  i =1 i =1  ∑ X i y i −  n n 2 i =1  .1 = 3. as relativas (fr) e porcentuais (fp) de cada classe: Aplicando-se então o algoritmo nos dados do Exemplo 3. b1 = i =1 2 n ∑X    n  i =1 i  ∑ X i2 − i =1 n n em que ∆x é a precisão de medida (menor valor detectável pelo instrumento ou método de medição).7 = 30. considerando que eles são referentes a uma população tem-se: i) Escolhe-se. também é o limite inferior da 2a classe: LS1 = LI2 LS2 = LI2 + c e assim sucessivamente até terminar as k classes. opcionalmente.06 = 3.7. iii) Calcular a amplitude de classe (c): c= A + ∆x (população) k ou c= A + ∆x (amostra) k −1 n n ∑X ∑ y    i  i =1 i =1 i  ∑ Xi yi − n . 5.1(arredondando) .em que MVO é o maior valor observado e mvo é o menor valor observado. O valor de c deverá ser arredondado para o mesmo número de casas decimais dos dados. vi) Calcular as freqüências absolutas (fa) e. iii) c = Em que as somas de quadrados (SQ’s) são dadas pelas seguintes expressões: 2 n ∑ y    i n n SQTotal = ∑ ( y i − y) 2 = ∑ y i2 −  i =1  .

0239 0. sendo tal modelo fixo para determinado conjunto de dados.8 33.05) [23. 35. .25.1 = 13.0299 0. 38. Um modelo de regressão linear é dito simples quando envolve somente uma variável regressora X. X2.2 15. tem-se o modelo de regressão linear simples: yi = b0 + b1Xi + εi em que εi é o erro experimental associado a observação yi. . Já o exemplo b) é típico de regressão linear múltipla pois envolve mais de uma variável regressora (no caso.41 16. de 54 árvores de um talhão Classes de DAP Ponto médio [10.75 + 3..55) [38. 23.0836 0.0555 1.0119 0..0741 0.0370 0. como os dados têm apenas uma casa decimal após a vírgula.0741 0.00 Fonte: Notas de aula.0926 0.35.95) [19. 13. duas).85 e assim por diante. 1997).85) [16. em cm.1 = 16. ∆x seria 0.35) [32. 32.65. 26.41 7.. 16.70 7.55.75.3 18.7 − 0.4 21. n.75 LS2 = 13.41 9. 29. Normalmente esta relação funcional é desconhecida e uma função alternativa pode ser usada para aproximar f como. Distribuição de freqüência do diâmetro à altura do peito (DAP).9 37.0000 dfr 0.45) [35.26 9.0741 0.. respectivamente.85.67 25. Os estimadores de quadrados mínimos de b0 e b1 são dados por: n  ∑X  i b o = i =1 − b1  i =1 n  n  Observação: Note que. por exemplo.41 5.95.45. se houvesse 2 casas após a vírgula.6 27.15) [26.92 7. 41.0 40.1 _ fa 2 4 4 9 14 4 5 5 4 3 54 fr 0.75 LI2 = LS1 =13. Admitindo que a relação entre yi e Xi é uma reta.0299 0.19..1 = 10.2592 0. iv) LI1 = 10.0741 0.55 ∑ yi n    = y − b1 X   100.7 30. qualquer relação funcional entre um conjunto de variáveis regressoras e um conjunto de variáveis dependentes. utilizadas). a) Representação tabular: Tabela 3.65) Total 12. b0 e b1 são parâmetros correspondentes ao coeficiente linear ou termo constante (intercepto da reta) e coeficiente angular ou de regressão.0239 0..0239 0.26 7.0239 0.01 e assim por diante. y1 e y2. os modelos polinomiais que estão incluídos entre os tipos de modelos de regressão linear simples e são amplamente utilizados (Nogueira.75) [13.1.25) [29.0538 0.0926 0.65 + 3. Os exemplos anteriores a) e c) se enquadram em casos de regressão linear simples. Sejam n pares de dados de duas variáveis (Xi.A princípio. 2. yi) com i = 1. Xk). pode ser chamada de modelo de regressão. o ∆x é 0.15.65 2 v) LS1 = 10.0179 _ fp (%) 3.05.5 24. b) Representação gráfica: Normalmente em gráficos de distribuição de freqüências de variáveis quantitativas contínuas usa-se no eixo vertical do gráfico a densidade de freqüência (df) de cada classe dada por: 88 17 . O exemplo d) é um caso de regresão linear múltipla multivariada (múltipla pois apresenta 3 variáveis regressoras e multivariada pelas duas variáveis respostas. representada por y = f(X1.1667 0.

04 0..2 5 32 . de 54 árvores de um talhão. tanto freqüências como densidades de freqüência.1) Histograma: é semelhante ao gráfico de barras.. os dois gráficos mais usais para distribuição de freqüências de variáveis contínuas são o histograma e o polígono de freqüência.40 b a b 19. a porcentual (dfp) obtidas.7. 5. c) Expressar a curva de crescimento (y) de aves em função do tempo (X).10 ab fa dfa = c .40 19.. e larguras iguais às amplitudes de classes.10 20.6 5 DAP 18 87 .3 5 35 . fp dfp = . Visto o conceito de df. de sacarose (X2) e pH (X3). simbolizado por y1. pode-se usar a densidade de freqüência absoluta (dfa) ou a relativa (dfr) ou. fr dfr = c . certamente uma variável y que se deseja descrever.05)..1 0.08 0. é determinada por um conjunto de outras variáveis. como por exemplo: a) Estudar a resposta na produção de grãos (y) em função de doses (X) de nitrogênio aplicadas ao solo. Mas se c é igual para todas as classes pode-se utilizar. simbolizado por y = f(X).8 5 19 .50 21.5 5 41 . X3). b.06 0.6 5 13 . X2). c Na Tabela 3 foram apresentadas as dfr´s (com c=3.1 5 29 .1) Características Na pesquisa agropecuária é freqüente o interesse no estudo de relações funcionais entre variáveis quantitativas. O uso de df se torna importante nas situações onde as amplitudes de classes (c) são desiguais e. X2. X2. no eixo vertical do gráfico. Xk. através da medida de seus diâmetros (X1) e alturas (X2). 10 ..1). em cm. .. simbolizado por y = f(X) d) Determinar como o número de brotos (y1) e seu peso seco (y2) são afetados pelas doses de meio de cultura MS (X1). b) Estimar o volume de madeira (y) em árvores de um povoamento florestal sem ter que derrubá-las. permite o cálculo de freqüências a partir de áreas do gráfico. y2 = f(X1.80 17. 0. com barras dispostas lado a lado.7 5 16 . X1.4 5 38 .02 0 dfr Médias seguidas de mesma letra não diferem entre si pelo teste de Tukey (Prob > 0. simbolizado por y = f(X1. As variáveis y’s dos exemplos anteriores que se deseja descrever são chamadas variáveis dependentes ou respostas e as variáveis X’s são denominadas independentes ou regressoras. por: Os resultados do teste de Tukey comparando as médias das Variedades para 1 e 2 linhas de irrigação está apresentado a seguir: Variedades\Linhas T1 T2 T3 T4 T1' 17.0 5 26 .18 c bc ab a T2' 17. também. Histograma de distribuição de freqüência relativa referente ao diâmetro à altura do peito (DAP).7) Análise de regressão 5. Na natureza.9 5 23 .densidade de freqüência (df) = freqüência da classe amplitude da classe Assim. respectivamente.80 19. Figura 4. ainda.

95: GLErro Médio = 2. DMS = q QMErro Médio r sendo q para α=0. 2 = 19.2 37 .6 27.50 4 84. A natureza desse comportamento pode ser simétrica.80 4 69.40 4 10.06 0.9 40.08 0.02 0 3.Comparando Médias de T para T2' : Variedade 1/ Linha 2 = T T _______ ' 1 2 = _______ ' 2 2 = _______ ' Variedade 3/ Linha 2 = T3 T2 = _______ ' Variedade 4/ Linha 2 = T4 T2 = 69.65 + 3._______ Variedade 2/ Linha 1 = T2 T1' = _______ 76. 2 Variedade 2/ Linha 2 = T T 9. No Exemplo 3 os pontos de união ao eixo horizontal são: . de 54 árvores de um talhão.05.95 1.7 = 21.0 = 20.4 = 19.1 DAP Teste de Tukey: Figura 5.18 4 LI1 − c 2 e LSk + c 2 em que LSk é o limite superior da última classe (k).1 = 43.1 dfr 0. em cm. 4 = 19. Adiante será visto como se quantifica a assimetria. o polígono é obtido pela união dos pontos médios das classes. nos pontos: Variedade 3/ Linha 1 = T3 T1' = Variedade 4/ Linha 1 = T T _______ ' 4 1 = 82.3 18.1 = 9.1 12.0207 = 2.2 15.2) Polígono de freqüência: quando as amplitudes de classe (c) são iguais.40 4 76.6 = 17. O polígono deve ser unido.6 = 17.8 33. assimétrica à direita ou à esquerda. como pode ser visualizado na Figura 6.1 2 e 41.65 − 0. DMS = 3. Polígono de freqüência relativa referente ao diâmetro à altura do peito (DAP).2 .00 .5 24. no eixo horizontal.4 21.04 0.7 30.10 4 79. 4 86 19 43. I = 4 tratamentos principais (Variedades) e n ' = 21 ⇒ q = 3.10 4 b.3) Natureza da distribuição O objetivo da distribuição de freqüência é descrever o comportamento da variável. nas alturas correspondentes às df’s.

ii) assimétrica à direita ou iii) assimétrica à esquerda.0005 0.0919 17.7900.1) Média (X ou Me) i =1 Da análise de variância anterior observa-se que houve diferença significativa entre efeitos de Variedades (T).0047 Figura 6. o teste de Tukey para comparar as médias de T (Variedades) para T1' (1 linha de irrigação) e também para T2' (2 linhas de irrigação).Comparando Médias de T para T1' . Podemos então utilizar. Médias: .0919 +17.848 5.0207 F 8. pela indicação da posição que o conjunto ocupa na escala de valores possíveis que a variável em questão pode assumir. Natureza da distribuição dos dados i) simétrica. T/T1' T/T2' Erro Médio 3) Estatísticas descritivas 3.42 + 79.8) 4 16 SQ T/T2' = 5449.7900 44.i) SQ Variedade /Linha 2 = SQ T/T2' = 2 1 (69.8819 ok! ii) iii) Assimétrica à direita Assimétrica à esquerda A análise de variância para o desdobramento T/T’ é: FV GL (I-1) = 4-1 =3 (I-1) = 4-1 =3 21 SQ 27.1) Medidas de posição Definição: é um número que descreve um conjunto de dados. Simétrica Para certificar se o cálculo das somas de quadrados do desdobramento Variedades dentro de Linhas foi realizado corretamente basta verificar: SQ T + SQ T x T ' = SQ T / T1' + SQ T / T2' 26.8 0 4 ∑ Xi N .1.62 + 76.4800 – 5431.62 ) − (294.22 + 69.2 = 17.9300 1. do Quadro 3 pode-se obter: Variedade 1/ Linha 1 = T T1' = 71.8819 = 44.9184 = 27.9635 + 17. 3.7900 QM 9. por exemplo.05).0306 5. no comprimento da banana. tanto para 1 linha de irrigação quanto para 2 linhas de irrigação (Prob < 0.6900 = 17. N Me = 20 85 .810 Prob>F 0.

o valor da SQD seria aumentada se colocássemos qualquer outro valor que não Me.40 a b Para o Exemplo 3 a média é: Me = 10.18 Linha 2/ Variedade 4 = 17.7 + 41. 54 d) Comparações entre médias de tratamentos principais dentro de cada nível de tratamento secundário (médias de Variedades dentro de cada Linha – T/T’): Esta comparação envolve os dois erros por meio de um erro médio. Do Quadro 3 obtém-se: SQ Variedade /Linha 1 = SQ T /T1' = 1 (314.1225 – 6174.1. [1. ou seja.0403] = 20.0011+ (2 − 1). os desvios di em relação a média são: xi 3 5 7 Média (Me) = 5 N i =1 O número de graus de liberdade (n’) associado a este Erro Médio é calculado de modo aproximado pela fórmula de Satterthwaite: [QMErro (a ) + ( K − 1). iii) A soma dos desvios (di’s) em relação a média é zero: di = x i − Me .7 2 − 4 16 ∑ di = 0 ( ) iv) A média minimiza a soma dos quadrados dos desvios (SQD).Me . N i =1 2 SQ T/T1' = 6201.3) 2 71. Para as N = 3 observações (xi) a seguir. a média (Me) também é acrescida de K: Me(x + K ) = Me( x ) + K .0011] 2 [(2 − 1).Linha 1/ Variedade 4 = 21.0403 = 1.2 2 + 76.0403] 2 + 9 12 2 Observação: GLErro (a) ≤ n ' ≤ [GLErro (a) + GLErro (b)].4 2 + 82.1.QMErro (b) K QMErro Médio = 1.QMErro (b)] 2 n = [QMErro (a ) ]2 [(K − 1)QMErro (b)]2 + GLErro (a ) GLErro (b) ' di 3-5 = -2 5-5 = 0 7-5 = 2 n' = [1.0919.K ) = K.0 2 + 84. 84 21 . sendo portanto um pouco mais complicada que as demais. a média também é multiplicada por K: QMErro Médio = QMErro (a ) + (K − 1).0306 = 27. 2 Me(x. Exemplo 4.1.0207 .4 + L + 39.7 + 12. Propriedades da média: i) Somando-se uma constante K a todos os dados.2 = 25. ii) Multiplicando-se K a todos os dados.67 ≈ 21 (arredondando).9. SQD = ∑ [x i − Me ] .0011 + (2 − 1).

ii) Md (x.T2 e T3 não houve diferenças significativas (Prob > 0.18 − 17. Observação: Se o número de observações (N) for par.18 4 _______ 69. Para as demais variedades T1.2) Mediana (Md) É o valor que é precedido e seguido pelo mesmo número de observações. 4 ' O contraste entre T1' e T2 para T4 é: iii) A mediana é o valor que minimiza a soma dos módulos dos desvios: ˆ y = T1' − T2' = 21.05. a mediana é: x1 8 x2 9 x3 10 x4 15 x5 40 Da análise de variância anterior observa-se que houve diferença significativa entre efeitos de Linhas (T´). somente para a Variedade 4 (Prob < 0.40 4 _______ Linha 1/ Variedade 4 = T1' T4 = Teste de Tukey: DMS = q QMErro (b) r Md = Propriedades da mediana: i) Md (x+K) = Md (x) +K. a mediana é: x1 9 x2 10 x3 14 x4 20 84. o teste de Tukey para comparar as médias de T´ (1 e 2 Linhas de irrigação) para T4 (Variedade 4).05).Md (x).05) entre 1 e 2 linhas de irrigação no comprimento do fruto central da terceira penca de banana. extremos.08: DMS = 3. Ela é a medida de posição mais utilizada. Ou seja. Colocando as letras do teste: 22 83 . no comprimento da banana.57 .0403 = 1.6 Linha 2/ Variedade 4 = T2' T4 = = 17. Exemplo 5. Médias: Md = 10 (este valor é precedido e seguido por duas observações). K = 2 tratamentos secundários (Linhas) e GLErro (b) = 12 ⇒ q = 3.78 > 1. 40 = 3. Para as N = 5 observações (xi) a seguir. ' 3. por exemplo.Observações: A média é muito influenciada por valores discrepantes. 3. ∑ xi − a é mínima se a = Md(x). em um conjunto de dados ordenados. Para as N = 4 observações (xi) a seguir.7 = 21. Podemos então utilizar. 2 sendo q para α=0. 1 linha de irrigação ( T1' ) proporcionou significativamente maior comprimento (cm) do fruto central da terceira penca de banana do ' que 2 linhas de irrigação ( T2 ).1.78 . Exemplo 6.08 1.K) = K. 10 + 14 = 12 . Observação: A Md é uma medida de posição para medidas assimétricas.57 portanto T1' ≠ T2 para T4. toma-se a média dos dois valores centrais. para Variedade 4 (T4).

8012 ok! ' A análise de variância para o desdobramento T /T é: ' ' 3.5012 12.4800 = 0.942 27.0800 = 0.1600 – 3248.9800 + 28.0403 F 0.3200. a moda é: x1 x2 9 x3 9 x4 12 x5 18 8 SQ T ' /T2 = 2918.9800 28.4 2 + 76.0000 0. ii) Mo (x.18 = 0.0000 + 0. através do denominado método de Czuber. ' ( ) Mo = 9 (valor mais freqüente.3200 + 0. 3. Ela é ainda menos afetada por valores extremos do que a mediana. SQLinha / Variedade 4 = SQ T ' / T4 = 2 1 (84.4 2 − 4 8 3.3) 4 8 SQ T ' / T4 = 3004.4838 QM 0.3) Moda (Mo) ( ) É o valor mais freqüente no conjunto de dados.8828 + 17.K) = K.6 2 ) − (154.2. porém.0000. SQ Linha /Variedade 2 = SQ T ' /T2 = 1 (152.4800 – 2918.5625 – 2976.3200 0.Mo (x).5012.mvo Trata-se da diferença entre o maior valor observado (MVO) e o menor valor observado (mvo) como já foi visto anteriormente.5012. apareceu duas vezes no conjunto de dados). onde é difícil encontrar um mesmo valor repetido duas ou mais vezes.1.2) Medidas de dispersão Definição: grandeza numérica que descreve a variabilidade em um conjunto de dados. Exemplo 7.308 0. 29.0000 0. Observações: A Mo também é uma medida de posição para medidas assimétricas.9975 0. Para variáveis contínuas.0 2 + 79.3200 0.2 2 − 4 8 SQ T / T3 = 3249.5012 1.2) 2 SQLinha / Variedade 3 = SQ T ' / T3 = 82. tal método não será discutido neste material.SQ T ' /T1 = 2478. Propriedades da moda: i) Mo (x+K) = Mo (x) +K.0613 = 28.397 Prob>F 0.1) Amplitude (A) A = MVO .9800 28.4000 – 2478.7 2 + 69. FV GL (K-1) = 2-1 =1 (K-1) = 2-1 =1 (K-1) = 2-1 =1 (K-1) = 2-1 =1 12 SQ 0.4341 0.0346 T ' /T1 T /T2 T ' /T3 T ' /T4 Erro (b) ' 82 23 .000 0. a moda é calculada de outra maneira.8) 2 76. Para certificar se o cálculo das somas de quadrados do desdobramento Linhas dentro de Variedades foi realizado corretamente basta verificar: SQ T + SQ T x T = SQ T ' /T1 + SQ T ' /T2 + SQ T ' /T3 + SQ T ' /T4 11. Para as N = 5 observações (xi) a seguir. 1 (161.8012 = 29.6347 0.9184 = 0.9800.

64 4x 4 DMS = q e T2' = TT ' rI 2 = 294. • Variância (Var ou σ ): média dos quadrados dos desvios (também chamada de quadrado médio). ˆ σ 2 = i =1 N n −1 2 2 SQ Linha /Variedade 1 = SQ T ' /T1 = 1 (140.56 portanto T1 = T2 e assim continua as comparações entre as outras médias de variedades duas a duas.2 2 + 69.0403 = 0. 3.T ' /T): Do Quadro 3 obtém-se: Ou ainda. c) Comparações entre médias de tratamentos secundários dentro de cada nível de tratamento principal (médias de Linhas dentro de cada Variedade .6 2 − 4 8 ( ) 24 81 . Observação: A amplitude é muito influenciada por valores extremos. σ2 = ∑ [x i − Me ] N 2 N (população) ou σ 2 = ˆ i =1 ∑ [x i − Me ] n 2 n −1 (amostra).78 4. a amplitude. portanto.8 = 18.Exemplo 8.4 ˆ y = T1' − T2' = 19.78 portanto T1' ≠ T2 . Assim. b) Comparações entre médias de tratamentos secundários (médias de Linhas .64 − 18.2) Variância (Var) e Desvio padrão (DP) São medidas baseadas em todos os dados. do Quadro 3 pode-se obter: A (X) = 41 – 6 = 35.08 ' O contraste entre T1' e T2 é: 1. pelas expressões alternativas: N n ∑x  ∑x    i  i  N n  i =1   i =1  2 2 ∑ xi − ∑ xi − N n (população) ou σ 2 = i =1 (amostra). X e Y apresentam mesma amplitude (A).21 > 0.3 = 19.05.5=1.5 < 1. a partir dos desvios em relação a média.21 .2.T ' ): ' Comparando a média de T1' com a de T2 pelo teste de Tukey.43 4x 4 QMErro (b) r. K = 2 tratamentos secundários (Linhas) e GLErro (b) = 12 ⇒ q = 3. cuja expressão é dada por: 2 i =1 T1' = TT ' rI 1 = 314.I sendo q para α=0.8) 2 71. uma vez que é calculada a partir deles. aumentando. ' 1. 43 = 1.08: DMS = 3. Considere dois conjuntos de dados (X e Y) medidos em metro (m): Totais X Y 6 6 16 11 16 21 16 31 41 41 95 110 -1. portanto o conjunto X apresenta claramente menor variabilidade (maior uniformidade) que o conjunto Y. aumenta a chance de encontrar valores extremos. a medida que aumenta N. A (Y) = 41 – 6 = 35.

respectivamente. facilitando. em relação a Var. Ti e Ti ' : média do tratamento principal i e do tratamento secundário i ' .6 − 19.66 m. a do DP também será kg enquanto que a da Var será kg2).00 m2.1 = −1. a média de T1 com a de T2 pelo teste de Tukey.TTi e TTi ' : total do tratamento principal i e do tratamento secundário i ' . DP( x + K ) = DP(x ) .8 T1 = = = 17. em média. de possuir a mesma unidade dos dados (por exemplo. As comparações de médias que o pesquisador pode ter interesse em um experimento em parcelas subdivididas são as seguintes: a) Comparações entre médias de tratamentos principais (médias de Variedades . se a unidade de medida dos dados é kg.41: DP(X) = DP(Y) = 136 = 11.K) = K [DP (x)]. 4. os dados se desviam da média.00 m2. cuja expressão é dada por: σ = σ 2 (população) ou ˆ ˆ σ = σ 2 (amostra). a Var fica multiplicada por K2 e o DP por K. assim.K (110) 2 5 = 3240 − 2420 = 164. ii) Multiplicando-se K a todos os dados. 5 Var(X) = 140. do Quadro 3 pode-se obter: • Desvio padrão (DP ou σ): é a raiz quadrada da variância.81 m.K) = K2[Var(x)].05.0011 = 1. ˆ y = T1 − T2 = 17. por exemplo.8 T2 = = = 19. ˆ Observações: Quanto maior σ2 ou σ 2 .T): Comparando. a Var e o DP não se alteram: Var( x + K ) = Var (x ) .41 O contraste entre T1 e T2 é: 1.56 . 164 = 12. respectivamente. a visualização do quanto. Para o Exemplo 8 tem-se: 6 2 + 16 2 + 16 2 + 16 2 + 412 − (95) 2 5 = 2485 − 1805 = 136. 80 25 . maior a variabilidade do conjunto de dados. DP (x. O DP tem a vantagem. Lembrando a interpretação do teste Tukey: Se  y ≥ DMS ⇒ as médias dos dois tratamentos em comparação ˆ podem ser consideradas estatisticamente diferentes. DMS = 4. I = 4 tratamentos principais (Variedades) e GLErro (a) = 9 ⇒ q = 4.6 rK 4x 2 DMS = q TT1 e 152. 5 sendo q para α=0.2 Propriedades da variância e do desvio padrão: i) Somado-se uma constante K a todos os dados.1 rK 4x 2 Var(Y) = TT2 5 6 2 + 112 + 212 + 312 + 412 − 5 QMErro (a ) r. Var(x.5 .

0 I: número de tratamentos principais.100 .100 = . K = 2 linhas de irrigação. r: número de blocos.2512 8.245 8. Considere os pesos (Kg) de animais de dois rebanhos diferentes: Rebanho A 70 90 80 100 Me DP 85 11. K: número de tratamentos secundários. Os rebanhos A e B possuem o mesmo DP. 26 79 .iii) O DP em relação a média é mínimo ao invés de qualquer outro valor devido ao fato da média ser o valor que torna mínima a soma de quadrados do desvio (SQD).0403 F 5.100 = . 495 CV (a ) = Para subparcelas: QMErro (a ) 1.9878 1.422 5. pois o desvio e a média possuem a mesma unidade. r = 4 blocos.18 11. Isto pode ser comprovado pelos valores de CV dos dois rebanhos: 11.37 SQ 15.0 Número de observações: 32 Nos experimentos em parcelas coeficientes de variação (CV): Para parcelas: subdivididas tem-se dois É claro que pelos valores de pesos tratam-se de rebanhos de idades diferentes.37% . possuem um peso relativo muito maior no rebanho A do que no rebanho B.0045  DP  CV (%) =   .0102 51.4838 94. poderíamos afirmar que a variabilidade do rebanho A é maior do que a do rebanho B.15% .9635 9.100 = 5.18 CV (Rebanho A): x 100 = 13. é óbvio que diferenças de 5 kg. Assim.18 Rebanho B 490 510 480 500 495 11.8828 17.0055 0. por exemplo.0122 QM 5.  Me  O CV é uma medida relativa.100 = 5.9184 12. porém.741 0.0403 . 85 CV (Rebanho B): 11. I = 4 variedades.8828 5.0011 11.9728 1.26% .0 CV (b) = Considere: QMErro (b) 1.18 x 100 = 2.7535 26. Exemplo 9.3) Coeficiente de Variação (CV) FV Bloco Variedades (T) Erro (a) Parcelas Linhas ( T ) Tx T Total CV (a) (%) CV (b) (%) ' ' GL 3 3 9 15 1 3 12 31 5. y 19.2.7272 11.0338 Erro (b) Média geral ( y) : 19. y 19.0229 0.26% .978 Prob>F 0. porcentual.26 5. 3.0011 .

Quadro 3.7272 . freqüentemente é interessante saber se a população da qual a amostra foi coletada pode ser descrita por uma curva normal. Quadro auxiliar com os totais de todas as repetições para cada combinação entre os níveis dos fatores T e T´.8828.9635 – 11. + 69.8 609.3. SQ Erro (a) = SQ Parcelas – SQ Blocos – SQ Variedades SQ Erro (a) = 51.11593. Isso pode ser verificado por meio das seguintes medidas: 3. podendo ser próximos de zero.6 2 ) . Linhas\Variedades T1 71.8(8) T2 76.2 (4) 69.7535 – 26.7272 – 11.5) conforme o esquema em parcela subdividida é: 78 27 .4 76. Observação: O CV por ser adimensional é útil na comparação entre conjuntos de dados com mesma unidade mas permite.1 3.8 2 ) . também. Na Figura 6 pode ser visto a natureza do comportamento de uma variável.  Se As é  zero (As = 0) : indica uma simetria (amostra pode ser considerada vinda de uma  distribuiç normal).3 Totais 314.3(16) 294.11593.6 154. 3. É necessário também fazer um outro quadro auxiliar com a combinação entre os níveis dos dois fatores (variedades e linhas de irrigação) para o cálculo da soma de quadrados do tratamento da subparcela (linhas de irrigação) e da interação variedades x linha (T x T´).8 T3 82. se simétrica.8828 – 17. O coeficiente K é dado por: E o quadro de análise de variância para os dados do exemplo 5.0 79. tendo a curva normal como referência.7206 – 11593.9635 = 9.6 140.SQ Parcelas = 11645.8378 – 26.4838. O coeficiente As é dado por: As = d ∑ (x i − x ) n i =1 3 T ' 1 m3 2 T2' Totais d 2 = m3 d3 sendo m 3 = 2 n e d2 = σ2 (variância populacional) ou Do Quadro 3 é possível obter: 1 SQ Linhas = (314. negativo (As < 0) : indica uma assimetria à esquerda.7272 – 15.8828 = 17.8378 = 11.7 69.2 161. SQ Variedades x Linhas (T x T ' ) = 1 (71.8378 16 SQ Linhas = 11605.32 + 294. SQ Erro (b) = SQ Total – SQ Parcela – SQ Linhas – SQ Variedades x Linhas SQ Erro (b) = 94.2 T4 84.8378 = 51.6 2 + .C − SQ Variedades − SQLinhas 4 ' ˆ σ (variância amostral).2 2 + 69.6.2) Coeficiente de curtose (K): medida que quantifica o grau de achatamento da distribuição de freqüência de um conjunto de dados.. Observação: Na prática os valores de As dificilmente serão zero. assimétrica à direita ou assimétrica à esquerda. positivo (As > 0) : indica uma assimetria à direita.9184 = 12.3..3) Medidas de assimetria e curtose Em estatística.6025 – 11593.0122 – 51. a comparação da variabilidade entre conjuntos de dados referentes a diferentes características.9184.4 152.0102. ão  SQ Variedades x Linhas (T x T ) = 11650.1) Coeficiente de assimetria (As): medida que quantifica o distanciamento de um conjunto de dados em relação à simetria.5650 .

8378 8 SQ Variedades = 11620.1 + . Para o cálculo da soma de quadrados de parcelas.5 d2 37.11593.7 32. C= 32 SQ Blocos = ˆ σ (variância amostral).0122.1 142.3 Totais 156.1 34. + 16.32 ) .8 2 + 161.12 + 142. .5 161.8 36.0 609.0 37. SQ Total = 19.9 2 + 34.4 37. Gráfico dos diferentes graus de achatamento relativos a uma distribuição de freqüência 4 Totais 37.25 Do Quadro 2 calculamos: 1 SQ Variedades = (140.0 + 17.2 36.4 38. SQ Parcelas = 1 8 (37.8378 SQ Total = 11687.9 (2) Tratamentos T2 39.2 2 + 154. Seja as seguintes N = 4 observações. do Quadro de dados podemos tirar: sendo m 4 = i =1 2 n e d2 = σ2 (variância populacional) ou (609.8500– 11593.  Se K é < 3 : indica uma distribuiç ão achatada chamada platicúrtica..5 2 ) . > 3 : indica uma distribuição afiada chamada leptocúrtica.5 42. Quadro auxiliar com os totais das parcelas Repetições T1 1 2 3 Figura 7.4 35.837 2 28 77 .8378 = 94. é necessário fazer um quadro auxiliar com os totais das parcelas.2 T4 38.8378 = 15.9635.4 (8) 155.8378 = 26. = 3 : indica uma distribuição semelhante a normal chamada mesocúrtic a.1) 2 = 11593. .6 2 + 155.8(8) Exemplo 10. Quadro 2.8 39.6 – 11593.8378 8 2 2 2 2 SQ Blocos = 11609.K= ∑ (x i − x ) n 4 m4 m = 44 d 2 . a média ( x ) e a variância (d2)destas observações dadas por x1 2 x2 15 x3 16 x4 17 x 12.5913 – 11593.0 41.8 T3 41.0 2 ) − 11593.8 2 + 152.4 2 + 38.5 154.4 + 18.4 2 + 155.7 2 + . + 37.d 2 d Considerando que a unidade de cálculo é a subparcela.8 140.0 40.6 155.8013 – 11593..2 152.  1 (156.7535.11593.8378.

3 17.1 142.(37.7 21.3 19.8 18. c1.3 19.0 19.+ bnmn M 5...4 19.5 17.5 20.. bn..4 20.5) 3 + (15 − 12.563 .9 17.6) Croqui de campo T2 BL I T4 T1 T3 YI-1 = c1m1 + c2m2 + .1) Contrastes ortogonais de médias Definição: São combinações lineares dadas por: Y1 = a1m1 + a2m2 + .1 17.2 18. A exigência para BL III ' 1 T T1 ' 2 T ' 1 T T2 ' 2 T ' 1 T T3 ' 2 T ' 2 T T4 ' 1 BL IV T2' T1' T1' T2' T2' T1' T1' T2' 76 29 . .9 18. com 4 repetições. T2.6 71.. 2..5) 4 + (15 − 12.2 76..fruto central da terceira penca de banana estão dispostos na Tabela 8 a seguir.9 18.+ anmn Y2 = b1m1 + b2m2 + .2 69.0 76.7 82. 4 4 As = − 252 37.. em esquema de parcela subdividida com 4 variedades de banana (T1. ∑ bi L∑ ci = 0 . .8 79. d3 Tratamentos Repetições T1 T2 T3 T4 Totais K= ' 2 ' 1 ' 2 3188.5 17. quando a variação de um contraste é independente da variação do outro.0 20.8 20. (37.2 19. cn são os coeficientes dos contrastes.6 155.7 16.108 (As < 0 → Assimetria a esquerda).4 19.n.30 (K < 3 → Distribuição platicúrtica).9 17.+ cnmn sendo a soma dos coeficientes de cada contraste igual a zero: T2' T3 T1' T T4 ' 2 T2' T1 T1' T T3 ' 1 T1' T2 T2' T T1 ' 2 T1' T4 T2' T T2 ' 1 i =1 ∑ a i .4 18..5) 4 + (17 − 12.6 21.25 37. ou melhor. T3 e T4) nas parcelas e 2 linhas de irrigação ( T1' = ' 1 linha e T2 = 2 linhas) nas subparcelas m3 = m4 = (2 − 12.. b1. m2. Comprimento (cm) do fruto central da terceira penca de banana para um experimento em blocos casualizados (DBC).9 84. = 4 4 ( 2 − 12.2 21.5) 4 + (16 − 12.25).25 = = 3188.0 17..5) 4 12754. Tabela 8.5) 3 + (16 − 12.6 14.1 22..6.563 = 2.5) 3 − 1008 = −252 .25 = m3 = −1. Dois contrastes são ditos ortogonais quando há uma independência entre suas comparações..6 69.0 609. mn são médias dos tratamentos 1. an.5) 3 + (17 − 12.. .6 19.7 21.6 4. m1. i =1 i =1 n n n BL II T T ' 1 T ' 2 T ' 1 T ' 2 em que: a1.25) T 1 2 3 4 Totais ' 1 T ' 2 T ' 1 T ' 2 T ' 1 T T T 4) Testes de comparações múltiplas 156.7 16..1 19.4 155.

γ é o efeito do k-ésimo nível do tratamento secundário.≠ rn : O modelo a seguir corresponde a um modelo de um DBC em esquema de parcela subdividida: Cov(Y1. 5. caracterizado como componente do erro (b). redução esta decorrente da existência de dois erros... 2 n i =1 ri n O erro padrão do contraste Y é: s(Y) = Var (Y) . comparativamente ao esquema fatorial. i =1 n A variância (Var) de um contraste Y é: Var (Y) = s 2 ∑ c i2 2 (se s1 = s 2 =. iii) δij e eijk são δ não correlacionados.≠ s 2 2 n n e r1 ≠ r2 ≠.. Y2) = ∑ a i b i = a 1 b1 + a 2 b 2 + L + a n b n .≠ rn : y ijk = ì + β j + α i + δ ij + γ k + (αγ ) ik + e ijk em que y ijk é o valor observado referente a parcela que recebeu o iésimo nível do tratamento principal α e o k-ésimo nível do tratamento secundário γ no j-ésimo bloco. Os tratamentos das parcelas foram 4 variedades de banana (T1. s1 + si = n i =1 ri rn r2 r1 e r1 ≠ r2 ≠. µ representa uma constante geral associada a esta variável aleatória...4) Modelo subdividida estatístico do experimento em parcela Se 2 s1 ≠ s 2 ≠. i =1 ri r1 r2 rn • 2 Se s1 = s 2 =. o erro (a) referente às parcelas e o erro (b). Yi ' ) = 0. 30 75 .. δij = (αβ)ij é o efeito residual das parcelas.6. correspondente às subparcelas dentro das parcelas.3) Desvantagem Há uma redução do número de graus de liberdade do erro. Seja s i2 a variância do tratamento i e ri o número de repetições do tratamento i.. Sobre as distribuições de δij e eijk pode-se considerar as seguintes pressuposições: i) δij ∩ N(0... (αγ)ij é o efeito da interação do i-ésimo nível do tratamento principal α com o k-ésimo nível do tratamento secundário γ e eijk representa o efeito residual das subparcelas.= s 2 2 n n ab ab a b a b Cov(Y1. ii) eijk ∩ N(0.= s 2 e r1 = r2 =. Y2) = ∑ • a b a i b i 2 a 1 b1 2 a 2 b 2 2 s2 +L + n n s2 .... T2.. σ 2 )...5) Exemplo de parcela subdividida Foi realizado um experimento em blocos casualizados com 4 repetições. αi é o efeito do i-ésimo nível do tratamento principal. Y2) = ∑ i i = 1 1 + 2 2 + L + n n .6. βj é o efeito do jésimo bloco.= rn : 2 n Cov(Y1.6. a covariância entre dois contrastes é dada por uma das seguintes expressões: • 5.≠ s 2 )..= s 2 =s2) 2 n i =1 ri ou 2 n c 2 Var (Y) = ∑ i s i2 (se s1 ≠ s 2 ≠. σ 2 ). 5. T3 e T4) e os tratamentos das subparcelas foram uma e duas linhas de irrigação ' ( T1' = 1 linha e T2 = 2 linhas).que dois contrates sejam ortogonais é que a covariância (Cov) entre eles seja nula: Cov( Yi . caracterizado como componente do erro (a). no esquema de parcelas subdivididas. Os dados do comprimento (cm) do Se 2 s1 = s 2 =.

a4= 0 a1= 0.6. casualizam-se os níveis do fator secundário nas subparcelas de cada parcela. Pimentel Gomes (1990) e Hinkelmann & Kempthorne (1994). a2 = -1. sendo os mais usados os delineamentos em blocos casualizados. Considere as médias de produtividade de grãos (t/ha) de 4 cultivares de milho: ˆ m1 = 5.2 ˆ m 2 = 3. níveis de irrigação). com o objetivo de procurar controlar a variabilidade que possa haver no material experimental. a2 =1.6. Assim.3 ˆ m 3 = 4. cada parcela funciona como um bloco para os tratamentos secundários. A principal característica destes experimentos é que as parcelas são divididas em subparcelas. c) quando se deseja maior precisão para comparações entre níveis de um dos fatores.6) Experimentos em parcelas subdivididas 5. a2 = 0. 2 4 i) Escolher os (I-1) = 4-1 = 3 contrastes: Y1 = m1 + m2 – m3 – m4 Y2 = m1 – m2 Y3 = m3 – m4 em que em que em que a1=1.0 ˆ m 4 = 9. 5. dentre outros autores. Os contraste são formulados de acordo com o interesse do pesquisador. o número máximo de contrastes ortogonais possíveis é dado por I-1 comparações. a3 = 1.19.. d) quando existe um fator de maior importância (que deverá ser casualizado na subparcela) e outro de importância secundária. Exemplo 11. onde é difícil a instalação do experimento no esquema fatorial. são unânimes em afirmar a maior precisão existente no teste de tratamentos secundários. a4= -1 a1=1. Os tratamentos das parcelas são chamados de primários ou principais e são dispostos segundo um tipo qualquer de delineamento. b) quando informações prévias asseguram que as diferenças entre os níveis de um dos fatores são maiores que as do outro fator. Observações: Em um experimento com I tratamentos. Primeiro casualizam-se os níveis do fator primário nas parcelas de cada bloco.0 2 2 r1 = r2 = r3 = r4 = 5 e s1 = s 2 = s 3 = s 2 = s 2 = 0.2) Vantagens Os experimentos em parcelas subdivididas apresentam uma grande utilidade na pesquisa agropecuária. a3 = -1. ii) Verificar se o somatório dos coeficientes de cada contraste é igual a zero: Y1 ⇒ ∑ a i = 1 + 1 − 1 − 1 = 0 i =1 4 4 Y2 ⇒ ∑ b i = 1 − 1 + 0 + 0 = 0 i =1 4 Y3 ⇒ ∑ c i = 0 + 0 + 1 − 1 = 0. sendo este incluído para aumentar a extensão dos resultados e e) nas situações práticas. Tais experimentos são úteis em situações como: a) quando os níveis de um dos fatores exigem grandes quantidades de material experimental (por exemplo. devendo ser casualizados nas parcelas. Os tratamentos das subparcelas são chamados secundários e são dispostos aleatoriamente dentro de cada parcela. a3 = 0. i =1 74 31 .1) Características O esquema experimental em parcelas subdivididas se caracteriza como sendo uma variação do experimento fatorial com dois fatores (Steel et al. 1997).5. em seguida. além de outras diversas áreas. a4 = -1.

05).2 + 3.3 Resultado do teste b a ˆ ˆ ˆ Cov(Y1 .05).1 + (−1).19   i =1 ri 5   2 n c  0 2 + 0 2 + 12 + (−1) 2  ˆ ˆ  = 0. ˆ Y1 = 5.iii) Verificar se a covariância entre dois contrastes é igual a zero: ˆ ˆ ˆ Cov(Y1 .1520 = 0.0 – 9. i =1 4 iv) Calcular a variância de cada contraste: A variedade 2 apresentou peso do colmo estatisticamente superior ao da variedade 1 quando foi utilizado o inoculante 1 (Prob<0.0 374.0760 = 0.1 + 1.4 385. Y2 ) = ∑ a i b i = 1.0 – 9.(−1) = 0 i =1 4 ˆ ˆ ˆ Cov(Y2 . 2757 t/ha.0 = -4.1 + 0.(−1) + (−1).Variedade dentro do inoculante 3: Variedade 1 2 Médias 244.(−1) = 0.2 – 3.0760.1520 = 0. . Y3 ) = ∑ b i c i = 1. 32 73 .9 t/ha ˆ Y3 = 4.0 + 1.0760 Var (Y2 ) = s 2 ∑ i = 0.5 t/ha ˆ Y2 = 5.19   i =1 ri 5   n n  12 + (−1) 2 + 0 2 + 0 2  b2 ˆ ˆ  = 0.2757 t/ha ˆ ˆ ˆ s(Y3 ) = Var (Y3 ) = 0.Variedade dentro do inoculante 1: Variedade 1 2 Médias 231.0 + 0.3 – 4. vi) Calcular as estimativas destes contrastes: A variedade 2 também apresentou peso do colmo estatisticamente superior ao da variedade 1 quando foi utilizado o inoculante 3 (Prob<0.0760 = 0.0 + (−1).3 = 1.3899 t/ha ˆ ˆ ˆ s(Y2 ) = Var(Y2 ) = 0.0 t/ha.0 + (−1). Y3 ) = ∑ a i c i = 1.05). .Variedade dentro do inoculante 2: Variedade 1 2 Médias 209.0 = 0 i =1 4 Aplicando o teste de Scott-Knott para variedades dentro de cada nível de inoculante tem-se: .3 Resultado do teste b a v) Calcular o erro padrão de cada contraste: ˆ ˆ ˆ s(Y1 ) = Var (Y1 ) = 0.19   i =1 ri 5   A variedade 2 apresentou peso do colmo estatisticamente superior ao da variedade 1 quando foi utilizado o inoculante 2 (Prob<0.0 = -5.8 Resultado do teste b a ˆ ˆ Var (Y1 ) = s 2 ∑  12 + 12 + (−1) 2 + (−1) 2  a i2  = 0.0 + (−1). Var (Y3 ) = s 2 ∑ i = 0.3 379.

b) Estudar o comportamento das variedades para cada inoculante Do Quadro 1 tem-se: SQ Variedade / I1 = ˆ b) Y 2' = ˆ ˆ m1 m 2 − = 1.25 t/ha a) Y1' = 1 2 2 O contraste Y1 nos indica que o grupo das cultivares 1 e 2 produz em média 2.2800 36450.4200 54979.0000 1843.0000.4 2 + 1541. Dada uma hipótese de nulidade (Ho) e sua hipótese alternativa (H1) dada por: 1 (2494.Inoculante dentro da variedade 2: Inoculantes 1 2 3 Médias 385. a probabilidade de erro tipo I (α). Também não houve diferenças significativas (Prob>0.0000 27648.05) para cada inoculante utilizado (I1 ou I2 ou I3). 72 33 .2800 36450.3 374.4200 54979.2800 4 8 ˆ ˆ m m ˆ c) Y 3' = 3 − 4 = −5. 1 (2466.0 2 ) − = 47370. O α consiste no erro que se comete ao rejeitar Ho. deve-se escolher os contrastes antes de avaliar os dados ou.4200 4 8 1 (2334. SQ Variedade / I2 = 4.De acordo com Banzatto & Kronka (1989).0001 0.8) 2 (835.1 ) − = 36450.05) com relação ao peso do colmo entre os 3 inoculantes utilizados para a variedade 2. se possível.1067 QM 47370.2. 1 1 O contraste Y3 nos indica que a cultivar 3 produziu em média 5.2) 2 2 2 SQ Variedade / I3 = (977..1) Teste t para contrastes ortogonais Considerações: .0 t/ha.775 Prob>F 0. .700 29. 4) 2 (925.2) Teste t de Student 4. assim. o que aumentaria.8 379.0 2 ) − = 54979. na fase de planejamento do experimento para evitar que sejam escolhidos contrastes correspondentes as maiores diferenças observadas entre médias.25 t/ha a menos que o grupo das cultivares 3 e 4. sendo que ela é verdadeira.0001 0. sugeridos pela estrutura dos tratamentos.1 + 1517. 4 8 FV Variedade / I1 Variedade / I2 Variedade / I3 Erro GL 1 1 1 15 SQ 47370.2071 F 25.0005 Neste segundo desdobramento da interação (variedade dentro de inoculante) conclui-se que as duas variedades apresentaram pesos de colmos diferentes (Prob<0.8 2 + 1499.O teste t pode ser usado para contrastes ortogonais.3 Resultado do teste a a a vii) Conclusões dos contrates: ˆ ˆ ˆ ˆ ˆ m + m 2 − m 3 + m 4 = -2.9 t/ha.828 19.9 t/ha 1 1 O contraste Y2 nos indica que a cultivar 1 superou em média a produção da cultivar 2 em 1.0 t/ha a menos que a cultivar 4.

5110 0. pode ser realizado das seguintes maneiras: a) Estudar o comportamento dos inoculantes para cada variedade Do Quadro 1 tem-se: SQ Inoculante / V1 = SQ Inoculante / V2 = FV Inoculante / V1 Inoculante / V2 Erro ˆ ˆ sendo Y a estimativa do contraste de interesse e s(Y ) a estimativa do erro padrão do contraste. A estatística t é calculada por: t= ˆ ˆ Y−0 Y−0 = ˆ ˆ ˆ V(Y) s(Y) variedades e inoculantes. não há diferença significativa (Prob>0.05) com relação ao peso do colmo entre os 3 inoculantes utilizados para a variedade 1. as médias ou grupos de médias comparadas no contraste não diferem entre si.9508 1843. 71 34 .3 Resultado do teste a a a ˆ Y1 = -4. pelo menos uma média difere das demais ou um grupo de médias difere de outro grupo.5617.9427 Neste primeiro desdobramento da interação (inoculante dentro de variedade) conclui-se que tanto para variedade 1 quanto para a variedade 2. Aplicar o teste t nos contrates Y1.2071 F 0.4 209.8 2 + 977.1067 QM 1277.4 2 + 835.9 t/ha ˆ Y = -5 t/ha 3 ˆ s(Y1 ) = 0. (925. ou seja. A estatística t é comparada (em valor absoluto) com um valor tabelado (tt).Ho: Y= 0.7808 110. Y1 = m1 + m2 – m3 – m4 Y2 = m1 – m2 Y3 = m3 – m4 .0 244.060 Prob>F 0. não houve diferenças significativas (Prob>0.9017 27648. rejeita-se a hipótese Ho e conclui-se que as médias ou o grupo de médias em comparação são diferentes.3899 t t ( Y1 ) para α=0.693 0.05) no peso do colmo entre os três inoculantes aplicados.3) 2 = 2555. aceita-se a hipótese Ho e conclui-se que as médias ou os grupos de médias em comparação são iguais.0 2 + 1517. no caso deste exemplo com dois fatores.5617 221.2757 t/ha t c( Y1 ) = − 4.3899 t/ha ˆ s(Y ) = 0.2757 t/ha 2 ˆ s(Y3 ) = 0. Exemplo 12.05 e GL Erro=16 ⇒ t t ( Y1 ) = 2. (1541.Teste t para Y1: 1 ( 2738.541 0. caso contrário.5 t/ha ˆ Y2 = 1. Aplicando o teste de Scott-Knott para inoculantes dentro de cada nível de variedade tem-se: .12 ) − 4 12 GL 2 2 15 SQ 2555. Y2 e Y3 do Exemplo 11. H1: Y≠ 0. recomenda-se proceder o desdobramento da interação V x I para certificar tal informação. Se t < tt.Inoculante dentro da variedade 1: Inoculantes 1 2 3 Médias 231.12 ) − 4 12 1 ( 4557.5 − 0 = −11. procurando-se na Tabela de t (encontrada em livros de estatística) o número de graus de liberdade (GL) associado a variância e o nível de significância α. considerando que o GLErro da análise de variância é 16.12 Realmente. ou seja.0 2 + 1499. se t ≥ tt.1) 2 = 221.9017. O desdobramento.

8 Resultado do teste a a a Embora a interação V x I não seja significativa (Prob > 0.4380 137834. apesar de seu efeito ter sido não significativo (Prob>0.1067 172067. Aplicando o teste de Scott-Knott para inoculantes.Teste t para Y3: t c( Y3 ) = Aplicando o teste de Scott-Knott para variedades (pois esta fonte de variação foi significativa: Prob<0.6211 0.05).136 > 2. tem-se: Inoculantes 1 2 3 Médias 308.5) conforme o esquema fatorial 3x2 é: FV Bloco (Tratamentos) Variedades (V) Inoculantes (I) VxI Erro Total CV (%) = Média geral: GL 3 (5) 1 2 2 15 23 14.688 15.8083 (140612.8 Resultado do teste b a − 5. iii) Calcular a média de cada grupo ( y i ).1900) 137834.7267– 1812.9 − 0 = 6.9733.892 0. iv) Calcular a variância de cada grupo (s i2 ) .05).12 ⇒ rejeita-se Ho: Y3 = 0 e portanto m3 ≠ m4 (a média da cultivar 3 difere da cultivar 4 ao nível de 5% de significância).2) Teste t para comparação de duas médias Passos para realização do teste: i) Definir a hipótese de nulidade: Ho: y1 = y 2 .2 379.3 291.9733 27648.2757 t t ( Y 3) para α=0.1900 .136 0.1050 QM 1268.541 > 2.780 0.2.12 Como t c( Y2 ) > t t ( Y2 ) ⇒ 6.262 Prob>F 0.0 − 0 = 18.137834.7267 906.05 e GL Erro=16 ⇒ t t ( Y2 ) = 2.7267 1812.0000 0.0000 0.12 ⇒ rejeita-se Ho: Y1 = 0 e portanto m1+ m2 ≠ m3 + m4 (os dois grupos de médias de cultivares diferem entre si ao nível de 5% de significância) .05) tem-se: Variedades 1 2 Médias 228.492 0.Teste t para Y2: E o quadro de análise de variância para os dados do exemplo 5. Como t c ( Y1 ) > t t ( Y1 ) ⇒ -11.4900 964.98 Número de observações: 24 SQ 3806.4867 1843. indicando não haver uma dependência entre os efeitos dos fatores 70 35 .5730 0.12 ⇒ rejeita-se Ho: Y2 = 0 e portanto m1 ≠ m2 (a média da cultivar 1 difere da cultivar 2 ao nível de 5% de significância) .4900 = 964.9361 28122.SQ Variedades x Inoculantes = 140612. ii) Estabelecer o nível de significância (α).2757 t t ( Y2 ) para α=0.257 74.12 303.2450 482.5.8 311.2071 F 0.892 > 2. 4.05 e GL Erro=16 ⇒ t t ( Y2 ) = 2.12 Como t c( Y3 ) = > t t ( Y 3) ⇒ 18.7731 t c ( Y2 ) = 1.

por meio da expressão: p s2 = p 2 (n 1 − 1)s 1 + (n 2 − 1)s 2 2 .0 2466. .4 925.2150 4 2 2 2 2 vi) Calcular a estatística t. Exemplo 13. SQ Erro = 172067. Quadro auxiliar com os totais de todas as repetições para cada combinação entre os níveis dos fatores.7050– 2217619.8 2 + 977. Do Quadro 1 obtém-se: SQ Variedades = 1 (2738.2150 = 3806.8 I3 977.4050 – 2217619.3 (12) 4557.1050.0 2 + 1499. SQ Variedades x Inoculantes = [SQ V.4 + 363.2150 = 1812.2 2 ) − 2217619.2150 = 172067. I1 V1 V2 Totais () os I2 835.0233 – 2217619. Quadro 1.4 2 + 1731. . Foi avaliado o volume estimado (em m /ha) de madeira produzida por 2 espécies de eucalipto.0 2 + 1517.2150 − 137834. e o grau de liberdade (GL) dado por n1 + n2 –2.12 ) − 2217619.0 2334.2150 12 1 (2466.1 7295.4900.2150 6 SQ Bloco = 2221426.12 + 1541. Verifique se há diferença entre as médias das 2 espécies por meio do teste t.12 ) − 2217619.1900 = 27648. Se t ≥ tt.4 2 + L + 1517. SQ Inoculantes = SQ Inoculantes = 2219431.4900 4  36 69 .3200 – 2217619. + 298.2150 = 140612. n1 + n 2 − 2 SQ Bloco = 1 (1819.5 2 + 1941.2150 = 137834. 4 2 + 2334.1 1517. . SQ Total = 238.7267.3 2 + 4557.v) Calcular a variância ponderada s 2 .1067.8 2 + 2494.2 Totais 2738. por meio da expressão: t= y1 − y 2  1 1  2  + s p n   1 n2  SQ Tratamento = 2358231. Espécie 1 1 1 1 1 2 2 2 Volume (m3/ha) 24 26 29 32 38 60 63 71 3 Deve-se montar um quadro auxiliar com os totais de todas as repetições para cada combinação entre os níveis dos fatores.1 + 223. I – C] – SQ Variedades – SQ Inoculantes 1  SQ Variedades x Inoculantes =  (925.1050 – 3806.2150 SQ Total = 2389686. α.8 1499.7267 − 1812. rejeita-se a hipótese Ho e conclui-se que as duas médias em comparação são diferentes.1) − 2217619.7 2 + 1802. viii) Concluir o resultado do teste: Se t < tt. vii) Encontrar o valor Tabelado de t (tt) procurando na Tabela de t o valor correspondente a combinação entre o nível de significância estabelecido.9417 – 2217619.2150 8 SQ Variedades = 2355453.8083 – 140612.6 + .1 2494.8083. SQ Tratamento = 1 (925.4 (8) valores dentro de parênteses correspondem ao número de parcelas que deu origem a cada total.4 (4) 1541.8 – 2217619. aceita-se a hipótese Ho e conclui-se que as duas médias em comparação são iguais.82 ) − 2217619.1900.4 2 + 835.

6 298.5 351.80 − 64.20 e s 2 = 32.9 452.9 442.33 .0 1517. 4. 2 ) = (5 − 1).05.5 1802. vii) tt(1.4 4 163. 5+3−2 29.80 e y 2 = 64.7 231.QME r 5.588.2.588 > 2.0 396. na Tabela unilateral de t.4 835.2) -8.4) = 2217619. Os dados estão apresentados na Tabela 7 a seguir.3) Teste t para comparação de duas médias em uma análise de variância A diferença mínima significante (DMS ou LSD-Least Significant Difference) entre duas médias pelo teste t de é dada por: DMS = t t 2.9 374.6 286. 2 iv) s 1 = 30.5 1941.447.05 e GL = 5 + 3 –2 = 6 ⇒ tt(1.1 7295.5 252.1 223.8 Totais 925. 68 37 .0 205.447 ⇒ Rejeita-se Ho ⇒ Portanto y1 ≠ y 2 (a média da espécie 1 de eucalipto difere da média da espécie 2 de eucalipto ao nível de 5% de probabilidade).2 372.5) são: C= (7295.5 406.7 3 267.2) para α=0. 24 2 em que tt é o valor de t tabelado.4 i) Hipótese de nulidade: Ho: y1 = y 2 . Tabela 7.2150.67. Peso do colmo (ton/ha) para os 6 tratamentos de um experimento em blocos casualizados (DBC). 2 ) = p vi) t (1.91 5 3 = -8.588= 8. iii) y1 = 29.0 217.2) = 2. O QME é o quadrado médio do erro da análise de variância e r é o número de repetições de cada tratamento.peso do colmo (ton/ha).2)> tt(1.6) Croqui de campo BL I BL II BL III BL IV 2 5 3 6 4 2 4 1 1 6 5 3 3 1 2 4 6 4 1 5 5 3 6 2 Assim.5 2 256. em esquema fatorial 2x3 Tratamentos 1 – V1I1 2 – V1I2 3 – V1I3 4 – V2I1 5 – V2I2 6 – V2I3 Totais Repetições 1 238.67 1 1  + 30.1 1541.30.8 403.5. 2 v) s 2 (1.32.7 184.6 347.8 977. ii) α=0.91. viii) Comparando a média da espécie 1 com a média da espécie 2 de eucalipto: t(1.8 1731.0 1499. com 4 repetições.5.6 210.33 = 30. o qual corresponde o valor obtido da combinação entre o nível de significância estabelecido (α) e o grau de liberdade do erro (GLE) da análise de variância.8 347. os valores das somas de quadrados para o exemplo 5.4 363.20 + (3 − 1).3 1819.

(4. incluindo os fatores isolados e as interações duplas.67. triplas e outras entre os fatores.2 i) tt para α=0. A análise estatística e a interpretação dos resultados pode tornar-se um pouco mais complicada que nos experimentos simples.08.5.228 2.9 y 4 = 26. no esquema fatorial 2x3 foi avaliado o efeito de 2 variedades de canade-açúcar (V1 e V2) e 3 tipos de inoculantes (I1.Quando o valor absoluto da diferença entre duas médias for igual ou maior que a DMS.2 y1 = 95.5 y 2 = 87. as médias podem ser consideradas estatisticamente diferentes.5 y 2 = 87.5. sendo preciso lançar mão de algumas técnicas alternativas (como por exemplo. com 3 repetições por linhagem.8 y 3 = 86. começando da diferença entre a maior e a menor média e assim por diante: y 5 =108.08) = 3. 5. (αγ)ik representa a interação entre o efeito do i-ésimo nível do fator α e o efeito do do k-ésimo nível do fator γ e eijk representa o erro experimental associado à observação yijk.3) Desvantagens como os tratamentos correspondem a todas as combinações possíveis entre os níveis dos fatores. mas pode ser estendido para os casos em que há mais fatores. O valor do grau de liberdade do erro (GLE) foi 10 e o quadrado médio do erro (QME) foi 4. Exemplo 14.3 38 67 . não podendo ser distribuídos em blocos completos casualizados devido à exigência de homogeneidade das parcelas dentro de cada bloco.228. Foi realizada a análise de variância para os dados de porcentagem de absorção de água de 5 linhagens de feijão.8 y 3 = 86. γ representa o efeito do k-ésimo nível do fator γ. I2 e I3) quanto ao iii) Coloque as médias em ordem decrescente e faça a diferença entre elas duas a duas. o número de tratamentos a ser avaliado pode aumentar muito. suposto ter distribuição normal com média zero e variância comum. µ representa uma constante geral. 5.5) Exemplo de fatorial Em um experimento em blocos casualizados com 4 repetições. y1 = 95. y ijk é o valor observado referente a parcela que recebeu o i-ésimo nível do fator α e o k-ésimo nível do fator γ no j-ésimo bloco. αi representa o efeito do i-ésimo nível do fator α. Isto pode levar a complicações na análise. Compare as médias dos tratamentos a seguir pelo teste t: 5.3 y 5 = 108. ii) DMS = 2. βj representa o efeito do j-ésimo bloco.4) Modelo estatístico do fatorial O modelo a seguir corresponde a um modelo de um delineamento em blocos casualizados (DBC) em esquema fatorial com 2 fatores (α e γ).5. 3 y ijk = ì + β j + α i + γ k + (αγ ) ik + e ijk em que.05 e GLE = 10 ⇒ tt = 2. o uso de blocos incompletos).9 y 4 = 26.

e podem ser instalado em qualquer dos delineamentos experimentais. Costuma-se representar o fatorial pela multiplicação dos níveis. As categorias (subdivisões) de cada fator são ditas níveis do fator.67 ⇒ 7.9 y 3 . BR 9004 e BR 4812) e o efeito de um determinado fungo (presença e ausência do fungo) na variável número de nódulos produzido pelo feijão.5. (Banzatto & Kronka. o primeiro fator com 3 níveis de estirpe e o segundo com 2 níveis de fungo.y 3 = 95.M.y 3 = 108.Permite estudar os efeitos principais dos fatores e os efeitos das interações entre eles.9 y 5 .2) Vantagens . iv) Coloque letras iguais para médias semelhantes e letras distintas para médias que diferem entre si e interprete o teste.6 y1 .y 4 = 108. etc.67 ⇒ 8.67 ⇒ 0. assim fica claro que existem dois fatores.2 a y1 = 95.2 > 3. Neste caso. 5. o pesquisador avalia dois ou mais tipos de tratamentos e deseja verificar se há interação entre estes tipos.2-26.2-86.67 ⇒ 61. 4. considere um experimento em que se comparou o efeito de 3 estirpes de rizóbio (BR 9001.9 = 0.5-86.y 3 = 87. y3 ≠ y 4 .9 > 3. 3 fatores com 5.3 d A linhagem 5 foi a que apresentou maior porcentagem de absorção de água diferindo das demais linhagens (Prob < 0.3 = 69. 4: BR 9001 na ausência do fungo. 6: BR 4812 na ausência do fungo.y 4 = 87. 1989). O número total de tratamentos avaliados também é dado pela multiplicação dos níveis.2-87.5. BR 9004 e BR 48122) e do fungo são 2 (presença e ausência).1) Características Em alguns experimentos.5 =12.6 ⇒ 81. y 5 ≠ y1 .5-26.y 4 = 95. y 5 =108. Os níveis do fator estirpe são 3 (BR 9001.5) Experimentos fatoriais 5. y5 ≠ y 2 . y1 ≠ y 4 .3) Teste de Tukey A diferença mínima significante (D.7 y 2 .67 ∴ ∴ ∴ ∴ ∴ ∴ ∴ ∴ ∴ ∴ y5 ≠ y 4 . existem dois fatores: estirpe de rizóbio e a ocorrência do fungo.3 y 5 .9 = 21. a representação seria: fatorial 5x2x3.y1 = 108.9 < 3.8 c y 3 = 86.5 y 2 . y 5 .9 c y 4 = 26.y 2 = 108. 2 e 3 níveis para cada fator respectivamente.5 > 3. Tais experimentos são denominados experimentos fatoriais e os tipos de tratamentos são denominados fatores. 2: BR 9004 na presença do fungo. DIC.3 = 81. sendo avaliado um total de 30 tratamentos e assim por diante.7 > 3. y5 ≠ y3 .2 y1 .8-26.8 = 20. Como exemplo.3 = 61.67 ⇒ 60.9 = 8. no exemplo são avaliados 3x2 = 6 tratamentos avaliados (1: BR 9001 na presença do fungo. por exemplo.3 > 3.5.2-95. y1 ≠ y 3 .5-87.67 ⇒ 12. 5: BR 9004 na ausência do fungo.) entre duas médias pelo teste de Tukey é dada por: 66 39 . DBC. ou seja.3 = 60.6 > 3.5 b y 2 = 87. y 2 = y3 .05).9-26.y 4 = 86. y1 ≠ y 2 .6 > 3.8-86.67 ⇒ 21.8 = 7. y2 ≠ y4 . 3: BR 4812 na presença do fungo. Vale lembrar que os experimentos fatoriais não são delineamentos e sim um esquema de desdobramento de graus de liberdade de tratamentos.4 > 3.S. No exemplo anterior o fatorial é 3x2 (fatorial 3 por 2).4 y 5 .y 2 = 95.67 ⇒ 69. Se fossem.7 > 3.67 ⇒ 20.7 y1 .

0700 – 70460.2 > 5.4 Número de observações: 20 SQ 355.y 2 = 7.y 3 = 21.9540 2748.3935. y1 .3205 = 2748.83 59.y 4 = 81. y1 ≠ y 2 . y5 ≠ y3 .42 y 2 .42 ∴ ∴ y5 ≠ y 4 .4020 728.65. .7978 138.7140 – 70460. 1 SQ Tratamento = (291.9 > 5. ou seja.05.3205 5 SQ Tratamento = 71188. Exemplo 15: Compare as médias dos tratamentos do Exemplo14 pelo teste de Tukey.DMS = q QME r em que q é um valor tabelado.9540. conclui-se que as quatro coberturas mortas tiveram influência semelhante no peso seco do brócolis.7 > 5. as médias podem ser consideradas estatisticamente diferentes.3935 1664.12 + 343.728. então.3205 = 355.8 2 + 215.4 > 5.0 2 ) − 70460.32 + . SQ Erro = 2748. y 2 = y3 . i) q para α=0.640 1. ii) DMS = 4. se F for não significativo.9 < 5.82 + 58. para um nível de significância estabelecido (α).42 ∴ y1 ≠ y 4 .y1 = 12. y3 ≠ y 4 .42.y 2 = 20.42 y 2 .y 3 = 0.3205 SQ Total = 73209.750 Prob>F 0.6 2 + 259.3935 = 1664. y 5 .6 2 + 250.7 2 + 249.6441 0. Neste caso. o pesquisador poderá optar ou não pelo uso do teste e. não há necessidade de aplicação de um teste de comparação múltipla.4.y 4 = 60.y 4 = 61.02 – 70460. y2 ≠ y4 .5 > 5.7495 – 355.7495 QM 88.7 > 5.7462 F 0. + 27.42 y1 .42 ∴ ∴ ∴ ∴ ∴ y1 ≠ y 3 .5) é: FV Bloco Cobertura morta GL 4 3 12 19 19.0 2 + 218.8505 242. diz-se então que o teste usado é protegido. y1 .3205 4 SQ Bloco = 70815. diz-se que o teste é não protegido. quando o valor absoluto da diferença entre duas médias for igual ou maior que a DMS.2100 4.6 > 5. o qual corresponde o valor obtido da combinação entre o número de tratamentos (I) e o grau de liberdade do erro (GLE) da análise de variância. caso contrário.6 2 ) − 70460.4020. Observação: Se o valor de F para tratamento for significativo a determinado nível α de significância.7495. Erro Total CV (%) = Média geral: y 5 .42 y 5 .y 4 = 69.42 ∴ y 5 ≠ y1 . SQ Total = 72. A interpretação é a mesma do teste t.08 = 5.42 ∴ y 5 ≠ y 2 . 65 . 1 SQ Bloco = ( 253. I = 5 tratamentos e GLE = 10 ⇒ q = 4.8 2 + 291.65 3 iii) y 5 .3 > 5.6 > 5.42 y 3 .7225 – 70460. E o quadro de análise de variância para os dados do Exemplo 5.42 + 39.y 3 = 8. .4020 . 40 Como Prob > 0.05 para cobertura morta. o pesquisador pode usar um teste de comparação múltipla para comparar as médias dos tratamentos (caso este seja qualitativo).3205 = 728. O QME e r já foram descritos no teste t.

r CV(%)= QMErro .J DMS = z n QME . e o grau de liberdade do erro (GLE) da análise de variância. quando o valor absoluto da diferença entre duas médias for igual ou maior que a D. . Assim. ou seja. o qual corresponde ao valor obtido da combinação entre o número de médias ordenadas abrangidas na comparação (n).Repetições: J = 5.Tratamentos: I = 4 tipos de cobertura morta (sorgo.J i . o número (n ) de médias ordenadas abrangidas na comparação. O QME e r já foram descritos nos testes anteriores.8 c y 3 = 86. O que diferencia uma DMS da outra é o valor de zn que é um valor tabelado.Delineamento: DBC.S.Variável a analisar: peso seco (g/parcela).5.3 d 1 J 2 ∑ Bj − C I j=1 1 2 ∑ Ti − C J i =1 I SQBloco/GLBloco QMBloco/QMErro 4.4. A única diferença é que na comparação entre duas médias deve-se considerar o valor de DMS correspondente ao n em questão. porém aqui.3. se estão envolvidos I tratamentos no estudo.5) tem-se: . 64 41 . .4) Teste de Duncan SQTrat. crotalária.M. os valores das somas de quadrados para o exemplo 5.4.100 y I .J No exemplo 5./QMErro A diferença mínima significante (DMS) entre duas médias pelo teste de Duncan é dada por: SQTotal -SQBlocoSQTrat.2 a y1 = 95.5 b y 2 = 87.9 c y 4 = 26. as médias podem ser consideradas estatisticamente diferentes. j=1 y = ∑ y ij / I. milheto e vegetação espontânea). é necessário calcular I-1 DMS’s. observando assim. i . Com o exemplo seguinte ficará mais fácil o entendimento. A interpretação é a mesma dos testes anteriores. .7) Esquema de análise de variância do DBC com fontes de variação e graus de liberdade Considerando a mesma representação da Tabela 5./GLTrat SQErro/GLErro QMTrat.5) são: No teste de Duncan. j=1 2 ∑ y ij − C I . Para realização deste teste deve-se também ordenar as médias em ordem decrescente e ir fazendo a diferença sempre entre a maior e menor média. as repetições representam os blocos. ao nível de significância estabelecido (α). o quadro de análise de variância para os dados de um delineamento em blocos casualizados (DBC) é expresso de uma maneira geral por: FV Bloco Tratamento Erro Total GL J-1 I-1 (I-1)(J-1) IJ-1 SQ QM F iv) y 5 =108.

4 2 69.5 67.1 72.08 DMS5 = 3.4 51.293. ou seja. é necessário o cálculo de zI = z5 até z2: z5 para α=0.3205 n = 4.4. z2 para α=0.08 DMS 2 = 3.0 259.0 292. z4. 293 4. n = 4 e GLE = 10 ⇒ z4 = 3.8 215.Exemplo 16: Compare as médias dos tratamentos do Exemplo 14 pelo teste de Duncan.3 4 66.6 250.0 1187.430 = 4. 3 iii) Lembrando que as médias colocadas em ordem decrescente são: y 5 =108.00 .376.8 y 3 = 86. 3 5.1)2/20 = 70460.1 73. z3.9 C= Total 253.4 59.05.08 = 3.430. 63 .6 59.3 42 A disposição dos tratamentos é realizada de forma aleatória dentro dos blocos.5 = 20 4.8 58.4 39.8 3 45.05.7 249.94 .5 y 2 = 87.05.6 58. 3 DMS 4 = 3.6 65.84 . i) Como no exemplo tem-se I=5 médias de tratamentos é necessário calcular z5.2 52.8 68. 2: crotalária.0 64.3 50. n = 2 e GLE = 10 ⇒ z2 = 3.6 51. n = 5 e GLE = 10 ⇒ z5 = 3.0 291. 3: milheto e 4: vegetação espontânea) Rep.376 DMS3 = 3.9 y 4 = 26. z3 para α=0.2 y1 = 95.4 (1187.3 60.2 66. ii) Calcula-se então as I-1= 4 DMS’s: Tabela 6.9 67.05.151.0 343. n = 3 e GLE = 10 ⇒ z3 = 3. Peso seco (kg/parcela) de brócolis em um experimento em blocos casualizados (DBC) com 5 repetições em que foi avaliada a influência de 4 tipos de cobertura morta (1: sorgo.67. e z2 .08 = 3.1 58.3 27. z4 para α=0.1 59. 1 2 3 4 5 Total Média Correção (C) n 1 72. 3 4. \ Trat.0 218.6) Croqui de campo BL I BL II BL III BL IV BL V 2 4 2 3 1 3 1 1 2 4 1 2 4 1 3 4 3 3 4 2 4.151 = 3.

y 5 .7 com a DMS2 ⇒ y1 .67 ∴ y1 ≠ y 2 .5 com a DMS3 ⇒ y 2 .2) Vantagens .00 ∴ y 5 ≠ y 4 .5 b y 2 = 87.5) Exemplo de DBC Estudou-se a influência de 4 tipos de cobertura morta (sorgo.84 ∴ y ij = ì + b j + t i + e ij em que. 61.5.4.Há uma redução no número de graus de liberdade do erro pois o DBC utiliza o princípio do controle local.5 > 3.94 ∴ 20. y 2 .y 3 = 8.9 y 5 .3 com a DMS4 ⇒ 21. crotalária.y 4 = 61. ti representa o efeito do i-ésimo tratamento.5 ⇒ n = 3 ∴ compara-se 61.2 > 3. .9 > 4.y 4 = 69.4.y1 = 12.9 y 3 .y 2 = 7.4 ⇒ n = 3 ∴ compara-se 20.94 ∴ ∴ y5 ≠ y3 . 5.y 2 = 20. y 5 ≠ y1 .y 4 = 60.6 com a DMS2 ⇒ 60. 5. Os dados de peso seco estão dispostos na Tabela 6 a seguir.8 c y 3 = 86. uma vez que a variação ambiental entre blocos é isolada.9 c y 4 = 26. y1 ≠ y 4 .Leva a uma estimativa mais exata da variância residual ( σ ).y 4 = 81.6 y1 .7 > 3.9 com a DMS5 ⇒ 81.67 ∴ iv) Coloque letras iguais para médias semelhantes e letras distintas para médias que diferem entre si e interprete o teste. milheto e vegetação espontânea) no peso seco de brócolis.3 > 3.67 ∴ 69.4)Modelo estatístico do DBC ⇒ n = 4 ∴ compara-se 21.67 ∴ y 2 = y3 . 5.4 > 3.7 ⇒ n = 2 ∴ compara-se 12.5) Teste de SNK (Student Newman Keuls) A diferença mínima significante (DMS) entre duas médias pelo teste de SNK é dada por: 62 43 . y 5 =108. y ⇒ n = 2 ∴ compara-se 60.2 com a DMS4 ⇒ y1 .6 y2 ≠ y4 .84 ∴ 12.84 y1 ≠ y 3 .3 ⇒ n = 5 ∴ compara-se 81.2 ⇒ n = 4 ∴ compara-se 69. O experimento foi instalado em DBC com 5 repetições.Controla diferenças nas condições ambientais de um bloco para outro. bj representa o efeito do j-ésimo bloco.2 a y1 = 95.4. não podendo ser muito elevado.7 > 3. y3 ≠ y 4 .9 com a DMS2 ⇒ 0.y 3 = 0. µ representa uma constante geral associada a esta variável aleatória. ⇒ n = 2 ∴ compara-se 0.6 > 3.6 > 3.9 < 3.7 ⇒ n = 3 ∴ compara-se 8. E as diferenças entre elas duas a duas: y 5 .y 3 = 21. suposto ter distribuição normal com média zero e variância comum.7 com a DMS2 ⇒ 7. ⇒ n = 2 ∴ compara-se 7.4 com a DMS3 ⇒ y 5 .O número de tratamentos a ser utilizado é limitado pela exigência de homogeneidade dentro dos blocos. e eij representa o erro experimental associado a observação yij.4. y5 ≠ y 2 .6 com a DMS3 ⇒ 8.3) Desvantagens .3 d 4. ij representa a observação do i-ésimo tratamento no jésimo bloco. ˆ2 .

n = 5 e GLE = 10 ⇒ q5 = 4.33.42 . q4 para α=0. Exemplo 17.05.08 = 5. ii) Calcula-se então as I-1= 4 DMS’s: Como Prob < 0. repetição e controle local e. Normalmente.0178 28333. correspondente a combinação entre o número de médias abrangidas na comparação (n) e o grau de liberdade do erro (GLE) da análise de variância. e q2 . q3.15. n = 2 e GLE = 10 ⇒ q2 = 3. conclui-se que há diferença estatística significativa entre as médias de peso seco da parte aérea das quatro variedades de cana-de açúcar. podendo haver heterogeneidade entre blocos.4) Delineamento em Blocos Casualizados (DBC) 5. as repetições são organizadas em blocos. deve-se procurar o valor tabelado na Tabela de q ao nível de significância estebelecido (α).05 (valor fornecido por alguns programas computacionais de análise de variância). A eficiência do DBC depende da uniformidade dentro de cada bloco.3. 3 4.65 DMS 4 = 4. Os blocos podem ser instalados na forma quadrada.DMS n = q n QME . DMS5 = 4.0330 15314. retangular ou irregular.31 Número de observações: 24 SQ 13019. ou seja.67. 3 44 61 . Deve-se então aplicar algum dos testes de comparação múltipla nestas médias. é necessário calcular q5.05 .05. 3 DMS2 = 3. q4.41 150.668 Prob>F 0.6776 765. r E o quadro de análise de variância para os dados do Exemplo 5.5) é: FV Variedades Erro Total CV (%): Média: y : GL 3 20 23 18. é necessário o cálculo de qI = q5 até q2: q5 para α=0.0056 O procedimento para a realização deste teste é bastante semelhante ao do teste de Duncan.7009 F 5. 5.52 . desde que seja respeitada a uniformidade dentro do bloco. é o delineamento mais utilizado em condições de campo. 3 4. ou seja.1) Características Os tratamentos são distribuídos aleatoriamente em blocos (princípio do controle local) de modo que haja maior uniformidade possível dentro de cada bloco. ou seja.05.15 4. n = 3 e GLE = 10 ⇒ q3 = 3.0508 QM 4339. n = 4 e GLE = 10 ⇒ q4 = 4. cada bloco deverá conter todos os tratamentos.4. O número de parcelas por bloco é igual ao número de tratamentos. O DBC possui os três princípios básicos da experimentação: casualização. i) Como no exemplo tem-se I=5 médias de tratamentos. q2 para α=0.08 = 3. portanto.08 = 4. Compare as médias dos tratamentos do Exemplo 14 pelo teste de SNK.88.88 4.33 DMS 3 = 3. q3 para α=0.08 = 5.05. A diferença é que nas DMS’s do SNK são usados os valores tabelados de qn ao invés de zn.65.

⇒ n = 2 ∴ compara-se 0.3. F QMTrat.y 4 = 60.15 ∴ 60 45 . os valores das somas de quadrados para o exemplo 5. Assim. SQ Erro = 28333.542207.4 > 3.3 com a DMS4 ⇒ 21. y 5 .O quadro de análise de variância para os dados da Tabela 5 é: FV Tratamento Erro Total CV(%)= QMErro .J i . ⇒ n = 2 ∴ compara-se 7.6 y1 .y 3 = 8.88 ∴ y5 ≠ y 4 .9 y 4 = 26.9 y2 ≠ y4 .6 > 3.9 < 3.3 > 4.0508.y1 = 12. y5 ≠ y 2 . .y 4 = 69.4 ⇒ n = 3 ∴ compara-se 20.y 3 = 21.15 ∴ y1 ≠ y 2 .33 ∴ 20.0330.59 2 + 1005.87 2 + 922.y 3 = 0.5 > 3.7 com a DMS2 ⇒ 12.9 com a DMS2 ⇒ 0.5 com a DMS3 ⇒ y 2 .y 2 = 7.2 com a DMS4 ⇒ 69.25 SQ Total = 570540.3.9 > 4.3017 .7 com a DMS2 ⇒ 7.5) tem-se: .592 + 153. . y1 ≠ y 4 .100 y GL I-1 I(J-1) IJ-1 SQ QM SQTrat.Tratamentos: I = 4 variedades de cana-de-açúcar (A.6 ⇒ n = 2 ∴ compara-se 60.0178.7 > 3.5) são: SQ Tratamento = 1 (667.59 2 ) − 542207.832 + 133.892 + .Repetições: J = 6.25 09 6 SQ Tratamento = 555226.y 4 = 81. + 922.6 com a DMS2 ⇒ 60. y 3 .5 y 2 = 87.0330 = 15314.2 > 4.88 ∴ y1 ≠ y 3 .15 ∴ y 2 = y3 .28389 – 542207.0508 – 13019. .65 ∴ ⇒ n = 4 ∴ compara-se 21. No exemplo 5.y 4 = 61.2509 = 13019. SQ Total = 113. D).Variável a analisar: peso seco da parte aérea (g/parcela).15 ∴ ⇒ n = 4 ∴ compara-se 69.9 com a DMS5 ⇒ 81.7 ⇒ n = 2 ∴ compara-se 12.J y 5 =108./QMErro iii) Lembrando que as médias colocadas em ordem decrescente são: 1 I 2 ∑ Ti − C J i =1 2 ∑ y ij − C I . y 5 ≠ y1 .5 ⇒ n = 3 ∴ compara-se 61.7 y1 . C.33 ∴ ⇒ n = 3 ∴ compara-se 8./GLTrat.y 2 = 20. j=1 I .6 > 3. .30 2 + 1011.9 y 5 . y3 ≠ y 4 .Delineamento: DIC.772 – 542207. .3 E as diferenças entre elas duas a duas: SQTotal –SQTrat. y5 ≠ y3 . 61.2509 = 28333.2 y1 .6 com a DMS3 ⇒ 8. SQErro/GLErro i .8 y 3 = 86.4 com a DMS3 ⇒ y 5 .7> 3. B.88 ∴ y 2 . j=1 y = ∑ y ij / I.3 ⇒ n = 5 ∴ compara-se 81.J y 5 .2 y1 = 95.

3. é fácil obter todos os grupos. A disposição das repetições de cada tratamento é realizada de forma totalmente aleatória às parcelas.5 b y 2 = 87. i) Determinar a partição entre dois grupos que maximiza a soma de quadrados (SQ) entre grupos. isto é. Contudo. Para atenuar esse problema. B e C. o número de grupos cresce exponencialmente. A.J  i . que maximize a soma de quadrados. em dois grupos. 1 2 3 M J Total Média Correção (C) n 1 y11 y12 y13 M y1J T1 2 y21 y22 y23 M y2j T2 3 y31 y32 y33 M y3j T3 L L L L M L L L y 5 =108. A vs B e C.J i . Com um número pequeno de tratamentos como o do exemplo. J c =  ∑ y ij  / I.v) Coloque letras iguais para médias semelhantes e letras distintas para médias que diferem entre si e interprete o teste.3 d 4. Seja por exemplo 3 tratamentos..J   I. Veja que nesse caso são possíveis 2n-1 grupos. j=1  2 n=IJ 46 59 .9 c y 4 = 26. Nessa situação. Tabela 5. dificultando a aplicação do teste. \ Trat. fazendo inicialmente o número de tratamentos envolvidos no grupo de médias considerado(g) igual ao o número total de tratamentos (n). Seja T1 e T2 os totais dos I yi1 yi2 yi3 M yij TI dados de um i =1 ∑ Ti = ∑ y ij i =1 I . Representação esquemática delineamento inteiramente casualizado Rep. 2000). procedese do seguinte modo. j=1 I I y1 y2 y3 yI y = ∑ y ij / I. o número de partições possíveis passa a ser obtido por n-1.6) Teste de Scott-Knott O procedimento de Scott e Knott (1974) utiliza a razão de verossimilhança para atestar a significância de que os n tratamentos podem ser divididos em dois grupos que maximizem a soma de quadrados entre grupos (Ramalho et al. 5. O processo consiste em determinar uma partição.8 c y 3 = 86.7) Esquema de análise de variância do DIC com fontes de variação e graus de liberdade Imagine um experimento com I tratamentos e cada tratamento com J repetições representado na Tabela a seguir.2 a y1 = 95. Uma vez ordenada as médias. basta ordenar as médias dos tratamentos. B vs A e C e C vs A e B. quando o número (n) de tratamentos é grande.

1 2 3 4 5 6 Total Média Correção (C) n A 113.6) Croqui de campo C D C B C A A D A C A C B C D B D D B A B A B D em que v é o grau de liberdade do erro associado a este estimador.15 101.3.00 180.6 = 24 dos dois grupos com k1 e k2 tratamentos em cada um.22 95.76 157.23 187. y é a média das médias dos g tratamentos e s 2 = QME é o y r estimador não viesado de σ 2 . sendo QME o quadrado médio do y erro e r o número de repetições.59 1005.89 96. )2 2(π − 2) σ o 667.76 156.35 (total geral) 2 em que σ o é o estimador de máxima verossimilhança de σ 2 dado y por: )2 σo = 1 g 2 2 i∑ ( y (i ) − y) + v.16 127. O delineamento foi o inteiramente casualizado com 6 repetições. iii) Se λ ≥ χ (2α .g /( π − 2 )) é um valor tabelado obtido na Tabela de 58 47 .61 168. C e D) em um delineamento inteiramente casualizado com 6 repetições Rep. sendo g o número de tratamentos envolvidos no grupo de médias considerado.g /( π− 2 )) rejeita-se a hipótese de que os dois grupos são idênticos em favor da hipótese alternativa de que os dois grupos 2 diferem.65 153.s y  g + v  =1  5. Cada parcela era constituída de 1 vaso com 3 plantas.79 167.3.83 133.27 B 174.89 181.31 (média geral) C= (3607.94 192.39 166.17 213.44 121.30 1011.70 144. B. a soma de quadrados Bo é estimada por: T12 T22 (T1 + T2 ) 2 Bo = + − k1 k 2 k1 + k 2 T1 = ∑ y (i ) e T2 = ∑ y ( i ) i =1 i = k1 +1 k1 g em que y (i ) é a média do tratamento da posição ordenada i.34 111. O experimento foi instalado em casa de vegetação.77 150. \ Trat.55 C 86. ii) Determinar o valor da estatística λ: λ= ) Bo π . Os dados de peso estão dispostos na Tabela a seguir: Tabela 4.65 177.5.35 144.59 3607. Os dois grupos deverão ser identificados por meio da inspeção das somas de quadrados das g-1 partições possíveis.2509 n = 4.69 D 131. Peso seco da parte aérea (g/parcela) de 4 variedades de cana-de-açúcar (A.88 174.57 178.87 922. χ (α .94 168.35)2/24 = 542207.5) Exemplo de DIC Suponha que foi avaliado o peso seco da parte aérea (g/parcela) de 4 variedades de cana-de-açúcar.

correspondente a combinação entre o nível de significância estebelecido (α) e o valor dado por g/(π-2) .3. O ideal é que os tratamentos sejam igualmente repetidos. com números de repetições diferentes entre tratamentos. suposto ter distribuição normal com média zero e variância comum. Agora vamos aplicar o algoritmo do teste de Scott e Knott nas médias do Exemplo 14 em que o quadrado médio do erro foi de 4.6400 .3.5 + 108.6900 + 35796.2) 5 2 - .2) Vantagens .9 + 87. O processo em cada subgrupo se encerra ao se aceitar Ho no passo iii) ou se cada subgrupo contiver apenas uma média. o que não leva a grandes alterações n a análise de variância.3 2 1 + (86. iv) No caso de rejeitar esta hipótese.2 lembrando que y (i ) é a média do tratamento da posição ordenada i..2) 2 4 − ( 26. como se esperava antes da instalação do experimento. a precisão do experimento. Se as condições não forem uniformes.9 + 87.8 + 95.Exige homogeneidade das condições experimentais. y 4 = y (1) = 26. 5.3..Possui grande flexibilidade quanto ao número de tratamentos e repetições. etc. (3). 5. fazendo respectivamente g=k1 e g=k2.3 y 3 = y ( 2) = 86. sendo dependente. toda variação (exceto à devida a tratamentos) irá para o erro. 48 57 .9 y 2 = y (3) = 87.32756.4180 = 3731.Considerando o mesmo número de parcelas e tratamentos avaliados. Pode-se ter DIC não balanceado.). da quantidade de material e área experimental disponíveis. A instalação do DIC no campo experimental exige uma certa homogeneidade das condições ambientais (como por exemplo quanto a fertilidade do solo. ti representa o efeito do i-ésimo tratamento. e eij representa o erro experimental associado a observação yij. é o delineamento que possibilita o maior grau de liberdade do erro.08 com 10 graus de liberdade. distribuição uniforme de água.3 + 86. e as médias das 5 linhagens de feijão estimadas a partir de 3 repetições foram: alternância das parcelas evita-se uma possível vantagem de algum tratamento. com i = 1.4) Modelo estatístico do DIC y ij = ì + t i + e ij em que.8 + 95. Bo = 691.8 y1 = y ( 4) = 95.. Exemplo 18. 5. (4) e (5) Bo = 26.Qui-quadrado (encontrada em alguns livros de estatística).. ou seja. entretanto.5 + 108. portanto. os dois subgrupos formados serão independentemente submetidos aos passos i) a iii). µ representa uma constante geral associada a esta variável aleatória. aumentando sua estimativa e reduzindo.3) Desvantagens . mas os testes de comparações múltiplas passam a ser aproximados e não mais exatos. i) SQ da partição (1) vs (2). y ij representa a observação do i-ésimo tratamento na jésima repetição. 5.5 y 5 = y (5) = 108.9120.

3) Delineamento Inteiramente Casualizado (DIC) 5. existem alternativas que podem ser usadas.0000 + 20746.2 2 − ( 26.94) + .32756.3 + 86. ii) Considerando g=5. onde há possibilidade de controle das condições ambientais.3 + 86.4270.8 + 95. Estas pressuposições visam facilitar a interpretação dos resultados e testar a significância nos testes de hipóteses.2120 + 13. (4) e (5) Bo = (26.O DIC possui apenas os princípios da casualização e da repetição. 3  5 + 10   1 ) σ 2 = [4023.5 + 108.4180 = 1457.9) 2 2 + (87.8845.08  1  2 2 (26. neste caso.1208 56 49 .2) 2 5 Bo = 13467.5. SQ da partição (1) e (2) vs (3).Normalmente é mais utilizado em experimentos de laboratório.9 + 87. entre elas a transformação de dados com a posterior análise de variância destes dados transformados.6000] = 269. SQ da partição (1). Na prática.5 + 108. iniciaremos agora os conceitos e exemplos dos delineamentos mais usuais.94) + 10.1200 + 28324.0833 .9 + 87. =19.4180 = 928. ou a utilização dos recursos da estatística não paramétrica.0806.8 + 95.2) 2 2 − (26. v=10 e y = 26.1) Características . + (108.32756.3 + 86.4180 = 1974. o pesquisador não perderia tanto com a aproximação visto que os testes aplicados na análise de variância são robustos quanto a isto.3 + 86.8 + 95. caso não seja verificada.5) 2 A partição (1) vs (2).4) Homogeneidade: os erros devem apresentar variâncias comuns (homogeneidade = homocedasticidade de variâncias).0625 + 11707.Os tratamentos são distribuídos nas parcelas de forma inteiramente casual (aleatória). experimentos em vasos ou bandejas em casa de vegetação.3 + 86.9 + 87.9 + 87.2) 2 3 − ( 26.2400 . (2). Feitas as considerações iniciais necessárias para o entendimento dos próximos assuntos.. Com esta tem-se: )2 σo = 4. (3) e (4) vs (5) ( 26. .8 + 95.8 + 95.5 + 108.2. na maioria das vezes. (4) e (5) foi a que maximizou a soma de quadrados entre grupos (Bo = 3731.1208 o 15 λ= π 3731. não possuindo controle local e. (2) e (3) vs (4) e (5) Bo = (26. o teste F e de comparações múltiplas poderão ser alterados.9 + 87. Quando alguma (s) das pressuposições da análise não se verifica(m).7853. . Bo = + 108.5 + 108.3 − 80. as repetições não são organizadas em blocos.2) 2 5 Bo = 6407.8) 2 3 + (95. Nos experimentos em casa de vegetação recomenda-se constantemente mudar as parcelas de posição para evitar diferenças ambientais devido a posição da parcela na casa de vegetação.94 5 5.3. SQ da partição (1).32756.9 + 87. é necessária pois.2 − 80.8450 .9120 ..3 + 86.2 = 80.9120).2) 2 4 1 5 Bo = 21978. (3).5 + 108.3 + 86.5 + 108. portanto. o que pode ocorrer é a validade aproximada e não exata de alguma (s) destas pressuposições. A homogeneidade de variância é que.8 + 95. 2(π − 2) 269.

2500. Bo = 24336.8) 2 (95. SQ da partição (2).5) 2 108. SQ da partição (2) e (3) vs (4) e (5) (86.089.5 + 108. 86.5 + 108.2.0450 + 20746.8 + 95. por exemplo.2) Pressuposições básicas da análise de variância Para realização de uma análise de variância deve-se aceitar algumas pressuposições básicas: 5. o princípio do controle local é o reconhecimento de padrões supostamente associados às parcelas. Alguns programas computacionais elaboram planilhas de campo já com os tratamentos aleatorizados. Deve-se então repetir o algoritmo apenas para os subgrupos que contém mais de um tratamento.8 + 95.2) 2 Bo = + − 2 2 4 2 Bo = 15260. 50 55 . Com isso. 1983).3) Controle local: a idéia básica do controle local é a partição do conjunto total de parcelas em subconjuntos (blocos) que sejam os mais homogêneos possíveis. 380 ) é 10.9 + 87. 2) 2 Bo = + − 1 3 4 2 Bo = 7551. a casualização evita que determinado tratamento seja favorecido e garante que os erros sejam independentes (Mead & Curnow. (4) e (5) seria possível realizar testes de hipóteses.9 + 87. 2) (86.2) Independência: os erros devem ser independentes.2.35796. (3) e (4) vs (5) foi a que maximizou a soma de quadrados entre grupos (Bo = 246. como por exemplo o MSTAT.9 + 87. pelo número de tratamentos que serão comparados.6133).6400 = 79.1. 5.5 + 108. 5.9 + 87. possibilita uma boa estimativa do erro experimental. entre outros fatores.8450 .2. (3) e (4) vs (5) (86. pela disponibilidade de material e de área experimental.3) Normalidade: os erros devem ser normalmente distribuídos. A partição (2).2400 . O uso de um número adequado de repetições. 5 /( π− 2 )) = χ (20.O valor de χ 20.1.2 (86. ou seja dois grupos são formados ao nível de 5%. 5. SISVAR e outros.8 + 95.1) Aditividade: os efeitos de tratamentos e erro devem ser aditivos.089 ( rejeita-se Ho.6400 = 210.8 + 95. o número de repetições pode ser limitado. 5. Este princípio é utilizado para atenuar problemas de heterogeneidade ambiental (por exemplo de solo. de distribuição de água no caso de experimentos irrigados. No entanto. 4 . 2) 2 + − Bo = 3 1 4 2 5.35796.8 + 95. ou seja. a probabilidade de que o erro de uma observação qualquer tenha um determinado valor não deve depender dos valores dos outros erros. melhorando as estimativas de interesse. 05 .9 + 87. no caso apenas para o grupo 2.5 + 108.9 2 (87. Como λ > 10.2) Casualização: refere-se à distribuição aleatória dos tratamentos às parcelas de modo que todas as parcelas tenham a mesma chance de receber qualquer um dos tratamentos.6133.6400 = 246.35796.0833 .2) (86. 05 . 2=(3). Para Hinkelmann & Kempthorne (1994).5 + 108.6100 + 28324. 1=(4) e 5=(5). o grupo 1 com apenas o tratamento (linhagem) 4=(1) e o grupo 2 com os tratamentos 3=(2). etc).0133 + 11707.0533. i) SQ da partição (2) vs (3).

ii) Teste de Tukey:  1 1  QME DMS = q  + .6000] = 21.60) + .2 − 94. 3  4 + 10   )2 1 σ o = [291.253.0417.8) 2 95. ou seja dois grupos são formados ao nível de 5%.253 ( rejeita-se Ho. 2=(3) e 1=(4) e o grupo 2 com apenas o tratamento 5=(5).5810.0133 = 44. + (108. r r  2  i i'  iii) Teste de Duncan: ii) Considerando g=4.504 ) é 10.0133 = 15.. ' 2 O valor de χ ( 0.8 + 95. efeitos de aninhamento e resíduo (erro). Deve-se então repetir o algoritmo apenas para o grupo 1. possibilitando.9 2 (87.1) Princípios básicos da experimentação Os delineamentos experimentais clássicos são baseados nos três conceitos a seguir.60) + 10.3000 + 13. efeitos de interações entre fatores.2 = 94.2817).6133 π .5) (86. estimar o erro experimental sem o qual não 54 (86. 3. 2(π − 2) 21.5) 2 Bo = + − 1 2 3 2 Bo = 7551. Os tratamentos devem ser repetidos.8 + 95. antes de partirmos para exemplos de análises de variância.8 + 95. 86.5 + 108. o grupo 1 com os tratamentos (linhagens) 3=(2). v=10 e y = tem-se: 86. =15.1.1) Repetição: refere-se ao número de parcelas que receberão um mesmo tratamento. Como λ > 10.5 (86. respectivamente.0450 + 9120. 05 .6100 + 16799. estabelecidos por Fisher (1935). 4 /( π− 2 )) = χ 20 .5) 2 + − Bo = 2 1 3 2 Bo = 15260. r r  2  i i'  com ri e ri ' sendo o número de repetições do tratamento i e i . 51 .8 + 95. SQ da partição (2) e (3) vs (4) 5. Para facilitar o entendimento.9 + 87. é necessário fazer alguns comentários sobre os princípios básicos da experimentação e também sobre as pressuposições da análise de variância.7786 14 λ= 246. i) SQ da partição (2) vs (3) e (4) 5) Análise de variância A análise de variância (ANAVA) é um dos métodos para análise dos dados que visa decompor a variação total entre parcelas em fontes (causas) de variação devidas a efeitos principais dos fatores. 5.9 + 87.4500 – 24336.60 4 )2 σo = 1  4.9 + 87.. A partição (2) e (3) vs (4) foi a que maximizou a soma de quadrados entre grupos (Bo = 44.2500 – 24336.2817. assim.9 − 94.9 + 87. r r  2  i i'  iv) Teste de SNK:  1 1  QME SNK = q n  + . 05.7786  1 1  QME DMS = z n  + .08  2 2 (86.

8 + 95. 05 . 752 ) é 5.8 − 90. 1. finalizando assim o algoritmo. Neste caso. v=10 e y = 86.8400 – 15260. i) SQ da partição (2) vs (3) y 4 = y (1) = 26.9 + 87. 3  2 + 10   1 1 DMS = t t  + .ii) Considerando g=3. formando um único grupo com os tratamentos (linhagens) 3=(2) e 2=(3).3 y 3 = y ( 2 ) = 86. 2 /( π− 2 )) = χ 20 . Como λ > 7.08  2 2 (86.4775.458 aceita( λ= π 44.35 tem-se: 2 )2 σo = 1  4.8 (86. 3 /( π −2 )) = χ (20.4050 + 13. 4050 = 0.8 − 87.0450 = 0.07 tem-se: 3 )2 1 σ o = [0.9 − 90. ii) Considerando g=2. Quando o número de repetições é diferente entre os tratamentos as DMS’s podem ser calculadas por: i) Teste t: Bo = 7551. 05.5 d c c b 86. Colocando letras diferentes para médias distintas e letras iguais para médias semelhantes por meio do teste Scott e Knott tem-se então: O valor de χ 20.8 y1 = y ( 4 ) = 95. a partição (2) vs (3) por ser única foi a que maximizou a soma de quadrados entre grupos (Bo = 0.QME r r   i i'  52 53 .9 y 2 = y (3) = 87. o grupo 1 com os tratamentos (linhagens) 3=(2).458. Como λ < 5.9 + 87.07) + 10.6867 + 13.4050.4050).35) + (87.5896. .6000] = 1. = 13.6100 + 7708.9 − 87.1671 12 1  4. ou seja dois grupos são formados ao nível de 5%.4836 13 2 O valor de χ ( 0.1671 )2 1 σ o = [44.07) + (95.9 2 87. Deve-se então repetir novamente o algoritmo para o grupo 1.5 − 90. 05 .8 = 87. 05 . 2(π − 2) 4.5 = 90.2 a Observações: Nestes exemplos os resultados de todos os testes realizados foram iguais mas poderiam ter diferenciado entre um ou outro teste.9 + 87.2817 .35) + 10.8) 2 Bo = + − 1 1 2 2 y 5 = y (5 ) = 108. 3  3 + 10   λ= π 0. 2=(3) e o grupo 2 com apenas o tratamento e 1=(4). 2 .4836 se Ho.136 rejeita( se Ho. ou seja. 2(π − 2) 1.08  2 2 2 (86. 628 ) é 7.07) + (87.6000] = 4. os dois grupos são idênticos ao nível de 5%. v=10 e y = ) σ2 = o 86.136.