Professional Documents
Culture Documents
e Experimentao
_____________________________________________________________________________________________________________
VIOSA - MG
MAIO - 2010
1. INTRODUO
Este roteiro tem como objetivo orientar as discusses de alguns aspectos da
Estatstica na pesquisa cientfica. Levanta questes relacionadas com os procedimentos e
metodologias empregados nas experimentaes agrcolas, os quais visam obteno de
informaes teis ao pesquisador, em seu esforo de tentar promover o desenvolvimento
da agricultura.
Sero abordados poucos itens em razo da exiguidade de tempo, porm importantes
de serem compreendidos, pois so elementos que devem ser lembrados na elaborao de
projetos, ajudam na compreenso dos resultados obtidos nos experimentos e facilitam a
exposio desses resultados aos interlocutores interessados.
No sero apresentados clculos, nem como aplicar os mtodos de anlise dos
dados, porm sero apontados alguns itens que devem ser lembrados na conduo de
experimentos e podem auxiliar na obteno de informaes teis desses experimentos.
1.1.
O que um experimento
1.2.
Objetivos de um experimento
1.3.
Definio de Estatstica
Extrao
Aplicao
Soluo
Figura 2.1. Diagrama do processo de soluo de um problema
O diagrama na Figura 2.1 mostra o modelo geral de como solucionar problemas. O
modelo possui trs estdios:
1. Extrao o problema terico para o qual uma soluo imaginada factvel
extrado do contexto real multilinear;
2. Soluo uma soluo encontrada para o problema terico extrado;
3. Aplicao a soluo ao problema extrado aplicada realidade multilinear.
mais que uma especulao terica e mais que a acumulao unidirecional de fatos
prticos. Ela progride pela alternncia de duas fases: deduo e induo.
Deduo comea com alguma agregao de teorias, modelos, conjeturas,
hipteses e idias. Faz predies e sugere maneiras de se observar o mundo e de se
coletar dados.
Induo comea com algumas observaes, dados, fatos e conhecimentos acerca
das prticas. Escolhe entre teorias e modelos com base nessas informaes. Pode,
tambm, construir sobre teorias, modelos e idias anteriores.
Kuhn (Kuhn, T.S. The Structure of Scientific Revolutions, 2nd ed. The University of
Chicago Press, 1970.) considerou que til fazer a distino entre perodos de cincia
normal, durante o qual os problemas so resolvidos sem questionamentos das colees
coerentes de teorias aceitas (que ele as referencia como paradigmas) e perodos de crise e
revolues, quando quantidades substanciais de velhas teorias so descartadas e
substitudas por novas teorias (que ele descreve como a emergncia de novos paradigmas).
A Figura 2.2 uma tentativa de se ilustrar as idias de Box e de Kuhn em uma
nica imagem. Nela, o perodo de cincia normal, aquele durante o qual os passos
dedutivos fazem predies que variam apenas levemente, de acordo com as vrias
hipteses, idias e conjeturas consideradas. Os passos indutivos tomam observaes,
dados, fatos e tiram concluses acerca de quais hipteses; idias e conjeturas so
provavelmente acuradas, verdadeiras ou aproximaes teis. Os resultados de
experimentos ou de estudos observacionais geralmente so obtidos sem repeties nesse
perodo de cincia normal, porque h pouco conflito entre as idias que continuamente
evolvem das vrias pesquisas na rea de estudo.
Resultados experimentais com repeties
e estudos de observao com repeties
Observaes,
dados e fatos
Predies
(Setas para cima)
Inferncias
(Setas para baixo)
Hipteses, idias
e conjeturas
Modelos
Teorias
Paradigmas
Revoluo
observado. Geralmente, duvidam-se dos dados antes que as teorias e os paradigmas sejam
questionados, de tal forma que, no perodo de crise, os pesquisadores geralmente repetem
os experimentos e os estudos observacionais. Durante o perodo de crise, predies
dedutivas podem ser feitas considerando modelos, teorias e paradigmas alternativos e as
predies geralmente iro diferir. Os passos indutivos durante o perodo de crise no so
aceitos por todos os pesquisadores da rea de estudo. Eles podem no aceitar que os dados
foram adequadamente repetidos. Alguns pesquisadores faro inferncias acerca de
hipteses e conjeturas menores, sem lanar qualquer dvida sobre seus modelos, teorias e
paradigmas solidamente arraigados. Outros pesquisadores inferem que modelos, teorias ou
paradigmas devem ser derrubados.
A revoluo ocorre quando as dedues derivadas dos vrios paradigmas so
diferentes e a induo oriunda de dados reproduzveis indica que uma mudana dos
paradigmas previamente aceitos necessria. Formas menos dramticas de revoluo
podem tambm ocorrer, quando modelos e teorias menos bsicas so derrubados.
2.4.
1415161718192021222324-
2.5.
O mtodo cientfico
Sentenas como Mrcia morena ou Ele pesa muito mais que 90 quilos so
comuns e informativas. Elas se referem a caractersticas que no so constantes, mas
variam de indivduo para indivduo e, portanto, servem para distingui-los ou para descrevlos.
Caractersticas que mostram variabilidade ou variao so chamadas variveis ou
variveis aleatrias.
Resumidamente, na Figura 3.1 mostrada a classificao das variveis, segundo
sua natureza.
VARIVEL
No-ordenvel
(Nominal)
Ordenvel
Com escala
Contnua
Sem escala
Discreta
(QUANTITATIVA)
(QUALITATIVA)
3.1.
Populaes e Amostras
Se um nico grupo particular de indivduos, que est sendo estudado (por exemplo,
estudantes matriculados na UFV neste semestre), for de interesse, ento os valores da
varivel aleatria para esses indivduos formam a populao. Se as observaes
particulares sero usadas para fazer inferncias sobre indivduos no observados (por
exemplo, todos os estudantes universitrios de Minas Gerais), os valores observados das
variveis aleatrias formam uma amostra da populao maior.
3.2.
Uma estatstica muito comum e muito conhecida a mdia (mdia aritmtica). Para
uma varivel aleatria x, as observaes so escritas como x, e a mdia, uma medida de
tendncia central, a soma das observaes dividida pelo nmero de observaes.
x
Simbolicamente, x
.
n
Para medir a disperso da distribuio, ou para indicar a variabilidade, usa-se o
desvio padro. Na verdade, inicialmente define-se a varincia (s2) de uma amostra como a
mdia dos quadrados dos desvios em relao mdia:
1
2
2
(x x)
s
n 1
8
3.3.
Distribuio Normal
A distribuio normal tem funo de densidade igual a
1 Y 2
1
(
)
, - < y < +,
2
e
2
em que e so parmetros da distribuio normal.
A mdia e a varincia da distribuio normal so, respectivamente, E(Y) = e
2
(Y) = 2; isto , Y ~ N(, 2).
f ( Y)
Yi
, tem
2 (Y)
.
n
z0,75
Algumas tabelas de z do a rea hachurada, at um dado valor de z. A rea mais
prxima de z0,75 encontrada em uma dessas tabelas de z 0,7486, que corresponde ao valor
9
da rea de 0,67. Portanto, z0,75=0,67. Ou seja, abaixo do valor 0,67 esto 75% das
observaes dessa distribuio.
3.3.5. Distribuio t
Sejam z e
Definimos t(v) =
z
1
2
(2v )
v
A distribuio t possui um parmetro, o grau de liberdade v.
3.3.6. Distribuio F
Sejam (2v1 ) e (2v2 ) duas variveis aleatrias 2 independentes. Definimos
(2v1 )
F( v1 ,v2 ) =
v1
, em que (2v1 ) e (2v2 ) so independentes.
(2v 2 )
v2
A distribuio F possui dois parmetros, o grau de liberdade do numerador v 1 e o
grau de liberdade do denominador v2.
s12
2
F tambm 21 .
s2
22
s12
, com n1 1 e n2 1 gl.
s 22
QMTR
Um teste F muito frequente : F
, com os gltr e gle.
QME
Se H0; 12 = 22 ,
F=
4. ANLISE DE VARINCIA
4.1. Definies
Anlise de varincia: processo aritmtico da partio da soma de quadrados total
em componentes associados a causas reconhecidas de variao.
10
11
Um experimento em que cada tratamento aparece apenas uma vez tem apenas uma
repetio. Nesse caso, pode-se dizer, tambm, que no h repetio; no se pode estimar o
erro experimental; no h meio de se saber se a diferena entre duas observaes causada
pela diferena entre tratamentos ou causada pela variao do material experimental.
Maior nmero de repeties implica em maior preciso na estimativa da mdia da
populao. Se a diferena de 5 unidades detectada pelo uso de 4 repeties, um
experimento com 16 repeties detectar diferenas de aproximadamente 2,5 unidades,
12
5. EXPERIMENTOS FATORIAIS
Experimentos fatoriais no so delineamentos. Nos experimentos fatoriais, o
investigador compara todos os tratamentos que podem ser formados pela combinao dos
nveis dos diferentes fatores.
O conceito de experimento fatorial pode ser ilustrado por alguns exemplos:
Considere um experimento para avaliar a capacidade produtiva de diversas variedades de
feijo. Suponha que um segundo fator, espaamento entre fileiras, seja de interesse. Um
experimento fatorial poderia ser planejado, de tal forma que os tratamentos consistissem da
combinao das variedades com os espaamentos escolhidos, isto , cada variedade estaria
presente em todos os espaamentos. (Num experimento com um s fator, todas as
variedades seriam plantadas em um s espaamento, ou todos os espaamentos seriam
estudados em uma s variedade.) Em solos, um experimento poderia ser planejado para
comparar todas as combinaes de vrias doses de fsforo e de potssio. Em experimento
de nutrio animal, poderiam ser estudadas vrias quantidades e fontes de protena.
Um fator, portanto, um tipo de tratamento (variedade, espaamento, fsforo,
potssio, fonte de protena, etc.).
O termo nvel se refere aos diversos tratamentos dentro de qualquer fator. Exemplo:
Se o fator for variedade, os nveis sero as variedades A, B, C, etc.; se o fator for fsforo,
os nveis sero as suas doses (0, 50, 100, etc. kg/ha).
Os experimentos fatoriais so usados em praticamente todos os campos de
pesquisa. Eles so de grande valia nos trabalhos exploratrios, em que pouco se tem
conhecimento dos nveis timos dos fatores, nem mesmo se sabe quais deles so
importantes. Considere uma nova cultura para a qual diversas variedades promissoras so
disponveis, mas que pouco se sabe a respeito da melhor poca ou densidade de plantio.
Nesse caso, um experimento fatorial com os trs fatores seria indicado. Entretanto, se a
opo for pelo estudo de um-fator-por-vez, define-se, por exemplo, a data e a densidade
de plantio e conduz-se um experimento com as variedades a serem avaliadas. Nesse caso, a
variedade que melhor se comporta na data e densidade de plantio escolhidas pode no ser a
melhor em outra poca ou outra densidade de plantio. Esse raciocnio tambm vlido,
quando se deseja testar pocas, fixando-se a variedade e a densidade.
Em outras situaes, o pesquisador pode estar principalmente interessado na
interao entre fatores, isto , ele deseja saber se as diferenas de respostas aos nveis de
um fator so semelhantes ou diferentes nos diferentes nveis de outro fator ou fatores.
Como ilustrao do fatorial mais simples, considere um experimento de beterraba,
com dois fatores. O primeiro fator nitrognio, aplicado em dois nveis: zero (no) e 300
quilos de sulfato de amnio por hectare (n1); o segundo fator profundidade de aradura,
tambm em dois nveis: 17 e 27 cm. Consequentemente, temos um fatorial 2x2. As quatro
combinaes so mostradas a seguir, com as respectivas produes mdias (mdias das
repeties).
Tratamento
Produo (kg/ha)
1 - no, 17 cm
2 - n1, 17 cm
3 - no, 27 cm
4 - n1, 27 cm
4090
4780
4240
5020
Profundidade
17 cm
27 cm
Mdia
27 cm vs 17 cm
no
4090
4240
4160
+150
Nitrognio
n1
Mdia
4780
4440
5020
4630
4900
+240
+190
Resposta a n1
+690
+780
+740
F
**
**
**
Produtividade (kg/ha)
Fatorial 2 x 2
5200
4900
4600
17 cm
4300
27 cm
4000
1
2
Dose de N
a1
30
36
33
6
CASO I
A
a2
32
44
38
12
Mdia
31
40
35,5
9
a2 - a1
2
8
5
a1
30
36
33
6
CASO II
A
a2
32
26
29
-6
Mdia
31
31
31
0
a2 - a1
2
-10
-4
Fator
Nvel
b1
b2
Mdia
b2 - b1
Fator
Nvel
b1
b2
Mdia
b2 - b1
15
CASO III
A
a2
32
38
35
6
Fator
Nvel
b1
b2
Mdia
b2 - b1
a1
30
36
33
6
Mdia
31
37
34
6
a2 - a1
2
2
2
16
OBS.: A presena ou ausncia dos efeitos gerais nada informa sobre a presena ou a
ausncia de interao. A presena ou a ausncia de interao nada informa sobre a
presena ou a ausncia dos efeitos gerais, mas informa sobre a homogeneidade dos efeitos
simples.
Relembrando, quando se podem combinar os nveis de todos os fatores em um
nico experimento, este chamado fatorial.
5.1.
17
Espcies
(A)
Alfafa (a1)
Trevo
vermelho
(a2)
Trevo
doce
(a3)
Total
a1+a2+a3
Fungicidas
(C)
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2
no c1
sim c2
c1+c2
Argila (b3)
66
215
281
167
203
370
52
121
173
285
539
824
Total
b1+b2+b3
618
762
1.380
708
770
1.478
401
518
919
1.727
2.050
3.777
Totais de
tratamentos
266
276
286
.
.
121
3.777
18
QM
178,39
(188,79)
4500,06
8218,06
1932,02
164,61
97,02
925,57
267,41
94,10
F
ns
**
47,82**
87,33**
20,53**
1,75 ns.
1,03 ns.
9,84**
2,84*
Tipo de solo
(B)
b1
b2
b3
b1 + b2 + b3
c1
670
772
285
1727
c2
729
782
539
2050
c1 + c 2
1399
1554
824
3777 = G
QM
94,10
193,39
5,56
3584,22
F
2,05 ns.
0,06 ns
38,09**
em que
SQC / c1
670 2 729 2
3.3
( r.a )
1399 2
233
193,39
( cra )
etc.
A interao ABC foi significativa, implicando que a interao BC difere com o
nvel de A. A interao ABC est sendo examinada por esse ngulo, porque a interao
BC foi significativa.
Pela observao da interao BC, pode-se concluir que a dificuldade est ligada ao
C, no solo argila. Procedemos, ento, ao exame dos efeitos simples de C, no solo argila
(b3) nos vrios nveis de A.
A tabela dos trs tipos de solos x fungicidas parece justificar esta aproximao.
Solo argila = (b3)
a1
a2
a3
c1
66
167
52
c2
215
203
121
281
370
173
3700,17**
SQC dentro de a1 em b3 =
3
23
1672 2032 3702
216,00n.s.
SQC dentro de a2 em b3 =
3
23
522 1212 1732
793,50**
SQC dentro de a3 em b3 =
3
23
19
5.2.
gl
45
4
2
8
11
44
22
88
495
719
O objetivo desse experimento foi avaliar dez novas variedades, comparando-as com a
variedade mais cultivada e com a mais produtiva da regio, bem como entre si. Portanto, as
inferncias sero aplicadas ao conjunto das doze variedades. Nesse caso, o efeito de variedades
fixo. A eventual nova variedade a ser escolhida e recomendada ser para toda a regio de
onde foram escolhidos os locais dos experimentos. Portanto, os locais so amostras da regio
de plantio. Nesse caso, locais de efeito aleatrio. Quanto aos anos em que os ensaios foram
conduzidos, so amostras dos futuros anos em que as variedades sero plantadas. Portanto, ano
e de efeito aleatrio. Naturalmente, as repeties, ou os blocos, so amostras das reas, sendo
de efeito aleatrio. Ento, os quadrados mdios esperados da anlise de varincia, considerando
o efeito de variedades fixo e os demais aleatrios, ser:
20
F.V.
B/LxA
e2 v 2B/LxA
AxL
e2 v 2B/LxA vr 2LxA
VxL
e2 r 2VLA ar 2VL
VxA
e2 r 2VLA r 2VA
VxLxA
e2 r 2VLA
Erro
e2
Na aplicao dos testes estatsticos, os termos a serem utilizados como erro so:
1.
2.
Para testar a interao LxA, utilizar o quadrado mdio de blocos dentro de locias e
anos (B/LxA).
3.
4.
5.
QMV QMVLA
QMVL QMVA
QM V QM VLA2
QM V2 QM VLA2
gl V
q
e
gl VLA
QM VL QM VA2
QM VL2 QM VA2 .
gl VL
gl VA
Observao:
Uma vez compreendidos os modelos matemticos dos experimentos, algumas
perguntas importantes podem ser respondidas. Dentre elas, a seguinte:
Quais efeitos estariam confundidos se o experimento fosse instalado em apenas um
local, durante os trs anos?
21
Efeito ou efeitos
Experimento em apenas um local Experimento em vrios locais
An
An + AxLnm
Vi
Vi + VxLim
VxAin
VxAin + VxAxLimn
6. COMPARAES MLTIPLAS
6.1.
23
7. REGRESSO LINEAR
7.1.
Introduo
7.2.
SPXY Cov(X, Y)
.
SQ X
VarX
a) Verificar se Y depende de X.
b) Predio de Y atravs de X.
c) Determinar a forma da curva.
d) Ajuste da anlise de Y, em um experimento, depois de retirados os efeitos de uma
varivel X (covarincia).
8.
CORRELAO
24
(X1 X1 )(X 2 X 2 )
rX1X 2
( X1 ) 2
( X 2 ) 2
( X
)( X 2
)
n
n
O valor de r, que o coeficiente de correlao da amostra.
2
1
9.
b 0 X i b1 X 2i X i Yi
25
b 0 X1 b1 X12 b 2 X1 X 2 X1Y
b 0 X 2 b 1 X1 X 2 b 2 X 2 X 2 Y
2
gl
k
n-k-1
n-1
SQ
SQR
SQD
SQTO
QM
QMR
QMD
O teste F, nesse caso, obtido pela diviso QMR/QMD, verifica a hiptese nula
H0: 1 = 2 = 3 = ... = k = 0
contra a hiptese alternativa
Ha: i 0, i = 1, 2, ... , k.
Para verificar se alguma varivel contribui significativamente para o modelo de
regresso, procede-se da seguinte maneira:
1) Ajustar o modelo de regresso completo, C, isto , ajustar o modelo com todas as
variveis de interesse, e calcular a Soma de Quadrados dos Desvios, SQDC.
2) Ajustar o modelo de regresso reduzido, R, isto , ajustar o modelo sem as variveis que
se deseja testar, e calcular a Soma de Quadrados dos Desvios, SQDR.
3) Aplicar o seguinte teste F:
26
(SQD R SQD C )
(gld R gld C )
F
,
SQD C
gld C
em que gldR e gldC so os graus de liberdade associados s somas de quadrados dos desvios
dos modelos R e C, respectivamente.
O F assim obtido comparado com o valor tabelado, com os graus de liberdade
{(gldR - gldC), gldC)} e o nvel de significncia desejado.
zero:
2
0
a
2
0
b
2
0
c
Resolvendo esse sistema de trs equaes e trs incgnitas, que so as equaes
normais da regresso quadrtica, obtemos as estimativas a, b e c.
G.L.
2
n-3
n-1
SQ
SQR
SQE
SQTO
QM
QMR
QME
27
F.V.
Regresso
Desvio
Total
Regresso linear
G.L.
SQ
1
SQRL
n-2
SQEL
n-1
SQTO
Regresso quadrtica
G.L.
SQ
2
SQRQ
n-3
SQEQ
n-1
SQTO
28
n = n0 . 2 . 2
x-sima
n = n0 . 2x
Essa ltima relao indica que o nmero de clulas numa colnia est crescendo
numa progresso geomtrica ou exponencialmente, isto , em uma taxa sempre
crescente.
Podemos reescrever a equao n = n0 . 2x da seguinte forma:
log n = log n0 + x log 2.
Essa equao expressa a relao entre o nmero de clulas na colnia, n, e o
nmero de geraes ocorridas, x, porm, normalmente, desejvel obter-se a relao entre
n e o tempo t. Portanto, se t o tempo em que x geraes ocorrem e o tempo para uma
gerao g, ento:
x = t/g.
Substituindo essa varivel na equao acima, temos:
log n = log n0 + (t/g) log 2.
Considerando constante o tempo de uma gerao, (log 2)/g ser, tambm, constante
e poder ser representado por k.
Portanto, pode-se escrever
log n = log n0 + kt
que uma equao linear da forma y = a + bx, em que log n0 est representado por a e k
por b.
A taxa de crescimento de uma colnia com esse tipo de crescimento dada pelo
incremento, dn, do nmero de clulas em um curto intervalo de tempo, dt; ou seja,
podemos dizer que a taxa de crescimento igual a dn/dt.
O valor dn/dt representa a declividade da curva em um dado tempo t e pode ser
observado que, no caso do crescimento exponencial, essa declividade aumenta
progressivamente com o tempo. Se todas as clulas estiverem se dividindo mesma taxa r,
claramente, a qualquer tempo t, a taxa de crescimento da colnia ser proporcional ao
nmero de clulas presente, isto , dn/dt ser proporcional a n.
Assim, apesar de a taxa de diviso celular, r, permanecer constante, a taxa absoluta
de crescimento da colnia como um todo no constante, pois com o correr do tempo, o
nmero de clulas presentes na colnia aumenta. O valor de r dado por dn/dt (o
29
dt n
Esse valor conhecido como a taxa de crescimento relativo da colnia. Assim, para
uma colnia mostrando esse tipo de crescimento, a taxa de crescimento absoluto aumenta
com o tempo, porm a taxa de crescimento relativo permanece constante.
Observe que a equao log n = log n0+ kt pode ser destransformada (antilogaritmo)
em: n = n0ekt, em que e a base do logaritmo natural (nmero neperiano = 2,7182).
Generalizando esse tipo de crescimento, com x denotando o tempo e f o tamanho,
tem-se o crescimento exponencial da seguinte forma:
df
kf , ou f(x) = e k ( x ) .
dx
Assim, a taxa de crescimento proporcional ao tamanho corrente f, sendo que para
k > 0, o crescimento ilimitado. O crescimento exponencial para x pequeno uma
caracterstica de muitos modelos de crescimento.
O modelo potncia-de-tempo,
f(x)= x
, algumas vezes, til. Porm, tanto no caso do modelo potncia-de-tempo, quanto no
modelo exponencial, o crescimento ilimitado, enquanto que o crescimento biolgico,
quase que invariavelmente, estabiliza com o tempo, tal que o tamanho final
lim f ( x )
x
existe e finito.
df
0 , quando x .
dx
Talvez, a pressuposio mais simples do crescimento limitado a de que a taxa de
crescimento proporcional ao tamanho restante, isto ,
df
k ( f ) ,
dx
para algum k > 0. A soluo geral dessa ltima expresso pode ser parametrizada como:
f (x) ( )e kx ,
em que x > 0 e k > 0.
Se a curva tem por objetivo descrever o crescimento (isto , aumento), necessita-se
> > 0. Com essa parametrizao, o tamanho final, [= f(0)] o tamanho inicial e k
atua como um parmetro de escala de x, governando, assim, a taxa de crescimento. Uma
parametrizao mais comum dada por
Como resultado,
f(x) = e kx
com substituindo - .
Pode-se, tambm, escrever
f (x) (1 e k ( x ) ) .
Esse modelo usualmente denominado de modelo de crescimento
monomolecular
Substituindo, ainda, - por - e e-k por , em que 0 < < 1, obtemos:
f (x) x , 0 < < 1 ,
30
(P P0 )
Pela anlise dessa equao, pode-se verificar que o crescimento total de uma planta
(P + S) depende quase igualmente da taxa de fotossntese, R, e da proporo dos produtos
fotossintticos dedicados a produzir novas partes fotossinteticamente teis da planta, ,
pois a taxa de juros compostos, que determina a taxa de crescimento, no depende de R
porm do produto de R com . Na ausncia de um rgo especializado de armazenamento
(por exemplo, plantas no estdio vegetativo), o reinvestimento fornece um dreno para os
produtos fotossintetizados e, isso ocorrendo, pode aumentar R.
31
em que g e h so funes crescentes com g(0) = h(0) = 0. Muitas das curvas de crescimento
so monomoleculares pela simples transformao do tamanho f (Curva de Richards) ou do
tempo x (Modelo de Weibull).
, - < x < ,
f (x)
1 e k ( x )
denominado de modelo logstico.
A curva tem assntotas f = 0 para x - e f = para x , que so, obviamente,
jamais atingidas. Isso causa pouca dificuldade na prtica, pois, quando se iniciam as
coletas dos dados, tem-se f > 0. Percebe-se que a taxa de crescimento atinge o mximo
f (x)
,
1 e kx
em que e kx , na equao (10).
Entretanto, uma das formas mais conhecidas da equao logstica
f(x) =
exp( x )
em que f(x) a probabilidade de uma resposta a
1 exp( x )
32
f(x) =
1
, obtida pela diviso do numerador e do
1 exp[ ( x )]
[Yi
i 1
f (, , , X i )]2
O primeiro passo no mtodo geral obter boas estimativas iniciais, a 1, b1, c1, das
, , . Para os tipos comuns de funes no-lineares, vrias tcnicas
estimativas finais
tm sido desenvolvidas, algumas delas grficas, outras por estudos especiais do problema.
O segundo passo usar o teorema de Taylor. Esse teorema enuncia que, se f(, , ,
X) contnua em , e e se ( a1), ( b1) e ( c1) so pequenas,
f(, , , Xi) f(a1, b1, c1, Xi) +( a1)fa +( - b1)fb + ( - c1)fc
em que fa, fb e fc denotam as derivadas parciais de f com respeito a , e ,
respectivamente avaliadas nos pontos a 1, b1, e c1.
Por exemplo, na regresso assinttica
f(, , , Xi) = (Xi)
temos
X 1
fa = 1;
fb = c1Xi ;
fc = b1X i (c1 i ) .
Como a1, b1 e c1 so conhecidos, os valores de f, fa, fb, e fc podem ser calculados
para cada membro da amostra, em que escrevemos f no lugar de f(a1, b1, c1, Xi).
Do teorema de Taylor, a relao de regresso original
Yi = f(, , , Xi) + i
pode ser escrita, aproximadamente, como:
Yi f + ( a1)fa + ( b1)fb + ( c1)fc + i .
(12.1)
Agora, escrevemos:
Yres = Y f;
X1 = fa;
X2 = fb;
X3 = fc.
Da equao (12.1),
Yres ( a1)X1 + ( b1)X2 + ( c1)X3 + i
(12.2)
A varivel Yres o resduo de Y da primeira aproximao. A relao (12.2)
representa uma equao linear ordinria de Yres sobre as variveis X1, X2 e X3, com os
coeficientes de regresso ( a1), ( b1) e ( c1).
33
, e encontrada, e
b2) e (c3 c2) dos quais uma terceira aproximao a 3, b3 e c3 de
assim por diante.
2
Se o processo efetivo, a soma de quadrados dos resduos, Yres , deveria
decrescer consistentemente em qualquer estdio, com o decrscimo tornando-se menor
com a aproximao da soluo de mnimos quadrados. Na prtica, os clculos so
2
paralisados quando o decrscimo em Yres e as mudanas em a, b e c so consideradas
pequenas o bastante para serem negligenciadas. O quadrado mdio do resduo
s 2 Yres2 /(n k) ,
em que k o nmero de parmetros estimados (no exemplo k = 3). Em regresses nolineares, s2 no um estimador no-viesado de 2 , apesar de que ele tende a ser noviesado para n grande.
, e so obtidos pelo processo
Erros padres aproximados das estimativas
usual, pelos multiplicadores de Gauss na regresso mltipla final computada. Assim,
s( ) s c11 ; s( ) s c 22 ; e s( ) s c33 .
34
isto , dados com nmeros iguais de observaes (ij = para todo i, j), para cada
combinao de tratamento.
Quando os dados no so balanceados, as somas de quadrados computadas pelo
procedimento ANOVA pode conter funes dos outros parmetros do modelo e,
conseqentemente, produzir resultados viesados.
Para ilustrar o efeito de dados no-balanceados na estimao de diferenas entre
mdias e na computao das somas de quadrados, consideremos os dados na seguinte
tabela de duas entradas:
B
1
1
7
2
5
A
4
1
7 = + 1 + 1
9 = + 1 + 1
8 = + 2 + 1
B
2
5 = + 1 + 2
A
4 = + 2 + 2
6 = + 2 + 2
Resposta mdia
Consideremos uma segunda populao, cujo vetor das respostas mdias aos
mesmos quatro tratamentos aplicados na populao 1 2 ' 21, 22 , 23, 24 . A
hiptese H0: 1 2 implica que os tratamentos tm o mesmo efeito (mesmas mdias) nas
duas populaes. Em termos de perfis populacionais, podemos formular a questo de
igualdade por etapas.
1. Os perfis so paralelos?
Equivalentemente: H01: 1i 1i 1 2i 2i 1 , i = 2, 3, . . . , p, aceitvel?
2. Assumindo que os perfis so paralelos, so eles coincidentes?
Equivalentemente: H02: 1i 2i , i = 2, 3, . . . , p, aceitvel?
3. Assumindo que os perfis so coincidentes, so eles nivelados (horizontais)? Isto ,
todas as mdias so iguais a uma mesma constante?
Equivalentemente: H03: 11 12 1p 21 22 2p aceitvel?
Teste para verificar se os perfis de duas populaes normais so paralelos
A hiptese nula no estgio 1 pode ser escrita
H01: C1 C 2
em que C a matriz contraste
1 0 0 0
1
0 1 1 0 0
C
(( p 1) xp )
0 0 0 0 1
0
0
0
(14.1)
Cx 2 j ,
1
CScomb C' C( x1 x 2 ) c 2
T ( x1 x 2 )' C'
n1 n 2
em que
(n1 n 2 2)(p 1)
Fp 1, n1 n 2 p ,()
n1 n 2 p
Quando os perfis so paralelos, o primeiro estar acima do segundo, 1i 2i , para
todo i, ou vice-versa. Sob essa condio, os perfis sero coincidentes apenas se os totais
das alturas, 11 12 1p 1' 1 e 21 22 2p 1' 2 , forem iguais.
c2
37
1
1' Scomb 1 1' ( x1 x 2 )
T 1' ( x1 x 2 )
n1 n 2
1' (x1 x 2 )
F1, n1 n2 2, ( )
t2
n1 n 2 2
1 1
2
1Scomb1
n1 n 2
n2
x1 j x 2 j
n1
n2
n1 n 2
( n1 n 2 ) x1 ( n 1 n 2 ) x 2
Consequentemente, temos o seguinte teste:
Para duas populaes normais: Rejeitar H03: C(1 + 2) = 0 (perfis planos) no nvel
x
se
j 1
j 1
==================
Quando os tamanhos das amostras so pequenos, a anlise de perfil depender da
pressuposio de normalidade. Essa pressuposio pode ser conferida com os mtodos
disponveis, usando-se as observaes originais, xj, ou as observaes contrastes, Cxj. A
anlise de perfil para vrias populaes acompanha o mesmo mtodo de duas populaes.
lugar dos testes paramtricos. Para optarmos pela aplicao de um determinado teste
estatstico devemos ter ateno:
No objetivo do teste;
Quantas variveis temos e de que tipo so;
Qual a dimenso da amostra;
Como as variveis se distribuem.
2n1n 2 (2n1n 2 n1 n 2 )
(n1 n 2 ) 2 (n1 n 2 1)
(B C) 2
(21)
BC
utilizando um fator de correo temos:
( B C 1) 2
2
Y
(21)
BC
As hipteses sero:
H0 : O tratamento no tem qualquer influncia.
Ha : O tratamento tem influncia.
Y2
1
x
N
2
em que:
1
Mdia = x = NP = N
2
1
Desvio-Padro = r = NPQ
N
2
Utilizando um fator de correo, temos:
1
( x 0,5) N
2 .
Z
1
N
2
N( N 1)(2 N 1)
24
i 1
K - nmero de amostras
Gj nmero de sucessos na coluna j
Li nmero de sucessos na linha i
X 2
K
12
(R j ) 2 3N(K 1)
NK(K 1) j1
em que:
N nmero de linhas
K nmero de colunas
Rj soma de ordens na coluna j
K
2
(R j ) - somatrio dos quadrados das somas das ordens sob todas as K condies.
j 1
44
populaes ou se so apenas variaes casuais, que podem ser esperadas entre amostras
aleatrias da mesma populao.
A tcnica paramtrica usual para comprovar se diversas amostras independentes
provm da mesma populao a anlise de varincia. A mensurao da varivel em estudo
tem de ser feita, no mnimo, em escala intervalar. Os testes no paramtricos tm, ainda, a
vantagem de permitir estudar dados em escala nominal ou ordinal.
N( N 1) j1 n j
em que:
K nmero de amostras;
nj nmero de casos na amostra j;
N nmero de casos em todas as amostras combinadas;
Rj soma de ordens na amostra j (coluna); e
2
K Rj
45
6 d i2
rS 1
t rS
(n 1)n (n 1)
n2
1 rS2
46
17. MICKEY, R.M.; DUNN, O.J.; CLARK, V.A. Analysis of Variance and Regression.
New York, John Wiley, 2004. 448p.
18. MONTGOMERY, D.C. & MYERS, R.H. Response Surface Methodology: Process
and Product in Optimization Using Designed Experiments. New York: John Wiley,
1995. 700 p.
19. MONTGOMERY, D.C. & PECK, E.A. Introduction to Linear Regression Analysis.
New York: John Wiley, 1992. 544 p.
20. MONTGOMERY, D.C. Design and Analysis of Experiments. New York: John Wiley,
1996. 704 p.
21. NELSON, W. Accelerated Testing: Statistical Models, Test Plans, and Data Analyses.
New York: John Wiley, 1990. 616p.
22. NETER, J.; WASSERMAN, W. & KUTNER, M.H. Applied Linear Statistical
Models. Boca Raton: CRC Press, 1990. 1184p.
23. ROBINSON, G.K. Practical Strategies for Experimenting. New York: John Wiley,
2000. 232p.
24. RYAN, T. Modern Experimental Design. New York: John Wiley, 2007. 593p.
25. RYAN, T.P. Modern Regression Methods. New York: John Wiley, 1996. 515 p.
26. SCHABENBERGER, O. & PIERCE, F.J. Contemporary Statistical Models for the
Plant and Soil Sciences. Boca Raton: CRC Press, 2002. 738p.
27. SCHEINER, S.M. & GUREVITCH, J. Design and Analysis of Ecological
Experiments. New York: Osford University Press, 2001. 415p.
28. SEARLE, S.R. Linear Models. Nova York: John Wiley, 1997. 532 p.
29. SEBER, G.A. & WILD, C.J. Nonlinear Regression. New York: John Wiley, 1989.
800p.
30. SNEDECOR, G.W. & COCHRAN, W.G. Statistical Methods. Iowa: Iowa State
University, 1989.
31. STEEL, R.G.D.; TORRIE, J.H. & DICKEY, D.A. Principles and Procedures of
Statistics: A Biometrical Approach. New York: McGraw-Hill.1997. 666 p.
47