Apostila Estatistica Duarte

UFU Universidade Federal de Uberlndia LVA Laboratrio de Vibraes e Acstica
UFU UNIVERSIDADE FEDERAL DE UBERLNDIA
FEMEC FACULDADE DE ENGENHARIA MECNICA
LVA Laboratrio de Vibraes e Acstica
Curso de Planejamento Experimental
Outubro/2007
Autores :
Marcus Antonio Viana Duarte
Tatiana Meola
UFU - Universidade Federal de Uberlndia

FEMEC - Faculdade de Engenharia Mecnica
Av. Joo Naves de vila, 2121- Bloco 1M
Campus Santa Mnica
CEP 38.400-902 Uberlndia - MG
Telefone: (34) 3239 4147 ramal: 234

SUMRIO
1. Planejamento Experimental 1
1.1. Introduo 1
1.1.1. Tcnicas Para Definio da Seqncia de Ensaios 2
1.1.2. Etapas do Planejamento Experimental e Anlise de Resultados 4
1.2. Conceitos Bsicos de Estatstica 5
1.2.1. Experimentos Aleatrios 5
1.2.2. Espao Amostral e Eventos 6
1.2.3. Freqncia Relativa 6
1.2.4. Probabilidade 7
1.2.5. Variveis Aleatrias 8
1.2.6. Medidas de Tendncia Central 10
1.2.7. Medidas de Disperso 11
1.2.8. Momentos, Assimetria e Curtose. 13
1.2.9. Desigualdade de Chebyshev 15
1.2.10. Teorema do Limite Central 16
1.2.11. Distribuies Caractersticas de Amostragens 17
Distribuio Normal 17
Distribuio Chi-quadrado 2 18
Distribuio t de Student 20
Distribuio F de Snedcor 21
1.2.12. Estimadores 22
Propriedades dos Estimadores 23
1.2.13. Intervalos de confiana. 25
Intervalo de Confiana para a Mdia 25
Varincia conhecida 25
Varincia Desconhecida 27
Diferena entre duas mdias (a - b ). 28
Varincias Conhecidas 28
Varincias Desconhecidas 29
Intervalo de Confiana para Proporo 30
Intervalo de confiana para a diferena entre propores 31
Intervalo de confiana para a varincia (2) 31
1.3. Testes de Hipteses 32
1.3.1. Tipos de Erros 34
1.3.2. Procedimento geral de teste 35
1.3.3. Teste para uma mdia 36
1.3.4. Teste para uma proporo 37
1.3.5. Decises e poder 39
1.4. Comparao entre dois tratamentos 39
1.4.1. Diferena entre mdias de dois grupos 39
Erro padro - assumindo desvios padres iguais 40
I.C. para a diferena entre mdias assumindo desvios padro iguais 40
Teste para a diferena das mdias 40
I.C. para diferena de mdias - desvios padro diferentes 41
1.4.2. Comparando propores 41
Intervalo de confiana para a diferena em propores 41
Teste para a diferena de duas propores 42
2. Comparaes entre Mais de dois Tratamentos 43
2.1. Introduo 43
2.1.1. Objetivo 43
2.1.2. Pressupostos 43
2.1.3. Hipteses 43
2.1.4 Notao 44
2.1.5 Modelo 44
2.1.6. Estatstica do Teste 45
2.1.7. Anlise 45
2.1.8. Tabela de ANOVA 46
2.2. Teste de Normalidade 47
2.2.1 - Teste de Kolmogorov-Smirnov 47
2.2.2 Teste de Shapiro-Wilk 50
2.2.3 - Teste DAgostino-Pearson 52
2.3. Teste de Homocedasticidade 54
2.3.1. Teste de Hartley 54
2.3.2. Teste de Cochran 55
2.3.3. Teste de Bartlett 55
2.4. Teste de Kruskal-Wallis 56
2.4.1 Pressupostos 56
2.4.2 Limitaes 56
2.4.3 O Teste 56
3. Blocos Aleatorizados e Planejamentos Fatoriais com Duas Classificaes 59
3.1. Testes de Hiptese de Dados Emparelhados 59
3.2. Blocos Aleatorizados 60
3.3. Efeitos de Tratamentos: Planejamento Aleatorizado por Nveis 61
3.3.1. Anlise de um modelo de efeitos fixos 63
3.3.2 Comparao das mdias individuais dos tratamentos 66
3.3.3 Anlise de um modelo de efeitos aleatrios 70
3.4. Efeitos de Blocos 71
3.4.1. Planejamento por Nveis Completo Aleatorizado por Blocos 71
3.4.2. Planejamento Por Nveis Incompleto Aleatorizados Por Blocos 74
4. Planejamentos com Mltiplos Blocos 77
4.1. Planejamentos Quadrados Latinos 77
4.2. Planejamento Quadrado Greco-Latino 80
5. Planejamentos Fatoriais: Modelos Empricos 83
5.1. Planejamento Fatorial Completo 22* 83
5.1.1. Clculo dos efeitos 85
5.1.2. Interpretao geomtrica dos efeitos 86
5.1.3. Interpretao dos Resultados de um planejamento 22 87
5.1.4. Codificao dos fatores 88
p
5.2. Experimentos Fatoriais Fracionados 2kResoluo 88
5.2.1 Confundindo (Sinnimos, Tendncias) 89

5.2.2. Delineamento de um Experimento Fatorial Fracionrio 90
5.3. Delineamento de Taguchi 92
6. Anlise de Regresso 95
6.1. Ajuste de Parmetros 95
6.2. Principais Estimadores e suas Caractersticas 98
6.2.1. Estimador de Mximo a Posteriori (MAP) 100
6.2.2. Estimador de Mxima Verossimilhana (ML) 101
6.2.3. Estimador de Mnimos Quadrados 102
6.3. A Unicidade e o Criterio de Identificabilidade 104
6.4. Estimativa dos Erros 105
6.5. Correlao e Regresso 105
6.6. Regresso Mltipla 108
6.6.1. Estimador de Mnimos Quadrados (Resumo) 110
7. Tcnica das Superfcies de Resposta 111
7.1. Superfcie de Resposta Linear 111
7.2. Superfcie de Resposta Quadrtica 113
7.3. Outros Planejamentos Fatoriais 117
7.3.1 Um Planejamento Fatorial 23 117
7.3.2. Obteno de Superfcie de Resposta linear para planejamentos fatoriais 23 117
7.3.3. Um Planejamento Fatorial 24 118
7.3.4. Obteno de uma Superfcie de Resposta Linear para um planejamento
119
fatorial 24
7.4. Anlise de Resduos 121
7.4.1 Teste de Significncia do Ajuste 121
7.4.2 Coeficiente de Mltipla Determinao 123
7.4.3 Coeficiente de Mltipla Determinao Ajustado 124
7.4.4 Coeficiente de Variao. 124
7.4.5. Teste Sobre um Coeficiente Particular 125
8. Referncias Bibliogrficas 126
PLANEJAMENTO EXPERIMENTAL
1. Planejamento Experimental
1.1. Introduo
O planejamento experimental, tambm denominado delineamento experimental,
representa um conjunto de ensaios estabelecido com critrios cientficos e estatsticos,
com o objetivo de determinar a influncia de diversas variveis nos resultados de um
dado sistema ou processo (Button, 2005). Com isso, objetiva a determinao do nmero
ideal de experimentos que leve obteno de resultados com um dado grau de
confiabilidade.
Esse objetivo maior pode ser dividido em outros objetivos de acordo com o
propsito dos ensaios:
a. determinar quais variveis so mais influentes nos resultados;
b. atribuir valores s variveis influentes de modo a otimizar os resultados;
c. atribuir valores s variveis influentes de modo a minimizar a variabilidade dos
resultados;
d. atribuir valores s variveis influentes de modo a minimizar a influncia de
variveis incontrolveis;
A utilizao das tcnicas estatsticas de planejamento experimental possibilita:
a reduo do nmero de ensaios sem prejuzo da qualidade da informao;
o estudo simultneo de diversas variveis, separando seus efeitos;
a determinao da confiabilidade dos resultados;
a realizao da pesquisa em etapas, num processo iterativo de acrscimo de novos
ensaios;
a seleo das variveis que influem num processo com nmero reduzido de
ensaios;
a representao do processo estudado atravs de expresses matemticas;
a elaborao de concluses a partir de resultados qualitativos.
O planejamento experimental uma ferramenta essencial no desenvolvimento de
novos processos e no aprimoramento de processos em utilizao. Um planejamento
adequado permite, alm do aprimoramento de processos, a reduo da variabilidade de
resultados, a reduo de tempos de anlise e dos custos envolvidos. (Button, 2005)
No que se refere ao projeto de produtos, o planejamento experimental permite a
avaliao e comparao de configuraes (projetos) distintas, avaliao do uso de
1
materiais diversos, a escolha de parmetros de projeto adequados a uma ampla faixa de
utilizao do produto e otimizao de seu desempenho. Os conceitos sobre
planejamento experimental podem ser resumidos em trs termos muito empregados
atualmente: qualidade, produtividade e competitividade.
1.1.1. Tcnicas Para Definio da Seqncia de Ensaios

Para que os resultados obtidos de ensaios experimentais possam ser analisados
atravs de mtodos estatsticos, possibilitando elaborarem-se concluses objetivas, o
planejamento experimental deve ser baseado numa metodologia tambm estatstica, que
a nica forma objetiva de avaliar os erros experimentais que afetam esses resultados.
H trs tcnicas bsicas para a definio dos ensaios num planejamento
experimental: o uso de rplicas, da aleatorizao (ou randomizao) e de blocos.
A rplica consiste na repetio de um ensaio sob condies preestabelecidas. Esta
tcnica permite obter-se uma estimativa de como o erro experimental afeta os resultados
dos ensaios e se esses resultados so estatisticamente diferentes. Ela tambm permite
verificar-se qual a influncia de uma determinada varivel sobre o comportamento de
um processo, quando a comparao feita pela mdia das amostras.
Por exemplo, pretende-se verificar como a presso afeta a velocidade de uma reao
qumica. Realizam-se ensaios em duas condies diferentes: p1 e p2 (com p1> p2 ).
Num primeiro planejamento, realiza-se um ensaio para cada condio, ou seja, sem
rplica, obtendo-se velocidades v1 e v2 respectivamente, iguais a 9,0 e 9,5. Como
afirmar que o aumento da presso acarreta um acrscimo de velocidade de reao? Tal
resposta fica mais objetiva quando se realiza um grande nmero de ensaios (rplicas) de
modo a minimizar o erro experimental e poder comparar as mdias dos resultados
obtidos nas amostras.
A aleatorizao uma tcnica de planejamento experimental puramente estatstica
em que a seqncia dos ensaios aleatria e a escolha dos materiais que sero utilizados
nesses ensaios tambm aleatria.
Uma das exigncias do uso da metodologia estatstica para o planejamento
experimental e para a anlise dos resultados que as variveis estudadas e os erros
experimentais observados apresentem um carter aleatrio, o que conseguido pelo
emprego desta tcnica.
2
Por exemplo, ao se definir para o caso do exemplo anterior (influncia da presso
sobre a velocidade de reao) trs valores para a presso e quatro rplicas para cada
valor de presso, teremos doze ensaios, como mostrado na Tabela 1.
Tabela 1
Presso Nmero dos Ensaios
p1 1 2 3 4
p2 5 6 7 8
p3 9 10 11 12
Caso a seqncia estabelecida para os ensaios fosse 1, 2, 3....., 9, 10, 11 e 12,

qualquer problema experimental no detectado poderia acarretar a invalidao de todo
o procedimento experimental.
Ao se utilizar uma seqncia aleatria (por exemplo: 8, 5, 9, 1, 12, 3, 7, 4, 11, 2, 6 e
10) os erros experimentais devidos a qualquer varivel no-controlvel seriam
distribudos ao longo de todo o procedimento, aleatorizando-o e permitindo sua anlise
estatstica.
A tcnica dos blocos permite realizar-se a experimentao com uma maior preciso,
reduzindo a influncia de variveis incontrolveis. Um bloco uma poro do material
experimental que tem como caracterstica o fato de ser mais homogneo que o conjunto
completo do material analisado. O uso de blocos envolve comparaes entre as
condies de interesse na experimentao dentro de cada bloco. Na anlise com blocos,
a aleatorizao restringida seqncia de ensaios interna dos blocos e no ao conjunto
total de ensaios.
O uso de blocos pode ser analisado no seguinte exemplo:
Supe-se que ao realizarem-se ensaios de dureza, cada um dos dois penetradores
disponveis para o durmetro estejam fornecendo resultados distintos. Caso fosse feita
uma aleatorizao completa do conjunto de ensaios, como no exemplo anterior,
diferenas significativas de propriedades entre materiais de diversas corridas de
produo poderiam mascarar a influncia dos penetradores. Assim, utiliza-se a tcnica
de blocos. Escolhem-se materiais provenientes de uma mesma corrida e se separa
corpos-de-prova para serem ensaiados com os dois penetradores. Desta forma, criou-se
um bloco: um conjunto de corpos de prova escolhidos de forma a garantir a
homogeneidade do material. A aleatorizao dentro desse bloco d-se quando se escolhe
3
ao acaso a seqncia como cada corpo-de-prova ser ensaiado (primeiramente pelo
penetrador no. 1 ou vice-versa).
1.1.2. Etapas do Planejamento Experimental e Anlise de Resultados

As etapas do planejamento experimental so:
1. Reconhecimento e definio do problema, que em grande parte, depende da
experincia j adquirida no estudo de processos semelhantes;
2. Escolha das variveis (fatores de influncia) e das faixas de valores em que essas
variveis sero avaliadas, definindo-se o nvel especfico (valor) que ser empregado em
cada ensaio. Deve-se verificar como essas variveis sero controladas nos nveis
escolhidos e como eles sero medidos. A avaliao intensiva de diversas variveis pode
ser necessria quando o estudo encontra-se em seus estgios iniciais e no se detm uma
experincia anterior, exigindo a avaliao das variveis em diversos nveis. Quando se
deseja verificar a influncia de uma varivel em particular, o nmero de nveis deve ser
reduzido, alm de manterem-se as demais variveis influentes em nveis to constantes
quanto possvel.
3. Escolha adequada da varivel de resposta, de modo que se garanta a objetividade na
anlise dos resultados obtidos. O critrio principal para essa escolha de que o erro
experimental de medida da varivel de resposta seja mnimo, permitindo a anlise
estatstica dos dados, com um nmero mnimo de rplicas;
4. Delineamento dos experimentos: tamanho da amostra (nmero de rplicas), seqncia
de execuo dos ensaios, necessidade de aleatorizao ou do uso de blocos.
Principalmente em processos complexos, com diversas variveis influentes, no se
deve partir de um conjunto extenso de experimentos, que envolva um grande nmero de
variveis, estudadas em diversos nveis. mais produtivo estabelecer-se um conjunto
inicial com nmero reduzido de ensaios (poucas variveis, poucos nveis de avaliao),
ir aprendendo sobre o processo e aos poucos, acrescentar novas variveis e nveis e
eliminar variveis que no se apresentem influentes. Com essa iniciativa, reduz-se o
nmero total de ensaios e o que mais importante reservam-se os recursos para aqueles
ensaios realmente importantes, que normalmente no fornecem resultados objetivos nas
tentativas iniciais;
5. Execuo dos experimentos, monitorando-os e controlando-os. Essa etapa
extremamente importante, pois garante a validade experimental e exige do pesquisador
4
um conhecimento profundo dos instrumentos, equipamentos e mtodos de controle e
monitoramento;
6. Anlise dos resultados, com o uso de mtodos estatsticos, a fim de que as concluses
estabelecidas sejam objetivas. Destaque-se que esses mtodos no permitem afirmar se
uma dada varivel apresenta ou no um determinado efeito: eles apenas garantem a
confiabilidade e a validade dos resultados, de modo que se possa determinar o erro
associado nas concluses, de acordo com um dado grau de confiana previamente
estabelecido;
7. Elaborao das concluses e recomendaes a partir da anlise dos resultados.
As concluses e recomendaes permitiro que decises sejam tomadas a respeito
do processo em estudo. Uma documentao extensa, com o uso de grficos e tabelas
permite que se apresentem os resultados obtidos, a anlise efetuada, bem como futuras
repeties do procedimento empregado.
1.2. Conceitos Bsicos de Estatstica

1.2.1. Experimentos Aleatrios
Experimentos aleatrios so observaes de ocorrncias incertas ou casuais, com as
seguintes caractersticas (Cunha, 2007):
9 Cada experimento poder ser repetido um nmero arbitrrio de vezes, sob
condies essencialmente inalteradas;
9 Em cada realizao do experimento, no somos capazes de prever o
resultado que ocorrer. Todavia, conhecemos o conjunto de todos os
possveis resultados do experimento.
9 Quando o experimento for repetido um grande nmero de vezes, surgira uma
r
regularidade do resultado, isto , haver uma estabilidade da frao
n
(freqncia relativa) da ocorrncia de um particular resultado.
Exemplos:
Jogar uma moeda e observar a sua face superior;
Sexo do primeiro filho de um casal;
Nmero de chips defeituosos encontrados num lote de 100 chips;
Peso de uma pessoa.
5
1.2.2. Espao Amostral e Eventos
O conjunto formado por todos os possveis resultados de um processo aleatrio
denominado espao amostral (S).
Exemplo1: Lanamento simultneo de trs moedas e o registro das faces obtidas. Para
este experimento o espao amostral :
S = {KKK; KKC; KCK; CKK; KCC; CKC; CCK; CCC}em que , K = cara e C =
coroa.
Exemplo 2: Processo aleatrio: Verificar a vida til de uma lmpada.
S = {x R : 0 x 24 meses}
Exemplo 3: Processo aleatrio: Verificar a cor das flores de uma planta de feijoeiro.
S = {branca; roxa; amarela}.
Qualquer sub-conjunto do espao amostral (S) denominado evento. O evento A:
exatamente duas caras obtidas no lanamento de uma moeda, representado pelo
conjunto:
A = { KKC; KCK; CKK }
Uma vez que os eventos podem ser interpretados como conjuntos, a eles podemos
aplicar as operaes empregadas na teoria de conjuntos. Assim: Se A e B forem
eventos:
A B ser o evento que ocorrer se, e somente se, A ou B (ou ambos)
ocorrerem.
A B ser o evento que ocorrer se, e somente se, A e B ocorrerem.
A ser o evento que ocorrer se, e somente se, A no ocorrer.
A e B so mutuamente excludentes se no puderem ocorrer juntos, ou seja, A B =
, onde indica o evento vazio (nenhuma ocorrncia).
1.2.3. Freqncia Relativa

Suponhamos que realizemos um experimento n vezes e que dois eventos a ele
associados A e B ocorram em nmeros nA e nB, respectivamente, com n = nA + nB.
nA
Define-se por f A = a frequncia relativa do evento A nas n repeties do
n
experimento. A frequncia relativa fA apresenta as seguintes propriedades:
1) 0 fA 1
2) fA = 1 se, e somente se, A ocorrer em todas as n repeties
6
3) fA = 0 se, e somente se, A nunca ocorrer nas n repeties
4) Se A e B forem mutuamente excludentes e se fAB for a frequncia relativa
do evento A B, ento fAB = fA + fB.
1.2.4. Probabilidade
A chamada definio clssica de probabilidade de: Dado um conjunto de N eventos
equiprovveis, a probabilidade de ocorrncia de um determinado evento A, dada pela
razo:
n
P( A) =
N
onde:
n o nmero de eventos de interesse
N o nmero total de eventos
As propriedades bsicas da probabilidade de A so:
1. 0 P(A) 1
2. P(S) = 1
3. Se A e B forem mutuamente excludentes: P(A B) = P(A) + P(B)
A escolha das probabilidades acima , obviamente, sugerida, pelas correspondentes
caractersticas da freqncia relativa.
Pode-se mostrar que os nmeros P(A) e fA so prximos um do outro quando fA for
baseado em um grande nmero de repeties.
Com base nas propriedades da probabilidade e das operaes conhecidas da teria
dos conjuntos, pode-se demonstrar os seguintes teoremas:
Teorema 1: P() = 0.
Teorema 2: Para um evento A qualquer, P(A) = 1 P(A).
Teorema 3: Se A e B so dois eventos quaisquer, ento, P(A B) = P(A) + P(B) -
P(A B).
Teorema 4: Se A, B e C forem trs eventos quaisquer, ento, P(A B C) = P(A)
+ P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C).
Determinao de Probabilidades em Experimentos com Eventos Igualmente

Verossmeis
7
Existem vrios experimentos aleatrios para os quais os resultados possveis so
igualmente provveis. Entretanto, muitos experimentos no apresentam esta
caracterstica, a qual deve, portanto, ser cuidadosamente testada e justificada.
Exemplo: Um dado equilibrado lanado, a probabilidade do evento A = {resultado
maior do que 4}, o nmero de resultados favorveis a A, que so dois resultados, sair
os nmeros 5 e 6, e o nmero de resultados possveis de todo o espao amostral 6.
Ento:
nmero de resultados favorveis a A
P( A) = (1.1)
nmero de resultados possveis em todo o espao amostral
2 1
P( A) = =
6 3
Mtodos de Enumerao: Permutaes, Arranjos e Combinaes

Para o clculo de probabilidades usando a Equao (1), precisamos, muitas vezes,
utilizar tcnicas de anlise combinatria para quantificar o numerador e o denominador.
Exemplo: Se tivermos os objetos a, b e c, poderemos obter as seguintes
permutaes: abc, acb, bac, bca, cab e cba. Portanto, para este caso, a resposta 6.
De modo geral, o nmero de permutaes de n objetos diferentes dado por:
Pn = n!
Consideremos novamente n objetos diferentes. Desejamos escolher r desses objetos
0 r n e permutar os r objetos escolhidos. Denotaremos o nmero de possibilidades
para fazer isso por An,r, calculado por:
n!
An ,r = (1.2)
(n r )!
Consideremos novamente n objetos diferentes, queremos dispor r dentre esses n
objetos, sem considerar sua ordem, obtendo as chamadas combinaes. O nmero de
combinaes possveis dado por:
n!
C n ,r = (1.3)
r!(n r )!
1.2.5. Variveis Aleatrias

Ao realizar-se uma srie de ensaios sob condies preestabelecidas, normalmente
observa-se uma variao de resultados de ensaio para ensaio. Essa variao denomina-
se erro experimental e tambm um erro estatstico proveniente de condies de ensaio
8
incontrolveis. A existncia deste erro caracteriza a varivel de resposta como sendo
uma varivel aleatria (V.A.), que pode ser discreta se apresentar um nmero finito de
valores possveis, ou contnua, se estiver dentro de um intervalo de valores.
A probabilidade de uma varivel aleatria x dada pela sua distribuio de
probabilidade. Caso a varivel seja discreta, essa distribuio uma funo
probabilidade p(x), caso seja contnua, passa a ser denominada funo densidade de
probabilidade f(x) (f.d.p).
Na figura 1, representa-se p(x), para uma distribuio discreta, onde a funo
representa a probabilidade P da distribuio.
Figura 1. Distribuio Discreta.
Na figura 2, mostrada f(y), sendo P representada pela rea sob a curva num dado
intervalo. Juntamente com cada figura, apresentam-se as propriedades de cada uma das
probabilidades em cada caso.
Figura 2. Distribuio Contnua.
9
Observaes:
9 f(x), a funo densidade de probabilidade, no probabilidade. Somente
quando for integrada entre dois limites ela produzir uma probabilidade, que
ser a rea sob a curva y = f(x) entre x = a e x =b, sendo a < b.
x0
9 P( x = x0 ) = f ( x)dx = 0
x0
Para caracterizar uma f.d.p., normalmente consideramos dois parmetros principais:

1. Tendncia central, em torno da qual a distribuio se concentra.
2. Disperso, que indica a variao em torno da tendncia central.
1.2.6. Medidas de Tendncia Central

A mdia (), ou valor esperado da V.A., de uma distribuio indica a locao ou
tendncia central dessa distribuio, sendo definida como:
= x p( x) , se x discreta.
todos y
(1.4)
= x f ( x) dx , se x contnua.

Pode-se definir como o valor mdio esperado para um nmero elevado de ensaios,
ou seja E(X), tambm denominado operador do valor esperado (Bendat, 1986).
Exemplo: Para a varivel aleatria contnua definida por:
f ( x) = 0 para x<0
x
f ( x) = para 0 x 2
2
f ( x) = 0 para x>2
tem-se:

0 2x2 4
E( X ) = xf ( x)dx = 0dx + dx + 0dx = unidade
0 2 3
2
2
Em particular, para f(x) = x , o valor esperado para esta funo dado por:

E(x 2 ) = x f ( x) dx = 2x
2
(1.5)

2: valor mdio quadrtico
10
1.2.7. Medidas de Disperso
A varincia 2 representa a disperso de uma distribuio e definida como:
2 = ( x ) 2 p( x) , se x for discreta. (1.6)

todos x

= (x )
2 2
f ( x) dx , se x for contnua. (1.7)

A varincia pode ser expressa usando o operador de expectativa E(x), pois:
2 = E[( x ) 2 ] (1.8)
Tambm se pode definir um operador de varincia V(x) igual a:
V ( x) = E[( x ) 2 ] = 2 (1.9)
A partir dos parmetros m, s2 e c (constante), tm-se as seguintes propriedades:
1. E(c) = c 7. E(y1 + y2) = E(y1) + E(y2) = 1 + 2
2. E(y) = 8. V(y1 + y2) = V(y1) + V(y2) + 2Cov(y1 y2)
3. E(c y) = c E(y) = c 9. V(y1 - y2) = V(y1) + V(y2) 2Cov(y1 y2)
4. V(c) =0 10. V(y1 y2) = V(y1) + V(y2) = 12 + 22
5. V(y) = 2 11. E(y1 y2) = E(y1) E(y2) = 1 2
6. V(c y) = c V(y) = c
2 2 2
y E ( y1 )
12. E 1
y2 E ( y2 )
Onde, y1 e y2 so variveis aleatrias, com mdias iguais a 1 e 2 e varincias
iguais a 12 e 22 .
No caso das propriedades 10 e 11, assume-se que essas variveis sejam
independentes.
O parmetro covarincia ( Cov(x,y) ) representa a associao linear que existe entre as
variveis x e y. A covarincia, a qual mede o grau de disperso conjunta de duas
variveis aleatrias, dada por:
cov(x, y ) = E[( x x )( y y )]
Sendo que no caso de duas variveis independentes, tem-se que Cov(x,y) = 0.

Para variveis aleatrias contnuas, a covarincia dada por:
11

E ( XY ) = ( xy)dxdy (1.10)

No caso do planejamento experimental, os resultados obtidos referem-se a uma

amostragem, que se espera possam reproduzir o comportamento da populao que
representam.
Os mtodos estatsticos s podem ser utilizados se as amostras forem escolhidas
aleatoriamente, ou seja, com a mesma probabilidade de serem retiradas da populao
que outras amostras.
Qualquer funo relativa aos resultados de uma amostra e que no contenha
parmetros desconhecidos denominada funo estatstica, como por exemplo, as
funes mdia ( x ) e varincia (s2) da amostra. Elas so estimadores pontuais, ou
estimativas, respectivamente da mdia () e da varincia (2) da populao.
n
xi
i =1
x= (1.11)
n
n
( xi x ) 2
i =1
s2 = (1.12)
n 1
onde x1, x2, ..., xn representam a amostra e n o nmero de elementos da amostra. O
desvio-padro da amostra (s) comumente empregado como medida de disperso por
apresentar unidade igual das medidas (xi).
Exemplo: Um estimador pontual no deve, necessariamente, ser distorcido ou
parcial. Deve apresentar uma varincia mnima, ou seja, menor que a varincia de
qualquer outro estimador do parmetro analisado.
A expresso que determina a varincia de uma amostra, tem como numerador:
n
SS = ( xi x ) 2
i =1
que a soma corrigida dos quadrados das observaes (xi), ou seja, a soma dos
quadrados das diferenas x1 x , x2 x , x3 x , K, xn x . Como a somatria dessas
diferenas igual a zero, somente n-1 elementos so independentes. Assim, SS tem n-1
graus de liberdade, ou = n-1, de modo que:
SS
E = 2

12
1.2.8. Momentos, Assimetria e Curtose.
Momentos
Se x1; x2; . . . ; xn so os n valores assumidos pela varivel X, define-se a
quantidade:

n
x r + x2r + L + x nr xrr
X = 1
r
= i =1
(1.13),
n n
como o momento de ordem r em relao a origem. Nota-se que o primeiro momento em
relao origem ( X 1 ) a mdia de X.
O momento de ordem r em relao a uma origem k, qualquer, dado por:
n
( xi k ) r
i =1
M r' (k ) = (1.14)
n
O momento de ordem r em relao mdia X dado por:
n
( xi X ) r (1.15)
i =1
M r' ( X ) =
n
Nota-se que o segundo momento em relao a mdia a varincia.

Para o caso dos dados encontrarem-se agrupados, na forma de uma distribuio de
freqncias, as expresses para o clculo dos momentos sero:
n
( xi k ) r Fi
M r' (k ) = i =1 (1.16)

n
F
i =1 i
onde:
xi o ponto mdio da i-sima classe
Fi = freqncia absoluta da i-sima classe.
Coeficiente de Assimetria (Cs).

Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Se a
curva de freqncia (polgono de freqncia suavizado) de uma distribuio tem uma
cauda" mais longa direita da ordenada mxima do que esquerda, diz-se que a
13
distribuio assimtrica direita ou assimtrica positiva. Se o inverso ocorre, diz-se
que ela assimtrica esquerda ou negativa.
O coeficiente de assimetria (Cs) dado por:
M 3'
Cs = (1.17)
( 2 )1,5
Classificao das distribuies quanto assimetria:

9 Cs = 0 distribuio simtrica perfeita.
9 Cs > 0 a distribuio assimtrica direita.
9 Cs < 0 a distribuio assimtrica esquerda.
Existem ainda o primeiro e segundo coeficientes de assimetria de Pearson dados
respectivamente por:
X Mo
Cs = (1.18)
s
3( X M d )
Cs = (1.19)
s
Tipos de distribuies quanto assimetria:
Distribuio Simtrica Distribuio Assimtrica Negativa
Distribuio Assimtrica Positiva
14
Coeficiente de Curtose
Curtose o grau de achatamento de uma distribuio, considerado usualmente em
relao distribuio normal, que ser detalhada na seo 1.2.11. A distribuio que
tem um pico relativamente alto chamada leptocrtica, enquanto a distribuio que
possui o topo achatado denominada platicrtica e a distribuio que no muito
pontiaguda, nem muito achatada, como acontece com a distribuio normal
denominada mesocrtica. O coeficiente de curtose dado por:
M 4'
Ck = (1.20)
( 2 ) 2
Tipos de distribuio quanto curtose:
Distribuio Leptocrtica Distribuio Mesocrtica
Distribuio Platicrtica
1.2.9. Desigualdade de Chebyshev

Seja x uma Varivel Aleatria com distribuio arbitrria, mdia , valor mdio
quadrtico 2 e varincia 2.

x2 = x 2 p( x )dx x 2 p( x )dx (1.21)
x
15
2
x p(x)dx x x p(x )dx
2 (1.22)
x x p(x )dx 2 p ( x )dx 1.23)

2
x
onde um valor real.

Portanto:
x2
Pr ob[ x ] =

x p (x )dx (1.24)
2
Substituindo x por x - , 2 ser substitudo por 2 e a desigualdade de Chebyshev
pode ser escrita como:
x2
Pr ob[ x x ] (1.25)
2
Fazendo = c, uma constante real vezes o desvio padro, chega-se forma final da
desigualdade de Chebyshev:
Pr ob[ x x c ]
1
(1.26)
c2
1.2.10. Teorema do Limite Central

Uma razo para a distribuio Normal ser considerada to importante porque
qualquer que seja a distribuio da varivel de interesse para grande amostras, a
distribuio das mdias amostrais sero aproximadamente normalmente distribudas, e
tendero a uma distribuio normal medida que o tamanho de amostra crescer. Ento
podemos ter uma varivel original com uma distribuio muito diferente da Normal
(pode at mesmo ser discreta), mas se tomarmos vrias amostras grandes desta
distribuio, e ento fizermos um histograma das mdias amostrais, a forma se parecer
como uma curva Normal.
No caso de uma amostra de tamanho n retirada de uma populao, seja finita ou
infinita, que apresenta mdia e varincia 2, se o valor mdio da amostra dado por
x , tem-se pelo teorema do limite central que:
x
z= (1.27)
n
de modo que se n , tem-se a distribuio normal padro, definida a seguir (1.2.11).
16
1.2.11. Distribuies Caractersticas de Amostragens
Distribuio Normal
Uma das distribuies de amostragem mais empregadas em tcnicas estatsticas para
modelar experimentos aleatrios com nmero de rplicas elevado a distribuio
normal f(x) ou distribuio de Gauss, definida para uma varivel aleatria x.
a mais importante das distribuies de probabilidades contnuas, pois a maioria
delas segue esta distribuio, aliado ao fato da facilidade e boa preciso que obtida na
aproximao de outras distribuies para a normal, e o Teorema do Limite Central
(TLC) que a base das estimativas e testes de hipteses, realizados sobre a mdia de
uma populao qualquer, que garante que a distribuio amostral das mdias segue uma
distribuio normal, independentemente da distribuio da varivel em estudo (Silva,
2005).
A funo densidade probabilidade normal dada por:
2
1 x

1
f ( x) = e 2 (1.28)
2
onde e so os parmetros mdia e desvio padro, respectivamente.

O grfico da distribuio normal dado por:
Propriedades da distribuio normal:

9 simtrica em relao ao ponto x =
9 Tem forma de sino
17
9 As trs medidas de posio, mdia, mediana e moda se confundem no ponto de
mximo da curva (x = )
9 Fica perfeitamente definida conhecendo-se a mdia e o desvio padro
9 Tem dois pontos de inflexo em x =
9 assinttica em relao ao eixo das abicissas
Sendo a equao (1.28) uma funo densidade probabilidade (f.d.p), a rea

compreendida entre a curva e o eixo x igual a 1, ou seja,

f ( x)dx = 1 . Portanto, a
b
rea sob a curva entre os pontos a e b dada por
a
f ( x)dx = 1 representa a probabilidade
da varivel X assumir um valor entre a e b.

Deste modo, imediato verificar que a probabilidade de um ponto qualquer nula,
a
pois
a
f ( x)dx = 0 .
Notao: X ~ N(, 2).

Como se pode notar, o clculo de probabilidades via distribuio normal envolve a
soluo de integrais que no so nada triviais. Em virtude da grande aplicao da
distribuio normal, procurou-se tabelar os valores de probabilidade, que seriam obtidos
por meio da integrao da funo densidade probabilidade normal num determinado
intervalo. A dificuldade para se processar esse tabelamento se prendeu na infinidade de
valores que e poderiam assumir. Nestas condies, teria que se dispor de uma tabela
para cada uma das infinitas combinaes de e . Procurou-se, por isso, obter uma
nova forma para a distribuio normal, que no sofresse a influncia desses parmetros.
O problema foi solucionado mediante o emprego de uma nova varivel z, definida
x
por z = , que transforma todas as distribuies normais, em uma distribuio

normal reduzida, ou padronizada, de mdia zero e desvio padro um, z ~ N(0; 1).
Assim, utilizamos apenas uma tabela para o clculo de probabilidades, para
qualquer que seja a curva correspondente a uma distribuio normal. Desta forma, para
um valor de x = numa distribuio normal qualquer, corresponde o valor z = 0, na
distribuio normal reduzida. Para x = + , tem-se z = 1, e assim por diante.
Distribuio Chi-quadrado 2
Uma distribuio de amostragem bastante empregada a chi-quadrado, ou
distribuio 2:
18
Se z1, z2, z3,...., zk so variveis aleatrias, normalmente e independentemente
distribudas, com = 0 e 2 = 1 [NID(0,1)], ento:
k2 = z12 + z 22 + ..... + z k2
onde k2 uma varivel aleatria que segue a distribuio chi-quadrado com k graus de
liberdade. A funo densidade de chi-quadrado :
1
( 2 ) ( k / 2)1 e
2
f ( 2 ) = /2
, 2 > 0 (1.29)
k
2 k / 2
2
onde (n) a funo gama. Para n inteiro positivo, (n) = (n-1)!
A distribuio chi-quadrado assimtrica e distorcida, com = k e 2 = 2k.
Seja uma distribuio normal, onde x1, x2, ..., xn, representam uma amostra retirada de
uma distribuio N(, 2). Tem-se que:
n
SS
( xi x ) 2
i =1
= n21 (1.30)
2
2
Assim, SS/2 est distribuda como chi-quadrado e tem n - 1 graus de liberdade, ou

seja, uma somatria de quadrados de variveis aleatrias dividida pela varincia, segue
a distribuio 2.
Distribuies Qui-Quadrado com 1, 5 e 10 graus de liberdade.
19
Distribuio t de Student
x
Viu-se que a varivel z = ~ N(0; 1). De modo semelhante, pode-se

demonstrar que:
x
z= ~ N(0; 1)
(1.31)
n
Suponha que o parmetro em 1.31 seja substitudo por seu estimador no
tendencioso:
s 2
=
( xi x ) 2
(1.32)
n 1
Assim, a equao 1.31 ficar:
x
t=
s (1.33)
n
Pode-se demonstrar que a varivel t, segue uma distribuio t de student com k = n
1 graus de liberdade, cuja funo densidade probabilidade :
k +1 k +1

2 2 2
f ( x) = 1 + x (1.34)
k k
k
2
Esperana: E(t) = 0;
k
Varincia: V (t ) =
k+2
Caractersticas:
9 simtrica em relao ao ponto x = 0 (mdia)
9 Se k tende para infinito, t tende para z, como pode ser observado na figura abaixo.
20
Distribuies t de student com 5 e 30 graus de liberdade e distribuio normal
padronizada.
Vale lembrar que se z e 2 so variveis aleatrias independentes respectivamente,

normal e chi-quadrado, ento a varivel aleatria t dada por:
z
t=
2 (1.35)
k
Distribuio F de Snedcor
Sejam duas variveis aleatrias independentes u2 e v2 , com u e v graus de

liberdade, respectivamente. A razo:
u2 u
Fu ,v = (1.36)
v2 v
segue a distribuio F, com u graus de liberdade para o numerador e v para o
denominador.
A distribuio de probabilidade de F dada por:
u/2
u + v u
F (u / 2)1
h( F ) = 2 v 0<F<
(u + v ) / 2 (1.34)
u v u
F + 1
2 2 v
21
Por exemplo, suponha duas populaes com distribuio normal e varincias
idnticas. Se retirarmos uma amostra de cada populao, respectivamente x11, x12, ..., x1n
e x21, x22, ..., x2n, com n1-1 e n2-1 graus de liberdade, ento:
S12
Fn1 1,n2 1
S 22
onde S12 e S 22 so as varincias das amostras. Ou seja, a razo das varincias das
amostras segue uma distribuio F.
Caso 12 22 , tem-se:
S12
12 S12 S 22
F= pois (n1 1) n21 1 e (n2 1) n22 1
S 22 12 22
22
Distribuio F, com 10 graus de liberdade para o numerador e 20 para o denominador.
1.2.12. Estimadores
Estimador
Consideremos uma amostra (x1; x2; x3; ... ; xn) de uma varivel aleatria que deve
descrever uma caracterstica de interesse da populao. Seja um parmetro que
desejamos estimar, como por exemplo a mdia = E(x) ou a varincia 2 = V (x). Um
estimador, , do parmetro uma varivel aleatria, que funo das observaes x1;
x2; x3; ... ; xn.
Assim,
22
n
xi
i =1
x= um estimador da mdia populacional
n
n
( xi x ) 2
i =1
s2 = um estimador da varincia populacional 2
n 1
Estimativa
Estimativa o valor numrico assumido pelo estimador quando os valores
observados x1; x2; x3; ... ; xn so considerados.
Assim,
x = 70 kg um estimador da mdia populacional
s 2 = 9 kg 2 um estimador da varincia populacional 2
Propriedades dos Estimadores

A) No tendenciosidade
Um estimador dito um estimador no tendencioso do parmetro se E( ) =
Obs.: Os termos no tendencioso, no viciado e imparcial so sinnimos.
n
xi
i =1
Exemplo 1: x = um estimador no tendencioso da mdia populacional .
n
23
n
( xi x ) 2
i =1
Exemplo 2: s 2 = um estimador tendencioso da varincia populacional 2
n 1
Portanto:
Deste modo, verifica-se que s2 um estimador tendencioso de 2. Um estimador no

tendencioso facilmente obtido por:
B) Consistncia
Um estimador um estimador consistente do parmetro se:
lim n E[ ] = ;
24
lim n V[ ] = 0;
n
xi
i =1
x= um estimador consistente da mdia populacional , pois:
n
E( x ) = ;
2
lim n V[ x ] = = 0.
n
C)
D) Eficincia
Se 1 e 2 so dois estimadores no tendenciosos de , ento 1 mais eficiente que
2 se V(1) < V(2).
A eficincia relativa do estimador 1 em relao ao estimador 2 dada por:
V ( 2 )
Ef1 , 2 =
V (1 )
1.2.13. Intervalos de confiana.
Conhecendo-se a distribuio amostral do estimador, de um parmetro , pode-se
facilmente determinar um intervalo que apresente uma confiana 1 - para , como
ser visto a seguir.
Intervalo de Confiana para a Mdia

Varincia conhecida
2
Sabe-se x ~ N ; , assim a varivel z = x ter distribuio N(0; 1).

n
n
Fixando-se um nvel de confiana (1- ) vir:
25
E o intervalo de confiana para , com uma confiana de 1 - , pode ser ento
escrito como:

IC ( )1 = x z (1.35)
2
n
onde n o tamanho da amostra.
Obs.: Se ocorrer amostragem sem reposio em populao finita (ASRPF) o intervalo

de confiana para a mdia ser:
N n
IC ( )1 = x z (1.36)
n N 1
2
onde:
N o tamanho da populao;
n o tamanho da amostra.
Exemplo: Uma mquina produz rolamentos que apresentam desvio padro de 0.042
polegadas em seu dimetro. Desejando-se conhecer o dimetro mdio dos rolamentos
produzidos por esta mquina, extraiu-se uma amostra de 100 rolamentos, observando-se
uma mdia igual a 0.824 polegadas: Obter o intervalo com 0.90 de confiana para o
verdadeiro dimetro mdio dos rolamentos.
Soluo:
Tem-se x = 0.824, = 0.042, n= 100, 1- = 0.90 substituindo esses valores em
1.35 vem:
Interpretao: Como um parmetro e no uma varivel aleatria, a interpretao

correta do intervalo de confiana : Construdos todos os intervalos do tipo x 1,65 .
n
90% deles contero o parmetro . Na prtica, apenas um nico intervalo construdo,
no presente exemplo tal intervalo foi [0.817; 0.831]. Esse intervalo ento comumente
chamado intervalo de confiana de 90% para . Isto , tem-se 90% de confiana de que
esse intervalo contenha o valor , no sentido de que 90% dos intervalos assim
construdos conteriam .
26
obviamente incorreto, do ponto de vista da estatstica clssica, dizer que a
probabilidade do intervalo [0.817; 0.831] conter o valor 0,90. Pois essa
probabilidade 0 ou 1, dependendo de pertencer ou no ao intervalo fixo.
Varincia Desconhecida
Quando no se conhece 2 e consequentemente , mas sim sua estimativa s, o
intervalo de confiana para a mdia ser dado por:
Amostras Pequenas (n 30)
s
IC ( )1 = x t (1.37)
2
n
t com n-1 graus de liberdade,

2
onde n o tamanho da amostra.
Obs. Se ocorrer amostragem sem reposio em populao finita (ASRPF) o intervalo de

confiana para a mdia ser:
s N n
IC ( )1 = x t (1.38)
n N 1
2
t com n-1 graus de liberdade

2
onde:
N o tamanho da populao;
n o tamanho da amostra.
Amostras Grandes (n > 30)
Foi visto que medida que se aumenta o tamanho da amostra, a distribuio t de
Student se aproxima da distribuio normal. Deste modo, quando se estiver trabalhando
com amostras grandes (n > 30), pode-se utilizar a distribuio normal padronizada z em
lugar da t na obteno dos intervalos de confiana, mesmo que 2 seja desconhecida.
Exemplo: Uma Companhia adquiriu 500 cabos. Uma amostra de 30 deles
selecionados ao acaso apresentou tenso de ruptura mdia igual a 2400 kg com desvio
padro de 150 kg. Obter o intervalo com 95% de confiana para a verdadeira tenso
mdia de ruptura destes cabos.
Soluo:
27
Tem-se: N = 500 n = 30, x = 2400, s = 150, 1- = 0.95.
Interpretao: Existem 95% de confiana em se dizer que a verdadeira tenso mdia

de ruptura dos cabos est entre 2345,69 e 2454,31kg.
Diferena entre duas mdias (a - b ).

Varincias Conhecidas
a2 b2
IC ( a b )1 = x a xb z (1.39)
na nb
2
onde:
xa e xb so as estimativas pontuais das mdias das populaes a e b, respectivamente;
a2 e b2 as varincias das populaes a e b, respectivamente;

na e nb os tamanhos das amostras das populaes a e b, respectivamente;
Obs.: Se ocorrer ASRPF deve-se multiplicar a varincia da populao, na qual ocorreu

N n
ASRPF, pelo fator de correo .
N 1
Exemplo: As empresas A e B produzem tubos para esgoto com as varincias em seus

dimetros iguais a 8 mm2 e 10 mm2, respectivamente. Uma amostra de 48 tubos da
empresa A apresentou dimetro mdio igual a 40 mm, e uma amostra de 36 tubos da
empresa B apresentou dimetro mdio de 42mm. Verifique, por meio de um intervalo
de confiana com 0.95 de probabilidade, se existe diferena entre os dimetros mdios
dos tubos das marcas A e B.
Soluo:
28
Concluso: Pode-se afirmar com 95% de confiana que a verdadeira diferena entre os
dimetros mdios dos tubos produzidos pelas empresas A e B est entre -2 1.2973mm,
isto , entre -3.2973 e -0.7027 mm. Como esse intervalo no compreende o valor 0
(zero) tem-se 95% de confiana em afirmar que os dimetros mdios dos tubos
produzidos por estas empresas no so iguais.
Varincias Desconhecidas
Quando se desconhecem as varincias populacionais ( a2 e b2 ) torna-se necessria
a substituio de seus valores paramtricos por suas estimativas amostrais ( s a2 e sb2 ).

Neste caso, deve-se utilizar a distribuio t de Student, em lugar da normal. Alm desta
alterao deve-se considerar ainda se as duas populaes so homocedsticas ou
heterocedsticas, isto , se as varincias populacionais (desconhecidas) so iguais ou
diferentes, o que pode ser aferido por meio de um teste de hiptese para homogeneidade
das varincias.
Populaes Homocedsticas
Sendo as populaes homocedsticas ( a2 = b2 = 2), assim, s a2 e sb2 so duas
estimativas para um mesmo parmetro (2). Ento o intervalo de confiana para a

diferena entre duas mdias dado por:
1 1
IC ( a b )1 = x a xb t s p + (1.40)
n a nb
2
t com na+ nb 2 graus de liberdade

2
onde:
(na 1) s a2 (nb 1) sb2

sp =
n a + nb 2
29
Populaes Heterocedsticas
Sendo as populaes heterocedsticas ( a2 b2 ), assim, s a2 e sb2 so as estimativas
de diferentes parmetros por serem combinadas em um nico valor. Ento o intervalo de

confiana para a diferena entre duas mdias dado por:
s a2 sb2
IC ( a b )1 = x a xb t + (1.41)
n a nb
2
t com graus de liberdade

2
onde:
2
s a2 sb2
+
n a nb
=
2 2
s a2 sb2

na
+ nb
n a 1 nb 1
Intervalo de Confiana para Proporo

Amostras grandes (n > 30): O intervalo de confiana para a proporo dado por:
p q
IC ( P)1 = p z (1.42)
n
2
onde:
p a proporo estimada na amostra;
q = 1 p ;
n o tamanho da amostra
Obs.: Se ocorrer ASRPF, o intervalo de confiana para proporo dado por:
p q N n
IC ( )1 = p z (1.43)
n N 1
2
Amostras pequenas (n 30): Quando a amostra for pequena deve-se utilizar a

distribuio t de Student, em lugar da normal e o intervalo de confiana para a
proporo ser dado por:
30
p q
IC ( P)1 = p t (1.44)
n
2

2
Obs.: Se ocorrer ASRPF, o intervalo de confiana para proporo dado por:
p q N n
IC ( )1 = p t (1.45)
n N 1
2

2
Intervalo de confiana para a diferena entre propores

Dadas duas amostras independentes, de populaes diferentes, o intervalo de
confiana para a diferena entre as propores nestas populaes dado por:
Amostras grandes (n > 30):
p a q a p b q b
IC ( Pa Pb )1 = ( p a p b ) z + (1.46)
na nb
2
onde:
p a a proporo estimada na amostra;
q a = 1 p a ;
q b = 1 p b
na e nb so os tamanhos das amostras a e b, respectivamente.
Obs.: Se ocorrer ASRPF, deve-se multiplicar o componente da varincia, referente
N n
populao na qual ocorreu ASRPF pelo fator de correo .
N 1
Amostras pequenas (n 30):
p a q a p b q b
IC ( Pa Pb )1 = ( p a p b ) t + (1.47)
na nb
2
t com na+ nb 2 graus de liberdade

2
Obs.: Se ocorrer ASRPF, deve-se multiplicar o componente da varincia, referente

N n
populao na qual ocorreu ASRPF pelo fator de correo .
N 1
Intervalo de confiana para a varincia (2)
O intervalo de confiana para a varincia populacional dado por:
31
Sabe-se que:
(n 1) s 2
~ n21 (1.48)
2
Ento,

(n 1) s 2 2
(n 1) s
2 = 1 (1.49)
2
2
1 2 2
E o intervalo de confiana para a varincia ser:

(n 1) s 2 (n 1) s 2
IC ( 2 )1 = ; (1.50)
2 2
1 2 2
1.3. Testes de Hipteses

Uma hiptese cientfica qualquer afirmao que possa ser refutada, caso contrrio
pertencer a outro ramo do conhecimento humano, como por exemplo, a religio. Assim
sendo, a hiptese: Os motores da marca x so mais econmicos que os da marca y"
uma hiptese cientfica, pois qualquer pessoa que duvide, ou queira comprov-la, pode
montar um experimento e averiguar sua veracidade. Por outro lado, a hiptese: Deus
existe", no pode ser avaliada, no sendo, portanto, cientfica. (Silva, 2005).
Uma determinada hiptese tida como verdadeira, se em sua avaliao no forem
encontrados indcios que a desaprovem, permanecendo assim at que se prove o
contrrio. Para que uma hiptese cientfica seja testada, ela deve ser convertida em uma
hiptese estatstica, que uma armao sobre um parmetro populacional. Um teste de
hiptese, fundamenta-se em um conjunto de regras, que permitem, a partir dos
resultados experimentais (amostrais) rejeitar ou no tal hiptese, associando a esta
deciso uma determinada confiana.
Em geral, intervalos de confiana so a forma mais informativa de apresentar os
achados principais de um estudo. Contudo, algumas vezes existe um particular interesse
em decidir sobre a verdade ou no, de uma hiptese especfica (se dois grupos tm a
mesma mdia ou no, se o parmetro populacional tem um valor em particular ou no).
32
Teste de hipteses fornece-nos a estrutura para que faamos isto. Veremos que
intervalos de confiana e testes de hipteses esto intimamente relacionados.
(Shimakura e Ribeiro, 2003)
Para a realizao de um teste de hipteses, devem-se formular duas hipteses
estatsticas, a saber:
9 Hiptese de nulidade (H0) a hiptese que seria testada, sendo geralmente
formulada com o intuito de ser rejeitada.
9 Hiptese alternativa (Ha) qualquer hiptese que contrarie H0.
Exemplo: Suponha que se esteja interessado em verificar se a verdadeira
performance (km/litro de combustvel) dos veculos, de determinada marca, equipados
com motores 1.6 c.c. seja de 14km/l, como afirma o fabricante, ou se este inferior a
14km/l. Ento deve-se formular as seguintes hiptese estatsticas:
Para verificar a veracidade da hiptese H0, deve-se conduzir um experimento

(coletar uma amostra), no qual ser medida a performance de vrios carros, que
fornecero uma estimativa da performance mdia, e sua varincia, a partir das quais,
verifica-se a veracidade da hiptese H0. Suponha que no experimento acima tenham
sido avaliados 9 carros, e que estes tenham apresentado uma performance mdia de 13
km=l, com varincia 4(km/l)2. Pelo simples fato desta amostra de 9 carros ter
apresentado uma performance mdia inferior a informada pelo fabricante (14 km/l), no
se pode concluir que esta afirmativa seja falsa, pois como j sabido, esta estimativa
est sujeita uma distribuio amostral. Deste modo, para verifica a veracidade de H0,
assume-se que esta hiptese seja verdadeira, isto = 14 km/l. e calcula-se a
probabilidade de uma amostra, com tamanho n = 9, retirada desta populao, fornecer
uma estimativa inferior a estimativa obtida (13 km/l). Caso esta probabilidade seja alta,
no haver nenhuma razo para rejeitar a hiptese H0 (isto , duvidar de sua
veracidade), sendo esta tida como verdadeira. Nesta situao, disse que a diferena
observada entre a mdia amostral (13 km/l) e a populacional (14 km/l) no
significativa, da a terminologia usual de que o teste foi no significativo", usada para
dizer que a hiptese H0 no foi rejeitada. Por outro lado, se a probabilidade de se obter
esta estimativa for pequena (p < 0.05) h razes para acreditar que a verdadeira mdia
populacional seja menor do que se imaginava, ou seja a verdadeira performance deve
33
ser menor que 14 km/l. Nesta situao, diz-se que a diferena foi significativa, portanto
a hiptese H0 deve ser rejeitada (o teste foi significativo).
Obs.: No existe nenhum argumento cientfico para se fixar o nvel de probabilidade
limite de um teste em 0.05. Este apenas um valor usual, devido facilidade de sua
obteno em tabelas. Nos nossos exemplos temos:
na amostra de n = 9 carros obteve-se x = 13km / l e s 2 = 4(km / l ) 2 ; sabendo-se que
2
x ~ N , , assumindo = 14 km/l, e como no se conhece 2, mas sim s2, tem-se:

n
4
x ~ t (8) 14,
9
grfico:
x 13 14
tc = = = 1.5
2
n 9
Ento,
P H0 ( x 13) = P(t 1.5) = 0.1720
Como esta probabilidade alta, no h razes para acreditar que a verdadeira

performance mdia seja inferior a 14 km/l.
1.3.1. Tipos de Erros
Ao realizar-se um teste de hiptese, pode-se incorrer em dois tipos de erros, que

sero discutidos a seguir. Suponha que a hiptese H0 formulada, no exemplo anterior
seja verdadeira, isto a performance mdia dos carros realmente de 14 km/l, isto (
= 14 km/l), e por efeito de acaso obtenha-se, na amostra, uma estimativa de
performance, cuja probabilidade de ocorrncia seja muito baixa, o que levaria a rejeio
da hiptese H0 : = 14 km/l, que verdadeira. Ento, ter-se- cometido um erro
denominado erro Tipo I (rejeitar uma hiptese H0) verdadeira. A probabilidade de se
cometer este erro denominada nvel de significncia () sendo esta, determinada
(fixada) pelo pesquisador. Por outro lado, a hiptese formulada pode ser falsa, isto na
34
verdade 14 km=/l, e por efeito de acaso obter uma estimativa, que nos leve a no
rejeio da hiptese H0 : = 14 km/l. Nesta situao ter-se- cometido o erro Tipo II
(aceitar H0 falsa). A probabilidade de cometer este erro (), sendo esta uma funo de
, H0 e do tamanho amostral. As probabilidades de se cometer os erros Tipo I e Tipo II,
( e ) so inversamente proporcionais, como pode ser observado na figura abaixo,
sendo que, a nica maneira de se diminuir simultaneamente e aumentando o
tamanho amostral (n).
Erros Tipo I e Tipo II
Os tipos de erros que podem ser cometidos em um teste de hipteses, bem como
suas probabilidades esto resumidos na tabela 1.1.
Tabela 1.1. Tipos de erros passveis de serem cometidos ao se testar uma hiptese.
1.3.2. Procedimento geral de teste
1. Estabelea a hiptese nula, H0 e a hiptese alternativa Ha.
35
2. Decida qual o teste a ser usado, checando se este vlido para o seu problema.
3. Calcule a estatstica de teste, T.
4. Encontre a probabilidade (p-valor) de observar um valor to extremo ou maior do
que T se a hiptese nula de fato verdadeira. Voc precisar se referir aos valores
crticos nas tabelas estatsticas as quais fornecem p-valores correspondendo aos
valores das estatsticas de teste.
5. Avalie a fora da evidncia contra H0.(Quanto menor p-valor, tanto mais evidncia
contra a hiptese nula.) Se necessrio, decida se esta evidncia suficiente para
rejeitar (ou no rejeitar) a hiptese nula.
6. Estabelea as concluses e interpretao dos resultados.
O p-valor a probabilidade de observar dados to extremos quanto os obtidos se a

hiptese nula verdadeira. Note as seguintes interpretaes de p-valores:
Esteja ciente da diferena entre significncia estatstica e significncia prtica. Um

efeito pode ser estatisticamente significante, mas no ter qualquer importncia prtica e
vice-versa. Por exemplo, um estudo muito grande pode estimar a diferena entre a
mdia de peso de plantas como sendo 0.0001 gramas e concluir que a diferena
estatisticamente significativa (p < 0.05). Contudo, na prtica, esta diferena
negligencivel e provavelmente de pouca importncia prtica.
1.3.3. Teste para uma mdia
Os passos principais do test-t para uma amostra aleatria x1 , x2,..., xn de uma
populao com mdia so dados a seguir:
1. Estabelea a hiptese nula, H0: = 0 , e a hiptese alternativa Ha: 0.

2. Calcule a mdia amostral = x e o desvio padro amostral s.
36
s
3. Calcule o erro padro, SE = .
n
( 0 )
4. Calcule a estatstica de teste t = . Este o nmero de erros padro que
SE
dista do valor de hiptese 0.
5. Encontre o p-valor da distribuio t, com r = n-1 graus de liberdade, da tabela
usando os valores absolutos da estatstica de teste.
6. Estabelea concluses e interprete os resultados.
1.3.4. Teste para uma proporo
Agora suponha que tenhamos um valor hipottico p0 para uma proporo. Podemos
realizar um teste de H0: p = p0 praticamente da mesma forma que o test-t acima. A
dualidade com intervalos de confiana segue exatamente da mesma forma. Suponha que
tenhamos uma amostra aleatria de tamanho n de uma populao de interesse onde a
verdadeira proporo de membros numa categoria em particular p. A hiptese nula
H0: p = p0. Se o nmero observado na categoria de interesse , ento um teste da
hiptese como segue:
1. Estabelea a hiptese nula, H0: p = p0, e a hiptese alternativa Ha: H0: p p0..
x
2. Calcule a proporo amostral p = .
n
)
p(1 p )
3. Calcule o erro padro, SE =
n
( p p 0 )
4. Calcule t = , o nmero de erros padro que p dista do valor de
SE
hiptese p0.
5. Encontre o p-valor usando o valor absoluto da estatstica de teste da tabela da
distribuio normal (ou equivalentemente da t com r = graus de liberdade).
Uma regra geral que este teste vlido quando tem-se ambos np e
n (1 p) maiores do que digamos 10.
37
Quantas vezes ouvimos dizer 85 em cada 100 brasileiros preocupam-se com .
Se um pesquisador srio quiser saber o tamanho da amostra para fazer esta afirmao
com um erro mximo igual a , como dever proceder?
x
P ( ) = P ( p p ) = P p
n
Portanto:
n x np n
P ( ) = P <
np (1 p ) np (1 p ) np (1 p )
Uma vez que x b ( n, p ) e para n grande, tem-se que a varivel aleatria:
x np
z= tem distribuio N(0,1).
np(1 p)
E pode ser re-escrita como:
n
z=
p(1 p)
Portanto, para um dado erro , e uma projeo para p, possvel fazer uma
estimativa do tamanho necessrio para a amostra. Quando no se tem nenhuma
expectativa com relao a p (por ex. p>90%), utiliza-se o valor mximo para o
denominador que para p=0,5.
No nosso exemplo, teramos para um erro de 5%:
z=1,96
e fazendo p=0,5 resulta em n=384 amostras.
38
1.3.5. Decises e poder
Ao tomar uma deciso a favor ou contra uma hiptese existem dois tipos de erros
que voc pode cometer. Voc pode rejeitar a hiptese nula quando de fato ela
verdadeira (erro tipo I) ou voc pode falhar em rejeitar H0 quando de fato ela falsa
(erro tipo II). Existe um balano entre esses dois tipos de erros, no sentido de que ao
tentar-se minimizar a possibilidade de um tipo, aumenta-se a probabilidade do outro.
Frequentemente, denotamos as probabilidades destes dois erros como e ,
respectivamente.
O poder de um teste a probabilidade de rejeitar a hiptese nula quando esta de

fato falsa. Isto igual a 1- . Em geral, quanto maior o tamanho da amostra, maior o
poder do teste. desejvel decidir sobre um tamanho de amostra conveniente antes de
conduzir um estudo de forma que os resultados do teste de hiptese tero poder
suficiente para responder a questo cientfica de interesse.
1.4. Comparao entre dois tratamentos

1.4.1. Diferena entre mdias de dois grupos
Lembrando que o intervalo de confiana para a mdia populacional , de uma
amostra aleatria de tamanho n era da forma x t SE . Agora consideremos a
comparao das mdias das populaes atravs da estimao das diferenas de mdias e
calculando um intervalo de confiana para esta diferena das mdias.
Quando temos amostras independentes de cada uma de duas populaes, podemos
sumariz-las pelas suas mdias, desvios padro e tamanhos amostrais. Denote estas
medidas por x1 , s1, n1 para a amostra um e x2 , s1, n1 para a amostra dois. Denote as
correspondentes mdias populacionais e desvios padro 1, 2, 1 e 2 respectivamente.
39
Erro padro - assumindo desvios padres iguais
Primeiramente, assumimos que os desvios padro populacionais so os mesmos em

cada grupo, i.e. 1 = 2 = . Podemos combinar os dois desvios padres amostrais para
formar uma estimativa combinada do desvio padro. Atribumos mais peso s amostras
maiores. Este desvio padro combinado sp a raiz quadrada da varincia combinada s 2p
dada por
Agora podemos calcular o erro padro das diferenas nas mdias como
I.C. para a diferena entre mdias assumindo desvios padro iguais
Um intervalo de confiana para 1 - 2, dado por
onde t escolhido apropriadamente. Quando os tamanhos amostrais so grandes, um

intervalo de confiana aproximado de 95% obtido usando t = 1.96.
Se os tamanhos amostrais no forem to grandes ento un intervalo exato de 95% de
confiana deveria de ser calculado selecionando o valor de t da tabela da distribuio t,
com n1 + n2 - 2 graus de liberdade e coluna p = 0.05. Para um intervalo de 99% de
confiana deveramos selecionar o valor na coluna p = 0.01.
Teste para a diferena das mdias
Um teste para a diferena entre mdias corresponde a um teste de H0: 1 - 2 = 0.

Nosso teste estatstico :
40
que a estimativa de 1 - 2 menos o valor hipottico (zero neste caso) e tudo dividido
pelo erro padro. Sob a hiptese nula, este segue uma distribuio t com n1 + n2 - 2
g.d.l. O valor obtido para t (ignorando seu sinal) comparado com os valores tabelados
com os graus de liberdade apropriados, para obter um p-valor.
I.C. para diferena de mdias - desvios padro diferentes
Uma regra prtica que os desvios padro populacionais 1 e 2 podem em geral

ser assumidas iguais se a razo do maior desvio padro amostral para o menor for
menor do que 2 ou 3. Alm disso, a suposio de varincias iguais pode ser
grosseiramente avaliada atravs de historgramas dos dados. Testes formais esto
disponveis se necessrio.
Se os desvios padro populacionais no puderem ser assumidos iguais, usamos uma
outra frmula para o erro padro de x 1 x 2 , dado por:
Note que esta abordagem usada somente para grandes amostras.

A estatstica de teste usando este SE no segue uma distribuio t sob a hiptese
nula. Contudo, para tamanhos amostrais razoavelmente grandes (digamos ambos
maiores do que 30), podemos comparar a estatstica de teste acima com uma
distribuio Normal padro (ltima linha da tabela t).
1.4.2. Comparando propores
Nesse tipo de experimento a idia principal comparar diretamente os dois lagos.

Portanto gostaramos de calcular um intervalo de confiana de 95% para a diferena em
propores. Note, contudo que isto somente apropriado para grandes amostras, e desse
modo quando a amostra pequena devemos ser cautelosos para no super-valorizar os
resultados.
Intervalo de confiana para a diferena em propores
Seja p1 a verdadeira proporo populacional de um grupo 1, se seja p2 a proporo
no grupo 2. Estamos interessados na diferena em propores, p2 p1.
O erro padro desta diferena
41
onde p1 e p 2 so as estimativa de p1 e p2.
Com isso podemos construir um intervalo de confiana da forma usual, ou seja,
Teste para a diferena de duas propores

Podemos testar a hiptese nula H0: p2 p1 = 0 versus a alternativa Ha: p2 p1 0,
usando a estatstica:
e comparando este valor com a tabela t com infinitos graus de liberdade.
42
2. Comparaes entre Mais de dois Tratamentos
Apesar de ser muito eficiente para comparao entre duas amostras, o teste t no
deve ser aplicado para comparaes mltiplas devido a problemas com o erro do Tipo I.
Sabendo que em um teste de hiptese a probabilidade p de ocorrer um erro do tipo I
igual ao nvel de significncia , ao realizarmos n testes de hipteses a distribuio
resultante ser uma binomial. Portanto, a probabilidade de ocorrer k erros do tipo I pode
ser calculada pela Eq. 2.1.
prob ( k ) = C nk p k (1 p )
n k
(2.1)
Suponha que estejamos interessados em avaliar se 5 amostras pertencem mesma

populao. Se utilizarmos o teste t para comparar as amostras duas a duas, teremos uma
combinao C2,5 que resultar em 10 testes de comparao de mdias. Para um nvel de
significncia de 5%, a probabilidade de que ocorra pelo menos um erro do Tipo I ser o
complemento da probabilidade de que no ocorra nenhum erro, ou seja: 40,13%.
2.1. Introduo
A anlise de varincia ANOVA a tcnica universalmente utilizada em
comparaes envolvendo vrias amostras de dados.
2.1.1. Objetivo
Ao se utilizar uma ANOVA, o objetivo a comparao de a grupos (tratamentos,
populaes) representados por ni indivduos (observaes) em cada grupo.
2.1.2. Pressupostos:
As amostras so aleatrias e independentes.
Os grupos tm distribuio normal.
Os grupos so homocedsticos (varincias constantes).
2.1.3. Hipteses
H 0 : i = i = 1,L , I
H1 : i para pelo menos um i
43
2.1.4 Notao
ni
x i 1
x i = =
ni ni
xij , a mdia das ni observaes do grupo i;
j=1
X 1 a ni
x = = x ij , a mdia total.
N N i =1 j=1
onde N o nmero total de observaes
2.1.5 Modelo
Dado a j-sima varivel aleatria xij do i-zimo grupo, a diferena com relao
mdia amostral global pode ser escrita como:
x ij x = ( x i x ) + ( x ij x i )
a n a n a n a n
( x ij x ) = ( x i x ) + ( x ij x i ) + 2 ( x i x ) ( x ij x i ) (2.2)
2 2 2
i =1 j=1 i =1 j=1 i =1 j=1 i =1 j=1
Uma vez que:
(x
j=1
ij x i ) = 0
A Eq. 2.2 fica reduzida Eq. 2.3.
a n a a n
( x x ) = n ( x i x ) + ( x ij x i )
2 2 2
ij (2.3)
i =1 j=1 i =1 i =1 j=1
ou
SQDt = SQDg + SQDe
Desvio Total = Desvio entre grupos + Desvio intragrupos
glt = glg + gle
N-1 = a-1 + N-a.
44
onde N o nmero total de observaes e gl (ou ) significa graus de liberdade.
Portanto, podemos definir:
Valor Mdio Quadrtico Total = QMt = SQDt/glt

Valor Mdio Quadrtico entre Grupos = QMg = SQDg/glg
Valor Mdio Quadrtico do Erro = QMe = SQDr/gle
2.1.6. Estatstica do Teste

Se os pressupostos forem vlidos e se a hiptese nula for verdadeira:
(2.4)
Portanto, para um ndice de significncia o critrio de rejeio da hiptese nula

(H0) ser:
F > F ,glg ,gle (2.5)
2.1.7. Anlise
Se os pressupostos forem vlidos, MQe um estimador da varincia das populaes.
Por outro lado, se a hiptese nula for verdadeira a esperana matemtica de MQg ser
nula. Se a hiptese nula for falsa, MQg tende a resultar em valores maiores do que MQe
para compensar a disperso de MQt, como pode ser visto na Figura 2.2 (lembre-se que
SQg=SQt-SQe), a qual mostra as curvas funo densidade de probabilidade de trs
populaes com distribuio normal e a populao resultante da combinao das trs.
45
Figura 2.1. Exemplo de Hiptese H0 aceita.
Figura 2.2. Exemplo de Hiptese H0 recusada.
2.1.8. Tabela de ANOVA:

Os resultados de uma anlise de varincia so apresentados na forma da Tabela 2.1,
onde F o valor observado da estatstica de teste Fischer.
46
Tabela 2.1. Tabela com os resultados da ANOVA
Fonte de Soma dos Graus de Mdias
F F(,g,e)
Variao Quadrados liberdade quadrticas
Entre
SQDg a-1 QMg QMg/ QMe
Grupos
Dentro dos
SQDe N-a QMe
grupos
Total SQDt N-1
2.2. Teste de Normalidade
Apesar da anlise de varincia ser bem robusta com relao aos pressupostas, um
teste de normalidade e um de homocedasticidade devem ser realizados para fins de
controle.
Nos testes de normalidade, o passo inicial consiste na formulao das hipteses:
Passo1: Formulao das hipteses

H0: A caracterstica em estudo da populao ou os erros (desvios) segue a distribuio
normal.
H1: A caracterstica em estudo da populao ou os erros (desvios) no segue a
distribuio normal.
Passo 2: Escolha do ndice de significncia

A seguir, para cada tipo de teste, tem-se a estatstica apropriada.
2.2.1 - Teste de Kolmogorov-Smirnov

O teste de Kolmogorov-Smirnov pode ser aplicado para testar se a caracterstica
estudada da amostra oriunda de uma populao com distribuio normal. O teste de
execuo simples, quando comparado ao qui-quadrado, baseado na maior diferena
absoluta entre a freqncia acumulada observada e a estimada pela distribuio normal
(Sokal & Rohlf, 1997).
Passo 3: Estatstica apropriada
47
A estatstica apropriada do teste baseada na maior diferena absoluta entre a
funo de distribuio normal acumulada, F(zi) , e a freqncia relativa observada
acumulada e ajustada, F0,5 . As expresses utilizadas so:
1
D mx = g mx +
2n
onde:
gmx : maior valor calculado de g;
n : tamanho da amostra ou nmero de parcelas.
g = F ( zi ) F0,5
F0,5 =
( i 0,5)
n
F(zi): funo de distribuio normal acumulada;
i: nmero da amostra;
Passo 4: Concluso
Quando o valor Dmx for maior que o valor crtico dado pela Tabela 2.3, para um
tamanho de amostra n, = 0,5 e significncia ), a hiptese Ho rejeitada e conclui-se
que a caracterstica em estudo da populao no segue a distribuio normal. Por outro
lado, se Dmx for menor que o valor crtico tabelado ( Dmx < Dt ), a hiptese Ho
aceita e conclui-se que a caracterstica em estudo da populao segue a distribuio
normal.
Tabela 2.2. Valores Crticos da Distribuio Dn da Estatstica (Kolmogorov-Smirnov)
48
Para n>40 os valores crticos de Dn podem ser aproximados pelas seguintes
expresses:
Exemplo: Para exemplificar, sero utilizados os dados de massa da matria fresca de

uma amostra com 10 repeties de 100 sementes de Dolichos biflorus L. Os passos para
a execuo do teste so:
Passo 1: Formulao das hipteses

H0: A massa da matria fresca de sementes de Dolichos biflorus L. na populao segue
a distribuio normal.
H1: A massa da matria fresca de sementes de Dolichos biflorus L. na populao no
segue a distribuio normal.
Passo 2: Significncia estabelecida = 0,05

Passo 3: Estatstica apropriada
Na Figura 2.3 mostrada, em forma de tabela, os passos necessrios para calcular
Dmx.
Fig. 2.3. Tabela com os passos necessrios para calcular Dmx para o exemplo.
49
Passo 4: Concluso
Como a amostra menor que 100, o valor de Dmx = 0,1704 deve ser comparado
com o valor Dt = 0,21072 obtido na Tabela 2.2 para n = 10 , = 0,5 e significncia 0,05.
Como o valor calculado de Dmx menor que o valor crtico tabelado Dt, a hiptese Ho
aceita e conclui-se que a massa de matria fresca de sementes de Dolichos biflorus L.
na populao segue a distribuio normal.
2.2.2 Teste de Shapiro-Wilk

Passo 3: Estatstica apropriada:
1 Ordenar em ordem crescente as n observaes da amostra
2 Calcular:
3 Calcular:
Se N mpar, despreza-se a observao mediana

Os valores de N-i+1, so obtidos da Tabela 2.3.
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
50
4 Calcular a estatstica de teste:
Passo 4: Concluso
Quando o valor W for maior que o valor crtico dado pela Tabela 2.4, para um
tamanho de amostra n e significncia ), a hiptese Ho rejeitada e conclui-se que a
caracterstica em estudo da populao no segue a distribuio normal. Por outro lado,
se W for menor que o valor crtico tabelado, a hiptese Ho aceita e conclui-se que a
caracterstica em estudo da populao segue a distribuio normal.
Tabela 2.4. Valores Crticos da Distribuio W da Estatstica Shapiro-Wick
51
Exemplo: Considere a seguinte amostra: 8 12 10 24 12 10 16 19 9 10. Teste se a
amostra provm de uma populao Normal, isto :
H0:A amostra provm de uma populao Normal
H1:A amostra no provm de uma populao Normal
1 - Ordenar a amostra:
8 9 10 10 10 12 12 16 19 24
2 Calcular n*S2: 236
3 Calcular b:
4 Calcular W: 0.840
5 Deciso:
Wcalc=0,840 < W(0,05,10) = 0.842
Deve-se rejeitar-se a hiptese de normalidade da amostra para um ndice de
significncia de 5%.
2.2.3 - Teste DAgostino-Pearson

O teste DAgostino-Pearson um teste de normalidade abrangente que detecta
desvio de normalidade em funo da assimetria (skewness) ou curtose (kurtosis).
1 Calcular Zg1 e Zg2 :
52
n ( Xi X )
3
( n 2 ) g1
g1 = k 3 / (S ) 2 3
; k3 =
( n 1)( n 2 )
; b1 =
n ( n 1)
A = b1
( n + 1)( n + 3)
; B=
( )
3 n 2 + 27n 70 ( n + 1)( n + 3)
;
6 ( n 2) ( n 2 )( n + 5)( n + 7 )( n + 9 )
1 A
C = 2 ( B 1) 1 ; D= C; E= ; F=
ln D 2
C 1
(
Zg1 = E ln F + F2 + 1 ; ) Simetria
2
( Xi X ) n ( n + 1)( n 1) 3 ( Xi X )
4 2
g 2 = k 4 S4 ; k4 =
( n 2 )( n 3)
24n ( n 2 )( n 3) ( n 2 )( n 1) g 2
G= ; H=
( n + 1) ( n + 3)( n + 5 )
2
( n + 1)( n 1) G
J=
(
6 n 2 5n + 2 ) 6 ( n + 3)( n + 5 )
; K = 6 + 8 / J 2 / J 1 + 4 / J2
( n + 7 )( n + 9 ) n ( n 2 )( n 3)
2
1
L= K
2
1+ H
K4
2 3
1 L
Zg 2 = 9K ; Curtose
2
9K
53
2 - Calcular a estatstica de teste:
2 2
Dp = Zg1 + Zg2
Se H0 for verdadeiro, Dp tem tem um distribuio chi-quadrado com dois graus de
liberdade ( 22 )
Passo 4: Concluso
Quando o valor Dp for maior que o valor crtico 22 , para um tamanho de amostra n
e significncia , a hiptese Ho rejeitada e conclui-se que a caracterstica em estudo

da populao no segue a distribuio normal.
2.3. Teste de Homocedasticidade
Os Testes de homocedasticidade mais conhecidos so:

Teste de Hartley
Teste de Cochran
Teste de Bartlett
Como nos testes de normalidade, tem-se:

H0: As varincias das populaes so iguais.
H1: Existe pelo menos uma varincia diferente

A seguir, para cada tipo de teste, tem-se a estatstica apropriada.
2.3.1. Teste de Hartley:

S2max
Fmax =
S2min
54
onde Smax e Smin so, respectivamente, os valores mximo e mnimo de desvio padro
estimados para as n amostras.
Passo 4: Concluso
Rejeitar H0 se Fmax > F(,a,N-1)
onde o ndice de significncia do teste, a o nmero de amostras sendo testadas e N
o nmero de observaes global.
2.3.2. Teste de Cochran:
S2max
C= a
Si2
i =1
Passo 4: Concluso
Rejeitar H0 se C > C(,a,N-1)
onde o ndice de significncia do teste, a o nmero de amostras sendo testadas e N

o nmero de observaes global, e
1
C(, a, n) =
1 + ( a 1) F ( (1 ) / a, (a 1) *a, n )
Com F igual a inversa da distribuio de Fischer.
2.3.3. Teste de Bartlett
( n i 1) ln i
( n 1)Si2
( n 1)
( )
( n i 1) ln Si2
c2 = i
1 1 1
1+
3 ( k 1) n i 1 ( n i 1)
55
Passo 4: Concluso
Rejeitar H0 se c2 > a21
onde o ndice de significncia do teste, a o nmero de amostras sendo testadas e ni

o nmero de observaes da i-sima amostra.
2.4. Teste de Kruskal-Wallis
Apesar da ANOVA ser bastante robusta em relao aos pressupostos, nos casos em
que os pressupostos falham de maneira significativa, pode utilizar o teste de Kruskal-
Wallis, o qual uma abordagem no paramtrica para comparao de mdias.
2.4.1 Pressupostos
Os dados devem ser variveis aleatrias independentes.
As distribuies no precisam ser normais e a varincia das populaes no
precisam ser iguais.
O nmero mnimo de observaes por amostra cinco.
Os tamanhos das amostras devem, sempre que possvel, serem iguais, apesar de ser
aceito uma pequena diferena.
2.4.2 Limitaes
Se a hiptese nula for aceita, voc no pode dizer que as amostras so as mesmas.
2.4.3. O Teste
H0: Todas a k (a) populaes so idnticas
H1: Pelo menos uma das populaes gera observaes mais elevadas do que pelo
menos uma das populaes.
Passo 3: Estatstica do teste

1- Calcular a graduao:
56
Cada uma das k amostras contm ni observaes, totalizando N observaes. As N
observaes so graduadas por ordem crescente, isto , para cada observao xij
atribuda uma graduao R(xij). Caso existam observaes iguais, a elas sero
atribudos os valores mdios.
2 - Calcular Ri:
k
R i = R x ij ( )
i =1
3 - Calcular a estatstica de teste:
12 k
R i2
H= 3 ( N + 1)
N ( N + 1) i =1 n i
Se tiver muitas observaes repetidas, corrigir H:

H
H' = l
q j ( q 2j 1)
j=1
1
(
N N2 1 )
onde l o nmero de conjuntos com observaes repetidas e qj o nmero de elementos
no j-simo conjunto.
Passo 4: Concluso
Rejeitar H0 se H > w1
Os valores crticos so retirados da tabela com a estatstica de Kruskal-Wallis, ou
podem ser aproximados por uma k21 .
Exemplo: Quatro reatores qumicos diferentes foram testados para determinar o

rendimento de uma dada reao. Os resultados observados foram os seguintes:
Reator 1 Reator 2 Reator 3 Reator 4
117 119 83 52
114 161 52 97
145 123 68 44
153 112 97 83
105 83 104
66
57
Verifique se os reatores tm rendimento mdio idntico.
Soluo:
Para um ndice de significncia de 5%, tem-se que 02.05,31 = 7.81 , ou seja: a
hiptese nula foi recusada.
58
3. Blocos Aleatorizados e Planejamentos Fatoriais com Duas Classificaes
3.1. Testes de Hiptese de Dados Emparelhados

Num estudo pareado, temos duas amostras, mas cada observao da primeira
amostra pareada com uma observao da segunda amostra. Tal delineamento ocorre,
por exemplo, num estudo de medidas feitas antes e depois no mesmo indivduo ou num
estudo de gmeos (onde cada conjunto de gmeos forma um dado pareado). Como
esperado, as duas observaes do mesmo indivduo (ou de um conjunto de gmeos) so
mais provveis de serem similares, e, portanto no so considerados estatisticamente
independentes (Shimakura e Ribeiro, 2003).
Com dados pareados, podemos usar a seguinte notao:
x1i = medio 1 no par i,
x2i = medio 1 no par i,
ento, escrevemos as diferenas nas medidas de cada par como: di = x2i x1i.
Agora temos uma amostra de diferenas di, e podemos usar os mtodos que j
estamos familiares. Podemos calcular um intervalo de confiana para a diferena mdia
e testar se a diferena mdia igual a um particular valor (usualmente zero) ou no.
Referimo-nos a tal teste como um paired t-test ao contrrio do test-t para duas amostras
acima.
Note que neste caso estamos interessados na diferena mdia enquanto que quando
temos duas amostras independentes, estamos interessados na diferena nas mdias.
Ainda que numericamente estas quantidades so as mesmas, conceitualmente elas so
diferentes.
Exemplo: A mudana nos nveis de um contaminante numa certa rea do incio ao
final de seis meses de observao foram (em /l):
-1.5 -0.6 -0.3 0.2 -2.0 -1.2
A mdia e o desvio padro so -0.9 e 0.81 /l, respectivamente. Ento o erro padro
0.81 / 6 = 0.33 / l .
Podemos agora realizar um test-t pareado para testar a hiptese nula de que a perda
na concentrao mdia 0. Para isso calculamos:
59
Note que este valor negativo (porque a mudana mdia observada foi a reduo na
concentrao do poluente -- um valor positivo seria um aumento na concentrao do
poluente). Observamos o valor absoluto da estatstica de teste (2.73) na tabela, usando a
linha com n 1 = 5 graus de liberdade.
A quinta linha da tabela mostra que 0.01 < p < 0.05 (porque o valor 2.73 est entre
os valores tabelados 2.571 e 4.032). Ento, rejeitamos a hiptese nula ao nvel de 5%.
Existe evidncia ao nvel de 5% de que a rea em estudo sofreu uma reduo em mdia
nos nveis do contaminante durante o perodo de seis meses.
Podemos adicionar nossa concluso o intervalo de confiana de 95% para a
reduo mdia nos nveis do contaminante:
Estamos 95% confiantes que a reduo mdia nos nveis do contaminante est entre
0.05 /l e 1.75 /l.
3.2. Blocos Aleatorizados

Em algumas situaes no h interesse em que o planejamento experimental seja
totalmente aleatorizado, devido heterogeneidade do material de anlise. Nesses casos,
h necessidade de utilizar-se da tcnica de blocos que representaro uma poro mais
homognea do material (Button, 2005).
Um exemplo da aplicao dos blocos a anlise de comparao por pares de modo
a minimizar os erros causados pela heterogeneidade do material analisado, caso o
planejamento totalmente aleatorizado fosse empregado. Nessa anlise, sero usados dois
nveis da varivel de influncia estudada, indicados pelo ndice i e n rplicas indicadas
por j. O modelo estatstico que descreve os dados obtidos pode ser representado por:
onde, yij uma observao (ou resultado), obtida para o nvel i na rplica j, i a mdia
para o nvel i, j o efeito sobre o resultado devido j-sima rplica e ij, um erro
experimental que apresenta mdia nula e varincia i2 .
Se fizermos a anlise da diferena entre os pares:
60
O valor esperado para a diferena :
O teste da hiptese nula H0: 1 = 2 pode ser feito pela diferena por pares d, ou
seja,
H0: d = 0
H1: d 0
O teste estatstico feito com:
onde:
a mdia das diferenas da amostra
o desvio padro das

diferenas da amostra
A hiptese nula rejeitada caso verifique-se que |t0| > t/2,n-1.

A tcnica de anlise por pares com o uso de blocos tem como principal benefcio
reduo da estimativa da variabilidade, devido eliminao da influncia de variveis
incontrolveis.
3.3. Efeitos de Tratamentos : Planejamento Aleatorizado por Nveis

Seja um procedimento experimental onde se realizaram ensaios com diferentes
nveis (ou tratamentos) de uma nica varivel de influncia (fator), com n rplicas para
cada nvel, como mostrado na tabela a seguir:
61
onde yij o j-simo elemento obtido no tratamento (nvel) i. Esses elementos podem ser
definidos pelo modelo estatstico linear:
onde a mdia geral, comum a todos os tratamentos, i um parmetro que define o

efeito de cada tratamento e ij um componente devido a erros aleatrios.
O objetivo deste estudo avaliar os efeitos dos tratamentos e estim-los, atravs do
teste de hipteses apropriadas. Para esse teste, assume-se que os erros do modelo
utilizado so normalmente e independentemente distribudos com mdia zero e
varincia 2 igual para todos os tratamentos.
Esse modelo denominado anlise de varincia de um fator nico e para que a
anlise seja objetiva necessrio que o procedimento experimental seja completamente
aleatorizado.
A anlise dos efeitos dos tratamentos pode ser feita de duas maneiras. Na primeira,
os tratamentos foram escolhidos de forma especfica e desta forma, o teste de hipteses
refere-se s mdias dos tratamentos e as concluses extradas sero aplicveis somente
aos nveis considerados na anlise, no podendo ser estendidos a outros nveis no
analisados. Nesse caso, tem-se a anlise de um modelo de efeitos fixos (Button, 2005).
J quando os tratamentos analisados representam uma amostra aleatria de uma
populao de tratamentos, podem-se estender as concluses da anlise feitas para essa
amostra, para todos os outros tratamentos da populao. Nesse caso, testam-se hipteses
e tenta-se estimar a variabilidade de i assim, tem-se a anlise de um modelo de efeitos
aleatrios ou de um modelo de componentes de varincia.
62
3.3.1. Anlise de um modelo de efeitos fixos
Neste caso, os efeitos dos tratamentos i so definidos como desvios a partir da
mdia geral, de modo que:
Da tabela anterior, tem-se que:
onde N = a.n o nmero total de observaes e y representa a mdia geral de todas as

observaes.
A mdia estimada do i-simo tratamento dada por E(yij) = i = + i, i = 1,2,..., a.
Ou seja, consiste da mdia geral m somada ao efeito do tratamento i.
O teste de hipteses feito para verificar se as mdias dos tratamentos so iguais:
caso H0 seja verdadeira, de modo que todos os tratamentos tm mdia igual a .

Para essa verificao, a anlise de varincia a que melhor se aplica. O termo
anlise de varincia deriva da diviso da variabilidade total em seus componentes.
A variabilidade total dos resultados representada pela soma corrigida dos
quadrados SST, que dividida pelo nmero de graus de liberdade N-1 fornece a varincia
da amostra.
Essa soma pode ser escrita como:
63
O ltimo termo da expresso nulo pois:
Assim,
Como se observa na expresso acima, a soma corrigida dos quadrados que

representa a variabilidade dos dados - representada pela somatria dos quadrados das
diferenas entre as mdias dos tratamentos e a mdia geral de todos os elementos,
adicionada somatria - dentro dos tratamentos - dos quadrados das diferenas entre as
observaes e as mdias dos tratamentos.
Assim,
SST = SSTRATAMENTOS + SSE
onde SSTRATAMENTOS denomina-se soma dos quadrados devidos aos tratamentos (entre
tratamentos) e SSE denominada soma dos quadrados devidos ao erro (dentro dos
tratamentos). SST apresenta N-1 graus de liberdade, SSTRATAMENTOS apresenta a-1 e SSE,
N-a graus de liberdade.
SS E
Assim, uma estimativa da varincia dentro de cada um dos tratamentos e
Na
SSTRATAMENTOS
, a estimativa da varincia entre os tratamentos.
a 1
Para a anlise estatstica das hipteses, tem-se que SST uma soma de quadrados de
variveis aleatrias normalmente distribudas, SST/2, SSE/2 e SSTRATAMENTOS/2 so
distribudas como chi-quadrado respectivamente, com N-1, N-a e a-1 graus de
liberdade, se a hiptese nula H0 : i = 0 for verdadeira. Nesse caso, aplicando-se o
teorema de Cochran (N-1 = N-a + a-1) tem-se que SSE/2 e SSTRATAMENTOS/2 so
variveis aleatrias chi-quadrado independentes.
64
Se a hiptese nula verdadeira, ou seja, no h diferena entre as mdias dos
SSTRATAMENTOS (a 1)
tratamentos, a razo F0 = uma distribuio F com a-1 e N-a
SS E ( N a )
graus de liberdade.
No caso da hiptese nula ser verdadeira, tanto o numerador quanto o denominador
da expresso so estimadores confiveis de 2. Assim, se o valor esperado para o
numerador maior que o valor esperado para o denominador, deve-se rejeitar H0 para
valores do teste de hipteses que sejam muito grandes, ou seja, a hiptese nula ser
rejeitada se F0 > F, a-1, N-a
A anlise da varincia pode ser feita construindo tabelas como a seguir:
O mtodo apresentado anteriormente, considera que todas amostras possuam n

rplicas. Num caso especial, onde o nmero de observaes no pode ser mantido
constante em todos os tratamentos, definindo-se como ni, o tamanho da amostra para
a
cada um dos i tratamentos, tem-se nessa situao, N = n i e as expresses das somas
i =1
ficam:
Deve-se preferir o uso de tratamentos com amostras de tamanhos iguais, pois a

hiptese de que as varincias sejam iguais para todos os tratamentos mais facilmente
verificada quando ni = n e tambm porque a capacidade do teste maximizada nessa
situao.
65
3.3.2 Comparao das mdias individuais dos tratamentos
O mtodo apresentado anteriormente permite verificar-se se as mdias de diversos
tratamentos so diferentes ou no, mas no possibilita verificar quais delas divergem.
Para tanto, h necessidade de as somatrias das observaes de cada tratamento (yi) ou
de suas mdias ( y i ). Essas comparaes so feitas atravs dos denominados mtodos de
comparao mltipla. Os testes de comparao mltipla permitem investigar onde se
encontram as diferenas possveis entre k mdias populacionais.
Existem muitos testes deste tipo, no entanto, sero abordados apenas trs:
Teste HSD (honestly significant difference) de Tuckey
Teste de Scheff
Teste do contraste
Estes testes permitem examinar simultaneamente pares de mdias amostrais para
identificar quais os pares onde se registram diferenas significativas.
Teste HSD de Tuckey

Quando as amostras tm tamanhos iguais este teste mais adequado do que o teste
de Scheff.
O teste HSD de Tuckey foi originalmente desenvolvido para amostras de igual
tamanho, no entanto, muitos estatsticos sustentam que este um mtodo robusto a
desvios moderados deste pressuposto.
Neste teste, duas mdias amostrais so comparadas usando:
onde, ST (1 ) o quantil de probabilidade (1-) da distribuio da Studentized Range

(Tabela 3.1) com (k , N k) graus de liberdade ST (k , N -k):
P(W ST (1 ) ) = 1 , W ~ ST (k , N -k).
A hiptese H0: i = j rejeitada, isto , as mdias amostrais xi e xj so consideradas

significativamente diferentes, se
66
Exemplo: Dado as mdias amostrais de venda, relativas a 12 observaes cada, de trs
lojas, existe evidncias estatstica de que as vendas das lojas so diferentes?
x1 x2 = 49 56 = 7
x1 x3 = 49 51 = 2
x2 x3 = 56 51 = 5
Usando um nvel de significncia igual a 0.05, ST (1 ) = 3.77, logo:
Como x1 x 2 = 7 > 4.718 , rejeita-se a hiptese H0: 1= 2.
Tambm, x2 x3 = 5 > 4.718 , logo, rejeita-se a hiptese H0: 2 = 3.
Finalmente, como x1 x3 = 2 < 4.718 , no se rejeita a hiptese H0: 1= 3.
Assim, h evidncia de que a loja 2 tem um volume mdio de vendas diferente das
lojas 1 e 3. Isto , a mdia observada para a loja 2 difere significativamente das mdias
observadas para as lojas 1 e 3, enquanto que, a diferena registrada entre o volume de
vendas da loja 1 e da loja 3 no significativa.
Tabela 3.1. - Distribuio da Amplitude Studentizada ( P(qr,g>qrab) = 0.05)
67
Teste Scheff
Neste teste a hiptese nula H0: i = j rejeitada se:
onde, F(1 ) o quantil de probabilidade (1-) da distribuio FNk 1k :
Exemplo:
x1 x2 = 6.4 9.5714 = 3.1714
x1 x3 = 6.4 6.3333 = 0.0667
x2 x3 = 9.5714 6.3333 = 3.2318
Consideremos um nvel de significncia igual a 0.01.
Assim, ao nvel de significncia de 0.01, h evidncia de que campanha de

marketing 2 est associado um volume mdio de vendas diferente dos volumes mdios
associados s campanhas 1 e 3. Isto , a mdia observada para a campanha 2 difere
significativamente das mdias observadas para as campanhas 1 e 3, enquanto que, a
diferena registrada entre as campanhas 1 e 3 no significativa.
68
Teste de contraste
Um contraste C uma combinao linear dos totais yi, que permite a comparao
das mdias dos tratamentos.
a
C = ci y i
i =1
com a restrio de que:

a
ci = 0 , para tratamentos com n iguais.
i =1
a
ni ci = 0 , para tratamentos com n diferentes.
i =1
A soma dos quadrados para qualquer contraste dada por:
para tratamentos com n iguais
para tratamentos com n diferentes
Um contraste testado comparando-se SSC com SSE/(N-a) que deve ser distribudo
como F,1,N-a caso a hiptese nula seja verdadeira, ou seja, com H0 ser rejeitada se F0 >
F,1,N-a.
O uso de contrastes ortogonais um caso particular deste mtodo, que oferecem
testes independentes para as mdias dos tratamentos. Dois contrastes {ci} e {di} so
ortogonais se
a
ci d i = 0 , para tratamentos com n iguais.
i =1
a
ni ci d i = 0 , para tratamentos com n diferentes.
i =1
69
3.3.3 Anlise de um modelo de efeitos aleatrios
Numa situao em que se deseja verificar um fator que apresenta um grande nmero
de nveis possveis e seleciona-se aleatoriamente alguns destes nveis para anlise, diz-
se que esse fator aleatrio. Como a escolha foi feita aleatoriamente, as concluses
extradas a partir dos resultados obtidos nos nveis analisados, podem ser estendidas
para toda a populao de nveis. Nesse caso, assume-se que essa populao infinita ou
suficientemente grande para ser considerada infinita (Button, 2005).
O modelo estatstico linear pode ser novamente utilizado.
onde i e ij so variveis aleatrias. Se i apresenta varincia 2 e independente de ij,
a varincia de qualquer observao dada por:
V ( y ij ) = 2 + 2
onde as duas parcelas so denominadas componentes de varincia e o modelo, modelo

de componentes de varincia ou modelo de efeitos aleatrios.
O teste de hipteses neste modelo, assume-se que {ij} seja NID( 0, 2 ), que {i}
seja NID( 0, 2 ) e que ambas sejam independentes.
A representao da soma de quadrados SST = SSTRATAMENTOS + SSE permanece

vlida. O teste de hipteses feito para a verificao da varincia dos efeitos dos
tratamentos ( 2 ):
Se 2 = 0 , todos os tratamentos apresentam os mesmos efeitos. Porm, se 2 > 0
esses tratamentos apresentam variabilidade significativa.
Novamente, SSE/ 2 e SSTRATAMENTOS/ 2 so distribudas como chi-quadrado
respectivamente, com N-a e a-1 graus de liberdade, se a hiptese nula H0 for verdadeira
e ambas so variveis aleatrias chi-quadrado independentes. Desta forma, a razo
SSTRATAMENTOS (a 1)
F0 = uma distribuio F com a-1 e N-a graus de liberdade.
SS E ( N a )
70
Definindo MSTRAT como SSTRATAMENTOS/ a - 1 e MSE como SSE/ (N - a) pode-se
provar que:
A hiptese nula ser rejeitada se F0 > F, a -1, N - a.
As varincias 2 e 2 podem ser estimadas:
No caso de amostras desiguais, n substitudo por:
Se as observaes distribuem-se como NID, a razo (N - a) MSE/ 2 distribuda
como 2N a .
O intervalo de confiana 100 (1 - ) para o componente de varincia 2 dado por:
( )
J a razo (a 1) MS TRAT 2 + n 2 distribuda como a2 1 , de modo que o
2
intervalo de confiana para a relao dado por:
2 + 2
onde
71
3.4. Efeitos de Blocos
3.4.1. Planejamento por Nveis Completo Aleatorizado por Blocos
Nesse tipo de planejamento, tem-se por objetivo avaliar a influncia dos tratamentos
para uma dada varivel de influncia, bloqueando-se uma fonte de variabilidade, que se
deseja eliminar (Button, 2005).
Como exemplo, teramos a verificao de penetradores (tratamentos) na medio de
dureza de materiais distintos. Assim, os materiais seriam bloqueados.
O planejamento definido como completo pois cada bloco contm todos os
tratamentos e, aleatorizado dentro dos blocos.
Nesse estudo, tem-se a tratamento e b blocos, com o seguinte modelo estatstico:
a
onde a mdia da populao, i efeito do tratamento i, ( i = 0 ) j o efeito do
i =1
b
bloco j ( i = 0 ) e ij o erro aleatrio, distribudo como NID( 0, 2 ).
i =1
Devido ao planejamento por nveis e blocos, define-se este planejamento como um

modelo de efeitos fixos, tanto para os tratamentos como para os blocos.
O teste de hipteses dado por:
Tambm se define as seguintes somatrias:
As somatrias dos quadrados das diferenas podem ser relacionadas como

SST=SSTRATAMENTOS+ SSblocos + SSE, o que fornece o seguinte quadro de anlise:
72
SS E
Assim, uma estimativa da varincia do conjunto total de dados,
(a 1)(b 1)
SSTRATAMENTOS
, a estimativa da varincia dentro de cada um dos tratamentos e
a 1
SS blo cos
, a estimativa da varincia dentro de cada um dos blocos.
b 1
Para a anlise estatstica das hipteses, tem-se que SST uma soma de quadrados de
variveis aleatrias normalmente distribudas, SST/2, SSTRATAMENTOS/2, SSBLOCOS/2 e
SSE/2 so distribudas como chi-quadrado respectivamente, com N-1, a-1, b-1 e (a-
1).(b-1) graus de liberdade, se a hiptese nula H0 : i = 0 for verdadeira.
Nesse caso, aplicando-se o teorema de Cochran (N-1 = a-1+b-1+( a-1).(b-1)) tem-se
que SSE/2, SSBLOCOS/2 e SSTRATAMENTOS/2 so variveis aleatrias chi-quadrado
independentes.
tratamentos, a razo:
SSTRATAMENTOS (a 1)
F0 = para os tratamentos
SS E (a 1)(b 1)
SS BLOCOS (b 1)
F0 = para os blocos
SS E (a 1)(b 1)
73
so distribuies F com a-1 e (a-1).(b-1) e b-1 e (a-1).(b-1) graus de liberdade,
respectivamente.
da expresso so estimadores confiveis de 2. Assim, se o valor esperado para o
rejeitada se:
F0 > F, a - 1, (a - 1)(b - 1) para o teste dos tratamentos.
F0 > F, b -1, (a - 1)(b - 1) para o teste dos blocos.
Caso a hiptese nula seja rejeitada (os tratamentos tm influncia), pode-se verificar
a influncia de cada tratamento atravs de comparaes mltiplas, com o uso de
contrastes.
Nesse caso, o procedimento idntico ao usado no modelo de efeitos fixos, apenas
empregando-se:
Um contraste ser testado comparando-se SSC com SSE/((a-1).(b-1)) que deve ser
distribudo como F, 1, (a - 1)(b - 1) caso a hiptese nula seja verdadeira, ou seja, com:
SS C
F0 =
SS E (a 1)(b 1)
H0 ser rejeitada se F0 > F, 1, (a - 1)(b - 1).
3.4.2. Planejamento Por Nveis Incompleto Aleatorizados Por Blocos

Quando no trabalho experimental h escassez de recursos, seja de matria-prima ou
de disponibilidade no uso de equipamentos e instrumentos, pode ocorrer de no ser
possvel o planejamento completo anteriormente apresentado. Nesse caso, pode-se
utilizar o planejamento incompleto aleatorizado por blocos, no qual nem todos os
tratamentos esto presentes em cada bloco (Button, 2005).
No planejamento incompleto balanceado, todos os blocos possuem o mesmo
nmero de tratamentos, sendo esse nmero definido como k, cada tratamento ocorre r
74
vezes no planejamento (ou replicado r vezes), e assim, existem N = a.r = b.k
observaes. J o nmero de vezes que cada par de tratamentos aparece no mesmo
bloco dado por l (que deve ser inteiro):
onde
a - nmero de tratamentos
b - nmero de blocos
k - nmero de tratamentos por bloco
r - nmero de vezes de ocorrncia de cada tratamento
Se a = b, o planejamento denominado simtrico.
O modelo estatstico que representa esse planejamento dado por:
semelhante ao obtido para anlise de modelos fixos.

A variabilidade total do modelo pode ser representada por:
SST = SSTRATAMENTOS(ajustado) + SSblocos + SSE
A somatria dos quadrados das diferenas para anlise dos nveis (SSTRATAMENTOS
(ajustado)) deve ser ajustado, pois o nmero de observaes difere dentro decada bloco.
Assim, tem-se:
com i = 1, 2, ....., a e onde nij = 1 se o tratamento i aparece no bloco j e nij = 0 caso

contrrio.
J SSE obtido por subtrao do total:
SSE = SST - SSTRATAMENTOS(ajustado) - SSblocos
75
SST apresenta N-1 graus de liberdade, SSTRAT (ajust.), a-1, SSBLOCOS, b-1 e SSE tem N-
a-b+1 graus de liberdade.
O teste estatstico apropriado para verificar a influncia dos efeitos dos tratamentos
:
SS TRAT .( ajust ) (a 1)
F0 =
SS E ( N a b + 1)
A hiptese nula ser rejeitada caso F0 > F a -1, N- a- b -1
76
4. Planejamentos com Mltiplos Blocos
4.1. Planejamentos Quadrados Latinos
Este planejamento til quando se tem por objetivo eliminar duas fontes de
variabilidade, bloqueando duas direes.
Como exemplo, assuma-se um estudo em que se deseja determinar a influncia da
formulao sobre a quantidade de energia liberada num processo. Assim, tem-se a
energia como varivel de resposta e a formulao como varivel de influncia. Porm,
as formulaes podem ser preparadas por operadores diversos com diferentes matrias-
primas, o que configura duas fontes de variabilidade que se deseja eliminar.
O quadrado latino consiste de um arranjo quadrado p x p, onde os tratamentos
(nveis) da varivel de influncia so representados por letras latinas maisculas (A, B,
C,....), sendo que cada letra s pode aparecer uma nica vez em cada linha e coluna.
As linhas e colunas do quadrado so ocupadas pelos nveis das fontes de
variabilidade bloqueadas. Denomina-se padro um quadrado latino que tem a primeira
linha e a primeira coluna com os nveis em ordem alfabtico, tem-se que um arranjo
quadrado latino 3 x 3 poder apresentar somente uma combinao, enquanto que um
arranjo 4 x 4 apresentar 4 combinaes, um 5 x 5 ter 56 e um 7 x 7 ter 16.942.080
(Button, 2005).
Alguns exemplos:
4x4 5x5
A B D C A B C D E
B C A D B C D E A
C D B A C D E A B
D A C B D E A B C
E A B C D
No caso do exemplo do arranjo 4 x 4, aps sortear os tratamentos para o nvel 1 da

fonte das linhas, ao iniciar o sorteio dos tratamentos para a segunda linha, o tratamento
A seria separado para a primeira coluna, o tratamento B para a segunda, o D para a
terceira, restando conseqentemente, o tratamento C para a quarta coluna. O
procedimento repete-se para as demais linhas, restringindo cada vez mais o nmero de
tratamentos possveis de sortear-se para cada coluna.
77
Este planejamento tem seus resultados analisados pelo seguinte modelo estatstico:
onde a mdia da populao, ai o efeito do linha i, j o efeito do tratamento j da

varivel de influncia e k o efeito da coluna k e ijk o erro aleatrio, distribudo
como NID( 0, 2 ).
O teste de hipteses dado por:
As somatrias dos quadrados das diferenas so representadas pela expresso e pelo

quadro de anlise apresentados a seguir.
SST = SSTRATAMENTOS + SSLinhas + SScolunas + SSE
78
Novamente, para a anlise estatstica das hipteses, tem-se que SST uma soma de
quadrados de variveis aleatrias normalmente distribudas, SST/ 2 ,
SSTRATAMENTOS/ 2 , SSLINHAS/ 2 , SSCOLUNAS/ 2 e SSE/ 2 so distribudas como chi-
quadrado respectivamente, com N-1 , p-1, p-1, p-1 e (p-2).(p-1) graus de liberdade, se a
hiptese nula H0 : i = 0 for verdadeira.
Nesse caso, aplicando-se o teorema de Cochran (N-1 = p-1+p-1+p-1+(p-2).(p-1)),
onde N=p2, tem-se que SSE/ 2 , SSLINHAS/ 2 , SSCOLUNAS/s2 e SSTRATAMENTOS/ 2 so
variveis aleatrias chi-quadrado independentes.

tratamentos. Portanto, a razo:
SSTRATAMENTOS ( p 1)
F0 =
SS E ( p 1)( p 2)
para os tratamentos
uma distribuio F com p-1 e (p-1).(p-2) graus de liberdade.

da expresso so estimadores confiveis de 2 . Assim, se o valor esperado para o
rejeitada se F0 > F, p - 1, (p - 1)(p- 1).
Os testes com as fontes das linhas e das colunas perdem objetividade estatstica
visto que durante o planejamento eles foram bloqueados, ou seja, tiveram sua
aleatoriedade restrita (Button, 2005).
A grande desvantagem do planejamento quadrado latino com quadrados pequenos
(3 x 3 ou 4 x 4) o pequeno nmero de graus de liberdade associado. Para evitar esse
problema, usa-se replicar os experimentos. Essa rplica pode ser feita de trs modos
distintos:
1. usando combinaes com os mesmos nveis das fontes (linhas e colunas) em cada
rplica;
2. alternando nveis das fontes em cada rplica, fixando o nvel da linha e alterando
o nvel da coluna, ou vice-versa, para cada combinao;
79
3. usando diferentes nveis de linhas e colunas para cada rplica.
Nesses casos, as somatrias dos quadrados das diferenas so dadas por:
SST = SSTRATAMENTOS + SSLINHAS + SSCOLUNAS + SSRPLICAS + SSE
O quadro de anlise para o caso (a) tem o ndice representando as rplicas, assim
cada resultado identificado por yijkl, ou seja, a observao na linha i, no tratamento j,
na coluna k e na rplica l. Com n rplicas para cada conjunto i, j, k tem-se um nmero
total de observaes N = np2.
4.2. Planejamento Quadrado Greco-Latino

Esses planejamentos resultam da sobreposio de dois quadrados latinos p x p. As
letras latinas e gregas referem-se aos tratamentos. Como restrio, cada letra grega
aparece apenas uma vez ao lado de cada letra latina, configurando que os quadrados
sobrepostos denominam-se ortogonais.
Com o uso desse planejamento, torna-se possvel o controle sistemtico de trs
fontes de variabilidade, ou seja, atravs do bloqueio em trs direes podem-se analisar
quatro fatores (linhas, colunas, letras latinas e letras gregas), cada um deles em p nveis,
80
com um total de p2 observaes. Podem-se obter quadrados greco-latinos a partir de
p3, exceto para p = 6.
A seguir, apresenta-se um exemplo de quadrado greco-latino 4 x 4:
O modelo estatstico correspondente a este planejamento dado por:
onde m a mdia da populao, i o efeito do linha i, j o efeito do tratamento j da

varivel de influncia (letra latina), k o efeito do tratamento k da fonte (letra grega),
l o efeito da coluna l e ijkl o erro aleatrio, distribudo como NID(0, 2 ).
As somatrias dos quadrados das diferenas representada pela expresso e pelo

quadro de anlise apresentados a seguir.
SST = SSTRATAMENTOS (Latinas) + SSTRATAMENTOS (gregas) + SSLINHAS + SSCOLUNAS + SSE
81
A anlise estatstica do planejamento com quadrados greco-latinos similar usada
para os quadrados latinos. Assim, a hiptese nula ser rejeitada para os nveis da
varivel de influncia, caso F0 > F, p - 1, (p - 1)(p - 3).
onde
SSTRATAMENTOS ( p 1)
F0 =
SS E ( p 1)( p 3)
para os tratamentos (letras latinas)
82
5. Planejamentos Fatoriais: Modelos Empricos
5.1. Planejamento Fatorial Completo 22*
Um dos problemas mais comuns que um pesquisador pode enfrentar a

determinao de influncia de uma ou mais variveis sobre uma outra varivel de
interesse.
Por exemplo, no estudo do volume do espao de trabalho um rob manipulador
interessante verificar como este volume afetado ao se variar o ngulo entre as juntas
do rob, os dados dimensionais, quando se considera a presena de pontos singulares.
Esse problema um caso particular da situao geral mostrada esquematicamente
na Fig. 5.1 em que um certo nmero de fatores, F1, F2, ... ,Fk, atuando sobre o sistema um
estudo, produz as respostas R1, R2, ...,Rj. U 1 m sistema pode ser uma funo desconhecida
que se deseja determinar ou uma funo conhecida, porm complicada analiticamente.
Figura 5.1. Representao de um sistema genrico.
Os fatores (ou variveis de projeto), isto , as variveis controladas pelo

experimentador tanto podem ser qualitativas (como a presena ou no de pontos
singulares, no exemplo anterior) como quantitativas (como os dados dimensionais do
rob). Dependendo do problema, pode haver mais de uma resposta de interesse.
Eventualmente essas respostas tambm podem ser qualitativas.
Exemplo 1: Na Fig. 5.2, sob a ao da fora F, o sistema de peso W se move at a

posio de equilbrio que corresponde mnima energia potencial. Seja a energia
potencial dada por:
1
Fonte EITON P. SILVA, SEZIMRIA F. P. SARAMAGO, FAMAT - UFU
83
Ep = W l (1 cos ) F l sen (5.1)
onde W = 400N e l =2,5m.
Figura 5.2. Pendulo de peso W sob a ao de uma fora constante F.
Este exemplo ser usado para ilustrar a execuo e a anlise dos resultados de um
planejamento fatorial 22. partir deste exemplo, sero apresentados alguns conceitos
fundamentais que depois podero ser aplicados a planejamentos envolvendo um nmero
qualquer de fatores.
Para executar um planejamento fatorial necessrio em primeiro lugar especificar
os nveis em que cada fator ser estudado, isto , os valores dos fatores (ou as verses,
nos casos qualitativos) que sero empregados. Pode-se, por exemplo, querer estudar o
efeito do fator fora F em quatro nveis, 10N, 20N, 80N e 100N, e o efeito do ngulo
em trs nveis, 0, 45 e 90.
Um planejamento fatorial requer a execuo de experimentos para todas as possveis
combinaes dos nveis dos fatores. Cada um desses experimentos, em que o sistema
submetido (por exemplo: F= 10N e = 45), um ensaio experimental. Havendo 4
nveis num fator e 3 no outro, como nesse caso, sero necessrio 4x3 = 12 ensaios
diferentes, e o planejamento chamado de fatorial 4x3. Em geral, se houver n1 nveis do
fator 1, n2 do fator 2, ..., e nk do fator k, o planejamento ser um fatorial n1x n2 x ...x nk
de experimentos. Este o nmero mnimo para se ter um planejamento fatorial
completo. O pesquisador pode querer repetir ensaios, para ter uma estimativa do erro
experimental, e nesse caso o nmero total de experimentos ser maior.
Havendo k fatores, isto , k variveis controladas pelo experimentador, o
planejamento de dois nveis ir requerer a realizao de 2x2x...x2 = 2k ensaios
diferentes, sendo chamado por isso de planejamento fatorial 2k (Barros, 1995).
Para o Exemplo 1, foram escolhidos os nveis 80N e 100N para a fora F e 5 e
85 para o ngulo . A execuo do planejamento 22 consiste em realizar ensaios e
84
registrar as respostas observadas (a energia potencial Ep, neste caso) em todas as
possveis combinaes desses nveis: (80N, 5), (80N, 85), (100N, 5) e (100N, 85). A
listagem dessas combinaes, que chamada de matriz de planejamento, apresentada
na Tab. 5.1, juntamente com os valores de Ep.
Tabela 5.1. Matriz de Planejamento

ngulo Energia
Fora
Ensaio Potencial
F (N)
(graus) (Nm)
1 80 (-) 5 (-) -13,63
2 100 (+) 5 (-) -17,98
3 80 (-) 85 (+) 713,60
4 100 (+) 85 (+) 663,79
5.1.1. Clculo dos efeitos

O efeito principal da fora F , por definio, a mdia dos efeitos da fora nos
dois nveis do ngulo .
Usando a letra A para representar esse efeito, pode-se escrever:
1 ( 17 ,98 ( 13,63)) + (5.2)

A= = 27 ,08
2 (663,79 713,60 )
A Eq. (5.2) pode ser reescrita como a diferena entre as duas mdias:
1 1
A = (17,98 + 663,79) (13,63 + 713,60) =-27,08 (5.3)
2 2
Como os valores 17,98 e 663,79 pertencem ao nvel (+) e 13,63 e 713,60

pertencem ao nvel (-) da varivel fora, tem-se que o efeito principal A a diferena
entre a resposta mdia no nvel superior e a resposta mdia no nvel inferior desse
fator. Esse raciocnio vale para qualquer efeito principal num planejamento fatorial de
dois nveis e pode ser considerado como uma definio alternativa de efeito principal.
Utilizando esse raciocnio para o efeito principal do ngulo , que ser denotado
por B tem-se:
85
1 1
B = (713,60 + 663,79) (13,63 17,98)
2 2
B=704,5 (5.4)
O significado prtico desse resultado que a Energia Potencial associada ao

ngulo =5 , em mdia, 704,5% inferior a Energia Potencial obtida com o ngulo
=85 (mas, no se pode esquecer que a fora e o ngulo podem se interagir, isto , o
efeito de um fator pode depender do nvel do outro fator).
Se no houvesse interao entre e F, o efeito A seria o mesmo nos dois nveis de
. Ou, equivalentemente, o efeito B seria o mesmo nos dois nveis de F.
O efeito de interao entre a fora F e o ngulo , que ser denotado por AxB ou
simplesmente AB dado por:
1
AB = (663,79 (17,98) ) (713,60 ( 13,63) )
2 14442 444 3 14442444 3

AB= -22,73 (5.5)
onde obtido com F fixo no nvel superior, variando-se ; obtido com F fixo no
nvel inferior, variando-se . Pode-se verificar facilmente que AB = BA.
5.1.2. Interpretao geomtrica dos efeitos

Pode-se dar uma interpretao geomtrica dos efeitos que foram calculados se o
planejamento experimental for representado num sistema cartesiano em que cada eixo
corresponda a um fator. Como so apenas dois fatores, o espao definido por eles um
plano, no qual os quatro ensaios ocupam vrtices de um quadrado. Os efeitos principais
so diferenas mdias entre valores situados em arestas opostas e perpendiculares ao
eixo do fator em questo. Assim, a Fig. 3.5(a) mostra o efeito da fora F e a Fig. 3.5(b)
o efeito do ngulo . O efeito de interao, Fig. 3.5(c), a diferena mdia entre valores
situados nas duas arestas diagonais do quadrado, sendo considerada positiva a diagonal
que liga o ensaio (- -) ao ensaio (+ +).
86
(a)
(b)
(c)
Figura 5.3. Interpretao geomtrica dos efeitos em um planejamento 22.
5.1.3. Interpretao dos Resultados de um planejamento 22.

A melhor forma de interpretar os resultados traar um diagrama contendo as
respostas em todas as combinaes de nveis das variveis, conforme Fig. 5.4.
87
Figura 5.4. Diagrama para interpretao dos resultados de um planejamento 22.
A mudana do ngulo de 85 para 5 diminui a energia potencial, mas essa

diminuio mais pronunciada quando F=80N. E a mudana do valor absoluto da
fora F de 80N para 100N diminui a energia potencial sendo essa diminuio mais
pronunciada quando =85. A energia potencial mnima obtida quando F=100N e =
5 e seu valor 17,98 Nm.
5.1.4. Codificao dos fatores
conveniente trabalhar com os fatores em uma escala onde cada fator varia de 1
para +1. Uma maneira comum de fazer isso :
2 (F F ) 2 ( )
x1 = e x2 = (5.6)
u
(F F ) l
( u l )
onde F e representam a mdia dos nveis de F e ; Fu e Fl representam os limites

superior e inferior da fora F; u e l representam os limites superior e inferior do
ngulo . Por exemplo, para F=95 N e =60, obtm-se x1=0.5, x2=0.375.
p
5.2. Experimentos Fatoriais Fracionados 2kResoluo
Quando existem muitos fatores, um experimento fatorial completo, com todas as

combinaes possveis dos nveis dos fatores, envolve um grande nmero de teste
mesmo quando somente dois nveis de cada fator esto sendo pesquisados. Nesses
casos, faz-se til um plano que exija menos testes do que o experimento fatorial
88
completo.
A idia por traz de um projeto fatorial fracionrio consiste em utilizar o fato de
que um projeto fatorial ortogonal e que a interaes de mais altas no so
significativas, ou seja: utilizam-se as interaes de mais alta ordem para blocar
(confudir) fatores extras. Portanto, a frao um subgrupo, cuidadosamente prescrito,
de todas as combinaes possveis. A anlise dos fatoriais fracionrios relativamente
direta e, em funo de sua estrutura, a utilizao de um fatorial fracionrio no impede a
possibilidade de uma complementao posterior de todo o experimento fatorial.
5.2.1 Confundindo (Sinnimos, Tendncias)

Num experimento fatorial completo, temos 2k tentativas experimentais. Na
anlise de um fatorial completo, temos a mdia geral, K efeitos, principais (2k - k - 1)
efeitos de interaes. Os 2k experimentos podem ser utilizados para fornecer estimativas
independentes de todos os 2k efeitos. Num fatorial fracionrio (digamos a frao 1/2p),
haver apenas 2k-p experimentos e, portanto, somente 2k-p estimativas independentes so
possveis. No delineamento de planos fracionrios (isto , na seleo do subgrupo ideal
do total das 2k combinaes), a meta manter cada uma das 2k-p estimativas o mais livre
de tendncias ou o mais independente possvel, ou seja, manter as estimativas dos
efeitos principais e, se possvel, as interaes de segunda ordem sem tendncias ou
quase.
Em nvel de exemplo, considere o seguinte experimento fracionrio 23-1
A B C Observao Z
- - + 8
+ - - 11
- + - 9
+ + + 14
Neste exemplo, estuda-se o efeito de 3 efeitos utilizando apenas 4 experimentos.

Observe que os nveis de C so obtidos via produto dos nveis de A e B.
Os efeitos principais so dados pela estatstica Z+Z- onde uma vez mais os
subndices menos e mais de cada letra no delineamento identificam as observaes que
entram em cada mdia. Assim:
1. O efeito principal de A estimado como sendo (11 + 14) / 2 - (8 + 9) / 2 = 4,0.
89
2. O efeito principal de B estimado como sendo (9 + 14) / 2 - (8 +11) / 2 = 2.
3. O efeito principal de C estimado como sendo (8 + 14) / 2 - (11 + 9) = 1,0.
Agora ao considerar a estimativa da interao dos fatores AB, o analista
descobrir que os sinais necessrios para estimar a interao AB so idnticos aqueles j
empregados para estimar o efeito principal de C. Portanto, o efeito principal de C e a
interao de dois fatores AB se confundem. Em outras palavras, a estatstica Z+ -Z-=1.0,
possui uma estrutura de sinnimos, isto , a estatstica tanto pode se identificada
como C ou como AB. Na verdade, o valor esperado da estatstica igual a C + AB, a
soma dos dois efeitos, e na ausncia de informaes claras sobre o efeito principal de C,
no somos capazes de dizer se o efeito AB positivo, negativo, grande ou pequeno. Da
mesma maneira:
A estimativa de A confunde-se com BC.
A estimativa de B confunde-se com AC.
Quando alguns, ou todos, efeitos principais se confundem com interaes de dois
fatores, diz-se que o delineamento fatorial fracionrio de Resoluo III. Quando um
ou mais efeitos principais confundem-se com interaes de (no mnimo) trs fatores,
diz-se que o fracionrio um delineamento de Resoluo IV. Fracionrios com
efeitos principais confundidos com interaes de (no mnimo) quatro fatores so de
Resoluo V e etc.
5.2.2. Delineamento de um Experimento Fatorial Fracionrio.

Consideremos N igual ao nmero de realizaes experimentais e K o nmero de
fatores a serem investigados. Quando N =2k, tem-se um delineamento fatorial completo,
quando N = 2k-p, tem-se uma rplica (1/2)p do fatorial 2k; por exemplo, 27-3 uma
rplica de um oitavo de um fatorial 27, contendo 16 observaes.
Para fazer o delineamento de um experimento fatorial fracionrio de K fatores
A,B,C ..., basta utilizar-se as relaes seguintes:
AA=BB=CC=...=I
A(BC)=(AB)C
e como conseqncia:
se D=ABC I=ABCD (relaes geradoras)
As relaes acima vm da representao dos nveis dos efeitos por vetores com
+1 e -1;
Seja, por exemplo, que estamos interessados em construir um delineamento 27-3.
90
Primeiramente devemos construir 3 (p) relaes geradoras:
I=ABCDE E=ABCD
I=ABCF F=ABC
I=ABDG G=ABD
lgico que outras relaes geradoras poderiam ser construdas. Quando se utilizam
todas as combinaes possveis de relaes geradoras diz-se que o planejamento
saturado. A resoluo do planejamento dado pelo tamanho da menor relao geradora,
no caso tem-se um fatorial 27IV3 .
A partir das relaes geradoras constri-se a tabela com o delineamento

experimental:
Contraste Fator A Fator B Fator C Fator D Fator E Fator F Fator G

1 - - - - + - -
2 + - - - - + +
3 - + - - - + +
4 + + - - + - -
5 - - + - - + -
6 + - + - + - +
7 - + + - + - +
8 + + + - - + -
9 - - - + - - +
10 + - - + + + -
11 - + - + + + -
12 + + - + - - +
13 - - + + + + +
14 + - + + - - -
15 - + + + - - -
16 + + + + + + +
Para saber quais interaes confundem uma estimativa, basta isolar a estimativa
do lado esquerdo das relaes geradoras. Por exemplo:
91
A estimativa de A confunde-se com:
BCDE, pois A=BCDE

BCF, pois A=BCF
BD, pois A=BDG
5.3. Delineamento de Taguchi

A metodologia proposta por Genechi Taguchi, no incio da dcada de 80,
apresenta trs objetivos principais:
1. Projetar produtos ou processos que sejam robustos em relao s condies
ambientais;
2. Projetar e desenvolver produtos que sejam robustos variabilidade de seus
componentes;
3. Minimizar a variabilidade em torno de um valor nominal.
A metodologia de planejamento experimental proposta por Taguchi pode ser
apresentada no exemplo descrito a seguir (extrado de Neto et all, 2001).
Consideremos uma mistura para bolo, fabricada, digamos, com quatro
ingredientes: farinha de trigo, acar, ovos e gordura vegetal. Quando o cozinheiro vai
preparar o bolo, tem de adicionar leite, ajustar a temperatura do forno e controlar o
tempo que a massa vai ficar assando. Esses fatores tambm afetam o resultado final,
mas esto fora do alcance do fabricante, por mais explcitas que sejam as instrues na
embalagem.
Aos primeiros fatores, que podem ser controlados durante a fabricao da
mistura, Taguchi chama de parmetros. Os outros so fontes de rudo. Na abordagem de
Taguchi, estes ltimos tambm devem ser includos durante o planejamento e o
desenvolvimento do produto. Para isso ele recomenda o uso de planejamentos fatoriais
ortogonais, semelhantes aos vistos neste captulo.
Dois tipos de planejamento devem ser construdos: um arranjo interno,
envolvendo apenas os parmetros, e um arranjo externo baseado nas fontes de rudo.
Esses dois arranjos so ento cruzados, isto , realizam-se ensaios em todas as suas
possveis combinaes. Na mistura para bolo, por exemplo, se considerarmos apenas
dois nveis para todos os sete fatores mencionados, um delineamento experimental de
Taguchi poderia resultar no esquema mostrado na tabela 5.2.
Para Taguchi, a resposta deve estar to prxima do alvo quanto possvel, mas
92
tambm deve ser robusta (pouco sensvel) influncia do rudo. O mtodo de Taguchi
prope que se analise a resposta mdia para cada combinao no arranjo interno, e que a
variabilidade seja analisada escolhendo uma razo sinal-rudo (SN) apropriado. Trs
razes SN padro so amplamente empregadas:
1) A melhor nominal SNT, usada quando se deseja reduzir a variabilidade em torno

de um valor nominal, que o caso deste exemplo:
__ 2
y
SN T = 10 log ,
s2
2) A quanto maior melhor SNL, usada quando se deseja maximizar os resultados:
1 n 1
SN L = 10 log10 2
n
i =1 yi
3) A quanto menor melhor SNS, usada quando se deseja minimizar os resultados:
1 n
SNS = 10 log10 yi2
n
i =1
Dois ensaios da tabela, o segundo e o oitavo, produzem respostas mdias

exatamente sobre o alvo (80). No entanto, o segundo ensaio deve ser preferido, porque
tem um desvio padro de apenas 1,83, contra 4,97 do oitavo.
Tabela 5.2. Exemplo de Planejamento de Taguchi para o desenvolvimento de uma
93
mistura para bolo.
Tempo/Leite/Temperatura
F G A O --+ -+- +-- +++ y s SNT
- - - - 85 96 97 92 92,5 5,45 24,6
- - - + 82 81 78 79 80 1,83 32,8
- + + - 75 80 70 73 74,5 4,20 25,0
- + + + 66 75 83 70 73,5 7,33 20,0
+ - + - 84 91 95 90 90 4,55 25,9
+ - + + 78 72 80 69 74,8 5,12 23,3
+ + - - 86 85 90 91 88 2,94 29,5
+ + - + 86 82 77 75 80 4,97 24,1
Taguchi sugere que os experimentos utilizem ensaios de dois nveis, definidos

por planejamentos em redes ortogonais designadas por L4, L8, L12, L16 e L32, onde o
numero indica o total de ensaios de cada planejamento. Os arranjos ortogonais so
planejamentos fatoriais fracionados, ou seja, planejamentos fatoriais que tm o nmero
de ensaios reduzidos ao se considerar somente os efeitos das variveis de influncia e de
algumas de suas interaes. Isso pode ser feito quando se conhece previamente que a
interao de algumas variveis no apresentar influncia significativa sobre a varivel
de resposta. Assim, a rede L4 um fatorial fracionrio 23-1, no qual os nveis da terceira
varivel so definidos pela relao geradora I = 123. O planejamento L8 equivalente
ao fatorial 27-4, construdo a partir das relaes geradoras I = -124, I = -135, I = -236 e I
= 1237.
A grande crtica que se faz metodologia de Taguchi o fato dela no
considerar os efeitos das interaes das variveis de influncia, o que pode ser
estatisticamente ncorreto em algumas anlises, pois como foi destacado, os arranjos
ortogonais empregados por Taguchi nada mais so do que planejamento fatoriais
fracionados, que foram originalmente desenvolvidos para situaes em que previamente
descartavam-se os efeitos de algumas interaes de variveis.
Para um melhor entendimento do delineamento de Taguchi, sugere-se a leitura
do livro de Montgomery.
94
6. Anlise de Regresso
6.1. Ajuste de Parmetros
No problema de estimao de parmetros, a expresso matemtica para a funo de
transferncia ( TF ) do modelo em funo dos parmetros do sistema conhecida. Os
valores das entradas f e sadas Y, bem como as condies iniciais ou valores de
contorno so avaliveis, caso necessrio, e alguns ou todos os parmetros do modelo
so desconhecidos. Caso haja rudo nos dados medidos m, uma hiptese comumente
utilizada de que o mesmo aditivo aos dados r, do sistema real, como mostrado na
figura 6.1. A soluo para o problema obter a melhor estimada dos parmetros
desconhecidos, usando alguns valores medidos das excitaes e das respostas do
sistema (Duarte, 1994).
Fig. 6.1. Hiptese sobre o rudo .
O processo de ajuste consiste na construo de uma funo objetivo, r, dependente

do erro, e, existente entre os dados simulados e os medidos m. A estimao de
parmetros do modelo obtida atravs da maximizao ou minimizao da funo
objetivo.
Existem dois modelos de erros utilizados como funo objetivo: o modelo de erro na
entrada, ou na excitao, e o modelo de erro na sada, ou na resposta.
O esquema do modelo de erro na entrada est mostrado na figura 6.2.
Fig. 6.2. Modelo de erro na entrada ou excitao.
95
Como pode ser observado no esquema mostrado na figura 6.2, o modelo
matemtico usado para o ajuste de parmetros, dado por:
= TF 1 (Y, )
(6.1)
m = r +
Os modelos matemticos utilizados em dinmica podem ser construdos de tal forma

que o modelo de erro na entrada conduza a modelos de ajuste linear em relao aos
parmetros , mesmo para o caso de modelos no lineares em relao s grandezas
fsicas do sistema. Nestes casos, a equao 6.1 pode ser reescrita como:
= X(Y ).
(6.2)
= r +
onde X(Y) a matriz de sensibilidade, funo das respostas do sistema.

O esquema do modelo de erro na sada est mostrado na figura 6.3.
Fig. 6.3. Modelo de erro na sada ou resposta.
Para sistemas dinmicos o modelo de erro na sada um modelo no linear em

relao aos parmetros. O modelo matemtico usado para o ajuste de parmetros,
dado por:
96
= TF(f , )
(6.3)
m = r +
No caso de modelos no lineares em relao aos parmetros, torna-se necessria a

utilizao de algoritmos no lineares para a maximizao ou minimizao da funo
objetivo. Mos mtodos que usam derivadas, a funo no linear (03), ou a funo
objetivo, so linearizadas e, procedimentos recursivos so utilizados para estimao dos
valores dos parmetros.
No mtodo de linearizao de Gauss, os dois primeiros termos de uma expanso em
srie de Taylor de TF, na equao 6.3, so retidos. Seja um vetor de dimenso n e
funo dos p parmetros a serem estimados. Supondo que f tenha derivada contnua
nas vizinhanas do vetor b, distante de . A resposta pode ser aproximada pela
Equao 6.4:
= TF(f , ) = TF(f , b + ) TF(f , b ) + X(b ). (6.4)
onde X(b) a matriz de sensibilidade das respostas em relao aos parmetros, com um
elemento genrico da linha i e coluna j, calculado pela Equao 6.5.
(i )
X(i, j) = (6.5)
b( j)
Substituindo-se a Equao 6.4 na Equao 6.3, resulta na Equao 6.6 que tem, a
menos de uma constante, a mesma forma da equao 6.2.
= TF(f , b ) + X(b ).
m = r + (6.6)
De maneira iterativa, os valores de b so atualizados at uma eventual convergncia

do processo. Para evitar que o procedimento divirja, normalmente, algum
amortecimento introduzido na direo de busca (Box-Kanemasu, Levenberg,
Marquardt).
97
Utiliza-se uma expanso em srie de Taylor da funo objetivo, no linear, retendo
os termos de at segunda ordem, resultando em:
1
r (b + b ) = r (b ) + J(b ).b + b'.H(b ).b (6.7)
2
onde significa transposto, J a matriz Jacobiana e H a Hessiana.

Para se determinar, em primeira aproximao, o valor de b que minimiza r(b),
considera-se que as matrizes Jacobiana e Hessiana so independentes de b, diferencia-
se parcialmente o lado esquerdo da Equao 6.7 em relao a b, e igualando-se a zero,
resulta:
J(b ) + H(b )b = (6.8)
A soluo de (6.8), para b, dada por:
b = H 1 (b ). J (b ) (6.9)
6.2. Principais Estimadores e suas Caractersticas

Os principais estimadores de parmetros podem ser desenvolvidos a partir do
teorema de Bayes, que definido pela seguinte expresso:
P( m | ).P()
P( | m ) = (6.10)
P( m )
onde P( ) significa probabilidade e P( | ) indica probabilidade condicional, sendo e m

variveis aleatrias.
Tem-se por objetivo maximizar P(|m). Os estimadores ditos Bayesianos
normalmente utilizam as seguintes informaes e hipteses a priori, com relao s
variveis e m:
9 tem distribuio Normal N(o,V), sendo o a esperana matemtica E[] e V a
matriz de covarincia Cov[].
9 um rudo com distribuio Normal de media zero e covarincia .
98
9 e so estatisticamente independentes.
9 No existe erro na matriz de sensibilidade X.
Com estas hipteses, a varivel aleatria m tem uma distribuio Normal, sendo:
E[ m ] = X.o
Cov[ m ] = X.V.X' + (6.11)
Da Equao (6.2), resulta:
Cov[ m ] = E[( m X.o )(

. m X.o )']
= E[{X( o ) + }.{X( o ) + }'] (6.12)
Tendo-se em vista a Equao 6.12 e a hiptese de que e so estatisticamente

independentes, pode-se derivar a expresso para P(|m):
P( | ). / m P( ).P( ) P( ).P( m X. )
P( | m ) = = = (6.13)
P( m ) P( m ) P( m )
onde o smbolo significa mdulo.
Usando a Equao 6.13 com a hiptese de distribuio normal, a funo de

densidade de probabilidade g, fica:
1 1
g ( | m ) = K. exp .( o ) .( m X )'. 1 .( m X. ) (6.14)
2 2
onde K uma constante e exp a funo exponencial.

Aplicando o logaritmo Neperiano Equao 6.14 tem-se:
1
(
ln (g( | m )) = ln (K ) . ( o )'.V 1 .( o ) + ( m X )'. 1 .( m X )
2
) (6.15)
A estimada tima de obtida pela minimizao da Equao 6.15.
99
6.2.1. Estimador de Mximo a Posteriori (MAP)
O estimador de Mximo a Posteriori (MAP) direto, bem como o seqencial

equivalente, que o filtro de Kalman Estendido, baseiam-se na minimizao da
Equao 6.15, que resulta em:
b MAP = o + MAP .X'. 1 .( m X o )

onde:
1
MAP = X '. 1 . X + V 1
bMAP o vetor com valores estimados de .
Substituindo a Equao 6.16 na Equao 6.4, obtm-se a Equao recursiva do

MAP no linear, para a k-sima mais uma interao, dada por:
K +1
bMAP = bMAP
K
+ MAP
K
( ( ) (
. X ' K . X ' K . 1 . m K + V 1 . o bMAP
K
)) (6.17)
onde:
( ) K
MAP
1
= X ' K . 1 . X K + V 1
Para utilizao do estimador MAP, necessrio conhecer as propriedades

estatsticas do rudo e as dos parmetros . Em um problema de estimao de
parmetros, o valor esperado para os parmetros , bem como a matriz de covarincia
V, so especificadas tendo em vista os conhecimentos prvios do usurio a respeito do
sistema.
As principais caractersticas deste estimador so:
- Hipteses fundamentais:
a) A matriz de sensibilidade X livre de erro.
b) e so variveis aleatrias independentes.
c) O rudo aditivo.
- Hipteses simplificadoras:
a) possui distribuio Normal N(o,V).
b) possui distribuio Normal N(0,).
- Condio de utilizao: o determinante X '. 1 . X + V 1 0.
100
- Polarizao: o estimador polarizado com E(bMAP) = o.
- Eficincia: o estimador eficiente, de mnima varincia, cuja covarincia de
estimativa dada por:
Cov(bMAP ) = (X '. 1
. X + V 1 )
1
(6.18)
O fato do estimador MAP ser polarizado muito til quando se procura ajustar
simultaneamente os valores de parmetros de um sistema composto por modelos
lineares e no lineares. Nestes casos, o ajuste torna-se difcil, s vezes impossvel, pois
as curvas de resposta do modelo do sistema so, normalmente, muito mais sensveis s
variaes dos valores dos parmetros dos modelos lineares do que s dos modelos no
lineares. Uma maneira de contornar este problema dividir o procedimento em duas
etapas: inicialmente controlam-se as foras de excitao de maneira que os nveis de
vibrao sejam baixos e, consequentemente, os efeitos das no linearidades sejam
desprezveis. Em seguida o ajuste refeito com as curvas de respostas para nveis mais
altos de vibrao do sistema.
Na primeira etapa os valores dos parmetros dos modelos lineares so ajustados e as
matrizes de covarincia de suas estimativas so calculadas. Para os parmetros dos
modelos no lineares, completa-se a matriz de covarincia total com valores grandes na
diagonal e nulo fora dela. Na segunda etapa, utiliza-se o estimador MAP com a matriz
de covarincia total gerada, para o ajuste simultneo de todos os parmetros do sistema.
Devido s caractersticas de polarizao do estimador MAP, na segunda etapa os
valores dos parmetros dos modelos das no linearidades sero ajustados sem grande
variao nos valores dos parmetros dos modelos lineares ajustados anteriormente.
6.2.2. Estimador de Mxima Verossimilhana (ML)

Para usar este estimador, no necessrio nenhum conhecimento a priori das
propriedades estatsticas dos parmetros.
O estimador de Mxima Verossimilhana ML baseado na maximizao da funo
de probabilidade condicional P(m | ), com as mesmas hipteses do estimador MAP:
rudo aditivo com distribuio Normal de mdia zero, e X livre de erro.
O estimador ML pode ser derivado diretamente do estimador MAP, bastando, para
isto, montar uma matriz de covarincia dos parmetros com valores na diagonal
101
elevados (da ordem de 1012), significando que no existe qualquer certeza sobre os
valores dos parmetros. Com a matriz de covarincia montada desta maneira, da
Equao 6.16 resulta:
K +1
bML = bML
K
+ ML
K
( (
. X ' K . X ' K . 1 . m K )) (6.20)
onde:
( ) K 1
ML = X ' K . 1 . X K
As principais caractersticas deste estimador so:

- Hipteses fundamentais:
a) A matriz X livre de erro.
b) O rudo aditivo.
- Hiptese simplificadora (estimador de Markov):
a) possui distribuio Normal N(0,).
- Condio de utilizao: o determinante X '. 1 . X 0.
- Polarizao: o estimador despolarizado com E(bML) = .

- Eficincia: o estimador eficiente, de mnima varincia, cuja covarincia da
estimada dada por:
Cov(bML ) = (X '. 1
.X )
1
(6.21)
6.2.3. Estimador de Mnimos Quadrados

Os estimadores de mnimos quadrados se baseiam na minimizao de uma funo
erro, definida por:
r = ( m )' . W .( m ) (6.22)
onde W uma matriz que pondera as incertezas sobre os valores medidos. Se W for
igual a matriz identidade tem-se o estimador de Mnimos Quadrados Comuns MQC. Se
W for uma matriz inversa da covarincia do rudo presente na medio, tem-se o
102
estimador de Markov (MAK), que equivalente ao estimador ML com as hipteses
simplificadoras j apresentadas (Duarte, 1994).
Os valores dos parmetros so, geralmente, avaliados via funo normal, resultando:
b = [X '.W . X ]1 . X '.W . m (6.23)
Estes estimadores podem ser derivados do estimador ML, bastando substituir -1 por
W. Substituindo W na Equao 6.22, tem-se para os estimadores no lineares MAK,
MQC e MQP:
( (
b K +1 = b K + K . X ' K . X ' K .W . m K )) (6.24)
Onde:
( ) K 1
= X ' K .W . X K
Nos casos em que o produto matricial [X.W.X] for mal condicionado, uma tcnica
pseudo-inversa, baseada no clculo de valores singulares da matriz X, pode ser
utilizada.
As principais caractersticas dos estimadores de Mnimos Quadrados so:
- No necessrio nenhum conhecimento a priori das propriedades estatsticas dos
parmetros.
- Para o estimador MQC nenhuma hiptese assumida para os dados.
- Condio para utilizao: |X.W.X| 0.
- Condies de despolarizao: o rudo deve ter mdia zero e ser aditivo s
respostas.
- m e mo podem ser processos estocsticos.
- Condies de mnima varincia: do teorema de Gauss-Markov necessrio que:
a) Cov(m | ) = 2 .W (rudo com varincia constante 2).
b) Para MQC, Cov(ij) = 0 para i j ( erros no correlacionados).
- As covarincias dos valores estimados so:

Cov bMQC = 2 . ( X '.W . X )
1
(6.25)
MQP
103
Cov(bMAK ) = (X '. 1
.X )
1
(6.26)
6.3. A Unicidade e o Criterio de Identificabilidade.

Uma questo que est sempre presente nos problemas de estimao de parmetros
saber se o modelo nico. Dado um sistema real, s possvel definir um modelo
estrutural nico para o mesmo, se o modelo for completo, isto , se os modos e
freqncias naturais so conhecidos para cada um dos graus de liberdade. Isto
praticamente impossvel, uma vez que as estruturas reais so contnuas e os custos dos
experimentos seriam muito altos para a obteno de todas as curvas de resposta do
sistema e identificao de seus modos de freqncia mais elevadas (Duarte, 1994).
Apesar disto, possvel identificar um modelo reduzido que seja consistente com os
conhecimentos existentes a priori sobre o sistema e com os dados medidos. Neste caso,
apenas um pequeno conjunto de parmetros do modelo terico devero ser ajustados a
partir dos dados experimentais, e o problema de identificabilidade, ou seja, se os
parmetros podero ser ajustados com os dados experimentais disponveis.
Existem vrios critrios de identificabilidade, e o utilizado neste trabalho o da
analise dos valores singulares da matriz de sensibilidade X. Os valores singulares esto
relacionados com a independncia linear entre as colunas de uma matriz, ou seja, o seu
posto. Pode ser demonstrado que se as colunas da matriz de sensibilidade, para um dado
grupo de parmetros, so lineares dependentes, ento aquele grupo no pode ser
estimado em bloco, a partir dos dados disponveis, isto , o posto da matriz da
sensibilidade determina o numero de parmetros que podem ser estimados
independentemente.
Analisando as equaes para as covarincias dos estimadores estudados, Equaes
6.18, 6.21 e 6.25, observa-se que estas so dependentes da matriz de sensibilidade dos
parmetros X. Em vista disto, prope-se um critrio de experimento timo, que pode ser
enunciado da seguinte maneira: se existir uma serie de conjuntos de experimentos,
candidatos para o ajuste de parmetros de um determinado modelo, o melhor conjunto
ser aquele que maximizar o determinante de X.W.X. Maximizar o determinante da
matriz X.W.X equivalente a maximizar o menor valor singular desta matriz.
104
6.4. Estimativa dos Erros
O critrio utilizado neste trabalho para avaliar a preciso dos valores estimados
baseado na estimada das matrizes de covarincia dadas pelas Equaes 6.18, 6.21 e
6.25.
Definem-se os erros percentuais tericos (ET), de i-simo parmetro de um dado
estimador (EST), pela Equao 6.27.
Cov EST (i, i )

ET (i ) = 100. (6.27)
bEST (i )
Da equao 6.27, pode-se observar que o erro definido est diretamente

relacionado com o desvio padro do valor estimado.
As matrizes de covarincia dos estimadores MAP, ML e MAK, so estimadas
diretamente pelas expresses dadas nas Equaes 6.18 e 6.21 e a matriz de covarincia
dos estimadores MQC e MQP, Equao 6.25, dependente da varincia do rudo 2.
Com as hipteses: o rudo ser aditivo, no correlacionado, de mdia zero e de
varincia constante; a matriz de sensibilidade ser livre de erro; e os parmetros no
serem aleatrios, apresenta-se uma estimativa para 2, para os estimadores de MQP e
MQC, dada pela expresso:
( m X .b )' . W .( m X .b )
2 = (6.28)
n p
onde n o nmero de dados experimentais e p o nmero de parmetros ajustados.
6.5. Correlao e Regresso

Muitas vezes, na literatura, os resultados de uma anlise de regresso so discutidos
em termos de correlao da varivel dependente com a varivel independente. A rigor,
isso no faz sentido, porque a correlao definida para um par de variveis aleatrias,
e na regresso somente a varivel dependente que considerada aleatria. No entanto,
se esquecermos desse detalhe conceitual, existem algumas relaes algbricas entre
105
correlao e regresso que vale a pena discutir, nem que seja para esclarecer seu
verdadeiro significado e suas limitaes (Barros, 2001).
Imaginemos que tanto X quanto y sejam variveis aleatrias e que, portanto, seja
apropriado definir um coeficiente de correlao entre elas, dado por:
__
__

X i X y i y
s s
x y
r (X, y ) = (6.29)
N 1
A Equao 6.29 pode ser reescrita como:
S xy
r (X, y ) = (6.30)
S xx S yy
Na mesma notao, a estimativa de 1 dada por
S xy
1 = (6.31)
S xx
Combinando as duas expresses, obtemos uma relao entre o coeficiente angular

da reta de regresso 1, e o coeficiente de correlao entre as duas variveis, r(X,y):
S yy
1 = r(X , y) (6.32)
S xx
ou
Sy
1 = r(X , y) , (6.33)
Sx
onde Sy e Sx so os desvios padro das variveis y e X, respectivamente. Mesmo assim,

1 e r(X,y) continuam tendo significados intrinsecamente diferentes. O coeficiente de
correlao, como sabemos, uma medida da associao linear existente entre as
variveis X e y, ambas supostamente aleatrias. O valor do coeficiente angular 1
106
representa a variao em y correspondente variao de uma unidade em X, ou seja, a
derivada dy/dX.
Para um modelo linear, podemos tambm esclarecer uma relao entre a
percentagem de variao explicada (ou coeficiente de determinao),
2
_

SQ R
yi y
,
R2 = =
SQ T _ 2

i
y y
e o coeficiente de correlao r(X,y). Para isso, reescrevemos R2 como:

S yy S xx
R2 = r 2 (X, y )
S xx S yy
ou, simplificando,
R2 = r 2 (X, y ) (6.34)
Esta igualdade mostra que, quando adotamos o modelo yi = o + 1Xi + i, a

percentagem de variao explicada pela regresso tambm uma medida de associao
linear entre X e y. Um erro comum, talvez induzido pela prpria Equao 6.34,
interpretar o valor de R, a raiz quadrada de R2 com o sinal algbrico apropriado, como o
coeficiente de correlao entre X e y, numa regresso qualquer. Acabamos de ver que
isso s valido para o ajuste de uma reta. Alm do mais, na modelagem por mnimos
quadrados, X nem sequer uma varivel aleatria. Na verdade, o valor de R pode ser
interpretado como um coeficiente de correlao, mas no entre as variveis X e y
(Barros, 2001). Pode-se demonstrar que em qualquer circunstancia, para qualquer
regresso linear com qualquer numero de variveis, R o coeficiente de correlao
entre as respostas observadas e os valores previstos pelo modelo ajustado:
R = r (y, y ) (6.35)
Esta relao legtima, pois tanto os valores observados quanto os valores previstos
so variveis aleatrias. O valor de R, que chamado de coeficiente de correlao
mltipla, nunca negativo. Ele o maior valor da correlao que uma combinao
107
linear das variveis independentes, na forma especificada pelo modelo, pode ter com os
valores de y observados.
6.6. Regresso Mltipla

Os objetivos da regresso mltipla so predizer valores de uma varivel dependente
(Y) em funo de variveis independentes (X1, X2, ..., Xk) e conhecer o quanto
variaes de Xj (j = 1,...,k) podem afetar Y.
Modelo de Regresso Mltipla:

O modelo de regresso linear mltipla dado por:
E{Y} = f(X1, X2, ..., Xk)
E{Y} = 0 + 1X1 + 2X2 + ... + kXk
onde Y, X1, ..., Xk podem representar as variveis originais ou transformadas.
Admite-se que X1, ..., Xk so variveis matemticas e Y uma varivel aleatria.
E{Y} = 0 + 1X1 + 2X2 + ... + kXk
O coeficiente k representa a variao esperada de Y para cada unidade de variao

em Xk (k = 1, 2, ..., k), considerando as outras variveis independentes fixas.
O primeiro objetivo estimar os coeficientes: 0, 1, 2, ..., k.
Amostra:
E{yi} = 0 + 1xi1 + 2xi2 + ... + kxik
108
yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei
onde ei o termo aleatrio (erro)
Suposies:
Os erros (ei) so independentes e variam aleatoriamente segundo uma
distribuio (normal) com mdia zero e varincia constante.
Suposio adicional: no deve haver correlaes muito fortes entre as variveis
independentes.
Exemplo com Regresso linear simples:
Y = X +
Exemplo com regresso linear mltipla:
Y = X +
109
6.6.1. Estimador de Mnimos Quadrados (Resumo)
De acordo com seo 6.2.6, o estimador de mnimos quadrados de , isto , o vetor

b que minimiza a funo L() = = (Y - X)(Y - X) dado por:
= (b0, b1, ..., bk)
Equao de regresso ajustada aos dados:
Valores preditos:
Resduos:
Estimativa da varincia do erro:
110
7. Tcnica das Superfcies de Resposta
Em processos industriais, muito comum a existncia de muitos fatores ou variveis
que afetam a qualidade global do produto final. Neste contexto, alguns estatsticos vm
estudando a Metodologia de Superfcie de Resposta (SR), desde 1970. Em essncia, esta
metodologia consiste em estimar coeficientes da regresso polinomial para a gerao de
um modelo emprico. Ento, usando a metodologia possvel aproximar um modelo
emprico a uma relao (inicialmente desconhecida ou conhecida) entre os fatores e as
respostas do processo (Saramago, 2006).
A superfcie de resposta til quando o pesquisador no conhece a relao exata
entre os fatores. Mas, geralmente quando a expresso analtica da funo conhecida, a
metodologia pode ser til em alguns casos: freqentemente pode-se encontrar funes
descontnuas, e em muitos casos se trabalha com valores discretos das variveis de
projeto ou fatores. Assim, til usar a superfcie de resposta para obter uma
aproximao polinomial.
Atualmente, o desenvolvimento da computao e o uso rotineiro dos computadores
tm proporcionado uma facilidade no trabalho de gerao de modelos empricos ou
superfcie de resposta com o uso de softwares modernos. Entretanto, isto demanda do
usurio conhecimentos bsicos de computao e estatstica para interpretar os
resultados.
Dentre as vantagens da Metodologia, a principal que seus resultados so
resistentes a influncia de condies no ideais, como erros aleatrios e pontos
influentes, porque a metodologia robusta. Outra vantagem a simplicidade analtica
da superfcie de resposta obtida, pois a metodologia gera polinmios. Em geral,
polinmios de duas ou mais variveis, so funes contnuas. Assim, a otimizao de
um processo ou sistema torna absolutamente fcil com o uso de mtodos tradicionais de
otimizao (Saramago, 2006).
7.1. Superfcie de Resposta Linear
Para mostrar como se constri uma SR linear, o Mtodo dos Mnimos Quadrados
(MQM) ser aplicado aos dados codificados do Exemplo abaixo.
111
Exemplo 1: Na Figura 8.1, sob a ao da fora F, o sistema de peso W se move at a
posio de equilbrio que corresponde mnima energia potencial. Seja a energia
potencial dada por:
Ep = W l (1 cos ) F l sen (7.1)
onde W = 400N e l =2,5m
Figura 7.1. Pendulo de peso W sob a ao de uma fora constante F (Saramago, 2006).
Na construo da RS linear torna-se necessrio acrescentar o ponto central do

planejamento, isto , o nvel zero nos fatores x1 e x2. Pois, como ser visto adiante, isto
ser til para verificar se h ou no falta de ajuste para um modelo linear.
Tabela 7.1. Resultados de um planejamento 22 com um ponto central.
Fora (N) ngulo (graus) x1 x2 Ep (Nm)
1 80 5 -1 -1 -13,63
2 100 5 1 -1 -17,98
3 80 85 -1 1 713,60
4 100 85 1 1 663,79
5 90 45 0 0 133,79
Seja a Tab. 7.1 formada pelos dados codificados do Exemplo 1 juntamente com o
ponto central.
112
Para usar o MQM, o prximo passo escrever a matriz X formada pelos nveis dos
fatores x1 e x2 juntamente com a sua primeira coluna formada pela unidade. Considere,
tambm, o vetor coluna y formado pelos valores de Ep:
x1 x2
13,63
1 1 1 17,98
1
1 1
e y = 713,60 (7.2)
X = 1 1 1
663,79
1 1 1
133,79
1 0 0
O clculo dos coeficientes do modelo linear utiliza a Equao 7.3, resultando:
[b] = {[ X]T[X]}-1[X]T[Y] (7.3)
b0 295.91
b = b1 = - 13.54 (7.4)
b2 352.25
Portanto, a superfcie de resposta dada por:
y r = 295.91 13,54 x 1 + 352,25 x 2 (7.5)
A Eq. (7.5) representa a SR linear que poder, depois de uma anlise dos resduos,
ser usada para estimar a energia potencial para diferentes valores de F e , dentro da
regio investigada R, onde R=((x1,x2) 2 : 1 x1 1 e 1 x2 1). A Figura 7.2
mostra a superfcie de resposta obtida na regio de investigao. Enquanto a Figura 7.3
mostra o grfico de Ep na regio do plano onde 0,0873 1,4835 (radianos) e 80N
F 100 (N) correspondente a regio R. Comparando-se as duas curvas, nota-se que a
SR linear no representou bem a funo desejada para a energia potencial.
113
Figura 7.2. Superfcie de resposta obtida Figura 7.3. Grfico da energia potencial,
para o Exemplo. obtida atravs da Eq. (7.1).
7.2. Superfcie de Resposta Quadrtica
Novamente os dados codificados do Exemplo 1 da seo 7.1 sero usados para

exemplificar uma construo de um modelo quadrtico. Observe que, se o nmero de
variveis fosse maior o processo de construo do modelo (linear ou quadrtico) seria
anlogo.
Figura 7.4. Planejamento 22 em estrela.
114
Tabela 7.2. Resultados do planejamento em estrela obtido pela ampliao da Tabela 7.1.
Fora (N) ngulo (graus) x1 x2 Ep (Nm)
1 80 5 -1 -1 -13,63
2 100 5 1 -1 -17,98
3 80 85 -1 1 713,60
4 100 85 1 1 663,79
5 90 45 0 0 133,79
6 75,86 45 -21/2 0 158,79
7 90 101,57 0 21/2 980,14
8 104,14 45 21/2 0 108,80
1/2
9 90 -11,56 0 -2 65,37
Quando o grau do polinmio aumentado, evidentemente aumenta-se o nmero de

parmetro a determinar. Por isso, necessrio ampliar o planejamento, ou seja,
aumentar o nmero de combinaes dos valores dos nveis dos fatores. A ampliao
pode ser feita de vrias maneiras. A mais comum a construo do chamado
planejamento em estrela, que ser adotado aqui.
Para fazer um planejamento em estrela simplesmente acrescenta-se ao planejamento
j existente um planejamento idntico, porm girado de 45 graus em relao origem
dos eixos x1 e x2. O resultado uma distribuio octogonal, como mostrado na Figura
7.4.
Atravs de um argumento geomtrico simples, pode-se concluir que os novos
pontos esto a uma distncia de 21/2 do ponto central e, portanto so localizados de
acordo com as coordenadas mostradas nas quatro ltimas linhas da Tab. 7.2.
Como o nmero de parmetro a determinar foi aumentado (pois se trata da
construo de um polinmio quadrtico) necessrio aumentar o nmero de colunas da
matriz X. Esta matriz obtida atravs dos dados da Tab. 7.2 sendo sua primeira coluna
formada pela unidade.
115
x1 x2 x12 x 22 x1 x 2
1 1 1 1 1 1
1
1 1 1 1 1
1 1 1 1 1 1

1 1 1 1 1 1
(7.6)

X= 1 0 0 0 0 0

1 2 0 2 0 0
1 0 2 0 2 0

1 2 0 2 0 0
1
0 2 0 2 0
- 13,63
- 17,98

713,60

663,79 (7.7)
y = 133,79

158,79
980,14

108,80
65,37

Utilizando X e y, dados em (7.6) e (7.7), a Eq. (7.3) fornece a seguinte superfcie

de resposta:
y r = 133,79 15,61 x1 + 337 ,83 x 2 + 2,04 x12 + 196,52 x 22 11,36 x1 x 2 (7.8)
A Figura 7.5 representa a SR quadrtica, dada pela Eq. (7.8). Pode-se observar que,
comparando com a curva da Figura 7.3, este resultado melhor do que a SR linear.
Figura 7.5. Grfico da SR quadrtica representada pela Eq. (7.8).
116
7.3. Outros Planejamentos Fatoriais
7.3.1 Um Planejamento Fatorial 23
Exemplo 2: Acrescente agora, aos dois fatores j examinados (fora e ngulo), um

terceiro fator, o peso que ser denotado por W. O peso W ser estudado nos nveis 400N
(+) e 300N (-). Com isso o planejamento fatorial completo com o ponto central passar
a necessitar da realizao de 23 + 1 = 9 ensaios. A Tab. 7.3 mostra a matriz de
planejamento para o Exemplo 2 e a Tab. 7.4 as energias potenciais obtidas nesses
ensaios.
Tabela 7.3. Matriz de Planejamento para o Exemplo 2.
Ensaio Fatores (-1) (1) (0)
1 Fora (N) 80 100 90
2 ngulo(graus) 5 85 45
3 Peso (N) 300 400 350
Tabela 7.4. Resultados de um planejamento fatorial 23 Exemplo 2.
Ensaios 1 2 3 Ep
1 -1 -1 -1 -14,58
2 1 -1 -1 -18,93
3 -1 1 -1 485,39
4 1 1 -1 435,58
5 -1 -1 1 -13,62
6 1 -1 1 -17,98
7 -1 1 1 713,60
8 1 1 1 663,79
9 0 0 0 97,18
7.3.2. Obteno de Superfcie de Resposta linear para planejamentos fatoriais 23
Anlogo ao planejamento 22, escreve-se a matriz X e o vetor coluna y, a partir dos

dados da Tab. 7.5:
117
x1 x2 x3
1 1 1 1
1
1 1 1
1 1 1 1

1 1 1 1
(7.9)
X = 1 1 1 1

1 1 1 1
1 1 1 1

1 1 1 1
1
0 0 0
- 14,58
- 18,93

485,39

435,58 (7.10)
y = - 13,62

- 17,98
713,60
663,79

97,18
Aplicando o MQM, utilizando a Eq. (7.3), obtm-se:

y r = 258,94 13,54 x1 + 295,43 x 2 + 57,29 x3 (7.11)
7.3.3. Um Planejamento Fatorial 24

Exemplo 3: Alm dos trs fatores j examinados no Exemplo 2 (planejamento 23 )
considere como o quarto fator o comprimento l no nvel inferior e superior igual a 1m e
3m, respectivamente. Assim obtm-se um planejamento fatorial 24. Os resultados
obtidos do planejamento 24 com o ponto central podem ser observados na Tab. 7.5 e
7.7.
Tabela 7.5. Matriz de Planejamento para o Exemplo 3.
Fatores (-1) (1) (0)
1 Fora (N) 80 100 90
2 ngulo (graus) 5 85 45
3 Peso (N) 300 400 350
4 Comprimento (m) 1 3 2
118
Tabela 7.7. Resultados de um planejamento fatorial 24 com o ponto central.
Ensaio 1 2 3 4 Ep (Nm)
1 -1 -1 -1 -1 -5,83
2 1 -1 -1 -1 -7,57
3 -1 1 -1 -1 194,16
4 1 1 -1 -1 174,23
5 -1 -1 1 -1 -5,45
6 1 -1 1 -1 -7,19
7 -1 1 1 -1 285,44
8 1 1 1 -1 265,52
9 -1 -1 -1 1 -17,49
10 1 -1 -1 1 -22,72
11 -1 1 -1 1 582,47
12 1 1 -1 1 522,70
13 -1 -1 1 1 -16,35
14 1 -1 1 1 -21,58
15 -1 1 1 1 856,33
16 1 1 1 1 796,55
17 0 0 0 0 77,75
7.3.4. Obteno de uma Superfcie de Resposta Linear para um planejamento

fatorial 24.
De acordo com a Tab. 7.7, escreve-se a seguinte matriz X e o vetor y:
119
x1 x2 x3 x4
1 1 1 1 1
1 1 1 1 1

1 1 1 1 1

1 1 1 1 1
1 1 1 1 1

1 1 1 1 1
1 1 1 1 1

1 1 1 1 1
X = 1 1
(7.12)
1 1 1

1 1 1 1 1

1 1 1 1 1
1 1 1 1 1

1 1 1 1 1
1 1 1 1 1

1 1 1 1 1
1 1 1 1 1

1 0 0 0 0
- 5,83
- 7,57

194,16

174,23
- 5,45

- 7,19
285,44

265,52
y = - 17,49
(7.13)

- 22,72

582,47
522,70

- 16,35
- 21,58

856,33
796,55

77,75
De forma anloga, usando a Eq. (7.3), encontra-se:
120
y r = 214,75 10,85 x1 + 236,33 x 2 + 45,85 x3 + 111,65 x 4 (7.14)
7.4. Anlise de Resduos

Nas sees anteriores, obtiveram-se superfcies que ajustam aos dados, mas no se
sabe ainda a qualidade desses ajustes. Ou seja, ainda no se tem uma ferramenta capaz
de avaliar se a superfcie ajustada (ou modelo) uma representao adequada para a
funo Ep. Alm disso, caso esta representao seja adequada, deseja-se saber em que
faixa de variao pode-se considerar tal ajuste.
A anlise dos resduos fundamental na avaliao da qualidade do ajuste de
qualquer modelo. Um modelo que deixe resduos considerveis obviamente um
modelo ruim. O modelo ideal no deixaria resduo algum: todas as suas previses
coincidiriam com os resultados observados.
7.4.1 Teste de Significncia do Ajuste

Procedimentos de teste de significncia so teis para aferir a qualidade da
aproximao gerada a partir de um conjunto de dados. Tais testes so baseados na
anlise da varincia e requerem a obteno dos seguintes parmetros estatsticos:
N
yi
i =1
y= (7.15)
N
( )
N 2
SQ yy = y i y (7.16)
i =1
( )
N 2
SQ E = yi y r i (7.17)
i =1
( )
N 2
SQR = y r i y (7.18)
i =1
SQ yy = SQ R + SQ E (7.19)
Lembrando que N o nmero total de observao, yi o valor observado (ou obtido

da funo dada) e yr i a previso do modelo para o valor yi.
121
A Eq. (7.19) mostra que a soma total dos quadrados particionada na soma dos
quadrados devida aos erros e na soma dos quadrados devida ao modelo ou devida
regresso. Quanto maior for a frao descrita pela regresso, melhor ser o ajuste do
modelo.
De posse destes parmetros que so as parcelas nas quais foi decomposta a
variabilidade total do modelo, constri-se a Tab. 7.8, conhecida como Tabela ANOVA
(anlise da varincia). Nesta tabela, p o nmero de parmetros estimados do modelo.
Tabela 7.8. Tabela de anlise da varincia (ANOVA)

Grau de
Fonte de Soma dos Quadrados
Liberdade Estatstica F0
Variao Quadrados Mdios
Estatstico
SQR MS R
Modelo SQR (p-1) MS R = F0 =
p 1 MS E
SQE
Erro SQE (N-p) MS E =
Np
Total SQyy (N-1)
A mtrica F0 usada para testar a hiptese de que todos os coeficientes do ajuste so

nulos (ajuste absurdo). Para tanto, ela comparada com o valor tabelado F, (p-1), (N-p),
correspondente distribuio padro de Fisher. Para isto, torna-se necessrio fixar um
nvel de significncia para um teste com (p-1) graus de liberdade da soma SQR e (N-p)
graus de liberdade da soma SQE. Caso a estatstica obtida seja maior que a tabelada,
rejeita-se a hiptese (pelo menos um dos coeficientes do ajuste no-nulo) e o
procedimento de aproximao est estatisticamente validado.
Quanto maior o valor de F0, melhor o ajuste. Pois, quando MSE suficientemente
pequeno, implica que SQE tambm pequeno, o que significa que yri est prximo de yi.
Pode acontecer, porm, que uma regresso, embora estatisticamente validada do
ponto de vista do teste F, no seja til para realizar previses, por cobrir uma faixa de
variao pequena dos fatores estudados. Para que isso no ocorra, isto , para que uma
regresso seja no apenas estatisticamente significativa, mas tambm til para fins
preditivos, o valor da mtrica F0 deve ser no mnimo de quatro a cinco vezes o valor de
F, (p-1), (N-p).
122
Alm do teste de hipteses bsico, apresentado acima, os parmetros de soma dos
quadrados podem ser empregados em outras verificaes quanto qualidade do ajuste.
Neste caso, SQE decomposto como:
(
SQ E = yij yi ) + ( yi y i )2
2
i, j i, j
SQE = SQEP + SQfaj
Onde:
SQE a soma dos quadrados do ajuste,
SQEP o erro mdio quadrtico das observaes (erro puro),
SQfaj a soma quadrtica da falta de ajuste.
Sob a H0, tem-se que a varivel aleatria:
SQfaj
mp
F= Fm p,m n
SQ EP
mn
Onde:
m o nmero de nveis.
n o nmero de replicaes.
7.4.2 Coeficiente de Mltipla Determinao

O coeficiente de mltipla determinao (R2) dado pela expresso:
SQR SQE
R2 = = 1 (7.20)
SQ yy SQ yy
Obviamente, o maior valor possvel para R2 obviamente um, e s ocorrer se no

houver resduo algum e, portanto toda a variao em torno da mdia for explicada pela
regresso. fcil notar que quanto mais perto de um estiver o valor de R2, melhor ter
sido o ajuste do modelo aos dados observados. Por exemplo, R2=0,98 significa que 98%
da variao total em torno da mdia explicada pela regresso, ficando apenas 2% com
os resduos.
123
7.4.3 Coeficiente de Mltipla Determinao Ajustado.
Uma vez que o valor de R2 cresce medida que novos termos so acrescentados ao
modelo, isto , quando o grau do polinmio ajustado aumentado, o coeficiente de
mltipla determinao ajustado (R2a), que leva em conta o nmero de termos no
modelo, pode ser usado como forma de verificar a influncia dos termos includos ou
retirados na qualidade da aproximao:
N 1
R a2 = 1 1 R 2 (7.21)
N p
Se alguns termos forem includos no modelo de forma desnecessria, o valor de R2a

declina, diferenciando-se cada vez mais de R2.
7.4.4 Coeficiente de Variao.

O coeficiente de variao (CV) til para medir o quanto grande o erro em relao
ao valor mdio das respostas, sendo dado por:
MS E
CV = (7.22)
y
Exemplo 4: Analisar e comparar o ajuste obtido atravs da SR linear dada pela Eq.
(7.5) e da SR quadrtica dada pela Eq. (7.8).
Estas superfcies sero comparadas atravs dos parmetros estatsticos definidos
anteriormente. Caso nenhuma delas apresente um ajuste adequado, o prximo passo
seria adotar um polinmio de maior grau, at ter-se um ajuste adequado.
Usando as Eq. (7.20) a (7.22), obtm-se os seguintes parmetros estatsticos para a

SR linear :
p = 3; N = 5; F0 = 14,89 (7.23)
R2 = 0,94; R2a = 0,87; CV = 0,44.
124
Fixando-se um nvel de 95% de confiana para um teste com p-1 = 2 graus de
liberdade da soma SQR e N-p = 2 graus de liberdade da soma SQE, obtm-se F2, 2 =
19,00 > F0. Portanto, o ajuste no est estatisticamente validado. Ou seja, existe a
hiptese de que todos os coeficientes sejam nulos.
Observe tambm, que os valores de R2 e R2a esto relativamente distantes um do
outro. Ento se poderiam acrescentar novos pontos ao conjunto dos pontos observados,
a fim de obter um melhor ajuste. Entretanto, com foi visto anteriormente, o grfico da
funo Ep no tem um comportamento linear (Fig. 7.3). Portanto, ainda se uma
quantidade grande de dados fosse usada, o ajuste linear no permitiria uma distribuio
normal dos resduos. Assim, no teria sentido a analise da significncia do ajuste. Pois o
emprego do teste F pressupe uma distribuio normal dos resduos.
Para a SR quadrtica, Eq. (7.8), obtm-se os seguintes parmetros estatsticos:
F0 = 361,14; R2 = 0.9983
R2a = 0.9956 (7.24)
CV = 0.07961; p = 6; N = 9
Fixando-se um nvel de 95% de confiana para um teste com p-1 = 5 graus de

liberdade da soma SQR e N-p = 3 graus de liberdade da soma SQE, obtm-se
F5,3=9,01<< F0. Portanto, o ajuste est estatisticamente validado. Ou seja, a hiptese de
que todos os coeficientes sejam nulos est descartada. Alm disso, o valor de R2 mostra
que 99,83% da variao dos pontos dados explicada pelo ajuste quadrtico.
7.4.5. Teste Sobre um Coeficiente Particular
Sendo E{Y} = 0 + 1X1 + 2X2 + ... + kXk, a hiptese H0: j = 0
bj
t=
se c jj
onde cjj o k-simo elemento da diagonal principal da matriz C = (XX)-1.
Sob H0 e considerando as suposies do modelo, t tem distribuio t de student com

g.d.l. = (n-k-1).
125
8. Referncias Bibliogrficas
Barros B. N., Scarminio I. S., Bruns R. E., Como Fazer Experimentos Pesquisa e
Desenvolvimento na Cincia e na Indstria, 2001. Campinas SP.
Bendat J. S., Piersol A. G., Randon Data Analysis and Measurement Procedures,
1986, USA.
Button S. T., Metodologia Para Planejamento Experimental E Anlise De Resultados,
2005. Campinas - SP.
Cunha F. D., Anlise de Confiabilidade de Sistemas: Fundamentos, Normatizao e
Estudo de Caso, 2007. Monografia apresentada Universidade Federal de
Uberlndia, curso de Segurana do Trabalho.
Duarte M. A. V., Ajuste de Modelos Dinmicos de Estruturas com no Linearidades
Concentradas, 1994. Tese de Doutorado apresentada Universidade Estadual de
Campinas. Faculdade de Engenharia Mecnica.
Shimakura, S. E., Ribeiro P. J., Apostila de Estatstica,2003. Departamento de
Estatstica da Universidade Federal do Paran.
Silva H. D., Estatstica, 2005.
Saramago S. F. P., Silva N.,Uma Introduo ao Estudo de Surperfcies de Resposta,
2006. Uberlndia MG.
126

Apostila Estatistica Duarte

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apostila Estatistica Duarte

Uploaded by

Copyright:

Available Formats

UFU Universidade Federal de Uberlndia LVA Laboratrio de Vibraes e Acstica

UFU UNIVERSIDADE FEDERAL DE UBERLNDIA

FEMEC FACULDADE DE ENGENHARIA MECNICA

LVA Laboratrio de Vibraes e Acstica

Curso de Planejamento Experimental

UFU - Universidade Federal de Uberlndia

Telefone: (34) 3239 4147 ramal: 234

5.2.1 Confundindo (Sinnimos, Tendncias) 89

1.1.1. Tcnicas Para Definio da Seqncia de Ensaios

Caso a seqncia estabelecida para os ensaios fosse 1, 2, 3....., 9, 10, 11 e 12,

1.1.2. Etapas do Planejamento Experimental e Anlise de Resultados

1.2. Conceitos Bsicos de Estatstica

1.2.3. Freqncia Relativa

Determinao de Probabilidades em Experimentos com Eventos Igualmente

Mtodos de Enumerao: Permutaes, Arranjos e Combinaes

1.2.5. Variveis Aleatrias

Figura 1. Distribuio Discreta.

Figura 2. Distribuio Contnua.

Para caracterizar uma f.d.p., normalmente consideramos dois parmetros principais:

1.2.6. Medidas de Tendncia Central

2: valor mdio quadrtico

2 = ( x ) 2 p( x) , se x for discreta. (1.6)

A varincia pode ser expressa usando o operador de expectativa E(x), pois:

Onde, y1 e y2 so variveis aleatrias, com mdias iguais a 1 e 2 e varincias

Sendo que no caso de duas variveis independentes, tem-se que Cov(x,y) = 0.

No caso do planejamento experimental, os resultados obtidos referem-se a uma

Nota-se que o segundo momento em relao a mdia a varincia.

Coeficiente de Assimetria (Cs).

Classificao das distribuies quanto assimetria:

Tipos de distribuies quanto assimetria:

Distribuio Simtrica Distribuio Assimtrica Negativa

Distribuio Assimtrica Positiva

Tipos de distribuio quanto curtose:

Distribuio Leptocrtica Distribuio Mesocrtica

1.2.9. Desigualdade de Chebyshev

x x p(x )dx 2 p ( x )dx 1.23)

onde um valor real.

1.2.10. Teorema do Limite Central

onde e so os parmetros mdia e desvio padro, respectivamente.

Propriedades da distribuio normal:

da varivel X assumir um valor entre a e b.

Notao: X ~ N(, 2).

Assim, SS/2 est distribuda como chi-quadrado e tem n - 1 graus de liberdade, ou

Distribuies Qui-Quadrado com 1, 5 e 10 graus de liberdade.

Vale lembrar que se z e 2 so variveis aleatrias independentes respectivamente,

Sejam duas variveis aleatrias independentes u2 e v2 , com u e v graus de

Distribuio F, com 10 graus de liberdade para o numerador e 20 para o denominador.

s 2 = 9 kg 2 um estimador da varincia populacional 2

Propriedades dos Estimadores

Deste modo, verifica-se que s2 um estimador tendencioso de 2. Um estimador no

Intervalo de Confiana para a Mdia

onde n o tamanho da amostra.

Obs.: Se ocorrer amostragem sem reposio em populao finita (ASRPF) o intervalo

Interpretao: Como um parmetro e no uma varivel aleatria, a interpretao

t com n-1 graus de liberdade,

onde n o tamanho da amostra.

Obs. Se ocorrer amostragem sem reposio em populao finita (ASRPF) o intervalo de

t com n-1 graus de liberdade

Interpretao: Existem 95% de confiana em se dizer que a verdadeira tenso mdia

Diferena entre duas mdias (a - b ).

a2 e b2 as varincias das populaes a e b, respectivamente;

Obs.: Se ocorrer ASRPF deve-se multiplicar a varincia da populao, na qual ocorreu

Exemplo: As empresas A e B produzem tubos para esgoto com as varincias em seus

Quando se desconhecem as varincias populacionais ( a2 e b2 ) torna-se necessria