Capitulo 1- Introdução

Praticamente em todas as áreas do conhecimentos o uso da estatística em
especial das técnicas de planejamento de experimentos são imprecendiveis para as
tomadas de decisão visando a avaliação de novos procedimentos ou a otimização de
processos e produtos.
Segundo Montegomery(2001), um experimento planejado é um teste, ou série de
testes, no qual são feitas mudanças propositais nas variáveis de entrada de um processo,
de modo a podermos observar e identificar mudanças correspondentes na resposta de
saída.
Figura 1.1: Modelo geral de um processo
O processo, como mostra a Figura 1, pode ser visualizado como uma
combinação de máquinas, métodos e pessoas, que transforma um material de entrada
em um produto de saída. Este produto de saída pode ter uma ou mais características da
qualidade observáveis ou respostas. Algumas das variáveis do processo p
x x x , , ,
2 1


são controláveis, enquanto outras, q
z z z , , ,
2 1

são não-controláveis(embora possam
ser controláveis para efeito de teste). Algumas vezes, esses fatores não-controláveis são
chamados fatores de ruído. Os objetivos do experimento podem incluir
1. Determinação de quais variáveis são mais influentes na resposta
y
.
2. Determinação do valor a ser atribuído aos
x
’s influentes de modo que
y
esteja
perto da exigência nominal.
3. Determinação do valor a ser atribuído aos
x
’s influentes de modo que a
variabilidade em
y
seja pequena.
4. Determinação do valor a ser atribuído aos
x
’s influentes de modo que os
efeitos das variáveis não-controláveis sejam minimizados.
Assim, métodos de planejamento experimental podem ser usados tanto no
desenvolvimento do processo quanto na solução de problemas do processo, para
melhorar o seu desempenho ou obter um processo que seja robusto ou não-sensível a
fontes externas de variabilidade.
1
Aplicação dos Planejamentos Experimentais na Industria são fundamentais para
desenvolvimento de novos produtos e para o controle de processos. Nesta área é comum
aparecer problemas em que se precisa estudar várias propriedades ao mesmo tempo e
estas, por sua vez, são afetadas por um grande número de fatores experimentais. È papel
de técnicas de planejamento de experimentos, auxiliar na fabricação de produtos com
melhores características, na diminuição do seu tempo de desenvolvimento, aumentar a
produtividade de processos e minimizar a sensibilidade a fatores externos (NETO et al.,
2001).
A análise de dados para os modelos de planejamento de experimentos fica
praticamente inviabilizada sem o uso de softwares específicos. Neste material é
apresentado as possíbilidades de análise de dados para modelos de planejamento pelo
software R.
O software R, que é uma linguagem e ambiente para computação estatística e
gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido
nos grandes centros, contudo pouco conhecido em Goiás. Este software pode ser uma
ótima alternativa para o trabalho com Análise de Experimentos, pois, tem apresentado
igual ou superior eficiência para análise de dados, além de haver material disponível na
internet e listas de discussão que servem como guia de suporte e aprendizagem.
Nesta apostila serão apresentados um resumo dos principais modelos de
planejamento de experimentos, dentre os quais destacamos: Planejamento
completamente aleatorizado com único fator, Planejamento completamente aleatorizado
com blocos, Planejamento Fatoriais e Planejamentos Hierarquicos e para cada modelo
apresentou-se a sequencia de comandos em R para a análise estatística dos modelos, que
geram os resultados finais como o Quadro da ANOVA, as Comparações Multiplas e a
Análise de Resíduos.
2
Capítulo 2- Elementos Básicos da Experimenta-
ção
Segundo Werkema & Aguiar (1996), para se realizar de forma eficiente um
experimento, deve-se ser utilizada uma abordagem científica para o planejamento.
Esta abordagem é identificada por meio do termo planejamento estatístico de
experimentos, que se refere ao procedimento de planejar um experimento de forma que
os dados apropriados sejam coletados em tempo e custo mínimos. A análise destes
dados por meio de técnicas estatísticas resultará em conclusões confiáveis.
Portanto existem dois aspectos fundamentais em qualquer estudo experimental:
o planejamento do experimento e a análise estatística dos dados. Estes dois aspectos
devem ser bem avaliados, já que a técnica de análise depende diretamente do
planejamento utilizado.
Um dos grande problemas dos estudos experimentais é a coleta de dados. Se os
dados forem coletados de forma inadequada, não há técnica estatística de análise de
dados que concerte o problema e todo o experimento fica comprometido.
2.1 Princípios Básicos

Para que seja possível planejar de modo adequado a coleta de dados, princípios
básicos do planejamento de experimentos como a réplica, a aleatorização e a formação
de blocos devem ser entendidos.
2.1.1- Réplicas
As réplicas são repetições do experimento feitas sob as mesmas condições
experimentais. O termo “sob as mesmas condições experimentais” se refere ao fato de
que os demais fatores que possam influenciar a variável resposta de interesse sejam
controlados de modo a não sofrerem variações de uma experimentação para outra.
Em um experimento, a realização de réplicas é importante pelos seguintes
motivos:
• As réplicas permitem a obtenção de uma estimativa da variabilidade devida ao
erro experimental. A partir desta estimativa é possível avaliar se a variabilidade
presente nos dados é devida somente ao erro experimental ou se existe
influência das diferentes condições avaliadas pelo pesquisador. Se estas
condições forem influentes, o responsável pela pesquisa poderá determinar qual
é a condição mais favoravel para conduzir o experimento.
• Por meio da escolha adequada do número de réplicas é possível detectar, com
precisão desejada, quaisquer efeitos produzidos pelas diferentes condições
experimentais que sejam considerados significantes do ponto de vista prático.
2.1.2- Aleatorização
A expressão aleatorização se refere ao fato de que tanto a alocação do material
experimental às diversas condições de experimentação, quanto a ordem segundo a qual
os ensaios individuais do experimento serão realizados, são determinados ao acaso. A
aleatorização torna possível a plicação dos métodos estatísticos para a análise dos
3
dados. A maioria dos modelos subjacentes e estes métodos estatísticos exigem que os
componentes do erro experimental sejam variáveis aleatórias independentes e a
aleatorização geralmente torna válida esta exigência.
A aleatorização permite ainda que os efeitos de fatores não-controlados, que
afetam a variável resposta e que podem estar presentes durante a realização do
experimento, sejam balanceados entre todas as possíveis medidas. Este balanceamento
evita possíveis confundimentos na avaliação dos resultados devido à atuação destes
fatores.

2.1.3- Formação de Blocos
Em muitas situações experimentais é necessário planejar o experimento de
forma que a variabilidade resultante de fatores externos conhecidos, sobre os quais não
existe interesse, possa ser sistematicamente controlada e avaliada.
Se estes fatores externos não forem controlados, mesmo usando a aleatorização,
o erro experimental irá refletir tanto o erro aleatório inerente ao experimento, quanto a
variabilidade existente em função desses fatores.
Nesta situação, deve-se formar blocos para os varios fatores externos de
influência, e realizar repetições completas do experimento em cada bloco, dessa forma
em cada bloco poderão ser observadas as diferenças existentes devido ao fator de
interesse, minimizando assim o efeito dos fatores pertubadores no resultado final do
experimento. Aqui cada bloco corresponde a um corpo de prova. Note que o objetivo
principal do experimento não é medir o efeito destes fatores pertubadores, mas sim
avaliar com maior eficiência os efeitos dos fatores de interesse.
Assim de forma genérica podemos definir que blocos são conjuntos
homogêneos de unidades experimentais.
2.1.4- Terminologia Básica
Na terminologia básica para um planejamento de experimentos, destaca-se:

• Unidade experimental: É a unidade básica para a qual será feita a medida da
resposta.
• Fatores: São as variáveis cuja influência sobre a variável resposta está sendo
estudada no experimento.
• Niveis de um Fator: Os diferentes modos de presença de um fator no estudo
considerado são denominados níveis do fator.
• Tratamento: As combinações específicas dos níveis de diferentes fatores são
denominadas tratamentos. Quando há apenas um fator, os níveis deste fator
correspondem aos tratamentos.
• Ensaio: Cada realização do experimento em uma determinada condição de
interesse(tratamento) é denominada ensaio, isto é, um ensaio corresponde a
aplicação de um tratamento a uma unidade experimental.
• Variável Resposta: O resultado de interesse registrado após a realização de um
ensaio é denominado variável resposta.
4
Vamos considerar um exemplo apresentado em Werkema & Aguiar (1996) para ilustrar
melhor os princípios básicos do planejamento de experimentos:
Exemplo 2.1- Suponha que um engenheiro esteja interessado em estudar o efeito
produzido por três diferentes banhos(meios) de têmpera: têmpera em água, em óleo e
em solução aqüosa de cloreto de sódio (água salgada) na dureza de um determinado tipo
de aço. Aqui o propósito era determinar qual banho de têmpera produziria a dureza
máxima do aço. Com este objetivo ele decidiu submeter um determinado número de
amostras da liga, que denominaremos corpos de prova, a cada meio de têmpera e a
seguir mediu a dureza da liga.
Vamos ilustrar a aplicação dos princípios do planejamento neste problema.
Réplica: Neste caso uma réplica do experimento completo consiste em medir a dureza
de um corpo de prova submetido à têmpera em água, de um segundo corpo de prova
submetido à têmpera em óleo e de um terceiro temperado em solução de cloreto de
sódio.Isto é, realizar uma réplica do experimento completo significa coletar uma
observação da variável resposta em cada condição experimental considerada no estudo.
Portanto, se seis corpos de prova são temperados em cada banho (água, óleo e água
salgada), sendo feita a seguir a medida da dureza de cada um destes corpos de prova,
dizemos que foram realizadas seis réplicas do experimento(sendo realizados dessa
forma 6x3=18 ensaios).
Aleatorização: Neste experimento a aleatorização deve-se fazer presente pela
distribuição ao acaso dos corpos de prova entre os banhos de têmpera. Este
procedimento atenua por exemplo situações onde a espessura dos corpos de prova são
ligeiramente diferentes, assim de todas as amostras com espessura maior foram
submetidas a um mesmo banho de têmpera este provavelmente estará em situação
vantajosa e os resultados do experimento estarão tendenciosos.

Blocos: Supor que os corpos de prova são provenientes de corridas diferentes ( ou
matérias primas diferentes), se planejarmos um experimento onde estes corpos de prova
sejam distribuídos ao acaso entre os diferentes banhos de têmpera, as diferenças entre os
corpos de prova irão acrescentar uma variabilidade adicional às medidas de dureza, o
que poderá mascarar os efeitos devidos ao fator de interesse (banho de têmpera). Para
eliminar do erro experimental a variabilidade devida ao fato de os corpos de prova
terem sido produzidos em corridas diferentes, deve-se realizar o experimento da
seguinte maneira: cada corpo de prova será dividido em três partes iguais, sendo cada
parte submetida a um diferente banho de têmpera. Deste modo, dentro de cada terno
formado pelas três partes de um mesmo corpo de prova, a influência devida às
características particulares de cada corpo de prova deverá ocorrer de forma
aproximadamente igual para cada um dos banhos de têmpera.
Dentro da terminologia básica temos que:
Unidade Experimental: Corpo de prova do aço utilizado no estudo.
Fatores: Banhos de têmpera.
Níveis do Fator: água, água salgada e óleo
5
Ensaio: Cada ensaio consiste em tratar um corpo de prova em um determinado banho
de têmpera.
Variável Resposta: É a dureza do corpo de prova medida após a realização da
têmpera.
2.1.5- Roteiro para a Realização de um Bom Experimento.
Para usar a abordagem estatística no planejamento e na análise de um
experimento é necessário que as pessoas envolvidas na experimentação tenham,
antecipadamente, uma idéia clara do que será estudado e da forma como os dados serão
coletados. Também é recomendado que se tenha uma idéia qualitativa de como os dados
serão analisados. Um roteiro para a realização de um bom experimento é apresentado a
seguir:
1. Reconhecimento e relato do problema. Na prática, geralmente é difícil
perceber que existe um problema que exige experimentos planejados formais,
de maneira que não pode ser fácil obter-se um relato claro de problema que é
aceito por todos. No entanto é de primordial importância desenvolver todas as
idéias do problema e definir de forma clara os objetivos específicos do
experimento.
2. Escolha dos fatores e dos níveis. Devem ser escolhidos os fatores que devem
variar, os intervalos sobre os quais esses fatores variarão e os níveis específicos
nos quais cada rodada será feita. Exige-se conhecimento do processo para fazer
isso, esse conhecimento em geral é uma combinação de experiência prática e
conhecimento teórico. É importante a investigação de todos os fatores que
possam ser importantes e evitar ser excessivamente influenciado pela
experiência passada.
3. Escolha da variável resposta: Na escolha da variável resposta, o
experimentador deve ter certeza de que aquela variável realmente fornece
informação útil sobre o processo em estudo e a capacidade de medida dessa
variável. Se a capacidade do medidor é baixa, então apenas grandes efeitos dos
fatores serão detectados pelo experimento, ou será necessário muitas réplicas.
4. Escolha do planejamento experimental. A escolha do planejamento envolve
consideração sobre o tamanho da amostra(número de replicações), seleção de
uma ordem adequada de rodadas para as tentativas experimentais, ou se a
formação de blocos ou outras restrições de aleatorização estão envolvidas.
5. Realização do experimento. Quanto da realização do experimento, é de vital
importância monitorar o processo, para garantir que tudo esteja sendo feito de
acordo com o planejamento. Erros no procedimento experimental nessa etapa,
em geral comprometem a validade do experimento.
6. Análise dos dados. Métodos estatísticos devem ser usados para analisar os
dados, de modo que os resultados e conclusões sejam objetivos e não de
opinião. Se o experimento foi planejado corretamente o método estatístico para
análise não será um problema. A análise de resíduos e a verificação da validade
do modelo são importantes e devem ser feitas.
7. Conclusões e recomendações. Uma vez analisados os dados, o experimento
deve acarretar conclusões práticas sobre os resultados e recomendar um curso
de ação. Deve-se auxiliar de métodos gráficos, particularmente na apresentação
dos resultados para outras pessoas. Seqüências de acompanhamento e testes de
6
confirmação devem ser também realizados para validar as conclusões do
experimento.
2.2 – Exercícios do Capítulo
1. Planeje um experimento para comparar quatro drogas no alívio de cefaléias,
supondo que você dispõe de um conjunto de pacientes similares.
2. Planeje um experimento para comparar três fórmulas de adubação no
crescimento de Pinus, supondo que você dispõe de um terreno heterogêneo que
deve ser dividido em cinco blocos e que em cada bloco podem ser alocadas nove
parcelas.
3. Planeje um experimento para comparar dois testes de inteligência tomando cada
criança como um bloco.
4. Planeje um experimento para comparar o desempenho(tempo de realização da
tarefa) de três máquinas empacotadeiras, dispondo de 5 operadores.
7
Capítulo 3 - Planejamento Completamente Alea-
torizado com Único Fator.
Para a comparação de dois tratamentos( duas populações) vindos de populações
normais, utiliza-se em o teste t-student, desde que as suposições sejam válidas. Para
comparação de mais de dois tratamentos não é muito recomendado sua utilização, visto
que serão necessárias várias comparações, o que acaretará um aumento no erro tipo I.
Essa situação é ilutrada em Montegomery (2001).
O problema para a comparação de k tratamentos por meio de ensaios
realizados em ordem aleatória é descrito abaixo.
Consideremos que existem k diferentes níveis (tratamentos de um único fator)
que queremos comparar. A resposta para cada um dos k tratamentos é uma variável
aleatória. A ilustração da disposição dos dados é ilustrado na Tabela abaixo:
Tabela 3.1: Esquema da disposição de dados para Experimento Aleatorizado com Fator
Único.
Tratamento Observações Totais Médias
1
11
y
12
y

n
y
1 . 1
y
. 1
y
2
21
y
22
y

n
y
2 . 2
y
. 2
y
  

  
k
1 k
y
2 k
y

kn
y
. k
y
. k
y
..
y
.. y
Aqui ij
y
representa a
j
ª - ésima observação feita sob o i ª-ésimo tratamento.
Neste caso estamos considerando a situação em que há um número igual de
observações,
n
, em cada tratamento.
3.1 – Modelo Estatístico
Cada observação ij
y
na Tabela 3.1, pode ser descrita pelo seguinte modelo
estatístico linear,
ij i ij
y ε τ µ + + ·
, (3.1)
com
k i ,..., 2 , 1 ·
e
n j ,..., 2 , 1 ·
.
Aqui,
:
ij
y
é uma v.a. denotando a (ij)ª obeservação;
: µ
é a média geral, comum a todos os tratamentos;
8
:
i
τ
é o efeito do i-ésimo tratamento;
:
ij
ε
é a componente do erro aleatório.
Supondo que
) ; 0 ( ~
2
σ ε N
ij
, ou seja, os erros são independentes e normalmente
distribuidos com média zero e variância
2
σ . Dessa forma, cada tratamento pode ser
pensado como uma população normal com média
i i
τ µ µ + ·
e variância
2
σ , ou seja,
) ; ( ~
2
σ µ
i ij
N y
.
Assim, vamos apresentar o procedimento para testar a igualdade das k médias
populacionais. Esse modelo de análise de variância é chamado de efeitos fixos. Os
efeitos dos tratamentos i
τ
são definidos, em geral, como desvios da média geral
µ
, de
modo que

·
·
k
i
i
1
0 τ
Representando,
. i
y
, o total das observações sob o i-ésimo tratamento e por
. i
y
a
média das observações sob o i-ésimo tratamento, analogamente, ..
y
o total geral e
..
y
a
média geral,

·
·
n
i
ij i
y y
1
.

n
y
y
i
i
.
.
· ,
. ,..., 2 , 1 k i ·
∑∑
· ·
·
k
i
n
j
ij
y y
1 1
..

N
y
y
..
..
· , kn N · “ Número total de observações”
Estamos interessados em testar a igualdade das médias
k
µ µ µ ,..., ,
2 1
dos k
tratamentos. Pela equação 3.1, este procedimento é equivalente a testar as hipóteses:
. um menos pelo para 0 :
0 ... :
1
2 1
i H
H
i
k o

· · · ·
τ
τ τ τ
(3.2)
Dessa forma se
o
H
é verdadeira, cada observação consiste de uma média geral
µ

mais uma realização da componente do erro aleatório ij
ε
. Assim se
o
H
é verdadeira a
mudança dos níveis do fator (tratamentos) não tem qualquer efeito sobre a resposta
média.
A análise de variância particiona a variabilidade total na amostra de dados em
duas partes então o teste proposto em (3.2) é baseado na comparação de duas
estimativas independentes da variância populacional.
A variabilidade total dos dados é dada a partir da soma de quadrados totais
( )
∑∑
· ·
− ·
k
i
n
j
ij T
y y SQ
1 1
2
..
(3.3)
Mas pode-se particionar
T
SQ
de forma que:
9
( ) ( )
∑∑ ∑ ∑∑
· · · · ·
− + − · −
k
i
n
j
k
i
k
i
n
j
i ij i ij
y y y y n y y
1 1 1 1 1
2
.
2
.. .
2
..
) (

(3.4)
Demonstração: Ver Montogomery 2001.
A relação em (3.4), mostra que a variabilidade total nos dados, medida pela soma de
quadrados total, pode ser particionada em uma soma de quadrados das diferenças entre
as médias dos tratamentos e a média geral, e na soma de quadrados das diferenças entre
as observações dentro de cada tratamento e a média do respectivo tratamento.
Diferenças entre médias de tratamentos observadas e a média geral quantificam
diferenças entre tratamentos, enquanto diferenças das observações dentro de um
tratamento e a média do tratamento podem ser devidas apenas a um erro aleatório.
Dessa forma, reescrevemos (3.4) como
E Trat T
SQ SQ SQ + ·
, onde:
( )
∑∑
· ·
− ·
k
i
n
j
ij T
y y SQ
1 1
2
..
: Soma dos quadrados total.
( )

·
− ·
k
i
i Trat
y y n SQ
1
2
.. .
: Soma dos quadrados devido aos tratamentos.
( )
∑∑
· ·
− ·
k
i
n
j
i ij E
y y SQ
1 1
2
.
: Soma dos quadrados dos erros.
Calculando os valores esperados de
Trat
SQ
e
E
SQ
tem-se :

·
+ − ·
k
i
i Trat
n k SQ E
1
2 2
) 1 ( ) ( τ σ
(3.5)
Demonstração: Ver Montgomery (2001)
Sob
o
H
verdadeira, temos que
2
) 1 (
1
σ ·

,
`

.
|

Trat
SQ
k
E

Se
1
H
é verdadeira, então
1 ) 1 (
1
1
2
2

+ ·

,
`

.
|


·
k
n
SQ
k
E
k
i
i
Trat
τ
σ
A razão
1 −
·
k
SQ
QM
Trat
Trat
é chamada média quadrática dos tratamentos. Logo, se
o
H
é
verdadeira,
Trat
QM
é um estimador não-viciado de
2
σ , enquanto que, se
1
H
é
10
verdadeira,
Trat
QM
estima
2
σ mais um termo positivo que incorpora a variação
devida à diferença entre as médias dos tratamentos.
Da mesma forma, tem-se que
2
) 1 ( ) ( σ − · n k SQ E
E
(3.6)
Então a média quadrática dos erros
) 1 ( −
·
n k
SQ
QM
E
E
é um estimador não-viciado de
2
σ , independente de
o
H
ser ou não verdadeira.
Analisaremos também a partição dos graus de liberdade.
SQT
: tem 1 1 − · − kn N graus de liberdade
Trat
SQ
: tem 1 − k graus de liberdade
E
SQ
: tem
) 1 ( − n k
graus de liberdade
Supondo que cada uma das k populações possa ser modelada com uma distribuição
normal. Com essa suposição pode-se mostrar que, sob
o
H
, então:
( ) ) 1 ( , 1
~
) 1 (
1
− −
·


·
n k k
E
Trat
E
Trat
o
F
QM
QM
n k
SQ
k
SQ
F
(3.7)
Se o
H
é verdadeira Trat
QM
e
E
QM
são estimadores não viciados de
2
σ , mas se
o
H
é falsa então
( )
Trat
QM E
será maior que
) (
E
QM E
, assim sob a hipótese
alternativa,
o
F
será grande. Dessa forma um teste de hipótese é construído. Devemos
rejeitar
o
H
se o valor da estatística é grande, isso implica em uma região crítica
unilateral superior. Então rejeita-se
o
H
se ) 1 ( ), 1 ( , − −
>
n k k o
F F
α . No geral utiliza-se o
seguinte quadro para ANOVA.
Tabela 3.2 - Quadro da Anova
Fonte de Variação
SQ
L G.
QM
o
F
Entre Tratamentos
Trat
SQ 1 − k
Trat
QM
E
Trat
o
QM
QM
F ·
Dentro dos Tratamentos (Erro)
E
SQ
) 1 ( − n k
E
QM
Total
SQT
1 − kn
Estimativas dos efeitos dos tratamentos:
.. .
ˆ y y
i i
− · τ
,
k i ,..., 2 , 1 ·
11
3.2 Análise de Resíduos.
O modelo matemático de um planejamento completamente aleatorizado,
considera que as observações sejam distribuidas de forma normal, com mesma
variância. Essas suposições podem ser verificadas através da análise de resíduos.
Um resíduo é a diferença entre uma observação ij
y
e seu valor estimado (ou
ajustado) a partir do modelo estatístico que esta sendo utilizado, denotado por ij

. Para
o modelo específico temos que .
ˆ
i ij
y y ·
, com cada resíduo sendo . i ij ij
y y − · ε
, ou seja,
a diferença entre uma observação e a média correspondente observada do tratamento.
Para identificar se as suposições estão sendo violadas utilizamos básicamente
três tipos de gráficos: Resíduos X Ordem de Coleta, Resíduos X Tratamentos (médias
. i
y
) e Gráfico de probabilidade normal dos Resíduos.
O gráfico de Resíduos X Ordem de Coleta busca identificar algum tipo de
associação dos resíduos com a ordem de coleta das observações. A identificação de
algum tipo de associação viola a suposição de indepêndencia entre os dados, portanto
espera-se em uma análise de resíduos que não haja associoação entre resíduos e ordem
de coleta. O gráfico deve apresentar uma configuração aleatória entre resíduos e ordem
de coleta.


Figura 3.1: Gráfico Resíduo X Ordem
Na Figura 3.1, tem-se uma típica configuração aleatória entre ordem X resíduos,
validando a suposição de independência entre as observações.
O gráfico de Resíduos X Tratamento, busca identificar algum tipo de alteração
na dispersão dos resíduos para cada tratamento. Se houver dispersões muito diferentes
entre tratamentos pode significar que a variação não é constante, e uma importante
suposição do modelo estará violada. O gráfico deve apresentar uma configuração de
dispersão semelhante para todos os tratamentos.
12
Figura 3.2: Resíduo X Média dos Tratamentos
Na Figura 3.2, verifica-se um caso típico de não violação da suposição de igualdade da
variância.
O gráfico de probabilidade normal dos resíduos identifica se os dados
apresentam uma distribuição normal. Os resíduos plotados contra os quantils de uma
distribuição normal devem ficar de forma aproximada ao longo de uma reta. Neste caso
pode-se usar um teste estatístico baseado no coeficiente de correlação para identificar
uma possível lineariedade.
Figura 3.3: Gráfico de Probabilidade Normal para os Resíduos.
Em situações como na Figura 3.3, percebemos que pontos centrais estavam
localizados, de forma aproximada, ao longo de uma reta, o que indica que os
componentes do erro do modelo seguiam uma distribuição normal. No entanto para
confirmar essa hipótese sugere-se utilizar um teste para normalidade.
3.3 Comparações Multiplas
13
A análise de variância nós indica que há uma diferença entre as médias, mas ela
não diz qual média que difere.Existem procedimentos específicos chamados de
procedimentos de comparação múltipla, para testar as diferenças entre as médias
específicas seguindo uma análise de variância. Dentre os testes mais conhecidos
destacamos o teste Tukey (Montgomery,2001).
3.3.1 Teste de Tukey
O teste de Tukey, está baseado na amplitude total estudentizada e pode ser usado
para comparar todos os pares de contrastes que envolvem diferenças de médias.
O teste é exato de nível
α
quando o número de repetições é o mesmo para todos
tratamentos e aproximado quando o número de repetições é diferente para os
tratamentos. Este teste pode ainda ser usado para a construção de intervalos de
confiança para a difernça entre as médias dos tratamentos.
O procedimento está baseado na distribuição de amplitude total estudentizada
(studentized range statistic) dada por:
n
QM
y y
q
E
min max

·
(3.8)
onde
max
y
e
min
y
são as maiores e menores médias amostrais respectivamente,
calculadas para um grupo de
p
amostras. A distribuição de
) , ( f p q
α
, com
α
sendo
o percentil superior de pontos de
q
com
f
graus de liberdade, associado ao
estimador
E
QM
é calculada computacionalmente.
Para um número igual de repetições, o teste Tukey detecta diferenças significativas
entre pares de duas médias se o valor absoluto da diferenças das médias amostrais
execeder
n
QM
f k q T
E
) , (
α α
·

De forma equivalente, constrói-se intervalos de
)% 1 ( 100 α −
de confiança para todos os
pares de médias dada por:
α α
µ µ T y y T y y
j i j i j i
+ − ≤ − ≤ − −
. . . .
,
j i ≠
.
Para tamanhos amostrais diferentes (diferente n° de repetições), temos:

,
`

.
|
+ ·
j i
E
n n
QM
f k q
T
1 1
2
) , (
α
α

e
α α
µ µ T y y T y y
j i j i j i
+ − ≤ − ≤ − −
. . . .
,
j i ≠
respectivamente.
3.4- Análise Estatística de um Planejamento Completamente Aleatorizado com o
uso do Software R.
14
Neste tópico vamos ilustrar a utilização do software R na análise de dados para o
modelo de planejamento de experimento completamente aleatorizado.
3.4.1- Descrição do Programa
O software R, que é uma linguagem e ambiente para computação estatística e
gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido
nos grandes centros.
A linguagem R é derivada da linguagem do Software S-plus. Sua sintaxe é semelhante
com a linguagem C, e sua estrutura é de linguagem funcional. A tela inicial do
programa está ilustrada na figura abaixo:
Figura 3.4 : Tela Inicial do Software R.
O simbolo > indica a linha de comando (“prompt”) na qual serão digitados os comandos
para a execusão das análises.
O R tem um sistema de ajuda on-line que permite que a documentação seja exibida em
um browser (explorer,mozilla,ou similar). Para iniciar este sistema on-line clique em
“help” depois “html help”.
Para uma consulta rápida, quando já se sabe o nome da função, basta digitar
help(nome_da_função).
Para conhecer ou lembrar os parâmetros ou argumentos da função utilize o comando
args(nome_da_função).
15
Ordem Água Ordem Óleo A Ordem Óleo B
24 36,7 11 36 4 35,3
12 38,9 26 36,4 14 35
25 38,7 9 35,3 15 34,3
22 38,8 23 36,8 17 35,7
21 37,6 2 36,9 20 35,2
8 37,2 18 37,5 3 34,2
13 38,8 1 35,3 5 36,5
16 38 10 36 6 35,8
7 37,2 19 35,7 27 35,5
Quando se quer listar todas as funções que possuem um determinado termo utiliza-se o
comando apropos(termo). Por Exemplo:
> apropos(vector)
[1] ".__C__vector" "as.data.frame.vector" "as.vector"
[4] "as.vector.factor" "is.vector" "vector"
Por ser gratuito, o R não possui suporte oficial. Existe uma lista de discussão através do
endereço http://www.r-project.org/mail.html, que se tem mostrado um suporte interativo
bastante eficiente.
3.4.2 – Aplicação do Software R na analise de dados para o planejamento de
experimentos completamente aleatorizado com único fator.
Para ilustrarmos a aplicação desse modelo, utilizamos o problema proposto em
Werkema & Aguiar (1996) descrito abaixo:
Os técnicos de uma indústria metalúrgica, desejam avaliar a dureza de peças de aço
após diferentes banhos de têmpera. O experimento consistiu em submeter nove peças de
aço a cada tipo de banho de têmpera (água, óleo A e óleo B), a seguir medir a dureza no
centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de
identificar o meio de têmpera mais adequado. Este é um exemplo de um experimento
com um único fator (banho de têmpera) com 3 · k níveis (água, óleo A e óleo B) e
n
= 9 réplicas. Neste experimento, os 27 ensaios ou testes foram realizados em ordem
aleatória. Na Tabela 9, apresenta-se os resultados do experimento.
Tabela 3.3 : Dados do experimento com a ordem dos ensaios.
Neste caso a matriz de planejamento de experimento pode ser montada com a seguinte
seqüência de comandos para entrar com os dados do experimento:
Montando as colunas resposta e ordem:
>y<- scan() : Depois do comando o próximo passo é digitar os valores da resposta
seguidos de enter e para encerrar digite enter duas vezes.
>or<- scan() : Depois do comando o próximo passo é entrar com os dados da ordem do
ensaio da mesma forma anterior.
16
Montando a variável tratamento:
>x<-rep(1:3,each=9) : no caso temos 3 tratamentos com 9 repetições, ou,
>x1<-factor(rep(1:3,each=9),labels=c("agua","oleoA","oleoB"))
Montando o data.frame ( matriz de dados e fatores)
bt<-data.frame(resp=y, ordem=or, trat=x1)
Assim, a matriz de planejamento terá a seguinte forma:
resp ordem trat
1 36.7 24 agua
2 38.9 12 agua
*
*
*
26 35.8 6 oleoB
27 35.5 27 oleoB
Para a análise descritiva o primeiro passo é indicar o caminho das variáveis no
data.frame, isso é feito com o comando attach(bt) . O comando tapply, possibilita a
manipulação de dados no data.frame. Para um resumo descritivo usamos a seqüência:
tapply(resp,trat,summary)
$água
Min. 1st Qu. Median Mean 3rd Qu. Max.
36.70 37.20 38.00 37.99 38.80 38.90
$óleoA
Min. 1st Qu. Median Mean 3rd Qu. Max.
35.30 35.70 36.00 36.21 36.80 37.50
$óleoB
Min. 1st Qu. Median Mean 3rd Qu. Max.
34.20 35.00 35.30 35.28 35.70 36.50
O comando resultou em um resumo descritivo das respostas por tratamento.
Uma inspeção gráfica pode ser obtida pelo Gráfico de Box-Cox.
>plot(resp~trat,xlab="Banho de Têmpera",ylab="Dureza", col ="red")
17
Figura 3.5: Box-Plot para os Valores de Dureza Obtidos em cada Banho de Têmpera.
Pela Figura 3.5 e medidas descritivas acima, pode-se observar que parece haver
uma diferença entre os banhos de óleo e o de água, sendo que a maior dureza média foi
observada no banho de água.
O problema agora é verificar se essas diferenças de fato são significativas ou
podem ser de origem aleatória. Para constatarmos se de fato as diferenças são
significativas utilizaremos à análise de variância.
Para a Análise de Variância temos a seguinte seqüência de comandos:
aov(formula, data = NULL, projections = FALSE, qr = TRUE,
contrasts = NULL, ...)
Este comando efetua e guarda todos os resultados da ANOVA do modelo (formula)
av<-aov(resp~trat) :
O comando names(av) lista todos os vetores de resultados gerados pela ANOVA como
por exemplo o vetor de resíduos.
> names(av)
[1] "coefficients" "residuals" "effects" "rank" "fitted.values" "assign"
"qr"
[8] "df.residual" "contrasts" "xlevels" "call" "terms" "model"
Para utilizar esses vetores deve-se referenciar como por exemplo av$res ou av$fitt ,
aqui será listado o vetor de resíduos e o vetor de valores ajustados pelo modelo
proposto.
Agora utiliza-se o comando summary(av) ou anova(av) , que geram a Tabela da
ANOVA abaixo:
Analysis of Variance Table
Response: resp
Df SumSq Mean Sq F value Pr(>F)
trat 2 34.145 17.073 28.389 4.732e-07 ***
Residuals 24 14.433 0.601
18
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Assim, como
389 . 28 ·
o
F
é um valor bem maior que 1, temos evidências
significativas para concluir que pelo menos um tratamento difere dos demais. Essa
evidência é mais facilmente verificado pelo p-value que neste caso é dado por
Pr(>F)=4.732e-07 , ou seja, a diferença é significativa a um nível de abaixo de 0.001.
Dessa forma verifica-se que as médias diferem, isto é, que o tipo de banho
utilizado afeta a dureza das peças temperadas.
Detectado a diferença entre tratamentos o próximo passo e identificar de fato
qual dos tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de
Tukey. O comando para o teste de Tukey é:
>TukeyHSD(av)

Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = resp ~ trat)
$trat
diff lwr upr
oleoA-agua -1.7777778 -2.690713 -0.8648426
oleoB-agua -2.7111111 -3.624046 -1.7981760
oleoB-oleoA -0.9333333 -1.846268 -0.0203982
Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de
confiança para as diferenças, que todos os tratamentos são diferentes entre si e a ordem
é dada por:
Água > Óleo A > Óleo B
19
Figura 3.6: Comparações Múltiplas.
O resultado pode ser melhor ilustrado pela Figura 3.6, que é gerado através do comado:
> plot(TukeyHSD(av))
O modelo de análise de variância assume que as observações são independentes,
com distribuição normal de mesma variância em cada tratamento. Dessa forma devemos
analisar o comportamento dos resíduos através dos seguintes gráficos:
• Gráfico de resíduos contra ordem de coleta das observações (tempo)
• Gráfico de resíduos contra Valores Ajustados
• Gráfico de probabilidade normal.
Para o Gráfico de resíduos contra ordem de coleta das observações (tempo),
utiliza-se o comando:
>plot (ordem,av$res,xlab="Ordem",ylab="Resíduos",col="red")
Aqui “ordem” é o vetor associado a ordem de realização do experimento, “av$res” é o
vetor relacionado com os resíduos gerados pelo modelo, xlab é o nome da coordenada
x, ylab é o nome da coordenada y e col é a cor desejada. Da mesma forma para
Resíduos X Valores Ajustados temos:
Figura 3.7 – Gráficos: Resíduos X Ordem e Resíduos X Valores Ajustados
>plot(av$fit,av$res, xlab="Valores Ajustados",ylab="Resíduos",col="blue")
Para o Gráfico Normal tem-se a seqüência de comando:
>qqnorm(av$res,xlab="Quantil da Normal",ylab="Resíduos")
20
Este comando plot os quantis da distribuição normal contra os valores dos resíduos
ordenados
>qqline(av.$res)
Este comando ajusta a reta entre os pontos. Neste caso espera-se que os dados se
alinhem em torno da reta ajustada.
Figura 3.8 – Gráfico Normal de Probabilidade dos Resíduos
Considerando o gráfico dos Resíduos X ordem, não se identifica nenhum relação
existente, validando dessa forma a suposição de independência entre os resíduos. Para o
gráfico de resíduos X valores ajustados (médias) a suposição testada era a de variação
igual para ambos os tratamentos, neste caso também parece não haver ocorrido violação
da suposição. No gráfico normal de probabilidade (QQ-Plot) os dados também parecem
não terem violado de forma comprometedora a suposição de normalidade.
Abaixo apresenta-se os testes de Bartlett para homogeneidade de variâncias nos
tratamentos e Shapiro-Wilk para normalidade dos resíduos.
O Teste de Bartlett é usado através do comando:
>bartlett.test(av$res,trat)
Bartlett test of homogeneity of variances
data: resp and trat
Bartlett's K-squared = 0.199, df = 2, p-value = 0.9053
21
Como visto não se rejeita a hipótese de igualdade de variâncias, portanto essa suposição
não foi violada.
O teste de normalidade de Shapiro-Wilk é usado através do comando:
>shapiro.test(av$res)
Shapiro-Wilk normality test
data: av$res
W = 0.9613, p-value = 0.3954
Da mesma forma, não se rejeita a hipótese de normalidade dos resíduos, portanto a
suposição de normalidade não foi violada.
Conclusão Final:
• Todos os tratamentos (água, óleo A e óleo B) diferem entre si.
• A ordem da durabilidade para o tipo de tratamento é: Água > Óleo A > Óleo B.
• O modelo utilizado para a análise foi adequado, não violando nenhuma
suposição inicial.
3.5 - Exercícios do Capítulo
1. Considere um experimento para determinar o efeito da vazão de C
2
F
6
sobre a
uniformidade do ataque químico em uma pastilha de silicone usada na
fabricação de um circuito integrado. Três vazões são usadas no experimento e a
uniformidade (%) resultante, para seis replicatas, é mostrado a seguir.
• Faça um estudo descritivo, visando comparar os níveis do fator (tabela
decritiva e Box-Plot).
• Faça um análise de variância completa usando
1 . 0 · α
e verifique quais
as vazões de gás que produzem diferentes uniformidades médias de
ataque químico.
2. Um experimento foi feito para determinar se quatro temperaturas específicas de
queima afetam a densidade de um certo tipo de tijolo. O experimento conduziu
aos seguintes dados.
22
• Faça um estudo descritivo, visando comparar os níveis do fator (tabela
decritiva e Box-Plot).
• Faça um análise de variância completa usando
05 . 0 · α
e verifique quais
níveis de temperatura que produzem diferentes densidades nos tijolos.
3. A resistência à compressão do concreto está sendo estudada e quatro técnicas
diferentes de mistura estão sendo investigadas. Os seguintes dados foram
coletados.
• Faça um estudo descritivo, visando comparar os níveis do fator (tabela
decritiva e Box-Plot).
• Faça um análise de variância completa usando
05 . 0 · α
e verifique se as
misturas afetam a resistência do concreto.
4. Um engenheiro eletrônico está interessado no efeito, na condutividade do tubo,
de cinco tipos diferentes de recobrimento de tubos de raios catódicos em uma
tela de um sistema de telecomunicações. Os seguintes dados de condutividade
são obtidos. Se 05 . 0 · α , você pode isolar qualquer diferença na condutividade
média devido ao tipo de recobrimento?
Capítulo 4- Planejamento de Experimentos em
Blocos Completamente Aleatorizados.
4.1 Introdução
23
Em muitas situações experimentais, a presença de fontes externas perturbadoras
conhecidas pode provocar variabilidade extra e alterar os efeitos dos fatores de
interesse, confundindo dessa forma a análise final do planejamento experimental.
Os planejamentos de experimentos com blocos completamente aleatorizados são
planejamentos experimentais nos quais parte dessa variabilidade devida a fatores
externos conhecidos é controlada.
Um exemplo desse estudo pode ser ilustrado em uma situação onde se deseja testar a
eficiência de diferentes processos de produção para a mesma finalidade sabendo que a
matéria-prima, que é vinda de diferentes fornecedores pode influenciar no resultado.
Aqui não se tem interesse em testar a matéria prima e sim os processos, no entanto a
matéria-prima que não vem de forma padronizada pode confundir o desempenho dos
processos.
Nesta situação, os diferentes lotes de matéria-prima devem ser tratados como
blocos. Dentro do bloco devem ser realizados todos os ensaios correspondentes aos
possíveis tratamentos (ou níveis do fator de interesse). Ainda dentro do bloco, a
associação dos tratamentos ás unidades experimentais e a ordem de realização dos
ensaios devem ser determinadas ao acaso.
4.2 Formulação Teórica
Para este modelo, vamos considerar em geral, que existem k tratamentos que
serão avaliados em b blocos. A disposição dos dados é ilustrada na Tabela abaixo:
Blocos
Trat 1 2 ... b Totais
1
11
y
12
y ...
b
y
1 . 1
y
2
21
y
22
y ...
b
y
2 . 2
y
     
k 1 k
y
2 k
y ...
kb
y
. k
y
Totais
1 .
y
2 .
y ...
b
y
. ..
y
Nesta situação será coletada apenas uma observação para cada tratamento (nível
do fator), em cada bloco. A maneira como os tratamentos serão alocados às unidades
experimentais e a ordem de realização dos ensaios, dentro de cada bloco, serão
determinadas de modo aleatório. Em função da primeira aleatorização dos tratamentos
com os blocos, dizemos que os blocos representam uma restrição a aleatorização.
O modelo estatístico para esse experimento é
ij j i ij
y ε β τ µ + + + ·
,
k i , , 2 , 1  ·
e
b j , , 2 , 1  ·
. (4.1)
onde
ij
y
: observações coletadas sob o i-ésimo tratamento no j-ésimo bloco.
µ
: média geral.
24
i
τ
: efeito do i-ésimo tratamento.
j
β
: efeito do j-ésimo bloco.
ij
ε
: erro aleatório associado à observação ij
y
.
Aqui será feita a suposição de que os erros aleatórios são independentes e
distribuídos de forma normal com média zero e variância
2
σ , ou seja,
) , 0 ( ~
2
σ ε N
ij
.
Os tratamentos e blocos serão considerados, inicialmente, como fatores fixos.
Temos ainda que os efeitos dos tratamentos e dos blocos são definidos como
desvios da média global, de modo que

·
·
k
i
i
1
0 τ e

·
·
b
j
j
1
0 β
. Considerando
também que os tratamentos e os blocos não interagem.
Assim, estamos interessados em testar a igualdade dos efeitos do tratamento. Isto
é:
um mínimo no para , 0 :
0 :
1
2 1 0
i H
H
i
k

· · · ·
τ
τ τ τ 
(4.2)
Dessa forma a análise de variância pode ser estendida ao planejamento em
blocos completamente aleatorizados. O procedimento usa a soma de quadrados total,
SQT
, que representa uma partição da variabilidade total das observações em relação à
variabilidade explicada pelo tratamento, pelos blocos e pelo acaso.
( )
∑∑ ∑ ∑ ∑∑
· · · · · ·
+ − − + − + − · − ·
k
i
b
j
k
i
b
j
k
i
b
j
i j ij j i ij
y y y y y y k y y b y y SQT
1 1 1 1 1 1
2
.. . .
2
.. .
2
.. .
2
..
) ( ) ( ) (

(4.3)
Aqui:
. i
y
: soma da observações no i-ésimo tratamento
j
y
. : soma da observações no j-ésimo bloco
..
y
: soma total
. i
y
: média das observações no i-ésimo tratamento
j
y
. : média das observações no j-ésimo bloco
..
y
: média geral de todas as observações.
kb N · : Total de observações.
A demonstração da partição de
SQT
pode ser vista em Montegomery, 2001. A
identidade da soma quadrática pode ser representada simbolicamente por
E Bloco Trat
SQ SQ SQ SQT + + ·
(4.4)
onde,
∑∑
· ·
− ·
k
i
b
j
ij
y y SQT
1 1
2
..
) (
: Soma de quadrados total.

·
− ·
k
i
i Trat
y y b SQ
1
2
.. .
) (
: Soma de quadrados devido aos tratamentos.
25

·
− ·
b
j
j Blo
y y k SQ
1
2
.. . cos
) (
: Soma de quadrados devido aos blocos.
∑∑
· ·
+ − − ·
k
i
b
j
i j ij E
y y y y SQ
1 1
2
.. . .
) (
: Soma do quadrado dos resíduos.
O desmembramento do grau de liberdade correspondente a essas somas
quadráticas é dado da seguinte forma. Para N observações,
SQT
terá 1 − N graus de
liberdade, para k tratamentos e b blocos,
Trat
SQ
e
cos Blo
SQ
terão 1 − k e 1 − b
graus de liberdade respectivamente. Para
E
SQ
temos
) 1 )( 1 ( − − b k
graus de
liberdade por subtração. A idéia do teste é a mesma do planejamento completamente
aleatorizado, procurando trabalhar com os quadrados médios. Para este modelo os
quadrados médios são:
1 −
·
k
SQ
QM
Trat
Trat
: Quadrado Médio dos Tratamentos
1
cos
cos

·
b
SQ
QM
Blo
Blo
: Quadrado Médio dos Blocos.
) 1 )( 1 ( − −
·
b k
SQ
QM
E
E
: Quadrado Médio dos Resíduos.
Pode ser demonstrado (ver Montgomery, 2002) que os valores esperados dessas
médias quadráticas são:
( )
1
1
2
2

+ ·

·
k
b
QM E
k
i
i
Trat
τ
σ
(4.5)
( )
1
1
2
2
cos

+ ·

·
b
k
QM E
b
j
j
Blo
β
σ
(4.6)
( )
2
σ ·
E
QM E (4.7)
Dessa forma, se a hipótese nula
0
H
for verdadeira de modo que todos os efeitos do
tratamento
0 ·
i
τ
, então
Trat
QM
será um estimador não tendencioso de
2
σ , enquanto
se
o
H
for falsa, estimará
2
σ mais um termo quadrático positivo. O quadrado médio
dos resíduos será sempre um estimador não tendencioso de
2
σ . Dessa forma para testar
a hipótese nula de que os efeitos dos tratamentos sejam iguais a zero, utilizamos a
estatística
E
Trat
QM
QM
F ·
0

que, sob
o
H
, terá uma distribuição F, com
) 1 )( 1 ( , ) 1 ( − − − b k k
graus de liberdade.
Assim, rejeita-se a hipótese nula
o
H
, com um nível de significância
α
, se
26
[ ] ) 1 )( 1 ( ), 1 (
,
− − −
·
b k k o
F F
α
O quadro da ANOVA será dado por:
Tabela 4.1 – Quadro da Anova
Fonte de
Variação
SQ GL QM
o
F
Tratamentos
Trat
SQ 1 − k
Trat
QM
E
Trat
QM
QM
Blocos
cos Blo
SQ 1 − b
cos Blo
QM
E
Blo
QM
QM
cos
Erros
E
SQ
) 1 )( 1 ( − − b k
E
QM
Total
SQT
1 1 − · − kb N
A estatística
E
Blo
QM
QM
F
cos
·
, aparece como teste para o efeito dos blocos. A
validade dessa razão como uma estatística de teste para a hipótese nula de nenhum
efeito do bloco é duvidosa, uma vez que os blocos representam uma restrição à
aleatoriedade, ou seja, usamos a aleatoridade apenas dentro dos blocos. Podemos
considerar, se os blocos forem realizados em uma ordem aleatória, que um valor grande
para F dá indicativos para efeitos significativos dos blocos, mas não podemos afirmar
esses resultados como para o teste do efeito dos tratamentos.
4.3-Análise de Resíduos (Verificação da Adequação do Modelo)
Da mesma forma, no caso dos planejamentos em blocos completamente aleatorizados
deve ser verificada a validade das suposições de normalidade dos erros, igualdade de
variância das observações nos tratamentos, nos blocos e ausência da interação
tratamento-bloco. A análise de resíduo é a principal ferramenta utilizada para esta
verificação. Para os planejamentos em blocos completamente aleatorizados os resíduos
são definidos por
.. . .
ˆ y y y y y y
j i ij ij ij ij
+ − − · − · ε
(4.8)
As verificações serão feitas por meio do estudo dos gráficos de resíduos como: Gráficos
de resíduos X Valores Ajustados; Gráficos de Resíduos x Tratamentos; Resíduos x
Blocos e Gráfico de probabilidade Normal. Aqui pode-se também usar o teste de
Barllets para testar a igualdade de variâncias e o teste de ShapiroWilk para Normalidade
dos resíduos.

4.4- Comparações Múltiplas.
Da mesma forma pode-se utilizar o teste de Tukey, considerando agora uma pequena
alteração no grau de liberdade do
E
QM
, que agora possui
) 1 )( 1 ( − − b k
graus de
liberdade e substituir o número n de réplicas pelo número de blocos b.
27
Catalisador 1 2 3 4 5
A 41 34 40 39 33
B 43 37 45 42 40
C 45 38 48 43 38
D 43 41 45 46 40
Lotes
4.5 – Aplicação do Software R na analise de dados para o planejamento de
experimento aleatorizado em blocos completos.
Para ilustrarmos a aplicação desse modelo, utilizamos outro problema proposto em
Werkema & Aguiar, (1996) descrito abaixo:
Com o objetivo de reduzir o tempo de reação de um processo químico, uma indústria
resolve realizar um experimento com quatro tipos de catalisadores (A,B,C e D). No
entanto os técnicos perceberam que a matéria-prima utilizada na reação não era
totalmente homogênea e representava uma fonte de variabilidade que afetava o
desempenho do processo. Uma maneira de contornar este problema consistia em
selecionar vários lotes de matéria-prima e comparar os quatro catalisadores nas
condições relativamente homogêneas dentro de cada lote. Dessa forma, a equipe decidiu
usar cinco lotes disponíveis no estoque da industria e para cada lote extrair quatro
porções de matéria-prima, de modo que cada porção fosse suficiente para fabricar uma
batelada de produto, e alocar aleatoriamente a cada uma destas porções um dos
catalisadores considerados no estudo. Estabeleceu-se a aleatorização da ordem de
realização dos ensaios. Neste caso, cada ensaio corresponde à produção de uma batelada
da substância química utilizando uma das combinações porção de matéria-
prima/catalisador. Portanto estamos diante de um experimento aleatorizado em blocos
completos.
Cada bloco corresponde a um lote de matéria prima e os tratamentos ou níveis do fator
correspondem aos tipos de catalisador. Dentro de um bloco, a associação dos
tratamentos às unidades experimentais e a ordem de realização dos ensaios são
determinadas ao acaso.
Os dados desse experimento estão ilustrados abaixo:
Tabela 4.2: Dados do experimento com Catalisadores
4.5.1 - Entrada de dados e análise descritiva usando o Software R.
Aqui a matriz de planejamento será montada da seguinte forma:
Repostas:
y<- scan() : Depois do comando o próximo passo é entrar com os dados da resposta.
Montando a variável Bloco e Tratamento:
b<-rep(1:5,each=4) : no caso temos 5 blocos com 4 repetições.
tr<-rep(1:5,4) : no caso temos 4 tratamentos com 5 repetições.
28
Uma opção mais completa pode ser definida por:
b<-factor(rep(1:5,each=4),labels=c("Lote1","Lote2","Lote3","Lote4","Lote5"))
tr<- factor(rep(1:4,5),labels=c("A","B","C","D"))
Montando o Data.frame
decab<-data.frame(resp=y,trat=tr,bloco=b)
> decab
resp trat bloco
1 41 A Lote1
2 43 B Lote1
*
*
*
19 38 C Lote5
20 40 D Lote5
Da mesma forma utilizando o comando attach() e tapply(), a um resumo descritivo
considerando os fatores.
attach(decab)
> tapply(resp,trat,summary)
$A
Min. 1st Qu. Median Mean 3rd Qu. Max.
33.0 34.0 39.0 37.4 40.0 41.0
$B
Min. 1st Qu. Median Mean 3rd Qu. Max.
37.0 40.0 42.0 41.4 43.0 45.0
$C
Min. 1st Qu. Median Mean 3rd Qu. Max.
38.0 38.0 43.0 42.4 45.0 48.0
$D
Min. 1st Qu. Median Mean 3rd Qu. Max.
40 41 43 43 45 46
> tapply(resp,bloco,summary)
$Lote1
Min. 1st Qu. Median Mean 3rd Qu. Max.
41.0 42.5 43.0 43.0 43.5 45.0
$Lote2
Min. 1st Qu. Median Mean 3rd Qu. Max.
34.00 36.25 37.50 37.50 38.75 41.00
$Lote3
Min. 1st Qu. Median Mean 3rd Qu. Max.
40.00 43.75 45.00 44.50 45.75 48.00
$Lote4
Min. 1st Qu. Median Mean 3rd Qu. Max.
29
39.00 41.25 42.50 42.50 43.75 46.00
$Lote5
Min. 1st Qu. Median Mean 3rd Qu. Max.
33.00 36.75 39.00 37.75 40.00 40.00
Uma inspeção gráfica, pode ser obtida pelos comandos:
par(mfrow=c(2,1))
plot(trat,resp,xlab="Tratamento",ylab="Respostas")
plot(bloco,resp,xlab="Bloco",ylab="Respostas")
Figura 4.1: Box-Plot para os tempos de reação segundo tratamento (catalisador) e
bloco (lotes de matéria-prima).
Pela Figura 4.1 e medidas descritivas acima, pode-se observar que parece haver uma
diferença entre os tempos, sendo que o menor tempo de reação parece estar associado
ao catalisador A.

> coplot(resp~trat|bloco,panel=panel.smooth,rows=1,xlab=c("Medidas por
Catalisador", paste("Bloco")),ylab="Tempo de Reação")
30
O problema agora é verificar se essas diferenças de fato são significativas ou podem ser
de origem aleatória. Para constatarmos se de fato as diferenças são significativas
utilizaremos à análise de variância.
> eb.av<-aov(resp~trat+bloco)
> anova(eb.av)
Analysis of Variance Table
Response: resp
Df Sum Sq Mean Sq F value Pr(>F)
trat 3 95.350 31.783 13.430 0.0003839 ***
bloco 4 165.200 41.300 17.451 6.098e-05 ***
Residuals 12 28.400 2.367
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
31
Pelo quadro da anova acima, verifica-se que existe diferença entre tratamentos, com
relação aos blocos tem-se uma indicação de que apresentaram efeito significativo, sendo
dessa forma seu uso indispensável neste experimento.
Detectado a diferença entre tratamentos o próximo passo e identificar de fato qual dos
tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de Tukey.
Comando:
>TukeyHSD(eb.av)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = resp ~ trat + bloco)
$trat
diff lwr upr
B-A 4.0 1.111354 6.888646
C-A 5.0 2.111354 7.888646
D-A 5.6 2.711354 8.488646
C-B 1.0 -1.888646 3.888646
D-B 1.6 -1.288646 4.488646
D-C 0.6 -2.288646 3.488646
$bloco
diff lwr upr
Lote2-Lote1 -5.50 -8.967325 -2.032675
Lote3-Lote1 1.50 -1.967325 4.967325
Lote4-Lote1 -0.50 -3.967325 2.967325
Lote5-Lote1 -5.25 -8.717325 -1.782675
Lote3-Lote2 7.00 3.532675 10.467325
Lote4-Lote2 5.00 1.532675 8.467325
Lote5-Lote2 0.25 -3.217325 3.717325
Lote4-Lote3 -2.00 -5.467325 1.467325
Lote5-Lote3 -6.75 -10.217325 -3.282675
Lote5-Lote4 -4.75 -8.217325 -1.282675
Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de
confiança para as diferenças, que o catalisador A proporciona menor tempo de reação
comparado com todos os tratamentos.
Para este modelo devem-se construir os gráficos de resíduos contra valores ajustados;
gráfico de resíduos contra tratamentos; gráfico de resíduos contra blocos e gráfico de
32
probabilidade normal. Da mesma forma, podem-se utilizar alguns testes para verificar
as hipóteses de variância constante e normalidade dos dados.
Na Figura abaixo contém os gráficos descritos acima, para a análise de resíduos.
Figura 4.2: Gráficos para Análise de Resíduo do modelo de planejamento de
experimentos em blocos completos.
A seqüência dos comandos para a análise de resíduos da Figura 4.2, é descrita abaixo:
> par(mfrow=c(2,2))
> plot(eb.av$fit,eb.av$res,xlab="Valores Ajustados",ylab="Resíduos",col="blue")
> plot(trat,eb.av$res,xlab="Tratamentos",ylab="Resíduos",col="blue")
> plot(bloco,eb.av$res,xlab="Blocos",ylab="Resíduos",col="blue")
> qqnorm(eb.av$res,xlab="Quantil da Normal",ylab="Resíduos",col="blue")
> qqline(eb.av$res)
Pela Figura 4.2, parece não existir nenhuma violação grave na suposição do modelo.
Aplicando os testes de normalidade e homogeneidade de variâncias tem-se os seguintes
resultados:
Para o teste da Normalidade dos Resíduos temos:
> shapiro.test(eb.av$res)
Shapiro-Wilk normality test
33
Comprimento do Canal 1 2 3 4 5
1 0,7 0,8 0,8 0,9 1
2 0,8 0,8 0,9 0,9 1
3 0,9 1 1,7 2 4
4 1 1,5 2 3 20
Largura
Tipo de Bocal 11,73 14,37 16,59 20,43 23,46 28,74
1 0,78 0,8 0,81 0,75 0,77 0,78
2 0,85 0,85 0,92 0,86 0,81 0,83
3 0,93 0,92 0,95 0,89 0,89 0,83
4 1,14 0,97 0,98 0,88 0,86 0,83
5 0,97 0,86 0,78 0,76 0,76 0,75
Velocidade do Jato de Saída (m/s)
data: eb.av$res
W = 0.9217, p-value = 0.1066
Para testar a homogeneidade das variâncias temos:
> bartlett.test(eb.av$res,trat)
Bartlett test of homogeneity of variances
data: eb.av$res and trat
Bartlett's K-squared = 0.8093, df = 3, p-value = 0.8472
>bartlett.test(eb.av$res,bloco)
Bartlett test of homogeneity of variances
data: eb.av$res and bloco
Bartlett's K-squared = 0.5292, df = 4, p-value = 0.9706
Como a suposições de normalidade e nem de variância constante foram rejeitadas,
pode-se considerar o modelo como válido e a análise encerrada.
4.6- Conclusões Finais
• Existe diferença entre o tempo médio de reação entre os tratamentos, sendo que
o Catalisador A apresenta menor tempo de reação.
• O modelo utilizado na análise se mostrou apropriado, sem apresentar violações.
• Dessa forma recomenda-se a utilização do Catalisador A na produção, pois irá
aumentar a produtividade do processo.
4.7- Exercícios do Capítulo
1- Um experimento foi conduzido a fim de investigar o escapamento de corrente
elétrica em um aparelho SOS MOSFETS. A finalidade do experimento foi
investigar como o escapamento de corrente varia com o comprimento do canal.
Quatro comprimentos diferentes foram selecionados. Para cada comprimento do
canal, cinco larguras diferentes foram também usadas. A largura deve ser
considerada como fator pertubador. Eis os dados.
2- No artigo intitulado “O efeito do projeto do bocal na estabilidade e desempenho
de jatos turbulentos de água”, na revista Fire Safety Journal,Vol.4,agosto de
1981,C.Theobald descreve um experimento em que uma medida da forma foi
34
0
5
10
15
20
25
30
35
- +
Fator A
B(+)
B(-)
0
5
10
15
20
25
- +
Fator A
B(+)
B(-)
Tipo de Ponteira 1 2 3 4
1 9,3 9,4 9,6 10
2 9,4 9,3 9,8 9,9
3 9,2 9,4 9,5 9,7
4 9,7 9,6 10 10,2
Corpo de Prova
determinada para vários tipos diferentes de bocais, com níveis diferentes de
velocidade do jato de saída. O interesse nesse experimento está principalmente
no tipo de bocal, sendo a velocidade um fator que provoca distúrbio. Os dados
são apresentados a seguir.

• O tipo de bocal afeta a medida da forma? Compare os bocais, usando os
diagramas de caixa e a análise de variância.
• Compare as diferenças entre os bocais utilizando o gráfico box-plot.
• Faça a análise de resíduos para o modelo.
3- Um experimento foi realizado para determinar o efeito de quatro tipos diferentes
de ponteiras em um teste de dureza de uma liga metálica. Quatro corpos de
prova da liga foram obtidos e cada ponteira foi testada uma vez em cada corpo
de prova, produzindo os seguintes dados:
• Faça uma análise de variância completa para checar se existe diferença
nas medidas de dureza entre as ponteiras.
Capítulo 5 – Planejamentos Fatorias
Em muitas situações práticas podemos ter interesse em estudar o efeito de dois ou mais
fatores, nestas situações um experimento fatorial deve ser utilizado. Nos experimentos
fatorias, os fatores variam de forma simultânea, especificamente, queremos dizer que
em cada tentativa completa ou replicação do experimento, são investigadas todas as
combinações dos níveis dos fatores. Por exemplo, se há dois fatores A e B, com
a
níveis para o fator A e b níveis para o fator B, então cada replicação contém todas as
ab combinações possíveis.
O efeito de um fator é definido como a mudança na resposta produzida por uma
mudança no nível do fator. Isso é chamado efeito principal, porque se refere aos fatores
principais no estudo.
Se a diferença na resposta entre os níveis de um fator não é a mesma em todos os níveis
dos outros fatores, então esse efeito é chamado de interação. Abaixo apresentamos
exemplos gráficos de planejamentos com dois fatores com e sem interação.
35
Figura 5.1: Sem Interação Figura 5.2: Presença de Interação
5.1- Planejamento Fatorial com dois fatores.
Vamos considerar neste caso o planejamento com dois fatores. Aqui consideramos A e
B, com
a
e b níveis respectivamente. Se o experimento é replicado
n
vezes, a
disposição dos dados pode ser ilustrada na tabela abaixo:
Tabela 5.1: Disposição dos dados para um experimento fatorial com dois fatores
Fator B
Fator A 1 2 … b
1
n
y
y y
11
112 111
...,
, ,
n
y
y y
12
122 121
...,
, ,

bn
b b
y
y y
1
2 1 1 1
...,
, ,
2
n
y
y y
21
212 211
...,
, ,
n
y
y y
22
222 , 221
...,
,

bn
b b
y
y y
2
2 2 1 2
...,
, ,
    
a
n a
a a
y
y y
1
12 11
...,
, ,
n a
a a
y
y y
2
22 21
...,
, ,

abn
ab ab
y
y y
...,
, ,
2 1
Em geral, a observação na ij-ésima cela na k-ésima repetição é ijk
y
. Aqui, na coleta de
dados, as abn observações devem ser feitas em ordem aleatória. O planejamento
fatorial com dois fatores é um planejamento completamente aleatorizado. Vamos supor,
inicialmente, que ambos os fatores tenham efeitos fixos.
O modelo matemático para observações de um experimento fatorial com dois fatores é
dado por
ijk ij j i ijk
y ε τ β β τ µ + + + + · ) (
;
¹
¹
¹
'
¹
·
·
·
n k
b j
a i
, . . . , 2 , 1
, . . . , 2 , 1
, . . . , 2 , 1
(5.1)
onde:
µ
: é o efeito médio geral
i
τ
: é o efeito do i-ésimo nível do fator A.
36
j
β
: é o efeito do j-ésimo nível do fator B.
ij
) (τβ
: é o efeito da interação entre A e B.
ijk
ε
: é o erro aleatório. Da mesma forma, vamos considerar que
). ; 0 ( ~
2
σ ε N
ijk
Ambos os fatores são considerados fixos, e o efeito dos tratamentos são definidos como
desvios da média geral, dessa forma

·
·
a
i
i
1
0 τ e

·
·
b
j
j
1
0 β
.
Similarmente os efeitos da interação são considerados fixos e são definidos de forma
que
∑ ∑
· ·
· ·
a
i
b
j
j i j i
1 1
0 ) ( ) ( β τ β τ
. Como existirão
n
réplicas no experimento, tem-
se um total de abn observações.
No experimento fatorial com dois fatores, tem-se interesse em testar o efeito dos dois
fatores. Especificamente, estamos interessados em testes de hipóteses sobre a igualdade
do efeito do tratamento das linhas (Fator A)
i H
H
i
a
um menos pelo para , 0 :
0 ... :
1
2 1 0

· · · ·
τ
τ τ τ
(5.2)
E a igualdade de efeito do tratamento das colunas (Fator B).
. um menos pelo para ; 0 :
0 ... :
1
2 1 0
j H
H
j
b

· · · ·
β
β β β
(5.3)
Também, tem-se interesse em se testar o efeito da interação entre linhas e colunas, ou
seja,
). , ( para um menos pelo para , 0 ) ( :
. , todo para , 0 ) ( :
1
0
j i H
j i H
ij
ij

·
τβ
τβ
(5.4)
5.1.1- Análise Estatística para o modelo de efeitos fixos.
Sejam
.. i
y
o total das observações no i-ésimo nível do fator A, . . j
y
o total das
observações no j-ésimo nível do fator B, . ij
y
o total das observações na ij-ésima cela
da Tabela 1, e
.. i
y
, . . j
y
, . ij
y
e
...
y
como as correspondentes médias de linha, coluna,
cela e total. Isto é,
∑ ∑
· ·
·
b
j
n
k
ijk i
y y
1 1
..

bn
y
y
i
i
..
..
· ;
a i ,..., 2 , 1 ·
∑ ∑
· ·
·
a
i
n
k
ijk j
y y
1 1
. .

an
y
y
j
j
. .
. .
· ;
b j ,..., 2 , 1 ·
37

·
·
n
k
ijk ij
y y
1
.

n
y
y
ij
ij
.
.
· ;
¹
'
¹
·
·
b j
a i
, . . . , 2 , 1
, . . . , 2 , 1

∑ ∑ ∑
· · ·
·
a
i
b
j
n
k
ijk
y y
1 1 1
...

abn
y
y
...
...
·
A análise de variância decompõe a soma de quadrados total
∑∑∑
· · ·
− ·
a
i
b
j
n
k
ijk T
y y SQ
1 1 1
2
...
) (
(5.5)
Da seguinte forma:
∑∑∑ ∑ ∑
· · · · ·
− + − · −
a
i
b
j
n
k
a
i
b
j
j i ijk
y y an y y bn y y
1 1 1 1 1
2
... . .
2
... ..
2
...
) ( ) ( ) (
∑∑
· ·
+ − − +
a
i
b
j
j i ij
y y y y n
1 1
2
... . . .. .
) (
∑∑∑
· · ·
− +
a
i
b
j
n
k
ij ijk
y y
1 1 1
2
.
) (
.
Ou, simbolicamente,
E AB B A T
SQ SQ SQ SQ SQ + + + ·
(5.6)
A decomposição dos graus de liberdade é ilustrada na tabela abaixo:
Tabela 5.2 – Decomposição dos graus de liberdade.
Efeito Graus de Liberdade
A 1 − a
B 1 − b
Interação AB
) 1 )( 1 ( − − b a
Erro
) 1 ( − n ab
Total 1 − abn
38
Cada soma de quadrados dividido pelos respectivos graus de liberdade formam os
quadrados médios. Assim
1 −
·
a
SQ
QM
A
A
: Quadrado médio do tratamento A.
1 −
·
b
SQ
QM
B
B
: Quadrado médio do tratamento B.
) 1 )( 1 ( − −
·
b a
SQ
QM
AB
AB
: Quadrado médio da Interação.
) 1 ( −
·
n ab
SQ
QM
E
E
: Quadrado médio dos Erros.
Os valores esperados dos quadrados médios são:
1 1
) (
1
2
2

+ ·
,
`

.
|

·

·
a
bn
a
SQ
E QM E
a
i
i
A
A
τ
σ (5.7)
1 1
) (
1
2
2

+ ·
,
`

.
|

·

·
b
an
b
SQ
E QM E
b
j
j
B
B
β
σ
(5.8)
) 1 )( 1 (
) (
) 1 )( 1 (
) (
1 1
2
2
− −
+ ·

,
`

.
|
− −
·
∑ ∑
· ·
b a
n
b a
SQ
E QM E
a
i
b
j
ij
AB
AB
τ β
σ
(5.9)
2
) 1 (
) ( σ ·

,
`

.
|

·
n ab
SQ
E QM E
E
E
(5.10)
Note que se as hipóteses nulas sobre o efeito das linhas A, efeitos das colunas B e da
interação AB são verdadeiras então
Q e Q , Q ,
E AB B A
M M M QM
são todos
estimativas de
2
σ .
Dessa forma, se existe diferenças entre os efeitos dos tratamentos em A, então
A
QM

será maior que
E
QM
. Similarmente, se existe diferenças nos efeitos dos tratamentos
em B, ou na interação AB, então a correspondente média quadrática será maior que
E
QM
. Portanto o teste de significância de ambos os efeitos e interações, é
simplesmente usar a razão entre as médias quadráticas e o quadrado médio dos resíduos
E
QM
.
39
Se for assumido que o modelo da equação 5.1 é adequado e que os
k
ij
ε
são
independentes e identicamente distribuídos de forma normal com variância constante
2
σ , então cada razão de quadrados médios
E
A
QM
QM
,
E
B
QM
QM
e
E
AB
QM
QM
é distribuído
como uma F com
) 1 ( − a
,
) 1 ( − b
e
) 1 )( 1 ( − − b a
graus de liberdade do numerador
respectivamente e
) 1 ( − n ab
graus de liberdade do denominador. A região critica para
um teste com nível de significância
α
, será valores da razão de quadrados que exceder
o quantil da F com um nível
α
e respectivos graus de liberdade.
O procedimento é resumido na tabela de Análise de Variância abaixo:
Tabela 5.3 – Quadro da ANOVA
Fonte de
Variação
Soma de
Quadrados
Graus de
Liberdade
Quadrado Médio
0
F
A
A
SQ 1 − a
1 −
·
a
SQ
QM
A
A
E
A
QM
QM
B
B
SQ 1 − b
1 −
·
b
SQ
QM
B
B
E
B
QM
QM
Interação
AB
SQ
) 1 )( 1 ( − − b a
) 1 )( 1 ( − −
·
b a
SQ
QM
AB
AB
E
AB
QM
QM
Erro
E
SQ
) 1 ( − n ab
) 1 ( −
·
n ab
SQ
QM
E
E
Total
T
SQ 1 − abn
5.1.2- Análise de Resíduo para o Modelo Fatorial com 2 fatores fixos.
Do mesmo modo que nos experimentos com um fator, discutidos anteriormente, os
resíduos de um experimento fatorial desempenham papel importante na garantia de
adequação do modelo. Os resíduos de um experimento fatorial de dois fatores são
.
ˆ
ij ijk ijk ijk ijk
y y y y − · − · ε
(5.11)
Isto é, os resíduos são, simplesmente, a diferença entre as observações e as médias das
celas correspondentes (ver Montgomery, 2001). Da mesma forma a utilização de
gráficos e testes para checar a adequação das suposições serão de grande importância.
Para o modelo fatorial de dois fatores A e B, destacamos os seguintes gráficos e testes.
1. Gráfico da probabilidade normal. Usado com os resíduos, checa se os mesmos
seguem uma distribuição normal. Aqui também utiliza-se o teste de
normalidade como por exemplo Shapiro-Wilky.
40
2. Gráfico de resíduos X níveis do fator A. Checa a homogeneidade da variância
nos níveis de A.
3. Gráfico de resíduos X níveis do fator B. Checa a homogeneidade da variância
nos níveis de B.
4. Gráfico de resíduos X valores preditos ijk

. Checa a homogeneidade da
variância de forma geral. Para testar a homogeneidade da variância pode-se usar
o teste de Bartey.
5. Gráfico de resíduos X Ordem de coleta. Checa a suposição de independência
entre as observações.
Se forem observadas evidências de fortes violações na suposição do modelo, esse deve
ser invalidado ou deve-se proceder a transformações dos dados originais (ver
Montgomery, 2001).
5.1.3- Comparações Múltiplas
Identificado o efeito significativo nos níveis dos fatores, deve-se utilizar um teste de
comparações múltiplas, para a identificação das diferenças específicas. Novamente será
utilizado nesta fase o teste de comparações múltiplas de Tukey.
Vale ressaltar que quando a interação é significativa, a comparação entre médias de um
mesmo fator pode ser mascarada pelo efeito da interação. Uma alternativa para essa
situação é por exemplo fixar o fator B em um nível específico e aplicar o teste Tukey
para as médias do fator A neste nível fixado.
5.2- O Modelo de Planejamento Fatorial Geral
Os resultados do experimento fatorial com dois fatores podem ser facilmente estendidos
para o caso geral onde existem
a
níveis do fator A, b níveis do fator B,
c
níveis do
fator C, e assim por diante. No geral, existirão n abc ... observações totais para
n

réplicas completas do experimento. Aqui, deve-se ter no mínimo duas réplicas ( 2 ≥ n )
para determinar as somas de quadrados envolvidas no modelo.
Se todos os fatores no experimento são fixos, pode-se facilmente formular e testar
hipóteses sobre os efeitos principais e interações. Neste caso, testes estatísticos para
cada efeito principal e interação podem ser construídos pela divisão da correspondente
média de quadrados dos efeitos ou interação pela média quadrática dos erros. Todos são
testes F , unilaterais a direita. O número de graus de liberdade para os efeitos
principais é o número de níveis do fator menos um e o número de graus de liberdade
para interação é o produto do número de graus de liberdade associado com os
componentes individuais da interação. Por exemplo, considerando o modelo com três
fatores temos:
41
ijkl ijk jk ik ij k j i ijkl
y ε τ βγ βγ τ γ τ β γ β τ µ + + + + + + + + · ) ( ) ( ) ( ) (
, com
¹
¹
¹
¹
¹
'
¹
·
·
·
·
n l
c k
b j
a i
, . .. , 2 , 1
, . .. , 2 , 1
, . .. , 2 , 1
, . .. , 2 , 1
(5.12)
Assumindo que A,B e C são fixados, a tabela resumo da análise de variância, incluindo
a esperança dos quadrados médios é dada abaixo.
Tabela 5.4 – Quadro da Anova (Modelo Fatorial com Três Fatores)
Fonte de
Variação
Soma de
Quadrados
Graus de
Liberdade
Quadrado
Médio
Esperança da Média
Quadrática
o
F
A
A
SQ
1 − a
A
QM
1
2
2

+

a
bcn
i
τ
σ
E
A
QM
QM
B
B
SQ 1 − b
B
QM
1
2
2

+

b
acn β
σ
E
B
QM
QM
C
C
SQ 1 − c
C
QM
1
2
2

+

c
abn
k
γ
σ
E
C
QM
QM
AB
AB
SQ
) 1 )( 1 ( − − b a
AB
QM
) 1 )( 1 (
) (
2
2
− −
+
∑∑
b a
cn
ij
τ β
σ
E
AB
QM
QM
AC
AC
SQ
) 1 )( 1 ( − − c a
AC
QM
) 1 )( 1 (
) (
2
2
− −
+
∑∑
c a
bn
ik
τ γ
σ
E
AC
QM
QM
BC
BC
SQ
) 1 )( 1 ( − − c b
BC
QM
) 1 )( 1 (
) (
2
2
− −
+
∑∑
c b
an
jk
βγ
σ
E
BC
QM
QM
ABC
ABC
SQ
) 1 )( 1 )( 1 ( − − − c b a
ABC
QM
) 1 )( 1 )( 1 (
) (
2
2
− − −
+
∑∑∑
c b a
n
ijk
τ βγ
σ
E
ABC
QM
QM
Erro
E
SQ ) 1 ( − n abc
E
QM
2
σ
Total
T
SQ
1 − abcn
A soma de quadrados total é encontrada da mesma forma anterior, sendo dada por
∑ ∑ ∑ ∑
· · · ·
− ·
a
i
b
j
c
k
n
l
ijkl T
abcn
y
y SQ
1 1 1 1
2
.... 2
(5.13)
As somas de quadrados dos efeitos principais são encontradas a partir dos totais dos
fatores A
) (
... i
y
, B
) (
.. . j
y
e C
) (
. .. k
y
como segue
42

·
− ·
a
i
i A
abcn
y
y
bcn
SQ
1
2
.... 2
...
1
(5.14)

·
− ·
b
j
j B
abcn
y
y
acn
SQ
1
2
.... 2
.. .
1
(5.15)

·
− ·
c
k
k C
abcn
y
y
abn
SQ
1
2
2
. ..
1
(5.16)
A soma de quadrados dos efeitos das interações, com dois fatores, é dada para cada par
como:
∑ ∑
· ·
− − − ·
a
i
b
j
B A ij AB
SQ SQ
abcn
y
y
cn
SQ
1 1
2
.... 2
..
1
(5.17)
∑ ∑
· ·
− − − ·
a
i
c
k
C A k i AC
SQ SQ
abcn
y
y
bn
SQ
1 1
2
.... 2
. .
1
(5.18)
∑ ∑
· ·
− − − ·
b
j
C B
c
k
jk BC
SQ SQ
abcn
y
y
an
SQ
1
2
....
1
2
. .
1
(5.19)
A soma de quadrados da interação de três fatores A, B e C é dada por:
BC AC AB C B A
a
i
b
j
c
k
ijk ABC
SQ SQ SQ SQ SQ SQ
abcn
y
y
n
SQ − − − − − − − ·
∑ ∑ ∑
· · ·
2
....
1 1 1
2
.
1

(5.20)
Por fim a soma de quadrados dos erros é obtida da seguinte forma:
]
]
]

− − ·
∑ ∑ ∑
· · ·
a
i
b
j
c
k
ijk T E
abcn
y
y
n
SQ SQ
1 1 1
2
.... 2
.
1
(5.21)
O procedimento de análise é semelhante aos modelos anteriores, comparando a
estatística 0
F
com a distribuição F tabela com os respectivos graus de liberdade.
5.3 – Aplicação do Software R na analise de dados para o Planejamento de
Experimentos Fatoriais .
Novamente, para ilustrarmos a aplicação desse modelo, utilizamos outro problema
proposto em Werkema & Aguiar, (1996) descrito abaixo:
43
Em uma indústria fabricante de equipamentos eletrônicos uma furadeira é utilizada para
furar as placas de circuito impresso produzidas. Com o objetivo de reduzir a
variabilidade do processo de furação, a equipe do controle de qualidade, decidiu
planejar um experimento para identificar os fatores responsáveis pela elevada
variabilidade. Foi decidido estudar dois fatores potencialmente influentes sobre a
variabilidade do processo: velocidade de rotação (Fator A) e diâmetro (Fator B) da
broca utilizada na furadeira. Foram escolhidos três níveis para cada fator:
16
1
,
12
1
e
8
1
polegadas para o diâmetro e 40, 60 e 80 rpm para a velocidade de rotação da broca.
Aqui foi decidido realizar um experimento fatorial com quatro réplicas. Como era muito
difícil medir diretamente a variação no diâmetro dos furos, foi decidido medi-la
indiretamente pela vibração que ocorria na placa que esta correlacionada com a
variação. Dessa forma, em trinta e seis placas de teste foram instalados acelerômetros
que permitiam medir a vibração nos eixos coordenados (X,Y,Z) das placas.
Deve-se salientar que a placa utilizada em cada ensaio foi escolhida ao acaso e a ordem
de realização dos ensaios também foi determinada aleatoriamente.
Os dados do Experimento estão ilustrados na tabela abaixo:
Tabela 5.5: Dados do Experimento Velocidade X Diâmetro da Broca

5.3.1 - Entrada de dados e análise descritiva usando o Software R.
Aqui a matriz de planejamento será montada da seguinte forma:
y<- scan() : Depois do comando o próximo passo é entrar com os dados da resposta.
Montando os Fatores:
d1<-factor(rep(1:3,each=12),labels=c("D1","D2","D3")) : Vetor que caracteriza os
diâmetros.
44
v1<-factor(rep(rep(1:3,each=4),3),labels=c("V1","V2","V3")) : Vetor que
caracteriza as velocidades. Dessa forma o data.frame será:
defca<-data.frame(resp=y, diam=d1,vel=v1)
> debca
resp diam vel
1 10.6 D1 V1
2 16.8 D1 V1
*
*
*
35 35.5 D3 V3
36 31.9 D3 V3
Da mesma forma utilizando o comando attach() e tapply(), a um resumo descritivo
considerando respectivamente:Média por velocidade, Média por Diâmetro e Média por
Velocidade X Diâmetro
> tapply(resp,vel,mean)

V1 V2 V3
16.14167 21.54167 23.55000
> tapply(resp,diam,mean)

D1 D2 D3
14.52500 20.10833 26.60000
> tapply(resp,list(vel,diam),mean)

D1 D2 D3
V1 14.425 12.975 21.025
V2 14.375 23.450 26.800
V3 14.775 23.900 31.975
Pelas descrições apresentadas acima, parece haver diferenças entre níveis de velocidade,
níveis de diâmetro e também diferenças entre as interações. Para confirmar tal indicação
procede-se a análise de variância.
5.3.2 - Análise de Variância, Comparações Múltiplas e Análise de Resíduos.
Os comandos para análise de variância do modelo fatorial são dados por:
> avdefca<-aov(resp~vel*diam)
> anova(avdefca)
Analysis of Variance Table
Response: resp
Df Sum Sq Mean Sq F value Pr(>F)
vel 2 352.31 176.15 31.9001 7.749e-08 ***
diam 2 876.48 438.24 79.3624 4.939e-12 ***
45
vel:diam 4 193.83 48.46 8.7753 0.0001129 ***
Residuals 27 149.10 5.52
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Por meio dos resultados no quadro da anova foi possível concluir que a velocidade, o
diâmetro da broca e também a interação entre estes dois fatores afetavam a vibração da
superfície das placas durante o processo de furação.Para auxiliar a interpretação de
como os fatores exercem seus efeitos sugerimos uma inspeção gráfica ilustrando as
médias por fatores e os gráficos de interação. A seqüência de comandos para se realizar
uma inspeção gráfica é descrita abaixo:
par(mfrow=c(2,2))
plot(diam,resp,xlab="Diâmetro",ylab="Vibração",col="blue")
plot(vel,resp,xlab="Velocidade",ylab="Vibração",col="blue")
interaction.plot(vel,diam,resp,trace.label=("Diâmetro"),xlab="Velocidade",ylab=
"Vibração Média",col="blue")
interaction.plot(diam,vel,resp,trace.label=("Velocidade"),xlab="Diâmetro",ylab=
"Vibração Média",col="blue")
Figura 5.3: Box-Plot para a vibração segundo os fatores Diâmetro e Velocidade e os
Gráficos de Interação entre os Fatores.
Pela Figura 5.3, constata-se o fato de que a interação era significativa, indicado pela
ausência de paralelismo entre as linhas. A partir da análise desta figura, é possível obter
uma indicação de que a vibração foi baixa para a broca D1 (1/16) em qualquer
velocidade de rotação e para a broca D2 (1/12), na velocidade de 40 rpm. Sabe-se que
quanto menores fossem o diâmetro e a velocidade de rotação, mais baixo era a taxa de
produção da furadeira e ainda que a taxa de produção era mais afetada pelas variações
de velocidade do que pelas variações no diâmetro da broca. Portanto para manter uma
taxa de produção satisfatória, a melhor condição de operação do processo parece ser
utilizar a broca D1 (1/16) com velocidade de rotação igual a 80 rpm.
46
Para confirmar os resultados acima procedemos a comparações múltiplas.
>TukeyHSD(avdefca)
Este comando gera todas as possíveis comparações múltiplas, no entanto como o efeito
das interações foi significativo, tem-se um interesse maior por estas comparações.
Assim
>TukeyHSD(avdefca,"vel:diam",ordered=T)
Este comando vai gerar todas as combinações para as interações, selecionando as
interações que de interesse tem-se:
$"vel:diam"
diff lwr upr
V1:D1-V2:D1 0.050 -5.5408860 5.640886
V3:D1-V2:D1 0.400 -5.1908860 5.990886
V3:D1-V1:D1 0.350 -5.2408860 5.940886
Podemos ver que o não existe diferença significativa entre os níveis de velocidade e o
nível do diâmetro em D1. Podemos confirmar, através do desdobramento da análise de
variância da interação que a interação no nível D1 não é significativa.
Vamos desdobrar os efeitos da velocidade em cada nível do diâmetro utilizando o
comando de efeito alinhado ( / ). O comando é ilustrado abaixo.
> av2f<-aov(resp~diam/vel)
> summary(av2f,split=list("diam:vel"=list(D1=1,D2=2,D3=3)))
Df Sum Sq Mean Sq F value Pr(>F)
diam 2 876.48 438.24 79.3624 4.939e-12 ***
diam:vel 6 546.14 91.02 16.4836 6.766e-08 ***
diam:vel: D1 1 0.13 0.13 0.0244 0.876915
diam:vel: D2 1 67.00 67.00 12.1333 0.001705 **
diam:vel: D3 1 0.24 0.24 0.0435 0.836422
Residuals 27 149.10 5.52
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Para este modelo deve-se construir para a análise de resíduos os gráficos de resíduos
contra ordem, gráfico de resíduos contra valores ajustados, gráfico de resíduos contra
fator velocidade, gráfico de resíduos contra fator diâmetro e gráfico de probabilidade
normal.
Da mesma forma, pode-se utilizar alguns testes para verificar as hipóteses de
independência, variância constante e normalidade dos dados. A seqüência dos
comandos para geração dos gráficos é dada por:
par(mfrow=c(3,2))
plot(ordem,avf$res,xlab="Ordem",ylab="Resíduos",col="blue")
plot(avf$fit,avf$res,xlab="Valores Ajustados",ylab="Resíduos",col="blue")
plot(vel,avf$res,xlab="Velocidade",ylab="Resíduos",col="blue")
47
plot(diam,avf$res,xlab="Diâmetro",ylab="Resíduos",col="blue")
qqnorm(avf$res,xlab="Quantil da Normal",ylab="Resíduos",col="blue")
qqline(avf$res)
Figura 5.4: Gráficos para Análise de Resíduo do modelo de Planejamento Fatorial.
Para o teste da Normalidade dos Resíduos temos:
> shapiro.test(avf$res)
Shapiro-Wilk normality test
data: avf$res
W = 0.9457, p-value = 0.07633
Para testar a homogeneidade das variâncias temos:
48
> bartlett.test(avf$res,vel)
Bartlett test of homogeneity of variances
data: avf$res and vel
Bartlett's K-squared = 0.7899, df = 2, p-value = 0.6737
> bartlett.test(avf$res,diam)
Bartlett test of homogeneity of variances
data: avf$res and diam
Bartlett's K-squared = 0.8408, df = 2, p-value = 0.6568
Como a suposições de normalidade e nem de variância constante foram rejeitadas,
pode-se considerar o modelo como válido e a análise encerrada.
5.4- Conclusões Finais
• Os efeitos da velocidade, broca e a interação broca X velocidade são
significativos;
• A vibração foi baixa para a broca D1 (1/16) em qualquer velocidade de
rotação;
• A melhor condição de funcionamento, considerando alto índice de
produção e baixa vibração é a combinação: broca D1 e velocidade de
rotação igual a 80 rpm.
• Todas as suposições foram testadas e nenhuma foi violada.
5.5- Exercícios do Capítulo
1- Um experimento envolve uma bateria usada no mecanismo de lançamento de
um míssil. Dois tipos de materiais podem ser usados para fazer as placas da
bateria. O objetivo é projetar uma que não seja relativamente afetada pela
temperatura ambiente. A resposta da saída da bateria é a vida efetiva em horas.
Dois níveis de temperatura são selecionados e um experimento fatorial com
quatro réplicas é corrido. Os dados são mostrados a seguir.
49
2- Um experimento foi utilizado para avaliar a adesão de tintas zarções para aviões.
Existem dois métodos de aplicação: imerção e aspersão, e três tipos de zarção.
Três corpos de prova foram pintados com cada zarção usando um dos métodos
de aplicação.Os dados dos experimentos estão mostrados na tabela abaixo.
• Identifique, atravêz da analise fatorial o melhor método e tipo de tinta
para melhorar a adesão da tinta.
3- Um experimento foi realizado para estudar o efeito do tipo do vidro e do tipo do
fósforo sobre o brilho de um tubo de televisão. A resposta media é a corrente
necessária (em microamps) para se obter determinado nível de brilho. Os dados
são mostrados abaixo. Analise-os e tire conclusões.
Capítulo 6 – Planejamento Hierarquico
Nos planejamentos experimentais, quando existe a presença de dois ou mais fatores a
forma como os fatores estão relacionados interfere na análise.
Quando o relacionamento é cruzado, ou seja, os níveis de um fator são identicos em
todos os níveis do outro fator a análise é realizada como nas formas descritas
anteriormente. No entanto, quando o relacionamento é hierárquico, ou seja, cada nível
de um fator está associado a um diferente conjunto de níveis do segundo fator, procede-
se aos experimentos hierárquicos.
50

A
1
B
1
B
2
A
2
B
1
B
2
A
3
B
1
B
2
Figura 6.1- Estrutura de um Experimento com Dois Fatores Cruzados
Figura 6.1- Estrutura de um Experimento com Fatores Hierárquicos
6.1- O modelo Estatístico
O modelo estatístico para o planejamento hierárquico com dois fatores fixos pode ser
dado por:
k ij i j i ijk
y
) ( ) (
ε β τ µ + + + ·
com
¹
¹
¹
'
¹
·
·
·
n k
b j
a i
, . . . , 2 , 1
, . . . , 2 , 1
, . . . , 2 , 1
(6.1)
onde
µ
: média global comum a todos os tratamentos.
i
τ
: efeito do i-ésimo nível do fator A.
) (i j
β
: efeito do j-ésimo nível do fator B aninhado sob o i-ésimo nível do fator A.
k ij ) (
ε
: componente do erro aleatório, onde
) , 0 ( ~
2
) (
σ ε N
k ij
Neste modelo existem
a
níveis para o fator A, b níveis para o fator B aninhados sob
cada nível de A e
n
réplicas. O índice
) (i j
indica que o j-ésimo nível do fator B está
aninhado sob o i-ésimo nível do fator A.
51

A
1
B
1
B
2
A
2
B
3
B
4
A
3
B
5
B
6
É importante destacar que não pode existir interação entre os fatores A e B em um
experimento hierárquico, já que cada nível do fator A está associado a um diferente
conjunto de níveis do fator B.
Nos planejamentos hierárquicos estaremos interessados em testar as seguintes
hipóteses:
• Ausência de efeitos do fator A:
0 ... :
2 1 0
· · · ·
a
H τ τ τ

0 :
1

i
H τ
para pelo menos um i . (6.2)
• Ausência de efeitos do fator B dentro de cada nível do fator A.
0 ... :
) ( ) ( 2 ) ( 1 0
· · · ·
i b i i
H β β β
, para todo i .

0 :
) ( 1

i j
H β
, para pelo menos uma combinação
) (i j
. (6.3)
Da mesma forma, o procedimento utilizado para testar as hipóteses acima consiste em
decompor a variabilidade total dos dados em parcelas de variabilidade devidas aos
efeitos do fator A, do fator B aninhado em A e do erro aleatório. É possível mostrar que
a soma de quadrados total,
SQT
, que é uma medida da variabilidade total das
observações, pode ser expressa por:
∑∑∑ ∑ ∑∑ ∑∑∑
· · · · · · · · ·
− + − + − · −
a
i
b
j
n
k
a
i
a
i
b
j
a
i
b
j
n
k
ij ijk i ij i ijk
y y y y n y y bn y y
1 1 1 1 1 1 1 1 1
2
.
2
.. .
2
... ..
2
...
) ( ) ( ) ( ) (

(6.4)
A equação (6.4) pode ser expressa simbolicamente por:
SQR A SQB SQA SQT + + · ) (
(6.5)
onde

·
− ·
a
i
i
y y bn SQA
1
2
... ..
) (
: soma de quadrados devida ao fator A.
∑∑
· ·
− ·
a
i
b
j
i ij
y y n A SQB
1 1
2
.. .
) ( ) (
: soma de quadrados devida ao fator B sob os níveis de
A.
∑∑∑
· · ·
− ·
a
i
b
j
n
k
ij ijk
y y SQR
1 1 1
2
.
) (
: soma de quadrados residual.
O quadro geral da anova para o modelo hierárquico é descrito abaixo:
52

Tabela 6.1- Quadro da ANOVA
Fonte de
Variação
SQ GL QM
o
F
Fator A
A
SQ 1 − a
1 −
·
a
SQ
QM
A
A
E
Trat
QM
QM
Fator B(A)
) ( A B
SQ ) 1 ( − b a
) 1 (
) (
) (

·
b a
SQ
QM
A B
A B
E
Blo
QM
QM
cos
Erros
E
SQ
) 1 ( − n ab
) 1 ( −
·
n ab
SQ
QM
E
E
Total
SQT
1 − abn
O procedimento de análise é semelhante aos modelos anteriores, comparando a
estatística 0
F
com a distribuição F tabela com os respectivos graus de liberdade.
6.2 Análise de resíduo e comparações múltiplas.
Os resíduos de um experimento hierárquico com dois fatores são definidos por
.
ˆ
ij ijk ijk ijk ijk
y y y y − · − · ε
(6.6)
Aqui os gráficos utilizados aqui são: Gráfico da probabilidade normal, Gráfico de
resíduos X níveis do fator A, Gráfico de resíduos X valores preditos ijk

e Gráfico de
resíduos X Ordem de coleta. Buscando checar as suposições de normalidade, variação
constante e suposição de independência dos resíduos.
Se forem observadas evidências de fortes violações na suposição do modelo, esse deve
ser invalidado ou deve-se proceder a transformações dos dados originais (ver
Montgomery, 2001).
Aqui o teste Tukey também é utilizado para comparações múltiplas.
6.3 – Aplicação do Software R na analise de dados para o Planejamento
Hierárquico.
Novamente, para ilustrarmos a aplicação desse modelo, utilizamos outro problema
proposto em Werkema & Aguiar, (1996) descrito abaixo:
Considere uma indústria de autopeças que produz um determinado tipo de peça
empregando quatro máquinas de marcas diferentes, sendo cada máquina controlada por
dois diferentes operadores em sistema de rodízio. A principal característica de qualidade
das peças fabricadas é o seu diâmetro, que deve satisfazer à especificação 30,83±0,16.
O processo de produção vinha apresentando uma elevada variabilidade e,
conseqüentemente, não vinha sendo capaz de atender as especificações (Montgomery,
53
Máquina 1 Ordem* 2 Ordem*
30,66 23 30,85 5
1 30,78 15 31 22
30,82 6 30,87 10
30,97 16 30,67 18
2 30,97 13 30,75 12
30,95 2 30,81 8
31,03 14 30,76 21
3 31,01 1 30,69 3
30,93 19 30,69 11
30,77 20 31,03 24
4 30,69 17 31,09 4
30,71 9 30,89 7
* Ordem de Coleta
Operador
2004). A equipe técnica responsável pelo processo suspeitava que a variabilidade no
diâmetro das peças pudesse estar sendo provocada, principalmente por diferenças entre
as máquinas. Para avaliar essa suspeita, a equipe decidiu realizar um experimento onde
foram medidos os diâmetros de três peças produzidas por cada operador de cada uma
das máquinas. Os dados do experimento foram coletados em ordem aleatória e estão
ilustrados na Tabela abaixo:
Os dados do Experimento estão ilustrados na Tabela abaixo:
Tabela 6.2 : Dados do Experimento Maquina X Operador.



6.3.1 - Entrada de dados e análise descritiva usando o Software R.
Aqui a matriz de planejamento será montada da seguinte forma:
Repostas:
y<- scan() : Depois do comando o próximo passo é entrar com os dados da resposta.
oh<scan(): vetor ordem de realização dos ensaios.
Montando os Fatores
> m<-factor(rep(1:4,each=6),labels=c("M1","M2","M3","M4")) : vetor associado
as máquinas.
> o<-factor(rep(rep(1:2,each=3),4),labels=c("O1","O2")) : vetor associado aos
operadores.
Montando o data.frame
> dh<-data.frame(resp=y,maq=m,op=o)
Assim, a disposição dos dados fica da forma:
resp maq op
1 30.66 M1 O1
54
2 30.78 M1 O1
*
*
*
24 30.89 M4 O2
Da mesma forma para a descrição dos dados, temos:
> attach(dh)
> tapply(resp,maq,summary)
Resumo por Máquina
$M1
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.66 30.79 30.84 30.83 30.87 31.00
$M2
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.67 30.77 30.88 30.85 30.97 30.97
$M3
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.69 30.71 30.85 30.85 30.99 31.03
$M4
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.69 30.73 30.83 30.86 31.00 31.09
Resumo descritivo por operador
> tapply(resp,op,summary)
$O1
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.66 30.76 30.88 30.86 30.97 31.03
$O2
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.67 30.74 30.83 30.84 30.92 31.09
55
Figura 12 – Média por Máquina e por Operadores
Como nesse planejamento o efeito é hieráquico, não devemos analisar a diferença entre
operadores somente em dois níveis, pois o que ocorre na verdade é que são duplas
diferentes de operadores para cada máquina.
6.3.2 - Análise de Variância, Comparações Múltiplas e Análise de Resíduos.
> dh.av<-aov(resp~maq/op,data=dh)
> anova(dh.av)
Analysis of Variance Table
Response: resp
Df Sum Sq Mean Sq F value Pr(>F)
maq 3 0.00355 0.00118 0.2676 0.8478
maq:op 4 0.34028 0.08507 19.2613 5.829e-06 ***
Residuals 16 0.07067 0.00442
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Pelos resultados no quadro da anova acima, é possível concluir que as máquina não
exercem um efeito significativo sobre o diâmetro das peças, no entanto para cada
máquina, os diâmetros das peças produzidas pelos dois operadores diferiam de modo
significativo.
Para evidenciar os resultados acima, procede-se a comparações múltiplas.
> TukeyHSD(dh.av,ordered=T)
Tukey multiple comparisons of means
95% family-wise confidence level
factor levels have been ordered
Fit: aov(formula = resp ~ maq/op, data = dh)
$maq
diff lwr upr
M3-M1 0.021666667 -0.08810937 0.1314427
M2-M1 0.023333333 -0.08644270 0.1331094
M4-M1 0.033333333 -0.07644270 0.1431094
M2-M3 0.001666667 -0.10810937 0.1114427
M4-M3 0.011666667 -0.09810937 0.1214427
M4-M2 0.010000000 -0.09977604 0.1197760
56
$"maq:op"
diff lwr upr
M4:O1-M3:O2 0.01000000 -0.177865767 0.1978658
M2:O2-M3:O2 0.03000000 -0.157865767 0.2178658
M1:O1-M3:O2 0.04000000 -0.147865767 0.2278658
M1:O2-M3:O2 0.19333333 0.005467567 0.3811991
M2:O1-M3:O2 0.25000000 0.062134233 0.4378658
M3:O1-M3:O2 0.27666667 0.088800900 0.4645324
M4:O2-M3:O2 0.29000000 0.102134233 0.4778658
M2:O2-M4:O1 0.02000000 -0.167865767 0.2078658
M1:O1-M4:O1 0.03000000 -0.157865767 0.2178658
M1:O2-M4:O1 0.18333333 -0.004532433 0.3711991
M2:O1-M4:O1 0.24000000 0.052134233 0.4278658
M3:O1-M4:O1 0.26666667 0.078800900 0.4545324
M4:O2-M4:O1 0.28000000 0.092134233 0.4678658
M1:O1-M2:O2 0.01000000 -0.177865767 0.1978658
M1:O2-M2:O2 0.16333333 -0.024532433 0.3511991
M2:O1-M2:O2 0.22000000 0.032134233 0.4078658
M3:O1-M2:O2 0.24666667 0.058800900 0.4345324
M4:O2-M2:O2 0.26000000 0.072134233 0.4478658
M1:O2-M1:O1 0.15333333 -0.034532433 0.3411991
M2:O1-M1:O1 0.21000000 0.022134233 0.3978658
M3:O1-M1:O1 0.23666667 0.048800900 0.4245324
M4:O2-M1:O1 0.25000000 0.062134233 0.4378658
M2:O1-M1:O2 0.05666667 -0.131199100 0.2445324
M3:O1-M1:O2 0.08333333 -0.104532433 0.2711991
M4:O2-M1:O2 0.09666667 -0.091199100 0.2845324
M3:O1-M2:O1 0.02666667 -0.161199100 0.2145324
M4:O2-M2:O1 0.04000000 -0.147865767 0.2278658
M4:O2-M3:O1 0.01333333 -0.174532433 0.2011991
Pelo quadro acima, verifica-se que as máquinas não exercem efeitos significativos e
que operadores nas máquinas diferem quanto aos diâmetros produzidos (negrito). Um
estudo descritivo pode nós auxiliar, apontandos as principais diferenças ocorridas.
> tapply(resp,list(maq,op),mean)
O1 O2
M1 30.75333 30.90667
M2 30.96333 30.74333
M3 30.99000 30.71333
M4 30.72333 31.00333
Ordenando essa matriz, percebe-se dois grupos de trabalhadores operando de maneiras
distintas

(M3O2) 30.71333 (M1O2) 30.90667
(M4O1) 30.72333 (M2O1) 30.96333
(M2O2) 30.74333 (M3O2) 30.99000
(M1O1) 30.75333 (M4O2) 31.00333
57
O primeiro grupo, três primeiros, trabalhando muito próximos do limite inferior e os
três ultimos muito próximos do limite superior. De posse dessa informações recomenda-
se instituir uma programa de treinamento e padronização de procedimentos.
Para a análise de resíduos temos a seguinte seqüência de comandos:
>g1<-tapply(resp,list(maquina:operador),mean)
>sort(g1)
Maq3:Op2 Maq4:Op1 Maq2:Op2 Maq1:Op1 Maq1:Op2 Maq2:Op1 Maq3:Op1 Maq4:Op2
30.71333 30.72333 30.74333 30.75333 30.90667 30.96333 30.99000 31.00333
>barplot(sort(g1),ylim=c(30.70,31.01))
> par(mfrow=c(2,2))
> plot(oh,dh.av$res,xlab="Ordem",ylab="Resíduos",col="blue")
>plot(dh.av$fit,dh.av$res,xlab="Valores Ajustados",ylab="Resíduos",col="blue")
> plot(maq,dh.av$res,xlab="Máquina",ylab="Resíduos",col="blue")
> qqnorm(dh.av$res,xlab="Quantil da Normal",ylab="Resíduos",col="blue")
> qqline(dh.av$res)
58
Figura 12: Gráficos para Análise de Resíduo do modelo de Planejamento Hierárquico.
Para o teste da Normalidade dos Resíduos temos:
> shapiro.test(dh.av$res)
Shapiro-Wilk normality test
data: dh.av$res
W = 0.9811, p-value = 0.9153
> bartlett.test(dh.av$res,maq)
Bartlett test of homogeneity of variances
data: dh.av$res and maq
Bartlett's K-squared = 2.2514, df = 3, p-value = 0.5219
Como a suposições de normalidade e nem de variância constante foram rejeitadas,
pode-se considerar o modelo como válido e a análise encerrada.
6.4- Conclusões Finais
• As máquinas não exercem um efeito significativo sobre o diâmetro das peças;
• Para cada máquina os diâmetros produzidos pelos operadores diferiam;
• Foi identificado padrões diferentes de produção entre os operadores, sugerindo
um programa de capacitação;
• As suposições do modelo não foram violadas.
59
6.5- Exercícios do Capítulo:
1. Para comparar o grau de alfabetização dos alunos de diferentes professores de
diferentes escolas, um pesquisador sorteou três escolas da mesma região
administrativa e, dentro de cada escola, sorteou quatro professores que
ensinavam a ler e a escrever. Depois, sorteou cinco alunos de cada professor.
Submeteu então todos os alunos à mesma prova. As notas dos alunos, nessa
prova, estão apresentadas na Tabela abaixo. Faça a análise de variância para este
caso.
2. Uma retífica de motores deseja investigar o motivo do grande tempo gasto para
a realização do serviço de retífica do motor tipo A. A empresa possuia três
máquinas diferentes que faziam o trabalho de retífica e que cada máquina era
controlada por dois operadores fixos. A equipe técnica da empresa estava
considerando que a causa para o elevado tempo de retífica poderia ser diferenças
entre máquinas e/ou diferenças entre operadores. O experimento foi conduzido
de tal forma que cada operador ficou responsável pela retífica de 6 peças,
utilizando a máquina que usualmente operava. Os tempos gastos para a
conclusão da retífica são mostrados abaixo:
60
Faça a análise de variância e discuta a causa para o elevado tempo de retífica.
7-Bibliográfia Utilizada
NETO, B. B.; SCARMINIO, I.S. ; BRUNS, R.E.Como Fazer Experimentos: Pesquisa e
desenvolvimento na ciência e na industria. Campinas, SP, Editora da Unicamp, 2001.
MONTGOMERY, D.C.Desing and analysis of experiments, 5th edition. New York,
Willey,2001.
MONTGOMERY, D.C.Introdução ao Controle Estatístico de Qualidade, 4º edição. Rio
de Janeiro,RJ, LTC, 2004.
VENABLES, W.N. ; SMITH, D. M. An Introduction to R: Notes on R: A programing
Environment for data analysis and grafics, site http://www.r-project.org.
VIERA,SONIA. Estatística Experimental, 2º edição. São Paulo-SP,Atlas,1999.
WERKEMA, M.C.C. ; AGUIAR, S.; Planejamento e Análise de Experimentos: como
identificar as principais variáveis influentes em um processo. Belo Horizonte, MG,
Série Ferramentas da Qualidade, Fundação Cristiano Ottoni, Escola de Engenharia da
UFMG,1996.
61