<T2 conhecida T2 desconhecida H): <T2 H): H( <Po > <TÕ p

<

2

<Xo 2

Estatísticae,fZal2 I.l.o Gráfico dos --Za I.l.o IJ- 2 H):p""po < Zas/"Iht Parâmetroh dCurvaCO <T/"Iht k, Xa/2,n-1 m,n -ta,n-) 2=zo> -ta,n-) Zo Alternativa Apêndice<T/<To Resumo dosHo: <T2 =H):Nula<""c,dddenpo de Hipóteses para Uma Amostra ProcedimentosIZol""<I.l.o I.l.)/<T (I.l.o c, l.l.ol/<T CritériosI= ---- - de Ho:HipóteseddIJ-oIZol II.l.Za/2 1J-01/<T H'o: I.l. H):Po2>= (IJ-oIJ-oI.l.o)/<T Ho: P I.l. H):[tolI.l. (IJ-xVITestes <TÕzo> >-- -Za l)s2 IJ-o<T2 >x(n <TÕ Teste Zo IJ-o i,j to>À g, I.l.o)/<T ou Xo to(I.l. ta/2,n-1 > a,b II.l. H):dH):p>po -ZaI.l.)/<T I.l.Rejeição IJ-< "" para X)-a/2,n-) Ynpo(l - Po) Curva CO

= == = =

Resumo dos Procedimentos

para Intervalo de Confiança para Uma Amostra x s2 x p Estimativa Intervalo Bilateral de Confiança de 100(1 - a)% x - Zaf20"/v/;z :S
JJ.

a 0"2desconhecida ção binomial p 3.

Média JJ., deou Tipodistribuição uma normal Variância 0"2de uma distribuição Média JJ. com parâmetro 0"2conhecida com variância de Pontual normal Proporção uma de Problema

:S x :S x

+ +

Zaf20"/v/;z taf2.n -1 s/v/;z

x - taf2.n _ I s/v/;z :S

JJ.

(112- l)s2 :S 0"2:s ~ - l)s2 Xa/2,n- I X j-af2,n-j

p - Zaf2· Jp(l 11 fi) :S P :S P A

A

+

Zaf2

Jfi(l - p)

Estatística Aplicada e Probabilidade para Engenheiros .

Se. Praf. Adjunto . Runger Arizona State University Tradução: Profa. Montgomery Arizona State University George C.Departamento de Engenharia Química Escola de Química/UFR] LTC EDITORA . D.Estatística Aplicada e Probabilidade para Engenheiros Segunda Edição Douglas C. Verôniea Calado.

A. Authorized translation from the English language edition published by John Wiley & Sons. 11 Rio de Janeiro. dispondo-se a possíveis acertos posteriores caso.1tceditora. 2nd edition Copyright © 1999 John Wiley & Sons.Livros Técnicos e Científicos Editora S. All rights reserved. Travessa do Ouvidor.com.: 21-3970-9480 Fax: 21-2221-3202 Itc@ltceditora.com.br www. os autores e os editores envidaram o máximo esforço para localizar os detentores dos direitos au~orais de qualquer material utilizado. a identificação de algum deles tenha sido omitida.CEP 20040-040 Tel. Direitos exclusivos para a língua portuguesa Copyright © 2003 by LTC . inadvertidamente. RJ .No interesse de difusão da cultura e do conhecimento. Jnc. U Vooo 3&973 LJ Applied Statistics and Probability for Engineers.br . Jnc.

Para: Meredith. Colin e Cheryl Taylor. Elisa e Rebecca . George. Neil.

embora tenhamos fornecido material suficiente para dois cursos. 3.) controle e os fundamentos no controle estatístico de processo. O Capo 14 fornece uma breve introdução aos métodos e aplicações de estatística não paramétrica. O Capo 15 introduz o leitor no controle estatístico da qualidade. elegemos focalizar o público voltado para engenharia. é a única do na primeira edição. que tenham completado um ou dois seme_stresde cálculo. 10 e 11 apresentam a regressão linear simples e ORGANIZAÇÃO DO LIVRO múltipla. 11). os diagramas de caixa e vários tipos de gráficos de séries temporais. 12 e 13 lidam com experimentos com um único fator reescrevendo grandes porções de vários capítulos. porque. sendo também aqueles que melhoram os sistemas existentes. Estes tópicos serão discutidos em mais detalhes nos capítulos subseqüentes. Trabalhamos arduamente de modo a assegurar que todos os nossos exemplos e exercícios estivessem baseados em engenharia e. Introduzimos também o bootstrap como uma técnica para encontrar o erro-padrão de uma estimativa.Prefácio A indústria americana* tem de continuar a melhorar a qualidade de seus produtos e serviços se quiser continuar a competir efetivamente nos mercados interno e externo. rias nesta edição. por causa de outras necessidades. Os Caps. Este é um livro introdutório para um primeiro curso em estatística aplicada e probabilidade para estudantes de graduação em engenharia e ciências físicas ou químicas. Enfatizam-se as noções O Capo 1 é uma introdução ao campo da estatística e como de aleatoriedade. Percebemos que os estudantes de engenhamaneira fácil de entender os conceitos apresentados. blocagem. Usamos álgebra matricial em todo o material de regresMantivemos o nível relativamente modesto de matemática. os 'engenheiros usam a metodologia estatística como parte do análise gráfica dos dados e planejamentos fatoriais fracionários. distribuições amostrais e o teorema central do limite.são múltipla (Cap.R. Acreditamos que este livro também sirva como uma referência útil. Apresenria. Enquanto muitos dos métodos que apresentamos são fundamentais para análise estatística em outras disciplinas. Os Caps. Damos um desenvolvimento lógico e heurístico dos procedimentos. não tações de aritmética escalar para regressão múltipla são. incluindo a reorganização de algum material e Os Caps. Os Caps. em quase todos os casos. . na esperança de que mais estudantes de engenharia vejam as aplicações importantes de estatística em seus trabalhos diários e façam um segundo curso. distribuições conjuntas de probabilidade e de independência. o planejamento de experimentos em engenharia e o monitoramento de processos de fabricação. bem francamente. muitos engenheiros fazem apenas um curso de estatística. variáveis aleatórias contínuas e discretas. Métodos estatísticos são uma importante ferramenta nessas atividades. porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e processos dé fabricação. O material foi extensivamente reescrito e reorganizado. o método da máxima verossimilhança. em vez de um desenvolvimento teórico formal.tomados de fonte publicada ou baseados em nossas experiências como consultores. Este capítulo introduz também os conceitos de amostragem aleatória. Teste de hipóteses e intervalos de confiança para médias. Escrevemos este livro de modo que ele pudesse ser usado para um único curso. O Capo 7 começa o tratamento da inferência estatística com estimação de parâmetros. Acreditamos que os engenheiros de todas as áreas deveriam cursar estatística. e com múltiplos fatores respectivamente. mas um entendimento da me. como de resto para todos os países de economia aberta. porém evitamos muitos dos detalhes matemáticos ou mais teóricos.graduação em engenharia estão expostos à bastante álgebra todologia e como aplicá-la. 5 e 6 cobrem os conceitos básicos de probabilidade. juntamente com informações detalhadas e exemplos de métodos para determinar os tamanhos apropriados das amostras. incluindo a construção de modelos empíricos. 4. Infelizmente. porque eles provêem os engenheiros com métodos descritivos e analíticos para lidar com a variabilidade nos dados observados. (N. Demos um tratamento razoavelmente completo desses tópicos. . algumas das importantes propriedades dos estimadores. enfatizando as cartas de *Isto va'le não só para os EUA. valores esperados. E nossa intenção dar lhor das hipóteses. Uma porção significante desse esforço de melhoria da qualidade será comandada por engenheiros e cientistas. Acreditamos que essa abordagem servirá melhor aos estudantes de engenharia e os permitirá concentrar-se nas muitas aplicações de estatística nessas disciplinas. interações. tais como negócios ou gestão. Fizemos um certo número de melhomatricial para entender a apresentação deste material. O Capo 2 continua a apresentação da descrição de dados e foca os diagramas de ramo e folhas. as ciências da vida e as ciências sociais. os histogramas. processo de solucionar problemas de engenharia. Queremos que os estudantes se tornem familiarizados com o modo como essas técnicas são usadas para resolver problemas de engenharia do mundo real e conseguir algum entendimento dos conceitos por trás deles. Este capítulo introduz também o leitor em algumas aplicações de estatística em engenharia. usamos exemplos de dados reais . usa. na meterão dificuldade em ler quase todo o texto. inconvenientes e notamos que os alunos de ao leitor não a teoria matemática. planejamentos fatoriais. Discutimos e ilustramos métodos simples para resumir e descrever dados. variâncias e proporções são apresentados. 8 e 9 discutem a inferência estatística para uma única amostra e para duas amostras respectivamente.

Vamos enfatizar que a finalidade deste curso é introduzir os engenheiros no modo como a estatística pode ser usada para resolver problemas de engenharia do mundo real e não para afugentar os estudantes menos agraciados matematicamente. Douglas C. que enfatizam o material daquela seção. introduzimos os modelos de regressão do Capo 10 (quatro aulas). e exercícios para expandir a mente. Montgomery George C. DESIGN-EASE. Prentice Hall. Acreditamos que um primeiro curso de estatística para engenheiros deveria ser principalmente um curso de estatística aplicada e não um curso de probabilidade. Esse material inclui uma introdução a funções geradoras de momentos. então é possível cobrir o livro inteiro. regressão múltipla e mais planejamento de experimentos seriam os tópicos mais importantes em um segundo curso. discutimos a maior parte dos Caps. damos uma introdução ao planejamento de experimentos dos Caps. se apropriado para os estudantes. engenheiros usam computadores para aplicar métodos estatísticos com a finalidade de resolver problemas. incluindo exercícios de final de seção. Cada capítulo tem uma coleção extensiva de exercícios. a permutações e métodos de contagem. fornecemos também algum material técnico complementar nos Apêndices. à mudança de técnicas de variáveis. Obviamente. tão logo ela seja discutida em classe. Se houver disponibilidade de um segundo semestre. há problemas que sentimos que deveriam ser trabalhados usando pacote no computador. Em nossas próprias aulas. explicaremos porém como usamos o livro. versões para estudantes. que freqüentemente requerem que o estudante estenda de algum modo o material texto ou o aplique em uma nova situação. Marcamos esses problemas com um símbolo especial na margem. Runger . porque a forma como o professor integra o pacote em sala de aula é muito mais importante do que qual pacote é usado. Em alguns capítulos. Todos os dados no texto estão disponíveis na forma eletrônica. tais como EXCEL. Muitos professores que usaram a primeira edição forneceram excelentes sugestões que incorporamos nesta revisão. a baixo custo. revisamos o material de probabilidade. assim como as habilidades de diferentes grupos de estudantes. que cobrem o escopo dos tópicos do capírulo. usamos não somente esses pacotes como outros. colocando mais ênfase na distribuição normal (seis a oito aulas). Percebemos que isso melhorou grande mente o andamento do curso e o entendimento do material por parte do estudante. 12 e 13 (seis aulas) e apresentamos os conceitos básicos de controle estatístico de processo. para quase todas as aulas. Não saturamos o livro com exemplos de muitos pacotes diferentes. e mostramos como a técnica é implementada no computador. Esse material pode ser de interesse para alguns professores e estudanres e o temos fornecido como uma referência. Conseqüentemente. Somos também gratos ao DI. Para ensinar. 8 e 9 sobre intervalos de confiança e testes (dez aulas). à estimação de Bayes e ao princípio da ra:ão de verossimilhança. Somos gratos também a John Wiley and Sons. o Instirute of Mathematical Statistics e os editores da Biometrics por nos permitirem usar o material com direitos autorais. incluindo as cartas de controle Shewart do Capo 15 (seis aulas). USANDO O COMPUTADOR Na prática. Seria possível também AGRADECIMENTOS Gostaríamos de expressar nossa gratidão a muitas organizações e indivíduos que contribuíram para este livro. JMP e SPSS. exercícios suplementares no fim do capítulo. porque as idéias dos professores variam muito acerca do que deveria estar em um primeiro curso de estatística para engenheiros. ST ATGRAPHICS. recomendamos fortemente que o computador seja integrado na aula. Este não é um curso "infantil de matemática-estatística". Logo. Muitos pacotes estatísticos oferecem. levamos um notebook PC e um mostrador de cristal líquido. Smiley Cheng pela permissão para adaptar muitas das tabelas estatísticas de seu excelente livro (com Dr. apresentamos saídas do Minitab e SAS como exemplos típicos do que pode ser feito com pacotes estatísticos modernos. Em nosso curso de um semestre. Isso nos deixa cerca de três a quatro períodos para exames e revisão. James Fu).nii PREFÁCIO Em adição à coleção usual de tabelas e gráficos estatísticos. que é tão freqüentemente dado a engenheiros. USANDO O LIVRO Este é um livro-texto muito flexível. incluindo algum material dos apêndices. Statistical Tables for Classroom and Exam Roam. hesitamos em dar um número demasiado de conselhos. designar e trabalhar. que podem comprar sua própria cópia ou usar os produtos disponíveis nas redes locais de computadores. na aula. cobrimos todo o Capo 1 e o 2 (em três ou quatro aulas). ao desenvolvimento das distribuições t e F. Através de todo o livro. muitos dos problemas propostos para reforçar o entendimento dos conceitos.

2 Distribuição Gama 94 5.3 Regras de Adição 37 3.7.8 Distribuição Hipergeométrica 65 4.2.1 Distribuição Geométrica 62 4.7 5.2 Distribuições de Probabilidades Marginais 99 .1.3 Funções de Distribuição Cumulativa 4.11 Distribuição de Weibull 95 Exercícios Suplementares 96 Exercícios para Expandir a Mente 97 CAPÍTULO 6 5.1 Introdução 27 3.7.1 Importância do Sumário e Apresentação de Dados 14 2.10.Sumário CAPÍTULO 1 o Papel da Estatística 1 CAPÍTULO 4 na Engenharia Variáveis Aleatórias Discretas e Distribuições de Probabilidades 51 1.3 Eventos 29 3.1.2 Distribuições de Probabilidades e Funções de Probabilidade 52 4.1 Duas Variáveis Aleatórias Discretas 98 6.5.4 Planejando Investigações Experimentais 8 1.1 Variáveis Aleatórias Contínuas Probabilidade 27 27 5.10.2 Axiomas de Probabilidade 35 3.2 Regra da Probabilidade Total 42 3.1.3 Funções de Distribuição Cumulativa 76 5.3 Distribuições de Freqüência e Histogramas 18 2.7 T eorema de Bayes 47 3.1.9 Distribuição de Poisson 68 Exercícios Suplementares 71 Exercícios para Expandir a Mente 62 n CAPÍTULO 5 Variáveis Aleatórias Contínuas e Distribuições de Probabilidade 73 73 5.2 Diagramas de Ramo e Folhas 14 2.4 Média e Variância de uma Variável Aleatória Discreta 55 54 Sumário e Apresentação de Dados 14 2.2 Julgamento Estatístico 5 1.2 EspaçosAmostrais 28 3.2 Interpretações de Probabilidade 33 3.6 Independência 44 3.1 Distribuições de Probabilidades Conjuntas 98 6.3 Modelos Mecanísticos e Empíricos 7 1.2 Distribuições de Probabilidades e Funções Densidade de Probabilidade 73 5.1.5 Distribuição Uniforme Discreta 57 4.4 Probabilidade Condicional 39 3.5 Gráficos Seqüenciais de Tempo 22 Exercícios Suplementares 24 Exercícios para Expandir a Mente 26 CAPÍTULO 3 4.7 Distribuições Geométrica e Binomial Negativa 4.1.6 5.2.5 5.1 Introdução 33 3.9 Distribuição Exponencial 89 5.1.4 Média e Variância de uma Variável Aleatória Contínua 77 Distribuição Uniforme Contínua 78 Distribuição Normal 79 Gráficos de Probabilidade 85 Aproximações das Distribuições Binomial e de Poisson pela Normal 87 5.8 3.8 Variáveis Aleatórias 48 Exercícios Suplementares 49 Exercícios para Expandir a Mente 50 Distribuições de Probabilidades Conjuntas 98 6.2 Distribuição Binomial Negativa 63 4.1 Espaços Amostrais e Eventos 3.1 O Método de Engenharia e o Julgamento Estatístico 1 1.1 Variáveis Aleatórias Discretas 51 4.1 Regra da Multiplicação 42 3.2 Coletando Dados de Engenharia 6 1.1 Engenharia e Resolução de Problemas 1.5.1 Distribuição de Erlang 93 5.5 Observando Processos ao Longo do Tempo 10 Exercícios Suplementares 13 Exercícios para Expandir a Mente 13 CAPÍTULO 2 4.5 Regras da Multiplicação e da Probabilidade Total 42 3.10 Distribuições de Erlang e Gama 93 5.4 Diagrama de Caixa (Box Plot) 20 2.6 Distribuição Binomial 58 4.

3.5.3 O Erro Tipo II e a Escolha do Tamanho da Amostra 150 8.3 Inferência sobre a Diferença nas Médias de Duas Distribuições Normais com Variações Desconhecidas 185 9.2 Inferência sobre a Média de uma População com Variância Conhecida 149 8.3.3 Solução Computacional 159 8.4.6 Intervalo de Confiança para a Média 153 8.2 Erro [3 e Escolha do Tamanho da Amostra 164 8.4.2.2.3.5 Inferências sobre as Variâncias de Duas Populações Normais 195 9.6 Tabela com Resumo dos Procedimentos de Inferência sobre uma Única Amostra 169 8.1 Inferência Estatística 126 7.7 Testando a Adequação do Ajuste 8.3.1 Testes de Hipótesespara a Razãode DuasVariâncias 195 9.3 Duas Variáveis Aleatórias Contínuas 107 6.2.2. com Variâncias Desconhecidas 185 9.3.3 8.1.1.2 Erro ~ e Escolha do Tamanho da Amostra 197 9.5 Alguns Comemários Práticos sobre Testes de Hipóteses 152 8.2.2.2 Amostragem Aleatória 127 7.4 Inferência Estatística para uma Única Amostra 142 8.3.6 Distribuições Amostrais das Médias 136 7.2 Distribuição Multinomial de Probabilidades 105 6.1 Testes de Hipóteses para uma Diferença nas Médias com Variâncias Conhecidas 180 9.1 Testes de Hipóteses para a Média 157 8.5.3.1 EstimadoresNão Tendenciosos 128 7.5 Intervalo de Confiança na Média 161 8.1 Testes de Hipóteses para a Diferença nas Médias.8 Intervalos de Confiança Bootstrap 155 Intervalo de Confiança para uma Diferença nas Médias com Variâncias Conhecid~s 182 9.4 Solução Computacional 189 9 .4 Estimativa Bootstrap do Erro·Padrão 130 7.1 Distribuições de Probabilidades Conjumas 104 6.4 Teste para Amostras Grandes 152 8.2 Inferência sobre uma Diferença nas Médias com Variâncias Conhecidas 179 9.3 Distribuições de Probabilidades Condicionais 109 6.5.5 Erro Médio Quadrático de um Estimador 131 7.7 Combinações Lineares de Variáveis Aleatórias 120 6.1.2 Escolha do Tamanho da Amostra 187 Intervalo de Confiança para a Diferença nas Médias 187 9.3 Intervalo de Confiança para a Razão de Duas Variâncias 197 9.2.4 Independência 111 6.2 Valor p para um Teste t 159 8.1 Hipóteses Estatísticas 142 8.2.6 Distribuição Normal Bidimensional 118 6.1 Testes de Hipóteses para a Média 149 8.5.1 Distribuições de Probabilidades Conjuntas 107 6.1 Teste de Hipóteses 142 8.8 Testes da Tabela de Contingência Exercícios Suplementares 174 Exercícios para Expandir a Mente 177 CAPíTULO 9 169 172 Erro·Padrão: Reportando uma Estimativa 130 7.6 Inferência sobre Proporções de Duas Populações 198 9.4 Método da Máxima Verossimilhança 132 7.4 Múltiplas Variáveis Aleatórias Contínuas 113 6.3 Inferência sobre a Média de uma População com Variância Desconhecida 157 8.4 Inferência sobre a Variância de uma População Normal 163 8.4 CAPíTULO 7 Estimação de Parâmetros 126 7.2.2.2.2 Variância de um Estimador 129 7.3 Intervalo de Confiança para uma Proporção Binomial 167 8.5.7 Introdução a Intervalos de Confiança 139 Exercícios Suplementares 140 Exercícios para Expandir a Mente 140 CAPíTULO 8 Inferência Estatística para Duas Amostras 179 9.2 Distribuições de Probabilidades Marginais 108 6.4 Teste t Emparelhado 191 9.1.2.3.3.1 Testes de Hipóteses para a Variância de uma População Normal 163 8.3.7 Método Geral para Deduzir um Intervalo de Confiança 155 8.3.3.2 Valores p nos Testes de Hipóteses 150 8.5 Inferência sobre a Proporção de uma População 166 8.2 Testes de Hipóteses Estatísticas 143 8.3.1 Testes de Hipóteses para uma Proporção Binomial 166 8.5 Distribuições Amostrais 136 7.2.5.2.4 Procedimento Geral para Testes de Hipóteses 148 8.2 Escolha do Tamanho da Amostra 181 9.4 Escolha do Tamanho da Amostra 160 8.3 6.2 Erro Tipo II e Escolha do Tamanho da Amostra 166 8.2 Múltiplas Variáveis Aleatórias Discretas 104 6.3.1.3 Identificando Causa e Efeito 182 9.3 .3 Propriedades de Estimadores 128 7.8 Desigualdade de Chebyshev 122 Exercícios Suplementares 123 Exercícios para Expandir a Mente 124 6.1.1 Introdução 179 9.3 Hipóteses Unilaterais e Bilaterais 147 8.3.4.3.5 Covariância e Correlação 115 6.3.3 Intervalo de Confiança para a Variância de uma População Normal 164 8.X SUMÁRIO Distribuições de Probabilidades Condicionais 100 Independência 101 6.3.

1 Análise Estatística do Modelo de Efeitos Fixos 300 .1 Introdução 295 13.11.2 Teste para os Coeficientes Individuais de Regressãoe Subconjuntos de Coeficientes 242 11.6.2 O Caso dos Efeitos Aleatórios 291 Exercícios Suplementares 292 Exercícios para Expandir a Mente CAPíTULO 13 293 11.4.1 Um Exemplo 269 12.8 Medidas da Adequação do Modelo 247 Planejamento de Experimentos com Vários Fatores 295 13.5 Testes de Hipóteses na Regressão Linear Simples 213 10.3 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 211 10.7 Predição de Novas Observações 246 11.3.2 Intervalo de Confiança para a Resposta Média 245 11.1 Teste para Amostras Grandes.SUMÁRIO xi 247 9.2 Estimação de Parâmetros pelo Método dos Mínimos Quadrados 232 11.8.8.6.2 Regressão Linear Simples 207 10.6.8.3 Falta de Ajuste 221 10.1 Intervalos de Confiança para a Inclinação e a Interseção 216 10.7 Previsão de Novas Observações 218 10.8.4 Modelo com Efeitos Aleatórios 281 12.5.1 Intervalos de Confiança para os Coeficientes Individuais de Regressão 245 11.3 Análise Residual e Verificação do Modelo 288 12.10 Variáveis Indicativas 252 11.4 Abusos Comuns na Regressão 212 10.3 Saída Computacional para a Regressão em Etapas 260 11.2.1 O Caso dos Efeitos Fixos 290 12.2 Erro 13 e Escolha do Tamanho da Amostra 199 9.3 Testes 12.5 Testes de Hipóteses para a Regressão Linear Múltipla 241 11.2.3 12.11 Seleção de Variáveis na Regressão Múltipla 11.5.2 Testes para as Médias Individuais dos Tratamentos 287 12.2 Intervalo de Confiança para a Resposta Média 217 10.1 Teste para Significância da Regressão 241 11.2 Análise Residual 248 11.7 Tabela com o Resumo dos Procedimentos de Inferência sobre Duas Amostras 201 Exercícios Suplementares 201 Exercícios para Expandir a Mente 204 CAPíTULO 10 11.2.8.11.3.6.8.1 Análise Residual 219 10.3 270 Regressão Linear Múltipla 230 Saída Computacional 273 Análise Residual e Verificação do Modelo 275 para Médias Individuais de Tratamento 278 Comparação Gráfica das Médias 278 Contrastes Ortogonais 278 Método de Fisher da Mínima Diferença Significativa 279 12.5.6.5.9 Transformações para uma Linha Reta 10.1 12.5.6 Intervalos de Confiança 216 10.5.3.2 Análise de Variância: Uma Abordagem para Testar a Significância da Regressã~ 214 10.3 Abordagem Matricial para a Regressão Linear Múltipla 233 11.2 12.5.2 A Análise de Variância 12.1 Modelo da Regressão Linear Múltipla 230 11.3 Observações Influentes 249 11.6 Determinação do Tamanho da Amostra em Experimentos com um Único Fator 290 12.2 Algumas Aplicações das Técnicas de Planejamento de Experimentos 295 13.6.4 12.3 Experimentos Fatoriais 297 13.6.2 Coeficiente de Determinação (R2) 10.4 Planejamento Aleatorizado com Blocos Completos e com Fatores Aleatórios 288 12.2 Procedimentos Computacionais para a Seleção de Variáveis 255 11.2.1 Coeficiente de Determinação Múltipla 11.1 Uso de Testes t 213 10.6.1 Problema de Construir o Modelo 255 11.P2 200 9.1 Planejamento e Análise Estatística 284 12. Considerando Ho: Pl = P2 198 9.11.4 Experimentos Fatoriais com Dois Fatores 299 13.1 Modelos Empíricos 205 10.9 Modelos de Regressão Polinomial 251 11.6.8 Cálculo da Adequação do Modelo de Regressão 219 10.3 Intervalo de Confiança para Pl .5.1 A Estratégia de Experimentação 268 12.4 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 240 11.6 Intervalos de Confiança para a Regressão Linear Múltipla 245 11.12 Multicolinearidade 263 Exercícios Suplementares 264 Exercícios para Expandir a Mente CAPíTULO 12 266 (R2) 255 Regressão Linear Simples e Correlação 205 10.lOCorrelação 224 Exercícios Suplementares 22 7 Exercícios para Expandir a Mente 229 CAPíTULO 11 221 224 Planej amento e Análise de Experimentos com um Único Fator: A Análise de Variância 268 12.2 Experimento Completamente Aleatorizado com um Único Fator 269 12.5 Planejamento Aleatorizado com Blocos Completos 284 12.

6.8.9.9 Desempenho do Gráfico de Controle 380 15.6.4 Adição de Pontos Centrais a um Planejamento 2k 320 13.1 Uma Meia Fração do Planejamento 2k 327 13.4 Comparações com o Teste t 354 14.2.4.3 15.3 Comparação com o Teste t 356 14.5 Gráficos de Controle X e R 367 15.2 Aproximação para Amostras Grandes 356 14.4 Controle Estatístico da 360 Melhoria e Estatística da Qualidade 360 Controle Estatístico da Qualidade 361 Controle Estatístico de Processo 361 Introdução aos Gráficos de Controle 361 15.1 Descrição do Teste 348 14.1 Descrição do Teste 353 14.2 Análise de uma Superfície de Resposta de Segunda Ordem 339 Exercícios Suplementares 343 Exercícios para Expandir a Mente 346 CAPíTULO 14 CAPíTULO 15 Qualidade 15.3 Saída Computacional 303 13.1 Teste de Kruskal-Wallis 357 14.1 Gráfico P (Gráfico de Controle para Proporções 377 15.4.6.1 Planejamento 22 310 13.8.1 Descrição do Teste 355 14.6 Planejamento Fatorial 2k 309 13.1 Introdução 347 14.1 15.5 Experimentos Fatoriais Gerais 306 13.4 Teste de Wilcoxon da Soma :1osPostos 355 14.2.8.4.4.6.4.6 Gráficos de Controle para Medidas Individuais 371 15.5 Fatores Aleatórios 304 13.4 Comparação com o Teste t 351 14.3.5.2 Verificação da Adequação do Modelo 303 13.3.4.4 Uma Observação por Célula 303 13.9.3 Teste de Wilcoxon do Posto com Sinais 352 14.4.3.9 Métodos e Planejamentos de Superfície de Resposta 336 13.2 Frações Menores: O Fatorial Fracionário 2k-p 331 13.5 Métodos Não Paramétricos na Análise de Variância 357 14.3.8.7 Capacidade de Processo 374 15.3 Observações Emparelhadas 353 14.4.3 Réplica Única do Planejamento 2k 318 13.2 15.1 Método da Ascendente de Maior Inclinação (Steepest Ascent) 337 13.1 Princípios Básicos 361 15.4.8 Gráficos de Controle para Atributos 377 15.8 Replicação Fracionária do Planejamento 2k 327 13.2 Planejamento 2k para k ~ 3 Fatores 313 13.2.11 Outras Ferramentas para Resolver Problemas de CEP 386 15.4.2.3 SubgruposRacionais 364 15.3 Erro Tipo II para o Teste dos Sinais 350 14.2 Gráfico U (Gráfico de Controle para Defeitos por Unidade) 378 15.4.4 Análise de Padrões de Comportamento para Gráficos de Controle 365 15.2 Teste dos Sinais para Amostras Emparelhadas 350 14.12 Implementando o CEP 388 Exercícios Suplementares 389 Exercícios para Expandir a Mente 391 Estatística Não Paramétrica 347 14.7 Blocagem e Superposição no Planejamento 2k 323 13.5.2 Aproximação para Amostras Grandes 353 14.2 Transformação de Posto 358 Exercícios Suplementares 358 Exercícios para Expandir a Mente 359 AP~NDICES 393 395 A Tabelas e Gráficos Estatísticos B Material Técnico Suplementar 426 I Técnicas de Contagem 426 II Função Geradora de Momento 429 III Funções de Variáveis Aleatórias 432 IV Desenvolvimento das Distribuições te F 436 V Abordagem Bayesiana para Estimação 437 VI Testes da Razão da Verossimilhança 439 VII Fatores Aleatórios em Experimentos Fatoriais 440 C Bibliografia 445 D Respostas dos Exercícios Selecionados 447 íNDICE 460 .2 Projeto de um Gráfico de Controle 364 15.10 Gráfico de Controle da Soma Cumulativa 382 15.xii SUMÁRIO 13.2 Teste dos Sinais 348 14.

Conseqüentemente. no mínimo tentar. 2. 4.1 Engenharia e Resolução de Problemas Um engenheiro é alguém que resolve problemas de interesse da sociedade. As etapas no método de engenharia são mostradas na Fig. Estabelecer limitações ou suposições do modelo. Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO 1.2 COLETANDO DADOS EM ENGENHARIA 1. Tirar conclusões ou fazer recomendações baseadas na solução do problema. engenheiros têm de saber como planejar. são colocadas em um retângulo. O método de engenharia ou científico é a abordagem para formular e resolver esses problemas. 7. As etapas 2-4. Conduzir experimentos apropriados e coletar dados para testar ou validar o modelo-tentativa ou conclusões feitas nas etapas 2 e 3. O campo da estatística lida com a coleta. usando conhecimento científico ou de engenharia do fenômeno estudado. Propor um modelo para o problema. Especificamente. Refinar o modelo. os fatores que podem influenciar sua solução. ou processo que encontre as necessidades dos consumidores. um modelo do fenômeno e a experiência para verificar a adequação do modelo e da solução proposta para o problema.1.1 o MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1. resolver problemas e planejar produtos e processos. 6.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS 1. analisar e interpretar os dados e entender como os dados observados estão relacionados ao modelo que eles propuseram para o problema sob estudo. os experimentos. 1. 1.o Papel da Estatística na Engenharia ESQUEMA DO CAPÍTULO 1. a análise e o uso dos dados para tomar decisões. obviamente algum conhecimento de estatística é importante para qualquer engenheiro. Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema. Identificar.1 Engenharia e Resolução de Problemas 1. Note que o método de engenharia caracteriza uma forte relação recíproca entre o problema. 5.1.1. com base nos dados observados. na Fig.1 O MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1. Os engenheiros executam isso através do refmamento do produto ou processos existentes. 8.1. indicando que vários ciclos ou iterações dessas etapas podem ser requeridos para obter a solução final. a apresentação.1.2 Julgamento Estatístico 1. pela aplicação eficiente de princípios científicos. eficientemente. os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua solução. 3. coletar dados. As etapas no método de engenharia são dadas a seguir: 1. técnicas estatísticas podem ser uma ajuda poderosa no planejamento de novos produ- .3 MODELOS MECANICISTAS E EMPÍRICOS 1. ou pelo projeto de um novo produto. Desenvolver uma descrição clara e concisa do problema. Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente.

.= I 8 13. 13. então o fulcro localizado em x equilibraria exatamente esse sistema de pesos. tais como o tipo de estrada mais usada recentemente (cidade ou estrada). <- A média da amostra é o valor médio de todas as observações do conjunto de dados..2 O PAPEL DA ESTATÍSTICA NA ENGENHARIA tos e sistemas. Você sempre consegue o mesmo desempenho de consumo em cada tanque de combustível? Naturalmente. 1. Métodos estatísticos são usados para nos ajudar a entender a variabilidade. 1. esses dados são uma amostra de observações que foi selecionada a partir de alguma população grande de observações. a média da amostra será n XI' X2. inseguro acerca do efeito dessa decisão na força de remoção do conector.. Esse gráfico nos permitirá ver facilmente duas características dos dados.. O engenheiro está considerando estabelecer como especificação do projeto uma espessura de parede de 3/32 polegada. cerca de 20 observações.0 pode ser pensada como um "ponto de balanço". 1.5. algumas vezes o desempenho varia consideravelmente. possivelmente. Por exemplo. Aqui. a população deve consis- • 12 • • • 13 • • •• 14 I 15 Força de remoção Fig. O diagrama de pontos é um gráfico muito útil para exibir um pequeno conjunto de dados. referir-nos-emos à média arítmética como a média da amostra. n Xn 2: Xi = . geralmente é dificil identificar qualquer padrão específico na variabilidade. Ou seja.. mas está. podemos caracterizar a localização ou tendência central nos dados através da média aritmética comum. nem todos os protótipos têm a mesma força de remoção. 12. Fig. . as mudanças na condição do veÍCulo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou compressão do motor ou desgaste da válvula). Porque quase sempre pensamos em nossos dados como sendo uma amostra. + Xn n . . melhorando os projetos existentes e planejando. não -na verdade. Encontramos também variabilidade em problemas de engenharia. 12.2 apresenta um diagrama de pontos desses dados. Definição Se as n observações em uma amostra forem denotadas por então. Note que a média da amostra x = 13. suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva. Como antecipamos. 13.. isto é. a marca e/ou número de octanagem da gasolina usada. Por exemplo.9.1.3.. a localização ou o meio. de algum modo.2 Diagrama de pontos dos dados da força de remoção. Por exemplo.6 + 12.6. A Fig. Se a força de remoção for muito baixa. 1. X. Essa variabilidade observada no consumo de gasolina depende de muitos fatores. Podemos também descrever numericamente as características dos dados. o conector pode falhar quando ele for instalado no motor. Geralmente. quando a espessura da parede for 3/32 polegada. resultando nos seguintes dados (em libras-pé): 12. 13.6. + 8 104 8 13. ou mesmo.. x = XI + Xl + . e o espalhamento ou a variabilidade.9 + . Todos nós encontramos variabilidade em nosso dia-a-dia e o julgamento estatístico pode nos dar uma maneira útil para incorporar essa variabilidade em nossos processos de tomada de decisão. que é um diagrama de pontos dos dados da força de remoção. . Oito unidades do protótipo são produzidas e suas forças de remoção são medidas.=1 2: Xi n (1.3.6. Quando o número de observações é pequeno. se cada observação representar 1 libra de massa colocada no ponto no eixo X.1 O método de solução de um problema.1 12. as condições climáticas. desenvolvendo e melhorando os processos de produção. Por variabilidade. 13. A Estatística nos fornece uma estrutura para descrever essa variabilidade e para aprender sobre quais fontes potenciais de variabilidade são mais importantes ou quais têm o maior impacto no desempenho de consumo de gasolina..1) EXEMPLO 1. queremos dizer que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado. Esses fatores representam fontes potenciais de variabilidade no sistema.1 A média da amostra da força de remoção para as oito observações coletadas nos protótipos dos conectores é 8 X = Xl + Xl + . 12.0 Uma interpretação fisica da média da amostra como uma medida da localização é mostrada na Fig. considere o desempenho de consumo de gasolina de seu carro..4. embora o diagrama de pontos seja uma maneira conveniente de ver quaisquer características incomuns nos dados.

a variabilidade será relativamente grande.2286 = 0.60 = 81.0 ela não transmite toda seja útil. sendo denotada pela letra gregafL(mi).2 A Tabela 1..4 Como a variância desvios Xi . N) na população.4 que mostra os desvios Xi .16 12.lda amostra.3 -0.60 12. 1.3 A média da amostra como um ponto de equilibrio para um sistema de pesos. Esses dados são graficados na Fig.16 0. Conseqüentemente. Uma vez que os desvios Xi . Essa média é chamada de média populacional.7 13.1 o desvio-padrão da amostra. é a raiz quadrada positiva da variânci<. Quando houver um número finito de observações (isto é.4 0. Como a Variância da Amostra Mede a Variabilidade? Para ver como a variância da amostra mede a dispersão ou a variabilidade. Quanto maior a variabilidade nos dados da força de remoção. da amostra mede a variabilidade através dos .3) n .48 libras-pé Tabela 1. s. X.5 0.36-X 13.2) assim.=.1 12.250. s 1. tal como uma porção de pastilhas de silício produzidas em uma fábrica de semicondutores. relativamente. maior será o valor absoluto de alguns dos desvios Xi .01 13.X somarão zero.6 Xi0.x.60 (1.5 Xi da --- Definição Se XI.49 0. existe uma população física real. as unidades para a variância da amostra serão (libras-pé)2.)2 _ I e o desvio-padrão da amostra é s = v'0. se S2 for grande. fL.60 1 = -7..4 1.6 0.• .X para os Fig. tir em todos os conectores que serão vendidos aos consumidores. 1. Logo. O numerador de S2é f. Elevar ao quadrado os desvios é uma abordagem usada na variância da amostra. fL. Xn for uma amostra de n observações. Muitos problemas importantes de engenharia envolvem fazer referências ou tomar decisões sobre uma média populacional.X. se x for medido em libras-pé. variância . então a média populacional será EXEMPLO 1. veja a Fig. o engenheiro durante o projeto do conector usando uma espessura de parede de 3/32 polegada concluiria. 1513 • 1 À4 I • Fig. Podemos pensar também em calcular o valor médio de todas as observações em uma população.4.4 -0. com base nos dados. se S2for pequeno.1 apresenta as quantidades necessárias para calcular a variância e o desvio-padrão da amostra para os dados da força de remoção. Embora a média da amostra --1"04. 1.02286 (l'b ras. então a da amostra será S2 = L _i=_I n (Xi - X)2 _ (1. que uma estimativa da força de remoção média seria 13. discutiremos modelos para populações infinitas e isso nos levará a urna defmição mais geral de média populacional. Algumas vezes. pouca variabilidade nos dados.0 libras-pé.01 0. 4 5 3 2 8 7 6 a informação acerca de uma amostra de dados. O desvio-padrão tem uma propriedade desejável de variabilidade de medida nas unidades originais da variável de interesse. temos de usar uma medida de variabilidade que transforme os desvios negativos em quantidades não negativas. 12 o o o o X o o o o 13 14 15 As unidades de medidas para a variância da amostra são o quadrado das unidades originais da variável.pe.1 12. dados da força de remoção do conector. haverá. Nos capítulos seguintes. 1.9 -0.o PAPEL DA EsTA TfsTICA I NA ENGENHARIA 3 emoção • • L •• i. Assim. é uma estimativa razoável da média populacional. x.1 (Xi0.L=-N i=1 L N i=1 Xi L 8 (Xi - x)2 = 1.6 0.1 Cálculo dos Termos para a Variância e Desvio-Padrão Amostra -0. porém. A variabilidade ou dispersão nos dados 1 pode ser descrita pela variância ou o desvio-padrão da amostra. X2.0X)2 13.6 0. a variância da amostra é 2 A média da amostra.

X e vários decimais podem ter de ser carregados para assegurar a exatidão numérica. Por conseguinte. Definição n S 2 i= =-------.I. a amplitude é largamente utilizada em controle estatístico da qualidade. n < 8 ou 10. somente n .1 e.. Xi .3. Usaremos a letra grega cr (sigma ao quadrado) para denotar a variância da população. que a média da amostra poderia ser usada como uma estimativa da média populacional. A média.I dos n desvios. 8 7 XI' Se as n observações em uma amostra forem denotadas por X2.x. Uma outra maneira de pensar acerca disso é considerar a variância S2 da amostra.2286 (libras-pé)2 e s = VO.x não forem inteiros. em média.3 Calcularemos a variância e o desvio-padrão da amostra. enquanto o desvio-padrão da segunda amostra é S2 = 2.1 n n I 2:x?- ( 2: n i=1 Xi )2 13536 _ (104f . Isso foi ilustrado na Tabela 1. existe uma medida de variabilidade na população chamada de variância da população. Se soubéssemos o valor verdadeiro da média populacional ]L. então poderíamos encontrar a variância da amostra como a média dos quadrados dos desvios das observações da amostra em tomo de ]L.. é uma medida útil de variabilidade.8 e 9 e 1. Geralmente. Observamos. Discutiremos algumas dessas aplicações no Capo 15.x. pode ser tedioso trabalhar com os desvios Xi . para compensar isso. o divisor é o tamanho N da população. as observações Xi tendem a ser mais próximas de seu valor médio.I). Se usássemos n como o divisor na variância da amostra.3.)2 I n (104) Note que a Eq.12.1.I n n 2: -:xi i=1 2: (X? + :x2 n- - 2ix. Algumas vezes. como estando baseada em n . A variabilidade é realmente menor na segunda amostra. Entretanto. dessa forma.I dessas quantidades determina automaticamente aquele restante. isto é. enquanto para a variância da população. Quando a população for finita e consistir em N valores. isso é chamado de método abreviado para cálculo de S2 (ou s). obteríamos uma medida de variabilidade que seria." então a amplitude da amostra será r = máx(xi) - mín(xi) (1. especificar os valores de quaisquer n . . as duas amostras 1. A amplitude da amostra é definida como segue. ]L. Similarmente.) Il X? i=1 2: + n:x2 - 2:X i=1 2: Xi n . a variância da amostra é uma estimativa da variância da população. Por exemplo. x. usamos n . à medida que a variabilidade nos dados da amostra aumenta. n subtrações e n operações de elevar ao quadrado e somar. estão livremente determinados.5.xY/n de x. do que a média populacional..48 libras-pé Esses resultados concordam exatamente com aqueles obtidos previamente. Na prática.5) = _i=_1 N _ Para os dados da força de remoção.já que x = (l/n) i = 1 Xi' essa última equação se reduz a I. Uma fórmula computacional mais eficiente para a variância da amostra é obtida como segue: n Il (xi S 2 i=1 =----. A amplitude da amostra é fácil de calcular.5. Dessa forma. Eq. a amplitude da amostra aumenta. a amplitude da amostra é r = 13. usando o método do atalho. X2 . n s2 i=1 =--------n ±X?- (± i=1 1 X. ou CJ'.6) = 1. e finalmente dividindo por n .83. ou a diferença entre a maior e a menor observação. denotará o desvio-padrão da população. . o valor de ]L quase nunca é conhecido e. Análoga à variância da amostra S2. onde tamanhos de amostra de 4 ou 5 são razoavelmente comuns. ainda que efetivas maneiras de resu- .35. a amplitude da amostra. ao quadrado a soma de Xi' subtraindo ('i. Além da variância e do desvio-padrão da amostra. a varíância e o desvio-padrão da amostra e o diagrama de pontos são simples. mas ignora toda a informação contida nos dados entre os valores maior e menor.. a perda de informação associada com a amplitude não é muito séria. assim.x sempre somam zero e.1 como o divisor em vez de n. previamente.6 .L)2 (1. A fórmula fornece Uma definição mais geral da variância cr será dada adiante.3 = 1. I EXEMPLOl. então.0 = 0. x. Algumas vezes. .2286 = 0.. Por exemplo.5. Note que o divisor da variância da amostra é o tamanho da amostra menos um (n . O termo graus de liberdade resulta do fato de que n desvios Xl . No entanto. o desvio-padrão da primeira amostra é SI = 3..5.I graus de liberdade. IA. IA requer que se calcule o quadrado de cada Xi' levando-se. A raiz quadrada positiva de cr. quando o tamanho da amostra for pequeno. podemos definir a variância da população como N 2: 0'2 (xi - f.. Se as observações originais ou os desvios Xi . consistentemente menor que a variância verdadeira cr da população.4 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Cômputo de 52 O cômputo de S2 requer o cálculo de x.x.9 têm a mesma amplitude (r = 8). Xn . a soma dos quadrados dos desvios em tomo da média x da amostra tem de ser usada.

se :x for alta. Estudo enumerativo Estudo analítico o = ~ polegada Fig. mantendo-se a terminologia. os oito protótipos dos conectores têm de ser representantivos. essa análise requer alguma noção de estabilidade como uma suposição adicional. respectivamente.0 lb-ft. as leis fisicas (tais como a lei de Ohm e a lei de gás ideal) são aplicadas para ajudar no projeto de produtos e processos. Em outros casos. Baseado nos dados da amostra. As análises estatísticas são geralmente as mesmas em ambos os casos. Outros métodos para descrever os dados serão apresentados no Capo 2. Esses modelos envolvem conceitos de probabilidade que serão introduzidos no Capo 3. Entretanto. 1. Por exemplo.9.9.5 e 13. também é importante raciocinar a partir de uma série específica de medidas para casos mais gerais para responder às questões prévias. 4-6 explorarão esses conceitos em detalhes. A inferência estatística é a partir de :x para f. Veremos que a noção de uma distribuição de probabilidade. Uma amostra é usada para fazer uma inferência à população da qual a amostra é selecionada. No entanto. 1. uma suposição de estabilidade. No entanto.- I I I I I I I I I I I . se a amostra for selecionada adequadamente. . Esse argumento é a partir de uma amostra (tal como os oito conectores) para uma população (tal como os conectores que serão vendidos aos consumidores).- .2.L).6.2 Julgamento Estatístico A necessidade de um julgamento estatístico aparece freqüentemente na solução de problemas de engenharia. Esse gráfico e os cálculos precedentes dão a impressão de que o aumento da espessura da parede levou a um aumento na força de remoção.L seja muito alta...L. será possível que o aumento aparente na força de remoção observada nos protótipos mais espessos seja apenas devido à variabilidade aparente no sistema e que o aumento da espessura da parte (e seu custo) realmente não afete a força de remoção? Freqüentemente.2. claramente. Oito protótipos desse projeto são construídos e as medidas observadas da força de remoção são: 12. A amostra é um subconjunto da população. Ver Fig.7 Estudo enumerativo versus estudo analítico. Por exemplo.. Fig. Resultados para ambas as amostras são graficados como diagrama de pontos na Fig. assim. 13.. medidas foram obtidas de uma amostra de pessoas e generalizadas para uma população. 1.. a média das medidas de resistividade na amostra (:X) não é esperada para igualar exatamente à média das medidas de resistividade no lote (f. Em alguns casos. uma amostra de três pastilhas pode ser selecionada de um lote de produção de pastilhas na fabricação de semicondutores. ele pensa que esse valor pode ser muito baixo para a aplícação pretendida. Claramente. Por exemplo.7. como sabemos que uma outra amostra de protótipos não dará resultados diferentes? A amostra de oito protótipos é adequada para fornecer resultados confiáveis? Se usarmos .1. a população não existe ainda. O raciocínio é referido como inferência estatística. o raciocínio baseado nas medidas de alguns objetos para medidas em todos os objetos pode resultar em erros (chamados de erros de amostragem). daqueles que serão vendidos aos consumidores. Uma amostra é usada para fazer uma inferência a uma população futura. Considere o engenheiro projetando o conector. Ver Fig.os resultados obtidos dos testes até agora para concluir que aumentando a espessura da parede aumenta a resistência. Tempo. O exemplo de pastilhas a partir de lotes é chamado de estudo enumerador. Os Caps. Por exemplo. queremos concluir alguma coisa a respeito do lote. Os engenheiros estão freqüentemente interessados em desenvolver um modelo do sistema ou processo que gerou os dados.50. 1. ele decide considerar um projeto alternativo com uma espessura maior de parede...8.4 e 0..5. esses riscos poderão ser quantificados e um tamanho apropriado de amostra pode ser determinado. Fig. Para responder às questões prévias.5 Diagrama de pontos da força de remoção para duas espessuras de parede. 1. deve ser considerado que as fontes de variabilidade na fabricação de protótipos (tais como temperatura. Claramente. 13.. pressão e tempo de cura) são as mesmas que aquelas para os conectores que serão vendidos aos consumidores. 1.- . Porém. como um modelo que descreve a variabilidade em um sistema ou processo. a amostra é realmente selecionada a partir da população. A partir de testes em protótipo. mas deve ser pensada como futuras réplicas dos objetos na amostra.6 Inferência estatistica é um tipo de raciocínio. População ? População futura ? • 12 • = • • 00 •• 00 I o • •• o o o I 13 f2 polegada 14 15 (:::) !_-~---j : I . há algumas questões óbvias a perguntar. 13. devemos estar preocupados com que f. 13. é muito importante no ambiente de engenharia. NA ENGENHARIA 5 1.. A média e o desvio-padrão da amostra são 13. quais os riscos que estão associados com essa decisão? Por exemplo. ele sabe que uma estimativa razoável da força média de remoção seria 13. 1. O exemplo do conector é chamado de estudo analítico.. porém um estudo analítico requer. I J : Força de remoção xl' X2"'" xn. Entretanto. de certo modo. 12. Geralmente..7.o PAPEL DA EsTATÍSTICA mir os dados. 14. Historicamente.1. Estamos familiarizados com esse raciocínio a partir de leis gerais para casos especiais.1. os oito conectores são vistos como uma amostra da população de conectores que serão vendidos aos consumidores. 1/8 polegada.

em um estudo observador. mas freqüentemente eles envolvem estudos analíticos.2. ou seja. são: 0. o engenheiro faz varíações propositais nas variáveis controláveis de alguns sistemas ou processos. Freqüentemente.2 COLETANDO DADOS DE ENGENHARIA Na seção prévia.015. 104. Se aparecerem questões relativas a uma mudança em uma importante característica elétrica. eles têm melhor desempenho. 0. 115. 102. ilustramos alguns métodos simples para resumir dados. 102. O exemplo do conector de plástico na seção prévia ilustrou um experimento planejado. na fabricação de semicondutores. esses dados são coletados em uma das duas maneiras a seguir. o processo ou sistema que está sendo estudado pode ser observado somente pelo engenheiro e os dados são obtidos à medida que se tomam disponíveis. Os dados (em mm) são: 74. 7099. Foram feitas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um automóvel.91.31. estatisticamente. Claramente. J. Os tempos. Assim sendo. 1. 12. 42. 6930. 102. No ambiente de engenharia. 7518. então.01. suponha que um engenheiro esteja avaliando o desempenho de um processo de fabricação de componentes plásticos através da injeção em molde. 4. Uma abordagem que poderia ser usada na resolução desse problema é comparar as médias da força de remoção para 3/32 polegada. o engenheiro pode estar interessado em saber se a força média de remoção de 3/32 polegada excede a carga máxima típica a ser encontrada nessa aplicação. 7518. os dados são quase sempre uma amostra que foi selecionada a partir de alguma população. Isso é chamado de problema de teste de hipóteses com uma única amostra. 74.000. Esses registros incluiriam dados de teste de características fisicas e elétricas das pastilhas. 36. esse é um exemplo de estudo analítico e também um exemplo de um problema envolvendo teste de hipóteses para duas amostras. 7. Os primeiros resultados (em kN) são: 96. uma mudança deliberada foi feita na espessura da parede do conector.06. com o objetivo de descobrir se uma força de remoção maior poderia ser ou não obtida.001. Em um experimento planejado. 160. 156.67.75 libras-pé.L3132 excederia 12. 33. 104. estaríamos interessados em testar o teste de hipóteses em que a resistência média J. 74.15. observa os dados de saída do sistema resultante e.005. 7041 e 6890. 126. 8.1 E 1.003. 12. 7013. assim como as condições de processamento sob as quais cada batelada de pastilhas foi produzida. Uma outra maneira é que os dados observados são obtidos através da análise de dados históricos do sistema ou processo. 1. Os dados provenientes de observação e os dados provenientes de experimentos planejados podem ser obtidos em ambos os tipos de estudos. 128. 31. Um artigo em Human Factors (junho de 1989) apresentou dados sobre a acomodação visual (uma função do movimento do olho). Alternativamente. quando produtos e processos são planejados e desenvolvidos com experimentos planejados. 4. reconhecendo um padrão de mancha em um vídeo CRT de alta resolução. sendo introduzidos e ilustrados em maiores detalhes na próxima seção. 128. o encolhimento ou a resistência da peça.005 e 74. 6.1. ilustraremos vários tipos de experimentos planejados para o exemplo do conector. introduzimos os conceitos de estudos enumeradores e analíticos. Construa um diagrama de pontos dos dados.002. se o engenheiro quiser alcançar o sucesso. ou seja. 1989) descreve um experimento para testar a resistência resultante em tubos circulares com calotas soldadas nas extremidades. Geralmente.78. 1982). JkJI32. 74. Por exemplo. 1. 74. e para 1/8 polegada. Em geral. 96.85.52. Por exemplo. Por exemplo. Pode-se observar o processo.89. PARA AS SEÇÕES 1.90. 164 e 170. Os Caps. mais alta confiabilidade e menores custos globais. Freqüentemente. 6800. Wayne Nelson apresenta o tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Na Seção 1. selecionar componentes à medida que são fabricados e medir importantes características de interesse.35.16. Calcule a média e o desvio-padrão da amostra. 74. O Capo 8 apresentará técnicas para esse tipo de problema. esses estudos envolvem um conjunto muito grande de dados e requerem um firme domínio dos princípios estatísticos. Na Seção 1. 8. 74.1. 160. o conteúdo de umidade da matéria-prima e o tempo do ciclo. tais como a temperatura do molde. Em Applied Li/e Data Analysis (Wiley. 67. O engenheiro pode medir também e registrar as variáveis de processo potencialmente importantes. 2. em minutos. Por exemplo. 126. Calcule a média e o desvio-padrão da amostra.4.78. Construa um diagrama de pontos dos dados. 0. uma hipótese é uma afirmação sobre algum aspecto do sistema em que tenhamos interesse. Nessa situação.71 e 72. isto é.18. Calcule a média e o desvio-padrão da amostra. 140.77.50. A maioria dos problemas de engenharia envolve os estudos analíticos. construa um diagrama de pontos e comente os dados.3. tais como a espessura da parede. A primeira maneira pela qual os engenheiros freqüentemente coletam dados é a partir de um estudo observacional. é razoavelmente comum manter registros extensos de cada batelada ou lote de pastilhas que foi produzido. Os dados são: 36. . 7100. o engenheiro pode estar interessado em testar a hipótese de que um aumento da espessura da parede de 3/32 para 1/8 de polegada resulta em um aumento da força média de remoção. faz uma inferência ou decisão sobre as variáveis que são responsáveis pelas mudan- ças observadas no desempenho de saída. Esses modelos são freqüentemente chamados de modelos empíricos. A habilidade de pensar e analisar.5. a história do processo pode ser estudada em um esforço para determinar o ponto no tempo onde a mudança ocorreu e para ganhar algum discernimento em relação às variáveis do processo que devem ser responsáveis pela mudança.27.004.96. A edição de janeiro de 1990 de Arizona Trend contém um suplemento descrevendo os 12 "melhores" campos de golfe do estado. Experimentos planejados também desempenham um papel crucial na redução do tempo de condução de um projeto de engenharia e do desenvolvimento de atividades. 6935. ---------EXERCÍCIOS 1. 3. 32. Um artigo no Journal o/ Structural Engineering (Vol. Problemas desse tipo serão discutidos no Capo 9.45.75 libras-pé.75. 8 e 9 discutirão o teste de hipóteses e outras técnicas relacionadas. Geralmente. 108. o engenheiro está interessado em usar os dados para construir um modelo do sistema ou processo. a inferência ou decisão da análise é sobre como o sistema ou o processo se desempenhará no futuro. 1.6 O PAPEL DA ESTATÍSTICA NA ENGENHARIA 1. 4. 38.LU8. A segunda maneira pela qual os dados de engenharia são obtidos é através de um experimento planejado. Os comprimentos desses campos emjardas são: 6981.2--------- 1.4. usando a técnica de teste estatístico de hipóteses.19. considere o problema a respeito da escolha da espessura da parede do conector de náilon. 6992. Calcule a média e o desvio-padrão da amostra. os dados amostrais nos capacitará a responder questões sobre o sistema ou o processo em estudo. O planejamento de experimentos tem um papel muito importante no projeto e desenvolvimento de engenharia e na melhoria dos processos de fabricação.

6. 27. 806. 918. Agora. talvez em tempos diferentes. porque ele é construído a partir de nosso conhecimento do mecanismo fisico básico. considerando apenas o termo de primeira ordem. 653.00 41. NA ENGENHARIA 7 1. Note que esse é um exemplo de um estudo observador (ver Seção 1.708. de modo que devemos considerar outras fontes de variabilidade . os engenheiros trabalham com problemas para os quais não há modelo mecanicista simples ou bem entendido. Essa tabela contém dados das três variáveis.605 54.35900 9. Os seguintes dados são medidas de intensidade solar direta (watts/m2).8) sendo E um termo adicionado ao modelo para considerar o fato de que os valores observados da corrente não seguem perfeitamente o modelo mecanicista. 939.30 e 49. o semicondutor [mal é um arame colado a uma estrutura. Calcule a média e o desviopadrão da amostra. Logo. 940. Infelizmente. em uma localização no sul da Espanha: 562. tais como mudanças na temperatura ambiente. 558. 905. 909. suponha que estejamos medindo a corrente em um fio fino de cobre. sabemos que Mil está relacionado dade (V) do material e também depende da quantidade de catalisador (C) e da temperatura (1) no reator de polimerização.3 MODELOS MECANICISTAS E EMPÍRICOS Os modelos desempenham um importante papel na análise de praticamente todos os problemas de engenharia. ou mesmo em dias diferentes. 1. 952.754 35.6. produzindo assim um modelo da forma Mn = 130 + 131V + !32C + !33T (1. A edição de 22 de abril de 1991 de Aviation Week and Space Technology reporta que.02Arame Molde 31. quando o material é fabricado.10) sendo f3's os parâmetros desconhecidos. ele usa a nossa engenharia e o conhecimento científico do fenômeno. 768.12 56. que foram coletados em uma planta de fabricação de semicondutores. a con"ente observada poderá diferir levemente por causa de pequenas mudanças ou variações em fatores que não estejam perfeitamente controlados. Desse modo. 955.952 25. assim como na lei de Ohm.13 21.458 sobre 24. 39.8. esse modelo não descreverá exatamente o fenômeno.2 Dados400y do a Resistência de Tração da Cola no Arame à250 Comprimento Resistência II=E/R+E (1. Construa um diagrama de pontos dos dados.63 22. 878.77. que relaciona essas variáveis.89 46. com um total de 6905 horas.7.775. Agora. não parece provável que a abordagem de modelo mecanicista possa ser usada com sucesso. C.71.00 10. 856.93 24.65 69.2). Nessa planta. suponha que estejamos interessados no peso molecular médio (Mil) de um à viscosipolímero.15 Tabela 1.72. 869. Calcule a média e o desvio-padrão da amostra.11) Esse é o modelo que usaremos para relacionar o peso molecular às outras três variáveis.704. ou seja. A relação entre Mil e essas variáveis é Mn = I(V.08 11.1 a 1. 870. Para cada um dos Exercícios 1. 918. Por exemplo.655. As variáveis reportadas são à tração (uma medida da quantidade de força a resistência requerida para romper a cola). Com o objetivo de ilustrar essas idéias com um exemplo específico. 730 e 753. Gostariamos de encontrar um modelo relacionando a resistência à tração. não há mecanismo fisico que possamos facilmente aplicar aqui.9) em que a forma da função f é desconhecida.66 17.30 17. Esse tipo é chamado modelo empírico. 809. 1. 898. Qual foi a duração média de uma missão F -117 A durante essa operação? Por que o parâmetro que você calculou foi a média popu1aciona1 ? 1.50 9. o comprimento do arame e a altura da matriz.86X. adicionamos um outro termo ao modelo resultando (1. um modelo de trabalho pudesse ser desenvolvido a partir de uma expansão em série de Taylor. Podemos pensar E como sendo um termo que inclui os efeitos de todas as fontes não modeladas de variabilidade que afetam esse sistema. 498.o PAPEL DA EsTATÍSTlCA 26. Muito da educação formal de engenheiros envolve o aprendizado sobre os modelos relevantes a campos e a técnicas específicos para aplicar esses modelos na formulação e solução de problemas.59 44. Algumas vezes. Nosso modelo para esse fenômeno pode ser a lei de Ohm Corrente ou que possam afetar o peso molecular. um modelo mais realista da corrente11 Observação pode Número da ser 16 15 18 17 12 13 10 20 21 23 5 7 94 8 14 6 19 22 23 24 25 observada do375 XI412 300 585 205 360 20 12 6 15 4 540 290 250 510 110 11 120 100 252 17 590 400 Altura 500 295 200 10 550 16 6 37. em dias diferentes. Talvez. pilotos da força aérea americana (F-117A) realizaram 1270 vôos de combate. 835. 661.775. ao comprimento do arame e à altura da matriz. 50. que explique o fenômeno. durante uma operação de guerra no deserto. = voltagem/resistência 1= E/R (1. 960. discuta se os dados resultam de um estudo observado ou de um experimento planejado. flutuações no desempenho do medidor.2. considere os dados na Tabela 1. pequenas impurezas presentes em diferentes localizações do fio e impulsos na voltagem.95 21. No entanto. 935. 946.88 16. 7) Chamamos esse tipo de modelo mecanístico. 693. Por conseguinte. se fizermos esse processo de medição mais de uma vez.38Tração 34. T) (1. porém não é diretamente desenvolvido a partir de nosso conhecimento teórico ou dos primeiros princípios do mecanismo básico. 957. Como um simples exemplo. 820.001 14.

em que nenhuma teoria científica ou de engenharia é completamente aplicável.8.0125 (altura da matriz) (1.1. Lembre-se de que o engenheiro construiu oito protótipos de cada projeto (3/32 e 1/8 polegada).26 + 2. Um experimento fatorial é aquele em que os fatores são variados conjuntamente. Examinando esse gráfico. Assim. 1.2 resulte em Resistência à tração = 2. quando o conector for arranjado na aplicação. seriam feitas em cada vértice.• 300 ~\~ 200 o~<S' y>\~ 20 O 100 ~~ Fig. 'üi üí 20 'ü a: 40 c 80 O o ~ 60 <Q) 'Ctl Q) Ctl ·Ctl 4 8 Comprimento 12 do arame 16 20 O 100 600 500 400 300 ~\1. em adição à espessura da parede.9 é um gráfico dos valores previstos da resistência à tração versus o comprimento do arame e a altura da matriz. experimentos fatoriais são a maneira mais eficiente de estudar os efeitos de interação dos vários fatores. suponha que. é quase sempre necessário conduzir testes ou experimentos para confirmar que a teoria é. parece razoável pensar que um modelo tal como Resistência à tração binações de comprimento de arame e altura da matriz que fossem de interesse. Note que os valores previstos repousam no plano acima do espaço comprimento do arame-altura da matriz. 1. um experimento fatorial consistiria das oito combinações de teste mostradas nos vértices do cubo na Fig. reconsidere o problema da espessura da parede do conector. É aparente. Julgamento estatístico e métodos estatísticos desempenham um papel importante no planejamento. Notamos que o teste estatístico de hipóteses foi uma estrutura possível para investigar que o aumento da espessura da parede no projeto conduziria a níveis mais altos da força média de remoção. A força de remoção é medida no arranjo final.10. Agora. Freqüentemente. Julgamento estatístico pode também ser aplicado a problemas experimentais mais sérios. esse tipo de modelo empírico é chamado de modelo de regressão. A Seção 1. engenheiros trabalham em áreas problemáticas. Para ilustrar. a experiência e a observação dos dados resultantes constituem as únicas maneiras pelas quais o problema pode ser resolvido. o mesmo número usado no estudo comparativo simples da Seção 1. esse método escolhe os parâmetros (f3's) no modelo empírico para minimizar a soma dos quadrados das distâncias entre cada ponto dado e o plano representado pela equação do modelo. 1. O modelo empírico na Eq. chamado de mínimos quadrados. que se originou do trabalho de Karl Gauss. 1. 1.12.8 apresenta um gráfico tridimensional de todas as 25 observações da resistência à tração. A partir dos gráficos dos dados na Fig.8 Gráfico tridimensional dos dados do arame e da resistência à tração. 10 e 11. comprimento do arame e altura da matriz.12) em que o "chapéu" ou circunflexo sobre a resistência à tração indica que essa é uma quantidade estimada ou prevista. Quando vários fatores são potencialmente importantes. 1. que a aplicação dessa técnica aos dados da Tabela 1. testou cada unidade e calculou a média e o desvio-padrão da amostra da força de remoção para cada projeto. obtido a partir da Eq. Usaremos um método para estimar os parâmetros nos modelos de regressão. Dessa forma. pela aplicação de calor ao longo de algum período de tempo.74 (comprimento do arame) + + 0. mostraremos como construir esses modelos e testar se eles são adequados como funções de aproximação. resultando em um experimento fatorial com 16 corridas. o modelo empírico poderia ser usado por um engenheiro exatamente da mesma maneira que um modelo mecanicista poderia ser usado. é necessário planejar um experimento que nos permitirá investigar o efeito de todos os três fatores na força de remoção. ou réplicas.200 o~(0'?> ~y>\ ~ ~ Fig. 1. Essencialmente.8 o PAPEL DA Esr A TÍSTICA NA ENGENHARIA A Fig. Essa é uma ilustração do uso do julgamento estatístico para ajudar na análise de dados. A Fig.9 Gráfico de valores previstos da resistência à tração. Para ilustrar. 1.1 continha um breve exemplo envolvendo um engenheiro que estava investigando o impacto do aumento da espessura da parede de um conector na força de remoção. então. operativa na situação ou no ambiente no qual ela está sendo aplicada. a partir do modelo empírico na Eq.12. condução e análise de dados a partir de experimentos de engenharia. O engenheiro suspeita que. Além disso. ele será primeiro imerso em um adesivo. Essencialmente. sendo então curado o arranjo. Mesmo que haja uma boa teoria científica básica em que possamos confiar na explicação do fenômeno de interesse. ~1 (comprimento do arame) E + ~2(altura da matriz) + seria apropriado como um modelo empírico para essa relação.12 poderia ser usado para prever valores da resistência à tração para várias com- "ti <> ·Ctl Ctl 080 ~ 60 g 40 <Q) üí .10. os tempos de cura de interesse sejam 1 e 24 h e que os níveis de temperatura sejam 70°F e 100°F. no experimento do conector. . 1. a melhor estratégia da experiência é planejar algum tipo de experimento fatorial. a partir de um simples experimento comparativo. Os valores observados da força de remoção estão mostrados entre parênteses nos vértices do cubo na Fig. uma vez que todos os três fatores têm dois níveis. Suponha que. Em geral. Duas tentativas. na verdade.~ 20 a: o O 8 Comprimento do arame 12 16 600 500 400 . Geralmente. o tempo e a temperatura de cura poderiam ter algum efeito no desempenho do conector. porém agora estamos investigando três fatores. esse modelo não parece razoável. vemos que a resistência à tração aumenta quando o comprimento do arame e a altura da matriz aumentam. Nos Caps.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS Muito do que sabemos em engenharia e nas ciências fisico-químicas é desenvolvido através de testes ou experiências. 1. Note que esse experimento usa oito protótipos de 3/32 polegada e oito protótipos de 1/8 polegada. = ~o + 1.

9. porém se o tempo maior de cura for usado (24 h).9.30 Temp. 15. Algumas tentativas de conclusões muito interessantes podem ser retiradas desse experimento. Podemos facilmente estender a estratégia fatorial para mais fatores.13.275 = 1. A interpretação dessa interação é muito direta. para medir o efeito de aumentar o tempo de cura. 13. compare a força média de remoção dos oito protótipos de 3/32 polegada com a força média de remoção dos oito protótipos de 1/8 polegada (essas são as médias das oito corridas na face esquerda e na face direita do cubo na Fig.125 . Esse é um exemplo de uma interação entre os dois fatores. se o objetivo do engenheiro for projetar um conector tendo um alto valor da força de remoção.9. = 70'F 12. -----14.7.6 (13. aumentando a espessura da parede de 3/32 para 1/8 polegada aumenta a força média de remoção por 0.11 A interação de segunda ordem entre o tempo de cura e a temperatura de cura. = 100'F 14. a temperatura de cura terá pouco efeito. resultados incorretos ou enganosos podem ser obtidos.0) 15. 7 libra-pé.10. O efeito da temperatura de cura pode ser avaliado. um efeito maior que o de aumentar a espessura da parede.30 24 h 70"F 13.4.3) I 13.13.6 (13.1 (14. Esse gráfico foi construí do calculando a força média de remoção nas quatro combinações diferentes de tempo e de temperatura.11. Força média 1h 70"F 13.o PAPEL DA ESTATÍSTICA 14.8) Espessura da parede (polegada) Fig. Assim. comparando-se a média das oito corridas no topo do cubo (onde a temperatura = 100°F) com a média das oito corridas na parte inferior do cubo (onde a temperatura = 70°F) ou 14.c :::. . Temp.2) ~ E 70' "\ e<f:'çO 24h lh l .8 (14. temperatura de cura e tipo de adesivo ..14.83 14.10 O experimento fatorial para o problema da espessura da parede do conector. Há dois tipos: o adesivo padrão e um novo competidor.6. tempo de cura. o aumento da temperatura de cura terá um efeito maior na força média de remoção.espessura da parede. aparentemente.12 ilustra como todos os quatro fatores .65.poderiam ser investigados em um plane- Tempo Temp. compare a média das oito corridas na face de trás do cubo (em que tempo = 24 h). De fato. os pontos representando os dois níveis de temperatura. Logo. respectivamente) ou 14.1 I (12.37 . o tempo de cura tem.50 1 h . 13.45 = 0.1 32 8 13. se o tempo padrão de cura (1 h) for usado.1 .6. A inclinação de cada uma dessas linhas retas representa o efeito do tempo de cura na força de remoção.13. = 70'F 24 h Tempo Fig. O efeito de aumentar o tempo de cura de 1para 24 h é aumentar a força média de remoção por 1 libra-pé. 1.425 = 0.3. com linhas retas. Existe uma relação interessante entre o tempo de cura e a temperatura de cura. porém especificando um tempo maior de cura e uma temperatura mais alta. que pode ser vista examinando-se o gráfico na Fig. 13.60 24 h 100"F 14. Desse modo. ~ 13.43 Temp. Primeiro. o tipo de adesivo.65 libra-pé. graficando essas médias versus tempo e então conectando. indicando que o efeito do tempo de cura é diferente nos dois valores da temperatura de cura. 15.1. se as interações estiverem presentes e a estratégia fatorial de experimentos não for usada. A Fig. tais como o aumento da espessura da parede e o uso das condições "padrões" de 1 h e 70°F ou o uso da espessura original da parede de 3/32 polegada.5.3)--0---/' /' /' /' /' /' 12.25 1h 100"F 13.5) I I I I 13. Suponha que o engenheiro queira considerar um quarto fator.95 15. o efeito de aumentar a temperatura de cura é aumentar a força média de remoção por O.13. A seguir. há aparentemente muitas alternativas.90 13.0 (12. ou seja. Interações ocorrem freqüentemente em sistemas físicos e químicos e os experimentos fatoriais são a única maneira para investigar seus efeitos. com a média das oito corridas na face da frente do cubo (em que tempo = 1 h) ou 14.97 12.a> c.3) NA ENGENHARIA 9 13. 1. 13. 1.275 .9) ~ '" ~ 100' a> c.1 (13. 1. Note que as inclinações dessas duas linhas não parecem ser as mesmas.9 (12.

onde nova tecnologia. Ele conduziu um experimento em que tentou deixar cair bolinhas de gude o mais próximo possível de um alvo em uma mesa. Ele. .13 Um experimento fatorial fracionário para o problema da espessura da parede do conector. As combinações de teste com um círculo. Felizmente. são as únicas combinações de teste que necessitam ser realizadas. Fenômenos que possam afetar o sistema ou o processo tomam-se com freqüência mais visíveis em um gráfico com uma escala de tempo. oito fatores. Por exemplo. ele notou que a variabilidade na distância até o alvo para a estratégia 2 foi apro- Tipo de adesivo ____ . requereriam 256 ensaios. o número necessário de corridas em um planejamento fatorial aumenta rapidamente. é essencial que todos os engenheiros entendam os princípios básicos de um planeja- mento eficiente e efetivo de experimentos./ 1 "8 Espessura da parede (polegada) Fig. O guru da qualidade Edward Deming enfatizou que é importante entender a natureza da variação ao longo do tempo. jamento fatorial.10 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Tipo de adesivo í------"-Velho '\ Novo ~ ::o "§ O> 100' If:'<P Q. quando houver quatro. A grande variação descrita no diagrama de pontos indica um possível problema.15. Experimentos fatoriais e fracionários são usados extensivamente por engenheiros e cientistas em pesquisa e desenvolvimento industriais.. Pelo fato de os dados serem coletados ao longo do tempo. Uma vez que muito do trabalho de engenharia envolve testar e experimentar. um hipercubo). O funil estava alinhado o mais próximo possível com o centro do alvo. é geralmente desnecessário testar todas as combinações possíveis dos níveis dos fatores. conforme mostrado na figura. Já que todos os quatro fatores têm dois níveis. 1.1. E 70' . por conseguinte. podendo o conceito de estabilidade ser melhor julgado. Esse planejamento de experimentos requer somente oito corridas. Uni experimento fatorial fracionário é uma variação do arranjo básico fatorial.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO Toda vez que os dados são coletados ao longo do tempo. como no planejamento fatorial.12 Um experimento fatorial com quatro fatores para o problema da espessura da parede do conector./ . O experimento requer 16 ensaios. do ponto de vista do tempo e de outros recursos. Esse é um excelente planejamento experimental para estudar todos os quatro fatores. em uma tentativa de compensar o erro. Geralmente. por exemplo. Ele. Ver Fig. eles são plotados ao longo do tempo na Fig./ .0 lh 3 32 24h . produtos e processos são projetados e desenvolvidos e onde produtos e processos existentes são melhorados. cada um com dois níveis.14 é um diagrama de pontos com leituras de concentração tomadas periodicamente em um processo químico. Um deslocamento no nível médio do processo é visível no gráfico e uma estimativa do tempo do deslocamento pode ser obtida. com k = 4.12 requer 16 testes. um planejamento fatorial de experimentos irá requerer 2k corridas. à medida que o número de fatores aumenta. 1. 1. Claramente. O Capo 13 concentrar-se-á nos fatoriais e nos fatoriais fracionários. então. porém o gráfico não ajuda a explicar a razão para a variação. 1. usou duas estratégias diferentes para operar o processo. 1. Note que. 32 1 "8 Espessura da parede (polegada) Fig. (2) Ele soltou a primeira bola de gude e registrou sua localização relativa ao alvo. 1. A Fig. todas as combinações possíveis dos quatro fatores são testadas. Ele proverá boa informação acerca dos efeitos individuais dos quatro fatores e alguma informação acerca de como esses fatores interagem. em vez das 16 originais.16. ./0-. ele será chamado de meia fração. Ele usou um funil montado em um anel e as bolas de gude caíram através do funil. para a versão com quatro fatores do experimento do conector. ~ I I . em que somente se testa realmente um subconjunto das combinações dos fatores.13 mostra um planejamento fatorial fracionário de experimentos. o planejamento 24 na Fig. (l) Ele nunca moveu o funil. se houver k fatores e cada um deles tiver dois níveis. Discutiremos esses princípios no Capo 12. é importante plotá-los ao longo do tempo. então. 100' 70' "o lf:'çO lh E 24h f- O> 1. Depois das duas estratégias estarem completas. Ele apenas soltou uma bola de gude depois da outra e registrou a distância até o alvo. 1. o planejamento experimental pode ainda ser representado geometricamente por um cubo (na verdade. que introduzimos aqui. Isso se toma rapidamente impraticável." Novo ~ ::o "§ O> Q. Ele continuou a fazer esse tipo de ajuste depois de cada bola ter sido solta. moveu o funil por uma distância igual e oposta. cinco ou mais fatores.. A Fig.

.1. O valor alvo para o processo é de 10 unidades. II • I87.5 IX 84. O sobrecontrole aumentou ·os desvios em relação ao alvo.5 91.17(a). A Fig. A Fig.então. Esse experimento interessante mostra que os ajustes em um processo. exceto que as medidas depois da observação de número 25 são 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.18(a) apresenta os mesmos dados da Fig. eles podem ajudar. Ajustes devem ser aplicados somente para compensar mudança não aleatória no processo .17(a) Dados do processo somente com distúrbios aleatórios. A Fig. em uma tentativa de produzir dados mais próximos ao alvo.14 O diagrama de pontos ilustra a variação.1.0 • Concentração ••• • ~ Alvo Fig. podem realmente aumentar a variação do processo.0 98. mas não identifica o problema. 1. Uma simulação computacional pode ser usada para demonstrar as lições do experimento do funil. com 50 medidas (denotadas por y) de um processo em que somente perturbações !fleatórias estão presentes.15 Um gráfico temporal do que o diagrama de pontos. quando a medida for 11 (uma unidade acima do alvo). 1. 1. 1.17(b) apresenta os mesmos dados depois dos ajustes serem aplicados à média do processo. 1. . baseados em perturbações aleatórias. Os ajustes no funil aumentaram os desvios até o alvo.17(b) Ajustes aplicados aos distúrbios aleatórios controlam em demasia o processo e aumentam os desvios em relação ao alvo. Conseqüentemente. Cada ajuste é igual e oposto ao desvio da medida prévia em relação ao alvo.0 94. de concentração provê mais informações ximadamente duas vezes maior que para a estratégia 1. Em vez disso.o PAPEL DA EsTATÍSTICA • • • • • • • NA ENGENHARIA 11 . 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.16 O experimento do funil de Deming. o 10 20 30 Número da observação Fig. 1. a média será reduzida por uma unidade antes que a próxima medida seja gerada. Isso é conhecido como sobrecontrole ou controle demasiado. eles tendem a mover o funil para mais longe do alvo. os ajustes no funil não diminuem erros futuros. 1. A explicação é que o erro (o desvio da posição da bola de gude até o alvo) para uma bola de gude não provê informação sobre o erro que ocorrerá para a próxima bola. Bolinhas de gude c Ü c u oo ~ 'lU Q) 100 90 80 Fig. Por exemplo.17(a) apresenta um gráfico do tempo.

Esses limites estão localizados acima e abaixo da linha central. 1.19 mostra um gráfico de controle para os dados de concentração do processo químico da Fig. a estrutura visual de referência. as medidas de concentração deverão flutuar aleatoriamente em tomo da linha central e quase todas elas deverão cair entre os limites de controle. Note que esse ajuste diminui os desvios em relação ao alvo. . 1.54 80 o 5 10 15 20 25 30 Número da observação Fig. 1. 14 13 12 11 y 10 9 A mudan a na média do processo é detectada 8 7 6 10 20 30 40 50 Número da observação Fig. A Fig.19 Um gráfico (carta) de controle para os dados de concentração de processoquimico. Quando houver uma mudança verdadeira na média de um processo.19. por duas unidades) depois da observação de número 25.18(a) A média do processo muda (para cima. que reflete a variabilidade inerente ou natural no processo.18(b) A mudança na média do processo é detectada na observação de número 28 e as medidas seguintes são diminuídas por duas unidades. em tomo da amostra 20. O limite superior de controle e o limite inferior de controle são um par de limites. sem quaisquer fontes externas de variabilidade presentes no sistema. Um gráfico ou carta de controle é uma maneira inestimável de examinar a variabilidade em dados ao longo do tempo. 1. Se pudermos encontrar e eliminar a causa básica desse distúrbio. No gráfico de controle da Fig. consideravelmente. indica que algum transtorno ou distúrbio atingiu o processo. por uma distância correspondente a três desvios-padrão dos valores de concentração. provida pela linha central e pelos limites de controle. Gráficos de controle são uma aplicação muito importante de estatística para monitorizar. A Fig. aumentadas em duas unidades para simular o efeito de uma mudança na média do processo. controlar e melhorar um processo. A questão de quando aplicar ajustes (e por qual quantidade) começa com um entendimento dos tipos de variação que afetam um processo. 1. O ramo da estatística que faz uso das cartas de controle é chamado de controle estatístico de processo ou CEP. quando o processo estiver estável. Se o processo estiver operando como deve. 1.5 g/l). o desempenho do processo.15.18(b) apresenta os dados obtidos quando um ajuste (diminuição em duas unidades) for aplicado à média depois de a mudança ter sido detectada (na observação de número 28). podemos melhorar. 1. um ajuste poderá ser útil. porque todas as observações seguin- tes estão abaixo da linha central e duas delas realmente caem abaixo do limite inferior de controle. 100 Limite superior de controle = 100. A linha central na carta de controle é apenas a média das medidas de concentração para as primeiras 20 amostras (x = 91.5 1(1) o c o Ü ~ ~ c: 90 Limite inferior de controle = 82.12 O PAPEL DA EsTATÍSTICA NA ENGENHARIA 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig. estatisticamente deduzidos. Discutiremos CEP e gráficos de controle no Capo 15. Esse é um sinal muito forte de que uma ação corretiva é necessária nesse processo.

(c) A partir dos dados. Calcule a média da amostra.. com medidas de temperatura em uma fornalha. Encontre uma relação entre .16. 81. 70.82. (Xi - fL)2 será a menor. 1.20. Os dados a seguir correspondem às temperaturas das junções dos anéis (graus F).40. qual das duas n quantidades desde que i=1 x I * 11 (Xi - X )2 e . ou seja. VoI. Agora. Um estudo de engenharia para investigar a fratura por fadiga em n = 9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de fratura: 2. (a) A partir dos dados. para cada lançamento real ou de teste de um motor de um foguete espacial (da Presidential Commission on the Space Shuttle Challenger Accident. com os seguintes resultados (os coeficientes de arraste estão em unidades de counts. Como está essa quantidade relacionada a S2 para os dados originais? Explique por quê. 75.58. 78. no Quais são os valores da média e do desvio-padrão de Z. Considere a quantidade 1=1 (Xi . subtraia 30 e então multiplique as quantidades resultantes por 10. 79. 129131): 84. Dê uma interpretação prática da média da amostra. 1. prepare um diagrama de pontos. 1. 3. 58. 7. 7. Quais são as maiores fontes de variabilidade nesse experimento? Um artigo no Journal of Aircraft (1988) descreve o cálculo de coeficientes de arraste para o aerofólio NASA 0012.61.20. a partir de um experimento envolvendo um vídeo CRT de alta resolução. recalcule as quantidades do item (a).17.37. 2.15. com média da amostra X e desvio-padrão s Faça Zi = (Xi .9.0001): 79. 1. Considere os dados de intensidade solamo ExerCÍcio 1.60.12. foram reportados no artigo. A prevenção da propagação da fratura por fadiga em estruturas de aeronaves é um importante elemento da segurança.14. 31. (b) Construa um diagrama de pontos com os dados de temperatura. 1 count é equivalente a um coeficiente de arraste de 0. 63. 2.63. 11 1. 72.15. 2.14 e 8. 82. (a) Calcule a média.? o o i i . Com esses dados.02.83. 83. 76. 1. = 1. a variância e o desvio-padrão da amostra e construa um diagrama de pontos. . 73.80.11.15. NA ENGENHARIA 13 1. 64. Xn. prepare um diagrama de pontos. (a) Calcule a média da amostra. Prepare um diagrama de pontos por essa segunda amostra e compare-o com o diagrama para a primeira amostra. Indique onde a média da amostra cai no diagrama. 76.7. 35.53. Diferentes algoritrnos de cálculo foram usados para M~ = 0. De cada valor. 1.04.. 70. pp.00 e um desvio-padrão de 10. 2. em que a e b são constantes diferentes de zero. 67.50 Usando os resultados do Exercício 1018. . 15.69. 61.24. Calcule a variância e o desvio-padrão da amostra.18. 7. = 1.10. Calcule a média.70.21..38.67.80.67.2.13. 85.16.67..66. 1.16 e 7. 7. o. a variância e o desvio-padrão da amostra.20. 52. 1.o PAPEL DA EsTATÍSTICA Exercícios Suplementares 1.19. usando um vídeo com baixa resolução. FaçaYi = a + bx. 100. prepare um diagrama de pontos. . 7.60. calcule S2 para os novos dados. Quão "diferentes" são as outras temperaturas em relação a esse último valor? (a) (b) (c) EXERCÍCIOS PARA EXPANDIR A MENTE 1.19.x )/s. Comente o que encontrou. 74. fL? Codificando os dados. (b) Calcule a variância e o desvio-padrão da amostra. Considere os dados do aerofólio no ExerCÍcio 1. resultou em uma média (OF)de 835.6.5 descreve os dados de um artigo em Human Factors em acomodação visual. 7.x e y e entre Sx e sr Uma amostra. 1.13. 80 e 84. 1. (b) Os dados de um segundo experimento.=1 I 1.96.68. O ExerCÍcio 1. (c) Sem considerar a menor observação (31°F). Ela obtém os seguintes dados: 7. O que você pode concluir acerca da resolução de CRT nessa situação? O pH de uma solução é medido oito vezes por uma operadora usando o mesmo instrumento.47. quais são a média e os desvios-padrão expressos em °C? Considere a amostra XI' x2. o. Eles são: 8. 26. 8. 81. 9.18.00.13. 70. 2. 75.49. 53.85. n. 57.45.18.a)20 Qual o valor de a ~ que minirniza essa quantidade? Usando os resultados do ExerCÍcio 1. 1.

escritos a priori. Não discutiremos a facilidade de uso dos pacotes com relação à entrada e à edição de dados ou ao uso dos comandos. juntamente com pessoas experientes em manipulá-los. usando esses dados. disponíveis na sua instituição.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS No Capo 1. seleciona os tipos de análises e apresentações de saída que são de interesse. Você encontrará esses pacotes. outras apresentações gráficas podem ser mais úteis. submetida à avaliação como um possível material para elementos estruturais de aeronaves.1 IMPORT ANCIA DO SUMÁRIO E APRESENTAÇÃO DEDADaS 2. Um diagrama de ramo e folhas é uma boa maneira de obter uma apresentação visual informativa de um conjunto de dados . 2. O usuário entra com os dados e.3 DISTRIBUIÇÕES DE FREQÜtNCIA HISTOGRAMAS E 2. No entanto. Porque existem muitas observações.5 GRÁFICOS SEQÜENCIAIS DE TEMPO 2. Os dados foram registrados à medida que os testes iam sendo realizados e.4 DIAGRAMA DE CAIXA 2. a variância e o desvio-padrão da amostra e o diagrama de pontos como técnicas para sumarizar dados. Sumários e apresentações de dados bem constituídos são essenciais ao bom julgamento estatístico. a construção de um diagrama de pontos. O computador se tomou uma ferramenta importante na apresentação e na análise de dados. Esses dados são a resistência à compressão. apresentações mais efetivas estão disponíveis para conjuntos com muitos dados. sendo necessário um computador para realizar as tarefas de forma muito mais eficiente. considere os dados na Tabela 2. Apresentaremos alguns exemplos de saída de vários pacotes estatísticos em todo o livro. no caso de amostras pequenas. seria relativamente ineficiente. Questões como "Que percentagem dos corpos de prova cai abaixo de 120 psi?" não são fáceis de responder. quando o número de observações for moderamente alto. de 80 corpos de prova de uma nova liga de alumíniolítio.1. A maioria da análise estatística é feita usando uma biblioteca de programas estatísticos. Pacotes estatísticos estão disponíveis tanto para computadores de grande porte como para computadores pessoais. introduzimos a média. porque permitem ao engenheiro focar as características importantes dos dados ou ter discemimento acerca do tipo de modelo que deveria ser usado na solução do problema.2 DIAGRAMAS DE RAMO E FOLHAS O diagrama de pontos é uma apresentação útil de dados.2 DIAGRAMAS DE RAMO E FOLHAS 2. para servidores e computadores pessoais (PCs). eles não contêm muita informação a respeito da resistência compressiva. nesse formato. Enquanto muitas técnicas estatísticas necessitam somente de uma calculadora portátil. e o Statgraphics e Minitab para Pc.Sumário e Apresentação de Dados ESQUEMA DO CAPíTULO 2. em libras por polegada quadrada (psi). então. Por exemplo. até cerca de 20 observações. Entre os pacotes mais populares e largamente usados estão o SAS (Statistical Analysis System). ou similares. essa abordagem pode requerer muito tempo e esforço.

2. Uma maneira de fazer isso seria dividir o ramo S (por exemplo) em dois novos ramos. e uma folha. considere os dados na Tabela 2. entre Oe 100. consistindo nos dígitos restantes. se os dados consistirem em informações percentuais. as resistências estão distribuídas aproximadamente de forma simétrica em tomo do valor central. .1. selecionaremos os números 7. A Fig. Ao lado de cada ramo.7.1. Uma vez que um conjunto de ramos tenha sido escolhido. A última coluna no diagrama é a freqüência do número de folhas associadas a cada ramo. dividimos cada ramo em duas partes. Em geral. relativamente. 8 e 9 como os ramos. Em alguns conjuntos de dados.3 e4 e oramo SU tem folhas S. no mínimo.9. 149 170 237 135 171 167 208 221 151 160 115 131 199 168 174 153 180 118 160 201 200 175 158 148 150 87 154 229 163 142 172 101 184 178 123 156 133 194 193 190 154 110 176 181 228 167 120 143 180 121 186 169 165 141 146 157 158 174 183 76 150 145 Tabela 2. Para construir o diagrama de ramo e folhas. 2. diagrama de ramo e folhas nos capacita a determinar rapidamente algumas características importantes dos dados.8.2. dividimos cada número Xi em duas partes: um ramo. 2.X2. O diagrama resultante de ramo e folhas é apresentado na Fig.8 e 9.1 Diagrama de ramo e folhas para os dados de resistência à compressão na Tabela 2.2(c) ilustra um diagrama de ramo e folhas. Para ilustrar. resultando em uma apresentação mais adequada dos dados. usamos 6. Ss (para seis e sete) com folhas 6 e 7. eles são listados ao longo da margem esquerda do diagrama. devemos escolher. sobre a resistência à compressão de uma liga. Além disso.SUMÁRIO E ApRESENTAÇÃO DE DADOS 15 .1. então poderemos dividir o valor 76 no ramo 7 e na folha 6. poucos ramos em comparação ao número de observações. dois dígitos.2(a). resultando em um diagrama que não nos diz muito acerca da forma dos dados. 2. Isso resulta em muitos poucos ramos e o diagrama de ramo e folhas não provê muita informação sobre os dados. em que cada número Xi consiste em. É geralmente melhor escolher entre S e 20 ramos. todas as folhas correspondentes aos valores observados são listadas na ordem em que elas foram encontradas no conjunto de dados. O ramo SL tem folhas 0. que não foram imediatamente óbvias quando da apresentação original na Tabela 2. Na Fig. Sf (para quatro e cinco) com folhas 4 e S.2 A Fig.. XI. Há um número excessivo de ramos nesse gráfico. St (para dois e três) com folhas 2 e 3. 2. definindo cinco novos ramos: Sz com folhas Oe 1. O EXEMPLO 2. pode ser desejável prover mais intervalos ou ramos. 7. EXEMPLO 2.• . Ramo 4 1 353 960934Freqüência 5 89 8 3073050879 0361410 580 7 108 103 1 729583169 5Folha 68544162106 471340886808 4 2 7 12 10 3 3 1 6 8 Fig. Poderíamos aumentar quatro vezes o número de ramos originais...2 ilustra o diagrama de ramo e folhas para 25 observações sobre os rendimentos de uma batelada de um processo químico... 2. Isso dobrará o número de ramos originais. e Se com folhas 8 e 9. Uma inspeção desse diagrama revela imediatamente que a maioria das resistências à compressão está entre 110 e 200 psi e que um valor central está em algum lugar entre ISO e 160 psi. 6.2(b). Na Fig.1 Para ilustrar a construção de um diagrama de ramo e folhas.24. consistindo em um ou mais dígitos iniciais.1. dos defeitos nos lotes de pastilhas de semicondutores. Como valores dos ramos. SL e SD.1 Resistência à Compressão de 105 80 Corpos de Prova da Liga de AluITÚnio-Lítio . com cada ramo dividido em cinco partes. .1. x.

1. 2. Por causa do tempo demandado. esse valor ocorre quatro vezes e nenhum outro valor ocorre tão freqüentemente na amostra. a mediana é (160 + 163)/2 = 161. 2. isso geralmente não é feito quando o diagrama é construído manualmente.75. a mediana estará na metade da distância entre os dois valores centrais.3 indica que a moda é 158. em cada ramo. Diagrama de Caracteres em Ramo e Folhas Ramo e Folhas da Resistência N = 80 Unidade da Folha = 1.25 e 3(80 + 1)/4 = 60. tanto no ramo como acima dele na metade superior do diagrama.3. metade abaixo da mediana e metade acima.2. A mediana de uma amostra é uma medida de tendência central. Note também que o computador ordena as folhas da menor para a maior. na Fig. e uma contagem das observações. A moda da amostra é o valor da observação que ocorre com mais freqüência.0 1 7 6 2 8 9 3 5 7 7 15 10 11 8 11 17 25 37 (10) 058 01 3 12 13 14 15 33 23 16 16 17 18 19 20 21 10 6 5 2 1 22 23 133455 12356899 001344678888 0003357789 0112445668 0011346 034699 0178 8 189 7 24 5 Fig. O computador adiciona uma coluna à esquerda dos ramos que provê uma contagem das observações. 2.0 e o 41. os quartis e a mediana. O diagrama ordenado de ramo e folhas toma relativamente fácil encontrar características dos dados. produzido pelo Minitab. Essa forma do gráfico é geralmente chamada de diagrama ordenado de ramo e folhas. Os dados de resistência à compressão. interpolando quando necessário.3 Diagrama de ramo e folhas do Minitab. O terceiro quartil ou quartil superior. O segundo quartil. Podemos também dividir os dados em mais de duas partes. O primeiro quartil ou quartil inferior. q2. que divide os dados em duas partes iguais. tais como os percentis. Se o número de observações forímpar.3.5. No ramo intermediário 16. qj. O pacote Minitab calcula o primeiro e o terceiro quartis como sendo as (n + 1)/4 e 3(n + 1)/4 observações ordenadas. .16 SUMÁRIO E APRESENT AçAo DE DADOS Ramo Folha Ramo 134 011 1 6z7s 23 1 3 Ramo 44 3 344 7 88 889 01 5 6 556 788 65 7z 7f 7t 6t 6f 455 57889 6e 5Folha 9U 7L 7U 9L 8L 6 6U 134556 6L (b) 8U 7 011357889 8 1344788 9 235 (a) 8e 7e 9s 9z 8z 8s 8t 8f 9f ge 9t (c) Fig. .3 mostra um diagrama de ramo e folhas dos dados de resistência à compressão na Tabela 2. os quartis podem não ser únicos. q3' tem aproximadamente três quartos (75%) das observações abaixo de seu valor. O pacote usa os mesmos ramos que adotamos na Fig. O segundo quartil é exatamente igual à mediana. A Fig. 2. 2. a coluna indica o número de observações nesse ramo. Por exemplo. Quando um conjunto ordenado de dados é dividido em quatro partes iguais. Se o número de observações for par.0 valores da resistência como 160 e 163.2 Diagrama de ramo e folhas para o Exemplo 2. tem aproximadamente metade (50%) das observações abaixo de seu valor. 2. tanto no ramo como abaixo dele na metade inferior do diagrama.1. Da Fig. os pontos de divisão são chamados de quartis. contêm n = 80 observações. (80 + 1)/4 = 20. encontramos o 40. a mediana será o valor central. 2. logo. é um valor que tem aproximadamente um quarto (25%) das observações abaixo dele e aproximadamente 75% das observações acima. Como no caso da mediana. A Fig.

3.9 88.390.6 34. o Minitab interpola entre a 20. Finalmente.6 87.392. de modo a obter ql = 143.3 33.6revestimentoquartis médiaciclosamostrafabricar processo33.191.5 94. como uma medida de variabilidade.485.894.77 Mediana da N Máx181.6 93.9 910 86.1 34.1A descrevem diagrama Exercício 2.2 2.3 37. 94.091.3 e a 61.76.0 84.687.3 um 84.7 35.3 que34.8 mostrados e moda e "sobreviverá" até de de de ca93.4 84.793.5 95. o 100k.586.491.2 esses dados.7.para os dados de rendimento Umcombustível A91.6 90.1 34.1 88.233.2 84.1 35.4 34.1 95.693.3 observação ordenada.dequalSEÇÃO diferentesdecaracterísticas dos dados. 92.791.6 mediana 84.9 34.3 87.434.0mediana dea os quartisa para os dados de posiçãocorde PARA Construa um 2.2 33.090.6 32.12.50 162.2 zação ExerCÍcio35. ximadamente podemos usar a faixa interquartil definida como IQR = q3 q I.6.7 88.8 86. Q O Q D .0 84. usado além dos 34.3 96.3 no94.1 92.66 3.235.394.k)% deles estão acima dele.8 90. acha 34.2 86.0 990 87.033.188.1 87. Expliquequartismetal foi aplicadofalhar umdados folhas19.835. Muitos pacotes estatísticos computacionais provêem sumários de dados que incluem essas quantidades.1 2265 1203 1330 1764 1883 1782 1223 1567 1000 1820 97.787.1 a ramo e folhas para no90.71102 um 88.394.2 34.2 100.1 37.4 86.78 média Q1Q3 Desvio-padrão Erro-padrão à e=o 2.4 92.7 34.o percentil é o valor de modo que aproximadamente 100k% das observações estão nesse ou abaixo desse valor e apro100(1 .3 90.396.7 89. para 2.187.8 e=o 34.0 94.2 35.75836. Em geral.4.8.3 93.1 88.7corposãoramo no(VaI.688.1 375 mediana.3 37.7 82.6 91. 32.4 dados motorprova representam esses 425)octanagem Construaartigo aem2.594.6 87.3 37.7 36.5 90.0 98.1 32.1 89.6 89.4.9 do a os números de os omedidas de locali33. de2. a faixaMín interquartil é menos sensível a valores extremos na amostra.50 245.81269 35.6 91.7 88.5.1 706 90.1 bate1adas consecutivas essas três p. a partir do Tabela 2.4 97.490.3 90.832.1 785 94.2 95.5 96.732.535.6 845 89. A saída obtida para os dados da resistência à compressão Minitab.6 93.6 33.6 90.689.5 35.9 de e seguir dematerial 1977.5 Encontre 37.086.7 90.9 88.2.4 87.6 94.3 86. 87.6 86. algodãono eExercício um dados dados.7 1888 93. 2.0seguintes36.SUMÁRIO E APRESENTAÇÁO DE DADOS 17 Conseqüentemente.4 diagrama deos 94.7 93.6 96.6 885 87.8 93.2 Resumo das Estatísticas para os Dados de Resistência Compressão. rendimento cerâmica.6 91.2 85.6 89.4 92.8 83.491.6 Você 92.00 161.1 34. de modo a obter q3 = 181.50 e entre a 60.9 93.4 86.2.6 89.1 35.1 90.188.00.2 95.9 1674 1260 90.3 35.1 82.3 e a 21.292.8 83.3 36.5 2.3 89. Provenientes do Minitab Média33.1 87.2 35.689.1 89. na Tabela 2.2 84. 96.1o Technometricscomo paraparadasubstratoporapresenta vapor. fratura no dados32.2.7 89.8 89.00 143.21792 90.1.183.00 relação à faixa ordiEm Variável 80 nma da amostra. Q 13151522 33.3 1512 1468 1238 92.9 88. é mostrada na Tabela 2.2 34.336.7 no Ospercentagem os de EXERCíCIOS 90 90.1 de1608 1910 1207 1535 1018 1015 1452 1315 1016 1501 2215 2100 1781 1940 1578 1120 1890 1730 1594 1102 1605 1750 2023 1642 1560 1416 2.3 observação ordenada.2 88.488.4 83.8 1055 78.3 90.5 85. do85.1 35.5 87.8 90.7 96.4 83.1.7 34.4 33.9 84.4 88.

use o eixo horizontal para representar a escala de medidas e desenhe os limites dos intervalos. então as alturas dos retângulos desenhados nos histogramas serão proporcionais às freqüências. suspeitamos de que cerca de 8 ou 9 intervalos de classe fornecerão uma distribuição satisfatória de freqüência.2500 ':J 110 170 c90 210 LL 250 230 15 c5 0. Na prática.3 DISTRIBUIÇÕES HISTOGRAMAS DE FREQÜÊNCIA E Uma distribuição de freqüência é um sumário mais compacto dos dados.0750 0. perdemos alguma informação porque não temos mais as observações individuais. como o diagrama de ramo e folhas. Se os intervalos de classe tiverem igual largura. O histograma. obtido no Minitab. Uma distribuição de freqüência não será informativa se usar um número muito baixo ou muito alto de intervalos de classe.3125~ 25 '" ':J ~ <: 0.76 = 169 unidades na escala de psi. os intervalos devem ser de iguais larguras de modo a aumentar a informação visual na distribuição de freqüências. os intervalos têm de cobrir uma faixa de no mínimo 245 . Para construir uma distribuição de freqüência. Algum julgamento tem de ser usado na seleção do número de intervalos de classes. essa perda de informação é pequena comparada ao ganho de concisão e de facilidade de interpretação ao usar a distribuição de freqüência e histograma. assim. Os números "padrões" foram usados nesse histograma.0625 > Resistência à compressão (psi) 70 e terminá-Ia em 250.0250 Freqüência Relativa Cumulativa 0.1250 0.4 Histograma de resistência alumínio-lítio. Por exemplo. Geralmente. As freqüências relativas são encontradas dividindo a freqüência observada em cada intervalo pelo número total de observações.5% dos corpos de prova caem abaixo de 230 psi. É também útil apresentar a distribuição de freqüência na forma gráfica. Notamos que os histogramas podem ser. Entretanto. O maior e o menor valores dos dados são 245 e 76.0000 < x < 110 110 < x < 130 130 < x < 150 150 <x < 170 170 < x < 190 190 < x < 210 210 < x < 230 230 < x < 250 90 <x< 90 I1I il111 il11tllJ.2750 0. cada um com 20'" psi de largura. Esse é um intervalo ou faixa de 180 o unidades de psi.1375 0.0625 0. Tal gráfico é chamado de histograma. A última coluna da Tabela 2. Logo. 2. levando a 17 intervalos de classe. Durante a passagem dos dados originais ou do diagrama de ramo e folhas para um diagrama de freqüência ou para um histograma. fornece uma impressão visual da forma da distribuição das medidas.1750 0.18 SUMÁRIO E APRESENTAÇÃO DE DADOS 2.3 expressa as freqüências relativas na base cumulativa. Uma vez que o conjunto de dados contém 80 observações e .9250 0. Nove intervalos.1 é mostrada na Tabela 2. Na Fig. então é costume desenhar retângulos cujas áreas serão proporcionais às freqüências.3 contém uma distribuição de freqüências relativas. achamos que 5 a 20 intervalos são satisfatórios na maioria dos casos e que o número de intervalos deve crescer com n. na Tabela 2. note a distribuição simétrica em forma de sino das medidas de resistência.tllJ.3125 0.9750 1.1895 'ü '" dos.4. a distribuição de freqüências na Tabela 2.0250 0. 2. os histogramas são mais fáceis de interpretar quando os intervalos de classe têm a mesma largura. O número de intervalos depende do número de observações e da quantidade de dispersão dos dados. 2.8000 0. em relação ao diagrama de ramo e folhas. temos de dividir a faixa de dados em intervalos.0375 0.1250 0. O eixo vertical representa a escala de freqüência (ou freqüência relativa). conforme mostrado na Fig. assim como informação sobre a dispersão dos dados. Uma distribuição de freqüência para os dados de resistência à compressão na Tabela 2.3 é baseada em nove intervalos de classe.4. que são geralmente chamados de intervalos de classe ou células. Se os intervalos de classe tiverem larguras desiguais. relativamente. Entretanto. de modo que uma apresentação razoável possa ser desenvolvida.5 mostra um histograma.0500 0. fornecem uma razoável distribuição de freqüência. Se possível. A quarta coluna da Tabela 2.0250 0.1 Intervalo de Classe (psi) 70 Marcação 11 Freqüência 2 3 6 14 22 17 10 Freqüência Relativa 0. à compressão para 80 corpos de prova da liga Tabela 2.5875 0. 11I1 4 2 11 . 2.3. dos dados de resistência à compressão.3 é muito fácil Fig.2125 0.lIlI il11tllJ.ll il111lJl.j8O = 9.lI il11il11tllJ. Para desenhar um histograma. então podemos começar 70a distribuição de freqüência em <: L~ 10190 o'ü 20 130 150 L 0. A Fig.tllJ. trabalha-se bem se o número de intervalos de classe for aproximadamente igual à raiz quadrada do número de observações.3 Distribuição de Freqüências para os Dados de Resistência à Compressão na Tabela 2. Distribuições de freqüências são geralmente mais fáceis de interpretar do que as tabelas de dados. respectivamente. ver que a maioria dos corpos de prova tem resistências à com'a> 'a> pressão entre 130 e 190 psi e que 97. Se quisermos que o limite inferior para o primeiro intervalo de classe comece um pouco abaixo do menor valor dos dados e que o limite superior para o último intervalo de classe comece um pouco acima do maior valor dos da0.

então a média. A Fig. Distribuições cumulativas são também úteis na interpretação de dados.~ 40 . 2. se a distribuição for distorcida para a direita.7 mostra uma variação de histograma. encontraremos que moda < mediana < média.8a e c. a ordem das categorias será arbitrária (tais como macho e fêmea). 2. como nas Figs. então a média.8 Histogramas para distribuições simétricas e deslocadas. Se.5 e 2. a escolha do número de intervalos não é especialmente importante e ambas (Figs.:. Histogramas são mais estáveis para conjuntos grandes de dados.-como na Fig. a mediana e a moda não Fig.4. à compressão. c ~ 10 5 20 O <1l 100 150 Resistência 200 250 o Fig. o gráfico de freqüência cumulativa. Em algumas aplicações. se a distribuição for distorcida para a esquerda. A Fig. Ele é similar ao histograma original. para amostras relativamente grandes. com nove intervalos. preferencialmente com 70. tipo n 2: 75 a 100 ou maior.8b. se os dados forem sirnétricog.7 que existem. os histogramas podem mudar dramaticamente na aparência.6) conduzem a informação similar..8 apresenta três casos. c ~ 20 10 o 100 150 Resistência Fig.~ 30 u. 70 observações menores que ou iguais a 200 psi. Distribuições de freqüências e histogramas são também usados com dados qualitativos ou por categorias. Se os dados tiverem desvio de simetria (assirnétricos.> <1l ~ 50 u . . além disso. proveniente do Minitab. dos dados de resistência à com- 200 250 coincidirão. então a média e a mediana coincidirão. 2. terceiro e quartanista na universidade).5 Histograma dos dados de resistência Minitab com 17 intervalos de classe. 2.6 Histograma dos dados de resistência Minitab com 9 intervalos de classe.6 mostra o histograma. Histogramas são mais efetivos como a apresentação de dados. com uma longa cauda para um lado). por exemplo. 2. A Fig.. haverá uma ordem natural das categorias (tais como calouro. Geralmente. feito pelo Minitab para os dados de resistência à compressão. a altura de cada barra é o número total de observações que é menor ou igual ao limite superior do intervalo. segundo. Uma vez que o número de observações é moderamente grande (n = 80). Quando usamos dados por categoria. 2. Para conjuntos pequenos de dados. à compressão. 2. 2. enquanto em outras. 100 ou mais dados. aproximadamente.SUMÁRIO E APRESENTAÇÃO DE DAOOS 19 r:r 'o> . Usualmente. proveniente do 140 160 180 200 220 240 Resistência sensíveis ao número e à largura de seus intervalos. 2. proveniente do 80 > 70 ~ 60 :. disponível no Minitab. Desvio para a esquerda ou negativo (a) Simétrico (b) Desvio para a direita ou positivo (e) Fig. podemos ler diretamente da Fig. enquanto moda> mediana> média. Nesse gráfico. o histograma poderá ser um indicador confiável da forma geral da população de medidas da qual a amostra foi retirada. se o número e/ou a largura dos intervalos mudarem. 2. 2. a mediana e a moda coincidirão.7 Gráfico de distribuição cumulativa pressão. Quando o tamanho da amostra for grande. os intervalos devem ter a mesma largura. 2. os dados tiverem apenas uma moda (dizemos que os dados são unimodais). mostrado na Fig.> '(3 u.

g.4 DIAGRAMA DE CAIXA (Box Plof ) o diagrama de. A linha inferior começa no primeiro quartil indo até o menor valor do conjunto de pontos dentro das faixas de 1. através da caixa. Uma variação importante de um histograma para dados por categoria é o diagrama de Pareto.14. no tamanho do motor no veículo. Ver Fig.2. é um número único ou pertence a uma categoria. Esse é um exemplo de dados multivariáveis.10. A Fig. alinhados tanto horizontal como verticalmente. Esse diagrama de caixa indica que a distribuição a resistências compressivas é razoavelmente simétrica em tomo do valor central. usando os dados de fratura do Exercício 2.1. Um ponto além da linha. Ocasionalmente.9 apre"ota a p<adoção de e'Paçooave. 4 buracos. As categorias são ordenadas de modo que a categoria com a maior freqüência ficará à esquerda. porém a menos de 3 amplitudes interquartis da extremidade da caixa.5 interquartil a partir do primeiro quartil. q2 = x. Construa uma distribuição de freqüência e histograma. para os dados da resistência da liga à compressão. tais como centro. Esses diagramas têm o nome do matemático italiano V.o o 757 (l)CO Um histograma de ocorrências por categoria (em que as categorias são ordenadas pelo número de ocorrências) é algumas vezes chamado de diagrama de Pareto. 30 peças fora de contorno e 3 peças com rebarbas. em 1985.4. 747. seguido pelos modelos 757. ql' e o canto direito (ou superior) no terceiro quartil.12. Note que o modelo 737 foi o mais popular. em um conjunto de pontos. tais como círculos abertos e fechados. ""'" EXERCÍCIOS PARA A SEÇÃO 2.1. 2. na potência do motor. . discutiremos esse tipo de dados. Construa uma distribuição de freqüência e histograma. Algumas vezes. com 16 intervalos de classe.9. cada observação pode consistir em uma medida de milhas por galão.3 2.14. Construa uma distribuição de freqüência e histograma para os dados de rendimento do Exercício 2. pela Compa. Os diagramas de caixa são muito úteis em comparações gráficas entre conjuntos de dados. ramo e folhas e o histograma fornecem impressões visuais geraiS"acerca de um conjunto de dados. 2.9 Produção de aviões em 1985. tais como x ou s fornecem informação sobre somente uma característica dos dados. . modos de falha ou problemas nos produtos/processos. 2. Os dois histogramas apresentam informação similar? o 2. diagramas' de caixa são chamados de diagramas de caixa e linha. Em muitos casos. ou seja. trabalhamos com dados em que cada observação consiste em várias medidas. Q 2. 767 e 707.3. ~ 2. com o canto esquerdo (ou inferior) no primeiro quartil. Nesta seção.10. pítulos mais adiante. símbolos diferentes. Use oito intervalos de classe.(l) ~ E Nos ca- nhia Boeing.!l! (l) ro ~1J 1J'" :? (l) .3 veículo. 5 peças não lubrificadas. no peso do veículo e no comprimento do ".) Um diagrama de caixa apresenta três quartis. Suponha que a seguinte informação sobre defeitos estruturais nas portas dos automóveis seja obtida: 4 arranhões. O diagrama de caixa é uma apresentação gráfica que descreve simultaneamente várias características importantes de um conjunto de dados. 21 peças subaparadas.13. temos nos concentrado em métodos descritivos para a situação em que cada observação. Por exemplo. e assim por diante. Por exemplo. em que as categorias geralmente representam tipos diferentes de defeitos. é chamado de outlier. o mínimo e o máximo dos dados em uma caixa retangular. 2. Dados mais afastados do que os bigodes são graficados como pontos individuais. (Fonte: Companhia Boeing. I A Fig. mostrados na Tabela 2. 2. uma vez que têm alto impacto visual e são fáceis de entender. desvio da simetria e identificação das observações que estão surpreendentemente longe do seio dos dados.5 interquartil do terceiro quartil. Modelo do avião Fig. Q 2. q3. seguida pela categoria com a segunda maior freqüência. A inspeção dessa apresentação revela que existe muito mais variabilidade na planta 2 e que as plantas 2 e 3 precisam melhorar o desempenho de seus índices da qualidade. Construa uma distribuição de freqüências e histograma para os dados do teor de algodão do Exercício 2. em um estudo de rnilhagem de gasolina. enquanto quantidades numéricas. em três plantas de fabricação. 707 747 250 100 ~º -150737 767 . (Essas observações são chamadas "outliers". Uma linha estende-se de cada extremidade da caixa. a Fig. pode ser creditada apenas a umas poucas categorias.1.20 SUMÁRIO E ApRESENTAÇÃO DE DAOOS EXEMPLO 2. D Construa uma distribuição de freqüência e histograma para os dados de octanagem do combustível para motor do Exercício 2. são usados para identificar os dois tipos de outliers. Há também dois suaves outliers em cada extremidade dos dados. Uma linha é desenhada.~~ 50 z.12 mostra os diagramas comparativos de caixa para o índice da qualidade de fabricação em equipamentos semicondutores. Um ponto a mais de 3 faixas interquartis da extremidade da caixa é chamado de outlier extremo. 2. Pareto e eles geralmente exibem a lei de Pareto. A caixa inclui a amplitude interquartil. porque os bigodes da direita e da esquerda e os comprimentos das caixas da direita e da esquerda ao redor da mediana são aproximadamente os mesmos. Esse gráfico é largamente empregado nos esforços de melhoria da qualidade. 8 fendas perdidas.9. Compare sua forma com aquela do histograma com oito intervalos de classe do Exercício 2. Construa um diagrama de Pareto e interprete. no segundo quartil (que é o percentil50 ou a mediana). a maioria dos defeitos. para os dados de octanagem do combustível para motor do Exercício 2.11 representa o diagrama de caixa obtido pelo Minitab. Ver Exercício 2. A linha superior começa no terceiro quartil indo até o maior valor do conjunto de pontos dentro das faixas de 1. dispersão.11. Diagrama de Pareto.LOO -.) ----------2. 6 itens arrumados fora da seqüência.

4. (b) Construa um diagrama de caixa dos dados.4 ---------2.5 rQR •• I :( raR 01< 1. Comente sua resposta. 2. 2.8. 1956. (b) Encontre a mediana. (a) Calcule a média da amostra. 950. o Outliers '\/ o Outlierextremo 1 •• / o f. até o maior ponto dado que esteja na faixa de 1.8.5 interquarti. 948. 5. 1. até o menor ponto dado que esteja na faixa de 1.5 IQR 01< Fig. em dias consecutivos.0. 5.91. de naftaleno. (a) Encontre os quartis inferior e superior de temperatura. Fig. 4.17. 5.19. (c) Construa um diagrama de caixa dos dados. 4. Comente o que encontrou.SUMÁRIO E APRESENTAÇÃO DE DADOS 21 A linha se estende.8 e 5. pp. 3.7. registradas em bateladas sucessivas de um processo de fabricação de semicondutores (unidades em °F): 953. 957. 2. investigando o efeito de muitas variáveis de processos na oxidação.3.+--l. a variância e o desvio-padrão da amostra. 3. (b) Calcule a variância e o desvio-padrão da amostra. 3.11 Diagrama de caixa para os dados de resistência à compressão na Tabela 2. 2.8. Planta :2 'õ u 'O c'" '" . 1. (c) Construa um diagrama de caixa dos dados e comente sobre a informação nesse diagrama. 954 e 955.1. 2. Os seguintes dados são as temperaturas.1.5 interquarti.5 rQR •• 1. 2.92. (a) Calcule a média e o desvio-padrão da amostra.12 Diagramas de caixa comparativos de um indice de qualidade em três plantas. Naquele exercício. (c) Isole a maior observação (100) e refaça os itens (a) e (b).1. 3. 2.0. (c) Isole a menor observação (31°F) e recalcule as quantidades das partes (a) e (b).09.7.75. o Exercício 2. (b) Encontre a mediana. ""'" D As nove medidas que seguem são temperaturas de fornalha. (b) Calcule a variância e o desvio-padrão da amostra.E Q) Q) ::> Q) 90 100 80 3150 200 250 70 120 2 110 Fig.15. (d) Encontre os percentis 5% e 95% da temperatura.2. sem mudar o valor da mediana? (c) Construa um diagrama de caixa dos dados.8. 4.35.62. 4.18.. em fase vapor. 3. a partir do terceiro quartil. 955.0. 3. 951. 949.20. De quanto a maior medida de temperatura poderia aumentar. Um artigo no Transactions of the !nstitution of Chemical Engineers (Vol. a partir dos dados. 2. 2. 3.2. um diagrama de caixa e comente a possível presença de outliers. desejava-se encontrar a média e o desvio-padrão da amostra de temperatura. . (b) Construa um diagrama de caixa dos dados. 4. Você calculou a média.8. O "tempo de ignição fria" de um motor de carro está sendo investigado por um fabricante de gasolina.14 apresentou as temperaturas na junção dos anéis (graus Fahrenheit) para cada lançamento de teste ou real do foguete espacial.6. 2.15. 3. Os seguintes tempos (em segundos) foram obtidos em um veículo de teste: 1.0. O Exercício 1. 2. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. (a) Calcule a média. do efluente na descarga de uma unidade de tratamento de esgoto: 43 45 49 47 52 45 51 46 44 48 51 50 52 44 48 50 49 50 46 46 49 49 51 50 (a) Calcule a média e a mediana da amostra.0. 2. a partir do primeiro quartil. (a) Encontre os quartis inferior e superior dos coeficientes de arraste.13 apresenta coeficientes de arraste para o aerofólio 0012 da NASA.10 Descrição de um diagrama de caixa. 34. A iinha se estende. EXERCíCIOS PARA A SEÇÃO 2. Q 2.16. a variância e o desvio-padrão da amostra de todos aqueles coeficientes. Quão diferentes são as outras temperaturas em relação a esse menor valor? (d) Construa.53 e 1. 280-293) reportou dados sobre um experimento.3.

p. considere a Fig.5 que o tempo é um fator importante que contribui para a variabilidade dos dados e os métodos gráficos acima mencionados não levam isso em consideração.. Esse gráfico resume 30 observações de concentração no produ- Folha Ramo Gráficode série temDoral 5 7 189 24 23 22 21 20 • • • • • .. dias. considerando que essas observações são registradas na ordem em que elas ocorre- 1982 1983 19841985 1986 1987 (a) 1988 1989 19901991 Anos ><: g ""O C Q) > 2 3 4 2 3 (b) 4 1989 1990 234 1991 Quadrimestres Fig.22 SUMÁRIO E APRESENTAÇÃO DE DADOS 2. são métodos visuais muito úteis para mostrar a variabilidade nos dados. 2. etc. Uma série temporal ou seqüência temporal é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. maiores do que as vendas durante o terceiro e o quarto trimestres. ~~f • 8 7 6 Fig. .13 Vendas da companhia por ano (a) e por quadrimestre (b). ' . notamos na Seção 1.. com as vendas no primeiro e no segundo trimestres sendo. O gráfico digiponto na Fig. Um gráfico de série temporal é aquele em que o eixo vertical denota o valor observado da variável (por exemplo. 13(a). 2.15 nos conta um fato diferente. 42.J .. Por exemplo. ciclos ou outras características gerais dos dados que não poderiam ser vistos de outra forma. Stuart Hunter (The American Statiscian. geralmente. 13 12 11 • 15 7 7 10 9 • • r · • • • '.· vf·~. A Fig. 2. anos. pode ser muito útil combinar um gráfico de série temporal com algumas outras apresentações gráficas que consideramos previamente. Entretanto. 2. durante os últimos 10 anos. como histogramas.14 Gráfico digiponto dos dados de resistência à compressão na Tabela 2. VoI.). diagramas de ramo e folhas e diagramas de caixa. 2. ramo Esse diagrama apresenta efetivamente a variabilidade global nos dados de resistência à compressão e mostra. Existe alguma variabilidade em tomo dessa tendência. Algumas vezes. freqüentemente vemos tendências. . \ • • .67. A Fig. a variabilidade nessas medidas ao longo do tempo. 2. 54) sugeriu combinar o diagrama de ramo e folhas com o gráfico de série temporal para formar um gráfico digiponto. A impressão geral é que a resistência à compressão varia em tomo do valor médio de 162.5 GRÁFICOS SEQÜENCIAIS DE TEMPO As apresentações gráficas que temos considerado.simultaneamente. que apresenta um gráfico de série temporal das vendas anuais de uma companhia..1.14 mostra um gráfico digiponto para as observações de resistência à compressão da Tabela 2.13(b) mostra os últimos três anos de vendas registradas no trimestre.. J. não havendo padrão óbvio forte nessa variabilidade ao longo do tempo. A impressão geral desse gráfico é que as vendas mostraram uma tendência para cima. Quando as medidas são plotadas como uma série temporal. • •• <I' r······ • .1. Ã • ~• • • • 8 7108 960934 0361410 8544162106 3073050879 471340886808 29583169 413535 103 580 19 18 17 16 15 14 • • \ . Esse gráfico mostra claramente que as vendas anuais nesse negócio exibem uma variabilidade cíclica no trimestre. x) e o eixo horizontal denota o tempo (que poderia ser minutos. 1988. com algumas vendas anuais aumentando sobre aquelas do último ano e algumas vendas anuais diminuindo.

então a operação desse processo poderá ser melhorada.9 força Construa As A201 e interprete um para um digiponto é medida em um teste especificações 2.8 16.2 48.4 )1.3 12.0 47. alguma coisa pode ter ocorrido no processo. Em seu livro Time Series Analysis.1 16. Em seu livro Forecasting and Time Series Analysis. de 1770 a 1869. Box.5 16. Jenkis e G.4 6.1. S. da esquerda para a direita).2 9.5 16.5 48. da esquerda para a direita)._e e\ • · li · • /\·/v.5 43. Johnson e 1. Reinsel apresentam leituras de concentração de um processo químico. •• . porém. Se essa variabilidade na concentração de saída do produto puder ser reduzida. sendo mostrados abaixo e em ordem (leia para baixo e.4. D. 1990).9 7. Montgomery. EXERCÍCIOS PARA A SEÇÃO 2. gráfico conector ou um diagrana viscosidade do produto são em 48 48.6 43. esse processo produziu concentrações geralmente acima de 85 g/l.6 O O O Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados. que resultou em concentrações mais baixas.6 43.5 48. Fig.3 16.1 48. então.0 48. 1994). (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados. 16. Alguns desses dados são mostrados a seguir (leia para baixo e.2 8.1 17.24. depois desse tempo.9 17.1 16.8 42.SUMÁRIO E APRESENTAÇÃO DE DADOS 23 Folha Ramo Grálicode série temporal 2333 45 0010000 66677 99998 45 9s 8t 8s 9f 8e ge 8z81 9t 9z 8 · · / IV f\J. .1 16.7 5. E. L.2 7. M. observadas dehora em hora.6 17. Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas dos dados.15 Gráfico digiponto das leituras de concentração de um processo químico. pelos passageiros da United Kingdom. Os seguintes dados são medidas de viscosidade para um produto químico observado de hora em hora (leia para baixo e.9 47. 225 248 203 195 249 (a) (b) 195 255 245 235 220 199 183 213 236 245 190 175 178 175 190 2.2 17. 2. então. 17.3 43. mensalmente.9 3. Os números anuais Wolfer de manchas solares. ver o livro de Box.dados.3 17.5 2. G.0 4. referenciado no Exercício 2.4 ""'" ""'" ""'" 48.25. and Control (Prentice Ral!.8 17.8 17.9 2. Gardiner analisam os dados na Tabela 2. então. em que as observações são registradas em intervalos de uma hora. Forecasting.) (a) Construa um diagrama da série temporal desses dados. a seguir (na poral desses para a direita): 40e um diagrama de série tem-então.1 43.6 245 251 212 187 238 185 194 218 210 209 198 249 220 48.5.0 17.5 12. são mostrados na Tabela 2. ma esquerda ordem em e para ramo 241 Construa um diagrama da série temporal dos dados.7 16. O College ofEngineering and Applied Science na Arizona State University tem um sistema V AX de computadores. feitas a cada duas horas.1 11.2 de remoção 42. to na saída de um processo químico.2 10.9 47. P.4 que foram corpos deleia parasão mostrados de laboratório. Jenkins e Reinsel. A. da separado de Dados folhas medidos.7 17. 48. C." edição (McGraw-Rill. da esquerda para a direita).3 6.24.4 18. 5.9 17. C. G. prova baixo e.J'v f\\~ ~. nho Construa e interprete um diagrama de série temporal desses dados.8 43.5 8.22.21.0 17. que correspondem ao total de milhas voadas. Esse diagrama indica que durante as primeiras 20 horas de operação.26.2 10. A análise deles requer algum conhecimento avançado de estatística e construção de modelo estatístico. Os tempos de resposta para 20 tarefas consecutivas foram registrados. (Para uma análise interesssante e uma interpretação desses números.0 17. 2. entre 1964 e 1970 (em !TIÍlhões de milhas). _.3 47.

882 13.948 7.829 10.994 8.078 12.685 10.444 12.Você acha que o valor médio calculado aqui é suficien- 2.852 10.030 pelos Passageiros da United Kingdom Voadas Mês (a) Desenhe um diagrama de série temporal dos dados e comente qualquer característica aparente desses dados. a operadora tenha de calibrar o aparelho e usar um material reagente.057 13.4.109 10. Exercícios Suplementares 2.350 10.x3 = 47.280 12.491 8.638 10.665 10.775 7.333 10.8.2.0.731 14. (c) Suponha que. Quais as maiores fontes de variabilidade que você imagina para esse experimento? Por que é desejável ter uma pequena variância dessas medidas? Uma amostra com resistores resultou as seguintes resistências (ohms):x] = 45.588 8.281 12.607 9.334 9.371 7.484 8.094 7.925 9.537 13.829 8. 67.290 8.24 1849118 1833 138 185047 185138 1830 66 183148 1867 50 184137 184063 181535 1862 2 1814 ApRESENTAÇÃO DE DADOS 71 14 13 11 1836 1311 1800 154 1834 101 1848 132 1858 103 1846 124 1822 122 1824 20 1823 24 1847 23 1837 68 1835 66 182560 185941 180983 183267 182190 1845 92 1868 85 1869 31 185382 185235 1805E 7 1807 43 1855 10 1798 42 1796 28 1860 98 1864 37 1839 40 1838 28 1828 51 1826 77 180134 1827 74 180245 1810 57 1799 47 185421 182967 1808 94 185723 1856 96 180628 1797 36 1820 64 1843 54 181830 184224 181741 1811 62 1866 39 181646 1844 55 186530 181924 1861 9 1803 4 1804 7 1795 6 1812 5 1863 O 1813 8 12 17 10 16 15 86 SUMÁRIO 125 1770 Tabela 2.417 16.953 11.682 10. para que se possa afirmar que a solução tenha atingido o alvo? Justifique sua resposta.637 14.252 9.161 Tabela 2.248 9.819 12.234 15.27. (a) Calcule a variância e o desvio-padrão da amostra.3 (g/l). (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.864 7.667 10.801 10.185 9.772 7.933 14. Ela obtém os seguintes dados: 63.455 9.775 11.1 e 65. temente próximo do valor alvo.179 10.577 11.x4 = 41.894 10.899 11. Suponha que o valor desejado para essa solução tenha sido especificado em 65 g/ 1. para medir a concentração.x2 = 38. 65.594 7.253 13. .222 11. (b) Calcule a variância e o desvio-padrão da amostra.794 11. usando o método da Eq.xs = 35 eX6 = 43.614 7.282 8.269 12.069 8.366 10.645 7.840 12.857 12.391 11.1.186 14.759 6.4 Números Anuais de Manchas Solares 1970 1968 1967 1965 1966 1969 1964 10.402 8.103 13.246 10.770 12. (a) Calcule a média da amostra. A concentração de uma solução é medida seis vezes por uma operadora que usa o mesmo instrumento.730 8.919 8.110 9.389 9.933 9. 64.589 11.424 13.5 Milhas 11.147 10. 65.637 12.396 9. 1.639 8.772 12.28.812 13.436 10.

Compare seus resultados com aqueles obtidos no item (a). que representam ciclos de falhas de um tecido: 675.3 13. 375. 10 e 6. Os dados mostrados na Tabela 2. 487495) apresenta dados de viscosidade de um processo químico em batelada.8 13. Há alguma coisa "especial" sobre o valor constante 1.3. você poderia usar os resultados dos itens anteriores desse problema. Há alguma evidência de que houve um aumento ou diminuição no número médio de erros em um conjunto de caracteres? Explique.9 14. (b) Encontre a média da amostra e o desvio-padrão. (a) Construa um diagrama de ramo e folhas dos dados. 10. (a) 2.1 15. faça y* (novo valor) = log(y) (valor antigo). 5 12 11 3113 2 9 7144 O 26 99 47 1 13 35 8 15 12 1918 4 12486Um canal de comunicação está sendo monitorado pelo registro O 17 Leia os dados erros em20 desses a direita.9 12. estatisticamente. Calcule a amplitude.000. 7.7.8. 6. 1992.0.6 Lendo para 14.150. tais como . (b) Calcule a amplitude. pp. para encontrar S2 e s? Um artigo no Transactions 01 tlle Institution 01 Cllemical Engineers (Vol. 4.0 de cada observação.1 15.0.9 14.SUMÁRIO E APRESENTAÇÃO DE DADOS 25 2. 1.30.8. 3. (b) Transforme os dados usando logaritmos. 13. enquanto as 40 últimas observações foram geradas a partir de um processo diferente.6 14. Calcule a variância e o desvio-padrão da amostra. 6. com um tamanho igual a 50. 2. fabricadas durante os 40 dias? Explique. Um fabricante de molas está interessado em implementar um sistema de controle da qualidade para monitorar seu processo de produção. de da para um conjunto de 3 2.2 16. mas primeiro subtraia o número 1.33.0. uma transformação por alguma função matemática aplicada aos dados originais. 4. Compare seus resultados com aqueles obtidos nos itens (a) e (b) e justifique sua resposta. desenhe um baixo diagrama.6 e da esquerda para a direita. 5.2.1. considere os seguintes dados. ou seja.8 16.4 13.2 16. Um artigo em Quality Engineering (VaI. (c) Construa um diagrama de série temporal dos dados. 4. Você concluiria que ambas as amostras exibem a mesma variabilidade? Explique. foi decidido registrar o número de molas fora de conformidade. Leia os dados da esquerda para a direita. Para ilustrar o efeito de uma transformação.6.3 16.8.32. Construa um diagrama de ramo e folhas dos dados. (a) (b) (c) . Essas quantidades indicam que ambos os processos resultam no mesmo nível de média? E a mesma variabilidade? Explique. 4.0 15. 8. 1. 2.8 e (b) 2. 8.8 16.4 13. 3. a variância e o desvio-padrão da amostra novamente. Explique por que os resultados são iguais aos do item (a).6 14. O gráfico indica que os dois processos geram resultados similares? (c) Calcule a média e a variância das 40 primeiras observações. Construa um diagrama da série temporal dos dados.7 15. Transformações. (a) Calcule a amplitude para ambas as amostras. (b) Calcule o desvio-padrão de ambas as amostras. 280-293) reportou dados sobre um experimento.3. 3. 4.2.31. 8 e 6. (b) 5.6 17.4 15.3 15.0. 4. (a) Construa um diagrama de série temporal dos dados e comente qualquer característica dos dados que seja revelada por esse diagrama. 34. 2. Uma amostra desses dados é apresentada a seguir. usando a definição da Eq. (c) Escreva um curto texto contrastando a amplitude da amos11 19 8 1 2. Essas quantidades indicam que ambas as amostras têm a mesma variabilidade? Explique. 2. 2.29.8 14.0 ou algum outro valor qualquer poderia ter dado os mesmos resultados? Considere as duas amostras dadas abaixo: Amostra 1: 10. do que os dados originais. 1956. 380.3.6 representam as vendas mensais de champanhe na França (1962-1969). Durante 40 dias de produção. (d) Se as resistências fossem 450.5 14.1 16.9 13.000 bits. 100.7 14. 4. 3. 350 e 430 ohms.3.3 14. a variância e o desvio-padrão da amostra. (c) Não use a medida da resistência igual a 35 e calcule S2 e s.650.0 14. Encontre a média da amostra e o desvio-padrão.5 15.8. calcule esses valores para as 40 últimas observações. então. investigando o efeito de muitas variáveis de processos na oxidação em fase vapor de naftaleno.1.caracteres (string) de do número Dados esquerda para conjuntos são vistos a seguir. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. 290. Em alguns conjuntos de dados.7. 5. 40 bateladas de dados foram coletadas sendo reportadas aqui. (b) Pergunte-se como você usaria um procedimento gráfico para prever vendas mensais de champanhe para o ano de 1970. como medida de variabilidade. 1. 5. pode resultar em dados que sejam mais fáceis de trabalhar. Construa um diagrama de caixa dos dados transformados e comente o efeito da transformação.2 15. Há alguma evidência de que houve um aumento ou diminuição no número médio de molas fora de conformidade.8.0.34.35. 410.4 15. Amostra 2: 10. característica dos dadostodos seja dados e comente qualquer de série temporal de que os revelada por esse diagrama 2. Considere a noção de que as 40 primeiras observações foram geradas a partir de um processo específico. (a) Construa um diagrama de caixa e comente a forma da distribuição dos dados. 9. pp. 175. 6. em cada batelada de produção. Como parte desse sistema de qualidade. 3.jY ou log(y). 3. 470. em milhares de garrafas. 10.0 13. 8.tra com o desvio-padrão da amostra.

031 3.639 4.38.591 9.221 4.858 5.842 3.922 4.010 4.260 2.212 3.048 3. (b) (c) Mostre que ns.934 4.006 3. 36. 51.286 4.776 1.132 3. respectivamente.424 3.076 1963 12.x" e tenhamos calculado x" e s~ para a amostra. Nov. Maio Abril Fev.968 3.755 2. entre a média da amostra x e a mediana da amostra X. que T% das observações sejam removidas de cada extremidade e que a média da amostra dos números restantes seja calculada.874 3.633 9. uma (n + l)-ésima observação se torna disponíveL Faça xn + 1 e s. Dez.282 2. (c) Compare os valores calculados nos itens (a) e (b) com a média e a mediana da amostra para os dados do Exercício 2. usando todas as n + 1 observações.528 5.. .986 3. Use os resultados dos itens (a) e (b) para calcular a nova média e o desvio-padrão da amostra para os da- dos do Exercício 2. sob condições de temperatura elevada.162 1. 2. (b) Calcule a média 20% podada para os dados de rendimento do Exercício 2.663 2.39.37.851 2.739 8.738 4.633 13. Jan.230 3.036 2.475 3.651 1969 11.541 3. Agosto Agosto Agosto EXERCÍCIOS PARA EXPANDIR A MENTE 2. em horas. Há muita diferença entre essas quantidades? Por quê? A Média Podada (Trímmeá).838 1. Out. + _n_ n+1 (xn+ l-X..946 3. + 1 = (n -1) s. Suponha que o tamanho da amostra n seja tal que a quantidade nTI100 não seja um inteiro. Suponha que os dados estejam arranjados em ordem crescente.088 3.222 1. Há alguma medida significante de localização que possa ser calculada para esses dados? Qual é o seu valor numérico? 2.670 2.375 7.523 3.539 3.211 Junho Julho Maio Set. Dez.927 3..266 2.718 4.357 6.) Oito componentes foram testados com os seguintes tempos resultantes de falha: 75.764 5. Abril Junho Dez.672 2.217 6.643 10. Por quê? (a) Calcule a média 10% podada para os dados de rendimento do Exercício 2. Jan.899 5.474 5.676 5. A média podada está. Julho Out.4.740 2.016 7.314 5. (a) Mostre como xn + I pode ser calculado.803 1964 1.957 9.659 3.292 4. Um experimento para investigar o tempo de sobrevivência.370 5.851 6.276 4. de um componente eletrônico.981 1.&73 5. A quantidade resultante é chamada de média podada. .10 e compare-a com a quantidade encontrada no item (a).614 4.647 4.. Suponha que tenhamos uma amostra x. . Nov. Mês Ano 4.753 3.965 8.36.26 SUMÁRIO E APRESENTAÇÃO DE DADOS Tabela 2. Dez. (Isso é chamado teste "acelerado" de vida.028 3. 45. 100+. A Média Podada (Trimmeá). Fev.6 Vendas de Champanhe na França Ano Jan.154 4.677 2.922 9.301 4.759 4.916 1967 10.271 2. Mar.520 4.113 3.821 2. Xz. Agora.254 4. quando a nova observação for = 46.428 6.047 4.)2.10.986 3. 63. 80 e 90.595 4. A observação "100+" indica que a unidade ainda funcionou no tempo de 100 horas.573 13.514 4.121 4. Desenvolva um procedimento para obter uma média podada nesse caso. geralmente.723 Vendas 1966 3.331 6.937 3.28. Set. usando x" e xll+1" x7 2. + 1 ser a média e a variância da amostra. Mar. consiste em colocar as partes em uma célula de teste e corrê-Ias durante 100 horas.510 1.