<T2 conhecida T2 desconhecida H): <T2 H): H( <Po > <TÕ p

<

2

<Xo 2

Estatísticae,fZal2 I.l.o Gráfico dos --Za I.l.o IJ- 2 H):p""po < Zas/"Iht Parâmetroh dCurvaCO <T/"Iht k, Xa/2,n-1 m,n -ta,n-) 2=zo> -ta,n-) Zo Alternativa Apêndice<T/<To Resumo dosHo: <T2 =H):Nula<""c,dddenpo de Hipóteses para Uma Amostra ProcedimentosIZol""<I.l.o I.l.)/<T (I.l.o c, l.l.ol/<T CritériosI= ---- - de Ho:HipóteseddIJ-oIZol II.l.Za/2 1J-01/<T H'o: I.l. H):Po2>= (IJ-oIJ-oI.l.o)/<T Ho: P I.l. H):[tolI.l. (IJ-xVITestes <TÕzo> >-- -Za l)s2 IJ-o<T2 >x(n <TÕ Teste Zo IJ-o i,j to>À g, I.l.o)/<T ou Xo to(I.l. ta/2,n-1 > a,b II.l. H):dH):p>po -ZaI.l.)/<T I.l.Rejeição IJ-< "" para X)-a/2,n-) Ynpo(l - Po) Curva CO

= == = =

Resumo dos Procedimentos

para Intervalo de Confiança para Uma Amostra x s2 x p Estimativa Intervalo Bilateral de Confiança de 100(1 - a)% x - Zaf20"/v/;z :S
JJ.

a 0"2desconhecida ção binomial p 3.

Média JJ., deou Tipodistribuição uma normal Variância 0"2de uma distribuição Média JJ. com parâmetro 0"2conhecida com variância de Pontual normal Proporção uma de Problema

:S x :S x

+ +

Zaf20"/v/;z taf2.n -1 s/v/;z

x - taf2.n _ I s/v/;z :S

JJ.

(112- l)s2 :S 0"2:s ~ - l)s2 Xa/2,n- I X j-af2,n-j

p - Zaf2· Jp(l 11 fi) :S P :S P A

A

+

Zaf2

Jfi(l - p)

Estatística Aplicada e Probabilidade para Engenheiros .

Se.Departamento de Engenharia Química Escola de Química/UFR] LTC EDITORA . Montgomery Arizona State University George C.Estatística Aplicada e Probabilidade para Engenheiros Segunda Edição Douglas C. Praf. Verôniea Calado. Adjunto . Runger Arizona State University Tradução: Profa. D.

2nd edition Copyright © 1999 John Wiley & Sons. U Vooo 3&973 LJ Applied Statistics and Probability for Engineers.br www.No interesse de difusão da cultura e do conhecimento.A. Jnc.: 21-3970-9480 Fax: 21-2221-3202 Itc@ltceditora. inadvertidamente.Livros Técnicos e Científicos Editora S. RJ . a identificação de algum deles tenha sido omitida. 11 Rio de Janeiro. os autores e os editores envidaram o máximo esforço para localizar os detentores dos direitos au~orais de qualquer material utilizado. dispondo-se a possíveis acertos posteriores caso.CEP 20040-040 Tel. All rights reserved. Authorized translation from the English language edition published by John Wiley & Sons. Direitos exclusivos para a língua portuguesa Copyright © 2003 by LTC . Jnc.com.1tceditora. Travessa do Ouvidor.br .com.

Elisa e Rebecca . George.Para: Meredith. Colin e Cheryl Taylor. Neil.

. Escrevemos este livro de modo que ele pudesse ser usado para um único curso. processo de solucionar problemas de engenharia. Os Caps. enfatizando as cartas de *Isto va'le não só para os EUA. os histogramas. O Capo 7 começa o tratamento da inferência estatística com estimação de parâmetros. é a única do na primeira edição. Este capítulo introduz também os conceitos de amostragem aleatória. Apresenria. valores esperados. Introduzimos também o bootstrap como uma técnica para encontrar o erro-padrão de uma estimativa. Trabalhamos arduamente de modo a assegurar que todos os nossos exemplos e exercícios estivessem baseados em engenharia e. Uma porção significante desse esforço de melhoria da qualidade será comandada por engenheiros e cientistas. 3. Este capítulo introduz também o leitor em algumas aplicações de estatística em engenharia. Infelizmente. Damos um desenvolvimento lógico e heurístico dos procedimentos. 5 e 6 cobrem os conceitos básicos de probabilidade. muitos engenheiros fazem apenas um curso de estatística.) controle e os fundamentos no controle estatístico de processo. Queremos que os estudantes se tornem familiarizados com o modo como essas técnicas são usadas para resolver problemas de engenharia do mundo real e conseguir algum entendimento dos conceitos por trás deles. algumas das importantes propriedades dos estimadores. Acreditamos que essa abordagem servirá melhor aos estudantes de engenharia e os permitirá concentrar-se nas muitas aplicações de estatística nessas disciplinas. na meterão dificuldade em ler quase todo o texto. usa. Demos um tratamento razoavelmente completo desses tópicos. (N. Estes tópicos serão discutidos em mais detalhes nos capítulos subseqüentes. Usamos álgebra matricial em todo o material de regresMantivemos o nível relativamente modesto de matemática. Acreditamos que os engenheiros de todas as áreas deveriam cursar estatística. variáveis aleatórias contínuas e discretas. porque eles provêem os engenheiros com métodos descritivos e analíticos para lidar com a variabilidade nos dados observados. e com múltiplos fatores respectivamente. Métodos estatísticos são uma importante ferramenta nessas atividades. Fizemos um certo número de melhomatricial para entender a apresentação deste material. elegemos focalizar o público voltado para engenharia. não tações de aritmética escalar para regressão múltipla são. porque.graduação em engenharia estão expostos à bastante álgebra todologia e como aplicá-la. 4. tais como negócios ou gestão. O material foi extensivamente reescrito e reorganizado. mas um entendimento da me. planejamentos fatoriais. o método da máxima verossimilhança. interações. 12 e 13 lidam com experimentos com um único fator reescrevendo grandes porções de vários capítulos. as ciências da vida e as ciências sociais. juntamente com informações detalhadas e exemplos de métodos para determinar os tamanhos apropriados das amostras. sendo também aqueles que melhoram os sistemas existentes. 11). porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e processos dé fabricação.R. O Capo 14 fornece uma breve introdução aos métodos e aplicações de estatística não paramétrica. embora tenhamos fornecido material suficiente para dois cursos.são múltipla (Cap. O Capo 15 introduz o leitor no controle estatístico da qualidade. 10 e 11 apresentam a regressão linear simples e ORGANIZAÇÃO DO LIVRO múltipla. por causa de outras necessidades. na esperança de que mais estudantes de engenharia vejam as aplicações importantes de estatística em seus trabalhos diários e façam um segundo curso. Percebemos que os estudantes de engenhamaneira fácil de entender os conceitos apresentados. Teste de hipóteses e intervalos de confiança para médias. Os Caps. 8 e 9 discutem a inferência estatística para uma única amostra e para duas amostras respectivamente. usamos exemplos de dados reais . em quase todos os casos. que tenham completado um ou dois seme_stresde cálculo. como de resto para todos os países de economia aberta. Enfatizam-se as noções O Capo 1 é uma introdução ao campo da estatística e como de aleatoriedade. em vez de um desenvolvimento teórico formal. o planejamento de experimentos em engenharia e o monitoramento de processos de fabricação. incluindo a construção de modelos empíricos. os diagramas de caixa e vários tipos de gráficos de séries temporais. Acreditamos que este livro também sirva como uma referência útil. E nossa intenção dar lhor das hipóteses. Este é um livro introdutório para um primeiro curso em estatística aplicada e probabilidade para estudantes de graduação em engenharia e ciências físicas ou químicas. Os Caps. distribuições conjuntas de probabilidade e de independência. porém evitamos muitos dos detalhes matemáticos ou mais teóricos.Prefácio A indústria americana* tem de continuar a melhorar a qualidade de seus produtos e serviços se quiser continuar a competir efetivamente nos mercados interno e externo. incluindo a reorganização de algum material e Os Caps. rias nesta edição. Discutimos e ilustramos métodos simples para resumir e descrever dados. . os 'engenheiros usam a metodologia estatística como parte do análise gráfica dos dados e planejamentos fatoriais fracionários. O Capo 2 continua a apresentação da descrição de dados e foca os diagramas de ramo e folhas. bem francamente. variâncias e proporções são apresentados.tomados de fonte publicada ou baseados em nossas experiências como consultores. distribuições amostrais e o teorema central do limite. blocagem. inconvenientes e notamos que os alunos de ao leitor não a teoria matemática. Enquanto muitos dos métodos que apresentamos são fundamentais para análise estatística em outras disciplinas.

Smiley Cheng pela permissão para adaptar muitas das tabelas estatísticas de seu excelente livro (com Dr. Statistical Tables for Classroom and Exam Roam. à mudança de técnicas de variáveis. muitos dos problemas propostos para reforçar o entendimento dos conceitos. Percebemos que isso melhorou grande mente o andamento do curso e o entendimento do material por parte do estudante. damos uma introdução ao planejamento de experimentos dos Caps. explicaremos porém como usamos o livro. Isso nos deixa cerca de três a quatro períodos para exames e revisão. Através de todo o livro. tão logo ela seja discutida em classe. então é possível cobrir o livro inteiro. cobrimos todo o Capo 1 e o 2 (em três ou quatro aulas). Não saturamos o livro com exemplos de muitos pacotes diferentes. USANDO O COMPUTADOR Na prática. Cada capítulo tem uma coleção extensiva de exercícios. e exercícios para expandir a mente. a permutações e métodos de contagem. discutimos a maior parte dos Caps. há problemas que sentimos que deveriam ser trabalhados usando pacote no computador. se apropriado para os estudantes. que é tão freqüentemente dado a engenheiros. o Instirute of Mathematical Statistics e os editores da Biometrics por nos permitirem usar o material com direitos autorais. hesitamos em dar um número demasiado de conselhos. Este não é um curso "infantil de matemática-estatística". incluindo exercícios de final de seção. versões para estudantes. porque as idéias dos professores variam muito acerca do que deveria estar em um primeiro curso de estatística para engenheiros. Em nossas próprias aulas. levamos um notebook PC e um mostrador de cristal líquido. Vamos enfatizar que a finalidade deste curso é introduzir os engenheiros no modo como a estatística pode ser usada para resolver problemas de engenharia do mundo real e não para afugentar os estudantes menos agraciados matematicamente. incluindo as cartas de controle Shewart do Capo 15 (seis aulas). Acreditamos que um primeiro curso de estatística para engenheiros deveria ser principalmente um curso de estatística aplicada e não um curso de probabilidade. que podem comprar sua própria cópia ou usar os produtos disponíveis nas redes locais de computadores. Somos também gratos ao DI. Conseqüentemente. revisamos o material de probabilidade. porque a forma como o professor integra o pacote em sala de aula é muito mais importante do que qual pacote é usado. JMP e SPSS. Obviamente. Esse material inclui uma introdução a funções geradoras de momentos. tais como EXCEL. Em alguns capítulos. recomendamos fortemente que o computador seja integrado na aula. incluindo algum material dos apêndices. e mostramos como a técnica é implementada no computador. 8 e 9 sobre intervalos de confiança e testes (dez aulas). fornecemos também algum material técnico complementar nos Apêndices. usamos não somente esses pacotes como outros. Logo. à estimação de Bayes e ao princípio da ra:ão de verossimilhança. que freqüentemente requerem que o estudante estenda de algum modo o material texto ou o aplique em uma nova situação. 12 e 13 (seis aulas) e apresentamos os conceitos básicos de controle estatístico de processo. Em nosso curso de um semestre. Todos os dados no texto estão disponíveis na forma eletrônica. designar e trabalhar. Marcamos esses problemas com um símbolo especial na margem. DESIGN-EASE. Muitos professores que usaram a primeira edição forneceram excelentes sugestões que incorporamos nesta revisão. assim como as habilidades de diferentes grupos de estudantes. ST ATGRAPHICS. Para ensinar. regressão múltipla e mais planejamento de experimentos seriam os tópicos mais importantes em um segundo curso. exercícios suplementares no fim do capítulo. Prentice Hall. USANDO O LIVRO Este é um livro-texto muito flexível. introduzimos os modelos de regressão do Capo 10 (quatro aulas). que cobrem o escopo dos tópicos do capírulo. que enfatizam o material daquela seção. engenheiros usam computadores para aplicar métodos estatísticos com a finalidade de resolver problemas. Esse material pode ser de interesse para alguns professores e estudanres e o temos fornecido como uma referência. para quase todas as aulas. a baixo custo. Montgomery George C. apresentamos saídas do Minitab e SAS como exemplos típicos do que pode ser feito com pacotes estatísticos modernos. Muitos pacotes estatísticos oferecem. Douglas C. na aula. Somos gratos também a John Wiley and Sons. Runger . Se houver disponibilidade de um segundo semestre. Seria possível também AGRADECIMENTOS Gostaríamos de expressar nossa gratidão a muitas organizações e indivíduos que contribuíram para este livro. ao desenvolvimento das distribuições t e F.nii PREFÁCIO Em adição à coleção usual de tabelas e gráficos estatísticos. James Fu). colocando mais ênfase na distribuição normal (seis a oito aulas).

7 T eorema de Bayes 47 3.4 Média e Variância de uma Variável Aleatória Discreta 55 54 Sumário e Apresentação de Dados 14 2.2 Coletando Dados de Engenharia 6 1.10 Distribuições de Erlang e Gama 93 5.1 Variáveis Aleatórias Discretas 51 4.11 Distribuição de Weibull 95 Exercícios Suplementares 96 Exercícios para Expandir a Mente 97 CAPÍTULO 6 5.5 5.4 Planejando Investigações Experimentais 8 1.1 Introdução 27 3.5.2 EspaçosAmostrais 28 3.2 Julgamento Estatístico 5 1.5 Gráficos Seqüenciais de Tempo 22 Exercícios Suplementares 24 Exercícios para Expandir a Mente 26 CAPÍTULO 3 4.1 Duas Variáveis Aleatórias Discretas 98 6.1 Introdução 33 3.2 Distribuições de Probabilidades Marginais 99 .7 Distribuições Geométrica e Binomial Negativa 4.3 Funções de Distribuição Cumulativa 4.1.4 Média e Variância de uma Variável Aleatória Contínua 77 Distribuição Uniforme Contínua 78 Distribuição Normal 79 Gráficos de Probabilidade 85 Aproximações das Distribuições Binomial e de Poisson pela Normal 87 5.2 Interpretações de Probabilidade 33 3.2 Distribuições de Probabilidades e Funções Densidade de Probabilidade 73 5.2 Axiomas de Probabilidade 35 3.1.2 Distribuição Binomial Negativa 63 4.3 Modelos Mecanísticos e Empíricos 7 1.7.9 Distribuição Exponencial 89 5.5 Regras da Multiplicação e da Probabilidade Total 42 3.8 Distribuição Hipergeométrica 65 4.1.4 Probabilidade Condicional 39 3.10.8 3.7.5.3 Eventos 29 3.6 Independência 44 3.1 Distribuições de Probabilidades Conjuntas 98 6.2 Diagramas de Ramo e Folhas 14 2.1 Importância do Sumário e Apresentação de Dados 14 2.1 Regra da Multiplicação 42 3.7 5.2.1 Distribuição de Erlang 93 5.3 Distribuições de Freqüência e Histogramas 18 2.3 Regras de Adição 37 3.2 Regra da Probabilidade Total 42 3.1 Engenharia e Resolução de Problemas 1.Sumário CAPÍTULO 1 o Papel da Estatística 1 CAPÍTULO 4 na Engenharia Variáveis Aleatórias Discretas e Distribuições de Probabilidades 51 1.6 Distribuição Binomial 58 4.1.1.8 Variáveis Aleatórias 48 Exercícios Suplementares 49 Exercícios para Expandir a Mente 50 Distribuições de Probabilidades Conjuntas 98 6.6 5.4 Diagrama de Caixa (Box Plot) 20 2.3 Funções de Distribuição Cumulativa 76 5.1.1.2 Distribuição Gama 94 5.10.2.1 Espaços Amostrais e Eventos 3.1 Distribuição Geométrica 62 4.5 Distribuição Uniforme Discreta 57 4.1 Variáveis Aleatórias Contínuas Probabilidade 27 27 5.2 Distribuições de Probabilidades e Funções de Probabilidade 52 4.9 Distribuição de Poisson 68 Exercícios Suplementares 71 Exercícios para Expandir a Mente 62 n CAPÍTULO 5 Variáveis Aleatórias Contínuas e Distribuições de Probabilidade 73 73 5.1 O Método de Engenharia e o Julgamento Estatístico 1 1.5 Observando Processos ao Longo do Tempo 10 Exercícios Suplementares 13 Exercícios para Expandir a Mente 13 CAPÍTULO 2 4.

4.4 Estimativa Bootstrap do Erro·Padrão 130 7.4 Independência 111 6.1.7 Introdução a Intervalos de Confiança 139 Exercícios Suplementares 140 Exercícios para Expandir a Mente 140 CAPíTULO 8 Inferência Estatística para Duas Amostras 179 9.2.6 Tabela com Resumo dos Procedimentos de Inferência sobre uma Única Amostra 169 8.2.X SUMÁRIO Distribuições de Probabilidades Condicionais 100 Independência 101 6.3 8.1 Testes de Hipóteses para a Média 157 8.2 Erro ~ e Escolha do Tamanho da Amostra 197 9.4 Escolha do Tamanho da Amostra 160 8.3 Hipóteses Unilaterais e Bilaterais 147 8.2.1 Testes de Hipóteses para a Variância de uma População Normal 163 8.4.2 Erro [3 e Escolha do Tamanho da Amostra 164 8.8 Intervalos de Confiança Bootstrap 155 Intervalo de Confiança para uma Diferença nas Médias com Variâncias Conhecid~s 182 9.1 Testes de Hipóteses para uma Diferença nas Médias com Variâncias Conhecidas 180 9.2.3 Distribuições de Probabilidades Condicionais 109 6.2 Testes de Hipóteses Estatísticas 143 8.3.5 Inferência sobre a Proporção de uma População 166 8.1 Distribuições de Probabilidades Conjuntas 107 6. com Variâncias Desconhecidas 185 9.1.8 Desigualdade de Chebyshev 122 Exercícios Suplementares 123 Exercícios para Expandir a Mente 124 6.3 Propriedades de Estimadores 128 7.3 6.2 Valor p para um Teste t 159 8.5 Erro Médio Quadrático de um Estimador 131 7.1 Testes de Hipóteses para a Média 149 8.3 O Erro Tipo II e a Escolha do Tamanho da Amostra 150 8.5.3.2 Erro Tipo II e Escolha do Tamanho da Amostra 166 8.3.1.2.7 Combinações Lineares de Variáveis Aleatórias 120 6.3.3 Intervalo de Confiança para uma Proporção Binomial 167 8.5 Distribuições Amostrais 136 7.4.5 Covariância e Correlação 115 6.5.1 Hipóteses Estatísticas 142 8.3.2.6 Distribuições Amostrais das Médias 136 7.3.2.3 Intervalo de Confiança para a Variância de uma População Normal 164 8.3.1 Introdução 179 9.2 Distribuição Multinomial de Probabilidades 105 6.3 Inferência sobre a Média de uma População com Variância Desconhecida 157 8.2 Escolha do Tamanho da Amostra 181 9.3 Inferência sobre a Diferença nas Médias de Duas Distribuições Normais com Variações Desconhecidas 185 9.3 Identificando Causa e Efeito 182 9.3.4 Método da Máxima Verossimilhança 132 7.3.1.2.1 Testes de Hipóteses para a Diferença nas Médias.4 Múltiplas Variáveis Aleatórias Contínuas 113 6.3.2.3.2 Amostragem Aleatória 127 7.2 Distribuições de Probabilidades Marginais 108 6.3.3 Duas Variáveis Aleatórias Contínuas 107 6.1.3.4 CAPíTULO 7 Estimação de Parâmetros 126 7.8 Testes da Tabela de Contingência Exercícios Suplementares 174 Exercícios para Expandir a Mente 177 CAPíTULO 9 169 172 Erro·Padrão: Reportando uma Estimativa 130 7.4 Inferência Estatística para uma Única Amostra 142 8.3.2 Variância de um Estimador 129 7.3 Intervalo de Confiança para a Razão de Duas Variâncias 197 9.3 .3.2 Inferência sobre a Média de uma População com Variância Conhecida 149 8.6 Intervalo de Confiança para a Média 153 8.2 Múltiplas Variáveis Aleatórias Discretas 104 6.4 Teste para Amostras Grandes 152 8.5 Alguns Comemários Práticos sobre Testes de Hipóteses 152 8.4 Teste t Emparelhado 191 9.2 Inferência sobre uma Diferença nas Médias com Variâncias Conhecidas 179 9.5 Intervalo de Confiança na Média 161 8.3.1 Inferência Estatística 126 7.2.6 Distribuição Normal Bidimensional 118 6.5 Inferências sobre as Variâncias de Duas Populações Normais 195 9.4 Inferência sobre a Variância de uma População Normal 163 8.5.2.2.5.5.2 Escolha do Tamanho da Amostra 187 Intervalo de Confiança para a Diferença nas Médias 187 9.3.3 Solução Computacional 159 8.6 Inferência sobre Proporções de Duas Populações 198 9.2.1 Teste de Hipóteses 142 8.2.2 Valores p nos Testes de Hipóteses 150 8.7 Método Geral para Deduzir um Intervalo de Confiança 155 8.1.4 Procedimento Geral para Testes de Hipóteses 148 8.4 Solução Computacional 189 9 .1 Testes de Hipótesespara a Razãode DuasVariâncias 195 9.1 EstimadoresNão Tendenciosos 128 7.3.5.1 Testes de Hipóteses para uma Proporção Binomial 166 8.1 Distribuições de Probabilidades Conjumas 104 6.7 Testando a Adequação do Ajuste 8.

5 Testes de Hipóteses para a Regressão Linear Múltipla 241 11.6.11.2 Análise de Variância: Uma Abordagem para Testar a Significância da Regressã~ 214 10.3 Testes 12.3 12.1 Um Exemplo 269 12.5.4 12.6.2 Estimação de Parâmetros pelo Método dos Mínimos Quadrados 232 11.5.7 Previsão de Novas Observações 218 10.2 Análise Residual 248 11.1 Teste para Amostras Grandes.8.4 Planejamento Aleatorizado com Blocos Completos e com Fatores Aleatórios 288 12.4.3 Saída Computacional para a Regressão em Etapas 260 11.2.2.1 Modelo da Regressão Linear Múltipla 230 11.1 O Caso dos Efeitos Fixos 290 12.lOCorrelação 224 Exercícios Suplementares 22 7 Exercícios para Expandir a Mente 229 CAPíTULO 11 221 224 Planej amento e Análise de Experimentos com um Único Fator: A Análise de Variância 268 12.3 Observações Influentes 249 11.8.3.1 Problema de Construir o Modelo 255 11.2 Procedimentos Computacionais para a Seleção de Variáveis 255 11.1 Teste para Significância da Regressão 241 11.9 Modelos de Regressão Polinomial 251 11.1 Modelos Empíricos 205 10.2 Testes para as Médias Individuais dos Tratamentos 287 12.7 Predição de Novas Observações 246 11.2.6.12 Multicolinearidade 263 Exercícios Suplementares 264 Exercícios para Expandir a Mente CAPíTULO 12 266 (R2) 255 Regressão Linear Simples e Correlação 205 10.4 Experimentos Fatoriais com Dois Fatores 299 13.3 Falta de Ajuste 221 10.8.P2 200 9.1 A Estratégia de Experimentação 268 12.2 Intervalo de Confiança para a Resposta Média 245 11.4 Modelo com Efeitos Aleatórios 281 12.2 Regressão Linear Simples 207 10.5 Planejamento Aleatorizado com Blocos Completos 284 12.2 O Caso dos Efeitos Aleatórios 291 Exercícios Suplementares 292 Exercícios para Expandir a Mente CAPíTULO 13 293 11.1 Análise Residual 219 10.5.3.5.3.10 Variáveis Indicativas 252 11.2 Teste para os Coeficientes Individuais de Regressãoe Subconjuntos de Coeficientes 242 11.8 Medidas da Adequação do Modelo 247 Planejamento de Experimentos com Vários Fatores 295 13.11.6.4 Abusos Comuns na Regressão 212 10.2 Experimento Completamente Aleatorizado com um Único Fator 269 12.11 Seleção de Variáveis na Regressão Múltipla 11. Considerando Ho: Pl = P2 198 9.8.6 Determinação do Tamanho da Amostra em Experimentos com um Único Fator 290 12.2.SUMÁRIO xi 247 9.3 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 211 10.6.2 Intervalo de Confiança para a Resposta Média 217 10.3 270 Regressão Linear Múltipla 230 Saída Computacional 273 Análise Residual e Verificação do Modelo 275 para Médias Individuais de Tratamento 278 Comparação Gráfica das Médias 278 Contrastes Ortogonais 278 Método de Fisher da Mínima Diferença Significativa 279 12.3 Abordagem Matricial para a Regressão Linear Múltipla 233 11.3 Análise Residual e Verificação do Modelo 288 12.2 12.1 Análise Estatística do Modelo de Efeitos Fixos 300 .5.2 Erro 13 e Escolha do Tamanho da Amostra 199 9.8.1 Coeficiente de Determinação Múltipla 11.1 Intervalos de Confiança para a Inclinação e a Interseção 216 10.5.1 Planejamento e Análise Estatística 284 12.8.7 Tabela com o Resumo dos Procedimentos de Inferência sobre Duas Amostras 201 Exercícios Suplementares 201 Exercícios para Expandir a Mente 204 CAPíTULO 10 11.11.6 Intervalos de Confiança para a Regressão Linear Múltipla 245 11.2 A Análise de Variância 12.6.5.1 Introdução 295 13.2 Coeficiente de Determinação (R2) 10.9 Transformações para uma Linha Reta 10.1 12.1 Uso de Testes t 213 10.8 Cálculo da Adequação do Modelo de Regressão 219 10.3 Intervalo de Confiança para Pl .6.6.6 Intervalos de Confiança 216 10.3 Experimentos Fatoriais 297 13.1 Intervalos de Confiança para os Coeficientes Individuais de Regressão 245 11.2 Algumas Aplicações das Técnicas de Planejamento de Experimentos 295 13.4 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 240 11.6.5 Testes de Hipóteses na Regressão Linear Simples 213 10.5.

4 Uma Observação por Célula 303 13.2 Frações Menores: O Fatorial Fracionário 2k-p 331 13.4.5 Experimentos Fatoriais Gerais 306 13.2 Verificação da Adequação do Modelo 303 13.1 Uma Meia Fração do Planejamento 2k 327 13.8.6.2.4.2 15.6 Gráficos de Controle para Medidas Individuais 371 15.2 Gráfico U (Gráfico de Controle para Defeitos por Unidade) 378 15.1 Planejamento 22 310 13.3 Erro Tipo II para o Teste dos Sinais 350 14.7 Blocagem e Superposição no Planejamento 2k 323 13.3 SubgruposRacionais 364 15.4.11 Outras Ferramentas para Resolver Problemas de CEP 386 15.4 Análise de Padrões de Comportamento para Gráficos de Controle 365 15.3 15.5.8.8 Gráficos de Controle para Atributos 377 15.8.2 Projeto de um Gráfico de Controle 364 15.2.3 Saída Computacional 303 13.1 Gráfico P (Gráfico de Controle para Proporções 377 15.6.3.10 Gráfico de Controle da Soma Cumulativa 382 15.3.2.9 Métodos e Planejamentos de Superfície de Resposta 336 13.1 Descrição do Teste 348 14.3 Observações Emparelhadas 353 14.4.6 Planejamento Fatorial 2k 309 13.7 Capacidade de Processo 374 15.5 Gráficos de Controle X e R 367 15.6.5 Fatores Aleatórios 304 13.12 Implementando o CEP 388 Exercícios Suplementares 389 Exercícios para Expandir a Mente 391 Estatística Não Paramétrica 347 14.3 Teste de Wilcoxon do Posto com Sinais 352 14.5.4.1 Descrição do Teste 355 14.4 Controle Estatístico da 360 Melhoria e Estatística da Qualidade 360 Controle Estatístico da Qualidade 361 Controle Estatístico de Processo 361 Introdução aos Gráficos de Controle 361 15.1 15.xii SUMÁRIO 13.9 Desempenho do Gráfico de Controle 380 15.1 Teste de Kruskal-Wallis 357 14.2 Aproximação para Amostras Grandes 356 14.9.2 Teste dos Sinais para Amostras Emparelhadas 350 14.3 Comparação com o Teste t 356 14.1 Introdução 347 14.8.4 Adição de Pontos Centrais a um Planejamento 2k 320 13.4 Comparação com o Teste t 351 14.4.2 Análise de uma Superfície de Resposta de Segunda Ordem 339 Exercícios Suplementares 343 Exercícios para Expandir a Mente 346 CAPíTULO 14 CAPíTULO 15 Qualidade 15.8 Replicação Fracionária do Planejamento 2k 327 13.5 Métodos Não Paramétricos na Análise de Variância 357 14.4.2 Aproximação para Amostras Grandes 353 14.2 Transformação de Posto 358 Exercícios Suplementares 358 Exercícios para Expandir a Mente 359 AP~NDICES 393 395 A Tabelas e Gráficos Estatísticos B Material Técnico Suplementar 426 I Técnicas de Contagem 426 II Função Geradora de Momento 429 III Funções de Variáveis Aleatórias 432 IV Desenvolvimento das Distribuições te F 436 V Abordagem Bayesiana para Estimação 437 VI Testes da Razão da Verossimilhança 439 VII Fatores Aleatórios em Experimentos Fatoriais 440 C Bibliografia 445 D Respostas dos Exercícios Selecionados 447 íNDICE 460 .3.4.1 Princípios Básicos 361 15.4.4.2.1 Método da Ascendente de Maior Inclinação (Steepest Ascent) 337 13.4 Teste de Wilcoxon da Soma :1osPostos 355 14.3.6.2 Teste dos Sinais 348 14.1 Descrição do Teste 353 14.2 Planejamento 2k para k ~ 3 Fatores 313 13.9.3 Réplica Única do Planejamento 2k 318 13.4.4 Comparações com o Teste t 354 14.

no mínimo tentar.o Papel da Estatística na Engenharia ESQUEMA DO CAPÍTULO 1. Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema. As etapas 2-4. ou processo que encontre as necessidades dos consumidores. eficientemente.3 MODELOS MECANICISTAS E EMPÍRICOS 1. 2. 1. Refinar o modelo. engenheiros têm de saber como planejar. Os engenheiros executam isso através do refmamento do produto ou processos existentes. Conseqüentemente. 3. coletar dados. 1. 8. um modelo do fenômeno e a experiência para verificar a adequação do modelo e da solução proposta para o problema. os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua solução. As etapas no método de engenharia são dadas a seguir: 1. O campo da estatística lida com a coleta. são colocadas em um retângulo. 7. Conduzir experimentos apropriados e coletar dados para testar ou validar o modelo-tentativa ou conclusões feitas nas etapas 2 e 3.1 O MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1. Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente.1. técnicas estatísticas podem ser uma ajuda poderosa no planejamento de novos produ- .2 COLETANDO DADOS EM ENGENHARIA 1. Note que o método de engenharia caracteriza uma forte relação recíproca entre o problema. usando conhecimento científico ou de engenharia do fenômeno estudado. Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados. 4. a análise e o uso dos dados para tomar decisões. com base nos dados observados.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO 1. 5. obviamente algum conhecimento de estatística é importante para qualquer engenheiro.2 Julgamento Estatístico 1. pela aplicação eficiente de princípios científicos. Desenvolver uma descrição clara e concisa do problema. os experimentos. os fatores que podem influenciar sua solução.1 o MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1.1. O método de engenharia ou científico é a abordagem para formular e resolver esses problemas. indicando que vários ciclos ou iterações dessas etapas podem ser requeridos para obter a solução final. ou pelo projeto de um novo produto. Identificar.1.1 Engenharia e Resolução de Problemas Um engenheiro é alguém que resolve problemas de interesse da sociedade. Estabelecer limitações ou suposições do modelo. na Fig. Tirar conclusões ou fazer recomendações baseadas na solução do problema. 6.1. Propor um modelo para o problema.1 Engenharia e Resolução de Problemas 1. a apresentação. As etapas no método de engenharia são mostradas na Fig. Especificamente. resolver problemas e planejar produtos e processos.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS 1.1. analisar e interpretar os dados e entender como os dados observados estão relacionados ao modelo que eles propuseram para o problema sob estudo.

desenvolvendo e melhorando os processos de produção. que é um diagrama de pontos dos dados da força de remoção. 1.3.2 O PAPEL DA ESTATÍSTICA NA ENGENHARIA tos e sistemas. Quando o número de observações é pequeno. n Xn 2: Xi = . quando a espessura da parede for 3/32 polegada.. suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva.1) EXEMPLO 1. se cada observação representar 1 libra de massa colocada no ponto no eixo X.. considere o desempenho de consumo de gasolina de seu carro. a marca e/ou número de octanagem da gasolina usada.2 Diagrama de pontos dos dados da força de remoção. esses dados são uma amostra de observações que foi selecionada a partir de alguma população grande de observações.. as mudanças na condição do veÍCulo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou compressão do motor ou desgaste da válvula). Geralmente. possivelmente. Se a força de remoção for muito baixa. não -na verdade. Definição Se as n observações em uma amostra forem denotadas por então. Você sempre consegue o mesmo desempenho de consumo em cada tanque de combustível? Naturalmente.6 + 12. Aqui. Por exemplo. a população deve consis- • 12 • • • 13 • • •• 14 I 15 Força de remoção Fig. Métodos estatísticos são usados para nos ajudar a entender a variabilidade. então o fulcro localizado em x equilibraria exatamente esse sistema de pesos. melhorando os projetos existentes e planejando.1 O método de solução de um problema. resultando nos seguintes dados (em libras-pé): 12. algumas vezes o desempenho varia consideravelmente. <- A média da amostra é o valor médio de todas as observações do conjunto de dados.4.9. tais como o tipo de estrada mais usada recentemente (cidade ou estrada). as condições climáticas. Podemos também descrever numericamente as características dos dados. Essa variabilidade observada no consumo de gasolina depende de muitos fatores. nem todos os protótipos têm a mesma força de remoção.. 12. o conector pode falhar quando ele for instalado no motor. . isto é. a localização ou o meio. Esses fatores representam fontes potenciais de variabilidade no sistema. Por variabilidade.2 apresenta um diagrama de pontos desses dados. mas está.3.= I 8 13.1. geralmente é dificil identificar qualquer padrão específico na variabilidade. Como antecipamos. O engenheiro está considerando estabelecer como especificação do projeto uma espessura de parede de 3/32 polegada. Por exemplo.9 + . + 8 104 8 13. Encontramos também variabilidade em problemas de engenharia.. 13.0 Uma interpretação fisica da média da amostra como uma medida da localização é mostrada na Fig. referir-nos-emos à média arítmética como a média da amostra. Fig. 12. Ou seja. 1. queremos dizer que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado. x = XI + Xl + . 13. X. + Xn n . podemos caracterizar a localização ou tendência central nos dados através da média aritmética comum.. inseguro acerca do efeito dessa decisão na força de remoção do conector. embora o diagrama de pontos seja uma maneira conveniente de ver quaisquer características incomuns nos dados. .6. Porque quase sempre pensamos em nossos dados como sendo uma amostra.. 1.. A Estatística nos fornece uma estrutura para descrever essa variabilidade e para aprender sobre quais fontes potenciais de variabilidade são mais importantes ou quais têm o maior impacto no desempenho de consumo de gasolina.6. e o espalhamento ou a variabilidade. 13.0 pode ser pensada como um "ponto de balanço". Note que a média da amostra x = 13.1 A média da amostra da força de remoção para as oito observações coletadas nos protótipos dos conectores é 8 X = Xl + Xl + . a média da amostra será n XI' X2. 12. de algum modo.. Esse gráfico nos permitirá ver facilmente duas características dos dados. cerca de 20 observações..1 12. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas.=1 2: Xi n (1. O diagrama de pontos é um gráfico muito útil para exibir um pequeno conjunto de dados. Por exemplo. . A Fig.5. 1. ou mesmo. 13. Todos nós encontramos variabilidade em nosso dia-a-dia e o julgamento estatístico pode nos dar uma maneira útil para incorporar essa variabilidade em nossos processos de tomada de decisão.6.

tal como uma porção de pastilhas de silício produzidas em uma fábrica de semicondutores.=.X.1 o desvio-padrão da amostra.1 12. Xn for uma amostra de n observações.5 0.6 0. O numerador de S2é f. 12 o o o o X o o o o 13 14 15 As unidades de medidas para a variância da amostra são o quadrado das unidades originais da variável. Quando houver um número finito de observações (isto é. X. s. dados da força de remoção do conector.4 -0.0X)2 13. Uma vez que os desvios Xi .6 0. o engenheiro durante o projeto do conector usando uma espessura de parede de 3/32 polegada concluiria.4 que mostra os desvios Xi . a variância da amostra é 2 A média da amostra.60 (1.1 Cálculo dos Termos para a Variância e Desvio-Padrão Amostra -0.5 Xi da --- Definição Se XI. Embora a média da amostra --1"04. com base nos dados.16 12. da amostra mede a variabilidade através dos . 4 5 3 2 8 7 6 a informação acerca de uma amostra de dados. a variabilidade será relativamente grande.02286 (l'b ras. então a da amostra será S2 = L _i=_I n (Xi - X)2 _ (1. Podemos pensar também em calcular o valor médio de todas as observações em uma população. Essa média é chamada de média populacional. Conseqüentemente. fL..3 A média da amostra como um ponto de equilibrio para um sistema de pesos.01 13.6 0. porém.o PAPEL DA EsTA TfsTICA I NA ENGENHARIA 3 emoção • • L •• i.7 13. veja a Fig. existe uma população física real.60 1 = -7. é uma estimativa razoável da média populacional. x. então a média populacional será EXEMPLO 1.6 Xi0.4 Como a variância desvios Xi .1 (Xi0.)2 _ I e o desvio-padrão da amostra é s = v'0.36-X 13. 1.250.2286 = 0.0 libras-pé.9 -0.pe. tir em todos os conectores que serão vendidos aos consumidores. 1. discutiremos modelos para populações infinitas e isso nos levará a urna defmição mais geral de média populacional.1 12. Nos capítulos seguintes. pouca variabilidade nos dados. as unidades para a variância da amostra serão (libras-pé)2.3 -0.49 0. que uma estimativa da força de remoção média seria 13.3) n . Como a Variância da Amostra Mede a Variabilidade? Para ver como a variância da amostra mede a dispersão ou a variabilidade.lda amostra. Quanto maior a variabilidade nos dados da força de remoção. s 1.• . maior será o valor absoluto de alguns dos desvios Xi .16 0. X2. fL.4. Muitos problemas importantes de engenharia envolvem fazer referências ou tomar decisões sobre uma média populacional.48 libras-pé Tabela 1. 1.x. relativamente.1 apresenta as quantidades necessárias para calcular a variância e o desvio-padrão da amostra para os dados da força de remoção.60 = 81.60 12. Elevar ao quadrado os desvios é uma abordagem usada na variância da amostra. se x for medido em libras-pé. 1. 1513 • 1 À4 I • Fig.L=-N i=1 L N i=1 Xi L 8 (Xi - x)2 = 1.4 0. Algumas vezes. sendo denotada pela letra gregafL(mi).X somarão zero. haverá.0 ela não transmite toda seja útil.4 1. N) na população. O desvio-padrão tem uma propriedade desejável de variabilidade de medida nas unidades originais da variável de interesse.2 A Tabela 1.01 0. é a raiz quadrada positiva da variânci<.X para os Fig. temos de usar uma medida de variabilidade que transforme os desvios negativos em quantidades não negativas. se S2 for grande. variância . se S2for pequeno.2) assim. A variabilidade ou dispersão nos dados 1 pode ser descrita pela variância ou o desvio-padrão da amostra. Esses dados são graficados na Fig.. Assim. Logo.

5) = _i=_1 N _ Para os dados da força de remoção. como estando baseada em n . n < 8 ou 10.I).1 e. que a média da amostra poderia ser usada como uma estimativa da média populacional. mas ignora toda a informação contida nos dados entre os valores maior e menor. onde tamanhos de amostra de 4 ou 5 são razoavelmente comuns.5.3. a soma dos quadrados dos desvios em tomo da média x da amostra tem de ser usada. isso é chamado de método abreviado para cálculo de S2 (ou s).9 têm a mesma amplitude (r = 8)..5.x. a amplitude da amostra é r = 13.5. A variabilidade é realmente menor na segunda amostra. Discutiremos algumas dessas aplicações no Capo 15. A média.L)2 (1. IA requer que se calcule o quadrado de cada Xi' levando-se. Na prática. x. o valor de ]L quase nunca é conhecido e.x sempre somam zero e. enquanto o desvio-padrão da segunda amostra é S2 = 2. enquanto para a variância da população. Eq. denotará o desvio-padrão da população. então poderíamos encontrar a variância da amostra como a média dos quadrados dos desvios das observações da amostra em tomo de ]L. .x.X e vários decimais podem ter de ser carregados para assegurar a exatidão numérica. . n s2 i=1 =--------n ±X?- (± i=1 1 X.já que x = (l/n) i = 1 Xi' essa última equação se reduz a I.2286 = 0.6 .x não forem inteiros. n subtrações e n operações de elevar ao quadrado e somar. Isso foi ilustrado na Tabela 1.. então.I n n 2: -:xi i=1 2: (X? + :x2 n- - 2ix.I dessas quantidades determina automaticamente aquele restante. Uma outra maneira de pensar acerca disso é considerar a variância S2 da amostra. x. ao quadrado a soma de Xi' subtraindo ('i. obteríamos uma medida de variabilidade que seria. IA. usando o método do atalho. ou a diferença entre a maior e a menor observação. a amplitude da amostra aumenta. No entanto. a amplitude é largamente utilizada em controle estatístico da qualidade. as observações Xi tendem a ser mais próximas de seu valor médio.I graus de liberdade.)2 I n (104) Note que a Eq.5. podemos definir a variância da população como N 2: 0'2 (xi - f. para compensar isso. A amplitude da amostra é definida como segue. usamos n . Se as observações originais ou os desvios Xi . Entretanto. dessa forma.I dos n desvios.1 n n I 2:x?- ( 2: n i=1 Xi )2 13536 _ (104f .12. existe uma medida de variabilidade na população chamada de variância da população. especificar os valores de quaisquer n . 8 7 XI' Se as n observações em uma amostra forem denotadas por X2. I EXEMPLOl. X2 .3. Por conseguinte.1 como o divisor em vez de n. Usaremos a letra grega cr (sigma ao quadrado) para denotar a variância da população.0 = 0. Xn .I.6) = 1.1.3 Calcularemos a variância e o desvio-padrão da amostra. quando o tamanho da amostra for pequeno. em média. a varíância e o desvio-padrão da amostra e o diagrama de pontos são simples. Por exemplo. Algumas vezes. A fórmula fornece Uma definição mais geral da variância cr será dada adiante. ainda que efetivas maneiras de resu- . Dessa forma. Por exemplo. o divisor é o tamanho N da população.83.. a perda de informação associada com a amplitude não é muito séria. Observamos. A raiz quadrada positiva de cr. estão livremente determinados.) Il X? i=1 2: + n:x2 - 2:X i=1 2: Xi n . O termo graus de liberdade resulta do fato de que n desvios Xl . Definição n S 2 i= =-------. Algumas vezes. Note que o divisor da variância da amostra é o tamanho da amostra menos um (n .. e finalmente dividindo por n .. Análoga à variância da amostra S2.xY/n de x.x.48 libras-pé Esses resultados concordam exatamente com aqueles obtidos previamente. Se usássemos n como o divisor na variância da amostra. Geralmente.35.. ]L. Xi .2286 (libras-pé)2 e s = VO. a amplitude da amostra.4 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Cômputo de 52 O cômputo de S2 requer o cálculo de x. ou CJ'. é uma medida útil de variabilidade. assim. Além da variância e do desvio-padrão da amostra. o desvio-padrão da primeira amostra é SI = 3.. isto é. à medida que a variabilidade nos dados da amostra aumenta. .3 = 1. consistentemente menor que a variância verdadeira cr da população. as duas amostras 1. somente n . Quando a população for finita e consistir em N valores. do que a média populacional. a variância da amostra é uma estimativa da variância da população. pode ser tedioso trabalhar com os desvios Xi ." então a amplitude da amostra será r = máx(xi) - mín(xi) (1. Uma fórmula computacional mais eficiente para a variância da amostra é obtida como segue: n Il (xi S 2 i=1 =----. Similarmente. A amplitude da amostra é fácil de calcular.8 e 9 e 1. previamente. Se soubéssemos o valor verdadeiro da média populacional ]L.

População ? População futura ? • 12 • = • • 00 •• 00 I o • •• o o o I 13 f2 polegada 14 15 (:::) !_-~---j : I . Os Caps. Resultados para ambas as amostras são graficados como diagrama de pontos na Fig. queremos concluir alguma coisa a respeito do lote.4 e 0. Oito protótipos desse projeto são construídos e as medidas observadas da força de remoção são: 12. respectivamente. 1. uma amostra de três pastilhas pode ser selecionada de um lote de produção de pastilhas na fabricação de semicondutores. . mantendo-se a terminologia. pressão e tempo de cura) são as mesmas que aquelas para os conectores que serão vendidos aos consumidores.os resultados obtidos dos testes até agora para concluir que aumentando a espessura da parede aumenta a resistência. ele pensa que esse valor pode ser muito baixo para a aplícação pretendida.L seja muito alta. 4-6 explorarão esses conceitos em detalhes. Claramente. os oito conectores são vistos como uma amostra da população de conectores que serão vendidos aos consumidores.. A amostra é um subconjunto da população. Historicamente. Esses modelos envolvem conceitos de probabilidade que serão introduzidos no Capo 3. 1.2. O exemplo de pastilhas a partir de lotes é chamado de estudo enumerador. Veremos que a noção de uma distribuição de probabilidade..6 Inferência estatistica é um tipo de raciocínio. A inferência estatística é a partir de :x para f. I J : Força de remoção xl' X2"'" xn. Por exemplo. Ver Fig.L. os oito protótipos dos conectores têm de ser representantivos. Entretanto. NA ENGENHARIA 5 1.. deve ser considerado que as fontes de variabilidade na fabricação de protótipos (tais como temperatura. como sabemos que uma outra amostra de protótipos não dará resultados diferentes? A amostra de oito protótipos é adequada para fornecer resultados confiáveis? Se usarmos . ele decide considerar um projeto alternativo com uma espessura maior de parede. Estudo enumerativo Estudo analítico o = ~ polegada Fig. Ver Fig. uma suposição de estabilidade. ele sabe que uma estimativa razoável da força média de remoção seria 13. se :x for alta. se a amostra for selecionada adequadamente.7. de certo modo. 1. também é importante raciocinar a partir de uma série específica de medidas para casos mais gerais para responder às questões prévias. mas deve ser pensada como futuras réplicas dos objetos na amostra. 12.8.0 lb-ft. o raciocínio baseado nas medidas de alguns objetos para medidas em todos os objetos pode resultar em erros (chamados de erros de amostragem).5 Diagrama de pontos da força de remoção para duas espessuras de parede. claramente. No entanto.5 e 13. 13. Por exemplo. Uma amostra é usada para fazer uma inferência à população da qual a amostra é selecionada.. será possível que o aumento aparente na força de remoção observada nos protótipos mais espessos seja apenas devido à variabilidade aparente no sistema e que o aumento da espessura da parte (e seu custo) realmente não afete a força de remoção? Freqüentemente. Esse gráfico e os cálculos precedentes dão a impressão de que o aumento da espessura da parede levou a um aumento na força de remoção. Fig. No entanto. há algumas questões óbvias a perguntar.- .5. Uma amostra é usada para fazer uma inferência a uma população futura. quais os riscos que estão associados com essa decisão? Por exemplo.2 Julgamento Estatístico A necessidade de um julgamento estatístico aparece freqüentemente na solução de problemas de engenharia. Fig. como um modelo que descreve a variabilidade em um sistema ou processo. daqueles que serão vendidos aos consumidores. Em outros casos.50. As análises estatísticas são geralmente as mesmas em ambos os casos. Por exemplo. Para responder às questões prévias. Tempo. 13. Considere o engenheiro projetando o conector. O exemplo do conector é chamado de estudo analítico. Entretanto.. Esse argumento é a partir de uma amostra (tal como os oito conectores) para uma população (tal como os conectores que serão vendidos aos consumidores). a população não existe ainda. 13.L).1.. a amostra é realmente selecionada a partir da população.1. 14. essa análise requer alguma noção de estabilidade como uma suposição adicional. devemos estar preocupados com que f.o PAPEL DA EsTATÍSTICA mir os dados. A partir de testes em protótipo. 1. Por exemplo. assim.7. O raciocínio é referido como inferência estatística.. as leis fisicas (tais como a lei de Ohm e a lei de gás ideal) são aplicadas para ajudar no projeto de produtos e processos. 1. Estamos familiarizados com esse raciocínio a partir de leis gerais para casos especiais.2. Claramente. esses riscos poderão ser quantificados e um tamanho apropriado de amostra pode ser determinado.. medidas foram obtidas de uma amostra de pessoas e generalizadas para uma população.6.. Baseado nos dados da amostra. Os engenheiros estão freqüentemente interessados em desenvolver um modelo do sistema ou processo que gerou os dados. Geralmente.1. 13.- I I I I I I I I I I I . 1/8 polegada. Em alguns casos.- . 1. 1. a média das medidas de resistividade na amostra (:X) não é esperada para igualar exatamente à média das medidas de resistividade no lote (f. porém um estudo analítico requer.9....7 Estudo enumerativo versus estudo analítico. é muito importante no ambiente de engenharia. A média e o desvio-padrão da amostra são 13.9. Outros métodos para descrever os dados serão apresentados no Capo 2. Porém.

50.6 O PAPEL DA ESTATÍSTICA NA ENGENHARIA 1. construa um diagrama de pontos e comente os dados. 8 e 9 discutirão o teste de hipóteses e outras técnicas relacionadas. Calcule a média e o desvio-padrão da amostra. 108. Em Applied Li/e Data Analysis (Wiley.45.2 COLETANDO DADOS DE ENGENHARIA Na seção prévia. 4. sendo introduzidos e ilustrados em maiores detalhes na próxima seção. 7013. 0. A primeira maneira pela qual os engenheiros freqüentemente coletam dados é a partir de um estudo observacional.000. Em geral. . o engenheiro pode estar interessado em saber se a força média de remoção de 3/32 polegada excede a carga máxima típica a ser encontrada nessa aplicação. Uma abordagem que poderia ser usada na resolução desse problema é comparar as médias da força de remoção para 3/32 polegada. 6992. Claramente.002. 31.75.75 libras-pé. 128. 12. 102. 140. 160.18. A habilidade de pensar e analisar. se o engenheiro quiser alcançar o sucesso. 3. 7041 e 6890. 4. Na Seção 1. 7100. Esses modelos são freqüentemente chamados de modelos empíricos. 1982). 0.2. estaríamos interessados em testar o teste de hipóteses em que a resistência média J. Construa um diagrama de pontos dos dados. 1989) descreve um experimento para testar a resistência resultante em tubos circulares com calotas soldadas nas extremidades. e para 1/8 polegada. Esses registros incluiriam dados de teste de características fisicas e elétricas das pastilhas. 74. eles têm melhor desempenho. então. 1.96. Nessa situação. Por exemplo. 160. é razoavelmente comum manter registros extensos de cada batelada ou lote de pastilhas que foi produzido. A edição de janeiro de 1990 de Arizona Trend contém um suplemento descrevendo os 12 "melhores" campos de golfe do estado. 74.5. Se aparecerem questões relativas a uma mudança em uma importante característica elétrica.1. 67. tais como a espessura da parede. 42. isto é. 12.15.015. com o objetivo de descobrir se uma força de remoção maior poderia ser ou não obtida. 2. o engenheiro faz varíações propositais nas variáveis controláveis de alguns sistemas ou processos. Uma outra maneira é que os dados observados são obtidos através da análise de dados históricos do sistema ou processo. 102. usando a técnica de teste estatístico de hipóteses. 8.27. Os dados provenientes de observação e os dados provenientes de experimentos planejados podem ser obtidos em ambos os tipos de estudos. esses estudos envolvem um conjunto muito grande de dados e requerem um firme domínio dos princípios estatísticos. ilustraremos vários tipos de experimentos planejados para o exemplo do conector. 6935. 7099. PARA AS SEÇÕES 1. 7518.005. O engenheiro pode medir também e registrar as variáveis de processo potencialmente importantes. Calcule a média e o desvio-padrão da amostra.52. em um estudo observador. mas freqüentemente eles envolvem estudos analíticos. 1. a inferência ou decisão da análise é sobre como o sistema ou o processo se desempenhará no futuro. observa os dados de saída do sistema resultante e.001. Por exemplo. A segunda maneira pela qual os dados de engenharia são obtidos é através de um experimento planejado. 1.78.01.L3132 excederia 12. uma hipótese é uma afirmação sobre algum aspecto do sistema em que tenhamos interesse. O exemplo do conector de plástico na seção prévia ilustrou um experimento planejado. J. 156. Geralmente. 36. tais como a temperatura do molde. esse é um exemplo de estudo analítico e também um exemplo de um problema envolvendo teste de hipóteses para duas amostras.89. Por exemplo. o engenheiro está interessado em usar os dados para construir um modelo do sistema ou processo. Os comprimentos desses campos emjardas são: 6981. Os dados são: 36. No ambiente de engenharia.004. o conteúdo de umidade da matéria-prima e o tempo do ciclo. mais alta confiabilidade e menores custos globais. Construa um diagrama de pontos dos dados. Assim sendo. são: 0. Os Caps. ou seja. 74. esses dados são coletados em uma das duas maneiras a seguir. 33. 6930. introduzimos os conceitos de estudos enumeradores e analíticos. 102. Geralmente. Isso é chamado de problema de teste de hipóteses com uma única amostra. 6. o processo ou sistema que está sendo estudado pode ser observado somente pelo engenheiro e os dados são obtidos à medida que se tomam disponíveis. 4. 74. O planejamento de experimentos tem um papel muito importante no projeto e desenvolvimento de engenharia e na melhoria dos processos de fabricação. considere o problema a respeito da escolha da espessura da parede do conector de náilon. 8. 104.91. 38. o encolhimento ou a resistência da peça. assim como as condições de processamento sob as quais cada batelada de pastilhas foi produzida. Em um experimento planejado. 104. Um artigo em Human Factors (junho de 1989) apresentou dados sobre a acomodação visual (uma função do movimento do olho). Pode-se observar o processo. em minutos. Foram feitas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um automóvel. 7518.005 e 74.85. Os tempos. a história do processo pode ser estudada em um esforço para determinar o ponto no tempo onde a mudança ocorreu e para ganhar algum discernimento em relação às variáveis do processo que devem ser responsáveis pela mudança. o engenheiro pode estar interessado em testar a hipótese de que um aumento da espessura da parede de 3/32 para 1/8 de polegada resulta em um aumento da força média de remoção. 96. reconhecendo um padrão de mancha em um vídeo CRT de alta resolução.78.1. selecionar componentes à medida que são fabricados e medir importantes características de interesse. 74.67.06.2--------- 1. 6800. estatisticamente.1 E 1. JkJI32. na fabricação de semicondutores. Problemas desse tipo serão discutidos no Capo 9. ou seja. 115. 1. ilustramos alguns métodos simples para resumir dados. Wayne Nelson apresenta o tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. 74. 32. faz uma inferência ou decisão sobre as variáveis que são responsáveis pelas mudan- ças observadas no desempenho de saída.19. Experimentos planejados também desempenham um papel crucial na redução do tempo de condução de um projeto de engenharia e do desenvolvimento de atividades. uma mudança deliberada foi feita na espessura da parede do conector. 164 e 170.3.75 libras-pé. os dados são quase sempre uma amostra que foi selecionada a partir de alguma população. Calcule a média e o desvio-padrão da amostra.90.77.16. O Capo 8 apresentará técnicas para esse tipo de problema. 7. 126. Por exemplo.4. Alternativamente.003.4. Os dados (em mm) são: 74. A maioria dos problemas de engenharia envolve os estudos analíticos.31. Freqüentemente. ---------EXERCÍCIOS 1. quando produtos e processos são planejados e desenvolvidos com experimentos planejados.71 e 72. Calcule a média e o desvio-padrão da amostra. Na Seção 1. suponha que um engenheiro esteja avaliando o desempenho de um processo de fabricação de componentes plásticos através da injeção em molde. 128. os dados amostrais nos capacitará a responder questões sobre o sistema ou o processo em estudo. 126. Freqüentemente.LU8.35. Os primeiros resultados (em kN) são: 96. Um artigo no Journal o/ Structural Engineering (Vol.

Construa um diagrama de pontos dos dados.2. porém não é diretamente desenvolvido a partir de nosso conhecimento teórico ou dos primeiros princípios do mecanismo básico. As variáveis reportadas são à tração (uma medida da quantidade de força a resistência requerida para romper a cola).72.35900 9.13 21. 869. No entanto. 809.65 69. suponha que estejamos medindo a corrente em um fio fino de cobre.8. 856.2 Dados400y do a Resistência de Tração da Cola no Arame à250 Comprimento Resistência II=E/R+E (1. flutuações no desempenho do medidor. Podemos pensar E como sendo um termo que inclui os efeitos de todas as fontes não modeladas de variabilidade que afetam esse sistema. Nosso modelo para esse fenômeno pode ser a lei de Ohm Corrente ou que possam afetar o peso molecular. Algumas vezes.08 11. ou mesmo em dias diferentes.30 e 49. 878. Talvez. quando o material é fabricado. ao comprimento do arame e à altura da matriz. que relaciona essas variáveis.6. pequenas impurezas presentes em diferentes localizações do fio e impulsos na voltagem. Esse tipo é chamado modelo empírico. 960.952 25. de modo que devemos considerar outras fontes de variabilidade .63 22.15 Tabela 1. Infelizmente. os engenheiros trabalham com problemas para os quais não há modelo mecanicista simples ou bem entendido. não há mecanismo fisico que possamos facilmente aplicar aqui. Calcule a média e o desvio-padrão da amostra. Para cada um dos Exercícios 1.775. 918. 918. suponha que estejamos interessados no peso molecular médio (Mil) de um à viscosipolímero. Agora. o semicondutor [mal é um arame colado a uma estrutura. um modelo mais realista da corrente11 Observação pode Número da ser 16 15 18 17 12 13 10 20 21 23 5 7 94 8 14 6 19 22 23 24 25 observada do375 XI412 300 585 205 360 20 12 6 15 4 540 290 250 510 110 11 120 100 252 17 590 400 Altura 500 295 200 10 550 16 6 37. A relação entre Mil e essas variáveis é Mn = I(V. 806. 957.11) Esse é o modelo que usaremos para relacionar o peso molecular às outras três variáveis. um modelo de trabalho pudesse ser desenvolvido a partir de uma expansão em série de Taylor.001 14. 935. Logo.00 41. 835. ou seja.77. 27.o PAPEL DA EsTATÍSTlCA 26. Calcule a média e o desviopadrão da amostra. 820. Muito da educação formal de engenheiros envolve o aprendizado sobre os modelos relevantes a campos e a técnicas específicos para aplicar esses modelos na formulação e solução de problemas. considere os dados na Tabela 1. = voltagem/resistência 1= E/R (1.71. Por conseguinte. 498.00 10. Essa tabela contém dados das três variáveis. Gostariamos de encontrar um modelo relacionando a resistência à tração. Nessa planta.10) sendo f3's os parâmetros desconhecidos. T) (1. 1. porque ele é construído a partir de nosso conhecimento do mecanismo fisico básico. 905. discuta se os dados resultam de um estudo observado ou de um experimento planejado.02Arame Molde 31.775. considerando apenas o termo de primeira ordem. ele usa a nossa engenharia e o conhecimento científico do fenômeno. 661.88 16. 50.86X. Qual foi a duração média de uma missão F -117 A durante essa operação? Por que o parâmetro que você calculou foi a média popu1aciona1 ? 1.50 9. NA ENGENHARIA 7 1.30 17. 952.605 54. 898. tais como mudanças na temperatura ambiente.1 a 1. 730 e 753. 909. que foram coletados em uma planta de fabricação de semicondutores.7. 946. Por exemplo.3 MODELOS MECANICISTAS E EMPÍRICOS Os modelos desempenham um importante papel na análise de praticamente todos os problemas de engenharia.95 21. Desse modo. 693. Note que esse é um exemplo de um estudo observador (ver Seção 1.8) sendo E um termo adicionado ao modelo para considerar o fato de que os valores observados da corrente não seguem perfeitamente o modelo mecanicista. 558.93 24. C. 39.754 35. 653. esse modelo não descreverá exatamente o fenômeno.708. produzindo assim um modelo da forma Mn = 130 + 131V + !32C + !33T (1.89 46.59 44. adicionamos um outro termo ao modelo resultando (1.9) em que a forma da função f é desconhecida.655. Os seguintes dados são medidas de intensidade solar direta (watts/m2). A edição de 22 de abril de 1991 de Aviation Week and Space Technology reporta que.66 17. 940.704.6. em uma localização no sul da Espanha: 562. que explique o fenômeno. o comprimento do arame e a altura da matriz. se fizermos esse processo de medição mais de uma vez. 1. 870.2). 955. pilotos da força aérea americana (F-117A) realizaram 1270 vôos de combate. talvez em tempos diferentes. não parece provável que a abordagem de modelo mecanicista possa ser usada com sucesso. assim como na lei de Ohm.12 56.458 sobre 24. a con"ente observada poderá diferir levemente por causa de pequenas mudanças ou variações em fatores que não estejam perfeitamente controlados.38Tração 34. durante uma operação de guerra no deserto. 7) Chamamos esse tipo de modelo mecanístico. sabemos que Mil está relacionado dade (V) do material e também depende da quantidade de catalisador (C) e da temperatura (1) no reator de polimerização. 939. em dias diferentes. Como um simples exemplo. Com o objetivo de ilustrar essas idéias com um exemplo específico. 768. Agora. com um total de 6905 horas.

que se originou do trabalho de Karl Gauss. Duas tentativas.2 resulte em Resistência à tração = 2.8 o PAPEL DA Esr A TÍSTICA NA ENGENHARIA A Fig. quando o conector for arranjado na aplicação. uma vez que todos os três fatores têm dois níveis. Em geral. é necessário planejar um experimento que nos permitirá investigar o efeito de todos os três fatores na força de remoção. pela aplicação de calor ao longo de algum período de tempo. comprimento do arame e altura da matriz. 1. operativa na situação ou no ambiente no qual ela está sendo aplicada. O engenheiro suspeita que. um experimento fatorial consistiria das oito combinações de teste mostradas nos vértices do cubo na Fig.12. obtido a partir da Eq. que a aplicação dessa técnica aos dados da Tabela 1. Dessa forma. Mesmo que haja uma boa teoria científica básica em que possamos confiar na explicação do fenômeno de interesse.74 (comprimento do arame) + + 0. esse modelo não parece razoável. porém agora estamos investigando três fatores. Para ilustrar. então. O modelo empírico na Eq. mostraremos como construir esses modelos e testar se eles são adequados como funções de aproximação. testou cada unidade e calculou a média e o desvio-padrão da amostra da força de remoção para cada projeto. resultando em um experimento fatorial com 16 corridas. o modelo empírico poderia ser usado por um engenheiro exatamente da mesma maneira que um modelo mecanicista poderia ser usado.12 poderia ser usado para prever valores da resistência à tração para várias com- "ti <> ·Ctl Ctl 080 ~ 60 g 40 <Q) üí . a melhor estratégia da experiência é planejar algum tipo de experimento fatorial. chamado de mínimos quadrados. a partir de um simples experimento comparativo. Nos Caps. Os valores observados da força de remoção estão mostrados entre parênteses nos vértices do cubo na Fig. na verdade.12. 1. Geralmente.26 + 2. Essencialmente. suponha que.10.8. 'üi üí 20 'ü a: 40 c 80 O o ~ 60 <Q) 'Ctl Q) Ctl ·Ctl 4 8 Comprimento 12 do arame 16 20 O 100 600 500 400 300 ~\1. esse tipo de modelo empírico é chamado de modelo de regressão. condução e análise de dados a partir de experimentos de engenharia. Essa é uma ilustração do uso do julgamento estatístico para ajudar na análise de dados. Examinando esse gráfico. em que nenhuma teoria científica ou de engenharia é completamente aplicável. Assim. 1.~ 20 a: o O 8 Comprimento do arame 12 16 600 500 400 . em adição à espessura da parede. 1.9 é um gráfico dos valores previstos da resistência à tração versus o comprimento do arame e a altura da matriz. Lembre-se de que o engenheiro construiu oito protótipos de cada projeto (3/32 e 1/8 polegada). reconsidere o problema da espessura da parede do conector. 1. sendo então curado o arranjo.1. .200 o~(0'?> ~y>\ ~ ~ Fig.1 continha um breve exemplo envolvendo um engenheiro que estava investigando o impacto do aumento da espessura da parede de um conector na força de remoção. 1. a partir do modelo empírico na Eq. Um experimento fatorial é aquele em que os fatores são variados conjuntamente.0125 (altura da matriz) (1. 1. seriam feitas em cada vértice. engenheiros trabalham em áreas problemáticas. Freqüentemente. é quase sempre necessário conduzir testes ou experimentos para confirmar que a teoria é. experimentos fatoriais são a maneira mais eficiente de estudar os efeitos de interação dos vários fatores. Usaremos um método para estimar os parâmetros nos modelos de regressão. vemos que a resistência à tração aumenta quando o comprimento do arame e a altura da matriz aumentam. os tempos de cura de interesse sejam 1 e 24 h e que os níveis de temperatura sejam 70°F e 100°F. 1. Quando vários fatores são potencialmente importantes. Note que esse experimento usa oito protótipos de 3/32 polegada e oito protótipos de 1/8 polegada. A Fig. 1. o mesmo número usado no estudo comparativo simples da Seção 1. Note que os valores previstos repousam no plano acima do espaço comprimento do arame-altura da matriz. Além disso.10. ele será primeiro imerso em um adesivo.• 300 ~\~ 200 o~<S' y>\~ 20 O 100 ~~ Fig. Notamos que o teste estatístico de hipóteses foi uma estrutura possível para investigar que o aumento da espessura da parede no projeto conduziria a níveis mais altos da força média de remoção. 1. parece razoável pensar que um modelo tal como Resistência à tração binações de comprimento de arame e altura da matriz que fossem de interesse.8 apresenta um gráfico tridimensional de todas as 25 observações da resistência à tração. Julgamento estatístico e métodos estatísticos desempenham um papel importante no planejamento. = ~o + 1.8 Gráfico tridimensional dos dados do arame e da resistência à tração. esse método escolhe os parâmetros (f3's) no modelo empírico para minimizar a soma dos quadrados das distâncias entre cada ponto dado e o plano representado pela equação do modelo. ou réplicas. 10 e 11. a experiência e a observação dos dados resultantes constituem as únicas maneiras pelas quais o problema pode ser resolvido. A partir dos gráficos dos dados na Fig. o tempo e a temperatura de cura poderiam ter algum efeito no desempenho do conector. Suponha que. Para ilustrar.12) em que o "chapéu" ou circunflexo sobre a resistência à tração indica que essa é uma quantidade estimada ou prevista. Julgamento estatístico pode também ser aplicado a problemas experimentais mais sérios.9 Gráfico de valores previstos da resistência à tração. A Seção 1. A força de remoção é medida no arranjo final. É aparente.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS Muito do que sabemos em engenharia e nas ciências fisico-químicas é desenvolvido através de testes ou experiências. no experimento do conector. ~1 (comprimento do arame) E + ~2(altura da matriz) + seria apropriado como um modelo empírico para essa relação. Essencialmente. Agora.

um efeito maior que o de aumentar a espessura da parede. temperatura de cura e tipo de adesivo .c :::. aparentemente.4.10 O experimento fatorial para o problema da espessura da parede do conector.6 (13. A interpretação dessa interação é muito direta. De fato.o PAPEL DA ESTATÍSTICA 14.1 (14.9.30 Temp. resultados incorretos ou enganosos podem ser obtidos.13. graficando essas médias versus tempo e então conectando.275 = 1. o aumento da temperatura de cura terá um efeito maior na força média de remoção.6 (13.9. O efeito de aumentar o tempo de cura de 1para 24 h é aumentar a força média de remoção por 1 libra-pé. há aparentemente muitas alternativas. compare a força média de remoção dos oito protótipos de 3/32 polegada com a força média de remoção dos oito protótipos de 1/8 polegada (essas são as médias das oito corridas na face esquerda e na face direita do cubo na Fig.3) I 13. 15. 7 libra-pé. se o objetivo do engenheiro for projetar um conector tendo um alto valor da força de remoção.10. .50 1 h .7. Há dois tipos: o adesivo padrão e um novo competidor. Assim. a temperatura de cura terá pouco efeito. o efeito de aumentar a temperatura de cura é aumentar a força média de remoção por O.14.425 = 0.43 Temp.3.5.1 I (12.2) ~ E 70' "\ e<f:'çO 24h lh l .6.1 (13.65 libra-pé. 15. ~ 13. Logo. Força média 1h 70"F 13. = 70'F 24 h Tempo Fig.65. para medir o efeito de aumentar o tempo de cura.13. 13.83 14. o tipo de adesivo. compare a média das oito corridas na face de trás do cubo (em que tempo = 24 h).3)--0---/' /' /' /' /' /' 12. Temp. 13. Note que as inclinações dessas duas linhas não parecem ser as mesmas. Suponha que o engenheiro queira considerar um quarto fator. indicando que o efeito do tempo de cura é diferente nos dois valores da temperatura de cura. com a média das oito corridas na face da frente do cubo (em que tempo = 1 h) ou 14.3) NA ENGENHARIA 9 13.5) I I I I 13.13.0 (12. 1. respectivamente) ou 14.95 15. 1.13. Desse modo.9 (12.12 ilustra como todos os quatro fatores . A Fig.45 = 0.0) 15.60 24 h 100"F 14.espessura da parede. O efeito da temperatura de cura pode ser avaliado. Primeiro.1. = 70'F 12. Interações ocorrem freqüentemente em sistemas físicos e químicos e os experimentos fatoriais são a única maneira para investigar seus efeitos. -----14. A inclinação de cada uma dessas linhas retas representa o efeito do tempo de cura na força de remoção. porém se o tempo maior de cura for usado (24 h). Podemos facilmente estender a estratégia fatorial para mais fatores. o tempo de cura tem. = 100'F 14.9. tais como o aumento da espessura da parede e o uso das condições "padrões" de 1 h e 70°F ou o uso da espessura original da parede de 3/32 polegada.11.1 . se o tempo padrão de cura (1 h) for usado.6.8) Espessura da parede (polegada) Fig. comparando-se a média das oito corridas no topo do cubo (onde a temperatura = 100°F) com a média das oito corridas na parte inferior do cubo (onde a temperatura = 70°F) ou 14. os pontos representando os dois níveis de temperatura. A seguir. 13. 1. tempo de cura. Existe uma relação interessante entre o tempo de cura e a temperatura de cura.90 13.. Algumas tentativas de conclusões muito interessantes podem ser retiradas desse experimento.30 24 h 70"F 13.97 12. Esse é um exemplo de uma interação entre os dois fatores. Esse gráfico foi construí do calculando a força média de remoção nas quatro combinações diferentes de tempo e de temperatura.1 32 8 13. que pode ser vista examinando-se o gráfico na Fig. 1.125 . 13.25 1h 100"F 13. aumentando a espessura da parede de 3/32 para 1/8 polegada aumenta a força média de remoção por 0.9) ~ '" ~ 100' a> c.37 . porém especificando um tempo maior de cura e uma temperatura mais alta.275 .a> c. se as interações estiverem presentes e a estratégia fatorial de experimentos não for usada.11 A interação de segunda ordem entre o tempo de cura e a temperatura de cura. ou seja. com linhas retas.poderiam ser investigados em um plane- Tempo Temp.8 (14.

A Fig. então. Ele proverá boa informação acerca dos efeitos individuais dos quatro fatores e alguma informação acerca de como esses fatores interagem. Claramente. 1. O Capo 13 concentrar-se-á nos fatoriais e nos fatoriais fracionários. um planejamento fatorial de experimentos irá requerer 2k corridas. Esse é um excelente planejamento experimental para estudar todos os quatro fatores.1. ~ I I . Geralmente. podendo o conceito de estabilidade ser melhor julgado. porém o gráfico não ajuda a explicar a razão para a variação. que introduzimos aqui. A Fig. Uma vez que muito do trabalho de engenharia envolve testar e experimentar. requereriam 256 ensaios./ . (2) Ele soltou a primeira bola de gude e registrou sua localização relativa ao alvo. ele será chamado de meia fração. é geralmente desnecessário testar todas as combinações possíveis dos níveis dos fatores. Esse planejamento de experimentos requer somente oito corridas." Novo ~ ::o "§ O> Q. . 1. o planejamento 24 na Fig./ . é essencial que todos os engenheiros entendam os princípios básicos de um planeja- mento eficiente e efetivo de experimentos. para a versão com quatro fatores do experimento do conector. como no planejamento fatorial. O funil estava alinhado o mais próximo possível com o centro do alvo. Por exemplo.13 Um experimento fatorial fracionário para o problema da espessura da parede do conector. cinco ou mais fatores. se houver k fatores e cada um deles tiver dois níveis. é importante plotá-los ao longo do tempo. todas as combinações possíveis dos quatro fatores são testadas. conforme mostrado na figura. E 70' .12 requer 16 testes. então. 1. Felizmente. O guru da qualidade Edward Deming enfatizou que é importante entender a natureza da variação ao longo do tempo. . Um deslocamento no nível médio do processo é visível no gráfico e uma estimativa do tempo do deslocamento pode ser obtida. Ele usou um funil montado em um anel e as bolas de gude caíram através do funil.10 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Tipo de adesivo í------"-Velho '\ Novo ~ ::o "§ O> 100' If:'<P Q. Ele apenas soltou uma bola de gude depois da outra e registrou a distância até o alvo. o planejamento experimental pode ainda ser representado geometricamente por um cubo (na verdade. por conseguinte. 32 1 "8 Espessura da parede (polegada) Fig. oito fatores. em vez das 16 originais. Isso se toma rapidamente impraticável. 1. em que somente se testa realmente um subconjunto das combinações dos fatores. usou duas estratégias diferentes para operar o processo.. Fenômenos que possam afetar o sistema ou o processo tomam-se com freqüência mais visíveis em um gráfico com uma escala de tempo.0 lh 3 32 24h . um hipercubo).16. Pelo fato de os dados serem coletados ao longo do tempo. Ele.14 é um diagrama de pontos com leituras de concentração tomadas periodicamente em um processo químico. Ele conduziu um experimento em que tentou deixar cair bolinhas de gude o mais próximo possível de um alvo em uma mesa. à medida que o número de fatores aumenta. Já que todos os quatro fatores têm dois níveis. por exemplo. O experimento requer 16 ensaios.13 mostra um planejamento fatorial fracionário de experimentos. em uma tentativa de compensar o erro.15. cada um com dois níveis. com k = 4. (l) Ele nunca moveu o funil. moveu o funil por uma distância igual e oposta. quando houver quatro.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO Toda vez que os dados são coletados ao longo do tempo. Note que. Ele continuou a fazer esse tipo de ajuste depois de cada bola ter sido solta. Uni experimento fatorial fracionário é uma variação do arranjo básico fatorial. Ver Fig. jamento fatorial. o número necessário de corridas em um planejamento fatorial aumenta rapidamente. Discutiremos esses princípios no Capo 12. 100' 70' "o lf:'çO lh E 24h f- O> 1. Ele./0-. 1. A grande variação descrita no diagrama de pontos indica um possível problema. são as únicas combinações de teste que necessitam ser realizadas. 1. onde nova tecnologia.12 Um experimento fatorial com quatro fatores para o problema da espessura da parede do conector. Depois das duas estratégias estarem completas./ 1 "8 Espessura da parede (polegada) Fig. eles são plotados ao longo do tempo na Fig. produtos e processos são projetados e desenvolvidos e onde produtos e processos existentes são melhorados. do ponto de vista do tempo e de outros recursos.. 1. As combinações de teste com um círculo. ele notou que a variabilidade na distância até o alvo para a estratégia 2 foi apro- Tipo de adesivo ____ . Experimentos fatoriais e fracionários são usados extensivamente por engenheiros e cientistas em pesquisa e desenvolvimento industriais.

1. A Fig. Cada ajuste é igual e oposto ao desvio da medida prévia em relação ao alvo. baseados em perturbações aleatórias.17(b) apresenta os mesmos dados depois dos ajustes serem aplicados à média do processo. mas não identifica o problema.17(a) Dados do processo somente com distúrbios aleatórios.18(a) apresenta os mesmos dados da Fig. 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.0 98. A Fig. Uma simulação computacional pode ser usada para demonstrar as lições do experimento do funil. Conseqüentemente. A explicação é que o erro (o desvio da posição da bola de gude até o alvo) para uma bola de gude não provê informação sobre o erro que ocorrerá para a próxima bola. . eles tendem a mover o funil para mais longe do alvo. Bolinhas de gude c Ü c u oo ~ 'lU Q) 100 90 80 Fig. 1. O sobrecontrole aumentou ·os desvios em relação ao alvo. Por exemplo. Os ajustes no funil aumentaram os desvios até o alvo.5 91. de concentração provê mais informações ximadamente duas vezes maior que para a estratégia 1. com 50 medidas (denotadas por y) de um processo em que somente perturbações !fleatórias estão presentes. Isso é conhecido como sobrecontrole ou controle demasiado.17(a).17(b) Ajustes aplicados aos distúrbios aleatórios controlam em demasia o processo e aumentam os desvios em relação ao alvo. II • I87.o PAPEL DA EsTATÍSTICA • • • • • • • NA ENGENHARIA 11 . Em vez disso. 1.1. Ajustes devem ser aplicados somente para compensar mudança não aleatória no processo . em uma tentativa de produzir dados mais próximos ao alvo. os ajustes no funil não diminuem erros futuros.5 IX 84.16 O experimento do funil de Deming. O valor alvo para o processo é de 10 unidades.então.1. 1. 1. exceto que as medidas depois da observação de número 25 são 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.14 O diagrama de pontos ilustra a variação. quando a medida for 11 (uma unidade acima do alvo). eles podem ajudar.0 • Concentração ••• • ~ Alvo Fig. 1. podem realmente aumentar a variação do processo. o 10 20 30 Número da observação Fig. 1. .17(a) apresenta um gráfico do tempo. a média será reduzida por uma unidade antes que a próxima medida seja gerada. Esse experimento interessante mostra que os ajustes em um processo.15 Um gráfico temporal do que o diagrama de pontos. A Fig.0 94.

estatisticamente deduzidos.5 1(1) o c o Ü ~ ~ c: 90 Limite inferior de controle = 82. A linha central na carta de controle é apenas a média das medidas de concentração para as primeiras 20 amostras (x = 91. Esse é um sinal muito forte de que uma ação corretiva é necessária nesse processo.18(b) apresenta os dados obtidos quando um ajuste (diminuição em duas unidades) for aplicado à média depois de a mudança ter sido detectada (na observação de número 28). quando o processo estiver estável. .19. um ajuste poderá ser útil. por duas unidades) depois da observação de número 25.19 Um gráfico (carta) de controle para os dados de concentração de processoquimico.15. controlar e melhorar um processo. sem quaisquer fontes externas de variabilidade presentes no sistema. O ramo da estatística que faz uso das cartas de controle é chamado de controle estatístico de processo ou CEP.18(a) A média do processo muda (para cima. Gráficos de controle são uma aplicação muito importante de estatística para monitorizar. Esses limites estão localizados acima e abaixo da linha central. em tomo da amostra 20. 1.18(b) A mudança na média do processo é detectada na observação de número 28 e as medidas seguintes são diminuídas por duas unidades. porque todas as observações seguin- tes estão abaixo da linha central e duas delas realmente caem abaixo do limite inferior de controle. Se o processo estiver operando como deve. a estrutura visual de referência. O limite superior de controle e o limite inferior de controle são um par de limites. Quando houver uma mudança verdadeira na média de um processo. No gráfico de controle da Fig.19 mostra um gráfico de controle para os dados de concentração do processo químico da Fig. podemos melhorar. A questão de quando aplicar ajustes (e por qual quantidade) começa com um entendimento dos tipos de variação que afetam um processo. Um gráfico ou carta de controle é uma maneira inestimável de examinar a variabilidade em dados ao longo do tempo. 14 13 12 11 y 10 9 A mudan a na média do processo é detectada 8 7 6 10 20 30 40 50 Número da observação Fig.12 O PAPEL DA EsTATÍSTICA NA ENGENHARIA 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig. 1. 1. Se pudermos encontrar e eliminar a causa básica desse distúrbio. por uma distância correspondente a três desvios-padrão dos valores de concentração. Discutiremos CEP e gráficos de controle no Capo 15. consideravelmente. indica que algum transtorno ou distúrbio atingiu o processo. 1. 100 Limite superior de controle = 100. as medidas de concentração deverão flutuar aleatoriamente em tomo da linha central e quase todas elas deverão cair entre os limites de controle. Note que esse ajuste diminui os desvios em relação ao alvo. A Fig. 1. A Fig.5 g/l). provida pela linha central e pelos limites de controle. aumentadas em duas unidades para simular o efeito de uma mudança na média do processo. 1.54 80 o 5 10 15 20 25 30 Número da observação Fig. que reflete a variabilidade inerente ou natural no processo. o desempenho do processo. 1.

13.18. Indique onde a média da amostra cai no diagrama. 26. 52.61.. a variância e o desvio-padrão da amostra. a partir de um experimento envolvendo um vídeo CRT de alta resolução. De cada valor. Ela obtém os seguintes dados: 7. Eles são: 8. 1.00 e um desvio-padrão de 10.82.21. 67.a)20 Qual o valor de a ~ que minirniza essa quantidade? Usando os resultados do ExerCÍcio 1. recalcule as quantidades do item (a). a variância e o desvio-padrão da amostra e construa um diagrama de pontos. resultou em uma média (OF)de 835.20. 73.6. 1. Quais são as maiores fontes de variabilidade nesse experimento? Um artigo no Journal of Aircraft (1988) descreve o cálculo de coeficientes de arraste para o aerofólio NASA 0012. (b) Calcule a variância e o desvio-padrão da amostra. 7.85. Diferentes algoritrnos de cálculo foram usados para M~ = 0.45.15. . com medidas de temperatura em uma fornalha. 2. Calcule a variância e o desvio-padrão da amostra.20.67.9.10. 7.15. 61. 80 e 84. NA ENGENHARIA 13 1. 85.. 100.04.15. O ExerCÍcio 1. para cada lançamento real ou de teste de um motor de um foguete espacial (da Presidential Commission on the Space Shuttle Challenger Accident. A prevenção da propagação da fratura por fadiga em estruturas de aeronaves é um importante elemento da segurança. Dê uma interpretação prática da média da amostra. qual das duas n quantidades desde que i=1 x I * 11 (Xi - X )2 e .18. 76. quais são a média e os desvios-padrão expressos em °C? Considere a amostra XI' x2.60.17.19. 75. 1. prepare um diagrama de pontos.11. Como está essa quantidade relacionada a S2 para os dados originais? Explique por quê. 3.66. n.14 e 8.96. (Xi - fL)2 será a menor. Considere a quantidade 1=1 (Xi . 83. Calcule a média. no Quais são os valores da média e do desvio-padrão de Z. 129131): 84. Um estudo de engenharia para investigar a fratura por fadiga em n = 9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de fratura: 2.67. 63. 2. Com esses dados.47. ou seja. 31. com média da amostra X e desvio-padrão s Faça Zi = (Xi . 1. 1 count é equivalente a um coeficiente de arraste de 0. 1.68. 64.83. o.02.37. 53. (b) Construa um diagrama de pontos com os dados de temperatura. 2. Comente o que encontrou.38.50 Usando os resultados do Exercício 1018. 1.o PAPEL DA EsTATÍSTICA Exercícios Suplementares 1. 76.16. (c) Sem considerar a menor observação (31°F). 75.x )/s.12. (a) Calcule a média da amostra. 81. 72.16 e 7. O que você pode concluir acerca da resolução de CRT nessa situação? O pH de uma solução é medido oito vezes por uma operadora usando o mesmo instrumento.. 9. 1. 57. 1. 7.14. Considere os dados de intensidade solamo ExerCÍcio 1. 1. Agora. Calcule a média da amostra.20. VoI.49. 7.80.63.=1 I 1.13.16.x e y e entre Sx e sr Uma amostra.80. 1.7. 35. calcule S2 para os novos dados.67. 74. 70. em que a e b são constantes diferentes de zero. o. fL? Codificando os dados.60..58. 2.0001): 79. 15. 70. .13. prepare um diagrama de pontos. foram reportados no artigo. 1. 8.2. 7. (a) A partir dos dados. = 1. usando um vídeo com baixa resolução. Considere os dados do aerofólio no ExerCÍcio 1. Xn. . 58. Quão "diferentes" são as outras temperaturas em relação a esse último valor? (a) (b) (c) EXERCÍCIOS PARA EXPANDIR A MENTE 1. 82.5 descreve os dados de um artigo em Human Factors em acomodação visual. 70. pp.00.40. prepare um diagrama de pontos.53. (b) Os dados de um segundo experimento. 81. (a) Calcule a média. Os dados a seguir correspondem às temperaturas das junções dos anéis (graus F). FaçaYi = a + bx.? o o i i . = 1. 11 1. 2. Prepare um diagrama de pontos por essa segunda amostra e compare-o com o diagrama para a primeira amostra.70. 78. (c) A partir dos dados.69. 7. com os seguintes resultados (os coeficientes de arraste estão em unidades de counts.18. subtraia 30 e então multiplique as quantidades resultantes por 10. Encontre uma relação entre .24. 79.19.

então. Sumários e apresentações de dados bem constituídos são essenciais ao bom julgamento estatístico. Por exemplo. essa abordagem pode requerer muito tempo e esforço.3 DISTRIBUIÇÕES DE FREQÜtNCIA HISTOGRAMAS E 2. ou similares. nesse formato.1. no caso de amostras pequenas. O computador se tomou uma ferramenta importante na apresentação e na análise de dados. A maioria da análise estatística é feita usando uma biblioteca de programas estatísticos.4 DIAGRAMA DE CAIXA 2. introduzimos a média. Questões como "Que percentagem dos corpos de prova cai abaixo de 120 psi?" não são fáceis de responder. Um diagrama de ramo e folhas é uma boa maneira de obter uma apresentação visual informativa de um conjunto de dados . a construção de um diagrama de pontos. Porque existem muitas observações. Esses dados são a resistência à compressão. Entre os pacotes mais populares e largamente usados estão o SAS (Statistical Analysis System). e o Statgraphics e Minitab para Pc.2 DIAGRAMAS DE RAMO E FOLHAS O diagrama de pontos é uma apresentação útil de dados. Você encontrará esses pacotes. Apresentaremos alguns exemplos de saída de vários pacotes estatísticos em todo o livro. No entanto. Enquanto muitas técnicas estatísticas necessitam somente de uma calculadora portátil. seleciona os tipos de análises e apresentações de saída que são de interesse. apresentações mais efetivas estão disponíveis para conjuntos com muitos dados.Sumário e Apresentação de Dados ESQUEMA DO CAPíTULO 2.5 GRÁFICOS SEQÜENCIAIS DE TEMPO 2. 2. até cerca de 20 observações. sendo necessário um computador para realizar as tarefas de forma muito mais eficiente. considere os dados na Tabela 2. em libras por polegada quadrada (psi). O usuário entra com os dados e. a variância e o desvio-padrão da amostra e o diagrama de pontos como técnicas para sumarizar dados. para servidores e computadores pessoais (PCs). Os dados foram registrados à medida que os testes iam sendo realizados e. de 80 corpos de prova de uma nova liga de alumíniolítio.1 IMPORT ANCIA DO SUMÁRIO E APRESENTAÇÃO DEDADaS 2.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS No Capo 1.2 DIAGRAMAS DE RAMO E FOLHAS 2. Pacotes estatísticos estão disponíveis tanto para computadores de grande porte como para computadores pessoais. Não discutiremos a facilidade de uso dos pacotes com relação à entrada e à edição de dados ou ao uso dos comandos. outras apresentações gráficas podem ser mais úteis. quando o número de observações for moderamente alto. usando esses dados. seria relativamente ineficiente. disponíveis na sua instituição. juntamente com pessoas experientes em manipulá-los. eles não contêm muita informação a respeito da resistência compressiva. porque permitem ao engenheiro focar as características importantes dos dados ou ter discemimento acerca do tipo de modelo que deveria ser usado na solução do problema. escritos a priori. submetida à avaliação como um possível material para elementos estruturais de aeronaves.

Ao lado de cada ramo. 2. Sf (para quatro e cinco) com folhas 4 e S.2 A Fig. O ramo SL tem folhas 0. 2. A última coluna no diagrama é a freqüência do número de folhas associadas a cada ramo. então poderemos dividir o valor 76 no ramo 7 e na folha 6.2 ilustra o diagrama de ramo e folhas para 25 observações sobre os rendimentos de uma batelada de um processo químico. O diagrama resultante de ramo e folhas é apresentado na Fig.1 Resistência à Compressão de 105 80 Corpos de Prova da Liga de AluITÚnio-Lítio . que não foram imediatamente óbvias quando da apresentação original na Tabela 2. Para ilustrar.9. Além disso.• . definindo cinco novos ramos: Sz com folhas Oe 1.2(b). Uma vez que um conjunto de ramos tenha sido escolhido.2(c) ilustra um diagrama de ramo e folhas.8 e 9.24. 2. Isso dobrará o número de ramos originais.3 e4 e oramo SU tem folhas S. A Fig. Ramo 4 1 353 960934Freqüência 5 89 8 3073050879 0361410 580 7 108 103 1 729583169 5Folha 68544162106 471340886808 4 2 7 12 10 3 3 1 6 8 Fig. Uma maneira de fazer isso seria dividir o ramo S (por exemplo) em dois novos ramos. Poderíamos aumentar quatro vezes o número de ramos originais. no mínimo.2(a). Há um número excessivo de ramos nesse gráfico. 2. . Ss (para seis e sete) com folhas 6 e 7. É geralmente melhor escolher entre S e 20 ramos. 7.1. Para construir o diagrama de ramo e folhas.7. e Se com folhas 8 e 9. dos defeitos nos lotes de pastilhas de semicondutores.1 Diagrama de ramo e folhas para os dados de resistência à compressão na Tabela 2.. Isso resulta em muitos poucos ramos e o diagrama de ramo e folhas não provê muita informação sobre os dados. resultando em uma apresentação mais adequada dos dados.. Na Fig.1. Na Fig. e uma folha. as resistências estão distribuídas aproximadamente de forma simétrica em tomo do valor central. se os dados consistirem em informações percentuais. selecionaremos os números 7. eles são listados ao longo da margem esquerda do diagrama. . sobre a resistência à compressão de uma liga.2. dois dígitos.8. 6. x.. diagrama de ramo e folhas nos capacita a determinar rapidamente algumas características importantes dos dados.1 Para ilustrar a construção de um diagrama de ramo e folhas.SUMÁRIO E ApRESENTAÇÃO DE DADOS 15 . 8 e 9 como os ramos. relativamente. pode ser desejável prover mais intervalos ou ramos. SL e SD. 2. poucos ramos em comparação ao número de observações. Em alguns conjuntos de dados. considere os dados na Tabela 2. dividimos cada ramo em duas partes.1. entre Oe 100.X2. em que cada número Xi consiste em. O EXEMPLO 2. Como valores dos ramos. XI. Uma inspeção desse diagrama revela imediatamente que a maioria das resistências à compressão está entre 110 e 200 psi e que um valor central está em algum lugar entre ISO e 160 psi. usamos 6. 149 170 237 135 171 167 208 221 151 160 115 131 199 168 174 153 180 118 160 201 200 175 158 148 150 87 154 229 163 142 172 101 184 178 123 156 133 194 193 190 154 110 176 181 228 167 120 143 180 121 186 169 165 141 146 157 158 174 183 76 150 145 Tabela 2.1. 2. St (para dois e três) com folhas 2 e 3. EXEMPLO 2.1. Em geral... dividimos cada número Xi em duas partes: um ramo. com cada ramo dividido em cinco partes. consistindo nos dígitos restantes. resultando em um diagrama que não nos diz muito acerca da forma dos dados. consistindo em um ou mais dígitos iniciais. todas as folhas correspondentes aos valores observados são listadas na ordem em que elas foram encontradas no conjunto de dados. devemos escolher.

contêm n = 80 observações. Se o número de observações forímpar. é um valor que tem aproximadamente um quarto (25%) das observações abaixo dele e aproximadamente 75% das observações acima.3 mostra um diagrama de ramo e folhas dos dados de resistência à compressão na Tabela 2. . os pontos de divisão são chamados de quartis. O segundo quartil.1.3. Os dados de resistência à compressão. a mediana estará na metade da distância entre os dois valores centrais. os quartis e a mediana. q2. O primeiro quartil ou quartil inferior.3 Diagrama de ramo e folhas do Minitab. Por causa do tempo demandado. interpolando quando necessário. 2. Diagrama de Caracteres em Ramo e Folhas Ramo e Folhas da Resistência N = 80 Unidade da Folha = 1. O terceiro quartil ou quartil superior. qj. Essa forma do gráfico é geralmente chamada de diagrama ordenado de ramo e folhas.3 indica que a moda é 158. O pacote Minitab calcula o primeiro e o terceiro quartis como sendo as (n + 1)/4 e 3(n + 1)/4 observações ordenadas. 2. Podemos também dividir os dados em mais de duas partes.0 e o 41.16 SUMÁRIO E APRESENT AçAo DE DADOS Ramo Folha Ramo 134 011 1 6z7s 23 1 3 Ramo 44 3 344 7 88 889 01 5 6 556 788 65 7z 7f 7t 6t 6f 455 57889 6e 5Folha 9U 7L 7U 9L 8L 6 6U 134556 6L (b) 8U 7 011357889 8 1344788 9 235 (a) 8e 7e 9s 9z 8z 8s 8t 8f 9f ge 9t (c) Fig.75. os quartis podem não ser únicos. A Fig. tais como os percentis. Por exemplo. O pacote usa os mesmos ramos que adotamos na Fig. A moda da amostra é o valor da observação que ocorre com mais freqüência. q3' tem aproximadamente três quartos (75%) das observações abaixo de seu valor. a coluna indica o número de observações nesse ramo. . que divide os dados em duas partes iguais. Note também que o computador ordena as folhas da menor para a maior. logo. No ramo intermediário 16. A mediana de uma amostra é uma medida de tendência central. O computador adiciona uma coluna à esquerda dos ramos que provê uma contagem das observações.2. A Fig.1. encontramos o 40.25 e 3(80 + 1)/4 = 60. Da Fig. e uma contagem das observações. 2. Como no caso da mediana. 2. esse valor ocorre quatro vezes e nenhum outro valor ocorre tão freqüentemente na amostra.0 1 7 6 2 8 9 3 5 7 7 15 10 11 8 11 17 25 37 (10) 058 01 3 12 13 14 15 33 23 16 16 17 18 19 20 21 10 6 5 2 1 22 23 133455 12356899 001344678888 0003357789 0112445668 0011346 034699 0178 8 189 7 24 5 Fig. isso geralmente não é feito quando o diagrama é construído manualmente. 2. produzido pelo Minitab. em cada ramo. na Fig.5.3. O diagrama ordenado de ramo e folhas toma relativamente fácil encontrar características dos dados. tanto no ramo como acima dele na metade superior do diagrama. tanto no ramo como abaixo dele na metade inferior do diagrama. a mediana é (160 + 163)/2 = 161. tem aproximadamente metade (50%) das observações abaixo de seu valor. 2. metade abaixo da mediana e metade acima. Se o número de observações for par. a mediana será o valor central. Quando um conjunto ordenado de dados é dividido em quatro partes iguais.0 valores da resistência como 160 e 163. O segundo quartil é exatamente igual à mediana. (80 + 1)/4 = 20. 2.2 Diagrama de ramo e folhas para o Exemplo 2.

1 bate1adas consecutivas essas três p.3 93.7 34.5 2.50 245.81269 35.0mediana dea os quartisa para os dados de posiçãocorde PARA Construa um 2.2 34.1 de1608 1910 1207 1535 1018 1015 1452 1315 1016 1501 2215 2100 1781 1940 1578 1120 1890 1730 1594 1102 1605 1750 2023 1642 1560 1416 2. 32.4 diagrama deos 94.5 87.00 143.5.2.7.6 91.8 89.2 95.191.4 33.7 35.2 86. é mostrada na Tabela 2.586. 2.6 845 89.1 89.6revestimentoquartis médiaciclosamostrafabricar processo33.2 85.0seguintes36. 87.3 90. o 100k.8 83.dequalSEÇÃO diferentesdecaracterísticas dos dados. 96.7 1888 93. Expliquequartismetal foi aplicadofalhar umdados folhas19.292.2 Resumo das Estatísticas para os Dados de Resistência Compressão. acha 34.50 162.4 83.5 95.21792 90. ximadamente podemos usar a faixa interquartil definida como IQR = q3 q I.2 100.4 dados motorprova representam esses 425)octanagem Construaartigo aem2.7 89. como uma medida de variabilidade.3 36. fratura no dados32. de modo a obter q3 = 181.1 92.8 90.7 93.1A descrevem diagrama Exercício 2.77 Mediana da N Máx181.3 86.4 92.3 37.8 86.3 37.3 87.9 88.1o Technometricscomo paraparadasubstratoporapresenta vapor.2 34.3 observação ordenada.8.3 90.4 84.732.491. do85.3 33.396.6 91.6 Você 92.5 94.3 89.1 35.9 de e seguir dematerial 1977.8 1055 78.336.6 90.188.6.1 34.6 33.688.3 e a 21. algodãono eExercício um dados dados.9 88.086.9 93.6 86.7 89.535.490.4 86.00.3 um 84.4 88.183.4 83.894.4 86.9 84.1 35.392.7 96.3 observação ordenada.1 34.9 88.5 85.9 do a os números de os omedidas de locali33.1 82.2 33.4 87.2 esses dados.235. Em geral.76.390.1 375 mediana.1 37.3 37.6 32.485.78 média Q1Q3 Desvio-padrão Erro-padrão à e=o 2.6 87.787.491.6 mediana 84.8 mostrados e moda e "sobreviverá" até de de de ca93.2.k)% deles estão acima dele.3 e a 61.1.0 94.6 87.5 90.6 91.3 96.3 que34.4.2 84.1 2265 1203 1330 1764 1883 1782 1223 1567 1000 1820 97.687.434.1 90.188.66 3.090. na Tabela 2.7 88.3 1512 1468 1238 92.4 34.4 92.1.394.4 97.SUMÁRIO E APRESENTAÇÁO DE DADOS 17 Conseqüentemente. Q O Q D .2 95.1 785 94.50 e entre a 60.00 relação à faixa ordiEm Variável 80 nma da amostra.1 706 90.9 1674 1260 90.091.71102 um 88.7 88.693.835. para 2.7 82.8 e=o 34.7 no Ospercentagem os de EXERCíCIOS 90 90. de modo a obter ql = 143.6 94.0 84.3. usado além dos 34.3 35.488.8 83.394.793.1 87. 92.5 96.1 a ramo e folhas para no90.233.1 88.1 89.0 84.9 910 86.1 32.9 34.689.2 2.832.689.187. A saída obtida para os dados da resistência à compressão Minitab.12. a partir do Tabela 2.00 161. a faixaMín interquartil é menos sensível a valores extremos na amostra.1 95.3 no94. Provenientes do Minitab Média33.1 88.6 89.5 Encontre 37.594.2 zação ExerCÍcio35.2.0 98.2 35.6 89.0 990 87.6 89. o Minitab interpola entre a 20.6 34.6 96. Q 13151522 33.1 87.1 35.para os dados de rendimento Umcombustível A91.5 35. 94.2 88.6 93.75836.6 885 87.2 84.7 34.6 90.8 93.7corposãoramo no(VaI.8 90.1 34.7 90. rendimento cerâmica. Finalmente.2 35. Muitos pacotes estatísticos computacionais provêem sumários de dados que incluem essas quantidades.7 36.6 93.791.033.4. de2.3 90.o percentil é o valor de modo que aproximadamente 100k% das observações estão nesse ou abaixo desse valor e apro100(1 .

respectivamente.18 SUMÁRIO E APRESENTAÇÃO DE DADOS 2.1 é mostrada na Tabela 2.j8O = 9.3 é muito fácil Fig. ver que a maioria dos corpos de prova tem resistências à com'a> 'a> pressão entre 130 e 190 psi e que 97. Logo.2125 0.2750 0.8000 0.lIlI il11tllJ. então é costume desenhar retângulos cujas áreas serão proporcionais às freqüências. a distribuição de freqüências na Tabela 2.4 Histograma de resistência alumínio-lítio. suspeitamos de que cerca de 8 ou 9 intervalos de classe fornecerão uma distribuição satisfatória de freqüência. A Fig.tllJ. à compressão para 80 corpos de prova da liga Tabela 2. então podemos começar 70a distribuição de freqüência em <: L~ 10190 o'ü 20 130 150 L 0. dos dados de resistência à compressão. Esse é um intervalo ou faixa de 180 o unidades de psi.0375 0. Entretanto. os histogramas são mais fáceis de interpretar quando os intervalos de classe têm a mesma largura.0750 0.3 expressa as freqüências relativas na base cumulativa.3 Distribuição de Freqüências para os Dados de Resistência à Compressão na Tabela 2.3.9750 1. levando a 17 intervalos de classe. 2. Notamos que os histogramas podem ser. A última coluna da Tabela 2. Para desenhar um histograma.9250 0.5 mostra um histograma. Entretanto.1 Intervalo de Classe (psi) 70 Marcação 11 Freqüência 2 3 6 14 22 17 10 Freqüência Relativa 0. achamos que 5 a 20 intervalos são satisfatórios na maioria dos casos e que o número de intervalos deve crescer com n. As freqüências relativas são encontradas dividindo a freqüência observada em cada intervalo pelo número total de observações.76 = 169 unidades na escala de psi. fornece uma impressão visual da forma da distribuição das medidas. perdemos alguma informação porque não temos mais as observações individuais. trabalha-se bem se o número de intervalos de classe for aproximadamente igual à raiz quadrada do número de observações. de modo que uma apresentação razoável possa ser desenvolvida. Algum julgamento tem de ser usado na seleção do número de intervalos de classes. Geralmente.1250 0.0625 > Resistência à compressão (psi) 70 e terminá-Ia em 250. Por exemplo.0250 0.0250 0.5% dos corpos de prova caem abaixo de 230 psi. 2. Uma distribuição de freqüência não será informativa se usar um número muito baixo ou muito alto de intervalos de classe.lI il11il11tllJ. 11I1 4 2 11 . O histograma. É também útil apresentar a distribuição de freqüência na forma gráfica. Nove intervalos. Na Fig.1750 0. Durante a passagem dos dados originais ou do diagrama de ramo e folhas para um diagrama de freqüência ou para um histograma. Se os intervalos de classe tiverem igual largura. essa perda de informação é pequena comparada ao ganho de concisão e de facilidade de interpretação ao usar a distribuição de freqüência e histograma.1895 'ü '" dos.0000 < x < 110 110 < x < 130 130 < x < 150 150 <x < 170 170 < x < 190 190 < x < 210 210 < x < 230 230 < x < 250 90 <x< 90 I1I il111 il11tllJ.3125 0. O maior e o menor valores dos dados são 245 e 76. note a distribuição simétrica em forma de sino das medidas de resistência. que são geralmente chamados de intervalos de classe ou células.3 contém uma distribuição de freqüências relativas. os intervalos devem ser de iguais larguras de modo a aumentar a informação visual na distribuição de freqüências. Distribuições de freqüências são geralmente mais fáceis de interpretar do que as tabelas de dados. 2. Para construir uma distribuição de freqüência. assim como informação sobre a dispersão dos dados.3 é baseada em nove intervalos de classe. cada um com 20'" psi de largura. temos de dividir a faixa de dados em intervalos.0250 Freqüência Relativa Cumulativa 0.ll il111lJl.0625 0.1375 0. Se quisermos que o limite inferior para o primeiro intervalo de classe comece um pouco abaixo do menor valor dos dados e que o limite superior para o último intervalo de classe comece um pouco acima do maior valor dos da0. O eixo vertical representa a escala de freqüência (ou freqüência relativa). na Tabela 2. Uma vez que o conjunto de dados contém 80 observações e . em relação ao diagrama de ramo e folhas. obtido no Minitab. assim. conforme mostrado na Fig.1250 0. A quarta coluna da Tabela 2. Uma distribuição de freqüência para os dados de resistência à compressão na Tabela 2.4. 2. Os números "padrões" foram usados nesse histograma.4.3125~ 25 '" ':J ~ <: 0. Tal gráfico é chamado de histograma. O número de intervalos depende do número de observações e da quantidade de dispersão dos dados.tllJ. então as alturas dos retângulos desenhados nos histogramas serão proporcionais às freqüências.0500 0. Se possível.3 DISTRIBUIÇÕES HISTOGRAMAS DE FREQÜÊNCIA E Uma distribuição de freqüência é um sumário mais compacto dos dados. os intervalos têm de cobrir uma faixa de no mínimo 245 . use o eixo horizontal para representar a escala de medidas e desenhe os limites dos intervalos. como o diagrama de ramo e folhas. Se os intervalos de classe tiverem larguras desiguais.5875 0. fornecem uma razoável distribuição de freqüência.2500 ':J 110 170 c90 210 LL 250 230 15 c5 0. Na prática. relativamente.

então a média. Ele é similar ao histograma original. Para conjuntos pequenos de dados. os intervalos devem ter a mesma largura. a escolha do número de intervalos não é especialmente importante e ambas (Figs. A Fig. se a distribuição for distorcida para a direita.-como na Fig. enquanto em outras.6) conduzem a informação similar. .6 mostra o histograma. como nas Figs. 2..7 mostra uma variação de histograma. com nove intervalos. para amostras relativamente grandes.7 que existem.. 2.8 apresenta três casos.~ 30 u. Distribuições cumulativas são também úteis na interpretação de dados. a mediana e a moda coincidirão. proveniente do 80 > 70 ~ 60 :.~ 40 . Histogramas são mais estáveis para conjuntos grandes de dados. Uma vez que o número de observações é moderamente grande (n = 80). 2. à compressão. à compressão.8 Histogramas para distribuições simétricas e deslocadas.8b. a mediana e a moda não Fig. Nesse gráfico.6 Histograma dos dados de resistência Minitab com 9 intervalos de classe. 70 observações menores que ou iguais a 200 psi. 2. 2. feito pelo Minitab para os dados de resistência à compressão. então a média e a mediana coincidirão. se a distribuição for distorcida para a esquerda. Histogramas são mais efetivos como a apresentação de dados. se os dados forem sirnétricog. Quando usamos dados por categoria. a ordem das categorias será arbitrária (tais como macho e fêmea). preferencialmente com 70. Distribuições de freqüências e histogramas são também usados com dados qualitativos ou por categorias. com uma longa cauda para um lado). a altura de cada barra é o número total de observações que é menor ou igual ao limite superior do intervalo. proveniente do 140 160 180 200 220 240 Resistência sensíveis ao número e à largura de seus intervalos. 2. 2. tipo n 2: 75 a 100 ou maior. aproximadamente.5 e 2. proveniente do Minitab. então a média. segundo. Quando o tamanho da amostra for grande. Geralmente. 2. Em algumas aplicações.5 Histograma dos dados de resistência Minitab com 17 intervalos de classe.SUMÁRIO E APRESENTAÇÃO DE DAOOS 19 r:r 'o> . disponível no Minitab. c ~ 10 5 20 O <1l 100 150 Resistência 200 250 o Fig. 2.8a e c. Desvio para a esquerda ou negativo (a) Simétrico (b) Desvio para a direita ou positivo (e) Fig.7 Gráfico de distribuição cumulativa pressão. dos dados de resistência à com- 200 250 coincidirão. por exemplo.> <1l ~ 50 u . terceiro e quartanista na universidade). A Fig. Se. os dados tiverem apenas uma moda (dizemos que os dados são unimodais). se o número e/ou a largura dos intervalos mudarem. enquanto moda> mediana> média. 2. encontraremos que moda < mediana < média. haverá uma ordem natural das categorias (tais como calouro. 2.:. A Fig. Usualmente. c ~ 20 10 o 100 150 Resistência Fig. os histogramas podem mudar dramaticamente na aparência. 100 ou mais dados. mostrado na Fig. podemos ler diretamente da Fig.> '(3 u.4. 2. Se os dados tiverem desvio de simetria (assirnétricos. o histograma poderá ser um indicador confiável da forma geral da população de medidas da qual a amostra foi retirada. além disso. o gráfico de freqüência cumulativa.

alinhados tanto horizontal como verticalmente. símbolos diferentes. Compare sua forma com aquela do histograma com oito intervalos de classe do Exercício 2. Use oito intervalos de classe.3.9 apre"ota a p<adoção de e'Paçooave. em 1985. dispersão. Construa uma distribuição de freqüência e histograma. mostrados na Tabela 2.) ----------2. A inspeção dessa apresentação revela que existe muito mais variabilidade na planta 2 e que as plantas 2 e 3 precisam melhorar o desempenho de seus índices da qualidade. A Fig. 2. temos nos concentrado em métodos descritivos para a situação em que cada observação.11.!l! (l) ro ~1J 1J'" :? (l) .10. 707 747 250 100 ~º -150737 767 . modos de falha ou problemas nos produtos/processos. 2. para os dados de octanagem do combustível para motor do Exercício 2. seguida pela categoria com a segunda maior freqüência. na potência do motor. enquanto quantidades numéricas. discutiremos esse tipo de dados. Ver Fig. são usados para identificar os dois tipos de outliers. no tamanho do motor no veículo. 747. D Construa uma distribuição de freqüência e histograma para os dados de octanagem do combustível para motor do Exercício 2. Note que o modelo 737 foi o mais popular. Há também dois suaves outliers em cada extremidade dos dados.9.13. I A Fig. o mínimo e o máximo dos dados em uma caixa retangular. Construa um diagrama de Pareto e interprete. Algumas vezes. em três plantas de fabricação. Uma linha estende-se de cada extremidade da caixa.12 mostra os diagramas comparativos de caixa para o índice da qualidade de fabricação em equipamentos semicondutores.14. pela Compa. O diagrama de caixa é uma apresentação gráfica que descreve simultaneamente várias características importantes de um conjunto de dados. q2 = x. porém a menos de 3 amplitudes interquartis da extremidade da caixa. pode ser creditada apenas a umas poucas categorias. Um ponto além da linha. através da caixa. Construa uma distribuição de freqüência e histograma. Esse gráfico é largamente empregado nos esforços de melhoria da qualidade. ou seja.3 veículo. porque os bigodes da direita e da esquerda e os comprimentos das caixas da direita e da esquerda ao redor da mediana são aproximadamente os mesmos. Por exemplo. 30 peças fora de contorno e 3 peças com rebarbas. Pareto e eles geralmente exibem a lei de Pareto. ~ 2.4 DIAGRAMA DE CAIXA (Box Plof ) o diagrama de.1.LOO -.o o 757 (l)CO Um histograma de ocorrências por categoria (em que as categorias são ordenadas pelo número de ocorrências) é algumas vezes chamado de diagrama de Pareto. Em muitos casos. Q 2. Uma linha é desenhada. a Fig.9. Q 2. Ocasionalmente. 21 peças subaparadas. e assim por diante. 2. Por exemplo.2.~~ 50 z. Os diagramas de caixa são muito úteis em comparações gráficas entre conjuntos de dados. com 16 intervalos de classe. 2.11 representa o diagrama de caixa obtido pelo Minitab. ""'" EXERCÍCIOS PARA A SEÇÃO 2.14. em um estudo de rnilhagem de gasolina. ql' e o canto direito (ou superior) no terceiro quartil. A caixa inclui a amplitude interquartil. 8 fendas perdidas. q3. é chamado de outlier. Esses diagramas têm o nome do matemático italiano V. Nesta seção. trabalhamos com dados em que cada observação consiste em várias medidas. Diagrama de Pareto. a maioria dos defeitos. é um número único ou pertence a uma categoria. Suponha que a seguinte informação sobre defeitos estruturais nas portas dos automóveis seja obtida: 4 arranhões. usando os dados de fratura do Exercício 2. (Fonte: Companhia Boeing.4.1. com o canto esquerdo (ou inferior) no primeiro quartil. 5 peças não lubrificadas. Construa uma distribuição de freqüências e histograma para os dados do teor de algodão do Exercício 2. Dados mais afastados do que os bigodes são graficados como pontos individuais. 2. (Essas observações são chamadas "outliers". em que as categorias geralmente representam tipos diferentes de defeitos. 767 e 707. em um conjunto de pontos. Modelo do avião Fig. para os dados da resistência da liga à compressão.20 SUMÁRIO E ApRESENTAÇÃO DE DAOOS EXEMPLO 2. ramo e folhas e o histograma fornecem impressões visuais geraiS"acerca de um conjunto de dados. Construa uma distribuição de freqüência e histograma para os dados de rendimento do Exercício 2. Esse é um exemplo de dados multivariáveis. Ver Exercício 2. Os dois histogramas apresentam informação similar? o 2. uma vez que têm alto impacto visual e são fáceis de entender. 6 itens arrumados fora da seqüência. .10. seguido pelos modelos 757. desvio da simetria e identificação das observações que estão surpreendentemente longe do seio dos dados. cada observação pode consistir em uma medida de milhas por galão.1. Esse diagrama de caixa indica que a distribuição a resistências compressivas é razoavelmente simétrica em tomo do valor central. As categorias são ordenadas de modo que a categoria com a maior freqüência ficará à esquerda. tais como centro. tais como x ou s fornecem informação sobre somente uma característica dos dados.5 interquartil a partir do primeiro quartil.3 2. 4 buracos. pítulos mais adiante. .g.(l) ~ E Nos ca- nhia Boeing. Uma variação importante de um histograma para dados por categoria é o diagrama de Pareto. no peso do veículo e no comprimento do ". Um ponto a mais de 3 faixas interquartis da extremidade da caixa é chamado de outlier extremo. 2. no segundo quartil (que é o percentil50 ou a mediana).9 Produção de aviões em 1985.12.) Um diagrama de caixa apresenta três quartis. diagramas' de caixa são chamados de diagramas de caixa e linha. tais como círculos abertos e fechados. A linha superior começa no terceiro quartil indo até o maior valor do conjunto de pontos dentro das faixas de 1.5 interquartil do terceiro quartil. A linha inferior começa no primeiro quartil indo até o menor valor do conjunto de pontos dentro das faixas de 1.

5 rQR •• 1. a partir do primeiro quartil.8. a partir dos dados.0.8. 2.19. 2.15. 955. Comente sua resposta. (b) Calcule a variância e o desvio-padrão da amostra. 950.92. (c) Construa um diagrama de caixa dos dados. Q 2.1. 2. 3.1.SUMÁRIO E APRESENTAÇÃO DE DADOS 21 A linha se estende. 2. 1. Um artigo no Transactions of the !nstitution of Chemical Engineers (Vol. 5. O "tempo de ignição fria" de um motor de carro está sendo investigado por um fabricante de gasolina. 3. pp.5 interquarti.0. 1956. 4.3.2. (d) Encontre os percentis 5% e 95% da temperatura.+--l. (a) Calcule a média e o desvio-padrão da amostra.7.5 IQR 01< Fig.4 ---------2. (b) Calcule a variância e o desvio-padrão da amostra. 3. 2. Quão diferentes são as outras temperaturas em relação a esse menor valor? (d) Construa. 34. 2.53 e 1. 954 e 955. 3. Os seguintes tempos (em segundos) foram obtidos em um veículo de teste: 1. 4.5 rQR •• I :( raR 01< 1. (a) Calcule a média da amostra.7. (c) Isole a menor observação (31°F) e recalcule as quantidades das partes (a) e (b).62. o Outliers '\/ o Outlierextremo 1 •• / o f.8.. 3.8. De quanto a maior medida de temperatura poderia aumentar. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. (a) Calcule a média. 4.14 apresentou as temperaturas na junção dos anéis (graus Fahrenheit) para cada lançamento de teste ou real do foguete espacial.6. EXERCíCIOS PARA A SEÇÃO 2. O Exercício 1. 280-293) reportou dados sobre um experimento. 948.8 e 5. 3.15. 2.E Q) Q) ::> Q) 90 100 80 3150 200 250 70 120 2 110 Fig. (c) Isole a maior observação (100) e refaça os itens (a) e (b). a variância e o desvio-padrão da amostra. 2. até o menor ponto dado que esteja na faixa de 1. a partir do terceiro quartil. 2. 1. 5. em fase vapor.11 Diagrama de caixa para os dados de resistência à compressão na Tabela 2. 949.13 apresenta coeficientes de arraste para o aerofólio 0012 da NASA. 957. 5.35.3. Planta :2 'õ u 'O c'" '" . investigando o efeito de muitas variáveis de processos na oxidação. registradas em bateladas sucessivas de um processo de fabricação de semicondutores (unidades em °F): 953. 4. (b) Encontre a mediana. desejava-se encontrar a média e o desvio-padrão da amostra de temperatura.75.5 interquarti. 2.91. Você calculou a média.18.20. (c) Construa um diagrama de caixa dos dados e comente sobre a informação nesse diagrama. (b) Construa um diagrama de caixa dos dados. 2. A iinha se estende. .0.0. 3. o Exercício 2.12 Diagramas de caixa comparativos de um indice de qualidade em três plantas. 951.0. (b) Construa um diagrama de caixa dos dados. 2. Os seguintes dados são as temperaturas. Comente o que encontrou. 3. Fig. 4. (a) Encontre os quartis inferior e superior dos coeficientes de arraste. 4. sem mudar o valor da mediana? (c) Construa um diagrama de caixa dos dados.16.09.1. do efluente na descarga de uma unidade de tratamento de esgoto: 43 45 49 47 52 45 51 46 44 48 51 50 52 44 48 50 49 50 46 46 49 49 51 50 (a) Calcule a média e a mediana da amostra.10 Descrição de um diagrama de caixa. a variância e o desvio-padrão da amostra de todos aqueles coeficientes. ""'" D As nove medidas que seguem são temperaturas de fornalha. Naquele exercício. (a) Encontre os quartis inferior e superior de temperatura. em dias consecutivos. até o maior ponto dado que esteja na faixa de 1.17. de naftaleno.8. (b) Encontre a mediana.2. um diagrama de caixa e comente a possível presença de outliers.

2.13 Vendas da companhia por ano (a) e por quadrimestre (b).. 2. Por exemplo. freqüentemente vemos tendências. VoI. a variabilidade nessas medidas ao longo do tempo. Entretanto. Ã • ~• • • • 8 7108 960934 0361410 8544162106 3073050879 471340886808 29583169 413535 103 580 19 18 17 16 15 14 • • \ . 1988. A impressão geral desse gráfico é que as vendas mostraram uma tendência para cima. dias. notamos na Seção 1. J. . A Fig..J . Algumas vezes. ramo Esse diagrama apresenta efetivamente a variabilidade global nos dados de resistência à compressão e mostra.5 que o tempo é um fator importante que contribui para a variabilidade dos dados e os métodos gráficos acima mencionados não levam isso em consideração. são métodos visuais muito úteis para mostrar a variabilidade nos dados.. considere a Fig.15 nos conta um fato diferente. 54) sugeriu combinar o diagrama de ramo e folhas com o gráfico de série temporal para formar um gráfico digiponto... A impressão geral é que a resistência à compressão varia em tomo do valor médio de 162.13(b) mostra os últimos três anos de vendas registradas no trimestre. considerando que essas observações são registradas na ordem em que elas ocorre- 1982 1983 19841985 1986 1987 (a) 1988 1989 19901991 Anos ><: g ""O C Q) > 2 3 4 2 3 (b) 4 1989 1990 234 1991 Quadrimestres Fig. 2. 2. x) e o eixo horizontal denota o tempo (que poderia ser minutos. 13 12 11 • 15 7 7 10 9 • • r · • • • '. Esse gráfico mostra claramente que as vendas anuais nesse negócio exibem uma variabilidade cíclica no trimestre. ' . p. 2. 2.5 GRÁFICOS SEQÜENCIAIS DE TEMPO As apresentações gráficas que temos considerado. A Fig. \ • • . O gráfico digiponto na Fig. geralmente. diagramas de ramo e folhas e diagramas de caixa. com as vendas no primeiro e no segundo trimestres sendo. • •• <I' r······ • . Esse gráfico resume 30 observações de concentração no produ- Folha Ramo Gráficode série temDoral 5 7 189 24 23 22 21 20 • • • • • .1. Uma série temporal ou seqüência temporal é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. anos.22 SUMÁRIO E APRESENTAÇÃO DE DADOS 2. pode ser muito útil combinar um gráfico de série temporal com algumas outras apresentações gráficas que consideramos previamente.). Existe alguma variabilidade em tomo dessa tendência. durante os últimos 10 anos.1.simultaneamente. com algumas vendas anuais aumentando sobre aquelas do último ano e algumas vendas anuais diminuindo. que apresenta um gráfico de série temporal das vendas anuais de uma companhia. ciclos ou outras características gerais dos dados que não poderiam ser vistos de outra forma.14 Gráfico digiponto dos dados de resistência à compressão na Tabela 2. Um gráfico de série temporal é aquele em que o eixo vertical denota o valor observado da variável (por exemplo. maiores do que as vendas durante o terceiro e o quarto trimestres.67.· vf·~. como histogramas. etc.14 mostra um gráfico digiponto para as observações de resistência à compressão da Tabela 2. . 42. ~~f • 8 7 6 Fig. Stuart Hunter (The American Statiscian.. Quando as medidas são plotadas como uma série temporal. 13(a). não havendo padrão óbvio forte nessa variabilidade ao longo do tempo.

A análise deles requer algum conhecimento avançado de estatística e construção de modelo estatístico.1 43. são mostrados na Tabela 2. Em seu livro Time Series Analysis.0 17.4 que foram corpos deleia parasão mostrados de laboratório. Os tempos de resposta para 20 tarefas consecutivas foram registrados. D. 2.1 16.4 ""'" ""'" ""'" 48. da separado de Dados folhas medidos.3 12.) (a) Construa um diagrama da série temporal desses dados.8 43. da esquerda para a direita).3 43.26. Reinsel apresentam leituras de concentração de um processo químico. (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.9 47. .5 2. ver o livro de Box. C. G. Gardiner analisam os dados na Tabela 2.9 17.1. to na saída de um processo químico.8 17. •• .1 48. 17. depois desse tempo. que correspondem ao total de milhas voadas.6 43. gráfico conector ou um diagrana viscosidade do produto são em 48 48. ma esquerda ordem em e para ramo 241 Construa um diagrama da série temporal dos dados. A. M. alguma coisa pode ter ocorrido no processo. S.2 10.8 16.4 )1. 2.1 11. Box. 225 248 203 195 249 (a) (b) 195 255 245 235 220 199 183 213 236 245 190 175 178 175 190 2.2 9.J'v f\\~ ~.22. 5. Montgomery. em que as observações são registradas em intervalos de uma hora. esse processo produziu concentrações geralmente acima de 85 g/l. sendo mostrados abaixo e em ordem (leia para baixo e. Fig. _.0 48. Jenkins e Reinsel.7 5.8 42.2 8. O College ofEngineering and Applied Science na Arizona State University tem um sistema V AX de computadores.5.0 17. porém.1 17. L.6 43. então.9 2. observadas dehora em hora. 1990).9 força Construa As A201 e interprete um para um digiponto é medida em um teste especificações 2.4 18. Forecasting.4.0 4. referenciado no Exercício 2.4 6.2 48._e e\ • · li · • /\·/v.15 Gráfico digiponto das leituras de concentração de um processo químico.0 47. que resultou em concentrações mais baixas.6 245 251 212 187 238 185 194 218 210 209 198 249 220 48.7 16.3 6.6 O O O Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.3 47. Jenkis e G.5 16. Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas dos dados.9 47. Em seu livro Forecasting and Time Series Analysis.9 7.SUMÁRIO E APRESENTAÇÃO DE DADOS 23 Folha Ramo Grálicode série temporal 2333 45 0010000 66677 99998 45 9s 8t 8s 9f 8e ge 8z81 9t 9z 8 · · / IV f\J.5 12.2 10.6 17. da esquerda para a direita). da esquerda para a direita). feitas a cada duas horas. EXERCÍCIOS PARA A SEÇÃO 2.8 17.21.0 17.3 17.3 16. então. de 1770 a 1869. entre 1964 e 1970 (em !TIÍlhões de milhas).5 43.5 8.1 16. 1994). Os seguintes dados são medidas de viscosidade para um produto químico observado de hora em hora (leia para baixo e. a seguir (na poral desses para a direita): 40e um diagrama de série tem-então. G. 48. 16. Johnson e 1. Os números anuais Wolfer de manchas solares. prova baixo e. mensalmente.dados.24. nho Construa e interprete um diagrama de série temporal desses dados. então.2 7.2 de remoção 42. Alguns desses dados são mostrados a seguir (leia para baixo e." edição (McGraw-Rill.9 3.9 17.5 16. C. and Control (Prentice Ral!. Esse diagrama indica que durante as primeiras 20 horas de operação. Se essa variabilidade na concentração de saída do produto puder ser reduzida.25.5 48. P. E.5 48.2 17.1 16. então a operação desse processo poderá ser melhorada. (Para uma análise interesssante e uma interpretação desses números.24.7 17. pelos passageiros da United Kingdom.

933 14.290 8.665 10.110 9. 65.28.222 11. (b) Calcule a variância e o desvio-padrão da amostra.186 14.829 8.455 9.389 9.588 8.246 10. Suponha que o valor desejado para essa solução tenha sido especificado em 65 g/ 1. usando o método da Eq.953 11.607 9. Quais as maiores fontes de variabilidade que você imagina para esse experimento? Por que é desejável ter uma pequena variância dessas medidas? Uma amostra com resistores resultou as seguintes resistências (ohms):x] = 45. (a) Calcule a média da amostra.801 10.1. (a) Calcule a variância e o desvio-padrão da amostra.577 11. (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.685 10.730 8. 67. para medir a concentração.2.24 1849118 1833 138 185047 185138 1830 66 183148 1867 50 184137 184063 181535 1862 2 1814 ApRESENTAÇÃO DE DADOS 71 14 13 11 1836 1311 1800 154 1834 101 1848 132 1858 103 1846 124 1822 122 1824 20 1823 24 1847 23 1837 68 1835 66 182560 185941 180983 183267 182190 1845 92 1868 85 1869 31 185382 185235 1805E 7 1807 43 1855 10 1798 42 1796 28 1860 98 1864 37 1839 40 1838 28 1828 51 1826 77 180134 1827 74 180245 1810 57 1799 47 185421 182967 1808 94 185723 1856 96 180628 1797 36 1820 64 1843 54 181830 184224 181741 1811 62 1866 39 181646 1844 55 186530 181924 1861 9 1803 4 1804 7 1795 6 1812 5 1863 O 1813 8 12 17 10 16 15 86 SUMÁRIO 125 1770 Tabela 2.772 7.030 pelos Passageiros da United Kingdom Voadas Mês (a) Desenhe um diagrama de série temporal dos dados e comente qualquer característica aparente desses dados.925 9.402 8. Exercícios Suplementares 2.057 13.281 12.417 16.812 13.27.731 14.3 (g/l).645 7.775 7.444 12.594 7.682 10.x3 = 47.x4 = 41.857 12. 65.667 10.5 Milhas 11. a operadora tenha de calibrar o aparelho e usar um material reagente.772 12.614 7.8.179 10.350 10.147 10.638 10.333 10.894 10.x2 = 38.775 11. (c) Suponha que.794 11.396 9.840 12.4.161 Tabela 2.269 12.637 14.280 12.366 10. temente próximo do valor alvo.637 12.948 7.864 7.852 10.1 e 65.103 13. .829 10.078 12.Você acha que o valor médio calculado aqui é suficien- 2.882 13.759 6. A concentração de uma solução é medida seis vezes por uma operadora que usa o mesmo instrumento.248 9. 1.933 9.xs = 35 eX6 = 43.484 8.899 11.069 8.639 8. Ela obtém os seguintes dados: 63.334 9.994 8.109 10.491 8.436 10.234 15. para que se possa afirmar que a solução tenha atingido o alvo? Justifique sua resposta.253 13.919 8.537 13.4 Números Anuais de Manchas Solares 1970 1968 1967 1965 1966 1969 1964 10.252 9.094 7.391 11.424 13.371 7.770 12.282 8.819 12.185 9. 64.0.589 11.

do que os dados originais.3 16.0 15.0 13. 290.150. de da para um conjunto de 3 2.6 e da esquerda para a direita. 4. 10. com um tamanho igual a 50.1 15. Os dados mostrados na Tabela 2. Compare seus resultados com aqueles obtidos nos itens (a) e (b) e justifique sua resposta.5 15. 8. 2.3 15. mas primeiro subtraia o número 1. 487495) apresenta dados de viscosidade de um processo químico em batelada. (a) Construa um diagrama de caixa e comente a forma da distribuição dos dados.650.4 15.9 14.8. 280-293) reportou dados sobre um experimento. Como parte desse sistema de qualidade.jY ou log(y).31. considere os seguintes dados.8. foi decidido registrar o número de molas fora de conformidade. (a) (b) (c) .7. Calcule a amplitude. (b) Calcule o desvio-padrão de ambas as amostras. (b) 5.0. (a) 2. 3.8. 9. 4.3. 1.5 14. Um fabricante de molas está interessado em implementar um sistema de controle da qualidade para monitorar seu processo de produção. (b) Transforme os dados usando logaritmos. Há alguma coisa "especial" sobre o valor constante 1. 5.6 17. Calcule a variância e o desvio-padrão da amostra. Você concluiria que ambas as amostras exibem a mesma variabilidade? Explique.1. 175.3 14. 6. 8. (b) Pergunte-se como você usaria um procedimento gráfico para prever vendas mensais de champanhe para o ano de 1970. Para ilustrar o efeito de uma transformação. 3. faça y* (novo valor) = log(y) (valor antigo).1 15.30.000. 4. Construa um diagrama da série temporal dos dados. pp. 4.0. (a) Construa um diagrama de série temporal dos dados e comente qualquer característica dos dados que seja revelada por esse diagrama. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. investigando o efeito de muitas variáveis de processos na oxidação em fase vapor de naftaleno. (c) Construa um diagrama de série temporal dos dados.6 14.6 representam as vendas mensais de champanhe na França (1962-1969).000 bits. 5.35. (a) Construa um diagrama de ramo e folhas dos dados. 6. 5.33.7 14.caracteres (string) de do número Dados esquerda para conjuntos são vistos a seguir. tais como .34. 1.0. Uma amostra desses dados é apresentada a seguir. pp.2.7. 1. 7. que representam ciclos de falhas de um tecido: 675. 8. O gráfico indica que os dois processos geram resultados similares? (c) Calcule a média e a variância das 40 primeiras observações.0 ou algum outro valor qualquer poderia ter dado os mesmos resultados? Considere as duas amostras dadas abaixo: Amostra 1: 10. 2.6 14. (d) Se as resistências fossem 450. Há alguma evidência de que houve um aumento ou diminuição no número médio de molas fora de conformidade.9 12. em cada batelada de produção.8 e (b) 2.8 16. 2. 8 e 6. (c) Escreva um curto texto contrastando a amplitude da amos11 19 8 1 2. fabricadas durante os 40 dias? Explique. você poderia usar os resultados dos itens anteriores desse problema.0 de cada observação. Durante 40 dias de produção. a variância e o desvio-padrão da amostra novamente.8 14.8 13. (b) Calcule a amplitude.9 13. 100.4 13. 3. pode resultar em dados que sejam mais fáceis de trabalhar. 2. Essas quantidades indicam que ambos os processos resultam no mesmo nível de média? E a mesma variabilidade? Explique. ou seja. 3. Explique por que os resultados são iguais aos do item (a).2 15.2. 470.8. como medida de variabilidade. 350 e 430 ohms.0.tra com o desvio-padrão da amostra.32. Transformações. Em alguns conjuntos de dados. 10 e 6.1.1 16. (c) Não use a medida da resistência igual a 35 e calcule S2 e s.6. (a) Calcule a amplitude para ambas as amostras.4 13. Construa um diagrama de caixa dos dados transformados e comente o efeito da transformação. 10.7 15. 2. Amostra 2: 10. 4.SUMÁRIO E APRESENTAÇÃO DE DADOS 25 2.3 13. Construa um diagrama de ramo e folhas dos dados. calcule esses valores para as 40 últimas observações. a variância e o desvio-padrão da amostra.3. Compare seus resultados com aqueles obtidos no item (a). enquanto as 40 últimas observações foram geradas a partir de um processo diferente. (b) Encontre a média da amostra e o desvio-padrão. desenhe um baixo diagrama. 4. 3.8.0 14. estatisticamente. 13. 40 bateladas de dados foram coletadas sendo reportadas aqui. 1992.6 Lendo para 14. para encontrar S2 e s? Um artigo no Transactions 01 tlle Institution 01 Cllemical Engineers (Vol. Leia os dados da esquerda para a direita. 1956. usando a definição da Eq. 4. 34.0. 375. 3.8 16.2 16.3. 6. 380. Um artigo em Quality Engineering (VaI. então. uma transformação por alguma função matemática aplicada aos dados originais. Há alguma evidência de que houve um aumento ou diminuição no número médio de erros em um conjunto de caracteres? Explique.2 16. característica dos dadostodos seja dados e comente qualquer de série temporal de que os revelada por esse diagrama 2. 5 12 11 3113 2 9 7144 O 26 99 47 1 13 35 8 15 12 1918 4 12486Um canal de comunicação está sendo monitorado pelo registro O 17 Leia os dados erros em20 desses a direita. Considere a noção de que as 40 primeiras observações foram geradas a partir de um processo específico. Encontre a média da amostra e o desvio-padrão.29. Essas quantidades indicam que ambas as amostras têm a mesma variabilidade? Explique.3.9 14.4 15. 410. em milhares de garrafas.

. Um experimento para investigar o tempo de sobrevivência. quando a nova observação for = 46.677 2.292 4.016 7.591 9. + 1 ser a média e a variância da amostra.520 4.981 1.211 Junho Julho Maio Set.271 2. + 1 = (n -1) s. .048 3.764 5.851 2.047 4. Dez.221 4.031 3.254 4. Jan. uma (n + l)-ésima observação se torna disponíveL Faça xn + 1 e s..38.803 1964 1.753 3. Maio Abril Fev. entre a média da amostra x e a mediana da amostra X. sob condições de temperatura elevada.670 2.937 3. Use os resultados dos itens (a) e (b) para calcular a nova média e o desvio-padrão da amostra para os da- dos do Exercício 2. Dez. (c) Compare os valores calculados nos itens (a) e (b) com a média e a mediana da amostra para os dados do Exercício 2.523 3.6 Vendas de Champanhe na França Ano Jan. usando todas as n + 1 observações.428 6.514 4.776 1. Mar. Agosto Agosto Agosto EXERCÍCIOS PARA EXPANDIR A MENTE 2. (b) (c) Mostre que ns. Fev. Mês Ano 4.934 4. .212 3. Nov.010 4.922 4.740 2. .595 4. Agora.) Oito componentes foram testados com os seguintes tempos resultantes de falha: 75. geralmente.113 3. 51.528 5.4.916 1967 10.965 8.121 4.266 2.541 3. Suponha que o tamanho da amostra n seja tal que a quantidade nTI100 não seja um inteiro.314 5.663 2.986 3.922 9.286 4.851 6. 63.643 10. A Média Podada (Trimmeá).375 7.331 6.759 4.217 6.858 5. Desenvolva um procedimento para obter uma média podada nesse caso. usando x" e xll+1" x7 2.154 4.510 1.899 5.076 1963 12.282 2.573 13. Xz.821 2.614 4.028 3.036 2.755 2.957 9. Abril Junho Dez. (Isso é chamado teste "acelerado" de vida.39.230 3.370 5.659 3.968 3.475 3.)2. + _n_ n+1 (xn+ l-X.. 80 e 90.986 3. consiste em colocar as partes em uma célula de teste e corrê-Ias durante 100 horas.651 1969 11.927 3. respectivamente.006 3.672 2. 45.36.647 4. A observação "100+" indica que a unidade ainda funcionou no tempo de 100 horas.28. (a) Mostre como xn + I pode ser calculado.222 1.874 3.424 3.x" e tenhamos calculado x" e s~ para a amostra. 100+.474 5.301 4.162 1. de um componente eletrônico. Há muita diferença entre essas quantidades? Por quê? A Média Podada (Trímmeá). Mar. Suponha que tenhamos uma amostra x.&73 5. A média podada está. Nov. Suponha que os dados estejam arranjados em ordem crescente. Dez.10. A quantidade resultante é chamada de média podada.10 e compare-a com a quantidade encontrada no item (a).37. Set.276 4.088 3.26 SUMÁRIO E APRESENTAÇÃO DE DADOS Tabela 2. 36.539 3. Julho Out.633 13. Out.718 4. Jan.676 5. Por quê? (a) Calcule a média 10% podada para os dados de rendimento do Exercício 2.738 4.842 3.946 3.739 8. 2. em horas.723 Vendas 1966 3.132 3.639 4. que T% das observações sejam removidas de cada extremidade e que a média da amostra dos números restantes seja calculada.357 6. (b) Calcule a média 20% podada para os dados de rendimento do Exercício 2.260 2.. Há alguma medida significante de localização que possa ser calculada para esses dados? Qual é o seu valor numérico? 2.838 1.633 9.