<T2 conhecida T2 desconhecida H): <T2 H): H( <Po > <TÕ p

<

2

<Xo 2

Estatísticae,fZal2 I.l.o Gráfico dos --Za I.l.o IJ- 2 H):p""po < Zas/"Iht Parâmetroh dCurvaCO <T/"Iht k, Xa/2,n-1 m,n -ta,n-) 2=zo> -ta,n-) Zo Alternativa Apêndice<T/<To Resumo dosHo: <T2 =H):Nula<""c,dddenpo de Hipóteses para Uma Amostra ProcedimentosIZol""<I.l.o I.l.)/<T (I.l.o c, l.l.ol/<T CritériosI= ---- - de Ho:HipóteseddIJ-oIZol II.l.Za/2 1J-01/<T H'o: I.l. H):Po2>= (IJ-oIJ-oI.l.o)/<T Ho: P I.l. H):[tolI.l. (IJ-xVITestes <TÕzo> >-- -Za l)s2 IJ-o<T2 >x(n <TÕ Teste Zo IJ-o i,j to>À g, I.l.o)/<T ou Xo to(I.l. ta/2,n-1 > a,b II.l. H):dH):p>po -ZaI.l.)/<T I.l.Rejeição IJ-< "" para X)-a/2,n-) Ynpo(l - Po) Curva CO

= == = =

Resumo dos Procedimentos

para Intervalo de Confiança para Uma Amostra x s2 x p Estimativa Intervalo Bilateral de Confiança de 100(1 - a)% x - Zaf20"/v/;z :S
JJ.

a 0"2desconhecida ção binomial p 3.

Média JJ., deou Tipodistribuição uma normal Variância 0"2de uma distribuição Média JJ. com parâmetro 0"2conhecida com variância de Pontual normal Proporção uma de Problema

:S x :S x

+ +

Zaf20"/v/;z taf2.n -1 s/v/;z

x - taf2.n _ I s/v/;z :S

JJ.

(112- l)s2 :S 0"2:s ~ - l)s2 Xa/2,n- I X j-af2,n-j

p - Zaf2· Jp(l 11 fi) :S P :S P A

A

+

Zaf2

Jfi(l - p)

Estatística Aplicada e Probabilidade para Engenheiros .

Montgomery Arizona State University George C. Adjunto .Estatística Aplicada e Probabilidade para Engenheiros Segunda Edição Douglas C. Verôniea Calado.Departamento de Engenharia Química Escola de Química/UFR] LTC EDITORA . Runger Arizona State University Tradução: Profa. Se. D. Praf.

inadvertidamente. U Vooo 3&973 LJ Applied Statistics and Probability for Engineers. dispondo-se a possíveis acertos posteriores caso.br www. Authorized translation from the English language edition published by John Wiley & Sons.No interesse de difusão da cultura e do conhecimento. Jnc.Livros Técnicos e Científicos Editora S.A.br . Direitos exclusivos para a língua portuguesa Copyright © 2003 by LTC . a identificação de algum deles tenha sido omitida. Travessa do Ouvidor. All rights reserved.CEP 20040-040 Tel.com.1tceditora. 11 Rio de Janeiro.com. RJ . os autores e os editores envidaram o máximo esforço para localizar os detentores dos direitos au~orais de qualquer material utilizado. Jnc.: 21-3970-9480 Fax: 21-2221-3202 Itc@ltceditora. 2nd edition Copyright © 1999 John Wiley & Sons.

Elisa e Rebecca . Neil. George. Colin e Cheryl Taylor.Para: Meredith.

elegemos focalizar o público voltado para engenharia. Enquanto muitos dos métodos que apresentamos são fundamentais para análise estatística em outras disciplinas. porque. Infelizmente. Este capítulo introduz também os conceitos de amostragem aleatória. muitos engenheiros fazem apenas um curso de estatística. as ciências da vida e as ciências sociais. interações. sendo também aqueles que melhoram os sistemas existentes. Apresenria. Este é um livro introdutório para um primeiro curso em estatística aplicada e probabilidade para estudantes de graduação em engenharia e ciências físicas ou químicas. os histogramas. distribuições amostrais e o teorema central do limite. Discutimos e ilustramos métodos simples para resumir e descrever dados.graduação em engenharia estão expostos à bastante álgebra todologia e como aplicá-la. tais como negócios ou gestão. variáveis aleatórias contínuas e discretas. embora tenhamos fornecido material suficiente para dois cursos. o método da máxima verossimilhança. O Capo 14 fornece uma breve introdução aos métodos e aplicações de estatística não paramétrica. os diagramas de caixa e vários tipos de gráficos de séries temporais. Trabalhamos arduamente de modo a assegurar que todos os nossos exemplos e exercícios estivessem baseados em engenharia e. variâncias e proporções são apresentados. em quase todos os casos. os 'engenheiros usam a metodologia estatística como parte do análise gráfica dos dados e planejamentos fatoriais fracionários. na esperança de que mais estudantes de engenharia vejam as aplicações importantes de estatística em seus trabalhos diários e façam um segundo curso. Demos um tratamento razoavelmente completo desses tópicos. processo de solucionar problemas de engenharia. Este capítulo introduz também o leitor em algumas aplicações de estatística em engenharia. não tações de aritmética escalar para regressão múltipla são. incluindo a reorganização de algum material e Os Caps. na meterão dificuldade em ler quase todo o texto. O material foi extensivamente reescrito e reorganizado.) controle e os fundamentos no controle estatístico de processo.tomados de fonte publicada ou baseados em nossas experiências como consultores. Uma porção significante desse esforço de melhoria da qualidade será comandada por engenheiros e cientistas. 5 e 6 cobrem os conceitos básicos de probabilidade. blocagem. Os Caps. Usamos álgebra matricial em todo o material de regresMantivemos o nível relativamente modesto de matemática. Acreditamos que essa abordagem servirá melhor aos estudantes de engenharia e os permitirá concentrar-se nas muitas aplicações de estatística nessas disciplinas. rias nesta edição. em vez de um desenvolvimento teórico formal. bem francamente. Damos um desenvolvimento lógico e heurístico dos procedimentos. distribuições conjuntas de probabilidade e de independência. porque eles provêem os engenheiros com métodos descritivos e analíticos para lidar com a variabilidade nos dados observados. Fizemos um certo número de melhomatricial para entender a apresentação deste material. usa. usamos exemplos de dados reais . . 10 e 11 apresentam a regressão linear simples e ORGANIZAÇÃO DO LIVRO múltipla. Teste de hipóteses e intervalos de confiança para médias. 4. e com múltiplos fatores respectivamente. Os Caps. Métodos estatísticos são uma importante ferramenta nessas atividades. porém evitamos muitos dos detalhes matemáticos ou mais teóricos. Acreditamos que os engenheiros de todas as áreas deveriam cursar estatística. enfatizando as cartas de *Isto va'le não só para os EUA. algumas das importantes propriedades dos estimadores.são múltipla (Cap. O Capo 15 introduz o leitor no controle estatístico da qualidade. juntamente com informações detalhadas e exemplos de métodos para determinar os tamanhos apropriados das amostras. inconvenientes e notamos que os alunos de ao leitor não a teoria matemática.Prefácio A indústria americana* tem de continuar a melhorar a qualidade de seus produtos e serviços se quiser continuar a competir efetivamente nos mercados interno e externo. 3. Enfatizam-se as noções O Capo 1 é uma introdução ao campo da estatística e como de aleatoriedade. Escrevemos este livro de modo que ele pudesse ser usado para um único curso. mas um entendimento da me. 12 e 13 lidam com experimentos com um único fator reescrevendo grandes porções de vários capítulos. O Capo 7 começa o tratamento da inferência estatística com estimação de parâmetros. 8 e 9 discutem a inferência estatística para uma única amostra e para duas amostras respectivamente. Percebemos que os estudantes de engenhamaneira fácil de entender os conceitos apresentados. . O Capo 2 continua a apresentação da descrição de dados e foca os diagramas de ramo e folhas. porque esses são os indivíduos que projetam e desenvolvem novos produtos e sistemas e processos dé fabricação. E nossa intenção dar lhor das hipóteses. que tenham completado um ou dois seme_stresde cálculo. é a única do na primeira edição. Os Caps. por causa de outras necessidades. o planejamento de experimentos em engenharia e o monitoramento de processos de fabricação. incluindo a construção de modelos empíricos. Queremos que os estudantes se tornem familiarizados com o modo como essas técnicas são usadas para resolver problemas de engenharia do mundo real e conseguir algum entendimento dos conceitos por trás deles. como de resto para todos os países de economia aberta. planejamentos fatoriais. Estes tópicos serão discutidos em mais detalhes nos capítulos subseqüentes. valores esperados. Acreditamos que este livro também sirva como uma referência útil. Introduzimos também o bootstrap como uma técnica para encontrar o erro-padrão de uma estimativa.R. 11). (N.

Somos também gratos ao DI. a baixo custo. à estimação de Bayes e ao princípio da ra:ão de verossimilhança. para quase todas as aulas. Vamos enfatizar que a finalidade deste curso é introduzir os engenheiros no modo como a estatística pode ser usada para resolver problemas de engenharia do mundo real e não para afugentar os estudantes menos agraciados matematicamente. DESIGN-EASE. cobrimos todo o Capo 1 e o 2 (em três ou quatro aulas). incluindo as cartas de controle Shewart do Capo 15 (seis aulas). discutimos a maior parte dos Caps. porque as idéias dos professores variam muito acerca do que deveria estar em um primeiro curso de estatística para engenheiros. Isso nos deixa cerca de três a quatro períodos para exames e revisão. Marcamos esses problemas com um símbolo especial na margem. explicaremos porém como usamos o livro. Conseqüentemente. Smiley Cheng pela permissão para adaptar muitas das tabelas estatísticas de seu excelente livro (com Dr. USANDO O LIVRO Este é um livro-texto muito flexível. o Instirute of Mathematical Statistics e os editores da Biometrics por nos permitirem usar o material com direitos autorais. exercícios suplementares no fim do capítulo. Obviamente. Em nossas próprias aulas. Cada capítulo tem uma coleção extensiva de exercícios. Prentice Hall. há problemas que sentimos que deveriam ser trabalhados usando pacote no computador. usamos não somente esses pacotes como outros. Montgomery George C.nii PREFÁCIO Em adição à coleção usual de tabelas e gráficos estatísticos. levamos um notebook PC e um mostrador de cristal líquido. se apropriado para os estudantes. então é possível cobrir o livro inteiro. Esse material inclui uma introdução a funções geradoras de momentos. Douglas C. ao desenvolvimento das distribuições t e F. James Fu). Somos gratos também a John Wiley and Sons. e mostramos como a técnica é implementada no computador. Esse material pode ser de interesse para alguns professores e estudanres e o temos fornecido como uma referência. Logo. Muitos pacotes estatísticos oferecem. ST ATGRAPHICS. e exercícios para expandir a mente. introduzimos os modelos de regressão do Capo 10 (quatro aulas). Se houver disponibilidade de um segundo semestre. Em nosso curso de um semestre. Para ensinar. Este não é um curso "infantil de matemática-estatística". que freqüentemente requerem que o estudante estenda de algum modo o material texto ou o aplique em uma nova situação. 12 e 13 (seis aulas) e apresentamos os conceitos básicos de controle estatístico de processo. assim como as habilidades de diferentes grupos de estudantes. Através de todo o livro. a permutações e métodos de contagem. que enfatizam o material daquela seção. Seria possível também AGRADECIMENTOS Gostaríamos de expressar nossa gratidão a muitas organizações e indivíduos que contribuíram para este livro. Muitos professores que usaram a primeira edição forneceram excelentes sugestões que incorporamos nesta revisão. 8 e 9 sobre intervalos de confiança e testes (dez aulas). USANDO O COMPUTADOR Na prática. hesitamos em dar um número demasiado de conselhos. Percebemos que isso melhorou grande mente o andamento do curso e o entendimento do material por parte do estudante. revisamos o material de probabilidade. Em alguns capítulos. colocando mais ênfase na distribuição normal (seis a oito aulas). recomendamos fortemente que o computador seja integrado na aula. porque a forma como o professor integra o pacote em sala de aula é muito mais importante do que qual pacote é usado. incluindo algum material dos apêndices. engenheiros usam computadores para aplicar métodos estatísticos com a finalidade de resolver problemas. versões para estudantes. tão logo ela seja discutida em classe. Todos os dados no texto estão disponíveis na forma eletrônica. tais como EXCEL. fornecemos também algum material técnico complementar nos Apêndices. que cobrem o escopo dos tópicos do capírulo. regressão múltipla e mais planejamento de experimentos seriam os tópicos mais importantes em um segundo curso. que podem comprar sua própria cópia ou usar os produtos disponíveis nas redes locais de computadores. designar e trabalhar. incluindo exercícios de final de seção. Runger . que é tão freqüentemente dado a engenheiros. Acreditamos que um primeiro curso de estatística para engenheiros deveria ser principalmente um curso de estatística aplicada e não um curso de probabilidade. JMP e SPSS. apresentamos saídas do Minitab e SAS como exemplos típicos do que pode ser feito com pacotes estatísticos modernos. à mudança de técnicas de variáveis. damos uma introdução ao planejamento de experimentos dos Caps. Não saturamos o livro com exemplos de muitos pacotes diferentes. na aula. Statistical Tables for Classroom and Exam Roam. muitos dos problemas propostos para reforçar o entendimento dos conceitos.

1.5.1 Variáveis Aleatórias Contínuas Probabilidade 27 27 5.2 Distribuições de Probabilidades e Funções Densidade de Probabilidade 73 5.7 5.1.3 Funções de Distribuição Cumulativa 76 5.8 Distribuição Hipergeométrica 65 4.5 Regras da Multiplicação e da Probabilidade Total 42 3.1 Engenharia e Resolução de Problemas 1.1 Distribuição Geométrica 62 4.2 Distribuições de Probabilidades Marginais 99 .5.5 Observando Processos ao Longo do Tempo 10 Exercícios Suplementares 13 Exercícios para Expandir a Mente 13 CAPÍTULO 2 4.1 O Método de Engenharia e o Julgamento Estatístico 1 1.2 Distribuição Binomial Negativa 63 4.6 Distribuição Binomial 58 4.1 Introdução 27 3.9 Distribuição de Poisson 68 Exercícios Suplementares 71 Exercícios para Expandir a Mente 62 n CAPÍTULO 5 Variáveis Aleatórias Contínuas e Distribuições de Probabilidade 73 73 5.2 Distribuições de Probabilidades e Funções de Probabilidade 52 4.9 Distribuição Exponencial 89 5.2 Distribuição Gama 94 5.1 Distribuições de Probabilidades Conjuntas 98 6.2 Coletando Dados de Engenharia 6 1.4 Probabilidade Condicional 39 3.6 Independência 44 3.3 Distribuições de Freqüência e Histogramas 18 2.8 3.5 Distribuição Uniforme Discreta 57 4.2 EspaçosAmostrais 28 3.2 Regra da Probabilidade Total 42 3.1 Introdução 33 3.7 T eorema de Bayes 47 3.7 Distribuições Geométrica e Binomial Negativa 4.1 Distribuição de Erlang 93 5.3 Funções de Distribuição Cumulativa 4.2.2 Julgamento Estatístico 5 1.1.1 Importância do Sumário e Apresentação de Dados 14 2.1 Espaços Amostrais e Eventos 3.3 Regras de Adição 37 3.10 Distribuições de Erlang e Gama 93 5.4 Média e Variância de uma Variável Aleatória Discreta 55 54 Sumário e Apresentação de Dados 14 2.1.2 Interpretações de Probabilidade 33 3.Sumário CAPÍTULO 1 o Papel da Estatística 1 CAPÍTULO 4 na Engenharia Variáveis Aleatórias Discretas e Distribuições de Probabilidades 51 1.2.1.2 Diagramas de Ramo e Folhas 14 2.1.7.11 Distribuição de Weibull 95 Exercícios Suplementares 96 Exercícios para Expandir a Mente 97 CAPÍTULO 6 5.4 Planejando Investigações Experimentais 8 1.7.4 Média e Variância de uma Variável Aleatória Contínua 77 Distribuição Uniforme Contínua 78 Distribuição Normal 79 Gráficos de Probabilidade 85 Aproximações das Distribuições Binomial e de Poisson pela Normal 87 5.1 Duas Variáveis Aleatórias Discretas 98 6.1 Regra da Multiplicação 42 3.3 Eventos 29 3.10.6 5.4 Diagrama de Caixa (Box Plot) 20 2.1 Variáveis Aleatórias Discretas 51 4.8 Variáveis Aleatórias 48 Exercícios Suplementares 49 Exercícios para Expandir a Mente 50 Distribuições de Probabilidades Conjuntas 98 6.10.5 Gráficos Seqüenciais de Tempo 22 Exercícios Suplementares 24 Exercícios para Expandir a Mente 26 CAPÍTULO 3 4.3 Modelos Mecanísticos e Empíricos 7 1.5 5.2 Axiomas de Probabilidade 35 3.1.

3.2 Testes de Hipóteses Estatísticas 143 8.3 Intervalo de Confiança para a Razão de Duas Variâncias 197 9.4 Múltiplas Variáveis Aleatórias Contínuas 113 6.2.1.3 O Erro Tipo II e a Escolha do Tamanho da Amostra 150 8.2.4 Inferência Estatística para uma Única Amostra 142 8.3 Inferência sobre a Média de uma População com Variância Desconhecida 157 8.3 .4 Independência 111 6.2.1 Distribuições de Probabilidades Conjuntas 107 6.4.5 Intervalo de Confiança na Média 161 8.1 Testes de Hipóteses para uma Proporção Binomial 166 8.4.5. com Variâncias Desconhecidas 185 9.3.5.4 Método da Máxima Verossimilhança 132 7.2 Distribuições de Probabilidades Marginais 108 6.3.2.1 Testes de Hipóteses para uma Diferença nas Médias com Variâncias Conhecidas 180 9.3 Propriedades de Estimadores 128 7.2 Erro ~ e Escolha do Tamanho da Amostra 197 9.6 Tabela com Resumo dos Procedimentos de Inferência sobre uma Única Amostra 169 8.3.2.3 Solução Computacional 159 8.2.2 Distribuição Multinomial de Probabilidades 105 6.3.7 Testando a Adequação do Ajuste 8.2.1 EstimadoresNão Tendenciosos 128 7.1 Distribuições de Probabilidades Conjumas 104 6.1.1 Inferência Estatística 126 7.3.X SUMÁRIO Distribuições de Probabilidades Condicionais 100 Independência 101 6.5 Inferência sobre a Proporção de uma População 166 8.4 CAPíTULO 7 Estimação de Parâmetros 126 7.8 Desigualdade de Chebyshev 122 Exercícios Suplementares 123 Exercícios para Expandir a Mente 124 6.3 Intervalo de Confiança para a Variância de uma População Normal 164 8.2.4 Teste para Amostras Grandes 152 8.7 Introdução a Intervalos de Confiança 139 Exercícios Suplementares 140 Exercícios para Expandir a Mente 140 CAPíTULO 8 Inferência Estatística para Duas Amostras 179 9.2 Erro [3 e Escolha do Tamanho da Amostra 164 8.7 Método Geral para Deduzir um Intervalo de Confiança 155 8.4 Escolha do Tamanho da Amostra 160 8.3.2 Escolha do Tamanho da Amostra 187 Intervalo de Confiança para a Diferença nas Médias 187 9.3 6.4 Procedimento Geral para Testes de Hipóteses 148 8.2 Múltiplas Variáveis Aleatórias Discretas 104 6.8 Testes da Tabela de Contingência Exercícios Suplementares 174 Exercícios para Expandir a Mente 177 CAPíTULO 9 169 172 Erro·Padrão: Reportando uma Estimativa 130 7.6 Distribuições Amostrais das Médias 136 7.3 Identificando Causa e Efeito 182 9.3.3 Intervalo de Confiança para uma Proporção Binomial 167 8.5.2.3 Distribuições de Probabilidades Condicionais 109 6.2.3.1.4 Solução Computacional 189 9 .4.1.2.3.2 Erro Tipo II e Escolha do Tamanho da Amostra 166 8.5 Inferências sobre as Variâncias de Duas Populações Normais 195 9.3.3.7 Combinações Lineares de Variáveis Aleatórias 120 6.1 Hipóteses Estatísticas 142 8.1 Introdução 179 9.1 Testes de Hipóteses para a Variância de uma População Normal 163 8.5 Distribuições Amostrais 136 7.3.2 Inferência sobre uma Diferença nas Médias com Variâncias Conhecidas 179 9.1.3 Hipóteses Unilaterais e Bilaterais 147 8.4 Estimativa Bootstrap do Erro·Padrão 130 7.3.3.1.4 Teste t Emparelhado 191 9.3 Inferência sobre a Diferença nas Médias de Duas Distribuições Normais com Variações Desconhecidas 185 9.3 Duas Variáveis Aleatórias Contínuas 107 6.3.2 Valores p nos Testes de Hipóteses 150 8.5 Alguns Comemários Práticos sobre Testes de Hipóteses 152 8.5 Erro Médio Quadrático de um Estimador 131 7.1 Testes de Hipóteses para a Média 149 8.5.5.3.5 Covariância e Correlação 115 6.2 Variância de um Estimador 129 7.3.6 Distribuição Normal Bidimensional 118 6.5.1 Testes de Hipóteses para a Média 157 8.4 Inferência sobre a Variância de uma População Normal 163 8.2.6 Inferência sobre Proporções de Duas Populações 198 9.2 Escolha do Tamanho da Amostra 181 9.2 Valor p para um Teste t 159 8.1 Teste de Hipóteses 142 8.2 Amostragem Aleatória 127 7.3 8.6 Intervalo de Confiança para a Média 153 8.1 Testes de Hipótesespara a Razãode DuasVariâncias 195 9.2 Inferência sobre a Média de uma População com Variância Conhecida 149 8.1 Testes de Hipóteses para a Diferença nas Médias.2.8 Intervalos de Confiança Bootstrap 155 Intervalo de Confiança para uma Diferença nas Médias com Variâncias Conhecid~s 182 9.2.

1 Modelos Empíricos 205 10.4 Planejamento Aleatorizado com Blocos Completos e com Fatores Aleatórios 288 12. Considerando Ho: Pl = P2 198 9.2.5 Planejamento Aleatorizado com Blocos Completos 284 12.11.2 Estimação de Parâmetros pelo Método dos Mínimos Quadrados 232 11.2 Algumas Aplicações das Técnicas de Planejamento de Experimentos 295 13.3 Experimentos Fatoriais 297 13.8.3.9 Modelos de Regressão Polinomial 251 11.4.1 Um Exemplo 269 12.5.3 Intervalo de Confiança para Pl .8.2 Análise de Variância: Uma Abordagem para Testar a Significância da Regressã~ 214 10.4 12.3 Saída Computacional para a Regressão em Etapas 260 11.4 Experimentos Fatoriais com Dois Fatores 299 13.2 Intervalo de Confiança para a Resposta Média 217 10.11 Seleção de Variáveis na Regressão Múltipla 11.7 Previsão de Novas Observações 218 10.5.2 A Análise de Variância 12.1 Intervalos de Confiança para a Inclinação e a Interseção 216 10.1 Análise Estatística do Modelo de Efeitos Fixos 300 .6.6.lOCorrelação 224 Exercícios Suplementares 22 7 Exercícios para Expandir a Mente 229 CAPíTULO 11 221 224 Planej amento e Análise de Experimentos com um Único Fator: A Análise de Variância 268 12.5.2 Teste para os Coeficientes Individuais de Regressãoe Subconjuntos de Coeficientes 242 11.2.1 Problema de Construir o Modelo 255 11.1 O Caso dos Efeitos Fixos 290 12.8.6.11.6.1 Coeficiente de Determinação Múltipla 11.9 Transformações para uma Linha Reta 10.1 A Estratégia de Experimentação 268 12.1 Introdução 295 13.6.3.1 Intervalos de Confiança para os Coeficientes Individuais de Regressão 245 11.5.1 Planejamento e Análise Estatística 284 12.8 Medidas da Adequação do Modelo 247 Planejamento de Experimentos com Vários Fatores 295 13.12 Multicolinearidade 263 Exercícios Suplementares 264 Exercícios para Expandir a Mente CAPíTULO 12 266 (R2) 255 Regressão Linear Simples e Correlação 205 10.2 Coeficiente de Determinação (R2) 10.5.5.10 Variáveis Indicativas 252 11.2 Regressão Linear Simples 207 10.3 Observações Influentes 249 11.1 Análise Residual 219 10.3.1 Uso de Testes t 213 10.4 Abusos Comuns na Regressão 212 10.2 Intervalo de Confiança para a Resposta Média 245 11.1 Teste para Significância da Regressão 241 11.8.7 Predição de Novas Observações 246 11.6.11.5.SUMÁRIO xi 247 9.8 Cálculo da Adequação do Modelo de Regressão 219 10.7 Tabela com o Resumo dos Procedimentos de Inferência sobre Duas Amostras 201 Exercícios Suplementares 201 Exercícios para Expandir a Mente 204 CAPíTULO 10 11.5 Testes de Hipóteses para a Regressão Linear Múltipla 241 11.1 12.6 Intervalos de Confiança 216 10.8.5.3 Falta de Ajuste 221 10.2.3 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 211 10.2 Erro 13 e Escolha do Tamanho da Amostra 199 9.2 O Caso dos Efeitos Aleatórios 291 Exercícios Suplementares 292 Exercícios para Expandir a Mente CAPíTULO 13 293 11.3 12.1 Modelo da Regressão Linear Múltipla 230 11.4 Propriedades dos Estimadores de Mínimos Quadrados e Estimação de cr 240 11.6.5 Testes de Hipóteses na Regressão Linear Simples 213 10.2 12.6.2 Experimento Completamente Aleatorizado com um Único Fator 269 12.3 Análise Residual e Verificação do Modelo 288 12.2 Testes para as Médias Individuais dos Tratamentos 287 12.2 Análise Residual 248 11.2 Procedimentos Computacionais para a Seleção de Variáveis 255 11.6 Determinação do Tamanho da Amostra em Experimentos com um Único Fator 290 12.3 Testes 12.6.6 Intervalos de Confiança para a Regressão Linear Múltipla 245 11.3 270 Regressão Linear Múltipla 230 Saída Computacional 273 Análise Residual e Verificação do Modelo 275 para Médias Individuais de Tratamento 278 Comparação Gráfica das Médias 278 Contrastes Ortogonais 278 Método de Fisher da Mínima Diferença Significativa 279 12.2.3 Abordagem Matricial para a Regressão Linear Múltipla 233 11.P2 200 9.4 Modelo com Efeitos Aleatórios 281 12.1 Teste para Amostras Grandes.8.

4.8.9 Desempenho do Gráfico de Controle 380 15.4 Teste de Wilcoxon da Soma :1osPostos 355 14.6.4 Adição de Pontos Centrais a um Planejamento 2k 320 13.3 Réplica Única do Planejamento 2k 318 13.2 Teste dos Sinais para Amostras Emparelhadas 350 14.12 Implementando o CEP 388 Exercícios Suplementares 389 Exercícios para Expandir a Mente 391 Estatística Não Paramétrica 347 14.4 Comparação com o Teste t 351 14.5 Gráficos de Controle X e R 367 15.1 Descrição do Teste 348 14.1 Gráfico P (Gráfico de Controle para Proporções 377 15.1 15.3.6.4.xii SUMÁRIO 13.5 Fatores Aleatórios 304 13.1 Uma Meia Fração do Planejamento 2k 327 13.4.5.4 Uma Observação por Célula 303 13.8.2 Teste dos Sinais 348 14.9.5 Experimentos Fatoriais Gerais 306 13.2 Aproximação para Amostras Grandes 356 14.1 Método da Ascendente de Maior Inclinação (Steepest Ascent) 337 13.2 Análise de uma Superfície de Resposta de Segunda Ordem 339 Exercícios Suplementares 343 Exercícios para Expandir a Mente 346 CAPíTULO 14 CAPíTULO 15 Qualidade 15.3.3 Observações Emparelhadas 353 14.2 15.4.1 Descrição do Teste 353 14.2.1 Introdução 347 14.4 Comparações com o Teste t 354 14.2.3.3 Erro Tipo II para o Teste dos Sinais 350 14.2 Planejamento 2k para k ~ 3 Fatores 313 13.4 Análise de Padrões de Comportamento para Gráficos de Controle 365 15.3.4.4 Controle Estatístico da 360 Melhoria e Estatística da Qualidade 360 Controle Estatístico da Qualidade 361 Controle Estatístico de Processo 361 Introdução aos Gráficos de Controle 361 15.2 Aproximação para Amostras Grandes 353 14.10 Gráfico de Controle da Soma Cumulativa 382 15.4.4.6 Planejamento Fatorial 2k 309 13.2 Frações Menores: O Fatorial Fracionário 2k-p 331 13.2 Transformação de Posto 358 Exercícios Suplementares 358 Exercícios para Expandir a Mente 359 AP~NDICES 393 395 A Tabelas e Gráficos Estatísticos B Material Técnico Suplementar 426 I Técnicas de Contagem 426 II Função Geradora de Momento 429 III Funções de Variáveis Aleatórias 432 IV Desenvolvimento das Distribuições te F 436 V Abordagem Bayesiana para Estimação 437 VI Testes da Razão da Verossimilhança 439 VII Fatores Aleatórios em Experimentos Fatoriais 440 C Bibliografia 445 D Respostas dos Exercícios Selecionados 447 íNDICE 460 .6.3 SubgruposRacionais 364 15.5 Métodos Não Paramétricos na Análise de Variância 357 14.1 Descrição do Teste 355 14.8.3 15.2.8 Gráficos de Controle para Atributos 377 15.4.1 Teste de Kruskal-Wallis 357 14.4.5.3 Saída Computacional 303 13.11 Outras Ferramentas para Resolver Problemas de CEP 386 15.2 Verificação da Adequação do Modelo 303 13.7 Capacidade de Processo 374 15.1 Planejamento 22 310 13.2.2 Gráfico U (Gráfico de Controle para Defeitos por Unidade) 378 15.3 Teste de Wilcoxon do Posto com Sinais 352 14.2 Projeto de um Gráfico de Controle 364 15.9.4.6 Gráficos de Controle para Medidas Individuais 371 15.8.9 Métodos e Planejamentos de Superfície de Resposta 336 13.6.7 Blocagem e Superposição no Planejamento 2k 323 13.4.8 Replicação Fracionária do Planejamento 2k 327 13.3 Comparação com o Teste t 356 14.1 Princípios Básicos 361 15.

são colocadas em um retângulo.3 MODELOS MECANICISTAS E EMPÍRICOS 1. engenheiros têm de saber como planejar. 1. analisar e interpretar os dados e entender como os dados observados estão relacionados ao modelo que eles propuseram para o problema sob estudo. usando conhecimento científico ou de engenharia do fenômeno estudado. 5. resolver problemas e planejar produtos e processos. Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema. Conduzir experimentos apropriados e coletar dados para testar ou validar o modelo-tentativa ou conclusões feitas nas etapas 2 e 3.1 O MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1. obviamente algum conhecimento de estatística é importante para qualquer engenheiro.1. Devido a muitos aspectos da prática de engenharia envolverem o trabalho com dados.1. As etapas no método de engenharia são dadas a seguir: 1. a apresentação.1.1 Engenharia e Resolução de Problemas Um engenheiro é alguém que resolve problemas de interesse da sociedade. na Fig. com base nos dados observados. Os engenheiros executam isso através do refmamento do produto ou processos existentes. 3. O campo da estatística lida com a coleta. coletar dados. indicando que vários ciclos ou iterações dessas etapas podem ser requeridos para obter a solução final. Estabelecer limitações ou suposições do modelo. os experimentos. 7.1. As etapas no método de engenharia são mostradas na Fig. Conseqüentemente. Identificar. Especificamente. Tirar conclusões ou fazer recomendações baseadas na solução do problema. um modelo do fenômeno e a experiência para verificar a adequação do modelo e da solução proposta para o problema. 4. As etapas 2-4. os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua solução. Refinar o modelo. a análise e o uso dos dados para tomar decisões. 1. O método de engenharia ou científico é a abordagem para formular e resolver esses problemas. pela aplicação eficiente de princípios científicos. ou pelo projeto de um novo produto. Desenvolver uma descrição clara e concisa do problema. Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente.1 o MÉTODO DE ENGENHARIA E O JULGAMENTO ESTATÍSTICO 1. 8. Propor um modelo para o problema. ou processo que encontre as necessidades dos consumidores. Note que o método de engenharia caracteriza uma forte relação recíproca entre o problema. técnicas estatísticas podem ser uma ajuda poderosa no planejamento de novos produ- .o Papel da Estatística na Engenharia ESQUEMA DO CAPÍTULO 1.1 Engenharia e Resolução de Problemas 1.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS 1.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO 1. 2. 6.1.2 COLETANDO DADOS EM ENGENHARIA 1. os fatores que podem influenciar sua solução. no mínimo tentar.2 Julgamento Estatístico 1. eficientemente.

queremos dizer que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado. + Xn n . . X. podemos caracterizar a localização ou tendência central nos dados através da média aritmética comum. cerca de 20 observações.9.. referir-nos-emos à média arítmética como a média da amostra. Quando o número de observações é pequeno. a marca e/ou número de octanagem da gasolina usada. A Estatística nos fornece uma estrutura para descrever essa variabilidade e para aprender sobre quais fontes potenciais de variabilidade são mais importantes ou quais têm o maior impacto no desempenho de consumo de gasolina. resultando nos seguintes dados (em libras-pé): 12. desenvolvendo e melhorando os processos de produção. a população deve consis- • 12 • • • 13 • • •• 14 I 15 Força de remoção Fig. 12. geralmente é dificil identificar qualquer padrão específico na variabilidade..1 O método de solução de um problema.1 A média da amostra da força de remoção para as oito observações coletadas nos protótipos dos conectores é 8 X = Xl + Xl + . O diagrama de pontos é um gráfico muito útil para exibir um pequeno conjunto de dados. as condições climáticas.. <- A média da amostra é o valor médio de todas as observações do conjunto de dados. de algum modo. considere o desempenho de consumo de gasolina de seu carro. Por exemplo. 1. Esses fatores representam fontes potenciais de variabilidade no sistema. A Fig. quando a espessura da parede for 3/32 polegada. 1. ou mesmo.= I 8 13.2 Diagrama de pontos dos dados da força de remoção. 13. a localização ou o meio. então o fulcro localizado em x equilibraria exatamente esse sistema de pesos. esses dados são uma amostra de observações que foi selecionada a partir de alguma população grande de observações. + 8 104 8 13. Porque quase sempre pensamos em nossos dados como sendo uma amostra. Encontramos também variabilidade em problemas de engenharia. isto é. Essa variabilidade observada no consumo de gasolina depende de muitos fatores.6. e o espalhamento ou a variabilidade. mas está. x = XI + Xl + . Se a força de remoção for muito baixa. Definição Se as n observações em uma amostra forem denotadas por então. inseguro acerca do efeito dessa decisão na força de remoção do conector.2 O PAPEL DA ESTATÍSTICA NA ENGENHARIA tos e sistemas. o conector pode falhar quando ele for instalado no motor..6 + 12.=1 2: Xi n (1. Podemos também descrever numericamente as características dos dados.0 Uma interpretação fisica da média da amostra como uma medida da localização é mostrada na Fig.1 12. Por exemplo. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas. Como antecipamos. n Xn 2: Xi = .. nem todos os protótipos têm a mesma força de remoção.9 + . Esse gráfico nos permitirá ver facilmente duas características dos dados.1. 1. Todos nós encontramos variabilidade em nosso dia-a-dia e o julgamento estatístico pode nos dar uma maneira útil para incorporar essa variabilidade em nossos processos de tomada de decisão.3. algumas vezes o desempenho varia consideravelmente.. . que é um diagrama de pontos dos dados da força de remoção. Por variabilidade. não -na verdade. suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva. Aqui.4. 1.3.. Fig.. Note que a média da amostra x = 13. a média da amostra será n XI' X2. Métodos estatísticos são usados para nos ajudar a entender a variabilidade. se cada observação representar 1 libra de massa colocada no ponto no eixo X. . 12. 13.. Geralmente. embora o diagrama de pontos seja uma maneira conveniente de ver quaisquer características incomuns nos dados.2 apresenta um diagrama de pontos desses dados.0 pode ser pensada como um "ponto de balanço". Ou seja. possivelmente. 12.6. O engenheiro está considerando estabelecer como especificação do projeto uma espessura de parede de 3/32 polegada. tais como o tipo de estrada mais usada recentemente (cidade ou estrada).5. as mudanças na condição do veÍCulo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou compressão do motor ou desgaste da válvula).1) EXEMPLO 1. 13. Você sempre consegue o mesmo desempenho de consumo em cada tanque de combustível? Naturalmente.6. 13.. melhorando os projetos existentes e planejando. Por exemplo.

3 -0. variância . 1. Nos capítulos seguintes. 1513 • 1 À4 I • Fig. que uma estimativa da força de remoção média seria 13. Embora a média da amostra --1"04.5 0.250.X somarão zero.48 libras-pé Tabela 1. as unidades para a variância da amostra serão (libras-pé)2. veja a Fig. O desvio-padrão tem uma propriedade desejável de variabilidade de medida nas unidades originais da variável de interesse.16 12.3) n . Esses dados são graficados na Fig.4 0.1 Cálculo dos Termos para a Variância e Desvio-Padrão Amostra -0. Podemos pensar também em calcular o valor médio de todas as observações em uma população.0 libras-pé. 1.6 0.4.o PAPEL DA EsTA TfsTICA I NA ENGENHARIA 3 emoção • • L •• i. então a da amostra será S2 = L _i=_I n (Xi - X)2 _ (1. fL.2) assim.1 o desvio-padrão da amostra.pe.60 = 81.01 0. s. haverá. X2.01 13.)2 _ I e o desvio-padrão da amostra é s = v'0.60 (1.X para os Fig.6 0.49 0.1 (Xi0.0X)2 13.9 -0.1 12. relativamente. Elevar ao quadrado os desvios é uma abordagem usada na variância da amostra. O numerador de S2é f. Xn for uma amostra de n observações.4 que mostra os desvios Xi . é a raiz quadrada positiva da variânci<.5 Xi da --- Definição Se XI. N) na população. discutiremos modelos para populações infinitas e isso nos levará a urna defmição mais geral de média populacional. tir em todos os conectores que serão vendidos aos consumidores. se S2 for grande.. Conseqüentemente.1 12. a variância da amostra é 2 A média da amostra. X. x. 1.X.2286 = 0. Algumas vezes.L=-N i=1 L N i=1 Xi L 8 (Xi - x)2 = 1.60 1 = -7.4 1. Assim. Quando houver um número finito de observações (isto é. dados da força de remoção do conector.6 Xi0.60 12. fL. pouca variabilidade nos dados. então a média populacional será EXEMPLO 1. maior será o valor absoluto de alguns dos desvios Xi . Muitos problemas importantes de engenharia envolvem fazer referências ou tomar decisões sobre uma média populacional. da amostra mede a variabilidade através dos .• . a variabilidade será relativamente grande. porém. se x for medido em libras-pé. Como a Variância da Amostra Mede a Variabilidade? Para ver como a variância da amostra mede a dispersão ou a variabilidade. Uma vez que os desvios Xi . se S2for pequeno. 1. Logo. existe uma população física real.7 13.36-X 13. s 1. 4 5 3 2 8 7 6 a informação acerca de uma amostra de dados. o engenheiro durante o projeto do conector usando uma espessura de parede de 3/32 polegada concluiria.lda amostra.1 apresenta as quantidades necessárias para calcular a variância e o desvio-padrão da amostra para os dados da força de remoção. Quanto maior a variabilidade nos dados da força de remoção. com base nos dados.4 -0. 12 o o o o X o o o o 13 14 15 As unidades de medidas para a variância da amostra são o quadrado das unidades originais da variável.0 ela não transmite toda seja útil.16 0.2 A Tabela 1.=. temos de usar uma medida de variabilidade que transforme os desvios negativos em quantidades não negativas. sendo denotada pela letra gregafL(mi).3 A média da amostra como um ponto de equilibrio para um sistema de pesos.x. Essa média é chamada de média populacional.6 0. é uma estimativa razoável da média populacional. A variabilidade ou dispersão nos dados 1 pode ser descrita pela variância ou o desvio-padrão da amostra..02286 (l'b ras.4 Como a variância desvios Xi . tal como uma porção de pastilhas de silício produzidas em uma fábrica de semicondutores.

a variância da amostra é uma estimativa da variância da população. como estando baseada em n .2286 (libras-pé)2 e s = VO.8 e 9 e 1.5. Definição n S 2 i= =-------. somente n . . Uma outra maneira de pensar acerca disso é considerar a variância S2 da amostra.x. IA requer que se calcule o quadrado de cada Xi' levando-se. A amplitude da amostra é fácil de calcular. Se soubéssemos o valor verdadeiro da média populacional ]L. Entretanto. então. obteríamos uma medida de variabilidade que seria. estão livremente determinados. ou a diferença entre a maior e a menor observação.1 n n I 2:x?- ( 2: n i=1 Xi )2 13536 _ (104f . Por exemplo. A média. ou CJ'. Quando a população for finita e consistir em N valores.4 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Cômputo de 52 O cômputo de S2 requer o cálculo de x. mas ignora toda a informação contida nos dados entre os valores maior e menor..xY/n de x.x não forem inteiros. a amplitude da amostra..2286 = 0.L)2 (1. . X2 . A amplitude da amostra é definida como segue. Por exemplo. ]L. A raiz quadrada positiva de cr.1. o valor de ]L quase nunca é conhecido e. usamos n .I dessas quantidades determina automaticamente aquele restante.5) = _i=_1 N _ Para os dados da força de remoção.1 e.I n n 2: -:xi i=1 2: (X? + :x2 n- - 2ix. é uma medida útil de variabilidade. para compensar isso.)2 I n (104) Note que a Eq. Geralmente. especificar os valores de quaisquer n . Se as observações originais ou os desvios Xi . usando o método do atalho. à medida que a variabilidade nos dados da amostra aumenta. então poderíamos encontrar a variância da amostra como a média dos quadrados dos desvios das observações da amostra em tomo de ]L.3.X e vários decimais podem ter de ser carregados para assegurar a exatidão numérica. quando o tamanho da amostra for pequeno. A variabilidade é realmente menor na segunda amostra. Xn . 8 7 XI' Se as n observações em uma amostra forem denotadas por X2.6) = 1. Discutiremos algumas dessas aplicações no Capo 15. x. a perda de informação associada com a amplitude não é muito séria. Análoga à variância da amostra S2.I dos n desvios. existe uma medida de variabilidade na população chamada de variância da população.83. Observamos. isto é. Eq." então a amplitude da amostra será r = máx(xi) - mín(xi) (1. Isso foi ilustrado na Tabela 1. isso é chamado de método abreviado para cálculo de S2 (ou s).I). Por conseguinte..já que x = (l/n) i = 1 Xi' essa última equação se reduz a I.I.6 . Algumas vezes. a amplitude é largamente utilizada em controle estatístico da qualidade. o divisor é o tamanho N da população. que a média da amostra poderia ser usada como uma estimativa da média populacional.. podemos definir a variância da população como N 2: 0'2 (xi - f.3 Calcularemos a variância e o desvio-padrão da amostra. e finalmente dividindo por n . Na prática.48 libras-pé Esses resultados concordam exatamente com aqueles obtidos previamente.3 = 1. assim. onde tamanhos de amostra de 4 ou 5 são razoavelmente comuns. Dessa forma. a varíância e o desvio-padrão da amostra e o diagrama de pontos são simples. Usaremos a letra grega cr (sigma ao quadrado) para denotar a variância da população. O termo graus de liberdade resulta do fato de que n desvios Xl . I EXEMPLOl. o desvio-padrão da primeira amostra é SI = 3.3. x. n < 8 ou 10. Uma fórmula computacional mais eficiente para a variância da amostra é obtida como segue: n Il (xi S 2 i=1 =----. Além da variância e do desvio-padrão da amostra. dessa forma. a soma dos quadrados dos desvios em tomo da média x da amostra tem de ser usada.5..) Il X? i=1 2: + n:x2 - 2:X i=1 2: Xi n . A fórmula fornece Uma definição mais geral da variância cr será dada adiante.x. ainda que efetivas maneiras de resu- ..1 como o divisor em vez de n. No entanto.5. pode ser tedioso trabalhar com os desvios Xi . .35. denotará o desvio-padrão da população. Algumas vezes.12.I graus de liberdade. a amplitude da amostra é r = 13. previamente. Se usássemos n como o divisor na variância da amostra. Xi .x sempre somam zero e. enquanto o desvio-padrão da segunda amostra é S2 = 2. n s2 i=1 =--------n ±X?- (± i=1 1 X. IA. em média.. Note que o divisor da variância da amostra é o tamanho da amostra menos um (n . n subtrações e n operações de elevar ao quadrado e somar.0 = 0. as observações Xi tendem a ser mais próximas de seu valor médio. ao quadrado a soma de Xi' subtraindo ('i.5. enquanto para a variância da população. do que a média populacional. a amplitude da amostra aumenta. as duas amostras 1.9 têm a mesma amplitude (r = 8).x. Similarmente. consistentemente menor que a variância verdadeira cr da população.

Por exemplo.2. 1. Para responder às questões prévias.6.. Entretanto. Baseado nos dados da amostra. Esses modelos envolvem conceitos de probabilidade que serão introduzidos no Capo 3. A amostra é um subconjunto da população. Claramente.o PAPEL DA EsTATÍSTICA mir os dados. População ? População futura ? • 12 • = • • 00 •• 00 I o • •• o o o I 13 f2 polegada 14 15 (:::) !_-~---j : I . também é importante raciocinar a partir de uma série específica de medidas para casos mais gerais para responder às questões prévias. há algumas questões óbvias a perguntar. Entretanto.L). No entanto. Esse argumento é a partir de uma amostra (tal como os oito conectores) para uma população (tal como os conectores que serão vendidos aos consumidores). Porém. Ver Fig.1. será possível que o aumento aparente na força de remoção observada nos protótipos mais espessos seja apenas devido à variabilidade aparente no sistema e que o aumento da espessura da parte (e seu custo) realmente não afete a força de remoção? Freqüentemente. 1. Os engenheiros estão freqüentemente interessados em desenvolver um modelo do sistema ou processo que gerou os dados.- . Historicamente. Claramente. Uma amostra é usada para fazer uma inferência à população da qual a amostra é selecionada. os oito conectores são vistos como uma amostra da população de conectores que serão vendidos aos consumidores. claramente. mas deve ser pensada como futuras réplicas dos objetos na amostra. de certo modo. medidas foram obtidas de uma amostra de pessoas e generalizadas para uma população.0 lb-ft.2. Estamos familiarizados com esse raciocínio a partir de leis gerais para casos especiais.4 e 0. 13..6 Inferência estatistica é um tipo de raciocínio. Em outros casos. A média e o desvio-padrão da amostra são 13. Por exemplo.7. ele sabe que uma estimativa razoável da força média de remoção seria 13.7 Estudo enumerativo versus estudo analítico. Geralmente.os resultados obtidos dos testes até agora para concluir que aumentando a espessura da parede aumenta a resistência. O exemplo do conector é chamado de estudo analítico. 1. uma suposição de estabilidade. Ver Fig. Outros métodos para descrever os dados serão apresentados no Capo 2. devemos estar preocupados com que f. 1. como um modelo que descreve a variabilidade em um sistema ou processo. é muito importante no ambiente de engenharia.1. Fig. Considere o engenheiro projetando o conector. 4-6 explorarão esses conceitos em detalhes.. Esse gráfico e os cálculos precedentes dão a impressão de que o aumento da espessura da parede levou a um aumento na força de remoção. Por exemplo. o raciocínio baseado nas medidas de alguns objetos para medidas em todos os objetos pode resultar em erros (chamados de erros de amostragem). daqueles que serão vendidos aos consumidores. 13. Oito protótipos desse projeto são construídos e as medidas observadas da força de remoção são: 12.. mantendo-se a terminologia. 14..5 Diagrama de pontos da força de remoção para duas espessuras de parede. I J : Força de remoção xl' X2"'" xn. Estudo enumerativo Estudo analítico o = ~ polegada Fig.1. esses riscos poderão ser quantificados e um tamanho apropriado de amostra pode ser determinado. Fig. como sabemos que uma outra amostra de protótipos não dará resultados diferentes? A amostra de oito protótipos é adequada para fornecer resultados confiáveis? Se usarmos . Por exemplo. ele pensa que esse valor pode ser muito baixo para a aplícação pretendida.. a população não existe ainda. 1/8 polegada. 1.. os oito protótipos dos conectores têm de ser representantivos. ele decide considerar um projeto alternativo com uma espessura maior de parede. Tempo.5.2 Julgamento Estatístico A necessidade de um julgamento estatístico aparece freqüentemente na solução de problemas de engenharia.8.7. porém um estudo analítico requer. 12. 13. quais os riscos que estão associados com essa decisão? Por exemplo. 13. No entanto. . Os Caps...9. As análises estatísticas são geralmente as mesmas em ambos os casos.- I I I I I I I I I I I . as leis fisicas (tais como a lei de Ohm e a lei de gás ideal) são aplicadas para ajudar no projeto de produtos e processos. a amostra é realmente selecionada a partir da população. Em alguns casos.5 e 13. A partir de testes em protótipo. se :x for alta.. 1. O raciocínio é referido como inferência estatística. queremos concluir alguma coisa a respeito do lote. A inferência estatística é a partir de :x para f. Veremos que a noção de uma distribuição de probabilidade. NA ENGENHARIA 5 1. 1..L seja muito alta. respectivamente. deve ser considerado que as fontes de variabilidade na fabricação de protótipos (tais como temperatura. uma amostra de três pastilhas pode ser selecionada de um lote de produção de pastilhas na fabricação de semicondutores. Resultados para ambas as amostras são graficados como diagrama de pontos na Fig. assim..- .9. Uma amostra é usada para fazer uma inferência a uma população futura. a média das medidas de resistividade na amostra (:X) não é esperada para igualar exatamente à média das medidas de resistividade no lote (f. pressão e tempo de cura) são as mesmas que aquelas para os conectores que serão vendidos aos consumidores.50. se a amostra for selecionada adequadamente. essa análise requer alguma noção de estabilidade como uma suposição adicional.L. O exemplo de pastilhas a partir de lotes é chamado de estudo enumerador.

usando a técnica de teste estatístico de hipóteses. Os dados (em mm) são: 74. o conteúdo de umidade da matéria-prima e o tempo do ciclo. selecionar componentes à medida que são fabricados e medir importantes características de interesse. ou seja.15.1. O engenheiro pode medir também e registrar as variáveis de processo potencialmente importantes. Esses registros incluiriam dados de teste de características fisicas e elétricas das pastilhas. 42. Freqüentemente. 108. 102. 140. J.005. 104. Os tempos. 128. o engenheiro faz varíações propositais nas variáveis controláveis de alguns sistemas ou processos. 160. estaríamos interessados em testar o teste de hipóteses em que a resistência média J. Por exemplo. JkJI32. 0. faz uma inferência ou decisão sobre as variáveis que são responsáveis pelas mudan- ças observadas no desempenho de saída. os dados amostrais nos capacitará a responder questões sobre o sistema ou o processo em estudo. A edição de janeiro de 1990 de Arizona Trend contém um suplemento descrevendo os 12 "melhores" campos de golfe do estado. 7518. Por exemplo.2--------- 1. 102. isto é. 104. 7041 e 6890. construa um diagrama de pontos e comente os dados. 126. Em geral. Claramente.5. 12. Na Seção 1. Calcule a média e o desvio-padrão da amostra. 128. Pode-se observar o processo. 115.002. esses dados são coletados em uma das duas maneiras a seguir. Uma outra maneira é que os dados observados são obtidos através da análise de dados históricos do sistema ou processo.06. 74. 1.6 O PAPEL DA ESTATÍSTICA NA ENGENHARIA 1. e para 1/8 polegada. introduzimos os conceitos de estudos enumeradores e analíticos. 6930. sendo introduzidos e ilustrados em maiores detalhes na próxima seção. Geralmente. observa os dados de saída do sistema resultante e.96. Os dados são: 36. Calcule a média e o desvio-padrão da amostra. o engenheiro está interessado em usar os dados para construir um modelo do sistema ou processo.004. 1. 31. 1989) descreve um experimento para testar a resistência resultante em tubos circulares com calotas soldadas nas extremidades. 67.18.1 E 1. ilustramos alguns métodos simples para resumir dados. Os dados provenientes de observação e os dados provenientes de experimentos planejados podem ser obtidos em ambos os tipos de estudos. 6800.89. o processo ou sistema que está sendo estudado pode ser observado somente pelo engenheiro e os dados são obtidos à medida que se tomam disponíveis. o encolhimento ou a resistência da peça. Geralmente. 102. o engenheiro pode estar interessado em saber se a força média de remoção de 3/32 polegada excede a carga máxima típica a ser encontrada nessa aplicação. Experimentos planejados também desempenham um papel crucial na redução do tempo de condução de um projeto de engenharia e do desenvolvimento de atividades. na fabricação de semicondutores. Nessa situação. Wayne Nelson apresenta o tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. estatisticamente. Freqüentemente. 1. esse é um exemplo de estudo analítico e também um exemplo de um problema envolvendo teste de hipóteses para duas amostras. No ambiente de engenharia. A habilidade de pensar e analisar. 7099.77.L3132 excederia 12. 36. Isso é chamado de problema de teste de hipóteses com uma única amostra. tais como a espessura da parede.90. 7518. a história do processo pode ser estudada em um esforço para determinar o ponto no tempo onde a mudança ocorreu e para ganhar algum discernimento em relação às variáveis do processo que devem ser responsáveis pela mudança.003. . são: 0. Um artigo no Journal o/ Structural Engineering (Vol. Os Caps. 160. uma mudança deliberada foi feita na espessura da parede do conector.27. ou seja. Problemas desse tipo serão discutidos no Capo 9. os dados são quase sempre uma amostra que foi selecionada a partir de alguma população. 156. Os comprimentos desses campos emjardas são: 6981. 1982). Em Applied Li/e Data Analysis (Wiley. ilustraremos vários tipos de experimentos planejados para o exemplo do conector. em minutos.35. ---------EXERCÍCIOS 1. 74. Foram feitas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um automóvel. A primeira maneira pela qual os engenheiros freqüentemente coletam dados é a partir de um estudo observacional. Na Seção 1. Uma abordagem que poderia ser usada na resolução desse problema é comparar as médias da força de remoção para 3/32 polegada. Esses modelos são freqüentemente chamados de modelos empíricos. 2.50. 6. 8 e 9 discutirão o teste de hipóteses e outras técnicas relacionadas.000.16. Calcule a média e o desvio-padrão da amostra.31. 126. Em um experimento planejado. esses estudos envolvem um conjunto muito grande de dados e requerem um firme domínio dos princípios estatísticos.2 COLETANDO DADOS DE ENGENHARIA Na seção prévia. a inferência ou decisão da análise é sobre como o sistema ou o processo se desempenhará no futuro. 3.75 libras-pé. 7. então.75 libras-pé.91.015.005 e 74. 164 e 170.LU8. 6935. Um artigo em Human Factors (junho de 1989) apresentou dados sobre a acomodação visual (uma função do movimento do olho).4.2. 4. mas freqüentemente eles envolvem estudos analíticos.75. 12. o engenheiro pode estar interessado em testar a hipótese de que um aumento da espessura da parede de 3/32 para 1/8 de polegada resulta em um aumento da força média de remoção. 4. Construa um diagrama de pontos dos dados. Assim sendo. 33. uma hipótese é uma afirmação sobre algum aspecto do sistema em que tenhamos interesse. A maioria dos problemas de engenharia envolve os estudos analíticos.1. tais como a temperatura do molde. 38.67. 0. O Capo 8 apresentará técnicas para esse tipo de problema.45. Alternativamente.4. mais alta confiabilidade e menores custos globais.78. 74. reconhecendo um padrão de mancha em um vídeo CRT de alta resolução. eles têm melhor desempenho.01. 96. Por exemplo. PARA AS SEÇÕES 1.85. Os primeiros resultados (em kN) são: 96. A segunda maneira pela qual os dados de engenharia são obtidos é através de um experimento planejado. se o engenheiro quiser alcançar o sucesso. 7013.78.001. 8.71 e 72.19. 74. O planejamento de experimentos tem um papel muito importante no projeto e desenvolvimento de engenharia e na melhoria dos processos de fabricação. quando produtos e processos são planejados e desenvolvidos com experimentos planejados. Se aparecerem questões relativas a uma mudança em uma importante característica elétrica. O exemplo do conector de plástico na seção prévia ilustrou um experimento planejado. 7100. é razoavelmente comum manter registros extensos de cada batelada ou lote de pastilhas que foi produzido. considere o problema a respeito da escolha da espessura da parede do conector de náilon. Construa um diagrama de pontos dos dados. em um estudo observador.3. Por exemplo.52. Calcule a média e o desvio-padrão da amostra. 8. 6992. 74. 1. 74. suponha que um engenheiro esteja avaliando o desempenho de um processo de fabricação de componentes plásticos através da injeção em molde. com o objetivo de descobrir se uma força de remoção maior poderia ser ou não obtida. 4. assim como as condições de processamento sob as quais cada batelada de pastilhas foi produzida. 32.

809. 856. Calcule a média e o desviopadrão da amostra.6. 870. sabemos que Mil está relacionado dade (V) do material e também depende da quantidade de catalisador (C) e da temperatura (1) no reator de polimerização.708. que foram coletados em uma planta de fabricação de semicondutores. Por exemplo. Gostariamos de encontrar um modelo relacionando a resistência à tração. considerando apenas o termo de primeira ordem. As variáveis reportadas são à tração (uma medida da quantidade de força a resistência requerida para romper a cola). Nosso modelo para esse fenômeno pode ser a lei de Ohm Corrente ou que possam afetar o peso molecular. ele usa a nossa engenharia e o conhecimento científico do fenômeno. pequenas impurezas presentes em diferentes localizações do fio e impulsos na voltagem. 498.001 14. talvez em tempos diferentes.2). Infelizmente. 898. 918. não parece provável que a abordagem de modelo mecanicista possa ser usada com sucesso. Agora.13 21.00 41.38Tração 34. Talvez. A relação entre Mil e essas variáveis é Mn = I(V.08 11. Para cada um dos Exercícios 1.952 25. C.775.8.50 9.6.63 22.30 e 49.72. Nessa planta.71. ou mesmo em dias diferentes. Logo. produzindo assim um modelo da forma Mn = 130 + 131V + !32C + !33T (1. 878. que relaciona essas variáveis. 39. em uma localização no sul da Espanha: 562. 909. Muito da educação formal de engenheiros envolve o aprendizado sobre os modelos relevantes a campos e a técnicas específicos para aplicar esses modelos na formulação e solução de problemas.754 35. adicionamos um outro termo ao modelo resultando (1. Agora. Podemos pensar E como sendo um termo que inclui os efeitos de todas as fontes não modeladas de variabilidade que afetam esse sistema. 693. de modo que devemos considerar outras fontes de variabilidade . Esse tipo é chamado modelo empírico. flutuações no desempenho do medidor. um modelo mais realista da corrente11 Observação pode Número da ser 16 15 18 17 12 13 10 20 21 23 5 7 94 8 14 6 19 22 23 24 25 observada do375 XI412 300 585 205 360 20 12 6 15 4 540 290 250 510 110 11 120 100 252 17 590 400 Altura 500 295 200 10 550 16 6 37. com um total de 6905 horas. quando o material é fabricado. 939. 1.89 46.65 69. Construa um diagrama de pontos dos dados. No entanto.9) em que a forma da função f é desconhecida.66 17.88 16. A edição de 22 de abril de 1991 de Aviation Week and Space Technology reporta que. um modelo de trabalho pudesse ser desenvolvido a partir de uma expansão em série de Taylor.1 a 1. 905.o PAPEL DA EsTATÍSTlCA 26. considere os dados na Tabela 1. assim como na lei de Ohm. Como um simples exemplo. Algumas vezes. 940.704. durante uma operação de guerra no deserto. ao comprimento do arame e à altura da matriz. 918. Com o objetivo de ilustrar essas idéias com um exemplo específico.93 24.15 Tabela 1. NA ENGENHARIA 7 1.30 17. 957.00 10.8) sendo E um termo adicionado ao modelo para considerar o fato de que os valores observados da corrente não seguem perfeitamente o modelo mecanicista.35900 9. 661.86X. 820.458 sobre 24.3 MODELOS MECANICISTAS E EMPÍRICOS Os modelos desempenham um importante papel na análise de praticamente todos os problemas de engenharia. Desse modo. 835.95 21. o comprimento do arame e a altura da matriz. suponha que estejamos medindo a corrente em um fio fino de cobre. 7) Chamamos esse tipo de modelo mecanístico.605 54. 768. não há mecanismo fisico que possamos facilmente aplicar aqui. 50. Qual foi a duração média de uma missão F -117 A durante essa operação? Por que o parâmetro que você calculou foi a média popu1aciona1 ? 1. discuta se os dados resultam de um estudo observado ou de um experimento planejado.59 44. os engenheiros trabalham com problemas para os quais não há modelo mecanicista simples ou bem entendido. 1.775. se fizermos esse processo de medição mais de uma vez. 27. 935. porque ele é construído a partir de nosso conhecimento do mecanismo fisico básico.2 Dados400y do a Resistência de Tração da Cola no Arame à250 Comprimento Resistência II=E/R+E (1. Calcule a média e o desvio-padrão da amostra.10) sendo f3's os parâmetros desconhecidos. que explique o fenômeno. Note que esse é um exemplo de um estudo observador (ver Seção 1. 558. suponha que estejamos interessados no peso molecular médio (Mil) de um à viscosipolímero. 955. Essa tabela contém dados das três variáveis. ou seja. = voltagem/resistência 1= E/R (1. 806. porém não é diretamente desenvolvido a partir de nosso conhecimento teórico ou dos primeiros princípios do mecanismo básico. 869.77. esse modelo não descreverá exatamente o fenômeno. 946. 653. tais como mudanças na temperatura ambiente.2. a con"ente observada poderá diferir levemente por causa de pequenas mudanças ou variações em fatores que não estejam perfeitamente controlados. T) (1.7. 960. Por conseguinte.655. 952.12 56.11) Esse é o modelo que usaremos para relacionar o peso molecular às outras três variáveis. 730 e 753. pilotos da força aérea americana (F-117A) realizaram 1270 vôos de combate. em dias diferentes.02Arame Molde 31. o semicondutor [mal é um arame colado a uma estrutura. Os seguintes dados são medidas de intensidade solar direta (watts/m2).

Em geral. Essencialmente.12 poderia ser usado para prever valores da resistência à tração para várias com- "ti <> ·Ctl Ctl 080 ~ 60 g 40 <Q) üí . suponha que. um experimento fatorial consistiria das oito combinações de teste mostradas nos vértices do cubo na Fig.12. 1. ele será primeiro imerso em um adesivo. chamado de mínimos quadrados. Mesmo que haja uma boa teoria científica básica em que possamos confiar na explicação do fenômeno de interesse. . ~1 (comprimento do arame) E + ~2(altura da matriz) + seria apropriado como um modelo empírico para essa relação.10. Notamos que o teste estatístico de hipóteses foi uma estrutura possível para investigar que o aumento da espessura da parede no projeto conduziria a níveis mais altos da força média de remoção. obtido a partir da Eq. A partir dos gráficos dos dados na Fig. reconsidere o problema da espessura da parede do conector.9 Gráfico de valores previstos da resistência à tração. Assim. Suponha que. Para ilustrar. A Seção 1. 1. então. Duas tentativas. 1. o modelo empírico poderia ser usado por um engenheiro exatamente da mesma maneira que um modelo mecanicista poderia ser usado. o tempo e a temperatura de cura poderiam ter algum efeito no desempenho do conector. em que nenhuma teoria científica ou de engenharia é completamente aplicável. Note que esse experimento usa oito protótipos de 3/32 polegada e oito protótipos de 1/8 polegada. ou réplicas. O engenheiro suspeita que. experimentos fatoriais são a maneira mais eficiente de estudar os efeitos de interação dos vários fatores. 1.2 resulte em Resistência à tração = 2. porém agora estamos investigando três fatores. que a aplicação dessa técnica aos dados da Tabela 1. pela aplicação de calor ao longo de algum período de tempo. mostraremos como construir esses modelos e testar se eles são adequados como funções de aproximação.9 é um gráfico dos valores previstos da resistência à tração versus o comprimento do arame e a altura da matriz. condução e análise de dados a partir de experimentos de engenharia.10. a partir do modelo empírico na Eq.74 (comprimento do arame) + + 0. Os valores observados da força de remoção estão mostrados entre parênteses nos vértices do cubo na Fig. 1. Usaremos um método para estimar os parâmetros nos modelos de regressão. Julgamento estatístico e métodos estatísticos desempenham um papel importante no planejamento. O modelo empírico na Eq. Examinando esse gráfico. o mesmo número usado no estudo comparativo simples da Seção 1.200 o~(0'?> ~y>\ ~ ~ Fig. a experiência e a observação dos dados resultantes constituem as únicas maneiras pelas quais o problema pode ser resolvido. Geralmente. 1.8 o PAPEL DA Esr A TÍSTICA NA ENGENHARIA A Fig. sendo então curado o arranjo. esse método escolhe os parâmetros (f3's) no modelo empírico para minimizar a soma dos quadrados das distâncias entre cada ponto dado e o plano representado pela equação do modelo. em adição à espessura da parede. os tempos de cura de interesse sejam 1 e 24 h e que os níveis de temperatura sejam 70°F e 100°F.12) em que o "chapéu" ou circunflexo sobre a resistência à tração indica que essa é uma quantidade estimada ou prevista. 1. A Fig. Nos Caps.8. resultando em um experimento fatorial com 16 corridas. 1. testou cada unidade e calculou a média e o desvio-padrão da amostra da força de remoção para cada projeto. 1. uma vez que todos os três fatores têm dois níveis. que se originou do trabalho de Karl Gauss. é quase sempre necessário conduzir testes ou experimentos para confirmar que a teoria é. Além disso. no experimento do conector. Lembre-se de que o engenheiro construiu oito protótipos de cada projeto (3/32 e 1/8 polegada). Essencialmente. quando o conector for arranjado na aplicação. esse modelo não parece razoável.• 300 ~\~ 200 o~<S' y>\~ 20 O 100 ~~ Fig. parece razoável pensar que um modelo tal como Resistência à tração binações de comprimento de arame e altura da matriz que fossem de interesse. é necessário planejar um experimento que nos permitirá investigar o efeito de todos os três fatores na força de remoção. Quando vários fatores são potencialmente importantes. = ~o + 1.12.26 + 2. É aparente. na verdade. a partir de um simples experimento comparativo. A força de remoção é medida no arranjo final. Note que os valores previstos repousam no plano acima do espaço comprimento do arame-altura da matriz. operativa na situação ou no ambiente no qual ela está sendo aplicada. 10 e 11.0125 (altura da matriz) (1. engenheiros trabalham em áreas problemáticas. Freqüentemente.8 Gráfico tridimensional dos dados do arame e da resistência à tração. Um experimento fatorial é aquele em que os fatores são variados conjuntamente.8 apresenta um gráfico tridimensional de todas as 25 observações da resistência à tração.1 continha um breve exemplo envolvendo um engenheiro que estava investigando o impacto do aumento da espessura da parede de um conector na força de remoção.~ 20 a: o O 8 Comprimento do arame 12 16 600 500 400 . esse tipo de modelo empírico é chamado de modelo de regressão. vemos que a resistência à tração aumenta quando o comprimento do arame e a altura da matriz aumentam. Para ilustrar. Dessa forma. 'üi üí 20 'ü a: 40 c 80 O o ~ 60 <Q) 'Ctl Q) Ctl ·Ctl 4 8 Comprimento 12 do arame 16 20 O 100 600 500 400 300 ~\1. seriam feitas em cada vértice. Agora. Essa é uma ilustração do uso do julgamento estatístico para ajudar na análise de dados. comprimento do arame e altura da matriz. a melhor estratégia da experiência é planejar algum tipo de experimento fatorial.1. Julgamento estatístico pode também ser aplicado a problemas experimentais mais sérios.4 PLANEJANDO INVESTIGAÇÕES EXPERIMENTAIS Muito do que sabemos em engenharia e nas ciências fisico-químicas é desenvolvido através de testes ou experiências. 1.

1 . comparando-se a média das oito corridas no topo do cubo (onde a temperatura = 100°F) com a média das oito corridas na parte inferior do cubo (onde a temperatura = 70°F) ou 14. = 70'F 24 h Tempo Fig. com linhas retas. Há dois tipos: o adesivo padrão e um novo competidor. o tempo de cura tem. A inclinação de cada uma dessas linhas retas representa o efeito do tempo de cura na força de remoção.1 (14. = 70'F 12. os pontos representando os dois níveis de temperatura.25 1h 100"F 13.5.12 ilustra como todos os quatro fatores .30 Temp.1 32 8 13. O efeito de aumentar o tempo de cura de 1para 24 h é aumentar a força média de remoção por 1 libra-pé.30 24 h 70"F 13.poderiam ser investigados em um plane- Tempo Temp. 15. se o tempo padrão de cura (1 h) for usado. Suponha que o engenheiro queira considerar um quarto fator. ~ 13.13. 15. aumentando a espessura da parede de 3/32 para 1/8 polegada aumenta a força média de remoção por 0.o PAPEL DA ESTATÍSTICA 14. Temp.1 (13. o efeito de aumentar a temperatura de cura é aumentar a força média de remoção por O. 13.9 (12. A interpretação dessa interação é muito direta. Esse é um exemplo de uma interação entre os dois fatores. 13.11 A interação de segunda ordem entre o tempo de cura e a temperatura de cura. 13.8 (14.65.45 = 0.14.9) ~ '" ~ 100' a> c. Logo. Note que as inclinações dessas duas linhas não parecem ser as mesmas.10. De fato. Algumas tentativas de conclusões muito interessantes podem ser retiradas desse experimento. porém se o tempo maior de cura for usado (24 h).4.7. Interações ocorrem freqüentemente em sistemas físicos e químicos e os experimentos fatoriais são a única maneira para investigar seus efeitos. Existe uma relação interessante entre o tempo de cura e a temperatura de cura.c :::. Primeiro.11.6. 1. graficando essas médias versus tempo e então conectando.60 24 h 100"F 14.83 14.0 (12..13.9.3) NA ENGENHARIA 9 13.2) ~ E 70' "\ e<f:'çO 24h lh l . 13.65 libra-pé. temperatura de cura e tipo de adesivo .9. 1. se as interações estiverem presentes e a estratégia fatorial de experimentos não for usada. aparentemente. resultados incorretos ou enganosos podem ser obtidos.13. 7 libra-pé. indicando que o efeito do tempo de cura é diferente nos dois valores da temperatura de cura. o tipo de adesivo.1 I (12.espessura da parede. -----14.1.0) 15. 1.3) I 13. Desse modo.425 = 0.8) Espessura da parede (polegada) Fig.90 13.37 .125 . O efeito da temperatura de cura pode ser avaliado. com a média das oito corridas na face da frente do cubo (em que tempo = 1 h) ou 14. A Fig.9.6 (13. um efeito maior que o de aumentar a espessura da parede.3)--0---/' /' /' /' /' /' 12.275 . respectivamente) ou 14. .a> c. Esse gráfico foi construí do calculando a força média de remoção nas quatro combinações diferentes de tempo e de temperatura. o aumento da temperatura de cura terá um efeito maior na força média de remoção.6 (13.50 1 h .6. que pode ser vista examinando-se o gráfico na Fig. porém especificando um tempo maior de cura e uma temperatura mais alta. a temperatura de cura terá pouco efeito. tempo de cura. 1.95 15. Assim.3. tais como o aumento da espessura da parede e o uso das condições "padrões" de 1 h e 70°F ou o uso da espessura original da parede de 3/32 polegada.10 O experimento fatorial para o problema da espessura da parede do conector. compare a força média de remoção dos oito protótipos de 3/32 polegada com a força média de remoção dos oito protótipos de 1/8 polegada (essas são as médias das oito corridas na face esquerda e na face direita do cubo na Fig.5) I I I I 13. há aparentemente muitas alternativas. para medir o efeito de aumentar o tempo de cura. Podemos facilmente estender a estratégia fatorial para mais fatores.13. compare a média das oito corridas na face de trás do cubo (em que tempo = 24 h). ou seja. = 100'F 14. se o objetivo do engenheiro for projetar um conector tendo um alto valor da força de remoção. Força média 1h 70"F 13.97 12.275 = 1.43 Temp. A seguir.

Esse planejamento de experimentos requer somente oito corridas./0-. (2) Ele soltou a primeira bola de gude e registrou sua localização relativa ao alvo.12 requer 16 testes. por exemplo. o planejamento experimental pode ainda ser representado geometricamente por um cubo (na verdade. Ele usou um funil montado em um anel e as bolas de gude caíram através do funil. quando houver quatro. é importante plotá-los ao longo do tempo." Novo ~ ::o "§ O> Q. em que somente se testa realmente um subconjunto das combinações dos fatores. Uma vez que muito do trabalho de engenharia envolve testar e experimentar.16. por conseguinte. oito fatores. então. o número necessário de corridas em um planejamento fatorial aumenta rapidamente. Experimentos fatoriais e fracionários são usados extensivamente por engenheiros e cientistas em pesquisa e desenvolvimento industriais.12 Um experimento fatorial com quatro fatores para o problema da espessura da parede do conector. Esse é um excelente planejamento experimental para estudar todos os quatro fatores./ .0 lh 3 32 24h . Claramente. é geralmente desnecessário testar todas as combinações possíveis dos níveis dos fatores. em uma tentativa de compensar o erro.13 Um experimento fatorial fracionário para o problema da espessura da parede do conector. com k = 4. Uni experimento fatorial fracionário é uma variação do arranjo básico fatorial.14 é um diagrama de pontos com leituras de concentração tomadas periodicamente em um processo químico. onde nova tecnologia. O Capo 13 concentrar-se-á nos fatoriais e nos fatoriais fracionários.15. . Por exemplo. Ele proverá boa informação acerca dos efeitos individuais dos quatro fatores e alguma informação acerca de como esses fatores interagem. 32 1 "8 Espessura da parede (polegada) Fig. Depois das duas estratégias estarem completas. usou duas estratégias diferentes para operar o processo. conforme mostrado na figura. todas as combinações possíveis dos quatro fatores são testadas. Pelo fato de os dados serem coletados ao longo do tempo. Ele continuou a fazer esse tipo de ajuste depois de cada bola ter sido solta.13 mostra um planejamento fatorial fracionário de experimentos. 1.10 O PAPEL DA EsTATÍSTICA NA ENGENHARIA Tipo de adesivo í------"-Velho '\ Novo ~ ::o "§ O> 100' If:'<P Q. é essencial que todos os engenheiros entendam os princípios básicos de um planeja- mento eficiente e efetivo de experimentos. As combinações de teste com um círculo. Felizmente. então. um planejamento fatorial de experimentos irá requerer 2k corridas. jamento fatorial. 1. Ele. 100' 70' "o lf:'çO lh E 24h f- O> 1. 1. A grande variação descrita no diagrama de pontos indica um possível problema.. ele será chamado de meia fração. para a versão com quatro fatores do experimento do conector. porém o gráfico não ajuda a explicar a razão para a variação. o planejamento 24 na Fig. E 70' . Ver Fig. podendo o conceito de estabilidade ser melhor julgado. cinco ou mais fatores. como no planejamento fatorial. Um deslocamento no nível médio do processo é visível no gráfico e uma estimativa do tempo do deslocamento pode ser obtida. Ele conduziu um experimento em que tentou deixar cair bolinhas de gude o mais próximo possível de um alvo em uma mesa. O guru da qualidade Edward Deming enfatizou que é importante entender a natureza da variação ao longo do tempo. eles são plotados ao longo do tempo na Fig. Ele apenas soltou uma bola de gude depois da outra e registrou a distância até o alvo.5 OBSERVANDO PROCESSOS AO LONGO DO TEMPO Toda vez que os dados são coletados ao longo do tempo.. O funil estava alinhado o mais próximo possível com o centro do alvo. 1. em vez das 16 originais. Isso se toma rapidamente impraticável. se houver k fatores e cada um deles tiver dois níveis. cada um com dois níveis. ~ I I . (l) Ele nunca moveu o funil. requereriam 256 ensaios. ele notou que a variabilidade na distância até o alvo para a estratégia 2 foi apro- Tipo de adesivo ____ . Geralmente./ . um hipercubo). que introduzimos aqui. moveu o funil por uma distância igual e oposta. 1. O experimento requer 16 ensaios. produtos e processos são projetados e desenvolvidos e onde produtos e processos existentes são melhorados. . Note que. são as únicas combinações de teste que necessitam ser realizadas. Já que todos os quatro fatores têm dois níveis. do ponto de vista do tempo e de outros recursos. à medida que o número de fatores aumenta. Discutiremos esses princípios no Capo 12. 1. Fenômenos que possam afetar o sistema ou o processo tomam-se com freqüência mais visíveis em um gráfico com uma escala de tempo.1. A Fig. Ele. A Fig./ 1 "8 Espessura da parede (polegada) Fig. 1.

eles tendem a mover o funil para mais longe do alvo.17(b) Ajustes aplicados aos distúrbios aleatórios controlam em demasia o processo e aumentam os desvios em relação ao alvo. em uma tentativa de produzir dados mais próximos ao alvo. A Fig. Bolinhas de gude c Ü c u oo ~ 'lU Q) 100 90 80 Fig. II • I87. Os ajustes no funil aumentaram os desvios até o alvo. Conseqüentemente. 1.17(a). 1. Isso é conhecido como sobrecontrole ou controle demasiado.16 O experimento do funil de Deming.15 Um gráfico temporal do que o diagrama de pontos. a média será reduzida por uma unidade antes que a próxima medida seja gerada.17(a) apresenta um gráfico do tempo. 1.17(b) apresenta os mesmos dados depois dos ajustes serem aplicados à média do processo. com 50 medidas (denotadas por y) de um processo em que somente perturbações !fleatórias estão presentes. . Uma simulação computacional pode ser usada para demonstrar as lições do experimento do funil. os ajustes no funil não diminuem erros futuros. Cada ajuste é igual e oposto ao desvio da medida prévia em relação ao alvo.14 O diagrama de pontos ilustra a variação.0 94.5 IX 84.0 98.5 91. Por exemplo. O sobrecontrole aumentou ·os desvios em relação ao alvo. baseados em perturbações aleatórias.o PAPEL DA EsTATÍSTICA • • • • • • • NA ENGENHARIA 11 . Ajustes devem ser aplicados somente para compensar mudança não aleatória no processo . exceto que as medidas depois da observação de número 25 são 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.18(a) apresenta os mesmos dados da Fig. eles podem ajudar. 1.0 • Concentração ••• • ~ Alvo Fig.então. quando a medida for 11 (uma unidade acima do alvo). O valor alvo para o processo é de 10 unidades. de concentração provê mais informações ximadamente duas vezes maior que para a estratégia 1. 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig.1. . 1. A explicação é que o erro (o desvio da posição da bola de gude até o alvo) para uma bola de gude não provê informação sobre o erro que ocorrerá para a próxima bola. o 10 20 30 Número da observação Fig. Esse experimento interessante mostra que os ajustes em um processo. mas não identifica o problema. podem realmente aumentar a variação do processo. Em vez disso. A Fig.1. 1. 1.17(a) Dados do processo somente com distúrbios aleatórios. A Fig.

18(b) apresenta os dados obtidos quando um ajuste (diminuição em duas unidades) for aplicado à média depois de a mudança ter sido detectada (na observação de número 28). A questão de quando aplicar ajustes (e por qual quantidade) começa com um entendimento dos tipos de variação que afetam um processo. Se o processo estiver operando como deve. provida pela linha central e pelos limites de controle. por uma distância correspondente a três desvios-padrão dos valores de concentração. 14 13 12 11 y 10 9 A mudan a na média do processo é detectada 8 7 6 10 20 30 40 50 Número da observação Fig. Esse é um sinal muito forte de que uma ação corretiva é necessária nesse processo. Gráficos de controle são uma aplicação muito importante de estatística para monitorizar. Um gráfico ou carta de controle é uma maneira inestimável de examinar a variabilidade em dados ao longo do tempo. Discutiremos CEP e gráficos de controle no Capo 15. aumentadas em duas unidades para simular o efeito de uma mudança na média do processo. O ramo da estatística que faz uso das cartas de controle é chamado de controle estatístico de processo ou CEP.12 O PAPEL DA EsTATÍSTICA NA ENGENHARIA 14 13 12 11 y 10 9 8 7 6 10 20 30 40 50 Número da observação Fig. O limite superior de controle e o limite inferior de controle são um par de limites. o desempenho do processo. consideravelmente. No gráfico de controle da Fig.5 g/l). Esses limites estão localizados acima e abaixo da linha central.15. Se pudermos encontrar e eliminar a causa básica desse distúrbio. 1. A Fig. em tomo da amostra 20. sem quaisquer fontes externas de variabilidade presentes no sistema. 1. 100 Limite superior de controle = 100. um ajuste poderá ser útil. podemos melhorar. porque todas as observações seguin- tes estão abaixo da linha central e duas delas realmente caem abaixo do limite inferior de controle. A linha central na carta de controle é apenas a média das medidas de concentração para as primeiras 20 amostras (x = 91.19 Um gráfico (carta) de controle para os dados de concentração de processoquimico. A Fig. 1. controlar e melhorar um processo. 1.19 mostra um gráfico de controle para os dados de concentração do processo químico da Fig. 1. indica que algum transtorno ou distúrbio atingiu o processo. 1. estatisticamente deduzidos. que reflete a variabilidade inerente ou natural no processo.54 80 o 5 10 15 20 25 30 Número da observação Fig. Note que esse ajuste diminui os desvios em relação ao alvo.18(a) A média do processo muda (para cima. 1. quando o processo estiver estável. as medidas de concentração deverão flutuar aleatoriamente em tomo da linha central e quase todas elas deverão cair entre os limites de controle. Quando houver uma mudança verdadeira na média de um processo.18(b) A mudança na média do processo é detectada na observação de número 28 e as medidas seguintes são diminuídas por duas unidades. por duas unidades) depois da observação de número 25. a estrutura visual de referência. .5 1(1) o c o Ü ~ ~ c: 90 Limite inferior de controle = 82.19.

1. Prepare um diagrama de pontos por essa segunda amostra e compare-o com o diagrama para a primeira amostra.15. 7. 1..18.80. 57.37.04. Eles são: 8.47. resultou em uma média (OF)de 835. a partir de um experimento envolvendo um vídeo CRT de alta resolução. 76. 1 count é equivalente a um coeficiente de arraste de 0.96. VoI.? o o i i . 70. 9. 63.16. FaçaYi = a + bx. com os seguintes resultados (os coeficientes de arraste estão em unidades de counts. 3. O que você pode concluir acerca da resolução de CRT nessa situação? O pH de uma solução é medido oito vezes por uma operadora usando o mesmo instrumento. 2. Xn. Indique onde a média da amostra cai no diagrama. 81. 31. Calcule a média. com medidas de temperatura em uma fornalha. usando um vídeo com baixa resolução.20.14 e 8.67.63. A prevenção da propagação da fratura por fadiga em estruturas de aeronaves é um importante elemento da segurança. 1. Os dados a seguir correspondem às temperaturas das junções dos anéis (graus F). NA ENGENHARIA 13 1. Diferentes algoritrnos de cálculo foram usados para M~ = 0.20. = 1. .18. 100.24. 7.61. prepare um diagrama de pontos. 129131): 84. 11 1. (a) Calcule a média. o. em que a e b são constantes diferentes de zero.o PAPEL DA EsTATÍSTICA Exercícios Suplementares 1. (c) A partir dos dados.x )/s.16.66.x e y e entre Sx e sr Uma amostra.82. 70. a variância e o desvio-padrão da amostra e construa um diagrama de pontos. Comente o que encontrou.20. (b) Os dados de um segundo experimento. calcule S2 para os novos dados. 7.. 72.02.85. 2. Como está essa quantidade relacionada a S2 para os dados originais? Explique por quê. ou seja. 35. 53.45.68. o.21. subtraia 30 e então multiplique as quantidades resultantes por 10.19.38. 1. = 1. 58.10. .40. 74. Ela obtém os seguintes dados: 7.67.. 85. 7. 83.80. Considere os dados do aerofólio no ExerCÍcio 1. Calcule a média da amostra. Quais são as maiores fontes de variabilidade nesse experimento? Um artigo no Journal of Aircraft (1988) descreve o cálculo de coeficientes de arraste para o aerofólio NASA 0012.7.00 e um desvio-padrão de 10. (a) Calcule a média da amostra. prepare um diagrama de pontos. para cada lançamento real ou de teste de um motor de um foguete espacial (da Presidential Commission on the Space Shuttle Challenger Accident.15. (a) A partir dos dados. 64.60. 67. a variância e o desvio-padrão da amostra. 2.2. n.49.12.13. 1. com média da amostra X e desvio-padrão s Faça Zi = (Xi . recalcule as quantidades do item (a). 7.67.00. 1. 1. (b) Calcule a variância e o desvio-padrão da amostra. 73. 2.5 descreve os dados de um artigo em Human Factors em acomodação visual. De cada valor. (b) Construa um diagrama de pontos com os dados de temperatura. Calcule a variância e o desvio-padrão da amostra.18. 1. 80 e 84.17.11. Considere a quantidade 1=1 (Xi . 7. quais são a média e os desvios-padrão expressos em °C? Considere a amostra XI' x2.0001): 79. fL? Codificando os dados. 75. 81.=1 I 1.60. 79.13. 15. no Quais são os valores da média e do desvio-padrão de Z. Um estudo de engenharia para investigar a fratura por fadiga em n = 9 asas carregadas ciclicamente reportou os seguintes comprimentos (em mm) de fratura: 2.14. 26. . 1. (Xi - fL)2 será a menor. 82.9. 70. Considere os dados de intensidade solamo ExerCÍcio 1. 1.58. Dê uma interpretação prática da média da amostra.6. 76. Quão "diferentes" são as outras temperaturas em relação a esse último valor? (a) (b) (c) EXERCÍCIOS PARA EXPANDIR A MENTE 1. (c) Sem considerar a menor observação (31°F).50 Usando os resultados do Exercício 1018. 52.16 e 7.15.70. Com esses dados.13. 61. 75. 78. Encontre uma relação entre . 2. 1.83. foram reportados no artigo. pp.53.a)20 Qual o valor de a ~ que minirniza essa quantidade? Usando os resultados do ExerCÍcio 1. Agora. 8. qual das duas n quantidades desde que i=1 x I * 11 (Xi - X )2 e .19. prepare um diagrama de pontos..69. O ExerCÍcio 1.

O computador se tomou uma ferramenta importante na apresentação e na análise de dados. A maioria da análise estatística é feita usando uma biblioteca de programas estatísticos. Entre os pacotes mais populares e largamente usados estão o SAS (Statistical Analysis System). Esses dados são a resistência à compressão. porque permitem ao engenheiro focar as características importantes dos dados ou ter discemimento acerca do tipo de modelo que deveria ser usado na solução do problema. no caso de amostras pequenas. seleciona os tipos de análises e apresentações de saída que são de interesse. Sumários e apresentações de dados bem constituídos são essenciais ao bom julgamento estatístico. juntamente com pessoas experientes em manipulá-los. escritos a priori. de 80 corpos de prova de uma nova liga de alumíniolítio. 2.2 DIAGRAMAS DE RAMO E FOLHAS O diagrama de pontos é uma apresentação útil de dados.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS No Capo 1. eles não contêm muita informação a respeito da resistência compressiva. Um diagrama de ramo e folhas é uma boa maneira de obter uma apresentação visual informativa de um conjunto de dados . então. Por exemplo. quando o número de observações for moderamente alto. outras apresentações gráficas podem ser mais úteis. apresentações mais efetivas estão disponíveis para conjuntos com muitos dados. Você encontrará esses pacotes. a construção de um diagrama de pontos. Questões como "Que percentagem dos corpos de prova cai abaixo de 120 psi?" não são fáceis de responder. introduzimos a média. No entanto. usando esses dados. disponíveis na sua instituição. O usuário entra com os dados e. nesse formato. Os dados foram registrados à medida que os testes iam sendo realizados e. Apresentaremos alguns exemplos de saída de vários pacotes estatísticos em todo o livro. considere os dados na Tabela 2.1. até cerca de 20 observações.5 GRÁFICOS SEQÜENCIAIS DE TEMPO 2. a variância e o desvio-padrão da amostra e o diagrama de pontos como técnicas para sumarizar dados.Sumário e Apresentação de Dados ESQUEMA DO CAPíTULO 2. em libras por polegada quadrada (psi).1 IMPORT ANCIA DO SUMÁRIO E APRESENTAÇÃO DEDADaS 2. seria relativamente ineficiente. para servidores e computadores pessoais (PCs).3 DISTRIBUIÇÕES DE FREQÜtNCIA HISTOGRAMAS E 2. Pacotes estatísticos estão disponíveis tanto para computadores de grande porte como para computadores pessoais. Porque existem muitas observações. ou similares. e o Statgraphics e Minitab para Pc. Não discutiremos a facilidade de uso dos pacotes com relação à entrada e à edição de dados ou ao uso dos comandos. essa abordagem pode requerer muito tempo e esforço. sendo necessário um computador para realizar as tarefas de forma muito mais eficiente.4 DIAGRAMA DE CAIXA 2. submetida à avaliação como um possível material para elementos estruturais de aeronaves. Enquanto muitas técnicas estatísticas necessitam somente de uma calculadora portátil.2 DIAGRAMAS DE RAMO E FOLHAS 2.

O EXEMPLO 2. St (para dois e três) com folhas 2 e 3. Isso dobrará o número de ramos originais.7. Na Fig. 6.SUMÁRIO E ApRESENTAÇÃO DE DADOS 15 . Para ilustrar.. A Fig.8.1. . Uma vez que um conjunto de ramos tenha sido escolhido...1 Para ilustrar a construção de um diagrama de ramo e folhas. 2. e Se com folhas 8 e 9.9. Poderíamos aumentar quatro vezes o número de ramos originais.8 e 9. resultando em uma apresentação mais adequada dos dados. diagrama de ramo e folhas nos capacita a determinar rapidamente algumas características importantes dos dados. devemos escolher. 2. dois dígitos.1.1 Diagrama de ramo e folhas para os dados de resistência à compressão na Tabela 2. no mínimo. entre Oe 100. dividimos cada número Xi em duas partes: um ramo. Como valores dos ramos. 2. SL e SD. com cada ramo dividido em cinco partes.2(c) ilustra um diagrama de ramo e folhas. considere os dados na Tabela 2. e uma folha. usamos 6. Uma inspeção desse diagrama revela imediatamente que a maioria das resistências à compressão está entre 110 e 200 psi e que um valor central está em algum lugar entre ISO e 160 psi. 149 170 237 135 171 167 208 221 151 160 115 131 199 168 174 153 180 118 160 201 200 175 158 148 150 87 154 229 163 142 172 101 184 178 123 156 133 194 193 190 154 110 176 181 228 167 120 143 180 121 186 169 165 141 146 157 158 174 183 76 150 145 Tabela 2. consistindo nos dígitos restantes. Há um número excessivo de ramos nesse gráfico.2. Ss (para seis e sete) com folhas 6 e 7. Na Fig. todas as folhas correspondentes aos valores observados são listadas na ordem em que elas foram encontradas no conjunto de dados. consistindo em um ou mais dígitos iniciais.• . definindo cinco novos ramos: Sz com folhas Oe 1. dos defeitos nos lotes de pastilhas de semicondutores. eles são listados ao longo da margem esquerda do diagrama. em que cada número Xi consiste em. Isso resulta em muitos poucos ramos e o diagrama de ramo e folhas não provê muita informação sobre os dados. 7. se os dados consistirem em informações percentuais. 2. EXEMPLO 2.2 ilustra o diagrama de ramo e folhas para 25 observações sobre os rendimentos de uma batelada de um processo químico.1. A última coluna no diagrama é a freqüência do número de folhas associadas a cada ramo.3 e4 e oramo SU tem folhas S. sobre a resistência à compressão de uma liga. Em alguns conjuntos de dados.1 Resistência à Compressão de 105 80 Corpos de Prova da Liga de AluITÚnio-Lítio . .2(a)...2(b). x. Sf (para quatro e cinco) com folhas 4 e S. 8 e 9 como os ramos.1. Ramo 4 1 353 960934Freqüência 5 89 8 3073050879 0361410 580 7 108 103 1 729583169 5Folha 68544162106 471340886808 4 2 7 12 10 3 3 1 6 8 Fig. 2. É geralmente melhor escolher entre S e 20 ramos.1. O diagrama resultante de ramo e folhas é apresentado na Fig. O ramo SL tem folhas 0. XI. então poderemos dividir o valor 76 no ramo 7 e na folha 6. Ao lado de cada ramo. poucos ramos em comparação ao número de observações. que não foram imediatamente óbvias quando da apresentação original na Tabela 2. 2. Em geral. relativamente. as resistências estão distribuídas aproximadamente de forma simétrica em tomo do valor central. selecionaremos os números 7. Além disso. Para construir o diagrama de ramo e folhas. pode ser desejável prover mais intervalos ou ramos.24. Uma maneira de fazer isso seria dividir o ramo S (por exemplo) em dois novos ramos.X2. resultando em um diagrama que não nos diz muito acerca da forma dos dados.2 A Fig. dividimos cada ramo em duas partes.

0 valores da resistência como 160 e 163.5. Por exemplo. na Fig.0 1 7 6 2 8 9 3 5 7 7 15 10 11 8 11 17 25 37 (10) 058 01 3 12 13 14 15 33 23 16 16 17 18 19 20 21 10 6 5 2 1 22 23 133455 12356899 001344678888 0003357789 0112445668 0011346 034699 0178 8 189 7 24 5 Fig.16 SUMÁRIO E APRESENT AçAo DE DADOS Ramo Folha Ramo 134 011 1 6z7s 23 1 3 Ramo 44 3 344 7 88 889 01 5 6 556 788 65 7z 7f 7t 6t 6f 455 57889 6e 5Folha 9U 7L 7U 9L 8L 6 6U 134556 6L (b) 8U 7 011357889 8 1344788 9 235 (a) 8e 7e 9s 9z 8z 8s 8t 8f 9f ge 9t (c) Fig. . Quando um conjunto ordenado de dados é dividido em quatro partes iguais. O terceiro quartil ou quartil superior. que divide os dados em duas partes iguais. em cada ramo. 2. qj.2 Diagrama de ramo e folhas para o Exemplo 2. os quartis podem não ser únicos. No ramo intermediário 16. Diagrama de Caracteres em Ramo e Folhas Ramo e Folhas da Resistência N = 80 Unidade da Folha = 1.3 mostra um diagrama de ramo e folhas dos dados de resistência à compressão na Tabela 2. isso geralmente não é feito quando o diagrama é construído manualmente. tanto no ramo como abaixo dele na metade inferior do diagrama. tem aproximadamente metade (50%) das observações abaixo de seu valor. contêm n = 80 observações. 2. Por causa do tempo demandado. 2. O pacote usa os mesmos ramos que adotamos na Fig. encontramos o 40. tanto no ramo como acima dele na metade superior do diagrama.3 indica que a moda é 158. O diagrama ordenado de ramo e folhas toma relativamente fácil encontrar características dos dados.1. O segundo quartil é exatamente igual à mediana. O computador adiciona uma coluna à esquerda dos ramos que provê uma contagem das observações.75. Note também que o computador ordena as folhas da menor para a maior. Essa forma do gráfico é geralmente chamada de diagrama ordenado de ramo e folhas. 2.0 e o 41. q3' tem aproximadamente três quartos (75%) das observações abaixo de seu valor.25 e 3(80 + 1)/4 = 60. Como no caso da mediana. os quartis e a mediana. 2. q2. interpolando quando necessário. a coluna indica o número de observações nesse ramo. Da Fig. esse valor ocorre quatro vezes e nenhum outro valor ocorre tão freqüentemente na amostra. metade abaixo da mediana e metade acima.3.3. A Fig. logo.2. O primeiro quartil ou quartil inferior. O segundo quartil. Se o número de observações forímpar. os pontos de divisão são chamados de quartis. tais como os percentis. A Fig. 2. 2. (80 + 1)/4 = 20.1. O pacote Minitab calcula o primeiro e o terceiro quartis como sendo as (n + 1)/4 e 3(n + 1)/4 observações ordenadas. a mediana estará na metade da distância entre os dois valores centrais. produzido pelo Minitab. Podemos também dividir os dados em mais de duas partes. é um valor que tem aproximadamente um quarto (25%) das observações abaixo dele e aproximadamente 75% das observações acima.3 Diagrama de ramo e folhas do Minitab. Os dados de resistência à compressão. a mediana é (160 + 163)/2 = 161. . a mediana será o valor central. A moda da amostra é o valor da observação que ocorre com mais freqüência. A mediana de uma amostra é uma medida de tendência central. Se o número de observações for par. e uma contagem das observações.

9 do a os números de os omedidas de locali33.50 e entre a 60.3 e a 61.3 e a 21.1.689. Provenientes do Minitab Média33.3 36.2 esses dados.3 90. 96.0 990 87.1 92.00.191.0 94.1 82. Q 13151522 33.1 95.6 90.5 90.7 96.5 35.4.832.6 87.6 34.188.6 32.6 96.9 88.4.2 35.8.090.2 84.6 845 89.187.00 161.2 95. a faixaMín interquartil é menos sensível a valores extremos na amostra.233. o 100k. Finalmente.8 93.4 83.535. de modo a obter ql = 143. algodãono eExercício um dados dados. rendimento cerâmica.9 34.7corposãoramo no(VaI.6 91.0 84.9 88.0mediana dea os quartisa para os dados de posiçãocorde PARA Construa um 2.7 90.1 34.586.3 35.3 no94.6 885 87. Q O Q D .894.2 2.76.1 35.4 92.183.3 observação ordenada.4 86.6 91.1 a ramo e folhas para no90.1 89.6.7 1888 93. para 2.7 34.4 92.3 33. A saída obtida para os dados da resistência à compressão Minitab.1 32.3 86.8 86.6 87.8 83.o percentil é o valor de modo que aproximadamente 100k% das observações estão nesse ou abaixo desse valor e apro100(1 . acha 34.5 95.7 35.3.4 34. a partir do Tabela 2.1 35.7 88.6 Você 92. Em geral.21792 90.5 87.5 94.1 88.1.6 90.6 89.7 88.7 no Ospercentagem os de EXERCíCIOS 90 90.4 33. Muitos pacotes estatísticos computacionais provêem sumários de dados que incluem essas quantidades.8 83.81269 35.4 88.390.3 que34. Expliquequartismetal foi aplicadofalhar umdados folhas19. fratura no dados32.1 375 mediana. na Tabela 2.75836.392.5.7 93.689.3 87.50 162.3 93.6 89.2 33.1 34. como uma medida de variabilidade.5 2.2 zação ExerCÍcio35.9 de e seguir dematerial 1977.3 1512 1468 1238 92.7 34.7 82. ximadamente podemos usar a faixa interquartil definida como IQR = q3 q I. de2.693. é mostrada na Tabela 2.1 37.4 87.9 1674 1260 90.188.1A descrevem diagrama Exercício 2.4 dados motorprova representam esses 425)octanagem Construaartigo aem2.9 84.1 89.2 85.SUMÁRIO E APRESENTAÇÁO DE DADOS 17 Conseqüentemente.336. o Minitab interpola entre a 20.6 93. 87. do85.5 Encontre 37.9 88.dequalSEÇÃO diferentesdecaracterísticas dos dados.6 89.4 97.3 37.434.4 84.1 706 90.594.2.6 91. 2.para os dados de rendimento Umcombustível A91.6 33.793.1o Technometricscomo paraparadasubstratoporapresenta vapor.2. de modo a obter q3 = 181.1 88.2 35.8 89.3 90.50 245.8 1055 78.791. usado além dos 34.8 90.235.00 relação à faixa ordiEm Variável 80 nma da amostra.488.2 84.5 85. 92.091.491.1 35. 94.732.2 100.3 um 84.2 88.2 34.2 34.78 média Q1Q3 Desvio-padrão Erro-padrão à e=o 2.1 90.7 36.787.1 bate1adas consecutivas essas três p.9 93.7.3 37.394.396.1 785 94.77 Mediana da N Máx181.4 83.8 mostrados e moda e "sobreviverá" até de de de ca93.0 84.6 86.1 de1608 1910 1207 1535 1018 1015 1452 1315 1016 1501 2215 2100 1781 1940 1578 1120 1890 1730 1594 1102 1605 1750 2023 1642 1560 1416 2.292.033.4 diagrama deos 94.0 98.71102 um 88.7 89.688.835.3 96.3 37.12.1 87.3 observação ordenada.485.7 89.6 93.4 86.394.3 90.8 90.490.2 86.086.0seguintes36.6 mediana 84.1 2265 1203 1330 1764 1883 1782 1223 1567 1000 1820 97.00 143.8 e=o 34.66 3.1 87.687.6 94.2 Resumo das Estatísticas para os Dados de Resistência Compressão.3 89.2.491.k)% deles estão acima dele.6revestimentoquartis médiaciclosamostrafabricar processo33.9 910 86.1 34.5 96. 32.2 95.

1 Intervalo de Classe (psi) 70 Marcação 11 Freqüência 2 3 6 14 22 17 10 Freqüência Relativa 0. O eixo vertical representa a escala de freqüência (ou freqüência relativa). essa perda de informação é pequena comparada ao ganho de concisão e de facilidade de interpretação ao usar a distribuição de freqüência e histograma. use o eixo horizontal para representar a escala de medidas e desenhe os limites dos intervalos. relativamente.2500 ':J 110 170 c90 210 LL 250 230 15 c5 0. cada um com 20'" psi de largura. Durante a passagem dos dados originais ou do diagrama de ramo e folhas para um diagrama de freqüência ou para um histograma. note a distribuição simétrica em forma de sino das medidas de resistência. Uma distribuição de freqüência para os dados de resistência à compressão na Tabela 2.tllJ.ll il111lJl.9250 0. os histogramas são mais fáceis de interpretar quando os intervalos de classe têm a mesma largura.3125 0. A Fig.3 é muito fácil Fig.0250 Freqüência Relativa Cumulativa 0. 2.8000 0. 2.3. Geralmente. fornecem uma razoável distribuição de freqüência.0250 0.0250 0. Tal gráfico é chamado de histograma. de modo que uma apresentação razoável possa ser desenvolvida. então podemos começar 70a distribuição de freqüência em <: L~ 10190 o'ü 20 130 150 L 0.j8O = 9. É também útil apresentar a distribuição de freqüência na forma gráfica. achamos que 5 a 20 intervalos são satisfatórios na maioria dos casos e que o número de intervalos deve crescer com n. assim como informação sobre a dispersão dos dados. perdemos alguma informação porque não temos mais as observações individuais. Entretanto. levando a 17 intervalos de classe. respectivamente.0500 0. como o diagrama de ramo e folhas.3 contém uma distribuição de freqüências relativas.3 DISTRIBUIÇÕES HISTOGRAMAS DE FREQÜÊNCIA E Uma distribuição de freqüência é um sumário mais compacto dos dados.2125 0. a distribuição de freqüências na Tabela 2. O histograma. A quarta coluna da Tabela 2. Se possível.0000 < x < 110 110 < x < 130 130 < x < 150 150 <x < 170 170 < x < 190 190 < x < 210 210 < x < 230 230 < x < 250 90 <x< 90 I1I il111 il11tllJ.4. fornece uma impressão visual da forma da distribuição das medidas.lI il11il11tllJ. que são geralmente chamados de intervalos de classe ou células.1750 0. Uma distribuição de freqüência não será informativa se usar um número muito baixo ou muito alto de intervalos de classe.0625 > Resistência à compressão (psi) 70 e terminá-Ia em 250. 11I1 4 2 11 .0375 0.9750 1. As freqüências relativas são encontradas dividindo a freqüência observada em cada intervalo pelo número total de observações. os intervalos têm de cobrir uma faixa de no mínimo 245 . Entretanto. Esse é um intervalo ou faixa de 180 o unidades de psi.lIlI il11tllJ.0625 0.1895 'ü '" dos. Se quisermos que o limite inferior para o primeiro intervalo de classe comece um pouco abaixo do menor valor dos dados e que o limite superior para o último intervalo de classe comece um pouco acima do maior valor dos da0. assim.2750 0. O maior e o menor valores dos dados são 245 e 76. Se os intervalos de classe tiverem igual largura. Os números "padrões" foram usados nesse histograma.1250 0. em relação ao diagrama de ramo e folhas. os intervalos devem ser de iguais larguras de modo a aumentar a informação visual na distribuição de freqüências.tllJ.3 Distribuição de Freqüências para os Dados de Resistência à Compressão na Tabela 2. Logo.76 = 169 unidades na escala de psi. O número de intervalos depende do número de observações e da quantidade de dispersão dos dados.1375 0. Notamos que os histogramas podem ser. dos dados de resistência à compressão.18 SUMÁRIO E APRESENTAÇÃO DE DADOS 2.5 mostra um histograma.5875 0.1250 0. Nove intervalos. temos de dividir a faixa de dados em intervalos. Uma vez que o conjunto de dados contém 80 observações e .4 Histograma de resistência alumínio-lítio.0750 0. então as alturas dos retângulos desenhados nos histogramas serão proporcionais às freqüências.3 expressa as freqüências relativas na base cumulativa. Na prática. Algum julgamento tem de ser usado na seleção do número de intervalos de classes. Se os intervalos de classe tiverem larguras desiguais.3 é baseada em nove intervalos de classe. 2. obtido no Minitab. Para construir uma distribuição de freqüência. ver que a maioria dos corpos de prova tem resistências à com'a> 'a> pressão entre 130 e 190 psi e que 97. então é costume desenhar retângulos cujas áreas serão proporcionais às freqüências.4. Distribuições de freqüências são geralmente mais fáceis de interpretar do que as tabelas de dados. Na Fig. conforme mostrado na Fig. 2.1 é mostrada na Tabela 2. Por exemplo. Para desenhar um histograma.5% dos corpos de prova caem abaixo de 230 psi. à compressão para 80 corpos de prova da liga Tabela 2. suspeitamos de que cerca de 8 ou 9 intervalos de classe fornecerão uma distribuição satisfatória de freqüência. trabalha-se bem se o número de intervalos de classe for aproximadamente igual à raiz quadrada do número de observações. A última coluna da Tabela 2. na Tabela 2.3125~ 25 '" ':J ~ <: 0.

a mediana e a moda não Fig. tipo n 2: 75 a 100 ou maior.8 apresenta três casos.6 mostra o histograma. Histogramas são mais efetivos como a apresentação de dados. encontraremos que moda < mediana < média.6) conduzem a informação similar. para amostras relativamente grandes. enquanto em outras. por exemplo.:. 2.. se a distribuição for distorcida para a esquerda. 2. Geralmente. o gráfico de freqüência cumulativa. A Fig. proveniente do 140 160 180 200 220 240 Resistência sensíveis ao número e à largura de seus intervalos.> '(3 u. .7 Gráfico de distribuição cumulativa pressão. Se os dados tiverem desvio de simetria (assirnétricos. feito pelo Minitab para os dados de resistência à compressão.7 que existem.-como na Fig. se o número e/ou a largura dos intervalos mudarem. Desvio para a esquerda ou negativo (a) Simétrico (b) Desvio para a direita ou positivo (e) Fig. 70 observações menores que ou iguais a 200 psi. segundo. 2. os histogramas podem mudar dramaticamente na aparência. Para conjuntos pequenos de dados. 2. terceiro e quartanista na universidade). se os dados forem sirnétricog. 2.> <1l ~ 50 u . o histograma poderá ser um indicador confiável da forma geral da população de medidas da qual a amostra foi retirada. Usualmente. os dados tiverem apenas uma moda (dizemos que os dados são unimodais).8a e c. 2.5 e 2. à compressão..SUMÁRIO E APRESENTAÇÃO DE DAOOS 19 r:r 'o> . Nesse gráfico. podemos ler diretamente da Fig.4. 2. c ~ 20 10 o 100 150 Resistência Fig. Ele é similar ao histograma original. Se. a mediana e a moda coincidirão. a escolha do número de intervalos não é especialmente importante e ambas (Figs.8 Histogramas para distribuições simétricas e deslocadas. 2. Distribuições de freqüências e histogramas são também usados com dados qualitativos ou por categorias. a ordem das categorias será arbitrária (tais como macho e fêmea). aproximadamente.5 Histograma dos dados de resistência Minitab com 17 intervalos de classe.~ 30 u. Distribuições cumulativas são também úteis na interpretação de dados. A Fig. proveniente do Minitab. proveniente do 80 > 70 ~ 60 :. A Fig. mostrado na Fig. se a distribuição for distorcida para a direita. 2. enquanto moda> mediana> média. como nas Figs. Em algumas aplicações. dos dados de resistência à com- 200 250 coincidirão. preferencialmente com 70. 2. além disso. então a média. à compressão. os intervalos devem ter a mesma largura. Histogramas são mais estáveis para conjuntos grandes de dados. com uma longa cauda para um lado). 2. 100 ou mais dados. disponível no Minitab. Quando o tamanho da amostra for grande. então a média.~ 40 . c ~ 10 5 20 O <1l 100 150 Resistência 200 250 o Fig. Quando usamos dados por categoria. 2. haverá uma ordem natural das categorias (tais como calouro.8b.6 Histograma dos dados de resistência Minitab com 9 intervalos de classe. então a média e a mediana coincidirão. com nove intervalos. Uma vez que o número de observações é moderamente grande (n = 80). a altura de cada barra é o número total de observações que é menor ou igual ao limite superior do intervalo.7 mostra uma variação de histograma.

mostrados na Tabela 2. Por exemplo. com o canto esquerdo (ou inferior) no primeiro quartil. Construa uma distribuição de freqüência e histograma. 4 buracos. tais como centro. a maioria dos defeitos. .4. em um estudo de rnilhagem de gasolina.13. Construa um diagrama de Pareto e interprete. a Fig. . 21 peças subaparadas. 767 e 707. na potência do motor. Construa uma distribuição de freqüência e histograma. A inspeção dessa apresentação revela que existe muito mais variabilidade na planta 2 e que as plantas 2 e 3 precisam melhorar o desempenho de seus índices da qualidade. modos de falha ou problemas nos produtos/processos. e assim por diante. Uma variação importante de um histograma para dados por categoria é o diagrama de Pareto. para os dados da resistência da liga à compressão. Q 2.3 veículo. é chamado de outlier. 2.3. em 1985. seguido pelos modelos 757. 5 peças não lubrificadas. Ocasionalmente. I A Fig. ql' e o canto direito (ou superior) no terceiro quartil.20 SUMÁRIO E ApRESENTAÇÃO DE DAOOS EXEMPLO 2. 30 peças fora de contorno e 3 peças com rebarbas. para os dados de octanagem do combustível para motor do Exercício 2. no segundo quartil (que é o percentil50 ou a mediana). seguida pela categoria com a segunda maior freqüência. com 16 intervalos de classe. Esse gráfico é largamente empregado nos esforços de melhoria da qualidade. Diagrama de Pareto. Nesta seção.12 mostra os diagramas comparativos de caixa para o índice da qualidade de fabricação em equipamentos semicondutores. O diagrama de caixa é uma apresentação gráfica que descreve simultaneamente várias características importantes de um conjunto de dados. 2. 747. pode ser creditada apenas a umas poucas categorias. em um conjunto de pontos. Esses diagramas têm o nome do matemático italiano V.2.11 representa o diagrama de caixa obtido pelo Minitab. uma vez que têm alto impacto visual e são fáceis de entender.3 2. Uma linha é desenhada. Uma linha estende-se de cada extremidade da caixa. Construa uma distribuição de freqüência e histograma para os dados de rendimento do Exercício 2. Esse é um exemplo de dados multivariáveis. símbolos diferentes. Um ponto além da linha. no tamanho do motor no veículo. Ver Exercício 2. são usados para identificar os dois tipos de outliers. 2.1. 707 747 250 100 ~º -150737 767 .(l) ~ E Nos ca- nhia Boeing. através da caixa.) ----------2. 2.14.) Um diagrama de caixa apresenta três quartis. Q 2. diagramas' de caixa são chamados de diagramas de caixa e linha. cada observação pode consistir em uma medida de milhas por galão. Use oito intervalos de classe. q2 = x. Os dois histogramas apresentam informação similar? o 2.9 Produção de aviões em 1985. ramo e folhas e o histograma fornecem impressões visuais geraiS"acerca de um conjunto de dados. temos nos concentrado em métodos descritivos para a situação em que cada observação. Modelo do avião Fig. Construa uma distribuição de freqüências e histograma para os dados do teor de algodão do Exercício 2. D Construa uma distribuição de freqüência e histograma para os dados de octanagem do combustível para motor do Exercício 2. Pareto e eles geralmente exibem a lei de Pareto. tais como x ou s fornecem informação sobre somente uma característica dos dados.14. usando os dados de fratura do Exercício 2. 2. Compare sua forma com aquela do histograma com oito intervalos de classe do Exercício 2. Há também dois suaves outliers em cada extremidade dos dados.o o 757 (l)CO Um histograma de ocorrências por categoria (em que as categorias são ordenadas pelo número de ocorrências) é algumas vezes chamado de diagrama de Pareto. discutiremos esse tipo de dados.LOO -. Esse diagrama de caixa indica que a distribuição a resistências compressivas é razoavelmente simétrica em tomo do valor central. (Fonte: Companhia Boeing. As categorias são ordenadas de modo que a categoria com a maior freqüência ficará à esquerda. alinhados tanto horizontal como verticalmente. desvio da simetria e identificação das observações que estão surpreendentemente longe do seio dos dados. enquanto quantidades numéricas. Algumas vezes. Um ponto a mais de 3 faixas interquartis da extremidade da caixa é chamado de outlier extremo.9. o mínimo e o máximo dos dados em uma caixa retangular.!l! (l) ro ~1J 1J'" :? (l) . A caixa inclui a amplitude interquartil. ou seja.5 interquartil do terceiro quartil. Por exemplo. pítulos mais adiante.5 interquartil a partir do primeiro quartil. (Essas observações são chamadas "outliers".1.12. ~ 2. porque os bigodes da direita e da esquerda e os comprimentos das caixas da direita e da esquerda ao redor da mediana são aproximadamente os mesmos. A Fig. 6 itens arrumados fora da seqüência.~~ 50 z. em três plantas de fabricação. Os diagramas de caixa são muito úteis em comparações gráficas entre conjuntos de dados.11. Dados mais afastados do que os bigodes são graficados como pontos individuais. dispersão. Ver Fig. 2.g. q3. em que as categorias geralmente representam tipos diferentes de defeitos. tais como círculos abertos e fechados. trabalhamos com dados em que cada observação consiste em várias medidas.9 apre"ota a p<adoção de e'Paçooave. A linha inferior começa no primeiro quartil indo até o menor valor do conjunto de pontos dentro das faixas de 1. Suponha que a seguinte informação sobre defeitos estruturais nas portas dos automóveis seja obtida: 4 arranhões. Em muitos casos. é um número único ou pertence a uma categoria.10.1.9.10. A linha superior começa no terceiro quartil indo até o maior valor do conjunto de pontos dentro das faixas de 1. 8 fendas perdidas.4 DIAGRAMA DE CAIXA (Box Plof ) o diagrama de. porém a menos de 3 amplitudes interquartis da extremidade da caixa. Note que o modelo 737 foi o mais popular. no peso do veículo e no comprimento do ". pela Compa. ""'" EXERCÍCIOS PARA A SEÇÃO 2.

a partir do terceiro quartil. 2. sem mudar o valor da mediana? (c) Construa um diagrama de caixa dos dados. 1. (b) Encontre a mediana. (c) Construa um diagrama de caixa dos dados e comente sobre a informação nesse diagrama.0. Os seguintes dados são as temperaturas.09.4 ---------2. o Outliers '\/ o Outlierextremo 1 •• / o f. 957.62. registradas em bateladas sucessivas de um processo de fabricação de semicondutores (unidades em °F): 953. 1. 2.8.16.7.92. 3.15. (a) Calcule a média. Quão diferentes são as outras temperaturas em relação a esse menor valor? (d) Construa. em fase vapor. Naquele exercício. até o menor ponto dado que esteja na faixa de 1. 1956. investigando o efeito de muitas variáveis de processos na oxidação.SUMÁRIO E APRESENTAÇÃO DE DADOS 21 A linha se estende. do efluente na descarga de uma unidade de tratamento de esgoto: 43 45 49 47 52 45 51 46 44 48 51 50 52 44 48 50 49 50 46 46 49 49 51 50 (a) Calcule a média e a mediana da amostra. (a) Calcule a média e o desvio-padrão da amostra. pp. 5. de naftaleno.8. Um artigo no Transactions of the !nstitution of Chemical Engineers (Vol. 3.17.7. o Exercício 2. 2. 951.0. 4.E Q) Q) ::> Q) 90 100 80 3150 200 250 70 120 2 110 Fig. 954 e 955.14 apresentou as temperaturas na junção dos anéis (graus Fahrenheit) para cada lançamento de teste ou real do foguete espacial.91. . Comente o que encontrou.11 Diagrama de caixa para os dados de resistência à compressão na Tabela 2.2. 949. Você calculou a média.3.8. (b) Calcule a variância e o desvio-padrão da amostra. (a) Calcule a média da amostra. 950.6.5 IQR 01< Fig.18. O Exercício 1. 2.0. 3.12 Diagramas de caixa comparativos de um indice de qualidade em três plantas. 34.5 rQR •• 1. 2. 2. Fig.+--l. Comente sua resposta. (c) Isole a maior observação (100) e refaça os itens (a) e (b). (d) Encontre os percentis 5% e 95% da temperatura. (c) Isole a menor observação (31°F) e recalcule as quantidades das partes (a) e (b).13 apresenta coeficientes de arraste para o aerofólio 0012 da NASA. 2.75.. 4. 2. 5.20.2. 2.5 interquarti. 2. 3. 955. (b) Encontre a mediana. a partir dos dados. A iinha se estende. 3. (a) Encontre os quartis inferior e superior dos coeficientes de arraste.19. 280-293) reportou dados sobre um experimento. a partir do primeiro quartil. 4. Os seguintes tempos (em segundos) foram obtidos em um veículo de teste: 1.15. até o maior ponto dado que esteja na faixa de 1. em dias consecutivos. 4. 4.1. 2.35. (b) Construa um diagrama de caixa dos dados. O "tempo de ignição fria" de um motor de carro está sendo investigado por um fabricante de gasolina. EXERCíCIOS PARA A SEÇÃO 2. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. (c) Construa um diagrama de caixa dos dados.3.1.5 rQR •• I :( raR 01< 1.0. 4.10 Descrição de um diagrama de caixa. 948. (a) Encontre os quartis inferior e superior de temperatura. 3.8.1. 2. Q 2. 3.8. De quanto a maior medida de temperatura poderia aumentar.53 e 1. ""'" D As nove medidas que seguem são temperaturas de fornalha.0.5 interquarti. (b) Construa um diagrama de caixa dos dados. (b) Calcule a variância e o desvio-padrão da amostra. 5. Planta :2 'õ u 'O c'" '" . um diagrama de caixa e comente a possível presença de outliers. desejava-se encontrar a média e o desvio-padrão da amostra de temperatura. a variância e o desvio-padrão da amostra de todos aqueles coeficientes. a variância e o desvio-padrão da amostra. 3.8 e 5.

Algumas vezes. Esse gráfico mostra claramente que as vendas anuais nesse negócio exibem uma variabilidade cíclica no trimestre. ramo Esse diagrama apresenta efetivamente a variabilidade global nos dados de resistência à compressão e mostra. dias. ' .13(b) mostra os últimos três anos de vendas registradas no trimestre.simultaneamente.1. 2.67. Por exemplo. A impressão geral é que a resistência à compressão varia em tomo do valor médio de 162.1. 2. 54) sugeriu combinar o diagrama de ramo e folhas com o gráfico de série temporal para formar um gráfico digiponto. A Fig. VoI.). Ã • ~• • • • 8 7108 960934 0361410 8544162106 3073050879 471340886808 29583169 413535 103 580 19 18 17 16 15 14 • • \ . Entretanto. são métodos visuais muito úteis para mostrar a variabilidade nos dados. Existe alguma variabilidade em tomo dessa tendência. etc.14 Gráfico digiponto dos dados de resistência à compressão na Tabela 2. Stuart Hunter (The American Statiscian. como histogramas.. • •• <I' r······ • . durante os últimos 10 anos. ciclos ou outras características gerais dos dados que não poderiam ser vistos de outra forma. J. diagramas de ramo e folhas e diagramas de caixa. 1988. . 2. 2.14 mostra um gráfico digiponto para as observações de resistência à compressão da Tabela 2. com algumas vendas anuais aumentando sobre aquelas do último ano e algumas vendas anuais diminuindo.22 SUMÁRIO E APRESENTAÇÃO DE DADOS 2. 13(a). não havendo padrão óbvio forte nessa variabilidade ao longo do tempo. notamos na Seção 1. Esse gráfico resume 30 observações de concentração no produ- Folha Ramo Gráficode série temDoral 5 7 189 24 23 22 21 20 • • • • • . considerando que essas observações são registradas na ordem em que elas ocorre- 1982 1983 19841985 1986 1987 (a) 1988 1989 19901991 Anos ><: g ""O C Q) > 2 3 4 2 3 (b) 4 1989 1990 234 1991 Quadrimestres Fig. 42. Uma série temporal ou seqüência temporal é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. .. com as vendas no primeiro e no segundo trimestres sendo.15 nos conta um fato diferente. maiores do que as vendas durante o terceiro e o quarto trimestres. pode ser muito útil combinar um gráfico de série temporal com algumas outras apresentações gráficas que consideramos previamente.. 13 12 11 • 15 7 7 10 9 • • r · • • • '. 2. 2. considere a Fig... \ • • . p. freqüentemente vemos tendências.· vf·~. O gráfico digiponto na Fig. geralmente. x) e o eixo horizontal denota o tempo (que poderia ser minutos. Um gráfico de série temporal é aquele em que o eixo vertical denota o valor observado da variável (por exemplo.. Quando as medidas são plotadas como uma série temporal. A Fig. a variabilidade nessas medidas ao longo do tempo.J .5 GRÁFICOS SEQÜENCIAIS DE TEMPO As apresentações gráficas que temos considerado. que apresenta um gráfico de série temporal das vendas anuais de uma companhia. ~~f • 8 7 6 Fig.13 Vendas da companhia por ano (a) e por quadrimestre (b). anos.5 que o tempo é um fator importante que contribui para a variabilidade dos dados e os métodos gráficos acima mencionados não levam isso em consideração. A impressão geral desse gráfico é que as vendas mostraram uma tendência para cima.

Os seguintes dados são medidas de viscosidade para um produto químico observado de hora em hora (leia para baixo e.2 7.5 8.6 O O O Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.6 43. and Control (Prentice Ral!.6 43. da esquerda para a direita). G. nho Construa e interprete um diagrama de série temporal desses dados.21.8 42.J'v f\\~ ~.2 de remoção 42.5 2. 48.24. P.SUMÁRIO E APRESENTAÇÃO DE DADOS 23 Folha Ramo Grálicode série temporal 2333 45 0010000 66677 99998 45 9s 8t 8s 9f 8e ge 8z81 9t 9z 8 · · / IV f\J. D.8 16. Johnson e 1.2 17.0 47. pelos passageiros da United Kingdom. ver o livro de Box. Gardiner analisam os dados na Tabela 2.0 17.5 48. 17.4 que foram corpos deleia parasão mostrados de laboratório.8 43. Forecasting.4.5 12.2 9. C.1 11.0 48. 1994). que correspondem ao total de milhas voadas.1 16. ma esquerda ordem em e para ramo 241 Construa um diagrama da série temporal dos dados. (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados. A análise deles requer algum conhecimento avançado de estatística e construção de modelo estatístico. Jenkis e G.7 17. A.15 Gráfico digiponto das leituras de concentração de um processo químico. da esquerda para a direita).5. G. 2. 1990). em que as observações são registradas em intervalos de uma hora.0 17. Esse diagrama indica que durante as primeiras 20 horas de operação. 225 248 203 195 249 (a) (b) 195 255 245 235 220 199 183 213 236 245 190 175 178 175 190 2. (Para uma análise interesssante e uma interpretação desses números.2 10. esse processo produziu concentrações geralmente acima de 85 g/l.9 47. Em seu livro Forecasting and Time Series Analysis.3 17. Alguns desses dados são mostrados a seguir (leia para baixo e. então a operação desse processo poderá ser melhorada.8 17.1 17.1. depois desse tempo. _.8 17._e e\ • · li · • /\·/v. EXERCÍCIOS PARA A SEÇÃO 2.6 17.5 48. Montgomery.4 ""'" ""'" ""'" 48. da esquerda para a direita). então. sendo mostrados abaixo e em ordem (leia para baixo e. então. 5. Em seu livro Time Series Analysis.9 3. Se essa variabilidade na concentração de saída do produto puder ser reduzida. . Box.24. a seguir (na poral desses para a direita): 40e um diagrama de série tem-então. Os tempos de resposta para 20 tarefas consecutivas foram registrados. prova baixo e. são mostrados na Tabela 2. C. Os números anuais Wolfer de manchas solares. feitas a cada duas horas.) (a) Construa um diagrama da série temporal desses dados.0 4.dados.3 47.25. mensalmente. 16. da separado de Dados folhas medidos. S.0 17.9 7.3 43.7 5.1 48.1 16.1 43.7 16.3 6.9 17.26." edição (McGraw-Rill.4 6. que resultou em concentrações mais baixas. 2.5 16.9 47. entre 1964 e 1970 (em !TIÍlhões de milhas).3 12. Fig.4 )1. •• . de 1770 a 1869. E.2 8.4 18.9 força Construa As A201 e interprete um para um digiponto é medida em um teste especificações 2.3 16. to na saída de um processo químico.5 16.6 245 251 212 187 238 185 194 218 210 209 198 249 220 48.2 10. Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas dos dados.2 48. referenciado no Exercício 2.9 17.5 43. O College ofEngineering and Applied Science na Arizona State University tem um sistema V AX de computadores. observadas dehora em hora. M. alguma coisa pode ter ocorrido no processo.22. então. L. gráfico conector ou um diagrana viscosidade do produto são em 48 48.9 2. Jenkins e Reinsel. Reinsel apresentam leituras de concentração de um processo químico. porém.1 16.

4 Números Anuais de Manchas Solares 1970 1968 1967 1965 1966 1969 1964 10.614 7. Suponha que o valor desejado para essa solução tenha sido especificado em 65 g/ 1. (b) Calcule a variância e o desvio-padrão da amostra.078 12.3 (g/l).645 7.953 11.186 14.147 10. 67.665 10.094 7.333 10.8.577 11.484 8.1.770 12.5 Milhas 11. (c) Suponha que.290 8.731 14. a operadora tenha de calibrar o aparelho e usar um material reagente.282 8.637 12. A concentração de uma solução é medida seis vezes por uma operadora que usa o mesmo instrumento.2.x2 = 38.607 9.103 13. Quais as maiores fontes de variabilidade que você imagina para esse experimento? Por que é desejável ter uma pequena variância dessas medidas? Uma amostra com resistores resultou as seguintes resistências (ohms):x] = 45.1 e 65.882 13.994 8.Você acha que o valor médio calculado aqui é suficien- 2.222 11.248 9.759 6.919 8.933 9.4.801 10.x3 = 47. Ela obtém os seguintes dados: 63.455 9.0.424 13.637 14. para que se possa afirmar que a solução tenha atingido o alvo? Justifique sua resposta.829 8.588 8.x4 = 41.24 1849118 1833 138 185047 185138 1830 66 183148 1867 50 184137 184063 181535 1862 2 1814 ApRESENTAÇÃO DE DADOS 71 14 13 11 1836 1311 1800 154 1834 101 1848 132 1858 103 1846 124 1822 122 1824 20 1823 24 1847 23 1837 68 1835 66 182560 185941 180983 183267 182190 1845 92 1868 85 1869 31 185382 185235 1805E 7 1807 43 1855 10 1798 42 1796 28 1860 98 1864 37 1839 40 1838 28 1828 51 1826 77 180134 1827 74 180245 1810 57 1799 47 185421 182967 1808 94 185723 1856 96 180628 1797 36 1820 64 1843 54 181830 184224 181741 1811 62 1866 39 181646 1844 55 186530 181924 1861 9 1803 4 1804 7 1795 6 1812 5 1863 O 1813 8 12 17 10 16 15 86 SUMÁRIO 125 1770 Tabela 2.179 10.389 9.27. temente próximo do valor alvo.xs = 35 eX6 = 43. 65.252 9.109 10. usando o método da Eq.682 10.638 10.350 10.391 11.685 10.334 9. .775 7.794 11.852 10.069 8.185 9.269 12.840 12.894 10.396 9. 64. (b) Construa e interprete um gráfico digiponto ou um diagrama de ramo e folhas desses dados.829 10.436 10.899 11.537 13.280 12.775 11.948 7.444 12.857 12.057 13.925 9.371 7.253 13.491 8.402 8. 65.417 16. (a) Calcule a variância e o desvio-padrão da amostra.667 10.730 8.864 7.594 7.772 7.589 11.246 10.933 14. 1.772 12.234 15.281 12.812 13.161 Tabela 2.030 pelos Passageiros da United Kingdom Voadas Mês (a) Desenhe um diagrama de série temporal dos dados e comente qualquer característica aparente desses dados.28.639 8.819 12. Exercícios Suplementares 2. para medir a concentração.366 10. (a) Calcule a média da amostra.110 9.

7 14.3 15. 5. de da para um conjunto de 3 2. Essas quantidades indicam que ambas as amostras têm a mesma variabilidade? Explique.tra com o desvio-padrão da amostra.8. 5. Há alguma evidência de que houve um aumento ou diminuição no número médio de erros em um conjunto de caracteres? Explique. 4. (c) Escreva um curto texto contrastando a amplitude da amos11 19 8 1 2. 470.33. (c) Construa um diagrama de série temporal dos dados. 3. Construa um diagrama de caixa dos dados transformados e comente o efeito da transformação. Durante 40 dias de produção.0. com um tamanho igual a 50.5 14. Para ilustrar o efeito de uma transformação. 8. em milhares de garrafas. Encontre a média da amostra e o desvio-padrão. (a) Construa um diagrama de série temporal dos dados e comente qualquer característica dos dados que seja revelada por esse diagrama.jY ou log(y).3 13. 34. (b) Pergunte-se como você usaria um procedimento gráfico para prever vendas mensais de champanhe para o ano de 1970.000. pp. 1.8 e (b) 2. O gráfico indica que os dois processos geram resultados similares? (c) Calcule a média e a variância das 40 primeiras observações. 1992. 6.8 13. desenhe um baixo diagrama. tais como . 2.1. (a) Calcule a amplitude para ambas as amostras.0 ou algum outro valor qualquer poderia ter dado os mesmos resultados? Considere as duas amostras dadas abaixo: Amostra 1: 10. em cada batelada de produção.9 12. 6. Amostra 2: 10.2. (a) (b) (c) . Como parte desse sistema de qualidade.7 15. foi decidido registrar o número de molas fora de conformidade.2 16. uma transformação por alguma função matemática aplicada aos dados originais.32.0 14. 175. Em alguns conjuntos de dados. como medida de variabilidade. 2. para encontrar S2 e s? Um artigo no Transactions 01 tlle Institution 01 Cllemical Engineers (Vol. 4. Há alguma coisa "especial" sobre o valor constante 1. (b) Calcule o desvio-padrão de ambas as amostras. calcule esses valores para as 40 últimas observações. pode resultar em dados que sejam mais fáceis de trabalhar.6 14. (b) Calcule a amplitude. Os dados mostrados na Tabela 2. ou seja. 8.0.8. (b) Transforme os dados usando logaritmos.9 13. característica dos dadostodos seja dados e comente qualquer de série temporal de que os revelada por esse diagrama 2. pp. Você concluiria que ambas as amostras exibem a mesma variabilidade? Explique. (a) Construa um diagrama de ramo e folhas dos dados. faça y* (novo valor) = log(y) (valor antigo).1 15.3.3 14. 375. 350 e 430 ohms.4 13. Compare seus resultados com aqueles obtidos nos itens (a) e (b) e justifique sua resposta. a variância e o desvio-padrão da amostra.34.0.caracteres (string) de do número Dados esquerda para conjuntos são vistos a seguir. enquanto as 40 últimas observações foram geradas a partir de um processo diferente.0 15. 8 e 6.6 representam as vendas mensais de champanhe na França (1962-1969).6 e da esquerda para a direita.3 16. 3. 10 e 6. então.4 15. 4.8 14. 5 12 11 3113 2 9 7144 O 26 99 47 1 13 35 8 15 12 1918 4 12486Um canal de comunicação está sendo monitorado pelo registro O 17 Leia os dados erros em20 desses a direita.8 16. 2. (a) Construa um diagrama de caixa e comente a forma da distribuição dos dados. Um artigo em Quality Engineering (VaI.29. 290.6 Lendo para 14. (a) 2. Considere a noção de que as 40 primeiras observações foram geradas a partir de um processo específico.35. 1.9 14. 5. 3.150. a variância e o desvio-padrão da amostra novamente. Compare seus resultados com aqueles obtidos no item (a). Calcule a amplitude. 4. Explique por que os resultados são iguais aos do item (a). 280-293) reportou dados sobre um experimento. Essas quantidades indicam que ambos os processos resultam no mesmo nível de média? E a mesma variabilidade? Explique. (b) Encontre a média da amostra e o desvio-padrão. (c) Não use a medida da resistência igual a 35 e calcule S2 e s.8.8. 410. Há alguma evidência de que houve um aumento ou diminuição no número médio de molas fora de conformidade.31. usando a definição da Eq.6 14.1 15.9 14. fabricadas durante os 40 dias? Explique. mas primeiro subtraia o número 1. 2.8 16.6.4 15.0 de cada observação. investigando o efeito de muitas variáveis de processos na oxidação em fase vapor de naftaleno. 8.7.0. Uma amostra da conversão percentual molar de naftaleno em anidrido maléico resulta em: 4. considere os seguintes dados.1. 7.3.4 13. 3. Leia os dados da esquerda para a direita.0. Construa um diagrama de ramo e folhas dos dados. Construa um diagrama da série temporal dos dados.3. 3. 100. 2. 40 bateladas de dados foram coletadas sendo reportadas aqui. que representam ciclos de falhas de um tecido: 675.2 15. (d) Se as resistências fossem 450. 1. 10.7.0 13. Um fabricante de molas está interessado em implementar um sistema de controle da qualidade para monitorar seu processo de produção.8. 4.5 15. do que os dados originais.650. 4.3.2. 1956. 3. 6. 4. 13. 380.000 bits. 9.30.2 16.1 16. Uma amostra desses dados é apresentada a seguir. Calcule a variância e o desvio-padrão da amostra.SUMÁRIO E APRESENTAÇÃO DE DADOS 25 2. estatisticamente. 487495) apresenta dados de viscosidade de um processo químico em batelada.6 17. você poderia usar os resultados dos itens anteriores desse problema. Transformações. 10. (b) 5.

647 4.121 4.260 2.031 3.076 1963 12.927 3. Out. Mar.539 3..424 3.26 SUMÁRIO E APRESENTAÇÃO DE DADOS Tabela 2.276 4.981 1.047 4.676 5.639 4.370 5. Maio Abril Fev.036 2.301 4.759 4. A observação "100+" indica que a unidade ainda funcionou no tempo de 100 horas.723 Vendas 1966 3.10.874 3. 100+.541 3. Agora.006 3. A Média Podada (Trimmeá).916 1967 10.718 4.357 6. Mar. (b) Calcule a média 20% podada para os dados de rendimento do Exercício 2.946 3.286 4.36.677 2. Jan.937 3.595 4. (c) Compare os valores calculados nos itens (a) e (b) com a média e a mediana da amostra para os dados do Exercício 2.922 4.523 3.957 9.922 9.016 7.10 e compare-a com a quantidade encontrada no item (a).132 3. consiste em colocar as partes em uma célula de teste e corrê-Ias durante 100 horas.028 3. A média podada está. Use os resultados dos itens (a) e (b) para calcular a nova média e o desvio-padrão da amostra para os da- dos do Exercício 2.591 9.986 3.986 3. Julho Out. Por quê? (a) Calcule a média 10% podada para os dados de rendimento do Exercício 2.776 1.934 4. (b) (c) Mostre que ns. entre a média da amostra x e a mediana da amostra X.672 2.842 3.) Oito componentes foram testados com os seguintes tempos resultantes de falha: 75.651 1969 11. Abril Junho Dez.010 4. Jan.633 9. 2. Há alguma medida significante de localização que possa ser calculada para esses dados? Qual é o seu valor numérico? 2. Desenvolva um procedimento para obter uma média podada nesse caso.217 6.375 7.)2.659 3. usando todas as n + 1 observações.37. Dez.314 5.254 4.528 5. Suponha que tenhamos uma amostra x. + _n_ n+1 (xn+ l-X..643 10. Nov. geralmente.6 Vendas de Champanhe na França Ano Jan. em horas. A quantidade resultante é chamada de média podada. respectivamente. de um componente eletrônico.663 2.899 5.614 4.739 8.858 5.088 3.154 4. + 1 ser a média e a variância da amostra. Xz.222 1.573 13.755 2.474 5. Dez. Agosto Agosto Agosto EXERCÍCIOS PARA EXPANDIR A MENTE 2.670 2.113 3.266 2. Há muita diferença entre essas quantidades? Por quê? A Média Podada (Trímmeá).510 1.282 2. (a) Mostre como xn + I pode ser calculado.803 1964 1. Nov.738 4.514 4. uma (n + l)-ésima observação se torna disponíveL Faça xn + 1 e s.851 6.428 6.x" e tenhamos calculado x" e s~ para a amostra. Suponha que os dados estejam arranjados em ordem crescente. Set. Fev.740 2. Suponha que o tamanho da amostra n seja tal que a quantidade nTI100 não seja um inteiro. que T% das observações sejam removidas de cada extremidade e que a média da amostra dos números restantes seja calculada.965 8.633 13.292 4. .39.753 3.520 4. 80 e 90. .28. 45.968 3. quando a nova observação for = 46.851 2.838 1. 63. 51.230 3. sob condições de temperatura elevada. (Isso é chamado teste "acelerado" de vida.212 3.162 1.048 3.475 3.821 2.4..221 4. Mês Ano 4. Dez.&73 5. .38.331 6.764 5. Um experimento para investigar o tempo de sobrevivência. usando x" e xll+1" x7 2.271 2. + 1 = (n -1) s.. 36.211 Junho Julho Maio Set.

Sign up to vote on this title
UsefulNot useful