Inferência Estatística

1 - Introdução
Diversos problemas da Engenharia e outras ciências requerem que decidamos entre aceitar ou rejeitar uma afirmação acerca de algum parâmetro. Essa afirmação é chamada de hipótese e o procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses. Para se realizar um teste de hipótese estatística, retira-se uma amostra da população em estudo, com base nessa amostra e utilizando um estimador não tendencioso do parâmetro toma-se a decisão de rejeitar ou aceitar a afirmação. De uma forma geral, a estrutura do teste de hipóteses é:

(i) H0: θ = θ0 (ou ≥) H1: θ < θ0

(2) H0: θ = θ0 (ou ≤) H0: θ > θ0

(3) H0: θ = θ0 H1: θ ≠ θ0

Nessa estrutura, H0 é chamado de hipótese nula e H1 é chamada de hipótese alternativa. Em (i), temos o teste unilateral esquerdo, que irá testar desvios no parâmetro que sejam inferiores ao valor a ser testado. Em (ii), temos o teste unilateral direito, que irá testar desvios no parâmetro que sejam superiores ao valor a ser testado. Em (iii), temos o teste bilateral, que testa diferenças no parâmetro em ambos os lados. Um conceito importante a ser definido é o nível de significância α, que é utilizado para se definir as regiões de aceitação e rejeição do teste de hipóteses. O valor mais utilizado é 5%, que é o valor a ser utilizado nesse curso. Outro importante conceito é o P-value (ou Valor P) que é o menor nível de significância que conduz à rejeição da hipótese nula H0 com os dados fornecidos. Quando uma estimativa de um parâmetro não fornece informação suficiente é interessante fazermos o intervalo de confiança para um parâmetro.

2 - Inferência Estatística para uma Única Amostra 2.1 - Inferência Estatística sobre a Média
Sabemos que a média amostral é um estimador não tendencioso da média populacional µ, assim de posse de uma amostra, deve-se calcular o valor da média amostral para se testar hipóteses sobre a média populacional.

2.1.1 - Uso da Distribuição Normal
Para utilizar-se a distribuição normal considera-se que a população de origem seja normalmente distribuída, ou que as condições do Teorema Central do Limite sejam satisfeitas. Assim, a distribuição da média amostral é aproximadamente normal, com média µ e variância σ2/n. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses: (2)H0: µ = µ0 (ou ≤) (3)H0: µ = µ0 (1)H0: µ = µ0 (ou ≥) H1 : µ < µ 0 H1: µ > µ 0 H1: µ ≠ µ 0 A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

(1) (2) (3) Figura 1 – Gráficos da estatística de teste, com suas respectivas regiões críticas Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 1 Proposta: Testar a média de uma população, quando o desvio padrão da população for conhecido. Problema: Considere que uma indústria compra de um certo fabricante, pinos cuja resistência média à ruptura é especificada em 12 kgf (valor nominal da especificação). Em um determinado dia, a indústria recebeu um grande lote de pinos e a equipe técnica da industria deseja verificar se o lote atende às especifições. Considere o desvio padrão como igual 4 e que a resistência à ruptura é normalmente distribuída. Adote um nível de significância de 5%. Tem-se interesse em testar as seguintes hipóteses: H0: µ = 12 H1: µ ≠ 12 A região crítica será: Rc = {│Z│> 1,96}. Ferramentas: 1-Sample Z

Fonte de dados: TH-1.mpj 1-SAMPLE Z 1. Abra o arquivo TH-1 2. Selecione Static > Basic Statics > 1-Sample Z 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB
One-Sample Z: Resistência Média à Ruptura; Resistência Média à Ruptura Test of mu = 12 vs not = 12 The assumed standard deviation = 4 Variable N P Resistência Média 22 0,083 Mean 13,4773 StDev 3,1954 SE Mean 0,8528 95% CI (11,8058; 15,1487) Z 1,73

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 1,73. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,083, que é maior que o nível de significância α adotado (0,05). Logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas para considerarmos que a resistência média à ruptura dos pinos produzidos pelo fabricante seja realmente igual a 12, assim esses pinos estão dentro das especificações estabelecidas.

INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µ; 0,95) = (11,8058; 15,1487) A interpretação é que temos 95% de chances de encontrarmos valores de resistência à ruptura dentro do Intervalo de Confiança acima. Como o Intervalo de Confiança acima contém o 12, podemos concluir então que a resistência média à ruptura dos pinos produzidos pelo fabricante seja realmente igual a 12.

2.1.2 Uso da Distribuição T-Student
Utilizar-se a distribuição T-Student quando o desvio-padrão é desconhecido e o tamanho da amostra é menor que 30. Se a população for normalmente distribuída, podemos utilizar o desvio-padrão amostral s para estimar o desvio-padrão populacional σ. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses: (1)H0: µ = µ0 (ou ≥) H1 : µ < µ 0 (2)H0: µ = µ0 (ou ≤) H1: µ > µ 0 (3)H0: µ = µ0 H1: µ ≠ µ 0

A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}.

(i)

(ii)

(iii)

Figura 2 – Gráficos da estatística de teste, com suas respectivas regiões críticas Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 2
Proposta: Testar a média da população, quando o desvio padrão da população for desconhecido (não importando o tamanho da amostra).

Problema: O exemplo é o mesmo anterior, só que agora o desvio-padrão não é conhecido. Tem-se interesse em testar as seguintes hipóteses: H0: µ = 12 H1: µ ≠ 12 A região crítica será: Rc = {│T│> t 0,025; 21} => Rc = {│T│> 2,08}. Ferramentas 1-Sample T Fonte de dados: TH-1.mpj 1-SAMPLE T

1. Abra o arquivo TH-1 2. Selecione Static > Basic Statics > 1-Sample T 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB
One-Sample T: Resistência Média à Ruptura
Test of mu = 12 vs not = 12 Variable N Resistência Média 22 Mean 13,4773 StDev 3,1954 SE Mean 0,6813 95% CI (12,0605; 14,8940) T 2,17 P 0,042

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 2,17. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,042, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0. CONCLUSÃO

Há evidências estatísticas fortes para considerarmos que a resistência média à ruptura dos pinos produzidos pelo fabricante seja diferente de 12, assim esses pinos não estão dentro das especificações estabelecidas. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µ; 0,95) = (12,0605; 14,8940) A interpretação é que temos 95% de chances de encontrarmos valores de resistência à ruptura dentro do Intervalo de Confiança acima. Como o Intervalo de Confiança acima não contém o 12, podemos concluir então que a resistência média à ruptura dos pinos produzidos pelo fabricante não seja igual a 12. Como o intervalo de confiança está um pouco acima do 12, podemos considerar que o valor da resistência média à ruptura desses pinos seja superior ao valor especificado.

2.2 - Inferência sobre a Proporção de uma População
Freqüentemente, é necessário testar hipóteses e construir intervalos de confiança para a proporção de uma população. Se o número de sucessos e o número de fracassos forem pelo menos iguais a 5, a distribuição de amostragem de uma proporção irá seguir aproximadamente uma normal. As hipóteses a serem testadas são: (1)H0: p = p0 (ou ≥) H1: p < p0 (2)H0: p = p0 (ou ≤) H1: p > p0 (3) H0: p = p0 H1: p ≠ p0

Nesse caso, a estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}. Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 3
Proposta: Testar a proporção de uma população. Problema: Um fabricante de semicondutores produz controladores usados em aplicações no motor de automóveis. O consumidor requer que a fração defeituosa em uma etapa crítica de fabricação não exceda 0,05 e que o fabricante demonstre uma capacidade de processo nesse nível de qualidade, usando um nível de significância de 5%. O fabricante dos semicondutores retira uma amostra aleatória de 200 aparelhos e encontra que 4 deles são defeituosos. O fabricante pode demonstrar uma capacidade de processo para o consumidor? Tem-se interesse em testar as seguintes hipóteses: Temos a seguinte Hipótese: H0: p = 0,05 H1: p <0,05 A região crítica será: Rc = { Z < - 1,645} Ferramentas 1-Proportion Fonte de Dados:

1 - PROPORTION 1. Abra o MINITAB 14; 2. Selecione Static > Basic Statics > 1-Proportion; 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options; 5. Preencha o quadro de acordo a figura seguinte:

6. Clique em OK; SAÍDA DO MINITAB
Test and CI for One Proportion
Test of p = 0,05 vs p < 0,05

Sample

X

N

Sample p

95% Upper Bound

Z-Value

P-Value

1

4

200

0,020000

0,036283

-1,95

0,026

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a -1,95. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Obtivemos um P-value igual a 0,026, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que proporção defeituosa do processo é menor que 0,05. Assim o fabricante de semicondutores demonstra uma capacidade de processo no nível de qualidade requerida pelo seu consumidor. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µ; 0,95) = ( ≤ 0,036283) A interpretação é que temos 95% de chances de encontrarmos proporções de controladores que sejam no máximo iguais a 0,036283.

2.3 - Teste de Normalidade
Em muitos casos é importante testarmos a normalidade da população estudada. Nos teste anteriores, fazíamos a suposição de normalidade. Para o teste de Normalidade, as hipóteses a serem testadas são: Ho: X é aproximadamente normal – X ~ N(µ, σ2) H1: A População X não é normalmente distribuída No MINITAB 14, podemos plotar um gráfico de Normalidade, se os pontos estiverem bem alinhados, pode-se considerar que a população seja normalmente distribuída. Esse julgamento é subjetivo, podendo se também calcular o valor de 3 diferentes Estatísticas de Teste: Anderson-Darling, Ryan-Joiner e Kolmogorov-Smirnov. A tomada de decisão também é feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

EXEMPLO 4
Proposta:

Problema: Teste se a Resistência Media à Ruptura é normalmente distribuída. Ferramentas: Normality Test Probability Plot

Fonte de dados: TH-1.mpj NORMALITY TEST 1. Abra o MINITAB 14 2. Selecione Static > Basic Statics > Normality Test 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB

Gráfico de Normalidade para a Resistência Média à Ruptura
Normal
99 Mean StDev N KS P-Value 13,71 3,554 22 0,085 >0,150

95 90 80

Percent

70 60 50 40 30 20 10 5

1

5,0

7,5

10,0 12,5 15,0 17,5 Resistência Média à Ruptura

20,0

22,5

INTERPRETAÇÃO DOS RESULTADOS Obtivemos um P-value ligeiramente inferior a 0,15, que é maior que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. CONCLUSÃO Há evidências estatísticas para se aceditar a Resistência à Ruptura dos pinos seja normalmente distribuída.

3 - Inferência Estatística para uma Duas Amostras
Agora iremos expandir os resultados anteriormente obtidos para comparações entre duas populações independentes.

3.1 - Inferência Sobre Diferença de Médias
No MINITAB 14, temos apenas 2 aplicações: quando as variâncias são desconhecidas e iguais e quando as variâncias são desconhecidas e diferentes. Devemos considerar que as 2 populações de interesse sejam normalmente distribuídas e independentes.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e Iguais
=σ .
2

Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ12 = σ22 De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ1 – µ2 = ∆0 (ou ≥) H1: µ1 – µ2 < ∆0

(2) H0:µ1 – µ2 = ∆0 (ou ≤) H1: µ1 – µ2 = ∆0

(3) H0: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0

A estatística de testes a ser utilizada é:

onde
Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n+m-2}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n+m-2}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n+m-2}. Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 5
Proposta: Testar a diferença entre as médias de duas poluações. Problema: Dois catalisadores estão sendo analisados para determinar como eles afetam o rendimento médio de um processo químico. Especificamente, o catalisador 1 está correntemente um uso, mas o catalisador 2 aceitável. Já que o catalisador 2 é mais barato, ele deve ser adotado se não alterar o rendimento do processo. Um teste é feito em uma planta piloto. Há alguma diferença entre os rendimentos médios? Considere as variâncias iguais. Nesse caso, as hipóteses a serem testadas são: H0: µ1 – µ2 = 0 H1: µ1 – µ2 ≠ 0 → → H0: µ1 = µ2 H1: µ1 ≠ µ2

A região crítica será: Rc = {│T│> t 0,025; 14} => Rc = {│T│> 2,145}. Ferramentas: 2-Sample T Fonte de dados: TH2.mpj 2-SAMPLE T

1. Abra o arquivo TH-2 2. Selecione Static > Basic Statics > 2-Sample T 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB
Two-Sample T-Test and CI: Catalisador 1; Catalisador 2
Two-sample T for Catalisador 1 vs Catalisador 2 N 8 8 Mean 92,26 92,73 StDev 2,39 2,98 SE Mean 0,84 1,1

Catalisador 1 Catalisador 2

Difference = mu (Catalisador 1) - mu (Catalisador 2) Estimate for difference: -0,477500 95% CI for difference: (-3,373886; 2,418886) T-Test of difference = 0 (vs not =): T-Value = -0,35 Both use Pooled StDev = 2,7009

P-Value = 0,729

DF = 14

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1.

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o rendimento médio do processo químico, assim seu rendimento pode ser considerado como igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode substituir o catalisador 1 nessa indústria. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µ1 – µ2; 0,95) = (-3,373886; 2,418886) A interpretação é que temos 95% de chances de encontrarmos diferenças entre o rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do processo químico utilizando ambos catalisadores seja aproximadamente iguais.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e Diferentes
Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ12 ≠ σ22. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses: (1)H0: µ1 – µ2 = ∆0 (ou ≥) H1: µ1 – µ2 < ∆0 (2) H0:µ1 – µ2 = ∆0 (ou ≤) H1: µ1 – µ2 = ∆0 (3) H0: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0

A estatística de testes a ser utilizada é:

onde
Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; ν}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; ν }; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; ν }. Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 6
Proposta: Problema: Considere o exemplo anterior, mas agora temos variâncias diferentes. Nesse caso, as hipóteses a serem testadas são: H0: µ1 – µ2 = 0 → H0: µ1 = µ2 H1: µ1 – µ2 ≠ 0 → H1: µ1 ≠ µ2 A região crítica será: Rc = {│T│> t 0,025; 13} => Rc = {│T│> 2,16}. Ferramentas 2-Sample T Fonte de dados: TH-2.mpj 2 – SAMPLE T 1. Abra o arquivo TH-2; 2. Selecione Static > Basic Statics > 2-Sample T; 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB
Two-Sample T-Test and CI: Catalisador 1; Catalisador 2
Two-sample T for Catalisador 1 vs Catalisador 2 N 8 8 Mean 92,26 92,73 StDev 2,39 2,98 SE Mean 0,84 1,1

Catalisador 1 Catalisador 2

Difference = mu (Catalisador 1) - mu (Catalisador 2) Estimate for difference: -0,477500 95% CI for difference: (-3,394928; 2,439928) T-Test of difference = 0 (vs not =): T-Value = -0,35

P-Value = 0,729

DF = 13

INTERPRETAÇÃO DOS RESULTADOS

Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. Conclusão

Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o rendimento médio do processo químico, assim seu rendimento pode ser considerado como igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode substituir o catalisador 1 nessa indústria. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µ1 – µ2; 0,95) = (-3,394928; 2,439928) A interpretação é que temos 95% de chances de encontrarmos diferenças entre o rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do processo químico utilizando ambos catalisadores seja aproximadamente iguais.

3.2 - Teste t Emparelhado
É um caso especial de testes t para duas amostras onde X e Y são variáveis que representam a primeira e a segunda medição de uma característica de interesse. Nesse caso, espera-se que exista alguma correlação entre essas duas medições. Para cada par de medições deve-se calcular a diferença entre as Y e X: Di = Yi - Xi Supõe-se que Di ~ N(µD, σD2), onde µD = µY – µX e σD2 é a variância de Di (desconhecida). (1)H0: µD = ∆0 (ou ≥) H1: µD < ∆0 Que equivale a: (1)H0: µY – µX = ∆0 (ou ≥) H1: µY – µX < ∆0 A estatística de teste utilizada é: (2) H0: µD = ∆0 (ou ≤) H1: µD = ∆0 (2) H0: µY – µX = ∆0 (ou ≤) H1: µY – µX = ∆0 (3) H0: µD = ∆0 H1: µD ≠ ∆0 (3) H0: µY – µX = ∆0 H1: µY – µX ≠ ∆0

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}. Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 7
Proposta: Testar a diferença entre as médias de duas populações, quando as populações forem dependentes. Problema: Um artigo no Journal of Strain Analysis (1983, Vol.18, N°2) compara vários métodos para predizer a resistência de cisalhamento para traves planas metálicas. Dados para dois desses métodos, os procedimentos de Karlsruhe e Lehigh, quando aplicados a nove traves específicas, são mostrados a seguir. Considere os dados como normalmente distribuídos. Nesse caso, as hipóteses a serem testadas são: H0: µK – µL = 0 → H0: µD = 0 H1: µK – µL ≠ 0 → H1: µD ≠ 0 A região crítica será: Rc = {│T│> t 0,025; 8} => Rc = {│T│> 2,306}. Ferramentas Paired t Arquivo de dados: TH-3.mpj PAIRED T 1. Abra o arquivo TH-3; 2. Selecione Static > Basic Statics > Paired t; 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK;

SAÍDA DO MINITAB
Paired T-Test and CI: Método de Karlsruhe; Método de Lehigh
Paired T for Método de Karlsruhe - Método de Lehigh N 9 9 9 Mean 1,34011 1,06622 0,273889 StDev 0,14603 0,04938 0,135099 SE Mean 0,04868 0,01646 0,045033

Método de Karlsr Método de Lehigh Difference

95% CI for mean difference: (0,170042; 0,377736) T-Test of mean difference = 0 (vs not = 0): T-Value = 6,08

P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 6,08. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value aproximadamente igual a 0, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0. CONCLUSÃO Não há evidências estatísticas para considerarmos que dois os métodos de previsão da resistência não forneçam resultados iguais. Os dados indicam que o método de Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(µD; 0,95) = (0,170042; 0,377736) A interpretação é que temos 95% de chances de encontrarmos diferenças nas previsões da resistência dos que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima não contém o 0, podemos concluir que as previsões de resistência utilizando os 2 métodos são diferentes. Como o intervalo é positivo, concluímos que o método de Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh.

3.3 - Inferência sobre as Variâncias de Duas Populações Normais
Devemos supor que as duas populações de origem sejam normais e independentes distribuídas, com médias µ1 e µ2, com variâncias σ12 e σ22. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses: H0: σ12 = σ22 H1: σ12 ≠ σ22 → → H0: σ12/ σ22 = 1 H1: σ12/ σ22 ≠ 1

A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos a seguinte região crítica: - Rc = { F > f 0,025; n – 1; m -1 ou F < f 0,975; n – 1; m -1}.

Figura 3 – Gráficos da estatística de teste, com suas respectivas regiões críticas Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

Onde

EXEMPLO 8
Proposta: Problema: Considere os exemplos 6 e 7, agora iremos testar se as variâncias dos rendimentos ao se utilizar os catalisadores 1 e 2 são iguais. Adote um nível de 5% de significância. Nesse caso, as hipóteses a serem testadas são: H0: σ12 = σ22 → H1: σ12 ≠ σ22 → A região crítica será: Rc = { F < f 0,975; 7; 7 ou F > f 0,025; 7; 7 }. H0: σ12/ σ22 = 1 H1: σ12/ σ22 ≠ 1

Rc = { F < 0,200204 ou F> 4,994909 } Ferramentas 2 Variances Fontes de dados: TH-2.mpj 2 VARIANCES 1. Abra o arquivo TH-2 2. Selecione Static > Basic Statics > 2 Variances 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options 5.Preencha o quadro de acordo com a figura seguinte

6. Clique em OK

SAÍDA DO MINITAB
Test for Equal Variances: Catalisador 1; Catalisador 2
95% Bonferroni confidence intervals for standard deviations N 8 8 Lower 1,49210 1,86648 StDev 2,38502 2,98345 Upper 5,46285 6,83355

Catalisador 1 Catalisador 2

F-Test (normal distribution) Test statistic = 0,64; p-value = 0,569

Levene's Test (any continuous distribution) Test statistic = 0,31; p-value = 0,589

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 0,64. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um Pvalue igual a 0,569, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas para considerarmos as variâncias dos rendimentos do processo utilizando os catalisadores 1 e 2 sejam iguais. UTILIZANDO O INTERVALO DE CONFIANÇA

Analisando o gráfico dos intervalos de confiança para os catalisadores 1 e 2, podemos ver que o ponto central do intervalo de confiança do catalisador 1 está dentro dos limites do intervalo de confiança do catalisador 2 e vice-versa, logo, podemos considerar que as variâncias dos catalisadores 1 e 2 sejam iguais.

3.3 Inferência sobre Proporções de Duas Populações
Freqüentemente, é necessário comparar proporções de duas populações distintas, onde há 2 parâmetros binomiais de interesse: p1 e p2. Para amostras grandes, podemos fazer a aproximação da binomial pela normal. As hipóteses a serem testadas são: (2)H0: p1 - p2 = 0 (ou ≤) (1)H0: p1 - p2 = 0 (ou ≥) H1: p1 - p2 < 0 H1: p1 - p2 > 0 Nesse caso, a estatística de testes a ser utilizada é: (3) H0: p1 - p2 = 0 H1: p1 - p2 ≠ 0

Onde Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}. Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α O Intervalo de confiança no caso bilateral será:

EXEMPLO 9
Proposta: Problema: Dois tipos diferentes de solução de polimento estão sendo avaliados para possível uso em uma operação de polimento na fabricação de lentes intra-oculares usadas no olho humano depois de uma operação de catarata. Trezentas lentes foram polidas usando a primeira solução de polimento e desse número, 235 não tiveram defeitos induzidos pelo polimento. Outras 300 lentes foram polidas, usando a segunda solução depolimento, sendo 196 lentes

consideradas satisfatória. Há qualquer razão para acreditar que a primeira solução de polimento seja melhor que a segunda? Adote α=0,05. Tem-se interesse em testar as seguintes hipóteses: Temos a seguinte Hipótese: H0: p1 - p2 = 0 → H0: p1 = p2 H1: p1 - p2 > 0 → H1: p1 > p2 A região crítica será: Rc = {│ Z│ < 1,645} Ferramentas 2-Proportion Fonte de dados:

2 – PROPORCION 1. Abra o MINITAB 14; 2. Selecione Static > Basic Statics > 2-Proportion 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options; 5. Preencha o quadro de acordo a figura seguinte:

6. Clique em OK

SAÍDA DO MINITAB
Test and CI for Two Proportions
Sample 1 2 X 253 196 N 300 300 Sample p 0,843333 0,653333

Difference = p (1) - p (2) Estimate for difference: 0,19 95% lower bound for difference: 0,133131 Test for difference = 0 (vs > 0): Z = 5,36

P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 5,36. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Obtivemos um P-value igual a 0,000, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que a primeira solução tenha um desempenho superior ao da segunda lente. A proporção de lentes sem defeitos que foram polidas com a primeira solução é maior que a proporção de lentes sem defeitos polidas com a segunda solução. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança: IC(p1 – p2; 0,95) = ( ≥ 0,133131)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre a proporção de lentes sem defeitos utilizando a primeira solução e a utilizando a segunda solução sejam no mínimo iguais a 0,133131.

Sign up to vote on this title
UsefulNot useful