You are on page 1of 10

Trabalho de Estatstica:

MINITAB




















Toledo, Julho de 2011.







Qumica Bacharelado
Disciplina de Estatstica Qumica


1) Os dados abaixo se referem a meses de experincia (x), e o nmero de erros
cometidos (y) por 12 datilgrafos, ao executarem um mesmo texto.

Meses (x) 1 2 3 4 5 6 7 8 9 10 11 12
Erros(Y) 29 28 23 20 19 18 14 13 10 7 4 2

(a) Admitindo que o modelo linear o adequado, qual seria a equao da reta
ajustada?
A equao da reta ajustada para o modelo linear a seguinte:
Erros(Y) = 31,42 - 2,437 Meses(X)

(b) Determine o coeficiente de correlao.
O coeficiente de correlao linear (r), entre os meses de experincia e o
nmero de erros cometidos pelos datilgrafos : r = -0,994. O coeficiente se
aproxima de -1, significando que h uma correlao negativa perfeita entre as
duas variveis.

(c) um bom ajuste? Caso contrrio proponha um outro modelo.

considerado um bom ajuste, pois, de acordo com o diagrama de
disperso dos dados observou-se que estes esto dispostos de maneira que se
aproximam de uma reta.
Como o coeficiente linear se aproxima de | 1 |, o R
2
indica a variabilidade
dos dados, a qual, tem valor de 98,9%.



Fig.1- Diagrama de disperso de erros em funo de meses.

2) Os dados abaixo mostram a concentrao de plncton (CP) dependente da
transparncia (T) da gua

CP (Y) 51 47 71 68 52 100 111 150 120 42
T (X)

22 25 11 8 15 6 6 4 5 26

a) Faa o diagrama de disperso
Meses(X)
E
r
r
o
s
(
Y
)
12 10 8 6 4 2 0
30
25
20
15
10
5
0
S 0,979808
R-Sq 98,9%
R-Sq(adj) 98,8%
Fitted Line Plot
Erros(Y) = 31,42 - 2,437 Meses(X)


Fig.2- Diagrama de disperso, Cp x T.


b) Encontre uma transformao que linearize os dados. Faa o diagrama de
disperso dos dados transformados.


Fig.3- Dados linearizados. Diagrama de disperso ln(Cp) x ln(T).
T(X)
C
P
(
Y
)
25 20 15 10 5
150
125
100
75
50
Scatterplot of CP(Y) vs T(X)
ln(X)
l
n
(
Y
)
3,5 3,0 2,5 2,0 1,5
5,0
4,8
4,6
4,4
4,2
4,0
3,8
3,6
Scatterplot of ln(Y) vs ln(X)



c) Ajuste o modelo aos dados transformados e encontre qual seria a concentrao
de plncton (CP) para uma transparncia (T) de 12 ?
Fazendo uso do modelo transformado, a equao da reta fica:
ln(Y) = 5,741 - 0,6147 ln(X)
Se, T=12
ln(Y) = 5,741 - 0,6147 ln(12)
ln(Y) = 5,741 1,527472118
ln(Y) = 4,213527882
Y= 67,59 ~ 67,6

Portanto, para T=12 a concentrao de plncton de 67,6.

3) Em uma indstria qumica so coletados dados de referentes ao teor de cobre de
uma das solues efluentes de um dos processos da empresa. A determinao do
teor do cobre feita por meio do emprego de um espectrofotmetro de absoro
atmica. Para que o espectrofotmetro de absoro atmica pudesse ser utilizado,
foi necessrio determinar a forma de relacionamento entre a absorbncia (varivel
resposta) medida diretamente pelo aparelho e o teor de cobre da soluo (varivel
preditora). Com este objetivo, os tcnicos da indstria utilizaram uma srie de
amostras da soluo efluente para as quais a concentrao era conhecida
(padres). Estes padres de calibrao foram a seguir medidos no aparelho sob
as mesmas condies que seriam utilizadas subseqentemente para medir as
amostras de concentrao desconhecida. Os dados obtidos so apresentados na
tabela 01.

Tabela 01: Medidas de absorbncia obtidas em solues com concentrao de
cobre conhecida.
Teor de cobre (g/ml) (X) Absorbncia (unidades de absorbncia) (Y)
2 9
3 15
4 20
5 23
6 29
7 35
8 38

a) A partir da tabela 01 construa um diagrama de disperso para os dados coletados
no estudo.



Fig.4- Diagrama de disperso Abs(Y) x Teor de Cu(X).

b) Por meio do emprego da anlise de regresso obtenha a curva de calibrao a
partir dos dados coletados.

Teor Cu (X)
A
b
s

(
Y
)
8 7 6 5 4 3 2
40
35
30
25
20
15
10
Scatterplot of Abs (Y) vs Teor Cu (X)


Fig.5- Anlise de regresso dos dados.

c) Avalie a adequao do modelo de regresso ajustado aos dados coletados em
estudo (anlise grfica de resduos, teste para validao da normalidade e R
2
).
Quais so suas concluses?




















x
y
8 7 6 5 4 3 2
40
35
30
25
20
15
10
S 0,925820
R-Sq 99,4%
R-Sq(adj) 99,2%
Fitted Line Plot
y = - 0,1429 + 4,857 x
Anlise grfica de resduos:



Fig.6- Analise grfica de resduos.



Fig.7- Diagrama de disperso de resduos x fits(x).

RESI1
P
e
r
c
e
n
t
4 3 2 1 0 -1 -2 -3 -4
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean
0,711
-6,09037E-15
StDev 0,8452
N 7
AD 0,226
P-Value
Probability Plot of RESI1
Normal - 95% CI
FITS1
R
E
S
I
1
40 35 30 25 20 15 10
1,0
0,5
0,0
-0,5
-1,0
Scatterplot of RESI1 vs FITS1
Teste de Normalidade:

Os testes de hipteses conhecidos como testes de normalidade tm as
seguintes hipteses:
-H
0
: Dados possuem distribuio normal;
-H
1
: Dados no possuem distribuio normal.

O primeiro grfico apresenta um valor de AD=0,161, que corresponde
estatstica de Anderson-Darling. Calculando e comparando a estatstica teste com
o valor fornecido, usa-se a anlise de p-valor. Como o p-valor deste teste (p-
value=0,711) maior que o nvel de significncia com o qual se est trabalhando
( ), H
0
no rejeitada ao nvel de 5%. Comprovando que os erros
apresentam uma distribuio normal.

Sendo,R
2
= 99,4%, o que significa que o modelo consegue explicar 99,4% da
variabilidade dos dados.

Pode-se concluir ento, que o modelo utilizado adequado.


d) Suponha que tenha sido obtida uma nova observao (y
0
=19) para a absorbncia.
Determine uma estimativa pontual para o teor de cobre correspondente ao
resultado.
A equao da reta obtida para os dados experimentais foi:
Abs (Y) = - 0,1429 + 4,857 Teor Cu (X)
Dessa forma estima-se que o teor de cobre para uma absorbncia de 19 :
19 = - 0,1429 + 4,857 Teor Cu (X
19 + 0,1429 = 4,857TeorCu(X)
19,1429 / 4,857 = TeorCu(X)
TeorCu(X) = 3,9413 g/ml

4) As tabelas abaixo fazem parte da sada de uma anlise de regresso realizada
pelo MINITAB.
05 , 0


Predictor Coef Stdev t-ratio P
Constant 83.074 6.593 12.6 0.000
X -1.1848 0.1258 -9.42 0.000

Source DF SS MS F P
Regression 1 1021.1 1021.1 88.68 0.000
Error 7 80.6 11.5
Total 8 1101.6

a) Escreva a equao da reta ajustada.
Equao da reta ajustada: y = 83,07 1,1848 . x

b) Teste
1
=0 contra
1
0 . Use =5%.
O valor de F tab limita as regies de rejeio e de no-rejeio.




Ftab(1,7; 0,05) = 5,59

Como ,Ho rejeitado com 5% de significncia, indicando que

1
significativo para os dados, isto tambm comprovado pelo p-valor deste
teste ser igual a zero.

c) O modelo adequado? Justifique sua resposta



Sim. Pois o modelo consegue explicar 92,68% da variabilidade dos dados.

d) Quais so as suposies do modelo.
Supe-se que os erros possuem variveis aleatrias independentes,
possuem distribuio normal e tm varincia constante.