You are on page 1of 91

MI ISTRIO DA EDUCAO U IVERSIDADE FEDERAL DO PIAU CE TRO DE CI CIAS DA ATUREZA DEPARTAME TO DE QUMICA

ESTATSTICA APLICADA QUMICA

Prof. Dr. Alexandre Araujo de Souza

Teresina PI 2010-2

SUMRIO
ASSUNTO 1. Conceitos Fundamentais em Estatstica. Organizao de dados quantitativos. Estatstica descritiva. Populao e amostra. Distribuies de frequncias. Tabelas. Grficos. Histogramas. Medidas de tendncia central e de disperso: mdia, mediana, moda, varincia, desvio-padro. Freqncia relativa e probabilidade. 2. Aplicao da Matemtica Estatstica. Varivel aleatria. Distribuies de probabilidade. A distribuio normal. Esperana. Varincia. Distribuio amostral das mdias. Estatstica inferencial. Teste de hipteses. Hiptese nula. Testes unilaterais e bilaterais. Erros do tipo I e do tipo II. Nvel de significncia. Teste Z. Teste t. Teste F. Intervalos de confiana. 3. Mtodos Grficos e Numricos. Diagramas de disperso. Correlao linear. Coeficiente de correlao de Pearson, r. Coeficiente de determinao, r2. Teste de hipteses sobre a correlao. Regresso linear simples. Mtodo dos mnimos quadrados. Anlise de resduos. 4. Fontes de Erro em Anlise Qumica. Algarismos significativos. Erro e desvio de uma medida. Exatido e preciso. Tipos de erros: determinados e indeterminados. Preciso de uma medida. Limite de confiana da mdia. Propagao de erros. Rejeio de resultados: teste Q. Amostragem. Padronizao. Calibrao. Validao. Certificao da qualidade. CARGA HORRIA

04 h

12 h

04 h

10 h

Captulo 1. Conceitos Fundamentais em Estatstica.

Introduo

Estatstica a cincia que faz uso efetivo dos dados numricos relativos a grupos de indivduos ou experimentos. Nesse sentido, ela trata de todos os aspectos, incluindo no s a coleta, organizao, anlise e interpretao dos dados, mas tambm o planejamento da coleta de dados. Importante dizer que todos os mtodos estatsticos baseiam-se na teoria das probabilidades. A Estatstica bastante til para orientar a tomada de decises baseada na anlise de um nmero muito grande de dados, tal como pesquisas de opinio pblica e de mercado. A palavra estatstica tambm pode ser usada para significar o prprio conjunto de dados, ou as grandezas a ele associadas, tais como a mdia e o desvio-padro. Assim, num conjunto de dados, podemos dizer que a mdia uma estatstica. A etimologia, ou origem da palavra Estatstica, mostra que ela deriva da palavra Estado. De fato, a expresso em Latim Moderno, statisticum collegium (conselho de Estado) e a palavra em Italiano, statista (homem de Estado, Poltico), fizeram com que o filsofo alemo Gottfried Achenwall (1719-1772) introduzisse o termo em Alemo, Statistik, em 1749, significando anlise dos dados sobre o Estado. Assim, a Estatstica foi originalmente desenvolvida para resolver questes de Estado, tais como taxas de nascimento e de mortalidade, impostos, heranas, fortunas, etc. Apesar de sua origem peculiar, a Estatstica hoje utilizada nas mais diversas reas. Ela est presente nas teorias mais fundamentais da Fsica Moderna, como a Mecnica Quntica, e hoje se sabe que a natureza das partculas fundamentais governada por leis estatsticas. Nas reas de Sade, a Estatstica conhecida como Bioestatstica. O nome pode ser diferente, mas os mtodos so os mesmos, sendo apenas as aplicaes especficas para as reas de Sade. A Qumica utiliza bastante a Estatstica, em suas diversas reas. Entretanto, a rea que mais faz uso da Estatstica a Qumica Analtica. Nesse sentido, a compreenso da teoria de erros e da obteno de retas de regresso, pelo mtodo dos mnimos quadrados, esto entre os pontos mais relevantes. Reconhecer os tipos de erros em anlises qumicas, saber como a propagao dos erros e como eles afetam o resultado de suma importncia para o qumico. As retas de regresso so bastante usadas nas curvas de calibrao, empregadas em diversas tcnicas de anlises quantitativas.

Populao e Amostra

Populao o conjunto de todos os elementos, ou resultados, do grupo em que estamos interessados em estudar alguma caracterstica. Um exemplo so todos os brasileiros do sexo feminino. Elas constituem uma populao, caso queiramos estudar alguma caracterstica delas, por exemplo, a estatura. Outro exemplo, se formos fabricantes de postes de concreto para iluminao e tivermos de testar a resistncia ruptura dos postes, para atender s normas tcnicas, ento toda a produo ser a nossa populao. Repare que, coletar os dados de uma populao, muitas vezes invivel, pois o custo muito alto, como no caso da pesquisa com todas as brasileiras. Em outros casos, a coleta de dados da populao destruiria toda a populao, como no caso dos postes de concreto para iluminao. O ensaio de resistncia trao danifica os postes. No sensato realizar esse experimento na populao, pois se trata de toda a sua produo. Uma populao pode ser finita ou infinita. Nos casos acima, as populaes so finitas. Se uma moeda jogada uma nica vez, a populao, P constituda pelo conjunto de todos os resultados possveis, ou seja, P = {cara;coroa}. Se uma moeda jogada duas vezes, a populao, P constituda pelo conjunto de todos os resultados possveis, ou seja, P = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}. Nesses dois exemplos, as populaes so finitas. No primeiro caso, a populao tem 21 = 2 (dois) elementos. No segundo caso, a populao tem 22 = 4 (quatro) elementos. Entretanto, considere uma moeda sendo jogada vrias vezes, indefinidamente. A cada jogada, d cara ou coroa. A populao, nesse caso infinita, pois consiste nas infinitas possibilidades de resultados possveis. Se uma moeda for jogada n vezes, o tamanho da populao ser dado por 2n.
Exerccio Resolvido. Se uma moeda for jogada trs vezes (n=3), primeiro calcule o tamanho da populao e depois escreva o conjunto de resultados P que representa a populao. Resoluo: Tamanho da populao = 23 = 8 (oito) P = {cara/cara/cara; cara/cara/coroa; cara/coroa/cara; coroa/cara/cara; coroa/cara/coroa; coroa/coroa/cara; cara/coroa/coroa; coroa/coroa/coroa}

Amostra um subconjunto de uma populao. uma frao de elementos, coletada da populao, para fins de anlise. Os dados geralmente so coletados a partir de amostras. Esse processo de coleta de dados denominado amostragem. A amostra deve ser representativa da populao. Por exemplo, se resolvermos pesquisar apenas brasileiras de uma cidade onde a mdia das mulheres mais alta que a mdia nacional, ento chegaremos concluso errada de que a mulher brasileira mais alta do que realmente . Esse um exemplo de uma amostra que no representativa. Uma amostra representativa deve conter brasileiras de diversas cidades, de regies bem distintas do Brasil, com estaturas mdias bastante variadas. No caso da produo de postes de concreto para iluminao, apenas uma pequena frao da produo (amostra) dever ser sacrificada para atender norma tcnica. No caso de uma moeda que foi jogada apenas duas vezes (n=2), apesar do tamanho da populao ser pequeno (22=4), a quantidade de amostras possveis bem grande, pois cada subconjunto uma amostra. S para se ter uma idia, e lembrando que o conjunto vazio { }, bem como o conjunto todo, so sempre subconjuntos de qualquer conjunto, podemos escrever aqui apenas algumas das amostras possveis para essa pequena populao: P={cara/cara; cara/coroa; coroa/cara; coroa/coroa}. Teremos amostras com zero, um, dois, trs e quatro elementos. O tamanho da amostra o nmero de elementos da amostra. Este exemplo foi colocado para ilustrar que h sempre uma enorme quantidade de amostras, para qualquer populao. Amostras (subconjuntos) possveis para uma populao onde uma moeda foi jogada duas vezes: A01 = { } A02 = {cara/cara} A03 = {cara/coroa} A04 = {coroa/cara} A05 = {coroa/coroa} A06 = {cara/cara; cara/coroa} A07 = {cara/cara; coroa/cara} A08 = {cara/cara; coroa/coroa} A09 = {cara/cara; cara/coroa; coroa/cara} A10 = {cara/cara; cara/coroa; coroa/coroa}

Afinal = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}.

Organizao de Dados Quantitativos

Os dados quantitativos so representados por nmeros e so denominados variveis aleatrias. Para se utilizar a Estatstica, os dados devem ser organizados em tabelas e grficos. O exemplo a seguir trata da anlise de ons cloreto [Cl] da gua tratada em um municpio brasileiro. Os valores das concentraes de cloreto na gua, medidos em 25 coletas so apresentados abaixo, em mg/L. Concentraes de ons cloreto [Cl] medidas em 25 coletas de gua tratada em um municpio brasileiro. As unidades esto em mg/L. 254 253 253 252 252 252 251 251 251 251 250 250 250 250 250 249 249 249 249 248 248 248 247 247 246 Os dados acima esto desorganizados. Vamos coloc-los na forma de uma tabela. A Tabela 1 apresenta os dados obtidos de forma organizada, colocando para cada valor obtido, a frequncia absoluta, f com que ele observado. Por exemplo, o valor 250 foi observado em 5 (cinco) coletas. Portanto, a frequncia absoluta do valor 250 f = 5. A frequncia relativa, fr representa a frao que o valor observado. Por exemplo, o valor 250 observado numa frao de fr = 0,20. Ou seja, em 20% das observaes. A frequncia relativa, fr calculada dividindo-se a frequncia absoluta , f pelo tamanho da amostra, N. = Tabela 1. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa. [Cl] f fr 246 1 0,04 247 2 0,08 248 3 0,12 249 4 0,16 250 5 0,20 251 4 0,16 252 3 0,12 253 2 0,08 254 1 0,04

A somatria de todas as frequncias absolutas numericamente igual ao tamanho da amostra. Podemos ver isso no exemplo da Tabela 1, fazendo a conta: 1+2+3+4+5+4+3+2+1 = 25 Essa igualdade representada pela equao abaixo, onde foi utilizado o smbolo de somatria, representado pela letra grega sigma maiscula, . = A somatria de todas as frequncias relativas numericamente igual unidade. Podemos ver isso no exemplo da Tabela 1, fazendo a conta: 0,04 + 0,08 + 0,12 + 0,16 + 0,20 + 0,16 + 0,12 + 0,08 + 0,04 = 1 Essa igualdade representada pela equao abaixo, onde foi utilizado o smbolo de somatria, representado pela letra grega sigma maiscula, .

=1 Os dados da Tabela 1 podem ser visualizados na forma grfica. Uma forma bastante usual o histograma de frequncias. Nesse grfico, a grandeza medida, ou varivel aleatria, colocada no eixo horizontal (abscissa) e a frequncia absoluta, ou a relativa, no eixo vertical (ordenada). A Figura 1 mostra o histograma de frequncias para os dados da Tabela 1.

0,20

0,15

fr

0,10

0,05

0,00 246 247 248 249 250 251 252 253 254

[Cl ]/mg/L

Figura 1. Histograma de frequncias para os dados da Tabela 1.

Observa-se, no histograma de frequncias da Figura 1, que a distribuio dos valores da varivel aleatria simtrica em relao a um valor central, igual a 250 mg/L. Esse comportamento compatvel com um tipo de distribuio de probabilidade que ser visto mais adiante, denominada distribuio normal.

Medidas de Tendncia Central

Um conjunto de dados pode ser representado por um nico nmero, denominado mdia. Trata-se de uma medida de tendncia central cujo significado vai ficar mais claro medida que os exemplos forem sendo dados. Considere o seguinte conjunto de dados: x1 = 40 x2= 41 x3 = 42 x4 = 43 x5 = 44 x6 = 45

A mdia aritmtica simples de um conjunto de dados, ou simplesmente mdia definida pela soma entre todos os elementos do conjunto, com a subsequente diviso pelo nmero de elementos do conjunto. Se o conjunto de dados for uma populao, a mdia populacional representada pela letra grega mi minscula, . Caso o conjunto de dados seja uma amostra, a mdia amostral representada pela por um pessoa que est fazendo a estatstica dos dados. Vamos considerar que os dados acima sejam uma amostra. Ento a mdia amostral ser dada por: = = 1 6 + + + + + com uma barra em cima, . Quem vai determinar se o conjunto de dados uma populao ou uma amostra a

1 40 + 41 + 42 + 43 + 44 + 45 6

= 42,5

1 255 6

A frmula geral da mdia aritmtica simples dada pelas equaes abaixo, onde o i que aparece denominado ndice e um nmero inteiro que varia, por exemplo, de 1 a n, no caso de uma populao, ou seja: i = 1, 2, 3, ..., n...

Frmula para a mdia populacional. O tamanho da populao n.

Frmula para a mdia amostral. O tamanho da amostra N.

No caso de dados, como os da Tabela 1, em que temos as frequncias, o clculo da mdia pode ser feito de uma das seguintes formas:

Frmula para a mdia amostral, usando as frequncias absolutas, tamanho da amostra N.

. O

Frmula para a mdia amostral, usando as frequncias relativas, caso, no preciso dividir pelo tamanho da amostra.

Neste

Faamos os clculos com os dados da Tabela 1, das duas formas. Primeiro usando as frequncias absolutas:
1 1 246 + 2 247 + 3 248 + 4 249 + 5 250 + 4 251 + 3 252 + 2 253 + 1 254 25 = 1 6250 25 = 250

Agora, refaamos o clculo da mdia, usando as frequncias relativas:


= 0,04 246 + 0,08 247 + 0,12 248 + 0,16 249 + 0,20 250 + 0,16 251 + 0,12 252 = 250 + 0,08 253 + 0,04 254

Observem que os valores calculados para as mdias foram o mesmo, pelos dois mtodos, ou seja, obteve-se uma mdia de

ons cloreto na gua tratada desse municpio brasileiro. Olhando para o histograma de

= 250 mg/L para a concentrao de

frequncias da Figura 1, vemos que esse valor coincide com o valor central da distribuio de frequncias. Para uma distribuio simtrica como essa, a mdia coincide com o valor central da distribuio. Isso ocorre na distribuio normal, a qual ser vista mais adiante. Por esta razo, a mdia considerada uma medida de tendncia central. Outras medidas de tendncia central so a moda e a mediana. A moda simplesmente o valor da varivel que possui a maior frequncia. No caso dos dados da Tabela 1, a moda 250 mg/L, pois o valor que possui a maior frequncia.

A mediana o valor central, que divide o conjunto de dados em partes iguais. Os valores dos dados devem ser previamente colocados em ordem crescente. Sendo N o tamanho da amostra, a posio da mediana pode ser encontrada pela equao abaixo. = +1 2

Considere o seguinte conjunto, com um nmero mpar de dados (N=11): 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 A posio da mediana ser: (11+1)/2 = 6 lugar. O valor da mediana ser 45.

Considere, agora, o seguinte conjunto, com um nmero par de dados (N=10): 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 A posio da mediana ser: (10+1)/2 = 5,5. Isso significa que a mediana est entre o 5 e o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que esto no 5 e no 6 lugar. Logo, o valor da mediana ser (44+45)/2 = 44,5. A mediana bastante til quando temos um valor muito discrepante dos demais. Por exemplo, as vendas de hambrguer numa lanchonete foram medidas num perodo de 10 dias. Entretanto, em um determinado dia, no 4 dia, houve uma grande festa na lanchonete e a venda foi muito mais alta. Vejamos os dados na Tabela 2.

Tabela 2. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em um perodo de 10 dias. Dia Vendas 1 48 2 47 3 52 4 320 5 50 6 45 7 46 8 53 9 44 10 49

Vamos calcular a mdia para os dados acima:


1 48 + 47 + 52 + 320 + 50 + 45 + 46 + 53 + 44 + 49 10 = = 75,4 1 754 10

Vamos calcular a mediana, agora. Mas, para isso, primeiro temos que colocar os dados em ordem crescente, na Tabela 3.

Tabela 3. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em um perodo de 10 dias. Dados colocados em ordem crescente. Dia Vendas 9 44 6 45 7 46 2 47 1 48 10 49 7 50 3 52 8 53 4 320

A posio da mediana ser: (10+1)/2 = 5,5. Ento, a mediana est entre o 5 e o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que esto no 5 e no 6 lugar, na Tabela 3. Logo, o valor da mediana ser (48+49)/2 = 48,5. A mdia 75,4 e a mediana, 48,5. Qual dessas duas medidas reflete melhor as vendas dirias da lanchonete? bvio que a mediana. E sabe por qu? Porque a mediana no afetada por valores extremos. J o valor da mdia ficou bem alto, justamente por causa do valor extremo, 320. Nem sempre a mdia a melhor medida.

Medidas de Disperso

A disperso de um conjunto de dados pode ser representado por um nico nmero, denominado varincia cujo significado vai ficar mais claro medida que os exemplos forem sendo dados. A varincia calculada de forma diferente, caso o conjunto de dados seja uma populao, ou uma amostra. E lembre-se que a pessoa que est fazendo a estatstica dos dados que vai determinar se o conjunto de dados uma populao ou uma amostra.

Frmula para a varincia populacional, var(x)= 2. A varincia populacional representada pelo quadrado da letra grega sigma minscula, . O tamanho da populao n.

Frmula para a varincia amostral. A varincia amostral representada pelo quadrado da letra romana s minscula. O tamanho da amostra N.

1 1

A varincia tem o significado de ser uma mdia dos quadrados dos desvios entre cada valor e a mdia amostral, ou populacional. Se todos esses desvios fossem zero, = 0, a varincia seria zero. Verifique que, se o tamanho

da amostra for muito grande, no far diferena usar N1 ou N no denominador da ltima equao para s2. A diferena s relevante para amostras pequenas.

Considere o seguinte conjunto de dados abaixo, cuja mdia 42,5. x1 = 40 x2= 41 x3 = 42 x4 = 43 x5 = 44 x6 = 45

Se o conjunto de dados acima for uma populao de media =42,5 e tamanho n=6, ento a varincia populacional calculada da seguinte forma:
1 40 42,5 6

+ 41 42,5

+ 42 42,5 =

= 2,91666

1 17,5 6

+ 43 42,5

+ 44 42,5

+ 45 42,5

Se o conjunto de dados acima for uma amostra de media N=6, ento a varincia amostral calculada da seguinte forma:
1 61

= 42,5 e tamanho

40 42,5

+ 45 42,5

+ 41 42,5 =

+ 42 42,5 1 17,5 5

+ 43 42,5

+ 44 42,5

= ,

Existe uma frmula prtica para calcular a varincia populacional, que a seguinte. = = 42,5

fcil obter o valor de O valor de

= 1806,25.

obtido a partir da mdia dos quadrados dos valores de x.

x12 = (40)2= 1600 x22= (41)2= 1681 x32 = (42)2= 1764

x42 = (43)2= 1849 x52 = (44)2= 1936 x62 = (45)2= 2025

1 1600 + 1681 + 1764 + 1849 + 1936 + 2025 6 = 1809,1666 = 1 10855 6

1809,17

Assim, a varincia calculada pela diferena:

= 1809,17 1806,25 = ,

A varincia tem a desvantagem de ter unidades da varivel ao quadrado. Por isso, define-se uma medida de disperso muito utilizada denominada desvio-padro como sendo a raiz quadrada da varincia. Assim, teremos as seguintes equaes.

Desvio-padro populacional: = =

Desvio-padro amostral: = Vamos agora comparar dois conjuntos de dados amostrais, com varincias

distintas. Primeiramente, vamos utilizar os dados da Tabela 1. Na Tabela 4, reproduzimos esses dados e acrescentamos os quadrados das concentraes de cloreto, para ficar mais fcil calcular a varincia. Vamos supor, somente por simplicidade de clculo, que esses dados sejam referentes a uma populao.

Tabela 4. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa.
[Cl] [Cl]2 f fr 246 60516 1 0,04 247 61009 2 0,08 248 61504 3 0,12 249 62001 4 0,16 250 62500 5 0,20 251 63001 4 0,16 252 63504 3 0,12 253 64009 2 0,08 254 64516 1 0,04

1 1 60516 + 2 61009 + 3 61504 + 4 62001 + 5 62500 + 4 63001 + 3 63504 25 + 2 64009 + 1 64516

1 1562600 25

= 62504 62500 =

Desvio-padro populacional:

= = mg/L

Os dados da Tabela 1 constituem uma distribuio simtrica, muito similar a uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 2 mg/L.

Vamos calcular, agora, a mdia e a varincia para o conjunto de dados da Tabela 5, assumindo que se trata de uma populao. A Figura 2 apresenta o histograma de frequncias para os dados da Tabela 5.

Tabela 5. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa.
[Cl] [Cl]2 f fr 246 60516 1 0,04 247 61009 1 0,08 248 61504 2 0,12 249 62001 8 0,16 250 62500 8 0,20 251 63001 8 0,16 252 63504 2 0,12 253 64009 1 0,08 254 64516 1 0,04

0,25

0,20

0,15

fr
0,10 0,05 0,00 246 247 248 249 250 251 252 253 254

[Cl ] / mg/L

Figura 2. Histograma de frequncias para os dados da Tabela 5.

= =

1 1 246 + 1 247 + 2 248 + 8 249 + 8 250 + 8 251 + 2 252 + 1 253 + 1 254 25 1 8000 32

= 1 1 60516 + 1 61009 + 2 61504 + 8 62001 + 8 62500 + 8 63001 + 2 63504 32 1 2000082 32 , + 1 64009 + 1 64516

= =

= 62502,5625 62500 = , ,

Desvio-padro populacional:

= ,

Os dados da Tabela 5 constituem uma distribuio simtrica, muito similar uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 1,6 mg/L. Com relao aos dados da Tabela 1, a mdia manteve-se a mesma. Entretanto, o desviopadro apresentou-se menor no segundo caso. Esse fato pode ser visualizado pela comparao dos histogramas de frequncia das Figuras 1 e 2. No primeiro caso, os dados esto mais dispersos, enquanto que, no segundo caso, os dados esto mais concentrados em torno do valor central. Em outras palavras, a disperso dos dados maior no primeiro caso e esse fato medido pelo valor maior do desvio-padro da distribuio de frequncias.

0,20

0,25

0,20 0,15 0,15

fr

fr
0,10 0,05 0,00 246 247 248 249 250 251 252 253 254 246 247 248 249 250 251 252 253 254

0,10

0,05

0,00

[Cl ]/mg/L

[Cl ] / mg/L

Figura 1. Histograma de frequncias para os dados da Tabela 1. = 250 mg/L ; = 2,0 mg/L

Figura 2. Histograma de frequncias para os dados da Tabela 5. = 250 mg/L ; = 1,6 mg/L

Dados Agrupados

Muitas vezes, os dados aparecem na forma de dados agrupados, como ocorre na Tabela 6.

Tabela 6. Peso de pessoas que trabalham em certa companhia. (N=40) Peso / kg 64-66 67-69 70-72 Frequncia Absoluta 16 21 2

Para se calcular a mdia em um conjunto de dados como esse, devemos fazer a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O histograma de frequncias da Figura 3 ilustra esse conceito.

20

frequncia absoluta

15

10

0 64 65 66 67 68 69 70 71

pesos / kg

Figura 3. Histograma de frequncias para os dados agrupados da Tabela 6.

Assim, a mdia da distribuio pode ser calculada atravs da equao abaixo, onde o ponto mdio de cada classe. Faamos o clculo para o exemplo da 1 Tabela 6. =

1 40

16 65 + 21 68 + 2 71 = 1 2610 40 ,

Vamos supor que tivssemos acesso aos dados mais completos e pudssemos construir a tabela de dados agrupados mostrada na Tabela 7.

Tabela 7. Peso de pessoas que trabalham em certa companhia. (N=40) Peso / kg 64 65 66 67 68 69 70 72 Frequncia Absoluta 3 5 8 11 7 3 2 1

Agora podemos calcular a mdia e comparar com aquela anteriormente feita, com a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O histograma de frequncias da Figura 4 mostra a real distribuio dos pesos.

10

Frequncia Absoluta

0 64 65 66 67 68 69 70 71 72

Pesos / kg

Figura 4. Histograma de frequncias para os dados da Tabela 7.

1 3 64 + 5 65 + 8 66 + 11 67 + 7 68 + 3 69 + 3 70 + 1 72 40 = = 1 2747 40 ,

O mesmo se dar ao se calcular a varincia. Esse erro se deveu ao fato de termos poucos dados agrupados na Tabela 6 e de termos feito a suposio de que a distribuio dos pesos uniforme dentro de cada classe. Entretanto, no h outra suposio razovel que se possa fazer. Logo, muitas vezes, pela falta de dados, temos de aceitar o fato de que haver um erro.

agrupados das Tabelas 6 e 7, verificamos que h um erro: = 68,68 65,25 = 3,43.

Comparando com os resultados da mdias calculadas com os dados

Probabilidade

Experimento Aleatrio

No experimento exemplificado anteriormente, a concentrao de ons cloreto foi medida na gua tratada de um municpio brasileiro. O que se obteve como resultado foi uma distribuio de valores. Por que no se obteve um valor nico? Por vrias razes. Talvez a concentrao dos ons cloreto seja realmente diferente em cada ponto de coleta, ou ento pode ter havido erros de vrios tipos durante as determinaes quantitativas. Quando um experimento pode resultar em uma distribuio de resultados possveis, ele denominado experimento aleatrio. Esse o tipo de experimento que interessa para a Estatstica. Uma varivel medida em um experimento aleatrio, como a concentrao dos ons cloreto, denominada varivel aleatria. A jogada de uma moeda, M vezes, tambm um experimento aleatrio, pois resulta em uma distribuio de resultados possveis, caras e coroas, que so as variveis aleatrias.

Espao Amostral

O conjunto de todos os resultados possveis para a varivel aleatria denominado espao amostral. Nesse sentido, o espao amostral tem o mesmo sentido da populao definida anteriormente. No caso das concentraes de ons cloreto, esse conjunto tem um tamanho infinito, pois h uma quantidade infinita de valores possveis para os resultados. Entretanto, h espaos amostrais de tamanho finito, como o caso do experimento aleatrio de uma moeda sendo jogada M vezes. O tamanho do espao amostral, neste caso, ser dado por 2M. Para simplificar a notao, representaremos o resultado cara pela letra K e coroa pela letra C.

Cara Coroa

= =

K C

Desde j vamos deixar bem claro que a jogada de uma nica moeda M vezes e uma nica jogada de M moedas so experimentos aleatrios completamente equivalentes, com os mesmos espaos amostrais. O espao amostral, para a jogada de uma moeda, possui 21 = 2 elementos dado pelo conjunto, A1 abaixo. O espao amostral, para a jogada de duas moedas, possui 22 = 4 elementos dado pelo conjunto, A2 abaixo. O espao amostral, para a jogada de trs moedas, possui 23 = 8 elementos e dado pelo conjunto, A3 abaixo.

A1 = {K, C} A2 = {KK, KC, CK, CC} A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Evento

Evento todo subconjunto de um espao amostral. Nesse sentido, evento tem o mesmo sentido da amostra definida anteriormente. Usando o exemplo acima, da jogada de trs moedas, podemos escrever alguns eventos abaixo, em relao ao espao amostral A3, com seus significados escritos ao lado.

E3,1 = {KKK, KKC, KCK, KCC}: Sair cara no lanamento da primeira moeda. E3,2 = {KKC, KCK, CKK}: Sair exatamente uma coroa. E3,3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK}: Sair no mximo duas coroas. E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras. E3,5 = {KKK}: No sair nenhuma coroa.

Probabilidade de um Evento

Para chegar ao conceito de probabilidade, vamos usar os exemplos vistos anteriormente. Considere o espao amostral para o lanamento de trs moedas, A3 e o evento que seja sair pelo menos duas caras, E3,4. A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC} E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras. A pergunta a seguinte: no lanamento de trs moedas, qual a probabilidade de sair pelo menos duas caras? A maneira formal de definir probabilidade considera o seguinte:

N E = nmero de elementos do evento.

amostral A, dada pela seguinte razo:

Assim, a probabilidade, P(E) de ocorrncia do evento E, no espao = Para o exemplo acima, o clculo da probabilidade fica assim: = = 4 1 = = 0,50 8 2

N A = nmero de elementos do espao amostral.

caras no lanamento de trs moedas.

O resultado foi P E =0,50 ou seja, h 50% de chance de sair pelo menos duas

Exerccio Resolvido. Uma moeda jogada 2 vezes. Calcule a probabilidade de sair cara na primeira jogada e coroa na segunda. Resoluo: Primeiro escrevem-se o espao amostral e o evento, com os respectivos tamanhos. A2 ={KK, KC, CK, CC}; N(A) = 4; A seguir, calcula-se a probabilidade do evento, pela equao abaixo. = = 1 = 0,25 4 E2,1 = {KC}; N(E) = 1

Logo, h 25% de chance de sair cara na primeira jogada e coroa na segunda.

Frequncia Relativa e Probabilidade

Uma segunda forma de definir probabilidade atravs do conceito de frequncia relativa. Neste caso, definimos as seguintes grandezas:

nE = nmero de vezes que o evento E observado. N = nmeros de vezes que o experimento aleatrio repetido. Assim, a frequncia relativa, f de ocorrncia do evento E, no experimento

aleatrio, dada pela seguinte razo:

No lanamento de trs moedas, a frequncia relativa de sair pelo menos duas caras depende do nmero de repeties e do que foi observado. Se o experimento foi repetido N=100 vezes e obtiveram-se pelo menos duas caras em nE = 48 vezes, ento Acompanhe o clculo abaixo. a frequncia relativa de sair pelo menos duas caras, neste caso foi f=0,48. = = 48 = 0,48 100

probabilidade (P=0,50). De fato, o valor da frequncia relativa tende para o valor da probabilidade, quando o experimento aleatrio for repetido um nmero muito grande de vezes. Por isso, vlida a seguinte definio de probabilidade, que utiliza o conceito de limite, quando N tender a infinito (). = lim

Verifique que o valor obtido aproxima-se bastante do valor calculado para a

Probabilidade da Unio de dois Eventos Mutuamente Excludentes

A unio de dois conjuntos A e B, simbolizada por AB, o conjunto que contm todos os elementos dos dois conjuntos. Por exemplo, considere os conjuntos A e B a seguir:

A = {1,3,5,7,9} B = {0,2,4,6,8}

Os conjuntos A e B acima no contm nenhum elemento em comum. So assim chamados conjuntos disjuntos, ou mutuamente excludentes. Diz-se que a interseo entre eles vazia, ou seja; AB = { }. A unio AB ser o conjunto dado abaixo: AB = {0,1,2,3,4,5,6,7,8,9} Agora vamos tratar da probabilidade da unio de dois eventos mutuamente excludentes. A probabilidade da unio de dois eventos A e B, mutuamente excludentes, igual soma das probabilidades de cada evento individual. A probabilidade da unio de dois eventos A e B interpretada como a probabilidade de ocorrncia do evento A ou do evento B.

(Eventos mutuamente excludentes)

Considere, agora, uma moeda sendo jogada duas vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A2 = {KK, KC, CK, CC} Vamos considerar dois eventos que sejam mutuamente excludentes. Por exemplo:

E2,1 = {KK}: Sair duas caras. E2,2={KC,CK}: Sair exatamente uma cara (ou uma coroa).

A unio desses dois eventos o seguinte conjunto: E2,1E2,2 = {KK, KC, CK} Pode-se ver que os eventos E2,1 e E2,2 so mutuamente excludentes, pois no apresentam nenhum elemento em comum. Ento podemos calcular a probabilidade da unio dos dois eventos pela equao acima. Primeiro, calculamos as probabilidades dos eventos individuais.
, ,

= =

, ,

= =

1 = 0,25 4 2 = 0,50 4

A seguir, aplicamos a equao da soma, para calcular a probabilidade da unio dos eventos.
2,1

2,1

2,2

2,1

2,2

2,2

= 0,25 + 0,50 = 0,75

2,1

2,2

Interpretamos a resposta assim: a probabilidade de sair duas caras ou exatamente uma cara (ou uma coroa) de 75%. Tambm podemos dizer que a probabilidade de ocorrncia do evento unio E2,1E2,2 de 75%. Essa conta s foi vlida dessa forma porque os dois eventos eram mutuamente excludentes. Vamos aprender, mais a frente, a calcular a probabilidade da unio de eventos que no so mutuamente excludentes.

Probabilidade da Interseo de dois Eventos

A interseo de dois conjuntos A e B, simbolizada por AB, o conjunto que contm todos os elementos que pertencem simultaneamente aos dois conjuntos. Por exemplo, considere os conjuntos A e B a seguir:

A = {1,2,5,6,9} B = {0,2,4,6,8}

A interseo entre os conjuntos A e B acima o conjunto dado abaixo: AB = {2,6} Como se v, os conjuntos A e B acima possuem dois elementos em comum. Portanto no so disjuntos, ou seja, no so mutuamente excludentes. No h uma frmula geral para calcular a probabilidade da interseo entre dois eventos A e B. Por isso, teremos de obter a interseo e contar seu nmero de elementos. A partir da, a interseo passa a ser vista como um evento e a probabilidade calculada com a frmula da probabilidade de um evento. A probabilidade da interseo de dois eventos A e B interpretada como a probabilidade de ocorrncia do evento A e do evento B. Consideremos uma moeda sendo jogada trs vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Vamos considerar os dois eventos seguintes; E3,1 = {KKC, CCK}: Sair duas caras ou duas coroas, nas duas primeiras jogadas. E3,2 = {KKC, KCK, CKK}: Sair exatamente duas caras. A interseo desse dois eventos dada pelo conjunto abaixo: E2,1E2,2 = {KKC} Logo, a probabilidade da interseo desses dois eventos calculada pela equao abaixo.

E2,1 E2,2 =

E2,1 E2,2

1 = 0,125 8

Interpretamos a resposta assim: a probabilidade de sair duas coroas, nas duas primeiras jogadas e sair exatamente duas caras igual a 12,5%. Tambm podemos dizer que a probabilidade de ocorrncia do evento interseo E2,1E2,2 de 12,5%.

Probabilidade Geral da Unio de dois Eventos

Agora estamos em condies de formular a equao que estabelece a probabilidade da unio de dois eventos A e B, sejam eles mutuamente excludentes, ou no. A frmula bastante geral e dada abaixo.

equao torna-se igual quela que foi vista anteriormente. Assim, v-se que aquela equao um caso particular desta ltima.

No caso dos eventos mutuamente excludentes, o termo P AB =0 e a

Por exemplo, considere, agora, uma moeda sendo jogada duas vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A2 = {KK, KC, CK, CC} Vamos considerar dois eventos que no sejam mutuamente excludentes, ou seja, que tenham pelo menos um elemento em comum. Por exemplo: E2,1 = {KK}: Sair duas caras. E2,2 = {KK, KC,CK}: Sair pelo menos uma cara. A interseo entre os eventos dada pelo conjunto abaixo: E2,1E2,2 = {KK} Vamos agora calcular a probabilidade da unio dos dois eventos, usando a ltima equao.
2,1

2,2

2,1

2,2

2,1

2,2

2,1

2,2 2,1

=
2,2

2,1

Interpretamos a resposta assim: a probabilidade de sair duas caras ou de sair pelo menos uma cara de 75%. Note que, se no fosse a subtrao do termo de probabilidade de interseo, a soma teria chegado a 100%, dando um resultado errado.
Exerccio Resolvido. Uma dado de seis faces jogado 2 vezes. Calcule (a) a probabilidade de sair 1 na primeira jogada e 2 na segunda jogada; (b) a probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada.

1 3 1 3 + = = 0,75 4 4 4 4

2,2

2,1

2,2

Resoluo: Primeiro escrevem-se o espao amostral e os eventos, com os respectivos tamanhos. A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}; N(A2) = 36 N(E2,1) = 6 N(E2,1) = 6

E2,1 = {11, 12, 13,14, 15, 16}: Sair 1 na primeira jogada. E2,2 = {12, 22, 32, 42, 52, 62}: Sair 2 na segunda jogada.

Os eventos no so mutuamente excludentes. Eles tm um elemento em comum. A interseo entre os eventos o conjunto: E2,1 E2,2 = {12}. N(E2,1 E2,2) = 1

(a) A probabilidade de sair 1 na primeira jogada e 2 na segunda jogada a probabilidade da interseo entre os dois eventos, ou seja, dado pelo clculo abaixo:
,

Jogando um dado duas vezes, h uma chance de 2,78% de sair 1 na primeira jogada e 2 na segunda jogada.

1 = 0,0278 36

(b) A probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada a probabilidade da unio entre os dois eventos, ou seja, dado pelo clculo abaixo:
, , ,

, ,

Jogando um dado duas vezes, h uma chance de 30,6% de sair 1 na primeira jogada ou 2 na segunda jogada.

6 6 1 + = 0,167 + 0,167 0,0278 = 0,306 36 36 36

Amostragem com Reposio

Amostragem significa escolher alguns elementos da populao. Ela pode ser feita com reposio, ou sem reposio. Na amostragem com reposio, uma vez que o elemento escolhido uma vez, ele pode voltar a ser escolhido novamente. Esse o caso das jogadas de moedas e dados. Uma vez que deu resultado cara, na jogada de uma moeda, nada impede que d cara novamente na prxima jogada. Quando se joga uma moeda M vezes, o nmero de resultados possveis dado por 2M. Da mesma forma, quando se joga um dado M vezes, o nmero de resultados possves dado por 6M. De um modo geral, quando escolhemos M objetos, com reposio, de uma populao de A objetos, teremos AM maneiras distintas de selecionar os objetos. Vamos analisar um exemplo interessante, usando amostragem com

reposio.Considere uma prova com 30 questes de mltipla escolha, com cinco alternativas em cada questo. Qual a probabilidade de tirar a nota mxima na prova, apenas na sorte? Neste caso, podemos considerar que estamos escolhendo M=30 questes, com reposio, de uma populao de A=5 alternativas. O nmero total de respostas possveis dado por AM = 530 = 9,31 x 1020. Como h apenas uma maneira de se responder a prova para tirar a nota mxima, essa probabilidade ser dada pela conta abaixo. Verifica-se que o resultado P=1021 extremamente baixo para que algum consiga acertar a prova toda, apenas na sorte. = 1 9,31 10 = 1,07 10

Amostragem sem Reposio

Veremos agora a amostragem sem reposio. Na amostragem sem reposio, uma vez que o elemento escolhido uma vez, ele no pode voltar a ser escolhido novamente. Considere que h sete camisas em uma gaveta, para serem usadas durante a semana, uma cada dia. Suponha que, a cada dia, uma camisa retirada da gaveta, mas no devolvida, pois vai para o cesto de roupas para serem lavadas. No

domingo, h sete camisas. Na segunda-feira, haver seis. Na tera-feira, cinco. E assim por diante. No sbado s haver uma camisa na gaveta. De quantas maneiras diferentes podem-se escolher as camisas para os sete dias da semana? No domingo, h 7 escolhas possveis de camisas. Na segunda-feira, h 6 escolhas possveis. Ento, haver 7x6=42 escolhas possveis para os dois primeiros dias. Continuando o processo, podemos concluir que haver o seguinte nmero de escolhas possveis de camisas para toda a semana; 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 5 040 Em outras palavras, h 5040 maneiras diferentes de se escolher as camisas durante a semana, assumindo que a retirada das camisas sem reposio. Este uma caso de permutao de 7 camisas. Caso a escolha tivesse sido feita com reposio, esse nmero seria bem maior: 7 =823 543. O valor 7! denominado fatorial de 7. O fatorial de um nmero muito importante na teoria das probabilidades. Abaixo esto os valores dos fatoriais de zero a dez, dando a idia do conceito. Os valores dos fatoriais crescem muito depressa e nmeros grandes tm fatoriais gigantescos, por exemplo, 70! 10100. Por definio, o fatorial de zero 1.
7

0! =1 1! = 1 2! =2x1 =2 3! = 3x2x1 = 6 4! = 4x3x2x1 = 24 5! = 5x4x3x2x1 = 120 6! = 6x5x4x3x2x1 = 720 7! = 7x6x5x4x3x2x1 = 5 040 8! = 8x7x6x5x4x3x2x1 = 40 320 9! = 9x8x7x6x5x4x3x2x1 = 362 880 10! = 10x9x8x7x6x5x4x3x2x1 = 3 628 800

Arranjos

Vamos considerar ainda a amostragem sem reposio. Entretanto, considere agora que h dez camisas em uma gaveta, para serem usadas durante a semana, uma cada dia. Note que, neste caso, nem todas as camisas sero usadas. De quantas maneiras diferentes podem-se escolher as camisas para os sete dias da semana? H 10 escolhas para o domingo, 9 para a segunda, 8 para a tera, e assim por diante. No sbado haver 4 camisas na gaveta. Podemos concluir que haver o seguinte nmero de escolhas possveis de camisas para toda a semana: 10 x 9 x 8 x 7 x 6 x 5 x 4=604 800 Em outras palavras, h 604 800 maneiras diferentes de se escolher as camisas durante a semana, assumindo que a retirada das camisas sem reposio. Este uma caso de arranjo de 10 camisas durante os 7 dias da semana. Podemos escrever uma frmula conveniente para arranjos, em termos de fatoriais. Vamos usar o ltimo exemplo para deduzir essa frmula. Note que a ltima expresso pode ser reescrita na forma abaixo: 10 9 8 7 6 5 4 3 2 1 10! 10! = = = 604 800 321 3! 10 7 ! A expresso acima mostra que a frmula para o arranjo,

escolhidos sem reposio, de uma populao de n objetos pode ser escrita na forma abaixo. = ! !

de j objetos,

Combinaes

Vamos considerar ainda a amostragem sem reposio. Vamos considerar uma exemplo bastante conhecido na loteria, a Mega-Sena. So 60 dezenas e voc tem de acertar seis. A pergunta , de quantas formas distintas pode-se escolher as seis dezenas?

Poderamos pensar em um arranjo. No incio tem-se 60 dezenas. Depois de sorteada a primeira dezena, sobram 59. Depois de sorteada a segunda, sobram 58. E assim por diante. Pode-se pensar no seguinte clculo de arranjo: 60 x 59 x 58 x57 x56 x55 = 36 045 979 200 Esse resultado seria calculado pela frmula do arranjo , dada abaixo.

60! 60! 60 59 58 57 56 55 54! = = = 36 045 979 200 54! 60 6 ! 54!

O nico problema com esse clculo o seguinte. Suponha que tenha sado as dezenas: 01, 05, 23, 25, 37, 39. Esse clculo conta todas as permutaes possveis dessas dezenas. Ento, temos de dividir o resultado pelo nmero de permutaes, ou seja 6! = 720. Isto porque a ordem em que os resultados saem no importa. Assim, a frmula para a combinao dada pela frmula abaixo. = ! de n objetos, tomados j de cada vez !

Fazendo o clculo da combinao de 60 objetos, tomados 6 de cada vez, chegamos ao nmero de formas distintas que se pode escolher as seis dezenas na Mega-Sena.
60! 60! 60 59 58 57 56 55 54! 36 045 979 200 60 = = = = = 50 063 860 6 6! 60 6 ! 6! 54! 720 6! 54!

Probabilidade Condicional Dados dois eventos A e B, a probabilidade condicional P A|B Considere N AB o nmero de elementos e P AB

probabilidade de ocorrncia do evento A, dado que o evento B tenha ocorrido. ocorrncia da interseo entre os eventos A e B. Considere, tambm N B o nmero a probabilidade de

clculo da probabilidade condicional P A|B dada abaixo. | = =

de elementos e P B a probabilidade de ocorrncia do evento B. A expresso para o

zero, ou seja, P A|B =0.

Note que se a interseo AB for vazia, ento a probabilidade condicional ser

Um exemplo a jogada de um dado duas vezes. O espao amostral tem N(A2)=36 elementos e dado pelo conjunto abaixo. A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66} Considere os seguintes eventos: E2,1 = {12, 21}: Obter soma 3 nas duas jogadas. N(E2,1)=2 E2,2 = {21, 22, 23, 24, 25, 26}: Obter 2 na primeira jogada. N(E2,2)=6 A interseo entre os dois eventos dada pelo conjunto abaixo: E2,1E2,2 = {21}. A probabilidade condicional
, , ,

N(E2,1E2,2) = 1

dada pela equao abaixo.


,

1 = 0,167 6

Ento, a probabilidade condicional de obter soma 3 nas duas jogadas, dado que se obteve 2 na primeira jogada de 16,7%.

Eventos Independentes

Dois eventos A e B so independentes se a equao abaixo for verdadeira:

Considere que aparea um 3 na primeira jogada de um dado. No que isso afeta a probabilidade de aparecer qualquer outro nmero na prxima jogada? A resposta que no afeta em nada. Nesse caso, os eventos so independentes. Portanto, para eventos independentes pode-se escrever a expresso abaixo.

=
na forma abaixo. =

Lembrando que P(AB)=P(A e B), essa ltima expresso pode ser rearranjada

(eventos independentes)

Por exemplo, na jogada de dois dados, qual a probabilidade de aparecer 3 na primeira jogada e 5 na segunda jogada? A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}. N(A2) = 36 Considere os seguintes eventos independentes: E2,1 = {31, 32, 33, 34, 35, 36}: Aparecer 3 na primeira jogada. N(E2,1)=6 E2,2 = {15, 25, 35, 45, 55, 65}: Aparecer 5 na segunda jogada. N(E2,2)=6
, ,

6 6 1 1 1 = = = 0,0278 36 36 6 6 36

Ento, na jogada de dois dados, a probabilidade de aparecer 3 na primeira jogada e 5 na segunda jogada de 2,78%.

Problemas

1. Quais so os significados da palavra Estatstica? 2. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) populao; (b) amostra; (c) populao de tamanho infinito; (d) populao de tamanho finito; (e) amostra representativa; (f) amostra no representativa. 3. Considere os conjuntos de dados amostrais A e B, abaixo. Para cada um, calcule a mdia, a mediana e a moda. (a) A={28, 22 , 33, 30, 100, 28, 25, 30, 27, 28} (b) B={213, 210, 215, 213, 220, 1018, 214, 213, 211, 213, 215} 4. Para as populaes de dados abaixo, calcule as respectivas varincias e desviospadro, usando as duas frmulas, a da definio e a frmula prtica. (a) A={70, 72, 75, 78, 74, 73, 79, 71, 77, 76} (b) B={1010, 1015, 1017, 1014, 1018, 1020, 1011} 5. Os visitantes do Parque Nacional de Yellowstone, nos Estados Unidos, consideram uma erupo do giser Old Faithful uma atrao que no pode ser perdida. A tabela de freqncias a seguir resume uma amostra de tempos (em minutos) entre erupes, Construa um histograma para a tabela de frequncias dada. Se um guia turstico deseja garantir que seus turistas presenciem uma erupo, qual o tempo mnimo que devem permanecer no parque? Calcule a mdia e o desvio-padro da distribuio de frequncias. Tempo / minutos 40-49 50-59 60-69 70-79 80-89 90-99 100-109 Freqncia 8 44 23 6 107 11 1

6. Obtiveram-se, em uma universidade brasileira, os dados da tabela abaixo, referentes ao nmero de carros de estudantes e de professores e servidores e seus respectivos anos de uso. Construa um histograma de freqncias relativas para cada um dos dois conjuntos de dados. Com base nos resultados, quais so as diferenas perceptveis entre as duas amostras? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Ano do carro 0-2 anos 3-5 6-8 9-11 12-14 15-17 18-20 21-23 Estudantes 23 carros 33 63 68 19 10 1 0 Professores e Servidores 30 carros 47 36 30 8 0 0 1

7. A tabela de freqncias a seguir d as velocidades, de motoristas multados pela polcia de uma cidade brasileira, onde o limite de velocidade estabelecido era de 40 km/h. Construa um histograma para essa tabela de freqncias. O que essa distribuio sugere sobre o limite fixado comparado com o limite de velocidade constatado? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Freqncia Absoluta 14 11 8 6 4 3 1 2 1 Velocidade / km/h 42-43 44-45 46-47 48-49 50-51 52-53 54-55 56-57 58-59

8. As companhias de seguro pesquisam continuamente as idades e as causas de morte. Construa um histograma de frequncias relativas correspondente tabela de freqncias abaixo. Os dados se baseiam em um estudo da revista Veja sobre vtimas fatais de armas de fogo no Brasil, durante uma semana. O que o histograma sugere quanto s idades dessas vtimas fatais? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Freqncia 22 10 6 2 4 5 1 Idade na Morte 16-25 26-35 36-45 46-55 56-65 66-75 76-85

9. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) experimento aleatrio; (b) varivel aleatria; (c) espao amostral; (d) evento; (e) unio de eventos (f) interseo de eventos; (g) eventos mutuamente excludentes. 10. Discuta a diferena conceitual entre as duas definies de probabilidade de um evento apresentadas, ou seja: = e = lim . Utilize um exemplo, diferente daquele dado no texto, para ilustrar sua discusso. 11. Uma moeda jogada trs vezes. Calcule a probabilidade dos eventos abaixo. Dica: escreva os conjuntos que representam o espao amostral e os eventos. (a) Sair exatamente uma cara. (b) Sair no mximo duas caras. (c) Sair coroa no lanamento da primeira moeda. (d) No sair nenhuma cara. 12. Uma moeda jogada trs vezes. Calcule as probabilidades que se pedem abaixo. (a) Sair trs caras ou trs coroas. (b) Sair trs caras e trs coroas. (c) Sair duas caras ou duas coroas. (d) Sair duas caras e duas coroas. (e) Sair uma cara e uma coroa. (f) Sair uma cara ou uma coroa. 13. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) amostragem com reposio; (b) amostragem sem posio; (c) fatorial de um nmero; (d) permutao; (e) arranjo; (e) combinao. 14. De quantas formas distintas 9 pessoas podem ficar dispostas em fila indiana? 15. Quantos anagramas podemos formar com a palavra TEORIA? 16. Em uma prova com 10 questes de mltipla escolha, com 4 alternativas cada, qual a probabilidade de um candidato responder a prova e acertar todas a questes apenas no palpite? 17. Se voc tem 15 camisas em uma gaveta, para serem usadas durante a semana (7 dias), uma cada dia, sem reposio, de quantas maneiras diferentes pode-se escolher as camisas para os sete dias da semana? 18. Em um campeonato de futebol, participam 20 times. Quantos resultados so possveis para os 3 primeiros lugares?

Captulo 2. Aplicao da Matemtica Estatstica.

A Distribuio Binomial

Uma varivel aleatria discreta aquela que pode ser descrita por meio de nmeros inteiros. Por exemplo, quando se joga uma moeda 20 vezes, podemos definir uma varivel aleatria X discreta como sendo o nmero de vezes que sai o resultado cara. Assim, os valores possveis de X podem ser: X = 0, 1, 2, 3, ..., 20. A distribuio binomial uma distribuio de probabilidade para varivel discreta. Ela caracterizada por dois parmetros, apenas (n,p). O parmetro n o nmero de vezes que o experimento executado. Por exemplo, no lanamento de uma moeda, a moeda pode ser lanada n = 1, 2, 3, 4, 5, ... vezes. O parmetro p a probabilidade de sucesso em cada vez que o experimento executado. Por exemplo, no lanamento de uma moeda, p= pode representar a probabilidade de sair cara (ou coroa). Por consequncia, 1p a probabilidade de fracasso. Uma distribuio de frequncia coloca a varivel aleatria no eixo horizontal (abscissa) e a probabilidade de ocorrncia de cada valor da varivel no eixo vertical (ordenada). Seja X uma varivel aleatria. A probabilidade P X=i de se obter X=i sucessos, em uma distribuio binomial (n, p), dada pela equao abaixo. = = 1

Na equao acima, foi utilizada a notao de combinao, dada abaixo. = ! ! !

Exemplo da Jogada de 20 moedas Vamos calcular a distribuio binomial n, p = 20, para uma jogada de 20

(vinte) moedas. A probabilidade de sucesso, em cada jogada, pode ser definida arbitrariamente como a probabilidade de sair cara e seu valor p = . nas outras 19 moedas, pela distribuio binomial 20, calculada da forma abaixo. =1 = 20! 0,5 1! 20 1 ! 1 0,5 = 0,0000190735 Por exemplo, P X=1 , a probabilidade de sair cara em apena 1 moeda e coroa

A Tabela 8 e a Figura 5 mostram os resultados de todos os clculos. Tabela 8. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i , a destacado. i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 probabilidade de se obter X=i sucessos. O valor central X=10 est P X=i 0,0000009537 0,0000190735 0,0001811980 0,0010871900 0,0046205500 0,0147858000 0,0369644000 0,0739288000 0,1201340000 0,1601790000 0,1761970000 0,1601790000 0,1201340000 0,0739288000 0,0369644000 0,0147858000 0,0046205500 0,0010871900 0,0001811980 0,0000190735 0,0000009537

0.18 0.16 0.14 0.12

P(X=i)

0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 8 10 12 14 16 18 20

i
Figura 5. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i , a probabilidade de se obter X=i sucessos.

Como interpretamos a distribuio de probabilidades acima? Ao jogarmos 20 (vinte) moedas, a probabilidade de se obter 10 caras (X=10) mxima, ou seja, distancia de 10. P X=10 = 0,176197 o valor mximo. As probabilidades diminuem medida que X se A esperana (valor mdio), E X e a varincia, Var X de uma varivel aleatria

com distribuio binomial so calculadas a partir dos valores dos parmetros n e p, de acordo com as equaes abaixo. =

de X possuem os seguintes valores.

No exemplo dado acima, n, p = 20, . Portanto, a esperana e a varincia = 20 0,5 = 10

= 20 0,5 1 0,5 = 5 Logo, de se esperar o valor central X=10 para a distribuio binomial acima, j que este o valor da esperana de X.

Exemplo das 30 questes de mltipla escolha

Outro exemplo de utilizao da distribuio binomial foi o caso abordado anteriormente de uma prova de mltipla escolha, com 30 questes e 5 alternativas em cada questo. Vimos que h um total de 530 = 9,31 x 1020 respostas possveis. Considerando X o nmero de questes que um candidato acertou na prova, os valores possveis para essa varivel aleatria discreta sero: X = 0, 1, 2, 3, ..., 30. Podemos considerar que essa varivel siga uma distribuio binominal (n,p) = (30,1/5). Como h 5 alternativas, a probabilidade de sucesso, ou seja, de acertar uma questo p=1/5. Assim, podemos calcular a probabilidade de acertar qualquer nmero de questes, apenas na sorte, usando a frmula da distribuio binomial. Vamos calcular a probabilidade de acertar a prova inteira na sorte, ou seja, vamos calcular P(X=30), usando a distribuio binomial, com n=30 e p=1/5=0,2. = 30 = 30! 0,2 30! 30 30 ! 1 0,2 = 1,07 10

Esse o mesmo resultado encontrado anteriormente, da ordem de P=1021. Vamos agora encontrar a probabilidade de acertar metade da prova na sorte, ou seja, vamos calcular P(X=15), usando a mesma distribuio binomial. = 15 = 30! 0,2 15! 30 15 ! 1 0,2 = 0,000179

A probabilidade encontrada muitas vezes maior que a anterior. De fato, para algum acertar metade da prova, na sorte, a probabilidade de 0,0179%. O valor continua sendo pequeno para que algum consiga acertar na sorte, mas j possvel que algum consiga, pois esta probabilidade bem maior que as de muitas loterias! Calculemos a esperana e a varincia de X para este caso. = 30 0,2 1 0,2 = 4,8 Vamos calcular a probabilidade de acertar apenas 6 (seis) questes, na sorte, ou seja, vamos calcular P(X=6), usando a mesma distribuio binomial. =6 = 30! 0,2 6! 30 6 ! 1 0,2 = 0,179 = 30 0,2 = 6

17,9%. O desvio padro igual 4,8 = 2,2. Portanto, espera-se que a 18% dos candidatos que faam a prova no puro palpite acertem 62 questes.

Para se acertar 6 questes na sorte, a probabilidade mxima e igual a

A Distribuio Normal

Uma varivel aleatria contnua aquela que pode ser descrita por meio de nmeros reais. Por exemplo, a concentrao dos ons cloreto em amostras de gua. A distribuio normal uma distribuio de probabilidade para varivel contnua. Ela caracterizada por dois parmetros populacionais (, ). Ela uma distribuio simtrica, em forma de sino, sendo que o valor central a mdia da populao, e a medida da disperso o desvio-padro, da populao. A distribuio normal dada pela curva gaussiana, nome dado em homenagem ao matemtico alemo Johann Carl Friedrich Gauss (1777-1855). Seja x probabilidade, f x para a varivel aleatria x e dada pela equao abaixo. uma varivel aleatria contnua. A curva gaussiana a funo densidade de

A esperana E(x) e a varincia Var(x) da varivel aleatria contnua x, em uma distribuio normal, so dadas pelas equaes abaixo, respectivamente.

E(x) = Var(x) = 2

A Figura 6 apresenta duas curvas gaussianas, ambas com =0. Uma das curvas possui =1,0 e a outra, =2,0. A curva com maior mais larga e menos alta.

Figura 6. Curva gaussiana para =0, =1,0 e =2,0.

A Distribuio Normal Reduzida

Qualquer conjunto de dados {x}, com media e desvio-padro , pode ser transformado em outro conjunto de dados {Z}, com mdia =0 e desvio padro =1, mediante o uso da equao de transformao abaixo.

Aplicando a transformao acima para uma funo gaussiana, obtemos a equao abaixo, denominada distribuio normal reduzida: (, ) = (0, 1).

Note que a Figura 6 apresenta o grfico da distribuio normal reduzida.

mulheres. As estaturas so representadas pela varivel aleatria x. Vamos supor que essa varivel siga uma distribuio normal e que a mdia e o desvio padro dessa populao sejam, respectivamente: = 1,60 m; = 0,20 m. Neste caso, duas mulheres da populao que tivessem estaturas x1 = 1,47 m e x2 = 1,68 m na

Vejamos um exemplo. Consideremos as estaturas de uma populao de

distribuio normal, passariam a ter as seguintes estaturas na distribuio normal reduzida: 1,47 1,60 0,20

= =

1,68 1,60 0,20

= 0,65 = +0,40

Os valores na distribuio normal reduzida podem ser positivos ou negativos, indicando se so maiores ou menores que a mdia. Na distribuio normal reduzida, o valor Z=0 significa que a varivel tem o valor mdio. Alm disso, a distribuio normal reduzida adimensional, ou seja, os valores no tm unidade, so nmeros puros.

Probabilidade de uma varivel aleatria contnua

Para discutir a probabilidade de uma varivel aleatria contnua assumir um determinado valor, vamos usar a distribuio normal reduzida. A funo gaussiana f Z d a densidade de probabilidade para a varivel reduzida Z. O valor da probabilidade P da varivel reduzida Z assumir um valor entre Z1 e Z2 dado pela integral definida abaixo.

<

<

A Equao acima significa que a probabilidade P da varivel reduzida Z assumir um valor entre Z1 e Z2 dada pela rea abaixo da curva de f Z , entre os valores Z1 e Z2. Usando a expresso da distribuio gaussiana reduzida, a ltima equao assume a forma dada abaixo. A equao abaixo integrada numericamente. Na prtica,os valores so tabelados. Por exemplo, a Figura 7 mostra que a probabilidade de a varivel reduzida Z assumir valores entre -2 < Z < 2 de 95,45%.

<

<

1 2

1 2

Figura 7. rea abaixo da curva gaussiana reduzida (=0, =1) na faixa 2 < Z < 2.

A rea total sob a curva 1, significando 100% (vide Figura 7). Em outras palavras, a probabilidade de a varivel Z assumir valores na faixa < Z < + P=1. Essa a denominada condio de normalizao, expressa pela equao abaixo.

=1

A partir da condio de normalizao, podemos calcular, por exemplo, a probabilidade de a varivel Z assumir valores maiores que 2, ou seja, P(Z>2). Observando a Figura 7, vemos que a probabilidade de Z estar na faixa -2>Z>2 dada por: 1 0,9545 = 0,0455. Como a funo simtrica, a probabilidade de Z ser maior que 2 metade desse valor, ou seja:

>2 =

1 0,9545 0,04550 = = 0,02275 2 2

Se quisermos saber a probabilidade de Z assumir valores menores que 2, ou seja, P(Z>2) s fazer o seguinte clculo:

< 2 = 1 0,02275 = 0,97725


H uma srie de valores de probabilidade que podemos calcular para os valores da varivel reduzida Z. Uma coisa importante notar. Que, como a probabilidade uma rea sob a curva, a probabilidade de a varivel assumir um determinado valor seria zero, pois a rea sob a curva seria zero.

=0

Na prtica so utilizadas tabelas de probabilidades. No Apndice A1 mostrada a tabela para a probabilidade de Z assumir valores menores que a, P(Z<a).

Vamos aprender a usar as tabelas de probabilidades para distribuio normal reduzida, com exemplos. Suponha que a concentrao do gs poluente SO2 apresente uma distribuio normal em uma cidade brasileira e que a mdia da concentrao seja = 0,14 ppm e o desvio-padro = 0,01 ppm. Calcule o que se pede abaixo:

(a) A probabilidade de que a concentrao de SO2 seja maior do que a mdia.

Neste caso, queremos a probabilidade P(X>0,14 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,14 0,14 = 0,00 0,01

Agora, o problema determinar a probabilidade P(Z>0,00). Na tabela de probabilidades, encontramos P(Z<0,00) = 0,5000. Como a rea total sob a curva 1, ou seja, como a curva normalizada, ento a probabilidade que se deseja calcular dada pelo clculo abaixo. > 0,00 = 1 < 0,00 = 1 0,5000 = 0,5000

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima da mdia, na cidade, de 50%, como mostra a Figura 8.

Figura 8. Probabilidade de que a varivel Z assuma valores acima da mdia, ou seja, P(Z>0)=0,5000.

(b) A probabilidade de a concentrao de SO2 ser maior que 0,15 ppm. Neste caso, queremos a probabilidade P(X>0,15 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,15 0,14 = 1,00 0,01

Agora, o problema determinar a probabilidade P(Z>1,00). Na tabela de probabilidades, encontramos P(Z<1,00) = 0,8413. Como a rea total sob a curva 1, ou seja, como a curva normalizada, ento a probabilidade que se deseja calcular dada pelo clculo abaixo. > 0,00 = 1 < 0,00 = 1 0,8413 = 0,1587

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima de 0,15 ppm, na cidade, de 15,87%, como mostra a Figura 9.

Figura 9. Probabilidade de que a varivel Z assuma valores acima de 1,00. Ou seja, P(Z>1,00)=0,1587.

(c) A probabilidade da concentrao de SO2 ser maior do que 0,17 ppm. Neste caso, queremos a probabilidade P(X>0,17 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,17 0,14 = 3,00 0,01

Agora, o problema determinar a probabilidade P(Z>3,00). Na tabela de probabilidades, encontramos P(Z<3,00) = 0,9987. Como a rea total sob a curva 1, ou seja, como a curva normalizada, ento a probabilidade que se deseja calcular dada pelo clculo abaixo. > 3,00 = 1 < 3,00 = 1 0,9987 = 0,0013

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima de 0,17 ppm, na cidade, de 0,13%, o que representa um valor muito baixo. (d) A probabilidade de que a concentrao de SO2 tenha um valor entre 0,141 ppm e 0,142 ppm. Neste caso, queremos a probabilidade P(0,141 ppm < X > 0,142 ppm). Vamos transformar em variveis reduzidas primeiro. = = = 0,141 0,14 = 0,100 0,01

0,142 0,14 = 0,200 0,01

A probabilidade que se quer pode ser obtida da tabela de probabilidades, atravs do seguinte clculo: P(0,100 < Z< 0,200) = P(Z<0,200) P(Z<0,100) = 0,5793 0,5398 = 0,0395 Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir valores entre 0,141 ppm e 0,142 ppm, na cidade, de 3,95%.

A Distribuio Amostral das Mdias

J vimos que, para uma dada populao, existe um grande nmero de amostras possveis. Cada amostra tem um tamanho padro . Se estivermos amostrando uma populao que tenha uma distribuio de probabilidades desconhecida, com mdia amostral e varincia , caso o tamanho , uma mdia e um desvio-

seja grande o suficiente, a distribuio amostral das mdias ser e a varincia, da mdia

aproximadamente normal. A esperana,

amostral so dadas, respectivamente, pelas equaes abaixo. Esse resultado conhecido como Teorema do Limite Central.

= =

O desvio-padro da mdia amostral, seja, dado pela equao abaixo.

a raiz quadrada da varincia, ou

A Figura 10 ilustra a idia por trs do Teorema do Limite Central, usando o experimento aleatrio da jogada de n dados. Quando se joga apenas 1 (um) dado, as probabilidades so todas iguais para os seis nmeros, ou seja P=1/6. Quando se joga mais de um dado, as probabilidades de se obter cada nmero vo ficando diferentes, podendo ser calculadas pela distribuio binomial. medida que o nmero de jogadas aumenta, a distribuio se aproxima da distribuio normal.

Figura 10. Ilustrao do Teorema do Limite Central. medida que o nmero de jogadas de dados aumenta, a distribuio se aproxima da distribuio normal.

Exerccio Resolvido. Suponha que a concentrao do gs poluente SO2 apresente uma distribuio populacional desconhecida em uma cidade brasileira. A mdia da concentrao = 0,140 ppm e o desvio-padro, = 0,010 ppm so conhecidos na populao. Voc coletou uma amostra aleatria de tamanho n=100, na cidade e mediu o teor de SO2. Qual a probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, ou seja, calcule a seguinte probabilidade: P(0,141 ppm < < 0,142 ppm) = ?

Resoluo:

Pelo Teorema do Limite Central, temos que a mdia amostral segue uma distribuio aproximadamente normal, com esperana, = 0,14 ppm e desvio-padro, =

ppm = 0,001 ppm.

Vamos agora usar a varivel reduzida Z, para calcular as probabilidades.

0,141 0,14 = 1,00 0,001

0,142 0,14 = 2,00 0,001

A probabilidade que se quer pode ser obtida da tabela de probabilidades, atravs do seguinte clculo:

P(1,00 < Z< 2,00) = P(Z<2,00) P(Z<1,00) = 0,9772 0,8413 = 0,1359

Resposta: A probabilidade de a mdia amostral ter um valor entre 0,141 ppm e 0,142 ppm, na populao considerada, ser de 13,59%.

Teste de Hipteses

Muitas vezes precisamos aceitar ou rejeitar o valor de algum parmetro. Para tanto, devemos estabelecer critrios. Os critrios que iremos adotar so estatsticos e obedecem a leis probabilsticas. Uma afirmao sobre um parmetro estatstico, tal como a mdia, ou a varincia, 2 de uma, ou mais de uma populao, denominada hiptese estatstica. O procedimento de tomada de deciso sobre a hiptese denominado teste de hiptese. A hiptese que se quer testar denominada hiptese nula e normalmente denotada por Ho. Por exemplo, a hiptese nula pode ser a de que a mdia populacional seja zero. Podemos express-la da seguinte forma: Ho: = 0. A hiptese oposta hiptese nula denominada hiptese alternativa e denotada por H1 ou por Ha. No exemplo usado, podemos express-la da seguinte forma: H1: 0. importante ressaltar que as hipteses estatsticas so sempre afirmaes sobre a populao, nunca sobre a amostra. Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como erro do tipo I. Vamos supor que hiptese nula seja Ho: = 0 e que chegssemos, atravs de um teste de hiptese, concluso de que ela devesse ser rejeitada. Nesse caso, haveria uma probabilidade de cometer o erro do tipo I. Essa probabilidade denotada por a (alfa). O valor dessa probabilidade denominado nvel de significncia do teste e deve ser fixado pelo estatstico logo no incio do teste de hiptese. Normalmente, o nvel de significncia estabelecido em 1% ou 5%, ou seja, a = 0,01 ou a = 0,05.

a = nvel de significncia do teste.

O teste de hiptese tem determinadas etapas a serem seguidas. A ordem em que elas aparecem abaixo deve ser respeitada, caso contrrio o teste no funciona.

(1) Formular as hipteses, nula e alternativa. Por exemplo: Ho: = 0; H1: 0. (2) Fixar o nvel de significncia do teste de hiptese. Por exemplo: a = 0,05.

(3) Se a hiptese nula for verdadeira, ento existe uma varivel aleatria denominada estatstica de teste, que deve ser calculada e essa estatstica de teste segue uma distribuio de probabilidade conhecida.
Por exemplo: uma amostra de tamanho n=100 obteve mdia amostral padro da populao conhecido, = 0,01. verdadeira, = 0,10. O desvio=

este caso, sabemos que, se a hiptese nula for =


,

reduzida:

0,010. Portanto, a estatstica de teste escolhida, denominada teste Z, ser a distribuio normal =

ter distribuio normal com mdia = 0 e desvio-padro

(4) Estabelecer valores crticos para a estatstica de teste, em funo do nvel de significncia fixado (a = 0,05). A Figura 11 mostra que acima de Z = 1,96 e abaixo de Z = 1,96, a rea total igual a 0,05. Isto significa que a probabilidade de a varivel Z assumir valores na faixa 1,96 > Z >1,96 de 5%. Se a estatstica de teste calculada assumir um valor nessa faixa, ento Ho ser rejeitada com um nvel de significncia de 5%. O valor crtico Zcrt. = 1,96. Esse valor foi encontrado a partir das tabelas de probabilidades. Como se quer P(Z>a) = 0,025 (/2), ento se tem que P(Z<a)=10,025=0,975. Procurando na tabela de probabilidades, encontra-se o valor crtico Z = 1,96. Este um teste bicaudal, ou bilateral.

Figura 11. Distribuio normal reduzida. Valores crticos Z = 1,96 e Z = 1,96. Acima e abaixo desses valores, a rea total igual a 0,05. A regio de rejeio de Ho denominada regio de significncia.

(5) Calcular a estatstica de teste.


.

(6) Deciso. Compara-se a estatstica de teste calculada com o valor crtico. No caso, verifica-se que |Zcalc.|>Zcrit. Em outras palavras, o valor de Zcalc. cai na regio de rejeio de Ho (vide Figura 11). Por isso, rejeita-se Ho com nvel de significncia de 5% (=0,05). Isso significa que a probabilidade de estarmos rejeitando Ho, dado que de fato ela verdadeira, ou seja, a probabilidade de estamos cometendo um erro do tipo I de 5%. (7) Concluso. No exemplo dado, pelos dados amostrais e pelo teste de hiptese efetuado, no temos razes significativas (=0,05) para supor que a mdia populacional seja zero. costume chamar a estatstica de teste (e os dados) de significantes quando a hiptese nula Ho for rejeitada. Inclusive, a regio de rejeio de Ho denominada regio de significncia.

0,10 0 = 100 0,01 100

Valor p

O valor p o menor nvel de significncia que conduz rejeio da hiptese nula Ho, com os dados fornecidos. Por exemplo, vamos supor que em um teste de hiptese, usando a estatstica de teste Z, calculou-se o seguinte valor, na etapa 5: Zcalc. = 2,56. Consultando a tabela de probabilidades, para Z<2,56, encontra-se P(Z<2,56) = 0,9948. O valor p calculado pela expresso abaixo e possui o valor p = 0,0104. Isso quer dizer que o menor nvel em que esses dados so sinificantes seria = 0,0104. p = 2 x [1 P(Z<2,56)] = 2 x [1 0,9948] = 2 x [0,0052] = 0,0104 A Figura 12 ilustra a idia do valor p. Ele simplesmente a soma das reas sombreadas, direita e esquerda no grfico. Quanto maior o valor de Zcalc., menor o valor p. no exemplo usado para explicar o teste de hiptese, encontrou-se Zcalc. = 100. Nesse caso, recorrendo-se tabela de probabilidades, conclui-se que o valor p praticamente zero nesse caso (p=0).

Figura 12. Valor p para Zcalc. = 2,56. p = 2 x [0,0052] = 0,0104. Regras de deciso, baseadas em um valor p

1. Se p, ento rejeite Ho. 2. Se p>, ento falhe em rejeitar Ho.

Erros do Tipo I e II

Tipo I Vimos o erro do tipo I cuja probabilidade se expressa por a (alfa). Rejeitar a hiptese nula Ho, quando de fato ela for verdadeira, definido como erro do tipo I. Vimos que, em um teste de hiptese, essa probabilidade o nvel de significncia do teste e deve ser pr-estabelecida pelo estatstico.

Tipo II Veremos agora o erro do tipo II cuja probabilidade se expressa por (beta). No rejeitar a hiptese nula Ho, quando de fato ela no for verdadeira, definido como erro do tipo II.

Para se calcular necessrio ter uma hiptese alternativa bastante especfica. Vamos usar um exemplo para calcular a probabilidade de erro do tipo II.

Exemplo:

Suponha que o desvio-padro da concentrao do gs poluente SO2 em uma populao seja conhecido, = 0,040 ppm. Considere que tomamos uma amostra de tamanho n =100 e que obtivemos uma mdia amostral = 0,147 ppm.

(a) Testar a hiptese nula de que a mdia populacional seja nvel de significncia em 5%. (b) Calcular o valor p.

= 0,140 ppm. Fixar

(b) Calcular a probabilidade, de erro do tipo II, caso a mdia populacional de fato fosse = 0,147 ppm.

Resoluo:

(a) Teste de hiptese: (1) Hiptese nula e alternativa: Ho: = 0,140 ppm; H1: 0,140 ppm (2) Nvel de significncia: a = 0,05 ( = probabilidade do erro do tipo I) (3) Estatstica de teste:

(4) Valores crticos (para a = 0,05): Zcrt. = 1,96

(5) Clculo da estatstica de teste.

= 1,75

(6) Deciso. |Zcalc.|<Zcrit. Como Zcalc. est na zona de aceitao, no se rejeita Ho.

(7) Concluso. No h razo significativa para rejeitar Ho. Portanto, no h razo para no supor que a mdia populacional da concentrao de SO2 seja = 0,140 ppm.

(b) Clculo do valor p.

p = 2 x [1 P(Z<1,75)] = 2 x [1 0,9599] = 2 x [0,0401] = 0,0802 Como p>, ento falhe em rejeitar Ho.

(c) Clculo de :

Primeiro vamos formular a hiptese nula, Ho original e uma hiptese alternativa, H1 bastante especfica. : = 0,147 ppm os limites da regio crtica, quando na verdade : = 0,140 ppm cair entre

Neste caso, um erro do tipo II ser cometido se a mdia amostral, = 0,147 ppm.

Vamos agora nos basear na transformao para varivel reduzida, abaixo.

Rearranjando a equao acima, encontramos em correspondentes aos valores reduzidos: Zcrt. = 1,96.

os valores crticos

= 1,96 = +1,96

100 100 0,04

0,04

+ 0,147 = 0,13916 + 0,147 = 0,15484

A Figura 13 ilustra o significado da probabilidade de cometer o erro do tipo II, ou seja, o valor de . Trata-se da probabilidade condicional da varivel aleatria assumir valores na faixa 0,13916 < < 0,15484, dado que

verdadeira, ou seja, dada pelas expresses abaixo. =

1,96 <

0,004 2

<

< ,
, ,

|
,

= ,

ppm)

< 1,96 =

= = 0,975 0,025 = = 0,950

< 1,96

= 0,950

< 1,96

Figura 13. Probabilidade de erro do tipo II, = 0,950. = 0,13916 < < 0,15484| : = 0,147 ppm) Veja que a probabilidade de falhar em rejeitar Ho neste caso bastante alta, =95%.

Potncia de um teste

A potncia de um teste pode ser definida como a probabilidade de rejeitar corretamente uma hiptese nula falsa. A potncia de um teste dada por 1. No ltimo exemplo, a potncia do teste era 10,95 = 0,05, ou seja, apena 5%.

Alguns pontos importantes devem ser destacados.

1. O tamanho da regio crtica sempre pode ser reduzida pela seleo apropriada do valor de (alfa). 2. Os erros do tipo I e do tipo II esto relacionados. Uma diminuio em (alfa) implica em um aumento em (beta) e vice-versa, desde que o tamanho da amostra no varie. 3. Um aumento no tamanho da amostra reduzir o valor de (beta), desde que o valor de (alfa) seja mantido constante. 4. Quando Ho for falsa, o valor de (beta) aumenta medida que o valor verdadeiro do parmetro (p.ex. a mdia, ) se aproxima do valor usado em Ho. valor de (beta) diminui medida que aumenta a diferena entre o valor verdadeiro do parmetro e o valor usado em Ho.

Teste t

Uma distribuio de probabilidade importante, relacionada distribuio normal a distribuio t, tambm denominada distribuio t de Student. Ela tem esse nome devido ao estatstico ingls William Sealy Gosset (1876-1937), que a criou sob o pseudnimo de Student, em um artigo publicado em 1908. A distribuio t simtrica, tem forma de sino e bem semelhante curva normal padro, porm com caudas mais largas, ou seja, a distribuio t pode gerar valores mais extremos que a curva normal. O nico parmetro que a define e que caracteriza a sua forma o nmero de graus de liberdade, gl. Quanto maior for esse parmetro, mais prxima da curva normal ela ser. A utilidade da distribuio t para aqueles casos onde no se conhece a varincia populacional, 2. Nestes casos, em um teste de hipteses, ao invs de se usar a estatstica de teste Z, como temos usado at agora, passaremos a usar a estatstica de teste t, calculada de acordo com a equao abaixo.

Na equao acima,

o desvio-padro amostral e =

o tamanho da

amostra. A distribuio t, neste caso possui probabilidades para uma distribuio t com

graus de liberdade, ou

seja, o nmero de graus de liberdade depende do tamanho da amostra. As graus de liberdade tambm podem ser encontradas em uma tabela de probabilidades. No Apndice A2 mostrada a tabela de probabilidades para a distribuio t de Student unilateral. No Apndice A3 mostrada a tabela de probabilidades para a distribuio t de Student bilateral.

Exemplo. Considere uma amostra de n = 27 jogadores de um time de futebol com mdia amostral de massa corprea normal com mdia Resoluo: (1) Hiptese nula e alternativa: Ho: (2) Nvel de significncia: (3) Estatstica de teste: (4) Valores crticos ( = = 0,05

Testar a hiptese de que a amostra foi extrada de uma populao com distribuio = 100 kg. (Considere nvel de significncia de 5%) = 90 kg; H1: 90 kg.

= 90 kg e desvio-padro amostral

= 9,0 kg.

1 = 27 1 = 26):

(5) Clculo da estatstica de teste.

(6) Deciso. |tcalc.|>tcrit. Como tcalc. est na regio de rejeio, rejeita-se Ho com nvel de significncia de 5%. (7) Concluso. Pelos dados amostrais e pelo teste de hiptese, no h razo significativa (=0,05) para supor que a mdia populacional tenha sido extrada de uma populao com distribuio normal com mdia = 100 kg.

= 5,7735

=2,056 (bilateral)

Problemas

Teste Z para uma mdia. Nos problemas abaixo, utilize como critrio de deciso no teste de hiptese tanto o valor crtico Zcrit. quanto o valor p.

1. O Departamento de Agricultura dos EUA reportou que o custo mdio (populacional) para se criar um filho at a idade de 02 anos na zona rural de $ 10 460, com desvio-padro (populacional) de $ 1 540. Uma amostra aleatria de 900 crianas, com idades at 02 anos, na zona rural revelou um custo mdio (amostral) de $ 10 345. H evidncia significativa para se apoiar o relatrio do Departamento de Agricultura dos EUA, com =0,05? 2. Um fabricante de chuveiros para proteo contra incndios afirma que a temperatura mdia (populacional) de ativao do sistema de 57,2 oC, com desvio-padro (populacional) de 1,8 oC. Em uma amostra aleatria de 100 chuveiros, encontra-se uma temperatura mdia (amostral) de 56,1 oC. H evidncia significativa para se apoiar a afirmao do fabricante, com =0,05? 3. Segundo o Instituto Gallup, o tempo mdio (populacional) que leva para os fumantes pararem de fumar permanentemente de 15 anos, com desviopadro (populacional) de 4,3 anos. Uma amostra aleatria com 36 ex-fumantes revelou um tempo mdio (amostral) de 14,8 anos. H evidncia significativa para se apoiar a afirmao do Instituto Gallup, com =0,05? 4. Uma empresa fabrica um refrigerante e afirma que em uma lata de 350 mL de refrigerante h uma massa mdia (populacional) 40 mg de cafena com desviopadro (populacional) de 7,5 mg. Uma amostra aleatria com 49 latas de refrigerante apresentou massa mdia (amostral) de 39,2 mg. H evidncia significativa para se apoiar a afirmao do fabricante, com =0,05? 5. Certo fabricante de cereal matinal afirma que em cada poro de 100 g do cereal h uma massa mdia (populacional) de 230 mg de sdio com desviopadro (populacional) de 10,0 mg. Uma amostra aleatria de 64 pores de cereal forneceu uma massa mdia (amostral) de 232 mg de sdio. H evidncia significativa para se apoiar a afirmao do fabricante, com =0,05?

Teste t para a uma mdia.

6. Uma indstria afirma que a mdia (populacional) do pH na gua do rio mais prximo de 6,8. Uma amostra aleatria de 19 pores de gua forneceu um pH (amostral) de 6,7 e um desvio-padro (amostral) de 0,24. H evidncia significativa para se apoiar a afirmao da indstria, com =0,05? 7. Uma universidade afirma que o nmero mdio (populacional) de horas-aula semanais do corpo docente de 12 h. Um representante estudantil decide estudar uma amostra aleatria de 09 professores e obtm os seguintes resultados, em horas-aula semanais: 11, 08, 12, 13, 10, 12, 06, 12, 14. H evidncia significativa para apoiar a afirmao da universidade, com =0,05?

Captulo 3. Mtodos Grficos e Numricos. Correlao


H correlao entre duas variveis aleatrias quando existe uma relao estatstica entre elas. A Tabela 9 mostra valores para dados amostrados das variveis x e y. Temos aqui uma correlao positiva, pois y tende a aumentar medida que x aumenta. A Figura 14 mostra o grfico desses valores e chamada de diagrama de disperso. A regresso dos dados permite encontrar a funo matemtica que melhor representa a relao entre as variveis. A curva em vermelho na Figura 14 foi obtida por regresso dos dados.

Tabela 9. As variveis x e y esto correlacionadas positivamente.


x 0 1 2 3 4 5 6 7 8 9 10 y 0,0 0,8 4,8 7,2 19,2 20,0 43,2 39,2 76,8 64,8 120

120

100

80

60

40

20

0 0 2 4 6 8 10

x
Figura 14. Diagrama de disperso para os dados da Tabela 9. Em vermelho est a curva de regresso dos dados.

Muitas vezes busca-se correlao entre pares de variveis aleatrias, tais como peso vs. idade, renda vs. consumo, taxa de juros vs. emprstimos, etc. Em Qumica Analtica, normalmente busca-se a correlao entre uma propriedade fsica, como a absorbncia (absoro de luz em um dado comprimento de onda) e a concentrao de um analito em soluo. A Figura 15 mostra uma soluo em uma cubeta de comprimento l, contendo o analito de concentrao c e absortividade molar . A luz incidente tem intensidade I0. Aps passar pela soluo, a luz transmitida possui intensidade I1. Parte da luz incidente foi absorvida pelo analito. Define-se transmitncia, T pela relao: equao abaixo. = = . A absorbncia, A definida pela

Figura 15. Cubeta de comprimento l, contendo uma soluo do analito, de concentrao c e absortividade molar . A luz incidente tem intensidade I0 e a luz transmitida, intensidade I1.

Se o sistema seguir a lei de Beer-Lambert, a absorbncia, A ser funo linear da concentrao, c, conforme mostrado na equao abaixo, onde a absortividade molar da substncia e l o caminho tico, ou seja, a distncia que a luz atravessa pelo material. Neste caso, temos uma correlao linear entre A e c. =

A Tabela 10 mostra os dados de uma anlise qumica, onde foi medida a absorbncia, A para cada concentrao c de um analito em soluo. Tabela 10. A absorbncia e a concentrao, c tem correlao linear positiva.
c / mol L1 Absorbncia

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10

0.012 0.048 0.052 0.088 0.092 0.128 0.132 0.168 0.172 0.208

A Figura 16 mostra o diagrama de disperso dos dados. Aps a regresso dos dados, constri-se uma curva de calibrao que permite obter a concentrao, c do analito em uma amostra, a partir da leitura da respectiva absorbncia, A. A reta de regresso mostrada na Figura 16 e corresponde seguinte equao de regresso: = 2,048 0,003

A notao

corresponde ao valor previsto para a absorbncia.

0.20

0.15

Absorbncia

0.10

0.05

0.00

0.00

0.02

0.04

0.06

0.08

0.10

c / mol L

-1

Figura 16. Diagrama de disperso para os dados da Tabela 10. Em vermelho est a curva de regresso dos dados, que corresponde curva de calibrao.

Coeficiente de Correlao Linear


O coeficiente de correlao linear, r mede a intensidade da relao linear entre os valores das variveis x e y. Ele tambm chamado de coeficiente de correlao de Pearson. Ele calculado pela equao abaixo, onde n o nmero de pontos.

A Tabela 11 apresenta a intensidade da correlao para cada faixa de valores de r. Em geral, em Qumica Analtica interessam apenas as correlaes fortes.

Tabela 11. Intensidade da correlao para cada faixa de valores de r. Coeficiente de Correlao, r 0,8 < =1 <1 Intensidade da Correlao Perfeita Positiva Forte Positiva Moderada Positiva Fraca Positiva nfima Positiva Nula <0 nfima Negativa Fraca Negativa Moderada Negativa Forte Negativa Perfeita Negativa

0,5 < 0,1 < 0<

< 0,8 < 0,1 < 0,5

0,5 < 0,8 < 1 <

0,1 <

=0

< 0,1 < 0,5

= 1

< 0,8

Vamos agora calcular o valor de r para os dados da Tabela 10. Vamos chamar a concentrao de x e a absorbncia de y. Vamos reescrever a Tabela 10, abaixo, acrescentando as colunas xy, x2 e y2 e depois calcular as somatrias que aparecem na equao para r: x, y, xy, x2, y2. No caso, o nmero de pontos n = 10.

xy 0.00012 0.00096 0.00156 0.00352 0.00460 0.00768 0.00924 0.01344 0.01548 0.02080 xy = 0,0774

x2 0.0001 0.0004 0.0009 0.0016 0.0025 0.0036 0.0049 0.0064 0.0081 0.0100 2 = 0,0385 x

y2 0.000144 0.002304 0.002704 0.007744 0.008464 0.016384 0.017424 0.028224 0.029584 0.043264 y2 = 0,15624

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 x = 0,55

0.012 0.048 0.052 0.088 0.092 0.128 0.132 0.168 0.172 0.208 y = 1,1

Usando a equao para r, calculamos o seguinte valor:

10 0,0385 0,55

10 0,0774 0,55 1,1

10 0,15624 1,1

= 0,9912

De acordo com a Tabela 11, trata-se de uma correlao forte positiva. Isto bastante adequado para uma curva de calibrao.

Regresso Linear
O objetivo da regresso linear encontrar a equao da reta que melhor descreve os dados. Para tanto, utiliza-se a equao da reta, dada abaixo, onde x e y so as variveis, a o coeficiente angular e b o coeficiente linear da reta. = +

A regresso linear feita atravs do mtodo dos mnimos quadrados. Neste mtodo, chamam-se yi os valores experimentais da varivel y e chamam-se (yi)calc, os valores de y calculados pela regresso linear, ou seja: = da reta, que minimizem +

O objetivo do mtodo encontrar os valores dos coeficientes a e b, da equao


2,

a somatria dos quadrados das diferenas entre yi e = em relao aos coeficientes a e b, da equao

(yi)calc, dados pela equao abaixo.

Para tanto, derivam-se os

da reta e igualam-se a zero, resultando em um sistema de duas equaes e duas incgnitas, a e b, conforme mostrado abaixo.
2 2 2

Substituindo as expresses para

=0 =0 em termos de a e b, temos:
2 2

=0 =0

Resolvendo as derivadas, chegamos s seguintes equaes:

2 2

=0

1 = 0

Dividindo as equaes acima por 1/2, obtemos as equaes abaixo:

=0 =0

As equaes acima podem ser reescritas na forma:

=0 1 =0

duas equaes acima e chegar s equaes para as constantes a e b.

Como 1 = , ou seja, o nmero de pontos, podemos resolver o sistema de

= =

Vamos agora calcular os valores de a e b para os dados da Tabela 10. Vamos reescrev-la, novamente.

xy 0.00012 0.00096 0.00156 0.00352 0.00460 0.00768 0.00924 0.01344 0.01548 0.02080 xy = 0,0774

x2 0.0001 0.0004 0.0009 0.0016 0.0025 0.0036 0.0049 0.0064 0.0081 0.0100 x2 = 0,0385

y2 0.000144 0.002304 0.002704 0.007744 0.008464 0.016384 0.017424 0.028224 0.029584 0.043264 y2 = 0,15624

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 x = 0,55

0.012 0.048 0.052 0.088 0.092 0.128 0.132 0.168 0.172 0.208 y = 1,1

Vamos usar as equaes para a e b. 10 0,0774 0,55 1,1 = 2,048 10 0,0385 0,55

0,0385 1,1 0,55 0,0774 = 0,003 10 0,0385 0,55

Chegamos ento, a seguinte reta de regresso:

= 2,048

0,003

Captulo 4. Fontes de Erro em Anlise Qumica.

Preciso e Exatido

As medidas que so feitas em uma anlise qumica (massas, volumes, absoro de luz, corrente eltrica, etc.), tm por objetivo final determinar a concentrao, ou o teor de um analito em uma amostra. Em anlise qumica, uma tcnica um princpio qumico, ou fsico, que pode ser usado para analisar uma amostra. Geralmente utiliza-se uma das seguintes tcnicas analticas: Tcnicas clssicas: gravimetria (pesagens) e volumetria (titulaes). Tcnicas espectroqumicas: espectroscopia de ultravioleta-visvel (UV-vis), espectroscopia no infravermelho com transformada de Fourier (FTIR), espectroscopia de absoro atmica (AAS), etc. Tcnicas eletroqumicas: potenciometria, coulometria, voltametria, etc. Um mtodo a aplicao de uma tcnica para a determinao de um analito especfico em uma matriz especfica. Por exemplo, existem mtodos para determinar a concentrao de chumbo (Pb) no solo, na gua, ou no sangue, por espectroscopia de absoro atmica com forno de grafite. Assim como existe um mtodo para determinao do teor de vitamina C, em suplementos vitamnicos, por volumetria de oxirreduo. A repetio de uma medida, pelo mesmo mtodo, indica a preciso (reprodutibilidade) da medida. A diferena entre os valores medidos pelo mesmo mtodo denominada desvio. Um tipo particularmente importante de desvio o desvio-padro. Uma medida precisa aquela que possui um desvio-padro baixo. A diferena entre a mdia dos valores medidos e um valor de referncia, assumido como o valor verdadeiro, o erro da medida. Uma medida exata aquela que possui um erro baixo. A concordncia entre resultados obtidos por mtodos diferentes tambm indica a exatido (veracidade) da medida. A Figura 17 ilustra os conceitos de preciso e exatido, considerando uma srie de medidas efetuadas por um mesmo mtodo. As causas dos erros e dos desvios sero discutidas na seo de Teoria de Erros.

Figura 17. A preciso a medida da disperso dos valores medidos por um mesmo mtodo, geralmente dada pelo desvio-padro. A exatido a diferena entre a mdia dos valores medidos e um valor de referncia, assumido como o valor verdadeiro.

Incertezas Absoluta e Relativa

A incerteza absoluta expressa a margem de incerteza associada a uma medida. Ela depende do instrumento, ou equipamento utilizado na medida. Se a incerteza na leitura da massa em uma balana for de 0,01 g, chamamos a grandeza 0,01 g de incerteza absoluta na leitura da massa. Um objeto de massa 2,68 g medido nessa balana deve ser reportada da seguinte forma: (2,680,01) g. Se a incerteza na leitura do volume em uma bureta calibrada for de 0,02 mL, chamamos a grandeza 0,02 mL de incerteza absoluta na leitura do volume. Um volume de um lquido igual a 18,03 mL, medido nessa bureta, deve ser reportado da seguinte forma: (18,030,02) mL.

A incerteza relativa compara o tamanho da incerteza absoluta, com o valor da medida. Ela definida pela razo entre a incerteza absoluta e o valor da medida. Por isso, adimensional, ou seja, no tem unidade. Quando multiplicada por 100, temos a incerteza relativa percentual (%). Quando multiplicada por 1000, temos a incerteza relativa em partes por mil (%o).

Para um objeto de massa (2,680,01) g, a incerteza relativa percentual de


, ,

100% = 0,4%
, ,

Para um volume de um lquido igual a (18,030,02) mL, a incerteza relativa percentual de

100% = 0,1%

Algarismos Significativos

Algarismos significativos so o nmero mnimo de algarismos necessrios para expressar o valor de um resultado experimental, sem perda de exatido. Esse resultado experimental pode ser obtido de duas formas distintas: (1) diretamente, como na medida da massa de uma substncia, pela pesagem em uma balana, ou na medida do volume de uma soluo, usando uma pipeta, ou uma bureta; (2) indiretamente, como na determinao da concentrao de uma espcie em soluo, atravs de clculos envolvendo as massas e volumes medidos experimentalmente.

O nmero de algarismos significativos expressa a preciso de uma medida. Por exemplo, existem balanas analticas cuja incerteza na medida da massa de 0,00001 g a 0,0001 g (ou 0,01 mg a 0,1 mg) e a balana tcnica, com incerteza de 0,01 g. Assim, um objeto pesado como 2,30385 g, em uma balana analtica, possui seis algarismos significativos. O ltimo algarismo denominado algarismo duvidoso, pois o seu valor no conhecido com certeza, j que a incerteza na medida est na quinta casa decimal. Assim, representa-se

apropriadamente a medida da massa do corpo como (2,30385 0,00001 g). Esse mesmo objeto, pesado em uma balana tcnica deveria apresentar o valor 2,30 g, com trs algarismos significativos. O algarismo duvidoso est agora na segunda casa decimal. Essa medida mais apropriadamente representada como (2,30 0,01 g). A medida feita com a balana analtica possui uma preciso maior que aquela efetuada com a balana tcnica, pois os desvios entre medidas efetuadas na balana analtica so, em princpio, menores. Existem tambm as microbalanas cuja incerteza bem menor, ou seja 0,0000001 g (ou 0,1 g). O algarismo zero, direita, significativo se fizer parte da medida. Por exemplo, em uma massa de 3,81900 g, medida em uma balana com incerteza de 0,01 mg os dois ltimos algarismo (os zeros) so significativos. O algarismo zero no significativo quando apenas expressar a ordem de grandeza. Por exemplo, uma massa de 1,23 mg, medida em uma balana com incerteza de 0,01 mg pode ser expressa como 0,00123 g. Neste caso, a medida possui apenas trs algarismos significativos. Os zeros esquerda no so significativos neste caso, pois expressam apenas converso 1 mg = 0,001 g. Neste caso, til expressar a medida em notao cientfica, colocando apenas os algarismos significativos e a potncia de dez. Neste caso, ficaria 1,23 103 g. O mesmo acontece no caso de uma massa de 2,46 g, medida em uma balana com incerteza de 0,01 g. Pode-se expressar essa massa como 2460 g. Entretanto, o ltimo algarismo, o zero, no significativo, pois apenas expressa a relao de converso 1 g = 1000 mg. Esta medida possui apenas trs algarismos significativos que podem ser expressos de forma mais conveniente, usando a notao cientfica. Neste caso, ficaria 2,46 103 mg.

Adio e Subtrao com Algarismos Significativos

Na adio e subtrao, envolvendo algarismos significativos, vale a seguinte regra prtica:

A soma ou a diferena, de duas ou mais quantidades, dever ter tantas casas decimais quantas existirem na parcela de menor nmero de casas decimais.

Considere os seguintes exemplos:

(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de 0,1 g e outra massa foi determinada como 0,2032 g em uma balana com incerteza de 0,0001 g. Calcule a soma das duas massas. 3,2 +0,2032 ______ 3,4032 O resultado deve ser expresso com uma casa decimal, ou seja, 3,4 g.

(2) A massa de um material foi determinada como 7,31 g em uma balana com incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse pedao foi determinada como 1,2058 g em uma balana com incerteza de 0,0001 g. Calcule a massa do restante do material. 7,31 1,2058 ______ 6,1042 O resultado deve ser expresso com duas casas decimais, ou seja, 6,10 g.

Arredondamento

Quando for necessrio arredondar nmeros, aps operaes matemticas, deve ser seguida a seguinte regra: Se o dgito que segue o ltimo algarismo significativo do resultado for maior ou igual a 5, ento se aumenta o ltimo algarismo significativo do resultado em uma unidade. Caso contrrio, permanece inalterado o ltimo algarismo significativo do resultado. Considere os seguintes exemplos:

(1) Uma massa foi determinada como 3,2 g em uma balana com incerteza de 0,1 g e outra massa foi determinada como 0,4532 g em uma balana com incerteza de 0,0001 g. Calcule a soma das duas massas. 3,2 +0,4532 ______ 3,6532 O resultado deve ser expresso com uma casa decimal e deve ser arredondado, aumentando uma unidade na primeira casa decimal, ou seja, 3,7 g. (2) A massa de um material foi determinada como 7,31 g em uma balana com incerteza de 0,01 g. Cortou-se um pedao do material e a massa desse pedao foi determinada como 1,1226 g em uma balana com incerteza de 0,0001 g. Calcule a massa do restante do material. 7,31 1,1226 ______ 6,1874 O resultado deve ser expresso com duas casas decimais, aumentando uma unidade na segunda casa decimal, ou seja, 6,19 g.

Multiplicao e Diviso com Algarismos Significativos

Na multiplicao e diviso, envolvendo algarismos significativos, vale a seguinte regra:

O produto ou o quociente, de duas ou mais quantidades, no poder ter uma incerteza relativa menor que o fator que possui a menor incerteza relativa.

Felizmente, em muitos casos vale a seguinte regra prtica:

O produto ou o quociente, de duas ou mais quantidades, dever ter tantos algarismos significativos quantos existirem no fator de menor nmero de algarismos significativos.

Considere o seguinte exemplo:

(1) Na titulao de 24,98 mL de uma soluo de HCl, foram gastos 25,11 mL de soluo de NaOH 0,1041 mol/L. Determine a concentrao da soluo de HCl. = = 25,11 0,1041 24,98 / = 0,1046417 /

O resultado deve ser expresso com quatro algarismos significativos, ou seja, [HCl] =0,1046 mol/L. Na seo sobre propagao da incerteza, a partir do erro aleatrio, aprenderemos que nem sempre a regra prtica vlida para multiplicaes e divises. Para tanto, deveremos calcular a propagao das incertezas e utilizar a regra que diz que o resultado no poder ter uma incerteza relativa menor que o fator que possui a menor incerteza relativa.

Teoria de Erros

Existem dois tipos bsicos de erros que acompanham uma medida:

Erros sistemticos (ou determinados). So devidos a falhas nos equipamentos, na pureza dos reagentes, nos mtodos, ou na realizao dos experimentos. Se realizarmos o experimento repetidas vezes, o erro sistemtico repete-se sempre da mesma forma, ou seja, reprodutvel. Por isso, em princpio, os erros sistemticos podem ser descobertos, calculados e corrigidos. Um medidor de pH pode ter sido padronizado incorretamente, levando a leituras de pH sistematicamente menores que o valor verdadeiro, em por exemplo, 0,05 unidades. Neste caso, uma soluo cujo pH verdadeiro fosse 7,00 produziria uma leitura de 6,95 no medidor de pH. Quando se faz uma anlise por volumetria, o uso de um indicador inadequado leva a um erro sistemtico de mtodo. Os erros de mtodo so os mais difceis de serem detectados.

Erros aleatrios (ou indeterminados). So devidos a variveis que no esto sob controle durante o experimento. A probabilidade de o erro aleatrio ser positivo ou negativo a mesma. Este tipo de erro sempre est presente e no pode ser corrigido. Uma pessoa, lendo a mesma escala de um instrumento diversas vezes, provavelmente obter leituras diferentes a cada vez, devido s interpolaes subjetivas que so feitas entre as marcaes da escala. Rudos eltricos aleatrios em equipamentos tambm levam a flutuaes positivas e negativas nas medidas. Por sua natureza aleatria, este tipo de erro pode ser tratado estatisticamente.

Propagao da Incerteza, a partir do Erro Aleatrio

Considere que todos os erros sistemticos foram detectados e corrigidos. Na maioria dos experimentos necessrio realizar operaes aritmticas envolvendo diversos nmeros, cada um deles associado a um erro aleatrio. As incertezas se propagam durante as operaes aritmticas. Qual a incerteza do resultado de uma operao aritmtica envolvendo nmeros associados a erros aleatrios?

Adio e Subtrao

Considere a operao aritmtica abaixo, envolvendo adio e subtrao de nmeros e suas respectivas incertezas absolutas (e1, e2, e3). Qual o valor da incerteza absoluta e4, do resultado?

1,76 (0,03) e1 +1,89 (0,02) e2 0,59 (0,02) e3 _______________ 3,06 (e4)

O valor da incerteza absoluta e4, do resultado de somas e adies dado pela equao abaixo: = + +

No caso da operao aritmtica acima, o valor da incerteza absoluta e4, do resultado calculado pela equao acima, conforme mostrado abaixo. = 0,03 + 0,02 + 0,02

0,0009 + 0,0004 + 0,0004 = = 0,04 0,0017

Normalmente, utiliza-se representar o primeiro algarismo no significativo como subscrito (0,041) para evitar erros de arredondamento nos clculos subseqentes que utilizem esse nmero. A incerteza relativa percentual, % % = 0,04 100% = 1, % 3,06 do resultado dada pela equao abaixo.

Resultado: 3,06(0,04) incerteza absoluta; 3,06(1%) incerteza relativa percentual.

Multiplicao e Diviso

Considere a operao aritmtica abaixo, envolvendo multiplicao e diviso de nmeros e suas respectivas incertezas absolutas (e1=0,03, e2=0,02, e3=0,02). Qual o valor da incerteza absoluta, e4 e da incerteza relativa percentual, % 1,76 0,03 1,89 0,02 = 5,64 0,59 0,02 O valor da incerteza relativa percentual %e4, do resultado de multiplicaes e divises dado pela equao abaixo, envolvendo as incertezas relativas percentuais dos fatores da operao. % = % +% +% do resultado?

Primeiro temos que encontrar as incertezas relativas percentuais dos fatores da operao. % % % = = = 0,03 100% = 1, % 1,76

0,02 100% = 1, % 1,89 0,02 100% = 3, % 0,59

Calcula-se, assim, o valor da incerteza relativa percentual %e4, do resultado da operao acima, conforme mostrado abaixo.

1,7

2,89 + 1,21 + 11,56

+ 1,1

+ 3,4

= 4, %

15,66

A incerteza absoluta, e4 do resultado ento encontrado conforme mostrado abaixo. % 100

= 0, 2

100

4,0

5,64

Resultado: 5,64(0,23) incerteza absoluta; 5,64(4,0%) incerteza relativa percentual. O resultado possui apenas dois algarismos significativos.

Tratamento Estatstico dos Erros Aleatrios

Na ausncia de erros sistemticos, os erros aleatrios permanecem e no podem ser detectados e corrigidos. Entretanto, os erros aleatrios seguem a lei de distribuio normal, discutida no Capitulo 2. Em uma srie de medidas experimentais, tem-se um conjunto de dados amostrais , , , . Com esses dados, pode-se calcular a mdia amostral, eo utilizando as equaes abaixo, discutidas anteriormente,

desvio-padro amostral,

onde N o nmero de dados amostrais, ou seja, o tamanho da amostra.

= =

1 1

O intervalo de confiana para a mdia populacional, pode ser estimado a partir da mdia amostral, , do tamanho da amostra, N e do desvio-padro da

populao, ou da amostra, s. Usam-se as equaes abaixo, em cada caso.

= =

Um intervalo de confiana diz que o valor da mdia populacional est compreendido em um certo intervalo, com uma certa probabilidade. As probabilidades so dadas pelos valores de z ou t e so encontradas nas tabelas dos Apndices.

Exemplo 1. Uma srie de uma mdia amostral de de 95%. = 0,03

/ . Determine o intervalo de confiana da mdia com uma probabilidade

= 3,78

= 9 medidas de concentrao de um analito produziu / . Sabe-se que o desvio-padro populacional

Soluo: Usaremos a Tabela A1 do apndice. Temos de encontrar o valor de z cuja rea entre -z e +z seja de 95%. Nesse caso, a rea fora desse intervalo dada pelo clculo 10,95 = 0,05. Logo, a rea acima de z dada por 0,05/2 = 0,025. A Tabela A1 fornece as reas abaixo de z. Portanto, temos de encontrar o valor de z cuja rea esquerda seja 10,025 = 0,975. Procurando na Tabela A1, encontramos z = 1,96. Portanto a mdia populacional est no intervalo de confiana abaixo, com probabilidade de 95%. = 3,78 1,96 = 3,78 1,96 0,03 0,03 3 9

= 3,78 1,96 0,01 = 9 medidas de concentrao de um analito produziu = 3,78 0,01

Exemplo 2. Uma srie de uma mdia amostral de de 95%. = 0,03

/ . Determine o intervalo de confiana da mdia com uma probabilidade

= 3,78

/ . Sabe-se que o desvio-padro amostral

Soluo: Usaremos a Tabela A3 do apndice. Temos de encontrar o valor de t cuja rea entre -t e +t seja de 95%, com N1 = 91 = 8 graus de liberdade (gl). Procurando na Tabela A3, para 95% e gl=9, encontramos t = 2,306. Portanto a mdia populacional est no intervalo de confiana abaixo, com probabilidade de 95%. = 3,78 2,306 = 3,78 2,306 = 3,78 0,02 0,03 0,03 3 9

= 3,78 2,306 0,01

Na ausncia de erro sistemtico o valor da mdia populacional, coincide com o valor verdadeiro Xv. Na presena de erro sistemtico, o erro dado por = .

APNDICES

A1. Tabela de probabilidades para distribuio normal reduzida.

Probabilidades Esquerda P(Z<a)


a a | 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 ----+------------------------------------------------------------------------------0.0 | 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 | 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 | 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 | 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 | 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 | 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 | 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 | 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 | 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 | 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 | 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 | 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 | 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 | 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 | 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 | 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 | 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 | 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 | 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 | 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 | 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 | 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 | 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 | 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 | 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 | 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 | 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 | 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 | 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 | 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 | 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

A2. Tabela de probabilidades para a distribuio t de Student unilateral com graus de liberdade.
gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 Os valores tabelados correspondem aos pontos a tais que: p=0,600 p=0,750 p=0,900 p=0,950 p=0,975 p=0,990 0,325 1,000 3,078 6,314 12,706 31,821 0,289 0,816 1,886 2,920 4,303 6,965 0,277 0,765 1,638 2,353 3,182 4,541 0,271 0,741 1,533 2,132 2,776 3,747 0,267 0,727 1,476 2,015 2,571 3,365 0,265 0,718 1,440 1,943 2,447 3,143 0,263 0,711 1,415 1,895 2,365 2,998 0,262 0,706 1,397 1,860 2,306 2,896 0,261 0,703 1,383 1,833 2,262 2,821 0,260 0,700 1,372 1,812 2,228 2,764 0,260 0,697 1,363 1,796 2,201 2,718 0,259 0,695 1,356 1,782 2,179 2,681 0,259 0,694 1,350 1,771 2,160 2,650 0,258 0,692 1,345 1,761 2,145 2,624 0,258 0,691 1,341 1,753 2,131 2,602 0,258 0,690 1,337 1,746 2,120 2,583 0,257 0,689 1,333 1,740 2,110 2,567 0,257 0,688 1,330 1,734 2,101 2,552 0,257 0,688 1,328 1,729 2,093 2,539 0,257 0,687 1,325 1,725 2,086 2,528 0,257 0,686 1,323 1,721 2,080 2,518 0,256 0,686 1,321 1,717 2,074 2,508 0,256 0,685 1,319 1,714 2,069 2,500 0,256 0,685 1,318 1,711 2,064 2,492 0,256 0,684 1,316 1,708 2,060 2,485 0,256 0,684 1,315 1,706 2,056 2,479 0,256 0,684 1,314 1,703 2,052 2,473 0,256 0,683 1,313 1,701 2,048 2,467 0,256 0,683 1,311 1,699 2,045 2,462 0,256 0,683 1,310 1,697 2,042 2,457 0,255 0,681 1,303 1,684 2,021 2,423 0,254 0,679 1,296 1,671 2,000 2,390 0,254 0,677 1,289 1,658 1,980 2,358 0,253 0,674 1,282 1,645 1,960 2,326 p=0,995 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576 p=0,9995 636,619 31,598 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,689 3,674 3,660 3,646 3,551 3,460 3,373 3,291

A3. Tabela de probabilidades para a distribuio t de Student bilateral com graus de liberdade.

gl

A 0.80 0.90 0.95 0.98 0.99 0.995 0.998 0.999 P 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 3.078 6.314 12.706 31.820 63.657 127.321 318.309 636.619 1 2 3 4 5 6 7 8 9 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 1.638 2.353 3.182 4.541 5.841 7.453 1.533 2.132 2.776 3.747 4.604 5.598 1.476 2.015 2.571 3.365 4.032 4.773 1.440 1.943 2.447 3.143 3.707 4.317 1.415 1.895 2.365 2.998 3.499 4.029 1.397 1.860 2.306 2.897 3.355 3.833 1.383 1.833 2.262 2.821 3.250 3.690 1.372 1.812 2.228 2.764 3.169 3.581 1.363 1.796 2.201 2.718 3.106 3.497 1.356 1.782 2.179 2.681 3.055 3.428 1.350 1.771 2.160 2.650 3.012 3.372 1.345 1.761 2.145 2.625 2.977 3.326 1.341 1.753 2.131 2.602 2.947 3.286 1.337 1.746 2.120 2.584 2.921 3.252 1.333 1.740 2.110 2.567 2.898 3.222 1.330 1.734 2.101 2.552 2.878 3.197 1.328 1.729 2.093 2.539 2.861 3.174 1.325 1.725 2.086 2.528 2.845 3.153 1.323 1.721 2.080 2.518 2.831 3.135 1.321 1.717 2.074 2.508 2.819 3.119 1.319 1.714 2.069 2.500 2.807 3.104 1.318 1.711 2.064 2.492 2.797 3.090 1.316 1.708 2.060 2.485 2.787 3.078 1.315 1.706 2.056 2.479 2.779 3.067 1.314 1.703 2.052 2.473 2.771 3.057 10.215 12.924 7.173 5.893 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 3.850 3.819 3.792 3.768 3.745 3.725 3.707 3.690

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

28 29 30 31 32 33 34 35 36 37 38 39 40 42 44 46 48 50 60 70 80 90 100 120 150 200 300 500

1.313 1.701 2.048 2.467 2.763 3.047 1.311 1.699 2.045 2.462 2.756 3.038 1.310 1.697 2.042 2.457 2.750 3.030 1.309 1.695 2.040 2.453 2.744 3.022 1.309 1.694 2.037 2.449 2.738 3.015 1.308 1.692 2.035 2.445 2.733 3.008 1.307 1.691 2.032 2.441 2.728 3.002 1.306 1.690 2.030 2.438 2.724 2.996 1.306 1.688 2.028 2.434 2.719 2.991 1.305 1.687 2.026 2.431 2.715 2.985 1.304 1.686 2.024 2.429 2.712 2.980 1.304 1.685 2.023 2.426 2.708 2.976 1.303 1.684 2.021 2.423 2.704 2.971 1.302 1.682 2.018 2.418 2.698 2.963 1.301 1.680 2.015 2.414 2.692 2.956 1.300 1.679 2.013 2.410 2.687 2.949 1.299 1.677 2.011 2.407 2.682 2.943 1.299 1.676 2.009 2.403 2.678 2.937 1.296 1.671 2.000 2.390 2.660 2.915 1.294 1.667 1.994 2.381 2.648 2.899 1.292 1.664 1.990 2.374 2.639 2.887 1.291 1.662 1.987 2.369 2.632 2.878 1.290 1.660 1.984 2.364 2.626 2.871 1.289 1.658 1.980 2.358 2.617 2.860 1.287 1.655 1.976 2.351 2.609 2.849 1.286 1.652 1.972 2.345 2.601 2.839 1.284 1.650 1.968 2.339 2.592 2.828 1.283 1.648 1.965 2.334 2.586 2.820 1.282 1.645 1.960 2.326 2.576 2.807

3.408 3.396 3.385 3.375 3.365 3.356 3.348 3.340 3.333 3.326 3.319 3.313 3.307 3.296 3.286 3.277 3.269 3.261 3.232 3.211 3.195 3.183 3.174 3.160 3.145 3.131 3.118 3.107 3.090

3.674 3.659 3.646 3.633 3.622 3.611 3.601 3.591 3.582 3.574 3.566 3.558 3.551 3.538 3.526 3.515 3.505 3.496 3.460 3.435 3.416 3.402 3.391 3.373 3.357 3.340 3.323 3.310 3.291