You are on page 1of 96

Notas de Aula de Estatstica

Professor Kleison Freitas

2015.2

Informaes Sobre a Disciplina


Apresentao
Cursando a disciplina de Estatstica, o acadmico poder utilizar a ferramenta estatstica na tomada de
decises que tangem s funes empresariais ou acadmicas, atravs de uma postura crtica e reflexiva.

Objetivos
1. Compreender o uso da estatstica na prtica acadmica ou empresarial;
2. Desenvolver clculos bsicos da estatstica e interpret-los;
3. Utilizar a objetividade e a probabilidade como uma base nas tomadas de decises;
4. Entender o uso e a importncia da inferncia e da previso estatstica em pesquisas de mercado, de
opinio e em consultorias empresariais.

Metodologias e Recursos
Utilizar as tcnicas estatsticas atravs de aulas expositivas, prticas em laboratrio de informtica com
uso do Microsoft Excel e apresentao de cases pelo professor, possibilitando o discente na resoluo de
problemas em sua rea de atuao e formao.

Sistema de Avaliao
Verificar no Portal da disciplina

Sistema de frequncia
O aluno deve ter no mnimo 75% de frequncia. Se o aluno tiver acima de 15 faltas estar reprovado por
falta, visto que cada aula so trs faltas ou trs presenas, respectivamente.

Bibliografia Recomendada
Bsica:
TRIOLA, M. F. Introduo Estatstica. 11 Edio. Rio de Janeiro. Livros Tcnicos e Cientficos,
2013.
MORETIN, L. G. Estatstica bsica: Probabilidade e Inferncia. Volume nico. So Paulo: Pearson,
2010.
LAPONNI, J.C. Estatstica Usando o Excel. 4 Edio. Editora Campus, 2005.
Complementar:
LEVIN; FOX; FORDE. Estatstica para Cincias Humanas. 11 Edio. So Paulo: Pearson, 2012.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 2

Informaes Sobre o Professor


Nome: Kleison de Paiva Freitas
E-mail: kfreitas@fanor.edu.br
Graduao
Curso: Estatstica
Instituio: Universidade Federal do Cear
Ano de Concluso: 2004
Ps-Graduao
Curso: Mestrado em Logstica e Pesquisa Operacional
Instituio: Universidade Federal do Cear
Ano de Concluso: 2009
Tema da dissertao: Alinhamento Estratgico na Cadeia Logstica de Flores do Cear Um estudo de
caso no municpio de Ubajara
Experincia no Magistrio
1. Professor da Universidade Federal do Cear (UFC).
Setor de estudo: Probabilidade e Estatstica.
Departamento de Estatstica e Matemtica Aplicada (DEMA) do Centro de Cincias.
Cursos em que j ministrou/ministra aulas: Biblioteconomia, Cincias Atuariais, Cincias Biolgicas,
Cincias Contbeis, Cinema, Computao, Engenharia de Alimentos, Engenharia Eltrica, Engenharia
Mecnica, Engenharia Metalrgica, Engenharia de Pesca, Geografia, Qumica, Matemtica e Publicidade
e Propaganda.
De Abril de 2006 a Janeiro de 2014.
2. Professor das Faculdades Nordeste (FANOR)/Devry Brasil.
Cursos de graduao em que ministrou/ministra aulas: Administrao, Cincias Contbeis, Construo de
Edifcios, Engenharia Ambiental, Engenharia Civil, Engenharia Eltrica, Engenharia de Produo,
Engenharia Qumica, Gesto Comercial, Logstica, Marketing, Nutrio, Processos Gerenciais,
Psicologia, Recursos Humanos e Sistema de Informao.
Disciplinas: Estatstica, Bioestatstica e Pesquisa Operacional.
Desde Agosto de 2007.
Curso de ps-graduao em que ministrou/ministra aulas: MBAs em Negcios.
Disciplina: Mtodos Quantitativos e Pesquisa Operacional.
Desde Abril de 2010

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 3

Calculadoras Sugeridas e Obrigatrias

Modelo Casio fx 82 MS

ou

HP Modelo: 12C

Programa Da Disciplina
CONTEDO
Nota de Aula 1 Introduo Geral Estatstica: Conceito de Estatstica; Aplicaes; Origem;
Pesquisa de Mercado e de Opinio: Etapas, Objetivo, Briefing, Variveis; Pesquisas Qualitativas,
Quantitativas e seus mtodos;
Nota de Aula 2 - Amostragem: Inferncia Estatstica; Populao; Parmetro; Amostra; Estimativa;
Margem de erro; Tcnicas de amostragem; Amostras no probabilstica; Amostras probabilsticas.
Nota de Aula 3 - Medidas descritivas para dados no agrupados: Medidas de tendncia central:
Mdia aritmtica simples; Moda; Mediana; Separatrizes, Box Plot; Medidas de disperso: Amplitude
total; Varincia; Desvio padro; Coeficiente de variao.
Nota de Aula 4 Correlao e Regresso Linear: Mtodos de Previso Estatstica.
Nota de Aula 5 - Medidas descritivas para dados agrupados Distribuio de Frequncias: Tipos
de Frequncias, Histograma, Polgono de Frequncias, Ogiva de Galton, Assimetria, Curtose. Medidas
de tendncia central e Disperso para dados agrupados.
Nota de Aula 6 Probabilidade: Conceitos Iniciais, Definio, Teorema da Soma e da Multiplicao
e Probabilidade Condicional.
Nota de Aula 7 Tabelas Estatsticas e Grficos atravs do Microsoft Excel: Tabelas; Elementos
fundamentais de uma tabela; Normas de construo de tabelas; Quadros; Banco de dados; Srie
estatstica; Caracterstica de uma srie estatstica; Tipos de sries estatsticas; Grficos; Elementos
essenciais dos grficos; Tipos de grficos; Estatsticas descritivas para dados no agrupados.
Nota de Aula 8 - Distribuio Normal de Probabilidade: Introduo breve Probabilidade e Uso da
tabela da Normal.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 4

Nota de Aula 1 Introduo Geral Estatstica


1. ESTATSTICA: uma cincia que utiliza teorias probabilsticas para explicar a frequncia da
ocorrncia de eventos, tendo como objetivo maior obter, organizar e analisar dados, a fim de estimar a
previso de fenmenos, conforme o caso estudado.
De forma prtica e didtica, a estatstica se resume na:

Coleta de Dados

Tratamento dos
Dados

Apresentao dos
Resultados

A estatstica uma cincia importante, til e com um escopo abrangente de aplicao em


negcios, administrao poltica fsica e cincias sociais, dentre outras reas, quase ilimitado.
Na prtica empresarial e industrial, a Estatstica uma ferramenta-chave e segura para entender
sistemas variveis, controlar processos, sumarizar dados e tomar decises baseados nos mesmos.

1.1. Aplicaes: Algumas cincias utilizam estatstica como uma ferramenta prpria, possuindo-a com
suas terminologias prprias, como sendo:
Bioestatstica: o planejamento, coleta, avaliao e interpretao de todos os dados obtidos em
pesquisa na rea biolgica, mdica e reas da sade em geral;
Estatstica Econmica ou Econometria: um ramo da estatstica direcionado para a anlise de
fenmenos econmicos;
Estatstica aplicada Engenharia: um ramo da estatstica que estuda as suas aplicaes no controle de
processos de produtos e servios, no planejamento de novas estratgias de produo, nas vendas, no
controle de qualidade, em ensaios destrutivos e no destrutivos, com o objetivo de verificar a
porcentagem de peas no conforme as especificaes ou a probabilidade de vida de equipamentos ou
peas, dentre outras;
Estatstica Fsica: o ramo da fsica que atravs da estatstica analisa sistemas fsicos de alta
complexidade, com elevado nmero de entidades constituintes, como os tomos, as molculas, os ons,
entre outros;
Estatstica aplicada Contabilidade: A estatstica utilizada na rea da contabilidade para comparar o
sexo de carteira de clientes, para comparar cargos de funcionrios da empresa, onde se compara o custo
gasto colocando os mais importantes acima da pirmide para comparao entre cargos similares, variao
e montagem na estrutura de cargos e salrios, contagem de estoque, de imobilizado, perdas, juros, dentre
outros;
Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 5

Estatstica Populacional: o ramo da estatstica relacionado populao e demografia (rea da


cincia geogrfica que estuda a dinmica populacional humana, ou seja, as taxas de natalidade,
mortalidade, imigrao, emigrao, densidade populacional, IDH, dentre outros);
Estatstica Social: o ramo da estatstica que avalia fatores relativos realidade social, econmica e
ambiental de um pas e seu uso para a formulao e a avaliao de polticas pblicas;
Estatstica Comercial;
Estatstica Psicolgica;
Dentre outras reas.

1.2. Origem:
A palavra estatstica originou-se da expresso latina statisticum, que significa Estado, que
depois de vrias significados, surgiu em alemo a palavra statistik que significa anlise de dados sobre o
Estado. O Estado teve fundamental importncia na origem da Estatstica como cincia, pois
originalmente, as estatsticas eram colhidas para as finalidades relacionadas com o Estado, como os
recenseamentos, por exemplo. Como disciplina, s no sculo XIX que se estruturou, mas j era
conhecida desde a antiguidade, h mais de 4 mil anos.
Nas decises do dia-a-dia, o indivduo h de forma direta ou indireta que se basear em dados
observados para isso. Por exemplo, ao decidir pelo seguro de um carro de uma determinada seguradora,
geralmente, este procura verificar se este seguro satisfaz as suas necessidades, ou seja, se o seu preo
compatvel com o seu oramento, alm de outras caractersticas.
Posteriormente, compara se dados deste seguro com o de outras seguradoras e, atravs de uma
anlise processada internamente em sua mente, toma-se a deciso de adquiri-lo ou no.
Essa analogia no difere na realizao das pesquisas cientficas, que tem por objetivo responder
as indagaes ou comprovar as hipteses elaboradas pelo pesquisador. E para isso, preciso,
inicialmente, coletar dados que possam fornecer informaes relevantes para responder esses
questionamentos, mas para que os resultados da pesquisa sejam confiveis, tanto a coleta de dados quanto
a sua anlise devem ser feitas de forma criteriosa e objetiva. Para isso, o planejamento eficaz da
realizao de uma pesquisa cientfica necessrio. Mas para isso necessrio entender o que realmente
uma pesquisa.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 6

1.3. Variveis: So as caractersticas associadas ao objeto de estudo investigado ou do experimento


realizado. Podendo ser:
Qualitativas ou Categorizadas: So variveis que exprimem qualidade do elemento investigado.
Podendo ser:
Nominal: Quando o dado se apresenta sob o aspecto qualitativo e no importa a ordem de
disposio delas, ou seja, no h uma hierarquia embutida.
Exemplos: Marca do Produto, Tipo de Produto, rea da Indstria, dentre outros.
Ordinal: Quando h uma hierarquia embutida, ou seja, um grau de relevncia de um indivduo
para outro mediante suas caractersticas.
Exemplos: Classe social, Grau de instruo, Desempenho (timo, bom, regular, ruim e pssimo),
Cargo dos funcionrios na empresa, Grau de dor (forte, moderada ou leve), dentre outros.
Quantitativas ou Numricas: So atributos resultantes de uma contagem ou mensurao. Podendo
ser:
Discreta: So todas as variveis numricas cujos valores se obtm a partir de procedimento de
contagem originado de um conjunto amostral finito ou enumervel. As variveis discretas assumem
valores inteiros. Exemplos: Nmero de maquinrios em uma indstria, Nmero de produtos
produzidos a cada hora por uma indstria, dentre outros.
Contnua: So variveis numricas cujos valores so obtidos por procedimento de mensurao (ou
no enumervel), de sorte que ao menos teoricamente, os resultados das medidas so capazes de
variaes insensveis ou contnuas. As variveis contnuas podem assumir qualquer valor num
intervalo contnuo e so quantificadas em uma escala infinita de valores, por isso, diz-se que as
variveis contnuas so muito informativas. Exemplos: Peso, Altura, Temperatura, Espessura,
Velocidade, Idade, Renda (em Reais), dentre outros.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 7

Nota de Aula 2 Amostragem


1. INTRODUO:
O profissional, na grande maioria das vezes, trabalha com limitaes de tempo, escassez
financeira, de recursos humanos, de produtos, de materiais, dentre outros, impedindo-o de analisar afundo
o processo como um todo, mas de um lado no se faz necessrio estud-lo por inteiro, pois a Estatstica
defende que apenas o estudo de uma parcela deste pode atender de forma eficaz s necessidades
desejadas.
Desta forma, quando se deseja estudar uma populao (ou universo) especfica, o pesquisador
tem duas formas possveis de faz-lo, ou de forma censitria, o que exige a observao de todos os
elementos que formam essa populao, ou analisar apenas uma parcela que represente este universo, ou
seja, uma amostra.
A finalidade da amostragem permitir fazer suposies, predies, generalizaes (ou
inferncias) acerca de caractersticas de uma populao com base na anlise de apenas alguns de seus
elementos. Essa tcnica amplamente utilizada em diversas situaes do dia-a-dia das empresas e de
vrios pesquisadores, de vrias reas profissionais, pois proporciona economia de recursos, de tempo,
rapidez nos resultados e maior controle. No caso das indstrias, a verificao da qualidade de seus
produtos, um exemplo disto, pois impossvel analisar todos os produtos fabricados, pois muitos deles
aps a anlise no podem ser mais comercializados, desta forma, isto implica em prejuzo para a empresa,
portanto recorrer a um estudo de amostragem o indicado. Outro exemplo, analisar a opinio de
moradores de um determinado bairro de um municpio em que analisar todos alm de alto custo,
demorado e inacessvel a todos.
Desta forma, conhecer e entender os procedimentos bsicos aplicveis realizao de estudos
estatsticos por inferncia e por consequncia utilizando uma amostra significativa, uma condio si ne
qua non para qualquer profissional de qualquer rea, que queira ter uma segurana e consistncia nas
tomadas de decises. Assim, para se inteirar do assunto, alguns conceitos iniciais so necessrios:
2. CONCEITOS INICIAIS:
2.1. Inferncia Estatstica: o processo de generalizao do universo a partir de resultados particulares,
ou seja, consiste em obter e generalizar concluses para o todo com base no particular, isso quer dizer que
a partir de amostras tiram-se concluses para a populao.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 8

2.2. Populao (N): o conjunto de todos os elementos que possuem em comum determinadas
caractersticas de interesse para uma pesquisa. Por exemplo: Pessoas, Maquinrios, Solues Qumicas,
Produtos, dentre outros.
Quanto ao tamanho, a populao pode ser classificada como finita ou infinita. Desta forma, as
finitas so as que possuem um tamanho limitado de elementos, em que possvel identificar do primeiro
at o ltimo componente populacional, analogamente, as infinitas so aquelas cujo nmero de elementos
ilimitado, ou seja, impossvel de identificar o ltimo indivduo. Assim, a populao, nesse caso to
grande que dificultoso a sua anlise com preciso.
Portanto, a escolha em analisar toda a populao (censo) uma deciso arbitrria do
pesquisador. Desta forma, os pesquisadores que optarem em utilizar o censo tero que verificar a seguinte
medida estatstica conhecida como parmetro.

2.3. Parmetro: a medida usada para descrever uma caracterstica numrica da populao em estudo e
para isso necessrio uma anlise integral desta. Assim, como na prtica este procedimento se torna
invivel, seu valor quase sempre desconhecido, na maioria das vezes. Um exemplo prtico de parmetro
a Idade mdia de todos os alunos de uma sala de aula, ou seja, a mdia () e a varincia (2), so
exemplos de parmetros.
Muitos pesquisadores defendem que o censo proporciona uma preciso incontestvel nos
resultados estatsticos, pois todo o universo analisado. No entanto, essa preciso pode ser contestada por
diversos fatores, dentre eles, as mudanas comportamentais dos componentes da populao, nos casos em
que a pesquisa demanda perodo longo, ou por erros de coleta de dados, como informaes inverdicas,
dentre outras. Ento, para abster-se desses fatores que o censo pode causar de forma implcita e, muitas
das vezes, explcita, a utilizao da amostragem uma soluo, pois a mesma permite que o pesquisador,
ao contrrio do censo, cometa alguns equvocos previsveis e aceitveis ao estudo, mas para que esses
equvocos sejam tolerveis, faz-se necessrio que o pesquisador entenda estatisticamente o que
amostragem.

2.4. Amostra (n): uma parcela significativa de uma populao, ou seja, uma parte da populao que a
representa estatisticamente.
Os pesquisadores que optarem em utilizar o processo de amostragem tero que utilizar as
seguintes medidas estatsticas conhecidas como estimativa e margem de erro.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 9

2.5. Estimativa: o valor numrico do estimador obtido com base nos resultados amostrais. Um
exemplo prtico de estimativa a Idade mdia de uma parte significativa dos alunos de uma sala de aula,
ou seja, a mdia amostral ( x ), a varincia amostral (S), so exemplos de estimadores.

2.6. Margem de Erro (e): Um estudo em que se optou na utilizao da amostragem como mtodo de
coleta de dados, sempre apresentar uma falha embutida nas suas anlises, visto que no se analisou
todo o universo. Essa falha conhecida como margem de erro (ou erro amostral), e tem uma relao
forte e inversamente proporcional com o tamanho da amostra e dos resultados que foram obtidos com a
pesquisa, ou seja, quanto maior for a quantidade de elementos pesquisados, menor a quantidade de erros
cometidos, ou seja, menor a margem de erro, mas em contra partida, maior o custo financeiro da mesma.
E vice-versa quando o tamanho amostral for menor.
Um exemplo prtico de margem de erro visto nas pesquisas eleitorais em que atravs de uma
amostragem de eleitores um determinado candidato aparece com um percentual de tantos por centos de
aceitao ao pleito, levando-se em considerao a margem de erro tolervel de tantos pontos percentuais
para mais ou para menos, ou seja, ele estar entre x% e y% dentro da margem de erro, isso quer dizer que,
se fosse analisada toda a populao de eleitores, existem uma possibilidade de que no dia da eleio o
resultado percentual do candidato fique entre x% e y%.
A margem de erro definida, na grande maioria das vezes, antes da coleta de dados, para evitar
assim retrabalho aos pesquisadores do estudo, pois caso a margem de erro fique muito alta (acima de 5%
para mais ou para menos), o retrabalho inevitvel ocasionando um custo a mais a quem encomendou a
pesquisa, e isso ocorre, na prtica, por falta de planejamento amostral adequado ao estudo almejado.
Assim, para planejar um estudo estatstico com uso de amostragem faz-se necessrio conhecer
dois processos bsicos de amostragens, as amostras no probabilsticas e as probabilsticas.

3. TCNICAS DE AMOSTRAGEM:
3.1. Amostras No Probabilsticas: Uma amostra no probabilstica (ou no casual ou no aleatria),
quando a probabilidade de seleo de cada unidade amostral da populao desconhecida. Nesse caso,
no se podem supor os resultados obtidos para o universo da populao, visto que a amostra, por ser no
probabilstica no significativa. Desta forma, devem ser evitadas, porque alm de no conhecer a
margem de erro e a confiabilidade, introduzem tendenciosidade (ou vis ou vcio) na seleo das unidades
e estimao das mesmas, ou seja, distorcendo os dados do estudo para uma determinada direo.
As amostras no probabilsticas mais comuns so:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 10

a) Amostras por Convenincia: As amostras por convenincia ocorrem quando as unidades a serem
analisadas esto mais acessveis ao pesquisador de acordo com as convenincias sociais, econmicas, de
tempo, dentre outras. um tipo de amostragem que vantajosa por ser rpida, de baixo custo e de fcil
acessibilidade, mas no h nada que a credite estatisticamente.
b) Amostras por Cotas: So amostras em que se leva em conta a porcentagem de alguma(s)
caracterstica(s) da populao de origem.
c) Amostras por Julgamento ou Intencional: uma forma de amostragem por convenincia na qual os
elementos populacionais so selecionados com base no julgamento arbitrrio do pesquisador, ou seja, o
pesquisador identifica os elementos que corroboraro com o objetivo do seu estudo sem o risco de fugir
deste objetivo pr-definido, ou seja, no h uma escolha aleatria dos elementos pesquisados e sim o
contrrio.

d) Amostras de Voluntrios: Quando a pesquisa inclui alguns procedimentos perigosos, difceis ou


dolorosos, desta forma a amostragem de sujeitos voluntrios a mais indicada, pois somente voluntrios
estaro dispostos a participar. O problema deste tipo de amostragem que ao ser colocado um anncio
em uma rede social, por exemplo, para recrutar voluntrios, s respondero pessoas muito especiais,
como por exemplo, pessoas aventureiras, ou as pessoas mais corajosas ou as mais motivadas. E muita das
vezes, este tipo de pessoa, nem faz parte do pblico-alvo do estudo.

3.2. Amostras Probabilsticas: Uma amostra probabilstica (ou ao acaso ou aleatria) quando cada
unidade amostral tem uma probabilidade conhecida e diferente de zero de ser escolhida frente a
populao de origem, garantindo, se for realizada de forma correta, a iseno de vcios.
As tcnicas de amostragem probabilstica consistem em Amostra Aleatria Simples, Amostra
Aleatria Estratificada, Amostra sistemtica e Amostra por Conglomerado:

a) Amostra Aleatria Simples (AAS): Selecionado por um processo ao qual a probabilidade de escolha
de todos os elementos a mesma para todos, ou seja, a populao de origem considerao homognea,
pois os seus elementos tm caractersticas parecidas entre si.
a1) Frmula para determinao do tamanho da amostra com AAS:

N .n0
N n0

Fonte: Barbetta (2001)


Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 11

Onde:
N = Tamanho da populao
n = Tamanho da amostra
Se a confiana do estudo for de 95%, de acordo a tabela da Normal Padro: n0

1
,
e

onde e = margem de erro.


2,06
e
2,17
Se a confiana for 97%: n0
e
2,33
Se a confiana for 98%: n0
e

Se a confiana for 96%: n0

2,575
e
3
Se a confiana for 99,9%: n0
e

Se a confiana for 99%: n0

OBS 1: O n0 representa a primeira aproximao do tamanho da amostra (n) caso no se conhea o N.


OBS 2: Caso conhea o N seja muito grande (tender para o infinito), no necessrio considerar o seu
tamanho exato. Neste caso, o clculo da primeira aproximao (n0) j suficiente para o clculo.
OBS 3: Uma amostra aleatria simples pode ser selecionada escrevendo os elementos da populao,
numerados de 1 a N, em N cartes, misturando-os numa urna e sorteando, sem reposio, n desses
cartes. Ou seja, a amostra consiste daqueles elementos da populao, cujas identificaes correspondem

N
N!
aos nmeros selecionados. Existiro
amostras possveis diferentes de tamanho n. Nesse
n n!( N n)!
caso, haver dependncia nas retiradas, pois o fato de no recolocar o elemento retirado afeta a
probabilidade de o elemento seguinte ser retirado.
OBS 4: A amostra aleatria simples pode ser tambm com reposio consiste em selecionar n
elementos um de cada vez, a partir dos elementos da populao (N), repondo o elemento sorteado na
populao antes do prximo sorteio. Com tal procedimento, qualquer elemento pode ser sorteado mais do
que uma vez. Nesse caso, haver independncia entre as retiradas, pois o fato de recolocar o elemento
retirado no afeta a probabilidade de o elemento seguinte ser retirado.

OBS 5: bom lembrar que a partir de um determinado nmero da populao a ser investigada, a amostra
no sofre variao considervel para mais ou para menos e, portanto, no adianta aumentar o nmero
amostral, imaginando que poder haver mais resultados porque este no sofrer alterao significativa.

Exemplo 1: Pensando em proporcionar ainda mais praticidade e comodidade para o aluno, a Devry
Brasil criou no ano 2014 o aplicativo Devry Aluno. Por meio dele, os estudantes da Fanor podem utilizar
seus smartphones IOS para solicitar alguns servios realizados pelo Ncleo de Atendimento ao Aluno
(NAA) da faculdade e fazer tudo com mais agilidade, como por exemplo:
- Solicitar declarao de matrcula para fins diversos;
- Solicitar Histrico Escolar;
- Solicitar Reviso de Prova Final;
- Acompanhar e ser avisado sobre o vencimento de faturas, evitando
multas desnecessrias;
- Manter-se atualizado e ser alertado sobre os principais eventos do
Calendrio acadmico oficial de sua faculdade, dentre outros.
Visando a satisfao de seus clientes (ou atuais alunos), a Devry Brasil
deseja fazer melhorias no seu aplicativo e adequ-lo s necessidades
destes. Para isso, ser feita uma pesquisa estatstica entre os alunos dos
cursos de engenharias da Fanor, para verificar quais melhorias devem
ser implementadas. De acordo o ltimo levantamento feito em Julho de
h
nos cursos de engenharias do campus 2.356 alunos regularmente matriculados. Assim, qual deve ser a
2015,
quantidade de alunos a serem pesquisados pela faculdade, se for considerado:
a) Uma margem de erro de 4%, com uma confiana de 95%?

b) Se diminuirmos a margem de erro para 2%, qual ser o tamanho da amostra (n), mantendo a mesma
confiana de 95%?

c) E se pesquisssemos 2000 clientes, qual seria a margem de erro, com a confiana de 95%?

Baseado nos itens anteriores:


d) Se para a faculdade o que importa o resultado estatstico da pesquisa, qual das alternativas (a, b
e c) voc aconselharia ela a utilizar? Por qu?

e) Se para a faculdade o que importa o quanto ela vai pagar pela pesquisa, ou seja, o custo da mesma,
qual das alternativas (a, b e c) voc aconselharia ela a utilizar? Por qu?

f) Se para a faculdade o que importa o resultado estatstico da pesquisa e ao mesmo tempo com menor
custo, qual das alternativas (a, b e c) voc aconselharia ela a utilizar? Por qu?
Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 13

b) Amostra Aleatria Estratificada (AAE): Muitas vezes a populao se divide em subpopulaes (ou
estratos), sendo razovel supor que em cada estrato a varivel de interesse analisada apresenta um
comportamento substancialmente diverso, ou seja, a populao considerada heterognea, mas
homogneo dentro de cada estrato.
Assim, deve-se adotar um tipo de amostragem que represente bem as diferentes caractersticas
dentro de cada um dos grupos, podendo ser, por exemplo, proporcional ao tamanho de cada um deles.
Exemplo 2: A prefeitura de Fortaleza implantou o sistema de bicicletas pblicas chamado Bicicletar,
que visa oferecer cidade uma opo de transporte sustentvel e no poluente. Este projeto operado
pela empresa Serttel e tem o apoio da Unimed Fortaleza. O Sistema composto por estaes inteligentes,
conectadas a uma central de operaes via wireless, alimentadas por energia solar, distribudas em pontos
estratgicos da cidade, onde os clientes cadastrados podem retirar uma bicicleta, utiliz-la em seus
trajetos e devolv-la na mesma, ou em outra Estao.
Um nutricionista deseja fazer um estudo com o
objetivo de verificar a prevalncia de usurios do
sistema que utilizam suplementos alimentares antes
e/ou aps prtica do esporte. Os usurios definidos
por ele so os que retiraram as bicicletas nas estaes
da Avenida Beira Mar. Assim, para participar do
estudo, foi definido ainda que os usurios devam ter
utilizados o sistema em no mnimo trs vezes por
semana

no

turno

manh,

tarde

e/ou

noite,

independente do gnero e idade, no ltimo ms.


Sendo assim, o nutricionista conseguiu levantar com a empresa operadora que a quantidade de ciclistas
que retiraram as bicicletas em no mnimo 3 vezes por semana na regio estabelecida foi de 1.259, mas h
uma diferena de quantidade de usurios por estaes, sendo que no ms passado, houve na Estao
Nutico 248 usurios, na Estao Aterro de Iracema com 189 usurios e na Estao Aterrinho da Praia de
Iracema com 822 usurios. Assim, qual deve ser a quantidade de usurios a serem pesquisados pela
empresa de consultoria, por estao e de forma proporcional, com uma margem de erro de 2,5% para
mais ou para menos e uma confiana de 98%, como sugeriu a prefeitura?
OBS: A pesquisa ser feita atravs do aplicativo que o usurio tem acesso no ato que fez o cadastro para
aderir ao sistema.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 14

c) Amostra Sistemtica (AS): Esse tipo de amostragem uma variao da amostragem aleatria
simples, mas que exige que um sistema aleatoriamente seja definido.
Segue abaixo outros tipos de exemplos de amostras sistemticas:
Exemplo1: Um engenheiro de controle da qualidade seleciona cada centsima fonte de computador que
passa em uma esteira transportadora.
Exemplo2: Um professor retira da populao para compor a amostra os alunos aleatoriamente escolhidos
que possuem o algarismo 0 como ltimo nmero da sua matrcula.
Exemplo3: Uma indstria tem 900 mquinas e o engenheiro de produo deseja uma amostra formada por
50 mquinas para uma pesquisa. Pode-se, neste caso, usar o seguinte procedimento: Como 900/50 = 18,
escolhe-se por sorteio casual um nmero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a
amostra, os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se supor que o
nmero sorteado fosse 4, a amostra seria: 4 mquina, 22 mquina, 40 mquina, 58 mquina, 76
mquina, dentre outros. Ao final, pode-se voltar ao incio para completar a quantidade amostral a
pesquisar.
d) Amostra por Conglomerado: Primeiramente, na amostra por conglomerado, a populao-alvo
dividida em estratos mutuamente exclusivos e coletivamente exaustivos. Aps isso, reduz-se,
arbitrariamente, a quantidade de estratos a serem analisados. Aps isso, sorteiam-se quais grupos sero
pesquisados e por fim, define-se qual o tipo de amostra probabilstica dever ser utilizada (AAS, AAE ou
AS). Podendo tambm, se assim o pesquisador desejar, utilizar o censo nos grupos selecionados para
coleta de dados. Com isso, a amostragem por conglomerado tem duas grandes vantagens: a viabilidade e
o baixo custo, ou seja, a que traz o menor custo-benefcio, se comparado s outras tcnicas probabilsticas
disponveis.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 15

Exemplo 3: Considere que um pesquisador deseja avaliar atravs de uma pesquisa por amostragem a
opinio dos alunos de engenharia da Fanor sobre a sua satisfao com relao coordenao do seu
curso. Assim, levantou-se a populao de alunos por cada curso da referida rea, como segue abaixo:
Cursos

Quantidade Populacional

Engenharia Ambiental e Sanitria


Engenharia Civil
Engenharia de Produo
Engenharia Eltrica
Engenharia Mecnica
Engenharia Qumica
Total

469
403
739
593
440
198
2.842

Fonte: Coordenao dos Cursos de Engenharia - Fanor (2014)

Se esse pesquisador fizer uma amostra por conglomerado para 3 cursos, quantos alunos sero
pesquisados, com uma margem de erro de 2% e uma confiana de 95%, levando em considerao um dos
mtodos de amostragem (AAS, AAE ou AS)?

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 16

Nota de Aula 3 Medidas Descritivas para dados


no agrupados
1. INTRODUO:
Para a maioria das pessoas, estatstica significa descrever nmeros da forma mais entendvel
possvel, como por exemplo, as taxas mensais de desemprego no Brasil aps a alta do dlar no mercado
atual, o ndice de falncias empresariais ocorridas no Brasil de 2010 para c, a proporo de mulheres que
assumem cargos de CEO no mercado brasileiro nos ltimos dois anos, a proporo de eleitores que
votaro em um determinado candidato nas prximas eleies, o nvel de satisfao de clientes de uma
determinada loja de convenincia de um determinado Shopping Center, dentre outros.
Todos esses exemplos representam descries estatsticas de um conjunto de dados coletados
sobre algum fenmeno e para isso no preciso usar a inferncia estatstica ainda, pois o objetivo aqui
apenas descrever estatisticamente essas informaes.
A descrio estatstica dos dados verifica a localizao central e a variabilidade desses dados
atravs de mdias, medianas, modas, varincias, desvios-padro e coeficientes de variao. Ainda, h
mtodos ilustrativos que possibilitam uma melhor interpretao deles, como os grficos, dos quais podese citar os histogramas, os diagramas de ramo-e-folhas, os diagramas de pontos, os grficos de caixa
(box-blot), dentre outros.
A descrio dos dados se d em duas formas, tanto para dados agrupados em classes como para
dados no agrupados. Esta nota de aula verificar apenas os dados no agrupados, e est divido em
medidas de tendncia central e medidas de disperso.
2. MEDIDAS DE TENDNCIA CENTRAL
As chamadas medidas de tendncia central tm por objetivo verificar o centro da distribuio dos
dados, ou seja, verificar atravs de medidas especficas o centro do conjunto de dados. As medidas de
tendncia central mais utilizada so a mdia aritmtica, a moda e a mediana. As usadas com menos
frequncias so as mdias geomtricas, harmnicas, quadrticas, cbicas e biquadrticas.
As outras medidas de posio usadas com menos intensidade so as separatrizes, que englobam:
a prpria mediana atravs dos decis, dos quartis e dos percentis.
Para incio desta nota de aula, a primeira medida de tendncia central a ser analisada a mdia
aritmtica simples, como segue:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 17

2.1. Mdia Aritmtica Simples: definida como sendo o quociente da soma de todos os valores de um
conjunto de dados pelo total de valores deste conjunto.
Mdia amostral

Mdia populacional

xi

i 1

x
i 1

, Onde

xi = Valores da varivel
n = Nmero de valores da amostra
N = Nmero de valores da populao

OBS1: A mdia por ser influenciada por todos os valores do conjunto de dados considerada como uma
medida sensvel, ao contrrio das outras medidas de tendncia central existentes.
Propriedades:
a) A mdia de um grupo de dados sempre ser nica, independente da sua localizao;

x
n

b) A soma algbrica dos desvios tomados em relao mdia sempre nula:

i 1

X 0

c) O resultado de multiplicar a mdia pela quantidade n de valores da varivel x igual a soma dos n
valores da varivel;
d) Somando-se ou subtraindo-se uma constante c (valor invarivel) a todos os valores de uma varivel,
a mdia do conjunto ficar aumentada ou diminuda dessa constante, respectivamente, de forma anloga,
se multiplicar ou dividir, a mdia ficar multiplicada ou dividida, respectivamente.
n

x
i 1

x .c
i

i 1

xi

c
i 1

Falando ainda de mdia, h a mdia aparada, que no to utilizada na prtica estatstica pois a
mesma tende a manipular o resultado final desta medida de tendncia central, mas vale a pena conhecer o
que este tipo de medida como segue no prximo tpico.

2.1.1. Mdia Aparada: Uma mdia aparada calculada aparando-se certa porcentagem dos maiores ou
menores valores do conjunto de dados. Por exemplo, para calcular a mdia aparada de 10%, deve-se
eliminar 10% dos valores maiores e 10% dos valores menores, e ento calcular a mdia dos valores que
sobraram. Podendo-se usar de forma arbitrria a porcentagem a ser retirada da amostra para um novo

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 18

clculo. Ao contrrio da mdia aritmtica, a mdia aparada uma medida resistente, pois no sofre
influncia dos valores extremos.
A segunda medida de tendncia central a analisar a moda, como segue no prximo tpico.
2.2. Moda (Mo): Na linguagem coloquial, moda algo que est em evidncia, ou seja, algo que se v
bastante. Na Estatstica, como o prprio nome sugere, a Moda aquele elemento que mais vezes aparece
no conjunto de dados. No muito sensato dizer que a moda uma medida de tendncia central, pois
nem sempre ela representa o centro do conjunto de dados, visto que ela identifica o(s) valor(es) que
ocorre(m) com maior frequncia, podendo ser nico, se existir, como pode tambm no existir. Nesse
caso, mais correto cham-la de medida de posio.
Quando dois valores ocorrem com a mesma frequncia mxima, cada um deles uma moda.
Das diferentes medidas de tendncia central, a moda a nica medida que pode ser usada com
dados em nvel nominal de mensurao, conforme o exemplo 1:

Exemplo 1: Um estudo sobre tempos de reao de pessoas em um teste foi composto por 30 canhotos, 50
destros e 20 ambidestros. Embora no possamos tomar a mdia numrica dessas caractersticas, podemos
afirmar que a moda destro, que a caracterstica com maior frequncia.
Quando no conjunto h apenas um valor que se repete alm dos demais de forma mxima,
chama-se este conjunto de unimodal, bem como se tiver dois valores que se repete alm dos demais, de
forma mxima e na mesma quantidade bimodal, assim acima de 2 modas multimodal. Se o conjunto
de dados no tiver nenhum valor que se repete alm dos demais de forma mxima, o conjunto de dados
amodal.

OBS2: Se o conjunto de dados tiver os valores: 1, 1, 2, 2, 3, 3, o conjunto multimodal, pois todos os


valores se repetem 2 vezes, ou seja, a frequncia a mesma para todos. Agora se for: 1, 2, 3, 4, amodal,
pois no h repetio de valores.
E se for: 10, 10, 10, 10 unimodal, pois o valor 10 o que ocorre com maior frequencia.
A terceira medida de tendncia central a ser analisada a mediana. Muitos confundem a mediana
com a mdia, mas so medidas completamente diferente, tanto na sua forma de encontrar quanto na sua
interpretao, como segue no prximo tpico.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 19

2.3. Mediana (Md):


A mediana uma medida de tendncia central que ocupa a posio central dos dados
observados, quando estes esto ordenados em ordem crescente ou decrescente (rol), tendo uma mudana
na sua realizao se a quantidade de dados par ou mpar.
Sendo assim, se o conjunto de dados (n) constitudo por um nmero mpar de dados, a mediana
o valor que fica no centro dos dados ordenados que pode ser encontrado atravs da seguinte notao:

n 1

2
Pelo exemplo 2, como segue, possvel verificar como a realizao da mediana para uma
quantidade mpar de valores.

Exemplo 2: Notas de alunos de uma determinada disciplina: 8 7 3 4 8


Soluo:
Ordenar os dados: 3 4 7 8 8
Mediana (Md) =
Interpretao:

Agora, se o conjunto de dados (n) constitudo por um nmero par de dados, a mediana a
mdia aritmtica dos dois valores que ficam na posio central dos dados ordenados que pode ser
encontrado atravs da seguinte notao:

n n
1
2 2
2
Pelo exemplo 3, como segue, possvel verificar como a realizao da mediana para uma
quantidade par de valores.

Exemplo 3: Notas de alunos de uma determinada disciplina: 8 7 3 4 8 9


Soluo:
Ordenar os dados: 3 4 7 8 8 9
Mediana (Md) =
Interpretao:

A mediana tem como vantagem a no afetao por valores extremos, ao contrrio da mdia
aritmtica, por isso a mediana uma medida mais robusta (forte) que a mdia, pois na mdia qualquer
alterao nos dados, modifica-se o valor da mdia, e a mediana nem sempre isso acontece.
Depois de verificado as trs medidas de tendncia central que so utilizadas com maior
freqncia, dentre as trs, a mdia aritmtica a medida mais usada na tomada de deciso, pois a mesma

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 20

encontrada com uso de todos os valores do conjunto de dados, ao passo que a mediana e a moda no
utiliza todos eles, e sim alguns ou nenhum dos valores (amodal), apresentado resultados distorcidos da
realidade dos dados apresentados.
Quando se descreve os dados, alm das medidas de tendncia central, necessrio analisar a
variabilidade dos dados, pois atravs destas pode-se tirar algumas concluses mais consistentes na tomada
de deciso. Assim, o prximo item mostrar as medidas de variabilidades mais utilizadas no campo
estatstico.

3. MEDIDAS DE DISPERSO:
Ao se fazer a descrio dos dados, alm de verificar o centro da distribuio deles atravs das
medidas de tendncia central prescindvel verificar tambm se os dados se comportam de forma
homognea ou heterognea, e isso ser possvel atravs das medidas de disperso.
Essa verificao importante, pois atravs delas podem-se tomar decises mais consistentes e
eficazes. Um exemplo disso eram que os bancos, h uns anos atrs, costumavam exigir que os clientes
formassem filas separados para os diversos guinches, mas atualmente passaram adotar a fila nica. O
motivo dessa modificao foi que o tempo mdio de espera era o mesmo para ambos os formatos de filas,
no afetando a eficincia dos caixas, mas a adoo de fila nica ocorreu ao fato de os clientes preferirem
tempos de espera com menor variao. Assim, que milhares de bancos efetuaram essa modificao que
resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia de tempo de
atendimento no tenha sido afetada.
Com isso, pode-se concluir que as medidas de disperso avaliam a variabilidade dos dados com
relao sua mdia. As medidas de disperso mais usadas so a amplitude total, varincia, desvio padro
e coeficiente de variao.
A primeira medida de disperso a ser analisada nesta nota de aula ser amplitude total, como
segue no tpico seguinte.

3.1. Amplitude total (At):


A amplitude total a medida mais simples de variao que existe, e obtida atravs da diferena
entre o maior e o menor dos valores da srie. A ressalva para esta medida simples de disperso que por
no levar em considerao os valores intermedirios, essa medida no possibilitar analisar como os
dados esto distribudos e/ou concentrados, visto que s feita uma anlise dos extremos deste.
At = Vmx Vmin

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 21

Pelo exemplo 4 possvel verificar que se no for levado em considerao os valores em si,
pode-se tomar concluses bastante equivocadas, pois amplitude total a mesma para ambas as turmas,
mas os valores de cada uma delas so visivelmente diferentes.

Exemplo 4: Notas de provas de duas turmas de 9 alunos


Turma 1: 1, 1, 1, 2, 2, 2, 3, 3, 3
At = 3 - 1 = 2
Turma 2: 8, 8, 8, 9, 9, 9, 10, 10, 10
At = 10 - 8 = 2
O que se pode concluir com essa medida, alm de verificar a distncia no maior para o menor
valor, que quanto mais longa essa distncia, mais heterogneos so os dados e caso contrrio, mais
homogneos.
Agora, a amplitude total, ser utilizada de forma necessria e obrigatria na construo de uma
distribuio de frequncias, que ser vista mais adiante.
Assim, a segunda medida de disperso que realmente pode ser utilizada para anlise a
varincia, como segue.
3.2. Varincia (S):
A varincia uma medida de disperso que mensura a variabilidade dos dados, atravs da soma
do quadrado dos desvios pela quantidade de valores da varivel menos um (n-1) no caso amostral, e por N
se for populacional.
Pela propriedade b da mdia aritmtica, verifica-se que a soma dos desvios ser sempre zero,
fazendo com que o pesquisador suponha que no h desvio (ou variabilidade) no conjunto de dados
analisado, mas se todos os valores no forem iguais, haver variabilidade sim, mas mesmo assim sempre
somando os desvios o resultado ser zero. Nesse caso, para que esse problema seja contornando, eleva-se
os desvios ao quadrado, ocasionando a no anulao dos mesmos.
Com isso, a notao matemtica da varincia :
Varincia amostral

x
n

S2

i 1

n 1

xi = Valores da varivel
X = Mdia aritmtica simples
n = Nmero de valores da amostra
Notas de Aula

Bioestatstica

Varincia populacional
n

x
i 1

, onde

xi = Valores da varivel
= Mdia populacional
N = Nmero de valores da populao
Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 22

Propriedades:
a) A varincia de uma constante c igual a zero;
b) Ao somar ou subtrair uma mesma constante c a todos os valores do conjunto de dados, a varincia
no ficar alterada;
c) Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante c, a varincia
ficar multiplicada ou dividida, respectivamente, pela constante ao quadrado (c).
Mas, mesmo elevando os desvios ao quadrado, surge o seguinte questionamento: E se ao invs
de elevar cada desvio ao quadrado e depois somar, no seria melhor utilizar o mdulo, em que os desvios
n

resultam em valores absolutos e depois utilizar a soma deles? Ou seja, assim:

x
i 1

X ? E aps isso,

dividir tudo pela quantidade de valores (n), obtendo a o desvio mdio dado pela seguinte notao
n

DM

x
i 1

A resposta para essa pergunta no, pois o mdulo far com que os desvios negativos fiquem
positivos, apresentando uma realidade distorcida dos dados.
Ao elevar ao quadrado, todos os desvios so elevados ao quadrado e no somente alguns,
portanto, o melhor a ser utilizado a varincia porque ela d certeza absoluta que as amostras so
diferentes. J o mdulo no d essa informao de variabilidade, ao contrrio, ele nos d evidncias de
que as amostras so iguais. Por exemplo: Suponha que uma turma fez uma prova e a mdia desta foi 7,0,
e um aluno tirou 8,0, ou seja, a disperso foi de 1 ponto para mais (8 - 7 = 1 ponto). Se outro aluno tirar
6,0, a disperso 1 ponto para menos (6 7 = -1 ponto). Se usar o mdulo, a disperso ao invs de ser -1
e 1, ser 1 e 1, mostrando que no h disperso das notas dos dois alunos, ou seja, ao invs de um aluno
ter tirado a nota 6 e o outro a nota 8, ambos tiraram a nota 8, pois o desvio com o uso do mdulo foi 1
ponto para mais.
Mas mesmo a varincia sendo considerada a ideal para tomar decises sobre a variabilidade dos
dados, a mesma apresenta um grande problema com unidade de medida dos dados que a compem, pois
estes sero elevados ao quadrado, dificultando assim a sua interpretao, pois se a unidade de medida for
em metro, ser metro quadrado, se for em centmetro, ficar centmetro ao quadrado e assim por diante.
Para contornar esse problema e verificar os dados com a unidade de medida original, aconselhase tirar a raiz quadrada da varincia. Nesse caso, chega-se a outra medida de disperso, o chamado desvio
padro, mas antes de analisar esta medida de disperso, faz-se necessrio se atentar para as seguintes
observaes:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 23

OBS3: Para um melhor entendimento da diviso por n-1 na frmula da varincia e no por n apenas,
que a varincia trabalha encima de n-1 valores, pois se subtende que pelo menos um valor a prpria
mdia (no havendo disperso de um valor, nesse caso). Portanto, a variabilidade ser entre n-1 valores
e no n.
Por exemplo, sejam os seguintes valores: 1, 2 e 3, a mdia 2, ou seja, um valor a prpria mdia, mas
dois valores no, ou seja, 2 = n-1 = 3-1 = 2. Mas isso no tem 100% de certeza no, pois tem casos em
que a mdia no igual ao conjunto de valores.

OBS4: Observe que no clculo da varincia amostral (S), deve-se dividir a soma dos quadrados dos
desvios por n-1e no por n apenas. Isso se d, pois atravs de estudos que sero vistos em Estimao
de Parmetros, a varincia amostral (S) tende a estimar de forma distorcida a varincia populacional ()
se for dividido apenas por n, ento para que S seja um estimador no viciado ou no tendencioso de
deve-se dividir por n-1.
H uma demonstrao que prova que E(S) = , mostrando que a esperana da varincia amostral igual
a varincia populacional, ou seja, a varincia amostral com diviso da sua frmula por n-1 representa
de forma eficaz e inferencial a varincia populacional, sem ter analisado a populao em si.

OBS5: Quando o tamanho da amostral suficientemente grande ( usual considerar um valor de n


superior a 30) no h praticamente diferena entre S e , assim pode-se dividir por n-1 ou por n,
respectivamente que o resultado ser aproximadamente o mesmo, pois, para comprovao S/ ser
aproximadamente 1, no fazendo diferena nenhuma nos clculos. Agora, se n for menor que 30, essa
diviso ser bem menor que 1 mostrando que no a mesma coisa, devendo assim no deixar de dividir
por n-1 se for o amostral e por n se for o populacional.
Aps, as observaes anteriores, faz-se necessrio verificar a medida de disperso realmente
utilizada na tomada de deciso, o desvio padro.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 24

3.3. Desvio Padro (S):


O desvio padro uma medida de variabilidade dos valores com relao mdia deles, mas ao
contrrio da varincia, esta medida utiliza-se mesma unidade de medida dos dados originais, por isso
esta utilizada com maior frequncia que a varincia (S). A notao matemtica do desvio padro, que
a raiz quadrada da varincia como segue:
n

(x
i 1

X )2

n -1

A ltima medida de disperso a ser analisada o coeficiente de variao, como segue no


prximo tpico.

3.4. Coeficiente de Variao de Pearson (CV):


O coeficiente de variao uma medida de disperso relativa que avalia o quanto o desvio
padro representa com relao mdia aritmtica de um conjunto de dados. Assim, quanto menor for o
CV, mais homogneo ser o conjunto de dados, ou seja, com menor variabilidade entre eles, caso
contrrio haver uma grande variabilidade. Assim, a notao do coeficiente de variao a seguinte:
S
CV 100
X
Mas para afirmar se os dados so ou no passveis de grandes ou pequenas variabilidades,

adota-se o ponto de corte percentual como segue:


Se CV < 50% (H baixa disperso entre os dados, ou seja, eles so homogneos)
Se CV 50% (H alta disperso entre os dados, ou seja, eles so heterogneos)

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 25

Anexo 1 Manual da Calculadora Cientifica e HP


Financeira
Manual para clculo de Estatstica descritiva, Correlao e Regresso Linear
Calculadora Cientfica Modelo: Casio fx 82MS
1. Mdia e Desvio Padro:
Colocar no modo estatstico: Clicar em Mode 2 (Sd)
Digitar os seguintes nmeros 1, 2 e 3 assim:
1 M+
2 M+
3 M+

Encontrar o valor da mdia:


Clicar em Shift 2 (S-VAR) 1 = (Sair o valor da mdia igual a 2)
Encontrar o valor do desvio padro:
Clicar em Shift 2 (S-VAR) 3 = (Sair o valor do desvio padro igual a 1)

Manual para clculo de Estatstica descritiva, Correlao e Regresso Linear


Calculadora Financeira HP Modelo: 12C
1. Mdia e Desvio Padro:
Limpar a memria: f CLx
Adicionar valores (1, 2, 3) na memria da calculadora assim: 1 + 2 + 3 +
Calcular a mdia: g 0
Calcular o desvio padro: g (ponto)

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 26

Anexo 2 Estatstica Descritiva com uso do Microsoft Excel


1 Passo: Abrir o Excel
Ao abrir o Excel: Digitar o banco de dados abaixo referente ao Salrio Mnimo dos funcionrios de
uma determinada Empresa.
Funcionrio
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
N.
Salrio (S.M*) 6 7 11 4 13 8 7 15 9 11 10 16 5 13 8 19 8 12
Funcionrio
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
N.
Salrio (S.M*) 14 16 5 17 9 11 9 10 6 15 7 12 23 7 17 9 14 19
2 Passo: Estatstica Descritiva de todas as variveis quantitativas: Salrio
Acionar a Ferramenta Anlise de Dados:
Clicar no Boto Office:
Clicar em Opes do Excel Suplementos Em gerenciar, clicar em Ir Clicar em Ferramentas de
Anlise OK: A funo ficar acionada na funo Dados.
Dados Anlise de Dados Estatstica descritiva:
Em Intervalo de entrada: Selecionar todas as clulas da varivel quantitativa em estudo, inclusive o ttulo
da varivel (Pode selecionar tudo de uma vez s) Selecionar Rtulos (OBS: Como selecionou o ttulo,
necessrio clicar em rtulo);
Em Opes de Sada: Clicar em Nova Planilha e Resumo estatstico.
O resultado est na tabela abaixo com as suas respectivas interpretaes abaixo:
Sada do Excel:
Salrio (S.M)
Mdia
11,12
Erro padro
0,76
Mediana
10,165
Modo
7,0 e 9,0
Desvio padro
4,58
Varincia da amostra
21,04
Curtose
-0,014
Assimetria
0,65
Intervalo
19,3
Mnimo
4
Mximo
23,3
Soma
400,4
Contagem
36
Interpretao da varivel salrio:
Mdia: A mdia salarial dos 36 funcionrios de 11,12 s.m.
Mediana: 50% dos funcionrios ganham abaixo de 10,16 s.m e 50% acima.
Moda: Os salrios que mais ocorreu entre os funcionrios foi 7 e 9 s.m.
Desvio Padro: (11,12 4,6), ou seja, a maioria dos funcionrios ganham entre 6,52 s.m e 15,72 s.m.
Mnimo e Mximo: O menor salrio entre os 36 funcionrios 4 s.m e o maior 23,3 s.m.
Soma: A empresa gasta 400,4 s.m no pagamento de seus 36 funcionrios, ou seja, 400,4 s.m a folha de
pagamentos da empresa.
Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 27

4. SEPARATRIZES:
Tanto a mdia como o desvio padro podem no ser medidas adequadas para representar um
conjunto de dados, pois so afetados, de forma exagerada por valores extremos, ou seja, so medidas
sensveis. Ento analisar outras medidas de posio, com as separatrizes, se faz necessrio, assim segue as
medidas:
Quartis: Dividem os valores ordenados (em ordem crescente ou decrescente) da varivel em quatro
partes iguais atravs de trs quartis (Q1, Q2 e Q3), ou seja, (25% abaixo, 50% abaixo e acima, 25%
acima).

Exemplo 5: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule os quartis:
2; 5; 6; 9; 10; 13; 15
OBS: O conjunto de dados MPAR (n = 7), assim:
2
5
6
9
Q1 = P25
Md = Q2 = P50 = D5

10

13
Q3 = P75

13

Soluo:

n 1 7 1
Q1

2valor = 5 anos
4 4
25% das pessoas tem idade abaixo de 5 anos e 75% acima.

n 1 7 1
Q2 Md

4valor = 9 anos
2 2
50% pessoas tem idade abaixo de 50% anos e 3 acima.

3n 1 21 1
Q3

5,5valor = Pega-se o 6 valor = 13 anos
4 4
75% tem idade abaixo de 13 anos e 25% acima.
Exemplo 6: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule e interprete os quartis:
1; 1; 2; 3; 5; 5; 6; 7; 9; 9

OBS: O conjunto de dados PAR (n = 10), mas ao dividir os dados ao meio sobram 5 valores para um
lado e 5 para o outro, ou seja, ao dividir fica uma quantidade mpar para um lado e para o outro, assim:

Quantidade mpar de Valores


1
2
3
Q1 = P25
Notas de Aula

Bioestatstica

Quantidade mpar de Valores


5 6
7
9
(5 + 5)/2 = 5
Q3 = P75

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 28

n n
10 10
1
1

2 2
2
2

5 6 55 5
Q2 Md

2
2
2
2
Quartis: Ao dividir o conjunto de dados em duas partes iguais, ficam 5 valores para um lado e 5 valores
para o outro, ou seja, uma quantidade mpar para um lado e uma quantidade mpar para o outro, assim,
para calcular o quartil 1 e quartil 3, deve-se utilizar a frmula para o caso mpar e no par, assim:

n 1 10 1
Q1

3valor 2
4 4

3n 1 3 *10 1
Q3

8valor 7
4
4

Exemplo 7: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule e interprete os quartis:

1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13

OBS: O conjunto de dados PAR (n = 12). Ao dividir os dados ao meio ficam 6 valores para um lado e 6
para o outro, ou seja, fica uma quantidade par para um lado e uma quantidade par para o outro, assim, as
frmulas devem ser, nesse caso as pares, assim:
Quantidade Par de Valores
1

2
3
Q1 = (2+3)/2 = 2,5

Quantidade Par de Valores


5 5

Q2 = (5 + 6)/2 = 5,5

9
9
Q3 = (9+9)/2 = 9

10

13

n n
12 12
1
1

2 2
2
2

6 7 5 6 5,5
Q2 Md

2
2
2
2
Quartis: Ao dividir o conjunto de dados em duas partes iguais, ficam 6 valores para um lado e 6 valores
para o outro, ou seja, uma quantidade par para um lado e uma quantidade par para o outro, assim, para
calcular o quartil 1 e quartil 3, deve-se utilizar a frmula para o caso par, assim:

n n
1
4
4
Q1

3n 3n
1
4
4

Q3
2
Notas de Aula

12 12
1

4 4
3 4 2 3 2,5 anos
2
2
2

36 36
1

4
4
9 10 9 9 9 anos

2
2
2

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 29

Decil: Divide o conjunto de dados em 10 partes iguais:


D1 = 10%, D2 = 20%,.., D10 = 100%
Decil 1 = Representa os 10% menores e os 90% maiores
Percentil: Divide a srie em 100 partes iguais:
P1 = 1%, P2 = 2%,.., P100 = 100%
Assim:
Md = Q2 = D5 = P50
Q1 = P25
Q3 = P75
5. BOX-PLOT
Em 1977, John Tukey publicou uma proposta que posteriormente foi reconhecida como sendo
um eficiente mtodo para mostrar cinco nmeros que sumarizam qualquer conjunto de dados. O grfico
proposto chamado de Box-Plot (tambm conhecido como Box and whisker plot).
O Box-Plot um tipo de representao grfica conveniente para revelar tendncias centrais,
disperso, distribuio dos dados e a presena de outliers (dados discrepantes). A construo de um Boxplot exige o resumo dos cinco nmeros, ou seja, o menor valor do conjunto de dados, o primeiro
quartil, o segundo quartil, o terceiro quartil e o maior valor do conjunto de dados.

5.1. Interpretao do Box-Plot: O grfico de Box-plot interpreta-se da seguinte forma:


A caixa (Box) propriamente contm a metade 50% dos dados (Q2 = Mediana). O limite superior da caixa
indica o percentil de 75% dos dados (Q3) e o limite inferior da caixa indica o percentil de 25% (Q1). A
distncia entre esses dois quantis (Q3 Q1) conhecida como amplitude interquartlica.
A linha na caixa indica o valor de mediana (Q2) dos dados.
Se a linha mediana dentro da caixa no equidistante (ter a mesma distncia) dos extremos, diz-se ento
que os dados so assimtricos ( direita ou esquerda).
Os extremos do grfico indicam o valor mnimo e mximo, a menos que valores outliers estejam
presentes.
Os pontos fora do grfico so ento outliers ou suspeitos de serem outliers.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 30

5.2. Vantagens do Box-plot:


Mostra graficamente a posio central dos dados (mediana) e a tendncia;
Mostra a forma de simetria ou assimetria dos dados;
Ao contrrio de muitas outras formas de mostrar os dados, o Box-plot mostra os outliers.
Utilizando o Box-plot para cada varivel categrica de lado a lado no mesmo grfico, pode-se
facilmente comparar os dados.

5.3. Desvantagem do Box-Plot:


Em alguns casos a quantidade de outliers pelo intervalo definido pelo desvio padro e pelo BoxPlot se diferem, pois pelo intervalo definido pelo desvio padro os dados no so modificados em
momento algum, j com o Box-Plot o clculo do limite inferior junto com o intervalo interquartlico no
mostra bem a realidade dos dados, mas este tipo de grfico bastante utilizado para verificar o formato da
curva dos dados.
Para contornar esta situo a idia utilizar os Box-Plot para verificar o formato da curva e o
intervalo definido pelo desvio padro para encontrar os dados discrepantes. Neste caso, o uso do Box-Plot
deve ser em ltimo caso para evitar interpretaes erradas.
Segue um exemplo prtico para ilustrar isso:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 31

Atravs desse grfico, podemos comparar as distribuies de idade entre cada profisso, quanto a
posio e disperso. Temos por exemplo, que advogados tm a menor mdia de idade de escolha da
profisso. Mdicos tm a maior idade, seguidos pelos dentistas. Temos, entretanto, que a variao de
idade para os dentistas muito maior do que para os mdicos e advogados. Provavelmente detectaramos
diferena significativa entre as mdias de idade de advogados e mdicos, e advogados e dentistas, mas
devido a grande variao de idades para dentistas, talvez no se detecte diferena entre mdicos e
dentistas. Temos tambm a ocorrncia de uma observao discrepante (outlier) para idade de dentistas:
enquanto 50% dos dentistas esto entre aproximadamente 29 e 34 anos, houve um dentista com idade
prxima de 20.
Alm disso, enquanto a distribuio de idade para advogados parece razoavelmente simtrica em
torno da mediana, para mdicos e dentistas parece haver uma concentrao maior (moda) para idades
maiores, indicando provavelmente uma distribuio assimtrica direita, isso quer dizer que a moda
mediana mdia. Para visualizar melhor s virar cada grfico para o lado direito e veremos que o lado
maior est do lado direito (assimetria direita).
Portanto, sugere-se o uso do resumo dos cinco nmeros de um conjunto de dados para a
construo do Box-Plot:
1 Valor mnimo (E1): Menor valor do conjunto de dados. Em algumas vezes pode ser considerado um
outlier (dado discrepante);
2 Primeiro Quartil (Q1): um valor que deixa um quarto dos valores abaixo e trs quartos acima dele
(25% abaixo e 75% acima);
3 Segundo Quartil ou Mediana (Q2 ou Md): um valor que divide na metade o conjunto de dados (50%
abaixo e 50% acima);
4 Terceiro Quartil (Q3): um valor que deixa trs quartos dos dados abaixo e um quarto acima dele
(75% abaixo e 25% acima);
5 Valor mximo (En): Maior extremo do conjunto de dados.
Exerccio 8: Segue abaixo as notas de 26 alunos de uma disciplina de Bioestatstica, construa um grfico
Box-Plot:
2,8
7,3
9,0

3,3
7,5
9,3

4,5
7,8
9,6

5,0
7,8
9,8

5,3
8,3
10,0

6,0
8,5
10,0

6,0
8,8

7,0
9,0

7,0
9,0

7,3
9,0

Desenhe o Box-Plot e interprete-o:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 32

Nota de Aula 4 Correlao e Regresso com uso


do Microsoft Excel
1. INTRODUO:
Diversas decises tomadas no dia-a-dia das empresas envolvem informaes do tipo: volume de
vendas previsto para subsidiar a rea de produo, demanda estimada de produtos que indique se e quais
equipamentos devem ser comprados, ou qual o lucro projetado para justificar determinados investimentos
(CORRAR, 2009).
Ainda de acordo o autor, dado um ambiente organizacional em contnua transformao, o que se
procura reduzir incertezas. Desta forma, os gestores demandam informaes que os auxiliem a escolher,
hoje, as que parecem ser as melhores alternativas sobre eventos que ocorrero no futuro. Assim, permitir
a antecipao de cenrios futuros a proposta dos modelos quantitativos de previso, pois estes envolvem
dados histricos e podem ser de dois tipos: por sries causais ou sries temporais.
Corrar (2009) defende que os modelos causais estudam os fatores que tem influencia sobre a
varivel a ser estimada, e a anlise de regresso um exemplo desse tipo de modelo. J os modelos de
sries temporais, por sua vez, envolvem projees baseadas, exclusivamente, nas observaes do passado
da varivel que se deseja estudar.
Assim, esta nota de aula trata de modelos de sries temporais e de sua utilidade para as diversas
reas do conhecimento, mas para isso faz-se necessrio relembrar os assuntos de Correlao de Pearson e
Regresso Linear Simples.
2. CORRELAO LINEAR:
O estudo de correlao mostra uma forma de medir quanto e de que maneira se relacionam duas
variveis quantitativas por meio do qual se pode analisar a relao existente das variveis em estudo, ou
seja, qual alterao deve esperar em uma das variveis, como consequncia de alteraes sofridas pela
outra varivel, ou seja, uma relao de causa de efeito.
Para entendimento dessa relao entre duas variveis, segue alguns exemplos prticos: o frio est
para o setor farmacutico, assim como o dia das mes est para o comrcio, pois as vendas de
medicamentos no controlados, como analgsicos, antigripais e vitaminas, disparam. Outro exemplo o
faturamento das empresas de energia eltrica diretamente influenciada pela temperatura, especialmente
no vero, onde a demanda por energia aumenta, pelo uso de ar condicionado e ventiladores, fazendo com
que as empresas produtoras de energia aumentem seus lucros. De forma similar, par ao consumo de gua,

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 33

desta forma em Fortaleza, por exemplo, nos meses que ocorre o vero (dezembro at meados de maro),
o consumo de gua nas residncias aumenta de forma significativa.
A priori essa relao pode ser verificada com auxlio de um grfico de disperso bidimensional,
que ser definido como eixo x, a varivel causa e y, a varivel efeito, como segue:
2.1. Interpretao subjetiva do grfico de disperso:
y

x
Correlao Positiva
entre x e y

Notas de Aula

Bioestatstica

x
Forte correlao
Positiva entre x e y

x
Correlao Positiva
perfeita entre x e y

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 34

Assim, a importncia de tal determinao decorre do fato de que a presena de uma correlao
pode conduzir-nos a um mtodo para estimar a varivel y (efeito) utilizando a varivel x (causa).

2.2. Outliers:
Os conhecidos como outliers, so os pontos discrepantes, ou as observaes extremas que no
so condizentes com o restante da massa de dados, conforme o Grfico abaixo. As causas mais provveis
da ocorrncia de outliers pode ser o registro incorreto dos dados, algum defeito no instrumento de
medio utilizado, dentre outros. Caso isso ocorra, o outlier deve ser se possvel, corrigido, em extremo
caso eliminado. Desta forma, deve-se dar a devida ateno causa de tais anomalias, pois esses dados
discrepantes podem ser teis para descobrir a causa dessa ocorrncia.
Outlier

x
Como as concluses tiradas de grficos de disperso tendem a ser subjetivas, necessita-se de
mtodos mais precisos e objetivos. Ento se utiliza o coeficiente de correlao linear de Pearson para
detectar padres lineares.
2.3. Coeficiente de Correlao de Pearson ( Rxy ):
O Coeficiente de Correlao de Pearson mede o grau de associao entre as duas variveis
analisadas, podendo ser fraca ou forte. Para isso, a notao matemtica que permite verificar essa
associao a que segue:

R xy

XY
X

X 2

X Y

2
Y

Assim, o valor de Rxy deve pertencer ao intervalo -1 Rxy 1, e a sua interpretao a seguinte:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 35

0,00 Rxy 0,69 = dependncia fraca +


0,70 Rxy 1,00 = dependncia forte +
-0,69 Rxy 0,00 = dependncia fraca -0,70 Rxy -1,00 = dependncia forte -

Diretamente proporcional: x y

Inversamente proporcional: x y

Contudo, em geral, uma correlao forte no sinnima de uma relao causa-efeito entre as
amostras ou variveis. H situaes em que um coeficiente de correlao prximo de um ou de um menos
um no significa que a maioria dos pares de valores esteja contida em uma reta (ser visto em regresso
linear). Desta forma, o simples conhecimento do coeficiente de correlao no suficiente devido a
anomalias na disperso dos dados, por isso recomendada a construo do grfico de disperso das
amostras para melhor compreender o resultado, pois em alguns casos, a relao de causa e efeito pode ser
provocada por um ou mais fatores ocultos, uma varivel no considerada na anlise.
Por exemplo, suponha que o nmero de vendas dirias de um jornal e a produo diria de ovos
tenha uma forte correlao positiva. No se pode afirmar que o aumento do nmero de jornais vendidos
resulte no aumento da produo de ovos. Para compreender a forte correlao positiva, devem-se
procurar fatores ocultos, por exemplo, o aumento de riqueza da populao que resulta em aumento de
demanda dos dois produtos ao mesmo tempo, jornais e ovos.
Conhecer a relao significativa entre as variveis de extrema importncia para que assim o
investigador possa realizar suas previses com mais segurana, assim, faz-se necessrio conhecer o que
regresso linear.

3. REGRESSO LINEAR SIMPLES:


Como visto anteriormente, o coeficiente de correlao (Rxy) apenas no mede com segurana a
relao causa-efeito entre duas variveis, apesar de essa relao poder estar presente. Por exemplo, uma
correlao fortemente positiva entre as variveis x e y no autoriza afirmar que variaes da varivel X
provocam variaes na Y, ou vice-versa. Entretanto, em uma regresso linear, a relao causa e efeito
deve ser definida no incio da anlise.
Em muitas pesquisas estatsticas, o objetivo principal estabelecer relaes que possibilitem
predizer uma ou mais variveis em termos de outras. Assim, que se fazem estudos para predizer os
seguintes exemplos:
Vendas futuras de um produto em funo do seu preo;

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 36

Perda de peso de uma pessoa em decorrncia do nmero de semanas que se submete a uma dieta de
800 calorias-dia;
Despesa de uma famlia com mdico e com remdio em funo de sua renda;
Consumo per capita de certos alimentos em funo do seu valor nutritivo e do gasto com propaganda
na TV;
Taxa de juros em funo da inflao;
Salrio em funo da escolaridade do trabalhador.
Assim, no estudo de regresso linear simples, utilizam-se duas amostras (ou duas variveis) e se
objetiva em analisar a reta que melhor explica a relao entre essas duas variveis, tendo previamente
definido a varivel independente (ou resposta ou causa) e a varivel dependente (ou preditora ou efeito).
A origem do termo regresso remonta a Francis Galton (1822 a 1911), que por volta de 1855,
investigava relaes entre caractersticas antropomtricas de sucessivas geraes. Uma de suas
constataes era de que cada peculiaridade de um homem transmitida aos seus descendentes, mas, em
mdia, numa intensidade menor. Por exemplo: embora pais com baixa estatura tendem a ter filhos
tambm com baixa estatura, estes tm altura mdia do que a altura mdia de seus pais. O mesmo ocorre,
mas em direo contrria, com pais com estatura alta. A esse fenmeno de a altura dos pais mover-se em
direo altura mdia de todos os homens ele chamou de regresso.
O termo regresso remete ao passado, ou seja, para se fazer previses estatsticas necessrio
conhecer o passado (ou histrico) das variveis de causa e efeito da empresa. Caso a empresa no possua
estes dados e quiser fazer previses, a sada buscar dados do seu concorrente.

3.1. Equao da reta:


Uma vez que o comportamento entre as variveis tende para uma relao linear, o prximo passo
consiste em buscar determinar a respectiva equao de regresso linear simples.
Toda reta pode ser representada pela seguinte expresso matemtica y = a + bx, onde x e y so as
variveis e a e b, seus respectivos coeficientes. Sendo:
a = Coeficiente linear ou ponto que intercepta o eixo vertical y, ou seja, valor de y para x = 0
b = Coeficiente angular ou Declividade da reta, ou seja, a variao de y por unidade de variao de x.
O grfico da equao y = a + bx uma linha reta. Na prtica, os valores de a e b costumam ser
estimados. Para obter os valores dos coeficientes a e b, recorremos ao Clculo Diferencial. Sendo:

y x x xy
a
n x x
Notas de Aula

Bioestatstica

xy

x y
n

x
x
n

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 37

3.2. Coeficiente de determinao (R):


Indica a proporo da variao total da varivel dependente que explicada pela variao da
varivel independente, ou seja, mede a confiabilidade da previso a ser realizada. Assim, quanto maior
for o R, melhor ser o poder de explicao da reta de regresso.
A diferena do coeficiente de correlao (Rxy) para o coeficiente de determinao (R), que o
primeiro mede a fora da relao linear entre as variveis, enquanto que o R mede a explicao da reta de
regresso.
Dessa maneira, para apreciar o ajuste de uma reta, melhor utilizar o coeficiente de
determinao que mede o sucesso da regresso em explicar y, ou seja, o R verifica quantos por centos de
y pode ser explicado por x, o restante (%) so os sem explicao.

4. SRIES TEMPORAIS:
Segundo Corrar (2009), uma srie temporal um conjunto de observaes sequenciais de
determinada varivel, expressas numericamente, obtidas em perodos regulares de tempo. Assim, a
anlise de sries temporais baseia-se na premissa segundo a qual os fatores que influenciaram o
comportamento dos dados no passado continuam influenciando seus movimentos futuros.
Desta forma, os dados coletados de uma srie temporal podem sofrer a influncia de diversos
fatores, como: alteraes macroeconmicas, mudanas no padro tecnolgico vigente, variaes nas
condies de natureza, ou mesmo podem ser afetados por fenmenos imprevisveis, e por consequncia
disso, os dados podem sofrer alguma tendncia (sazonalidade, por exemplo), que consiste em mudanas
nos dados, fazendo-os serem no formato linear (diretamente ou inversamente proporcional), ou no
formato de uma curva, como por exemplo, a exponencial, polinomial, potencial, dentre outras (Quadro 1).
Tipo de Funo Equao Original

Equao
Linearizada

y = a + b.x
y = a + b.x
Linear
bx
y = a.e
ln y = ln a + b.x
Exponencial
b
y
=
a.x
ln
y = ln a + b.ln x
Potncia
y = a + b.ln x
y = a + b.ln x
Logartmica
Quadro 1: Principais transformaes lineares
Fonte: Adaptado de Corrar (2009)

Notas de Aula

Bioestatstica

Varivel
X

Varivel
Y

x
x
ln x
ln x

y
ln y
ln y
y

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 38

Exerccio 1: O objetivo do diretor de vendas do Grupo Po de Acar analisar a relao entre o


investimento realizado em propaganda e as vendas (ambas em milhes de Reais) de uma loja da rede no
Municpio de Fortaleza, para realizar projees de vendas baseados em futuros investimentos em
propaganda nos prximos anos. O Quadro a seguir registra o histrico de 10 anos com os valores de
propaganda e vendas em milhes de reais:
Ano

Propaganda
Vendas
(R$ milhes) (R$ milhes)

2005
2006
2007
2008
2009
2010
2011
2012
2013
2014

30
21
35
42
37
20
8
17
35
25

430
335
520
490
470
210
195
270
400
480

Assim, seguem os passos no Microsoft Excel:

CORRELAO:
1 Passo:
Abrir o arquivo que encontra o banco de dados no Excel ou digitar os valores da tabela acima;
Identificar quais so as variveis quantitativas e qual delas ser x (causa) e y (Efeito);

2 Passo: Construo do grfico de disperso entre x e y:


Selecionar as variveis Propaganda (x) e Vendas (y) Inserir grfico escolher grfico de
disperso xy (ou Ponto) Avanar Clicar em OK.
Formatao do grfico:
Apagar a legenda
Ttulo: Clique com boto direto do mouse dentro do grfico: Opes do grfico Em Ttulo: digitar
Relao entre Propaganda (R$ milhes) versus Vendas (R$ milhes) de uma determinada empresa x.
Formatar os eixos x e y, sendo Propaganda (R$ milhes) e Vendas (R$ milhes),
respectivamente;
Letra Times New Roman, tamanho 11;
Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 39

Verificar se os dados do grfico seguem uma tendncia linear. Se sim, calcula-se a correlao linear
entre as variveis x e y;

2 Passo: Fazer estudo de correlao linear entre x e y:


Procedimento 1: Com a ferramenta FUNO:
Posicione o cursor em um local abaixo do banco de dados para visualizar o resultado;
Clicar em Inserir funo Em selecionar uma categoria, escolha Estatstica Selecione uma
funo: CORREL OK Em matriz 1: selecione todos os dados da varivel x, em matriz 2: selecione
todos os dados da varivel y, inclusive com o ttulo. Caso esquea de selecionar o ttulo, o programa
calcula a correlao mesmo assim.
Com isso sair o resultado da correlao entre x e y = 0,8594 = 85,94%
Propaganda (R$ milhes) Vendas (R$ milhes)
Propaganda (R$ milhes)
1
Vendas (R$ milhes)
0,859366125
1
Procedimento 2: Com a FERRAMENTA ANLISE DE DADOS:
Clicar em Inserir
Ferramentas Anlise de dados Clicar na funo Correlao OK Em intervalo de entrada,
selecionar tudo que compe o banco de dados, inclusive o ttulo Clicar tambm em Rtulos na
primeira linha, pois caso no clique, o programa no conseguir ler o banco de dados, pois voc est
informando a ele que a primeira linha do banco de dados so as variveis Agrupados por coluna
Clicar em Nova sada OK. O resultado ser:
PARA A REGRESSO LINEAR SIMPLES:

Procedimento 1: Atravs da ferramenta FUNO:


Para encontrar o valor de a (o intercepto), que representado pela frmula:

y x x xy
n x x

CUIDADO para definir qual varivel x (independente) e qual y (dependente), pois contrrio o
resultado de a e b ser errado.
Clique em Inserir funo INTERCEPO Selecione os dados da varivel y, inclusive o ttulo,
e os dados da varivel y. Resultar: a = 117,07

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 40

Para encontrar o valor de b (o coeficiente angular, ou seja a inclinao da reta), que representado
pela frmula:

xy

x y

n
x

n
Clique em Inserir funo INCLINAO Selecione os dados da varivel y, inclusive o ttulo, e
os dados da varivel y. Resultar: b = 9,74

Portanto a equao de previso ser: y = a + bx, ou seja, y = 117,07 + 9,74x, que representa:
Vendas = 117,07 + 9,74. Propaganda
Procedimento 2: Atravs da ferramenta ANLISE DE DADOS:
Clique em Ferramentas Anlise de dados Regresso OK Selecione separadamente a
varivel y (vendas) e a varivel x (propaganda), inclusive os ttulos Clique em rtulos Nova
planilha. O que iremos utilizar segue abaixo:
Estatstica de regresso
R mltiplo
0,859366125
R-Quadrado
0,738510137
R-quadrado ajustado 0,705823904
Erro padro
65,17342989
Observaes
10
Onde o Coeficiente de determinao (R) igual a 0,7385, ou seja, 73,85% dos dados esto sendo
explicados pela equao y = 117,07 + 9,74x, e 0,2614 = 26,14% no esto sendo explicados pela reta
encontrada.
Coeficientes
Interseo
117,0701581
Propaganda (R$ milhes) 9,738142292
O quadro acima mostra os coeficientes a e b da reta de regresso.

Procedimento 3: Atravs do GRFICO DE DISPERSO:


Clique em algum dos pontos do grfico com o boto direito: Clicar em Adicionar linha de tendncia
Clicar em Linear Ir em Opes: Clicar em exibir equao do grfico e Exibir valor de R no
grfico, e sair a equao y = 117,07 + 9,7381x e R = 0,7385. Assim:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 41

Relao entre Propaganda (R$ milhes) versus Vendas


(R$ milhes) de uma determinada empresa X
600

Vendas (R$ milhes)

500
400
300
200

y = 9,7381x + 117,07
R2 = 0,7385

100
0
0

10

20

30

40

50

Propaganda (R$ milhes)

Fazendo previses matemticas com uso da equao de regresso linear:

Para investimento em propaganda no valore de 20 milhes, 40 milhes e 50 milhes de reais, assim:

Assim, a projeo para cada um dos investimentos ser de:

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 42

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 43

Nota de Aula 5 Medidas Descritivas para dados


agrupados
1. INTRODUO:
Quando o conjunto de dados consiste de um grande nmero de dados, indica-se aloc-los numa
tabela de distribuio de frequncia. Distribuio de frequncia uma srie de dados brutos agrupados
em uma tabela de acordo com o nmero de elementos distintos da srie. Esta tabela resume as classes de
valores, juntamente com as suas respectivas contagens (ou frequncias), servindo de base para as
representaes grficas.
A organizao dos dados agrupados traz vantagens na visualizao global, apesar de eliminar
alguns detalhes, pois h uma pequena perda de informao.

2. PASSOS PARA CONSTRUO DE UMA DISTRIBUIO DE FREQUNCIAS POR


INTERVALO:
1. Passo: Encontrar a amplitude total dos dados (Diferena entre o maior valor e o menor do conjunto de
dados):
At = V mx V min
2. Passo: Determinar o nmero de classes (k):
k = 5, se n 25
k = n , se n > 25 ou de acordo a Regra de Sturges: k = 1+3,22 log (n)
OBS1: Para n 50, ambos os mtodos de determinao de k so iguais, acima disso, aconselhvel
utilizar a Regra de Sturges, pois os dados ficam mais concentrados.
OBS2: Arredondar para mais o nmero de k independente do valor ocorrido.
Podemos notar que os valores encontrados no so nem de perto parecidos quando o valor de n
grande, por isso deve ser registrado que na organizao e construo de uma tabela de distribuio de
frequncias, o que deve prevalecer o bom senso e no s e simplesmente o resultado encontrado, usando
os modelos matemticos disposto no 2 passo.
A Regra de Sturges tende a apontar um nmero de classes com mais ecincia que a da raiz
quadrada.
Uma regra de bolso diz que as tabelas de distribuio de frequncias devem ter de 5 a 20 classes,
pois abaixo de 5 est se perdendo informao nas classes e acima de 30 o nvel de detalhamento torna-se
exagerado e pouco eficaz.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 44

Nmero de Classes (k)

n
30
35
40
50
60
70
80
90
100
110

Pela: k =

Pela: k = 1+3,22 log (n)

6
6
7
8
8
9
9
10
10
11

6
6
7
7
7
7
8
8
8
8

Quadro 1: Nmero de classes de acordo do tamanho de n

3. Passo: Amplitude do intervalo de classe (h):

At
k

4. Passo: Identificar os limites de classe: So os extremos de cada classe.


li = limite inferior, i = 1,...,k
ls = limite superior, s = 1,...,k

3. TIPOS DE DISTRIBUIO DE FREQUNCIAS:


Cada distribuio de frequncia depender do tipo de varivel que se est analisando:
a) Varivel quantitativa discreta: aquela que s pode assumir valores obtidos por contagem. Nesse
caso usa-se uma distribuio de frequncia por pontos, pois os dados sero tratados de maneira
individualizada.
b) Varivel quantitativa contnua: aquela que pode assumir valores quaisquer num intervalo de
observao, representam mensuraes. Nesse caso usa-se uma distribuio de frequncias com classes,
pois os dados sero agrupados para facilitar anlises futuras.

4. TIPOS DE FREQUNCIAS:
4.1. Frequncia simples ou absoluta (fi): o nmero de observaes correspondente classe i (i =
K

1,...,k), ou seja,

f
i 1

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 45

4.2. Frequncia relativa fi (%): A frequncia relativa representa a proporo de observaes de uma
classe em relao ao nmero total de observaes. Trata-se, portanto, de um nmero relativo. Para
calcular a frequncia relativa basta dividir a frequncia absoluta do valor individual (ou da classe) pelo
numero total de observaes, ou seja, ento:

f
f i (%) i x100 , onde
n
n = Tamanho da amostra
K

f (%) 1 ou 100%
i 1

4.3. Frequncia acumulada absoluta abaixo de (Fi): Representa o nmero de observaes


existentes abaixo do limite superior de cada classe. A expresso abaixo de refere-se ao fato de que as
frequncias a serem acumuladas correspondem aos valores menores ou anteriores classe cuja frequncia
acumulada se deseja obter, incluindo no clculo a frequncia da classe. Toda vez que se procura saber
quantas observaes existem at um determinado valor individual (ou uma determinada classe), recorrese frequncia acumulada abaixo de.
4.4. Frequncia acumulada absoluta acima de (Fi): Representa o nmero de observaes existentes
acima do limite inferior de cada classe. Para se obter a frequncia acumulada acima de basta somar a
frequncia das classes posteriores.
4.5. Frequncia acumulada relativa abaixo de ou acima de (Fi(%)): a frequncia acumulada do
valor ou da classe, dividida pelo tamanho total da amostra (n).

F
Fi (%) i 100
n

F
Fi (%) i 100
n

Exerccio 1: Segue abaixo o peso (kg) de 30 adolescentes de um consultrio de nutrio de um famoso


nutricionista de Fortaleza. Os dados foram obtidos dos pronturios destes pacientes que foram atendidos
no ms passado:
42
51
57

46
52
57

47
54
57

48
54
57

49
54
58

49
55
61

50
55
61

51
55
64

51
56
65

51
56
68

a) Construa uma distribuio de frequncias com classes para os dados acima (Utilize duas casas
decimais aps a vrgula)

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 46

Responda:
b) Quantos pacientes tem o peso entre 50,68 e 55,02kg?
Soluo:

c) Quantos pacientes tem o peso acima de 50,68kg?


Soluo:

d) Quantos pacientes tem o peso abaixo de 63,7kg?


Soluo:

e) Quantos pacientes tem o peso (%) 63,7 e 68,04kg?


Soluo:

f) Quantos pacientes tem o peso acima de 42kg?


Soluo:

5. REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQUNCIAS:


5.1. Histograma: formado por um conjunto de retngulos justapostos que tm as bases sobre um eixo
horizontal, com centro no ponto mdio. As bases coincidem com as amplitudes das classes. Se todos os
intervalos tiverem a mesma amplitude, as alturas sero proporcionais s frequncias das classes,
tomando-se ento as alturas numericamente iguais a essas frequncias, ou seja, largura do retngulo
igual amplitude da classe (h) e altura do retngulo igual sua frequncia simples (fi).
O objetivo de utilizar um histograma tentar perceber algo pelo formato da distribuio da
populao de dados da qual a amostra foi obtida.

Figura 1: Modelo de um histograma

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 47

5.2. Polgono* de frequncias: Consideramos um grfico de linha que une os pontos mdios das bases
superiores dos retngulos do histograma (pontos mdios das classes).

Figura 2: Modelo de um Polgono de frequncia

5.3. Medidas de Assimetria:


Ao montar uma distribuio de frequncias, pode-se construir um grfico que a represente, ou
seja, um histograma. Atravs do histograma possvel verificar se os dados tem um comportamento de
simetria, em que a mdia igual a moda e que ambas so iguais a mediana. Caso contrrio, a existncia
da simetria no ocorre mais, ou seja, a distribuio dos dados considerada assimtrica, podendo ser
positiva ou assimtrica direita (Moda Mediana Mdia), ou negativa ou assimtrica esquerda
(Mdia Mediana Moda).
O que determina a assimetria a posio da moda?, bom, se a moda for no incio isso mostra que
a assimetria ficar do lado direito, se a moda ficar no final, isso mostra que a assimetria ser do lado
esquerdo. Portanto, se a moda for menor que todas as outras medidas, ela estar no incio (assimtrica
direita), e se ela for maior que todas as medidas sero assimtricas esquerda.
A assimetria, como o prprio nome insinua, significa desvio ou afastamento da simetria, ou seja,
em outras palavras, assimetria o grau de deformao de uma curva de frequncias.
Veja a Figura 3, que representa uma distribuio de frequncias simtrica, e as Figuras 4 e 5 que
representam uma distribuio de frequncias assimtricas.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 48

Figura 3 Histograma simtrico

Figura 4 Histograma assimtrico direita

Figura 5 Histograma assimtrico esquerda

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 49

5.4. Medidas de Curtose (ou achatamento):


A curtose ou excesso indica at que ponto a curva de frequncias de uma distribuio se
apresenta mais afilada ou mais achatada do que uma curva-padro, denominada curva normal ou
distribuio Normal (ou de Gauss em homenagem ao matemtico alemo Carl F. Gauss) a
distribuio de probabilidade que mais frequentemente se utiliza para descrever fenmenos que so
traduzidos por variveis aleatrias contnuas.
Teremos, portanto, no tocante s situaes de Curtose de um conjunto, as seguintes
possibilidades:

Figura 7 Achatamento das curvas com relao Distribuio Normal de Probabilidade

- Mesocrtica: ou de curtose mdia. Ser essa a nossa Curva Normal. Meso lembra meio. Esta curva
est no meio termo: nem muito achatada, nem muito afilada;
- Platicrtica: a curva mais achatada, ou seja, os dados esto muito dispersos da mdia. Seu desenho
lembra o de um prato emborcado. Ento prato lembra plati e plati lembra platicrtica;
- Leptocrtica: a curva mais afilada, ou seja, os dados esto muito concentrados no meio (na mdia),
sempre estar acima da Curva Normal.
OBS: Se a distribuio assimtrica no h razes para verificar o seu grau de achatamento, ou seja, no
existe curtose para ela.

Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 50

5.5. Grfico da distribuio de frequncia acumulada abaixo de ou Ogiva de Galton**: um


grfico representativo da distribuio acumulada de frequncias (%). utilizado para encontrar uma
parcela da amostra at determinado valor.

Figura 3: Modelo de uma Ogiva de Galton

Ainda, de acordo o Exerccio 1:


g) Construa um histograma, trace o polgono de frequncias e verifique se os dados so simtricos ou
assimtricos (direita ou esquerda):

h) Construa uma Ogiva de Galton e informe em qual classe se encontram as 10% maiores notas e as 10%
menores.
6. MEDIDAS DE TENDNCIA CENTRAL PARA DADOS AGRUPADOS EM CLASSES:
6.1. Mdia Ponderada (x ) : Quando os dados esto resumidos em uma tabela de frequncia, podemos
aproximar a mdia substituindo os limites da classe pelos pontos mdios delas, e supor que todos os
elementos da classe se concentram no respectivo ponto mdio.
No exerccio 2, por exemplo, a 2 classe de 4,0|---5,2 contm dois valores que se situam em
algum ponto entre os limites da classe, mas no sabemos os valores especficos desses dois nmeros. A
fim de possibilitar os clculos, supomos que todos os dois valores se concentram no ponto mdio 4,6, ou
seja, supomos que a mdia deles 4,6.
Onde:
n = nmero de observaes ou tamanho da amostra
k

X i fi
i 1

Xi = Ponto mdio da i-sima classe***


fi = frequncia simples ou absoluta da i-sima classe (pesos de cada classe)
k = nmero de classes
*** Ponto mdio (Xi) =

Notas de Aula

Bioestatstica

li l s
, onde li = limite inferior e ls = limite superior
2

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 51

6.2. Moda (Mo): Existem diferentes formas de se calcular a Moda de uma Distribuio de Frequncias.
Para isso existem dois mtodos, cada um dos quais traduzidos por uma frmula.
Aprenderemos a determinar a Moda da Distribuio de Frequncias pelo Mtodo de Czuber e
pelo Mtodo de King. Teremos ento que conhecer ambas as frmulas, saber aplic-las e, sobretudo,
saber quando usar uma ou outra.
A regra a seguinte: se a questo no especificar qual das frmulas a ser empregada, pedindo
apenas que se calcule a Moda, usaremos a frmula de Czuber. Consequentemente, s empregaremos a
frmula de King quando assim for solicitado expressamente pelo enunciado.
- Passo Preliminar: Encontrar a Classe Modal
A determinao da Moda de uma Distribuio requer que se proceda a um passo preliminar, que
consiste em identificar a classe modal daquele conjunto. A classe modal ser, simplesmente, aquela que
apresentar maior frequncia absoluta simples, ou seja, maior fi.
- Moda pelo Mtodo de Czuber:

1
Mo limo
h

2
1
Onde:
limo= limite inferior da classe modal
OBS4: Delta () normalmente significa diferena.
1 = Diferena entre a frequncia absoluta da classe modal e da classe imediatamente anterior: 1 = fmo fant
2 = Diferena entre a frequncia absoluta da classe modal e da classe imediatamente posterior:
2 = fmo fpost
h = comprimento do intervalo da classe modal
6.3. Mediana (Md): Quando se trabalha com uma distribuio de frequncias, deve-se inicialmente,
identificar a classe mediana atravs do elemento mediano (EM), assim:
Para n = mpar: EM

n 1
2

n
2
Aps isso, na frequncia acumulada abaixo de, localizar a frequncia imediatamente posterior

Para n = par: EM

ao do elemento mediano. Em seguida, ser identificada a classe mediana.


A mediana ser dada pela seguinte frmula:

Notas de Aula

Bioestatstica

EM Fi ant
Md
Md linfMd
f iMd

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

.h

Pgina 52

Onde,
linf Md = limite inferior da classe mediana (classe

fimd = frequncia absoluta da classe

que contm a mediana)

mediana

Fi anter Md = Frequncia acumulada anterior a da

h = amplitude do intervalo da classe mediana

classe mediana

n = tamanho da amostra

6.4. Medidas de disperso para dados agrupados em classes:


Varincia
k

S
2

(X
i 1

Desvio Padro
k

X )2 fi

n 1

(X
i 1

Coeficiente de Variao

S
CV
X

X )2 fi

n 1

100

Exerccio 2: Os dados abaixo so referentes aos pesos (kg) de 25 crianas que nasceram de forma
prematura. Um nutricionista deseja analisar as condies nutricionais destes recm-nascidos e fazer um
acompanhamento do peso deles nos prximos 3 meses. Complete as informaes que faltam na
distribuio de frequncias e responda os itens abaixo:
Pesos (kg)

fi

fi (%)

Fi
(abaixo de)

Fi
(acima de)

100%

xi

xifi

1,5|--- 1,7
|---

|---

11

|---

|---

TOTAL

25

Fonte: Dados hipotticos

a) Calcule o peso mdio dos recm-nascidos analisados


b) Calcule o peso que mais se repete entre dos recm-nascidos analisados
c) Calcule o peso mediano dos recm-nascidos analisados
d) Na primeira classe, quantos recm-nascidos pesam exatamente 1,5 Kg?
e) Quantos recm-nascidos pesam abaixo de 2,3 Kg?
f) Quantos recm-nascidos pesam acima de 1,5 Kg?
g) Quantos recm-nascidos pesam acima de 2,3 Kg?
Notas de Aula

Bioestatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 53

Nota de Aula 6 Probabilidade


1. INTRODUO:
O passo decisivo para a fundamentao terica da inferncia estatstica associa-se ao
desenvolvimento do clculo das probabilidades.
At recentemente, era comum creditar a deciso de qualquer evento aos deuses ou alguma outra
causa sobrenatural. Simplesmente no havia espao para uma abordagem que atribusse ao acaso, e to
somente a ele, essas ocorrncias. Entretanto, a Humanidade precisou de centenas de anos para se
acostumar com um mundo onde alguns eventos no tinham causa, ou eram determinados por causas to
remotas que somente podiam ser razoavelmente representados por modelos no casuais. Tendo isso em
vista, fica mais fcil perceber porque a abordagem matemtica do acaso, do azar e do risco s se iniciou
h pouco mais de 500 anos.
Dessa forma, a teoria das probabilidades nasceu das tentativas de quantificao dos riscos dos
seguros e da avaliao das chances de se ganhar em jogos de azar.
Assim, essa quantificao dos riscos ocorreu h mais de 5 mil anos entre os comerciantes
martimos mesopotmicos e fencios, aplicados perda de carga de navios, ou por naufrgio ou por
roubo. Assim, a prtica foi continuada pelos gregos e romanos e acabou chegando ao mundo cristo
medieval atravs dos comerciantes martimos italianos que se baseavam em estimavas empricas das
probabilidades de acidentes para estipularem as taxas e prmios correspondentes.
Logo aps o trmino da Idade Mdia, o crescimento dos centros urbanos levou popularizao
de um novo tipo de seguro: o seguro de vida. Assim, com este tipo de seguro surgiram os primeiros
estudos matemticos sobre o assunto, fazendo com que houvesse um enorme aumento nos negcios de
seguros martimos (associados aos preciosos carregamentos trazidos das Amricas e das ndias), mas os
seguradores continuaram a usar as milenares tcnicas empricas.
Posteriormente a isso, o primeiro trabalho prtico na rea dos seguros de
vida devido a Halley em 1693 (Degrees of Mortality of Mankind).
Nesse trabalho, Halley mostrou como calcular o valor da anuidade do
seguro em termos da expectativa de vida da pessoa e da probabilidade de
que ela sobreviva por um ou mais anos, mas com Daniel Bernoulli
(1730), a matemtica dos seguros atingiu um estado bastante maduro,
pois com ele retoma-se um clssico problema de, a partir de um nmero
dado de recm nascidos, calcular o nmero esperado de sobreviventes
aps n anos.
Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 54

Alm disso, ele tambm d os primeiros passos em direo a novos tipos de seguros calculando,
por exemplo, a mortalidade causada pela varola em pessoas de idade dada.
Concomitantemente, os jogos de azar, jogos nos quais a possibilidade de ganhar ou perder no dependem
da habilidade do jogador, mas sim exclusivamente do azar do apostador, so, provavelmente, to velhos
quanto humanidade.
Sendo assim, a origem da probabilidade se deu aos jogos de azar, atravs de questes postas pelo
matemtico francs Pascal (1623-1662) com o clebre cavaleiro Mr, um famoso jogador profissional
que escreveu uma carta a Pascal, propondo-lhe resolver alguns problemas matemticos que tinha
encontrado em suas lidas com jogos de azar.
Sendo assim, hoje h muitas aplicaes que envolvem jogos de azar como as loterias, os cassinos
de jogos, as corridas de cavalos e os esportes organizados (futebol, voleibol, handebol), dentre outros, que
utilizam a teoria das probabilidades diariamente nas duas deliberaes.
Independente de qual seja a aplicao em particular, a utilizao das probabilidades indica que
existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de um evento futuro. Assim
que, em muitos casos, pode ser impossvel afirmar por antecipao o que ocorrer, mas possvel dizer o
que pode ocorrer. Por exemplo, se jogarmos uma moeda para o ar, de modo geral no podemos afirmar se
vai dar cara ou coroa. Alm disso, mediante determinada combinao de julgamento, experincia e dados
histricos, em geral, possvel dizer quo provvel a ocorrncia de determinado evento futuro.
Assim, as probabilidades so teis porque auxiliam a desenvolver estratgias e faz com que o
mtodo da inferncia estatstica se baseie na teoria da probabilidade para formular concluses sobre toda
uma populao (N) baseada em uma amostra (n). Dessa forma que alguns motoristas parecem
demonstrar uma tendncia para correr a grande velocidade se acham que h pouco risco de serem
apanhados ou de correr acidentes fatais. Os investidores sentem-se mais inclinados a aplicar seu dinheiro
se as chances de lucro so boas, e voc certamente carregar capa ou guarda-chuva se houver grande
probabilidade de chover. Analogamente, uma empresa pode sentir-se inclinada a negociar seriamente com
um sindicato quando h forte ameaa de greve, ou mais inclinada a investir em novo equipamento se h
boa chance de recuperar o dinheiro, ou ainda de contratar um novo funcionrio que parea promissor,
dentre outros.
Ao longo dos anos, os clculos probabilsticos vieram se aperfeioando, passando da simples
anlise de fatos concretos abstrao destes. Um caso de utilizao da teoria da probabilidade o
envolver a maior loteria do Brasil, a Mega-Sena, onde so apostados de seis a quinze nmeros, entre os
60 disponveis no volante (01 a 60, inclusive respectivamente).

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 55

Neste jogo, os apostadores podem apostar de no mnimo seis nmeros e no mximo quinze do
total de 60. Marcando 4, 5 ou 6 pontos (quadra, quina ou sena, respectivamente) recebero prmios.
O preo das apostas dependendo de quantos grupos possveis de seis nmeros existem dentro dos
nmeros escolhidos, variam de R$ 3,50 para seis nmeros (somente 1 jogo possvel) a R$ 8.758,75 para
15 nmeros (5005 jogos possveis). A possibilidade de acertar a Mega-Sena ao fazer uma aposta mnima
de 1 em 50.063.860 (aproximadamente 50 milhes).
O clculo feito da seguinte forma:
n = Total de nmero a escolher (n = 60)
X = Ganhar na Mega-Sena, ou seja, quantidade de nmeros a acertar dentre os 60 nmeros (x = 6
nmeros), ento:
Como a ordem de escolha dos nmeros no importa, ento usa-se a seguinte frmula de
combinao:

n 60
60!
60!

50.063.860 , ento:
x 6 6!(60 6)! 6!54!
P(ganhar na mega-sena) =

1
0,00000002 0,000002% , ou seja, as chances de
50.063.860

ganhar o jogo com uma nica cartela de 1 para 50 milhes. Para todos os efeitos prticos, essa
probabilidade zero, o que significa que o apostador tem quase nenhuma chance de ganhar na loteria com
uma nica cartela, mas mesmo assim, sempre h algum ganhador na loteria. Essa contradio aparente
pode ser explicada com a seguinte analogia:
Suponha que h uma fila de micronibus de Fortaleza at o Porto Alegre (RS). Suponha que
pela distncia entre as duas cidades e pelo comprimento de um micronibus normal, haver, de forma
hipottica, aproximadamente 23 milhes de micronibus na fila. Diretores da loteria selecionariam, ao
acaso, um dos micronibus e colocariam um cheque de 30 milhes de reais em seu porta-luvas. Por um
custo de dois reais o apostador pode viajar pelo pas e selecionar um (e somente um) micronibus e
verificar o porta-luvas.
Em sua opinio, voc acha que o apostador vai encontrar os 30 milhes no micronibus que
escolheu?
Voc deve estar quase certo que no. Agora, permita que qualquer pessoa entre na lotrica e por
dois reais adquira uma cartela e suponha que 50 milhes de pessoas faam isso uma nica vez. Com um
nmero to grande de participantes muito provvel que algum v achar o micronibus com os 30
milhes, mas quase certo que no ser voc.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 56

Este exemplo ilustra um axioma da Estatstica chamando de a lei dos grandes nmeros (proposta
por Bernoulli), que estabelece que a frequncia relativa (proporo entre o nmero de elementos do
espao amostral e o espao amostral) do nmero de vezes em que um resultado ocorre quando um
experimento repetido muitas vezes (um grande nmero de vezes) se aproxima do valor terico da
probabilidade de resultado. Em outras palavras, quando se repete um experimento um nmero
suficientemente grande de vezes possvel, substituir a expresso frequncia relativa por
Probabilidade com erro desprezvel.
Bernoulli afirmou: Para um grande nmero de experincias, tendo cada uma um resultado
aleatrio, a frequncia relativa de cada um desses resultados tende a estabilizar, convergindo para um
certo nmero que constitui a probabilidade desse resultado.
claro que se o nmero de repeties da experincia aleatria for bastante elevado, e a mesma
for repetida em sequncias de n vezes, a frequncia do acontecimento do evento E diferente de
sequncia para sequncia, mas toma valores prximos de um valor dado. Esse valor o limite para o qual
tende a frequncia do acontecimento E, e tambm o valor esperado (terico) da probabilidade desse
acontecimento quando o nmero n de provas que se realizaram tende para infinito. Assim:
P( E )

lim
n

P( E )

lim n( E )
n n()

No entanto, para este processo poder ter preciso, necessrio realizar um grande nmero de
vezes a experincia aleatria. Isto ocorrendo, para qualquer tipo de distribuio de probabilidade
(Normal, Uniforme, Triangular, Exponencial) a lei dos grandes nmeros funciona tambm.
Na prtica empresarial, a utilizao lei dos grandes nmeros ocorre devida uma razo bem
cientfica para escolha do ser humano mdio como foco na formulao desta lei na gesto de pessoas,
podendo formul-la mais ou menos assim: O comportamento de um grande nmero de pessoas mais
previsvel do que o comportamento de um grupo pequeno ou que o comportamento de uma pessoa
isolada. Essa afirmao nos ajuda a entender vrios acontecimentos aparentemente misteriosos da vida
em sociedade, e muita mais na vida na empresa. Por exemplo, ningum controla a quantidade de comida
que deve chegar a uma cidade como Fortaleza, ou quais tipos de comida devem ser encomendados, mas
certo eu encontrar o que quero, quando quero, do jeito que quero. A habilidade que o sistema tem de
antecipar minhas necessidades e desejos sem que eu tenha falado deles a ningum, explicada pela lei
dos grandes nmeros. Eu, um cara mdio, no vou sair procurando nada muito fora da mdia. Chamam
esse talento para computar o que os mdios querem, de talento de marketing, e para isso utilizam a
teoria da probabilidade.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 57

Ainda para uma maior explicao da lei dos grandes nmeros, se no soubermos a probabilidade
de ocorrer algum evento natural (por exemplo, a chance de chover), ou se no conhecemos a frao de
alguma populao que satisfaz uma condio (tal como quantas partes defeituosas foram produzidas
numa linha de montagem) podemos descobrir esta probabilidade ou esta porcentagem atravs de
numerosas observaes e experimentos suficientes.
Um outro exemplo para a lei dos grandes nmeros voc pode achar estranho que uma pessoa
ganhe duas vezes ou mais na Mega-Sena. O New York Times contou a histria de uma mulher de Nova
Jersey (EUA) que ganhou duas vezes a lotaria americana, dizendo que as probabilidades eram de 1 em
17 trilhes. Contudo, os estatsticos Stephen Samuels e George McCabe da Universidade de Purdue
calcularam a probabilidade de algum ganhar a loteria duas vezes num perodo de 4 meses como de 1
para 30.
Por qu essa chance e essa probabilidade de ganho aumenta?
Porque os jogadores no compram um nico bilhete para cada uma das duas loterias, compram
vrios bilhetes mltiplos por semana. Justificando nesse caso a lei dos grandes nmeros com a quantidade
grande de jogadas por jogadores.
Em outras palavras, quer ganhar na Mega-Sena, aposte nela e com muitas cartelas, mas muitas
mesmo.
Um outro exemplo para a lei dos grandes nmeros , se fizermos uma pesquisa sobre a
populao de um Estado brasileiro e observamos apenas alguns cidados (amostra), os resultados podem
conter grande erro, porm se analisarmos vrias pessoas em vrias cidades diferentes dentro deste Estado
(selecionados ao acaso), os resultados das amostras estaro muito prximos dos verdadeiros valores da
populao e quanto maior a amostra (maior nmero de pessoas entrevistadas) maior ser esta
aproximao.
Diante de tudo isto, os jogos, considerados legais, no Brasil estimulado, pois de acordo o site
da Caixa Econmica Federal (Janeiro, 2012), quem joga na Mega-Sena tem milhes de motivos para
apostar e milhes de brasileiros para ajudar. 51% do valor arrecadado com as apostas repassada ao
Governo Federal, que pode, ento, realizar investimentos nas reas da sade, educao, segurana, cultura
e do esporte, beneficiando toda a populao, por exemplo, 18,1% destinado Seguridade Social, 7,76%
ao FIES-Crdito educativo e 3,14% ao Fundo Penitencirio Nacional.
Desde ento, as loterias em geral se tornaram imensamente populares por duas razes. Primeiro,
elas atraem o apostador com a oportunidade de ganhar milhes de reais com um investimento de dois
reais, segundo, quando o apostador perde, pelo menos acredita que seu dinheiro est indo para uma boa
causa.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 58

A Mega-Sena no simplesmente uma vantagem para o povo concedida pelo governo, pois
como a grande maioria dos apostadores so pertencentes classe baixa, os mesmos gastam na loteria
aproximadamente o mesmo que pessoas de classe mdia, mas por terem menos dinheiro, o maior
percentual de seus ganhos dos que apostam na sorte se destinam a esse fim. Isso faz desta uma forma de
atividade regressiva, ou seja, empobrece mais quem j tido como pobre.
Sempre acerto 11 pontos e ganho 2 reais na LOTOFACIL, s
uma vez que acertei 13 pontos e ganhei 10 reais. No total ja
ganhei 32 reais, mas a descontei 12 reais das apostas, sobrou
20 reais, s que a fui descontar os outros jogos que eu no
acertei e vi que fiquei 17 reais mais pobre...

(depoimento annimo de um jogador)


2. CONCEITOS INICIAIS:
Experimentos(1) aleatrios: So aqueles que no so previsveis, mesmo que repetido em idnticas
condies, geram resultados diferentes, pois ocorrem ao acaso.
Ex1: Lanamento de uma moeda honesta
Ex2: Lanamento de um dado no viciado
Ex3: Sorteio de uma bolinha no bingo
Ex4: Determinao da vida til de um aparelho eletrnico
Ex5: Resultado de um jogo de futebol.
Espao amostral (): o conjunto de todos os resultados possveis de um experimento aleatrio, ou
seja, o conjunto universo do experimento.
Ex: Seja o experimento Lanar uma moeda honesta.
Os resultados possveis so:

= {C, K}, onde C = Cara e K = Coroa


Evento (E): o subconjunto do espao amostral que contm os resultados que nos interessam.
Ex: Lanam-se uma moeda e um dado.
Enumere o seguinte evento: E1= Sair cara e face par
Evento certo: o evento que ocorre com certeza ( o prprio espao amostral).
Ex: Sair face menor que 7 no lanamento de um dado.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 59

Evento impossvel: o evento que nunca ocorre (), ou seja, no h possibilidade de ocorrncia deste
evento.
Ex: Obter soma maior que 12 no lanamento de dois dados.
Operaes com eventos aleatrios:
a) Unio: Sejam os eventos A e B, a unio do evento A ao evento B entendido por A B. Representa a
ocorrncia de pelo menos um dos eventos, A ou B.
Ex: Seja o experimento: Lanar um dado honesto. Ento, = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par
E2: Ocorrer nmero menor que 3
Ento, E1 E2 =
Representao esquemtica pelo diagrama de Venn:

E1

E2
b) Interseo: O evento interseo formado pelos pontos amostrais que pertencem simultaneamente
aos eventos A e B, sendo representado por A B.
Ex: Seja o experimento Lanar um dado honesto. Ento, = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par ou

E1

E2: Ocorrer um nmero primo


Ento, E1 E2 =
E2
Eventos mutuamente exclusivos ou disjuntos: So eventos que no ocorrem simultaneamente, ou
seja, A B = , pois a ocorrncia de um deles anula a ocorrncia do outro.
Ex: Seja o experimento Lanar um dado honesto. Ento, = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par
E2: Ocorrer face mpar
Ento, E1 E2 =

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 60

Eventos complementares ( E ) : O complemento de um evento E, denotado por E ou E c , consiste


em todos os resultados em que o evento E no ocorre, ou seja, o acontecimento complementar de E.
Eventos complementares so eventos mutuamente exclusivos, mas a recproca no verdadeira,
ou seja, nem todo evento mutuamente exclusivo complementar, por exemplo, no jogo de futebol, se o
time ganhar por que o outro perdeu, mas se empatar, nenhum ganhou ou nenhum perdeu.
E E = (mutuamente exclusivo)
E E = E + E = E = -E
Dizemos que E e E so complementares se sua unio o prprio espao amostral e sua
interseo vazia.
Exemplo1: Cara ou coroa na jogada de uma moeda
Exemplo 2: Feridos e no feridos num acidente
Exemplo 3: Seja o experimento: Resultado final de uma disciplina: Aprovado ou no aprovado
2.1. Definio de Probabilidade: a possibilidade de que certo evento venha ocorrer, ou seja, uma
medida da incerteza associada aos resultados do experimento aleatrio. De acordo a Lei de Laplace: Seja

um espao amostral equiprovvel (quando todos tm a mesma probabilidade de ocorrer) de um


experimento aleatrio, e E, um evento desse espao amostral finito*, definido por:
P(E )

Nmero de elementos de E
n( E )
, assim: P( E )
Nmero de elementos do
n()

Em outras palavras, probabilidade uma frao entre o nmero de resultados favorveis (aqueles
que satisfazem a necessidade do problema as ser calculado) com o nmero de resultados possveis.
De acordo a Lei dos Grandes Nmeros: Quando o nmero de provas aumenta muito, tendendo
para infinito, a frequncia relativa de cada acontecimento, associado experincia aleatria tende a
estabilizar na vizinhana de um certo valor, ou seja, converge para um limite que a probabilidade desse
acontecimento.
Propriedades/Axiomas:
a) A probabilidade de um evento certo igual a 1, isto , P() = 1
b) O P(E) 1: A probabilidade de um evento ocorrer sempre maior ou igual a zero e menor ou igual a
1.
c) P( A ) 1 P( A) P( A) P( A ) 1 = P(), ou seja, a soma de eventos mutuamente exclusivos
sempre ser igual a 1.
d) P() = 0, mas a reciproca no verdadeira, pois o fato de P(A) = 0 no implica que seja impossvel.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 61

Exerccio 1: Em um teste com 3 questes do tipo verdadeiro e falso, um estudante que no est preparado
deve responder cada uma aleatoriamente (chutando). Portanto:
a) Relacione os diferentes resultados possveis:
Soluo:

b) Qual a probabilidade de responder corretamente todas as trs questes?


Soluo:

c) Qual a probabilidade de passar no teste chutando corretamente pelo menos 2 questes?


Soluo:

Exerccio 2: Uma pessoa vai ler uma frase de uma pgina ao acaso
de um livro de 240 pginas. Qual a probabilidade de ser escolhida
uma pgina com nmero compreendido entre 80 e 120, excluindo
estes dois?
Soluo:

2.2. Teorema da soma: Seja E um espao amostral finito e no vazio. O principal objetivo da regra da
adio encontrar a probabilidade de ocorrncia do evento A, ou do evento B, ou de ambos, ou pelo
menos um deles. Assim:
P (A B) = P (A) + P (B) P (A B)
Ou
P(A B) P(A B) P(A B) P(A B)

Representando pelo diagrama de Venn:

P (A e B) = P (A B)
Se os eventos forem mutuamente exclusivos, ou seja, no ocorrem simultaneamente, isto ,
A B = , ento P (A B) = 0, assim: P (A B) = P (A) + P (B)
Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 62

Quando as probabilidades de eventos mutuamente exclusivos somam 1, diz-se que os eventos


so coletivamente exaustivos, nesse caso no existem outros resultados possveis.
Leis de Morgan ou Leis das Dualidades: Seja E um espao amostral finito e no vazio. O principal
objetivo da regra verificar a:
P(A B) = Probabilidade de no ocorrer A e B, ou seja, no ocorre a interseo.

P(A B) = Probabilidade de no ocorrer A e no ocorrer B, ou seja, no ocorre cada um


separadamente, assim: P(A B) =1- P(A B)

P( A B ) 1 P( A B) P( A B) : A probabilidade de no ocorrer a interseo.


Sejam A, B e C trs eventos. Ento:
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C)

Exerccio 3: Considere um experimento aleatrio e os eventos A e B associados, tais que


P (A) =

1
1
1
, P (B) = e P (A B) = . Ento temos:
2
3
4

a) P(A)
b) P(A B)
c) P(A B)
d) P(A B)
e) P(A B)
Exerccio 4: Quando Maria pra em um posto de gasolina, a probabilidade dela abastecer o seu
automvel 0,73; a probabilidade dela pedir para verificar a presso dos pneus 0,28 e a probabilidade
dela pedir para realizar ambos, abastecimento e pneus 0,04. Portanto, a probabilidade de Maria parar em
um posto de gasolina e no pedir nem para abastecer o automvel e nem para verificar a presso dos
pneus igual a:
Soluo:

2.3. Probabilidade condicional:


Se A e B so eventos associados a um espao amostral , com P(B) 0, ento a probabilidade
de ocorrncia do evento A condicionada ocorrncia do evento B, denotada por P (A/B) e definida pela
relao:
P( A / B)

Notas de Aula

Estatstica

P( A B)
, onde P (B) > 0
P( B)

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 63

n( A B )
n ( )
Nesse caso, P( A / B)
n( B )
n ( )
Se A e B forem independentes:
P( A / B)

P( A).P( B)
P( A) , analogamente P(B/A) = P(B), ou seja, a regra da probabilidade
P( B)

condicional no se aplica.

Exerccio 5: Um nmero sorteado ao acaso entre os inteiros: 1, 2, ... , 15. Se o nmero sorteado for par,
qual a probabilidade de que seja o nmero 6?
Soluo:

Atravs da definio da probabilidade condicional definiu-se o chamado Teorema da


Multiplicao.

2.4. Teorema da multiplicao: A regra da multiplicao calcula a probabilidade de o evento A ocorrer


e a ocorrncia do evento B, ou seja, P(A e B).
P (A e B) = P (A). P (B), se A e B so independentes
P (A e B) = P (A). P (B/A), se A e B so dependentes
Eventos independentes: Dois eventos A e B so independentes se a ocorrncia de um deles no afeta
a probabilidade de ocorrncia do outro, caso contrrio, so dependentes. Ento:
P (A B) = P (A). P (B), se A e B so independentes
P (A B) = P (A). P (B/A), se A e B so dependentes
A regra da multiplicao extremamente importante em virtude de suas inmeras aplicaes.

Exemplo de dependncia: O lanamento de uma moeda e um dado so eventos independentes, porque o


resultado da moeda no afeta a probabilidade do resultado do dado. Por outro lado, os eventos conseguir
dar partida no carro e chegar aula no horrio so dependentes, por que o resultado da operao de
dar partida no carro influi na probabilidade de chegar aula no horrio. E outra, assistir as aulas de
estatstica depende para passar na disciplina de estatstica.
Se A e B so mutuamente exclusivos, ento A e B so dependentes, pois se A ocorre, B no
ocorre, isto , a ocorrncia de um evento condiciona a no ocorrncia do outro.
Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 64

Um exemplo de independncia: A confiabilidade de um sistema areo: Os avies tm dois sistemas


eltricos independentes e dois rdios. Um avio deve levar dois transceptores de radar, porque se um
nico falhar o avio se torna invisvel na tela do radar. Se a probabilidade de um desses componentes
falhar de 0,001, ou seja, 1/1000 (um para cada mil), a probabilidade de dois falharem simultaneamente
de apenas 0,001, ou seja, 1/1.000.000 (um para cada um milho).

Um outro exemplo de independncia: Imagina a situao em que em uma mo voc tenha um dado e
em uma outra uma moeda, o lanamento de um e de outro no influencia nos seus respectivos resultados.
Ou seja, lana uma moeda para cima e um dado sobre a mesa no vai influenciar em nada, pois so
eventos independentes.

Exerccio 6: Em uma caixa existem 5 bolas brancas e 8 bolas azuis. Duas bolas so retiradas uma aps a
outra da caixa, aleatoriamente e sem reposio. Determine:
a) A probabilidade de serem brancas:

b) A probabilidade de uma ser branca e outra azul, em qualquer ordem:

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 65

Nota de Aula 7 Apresentao Tabular e Grfica de


Dados Com Uso Do Microsoft Excel
1. GERAO DE TABELAS E GRFICOS:
1 Passo: Abrir o Excel
Ao abrir o Excel: Visualizar o banco de dados (em anexo) referente ao perfil dos funcionrios de uma
Empresa.
Identificar os tipos de variveis:
Estado Civil: Varivel Qualitativa Nominal
Sexo: Varivel Qualitativa Nominal
Grau de instruo: Varivel Qualitativa Ordinal
Salrio (S.M): Quantitativa Contnua
Idade: Quantitativa Contnua
2 Passo: Fazer uma tabela para Estado Civil
Clicar na planilha nova (ao clicar j insere automaticamente outra planilha): Digitar na clula B2 as zonas
enunciativas da tabela (Estado Civil e Frequncia).
Aps isso digitar os estados civis dos funcionrios que contm no banco de dados (Casado e Solteiro)
nessa ordem.
1.1. Frequncia simples ou absoluta: Embaixo da palavra frequncia que foi digitada:
Ir em Frmulas Inserir funo (fx) Selecionar a funo CONT.SE clicar em OK
OBS: Para selecionar tudo de uma vez, clique em shift + end + (tudo junto).
Em Intervalo: selecionar todos os funcionrios referentes clula estado civil, sem o rtulo (ttulo).
Em Critrios: Selecione o estado civil que est querendo quantificar (Essa seleo deve ser na
planilha do banco de dados e no na que foi criada, pois caso contrrio vai dar zero e t errado: O Excel
s entende se copiar e colar as palavras exatamente do banco de dados ou clicar nele). Clicar em
OK.
Embaixo do ltimo estado civil digitado, digitar a palavra Total e na clula ao lado, clicar em
Somatrio ou =soma(C3:C4): O resultado deve ser 36, pois a quantidade de funcionrios no banco
de dados.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 66

1.2. Frequncia relativa (%): Ao lado do valor encontrado para o estado civil casado, calcular a
frequncia percentual para esse estado civil:
Digitar a seguinte frmula: =(valor encontrado/valor total) Clicar em % com uma casa decimal
(Formatar Clula Em porcentagem, clicar em 1 casa decimal).
Para fixar o valor total clicar no meio dele e depois em f4 e arrasta at fim da tabela.
Para a clula abaixo (Solteiro): Repetir os passos acima;
Em Total, clicar em Somatrio ou =soma(C3:C4) (Cuidado, o total deve resultar em 1 ou
100%).
1.3. Formatao da tabela: Selecione toda zona enunciativa da tabela e clique em Bordas (Borda
superior e inferior). Idem para o Total.
Se quiser: Selecione toda coluna de Frequncia e clicar em Borda externa (quadrado).
Cuidado: A tabela no deve ser fechada nas bordas.
Sada do Excel:
Estado Civil Frequncia Frequncia (%)
Casado
20
55,6
Solteiro
16
44,4
Total
36
100,0
Tabela 1: Estado civil dos funcionrios da empresa x, Fortaleza, Cear, 2013
Fonte: Empresa x

3 Passo: Construo do grfico para a tabela de Estado Civil


O grfico s sair corretamente aps a construo da tabela.
Selecionar os estados civis (Solteiro e Casado) e as respectivas freqncias: Ir em Inserir escolher
grfico de pizza Avanar Clicar em OK.
OBS: No precisa selecionar a frequncia relativa (%) s a absoluta (o Excel j transforma se quiser).

1.4. Formatao do grfico:


Apagar a legenda
Clicar com boto direito do mouse (Em uma das partes do grfico, NO NAS DUAS): Formatar
Pontos de dados
Em Prenchimento (mudar as cores).
Em Formatar Rtulo de dados Clicar em Porcentagem e Nome da Categoria Ajustar
arrastando a melhor forma de apresentar os resultados Na porcentagem encontrada: Clicar com boto
direito do mouse Formatar rtulo de dados Nmero Porcentagem Casas decimais = 1.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 67

Ttulo: Boto direto do mouse: Opes do grfico Em Ttulo: digitar Estado Civil dos
funcionrios da Empresa x, Fortaleza 2013.
Sada do Excel:

Grfico 1: Estado Civil dos funcionrios da Empresa x, Fortaleza 2013


Fonte: Empresa x

2. TABELA DINMICA:
Clicar em Inserir Tabela dinmica Selecionar todo o banco de dados Intervalo: Selecione
Estado Civil e Sexo (tudo junto) Avanar Nova Planilha Concluir
Arrastar a varivel estado civil para a coluna e a varivel sexo para linha e qualquer uma das duas no
meio.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 68

Sada do Excel:
Sexo
Feminino
Masculino
Total

Estado Civil
Casado Solteiro
12
10
8
6
20
16

Total
22
14
36

Grfico 2: Estado Civil e Sexo dos funcionrios da Empresa x, Fortaleza 2013


Fonte: Empresa x

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 69

Anexo 3 Banco De Dados


Banco de dados referente ao perfil dos funcionrios de uma determinada empresa
N. Estado Civil
1
Solteiro
2
Solteiro
3
Solteiro
4
Solteiro
5
Casado
6
Solteiro
7
Casado
8
Casado
9
Casado
10
Casado
11
Casado
12
Solteiro
13
Casado
14
Casado
15
Casado
16
Solteiro
17
Casado
18
Solteiro
19
Casado
20
Casado
21
Casado
22
Casado
23
Solteiro
24
Solteiro
25
Solteiro
26
Casado
27
Solteiro
28
Casado
29
Solteiro
30
Solteiro
31
Casado
32
Solteiro
33
Casado
34
Casado
35
Solteiro
36
Casado

Sexo
Feminino
Feminino
Masculino
Masculino
Feminino
Feminino
Feminino
Feminino
Masculino
Feminino
Feminino
Feminino
Feminino
Feminino
Masculino
Feminino
Feminino
Masculino
Masculino
Masculino
Masculino
Feminino
Feminino
Masculino
Feminino
Masculino
Feminino
Masculino
Feminino
Feminino
Masculino
Masculino
Feminino
Feminino
Masculino
Feminino

Grau de instruo
Ensino Mdio
Ensino Mdio
Superior
Ensino Fundamental
Superior
Ensino Fundamental
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Superior
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Superior
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Fundamental
Ensino Fundamental
Ensino Mdio
Ensino Fundamental
Ensino Fundamental
Superior
Ensino Fundamental
Superior
Ensino Fundamental
Ensino Fundamental
Ensino Mdio

Salrio (S.M*) Idade


6
20
7
23
11
25
4
26
13
26
8
27
7
28
15
29
9
30
11
30
10
31
16
31
5
32
13
32
8
33
19
33
8
34
12
34
14
35
16
35
5
36
17
36
9
37
11
37
9
38
10
39
6
40
15
40
7
41
12
41
23
42
7
43
17
43
9
44
14
46
19
48

Fonte: Empresa X
*Salrio mnimo

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 70

Nota de Aula 8 Distribuio Normal


1. INTRODUO:
Quando uma varivel aleatria assume somente valores inteiros, suas informaes so originadas
de uma varivel aleatria discreta, pois estas so obtidas por contagem. Agora, em alguns casos, os
resultados de uma varivel aleatria podem no estar limitados somente a nmeros inteiros, mas podendo
ser no inteiros tambm. Suponha, por exemplo, que uma varivel X represente a altura (cm) de um
indivduo, neste caso, raramente um indivduo tem exatamente 1,77cm ou 1,78cm de altura, pois
teoricamente, esta varivel pode assumir um nmero infinito de valores intermedirios, como 1,7704cm
ou 1,7832 cm, por isso trata-se de uma varivel aleatria contnua, varivel este que obtida por
mensurao e por este motivo seus possveis valores tendem para o infinito, visto no serem inteiros.
A distribuio contnua mais comum e mais utilizada
no mbito estatstico a distribuio de probabilidade chamada
normal, que tambm conhecida como curva em forma de sino
ou curva de Gauss, como ser vista mais adiante.
Esta distribuio tem uma histria bastante longa, e
est ligada histria da descoberta das probabilidades, que
surgiram no sculo XVII para resolver, inicialmente, questes
de apostas de jogo de azar.
O responsvel direto pela curva normal foi o
matemtico francs Abraham de Moivre (1667-1754), exilado
na Inglaterra, que a definiu em 1730, dando sequncia aos
trabalhos de Jacob Bernoulli (com o teorema dos grandes
nmeros) e de seu sobrinho Nicolaus Bernoulli, ambos

Johann Carl Friedrich Gauss (1777-1855)

matemticos suos.
A descoberta teve logo grande sucesso e grandes estudiosos da poca foram ligados curva
normal, tais como Laplace que em 1783 a utilizou para descrever a distribuio de erros, e Gauss que em
1809 a empregou para analisar dados astronmicos.
Assim, como Gauss foi a primeira pessoa a reafirmar o papel fundamental proposta por Moivre a
curva da normal chamada hoje de curva de Gauss.
Antes de explanar com mais detalhes a curva de Gauss, faz-se necessrio analisar a lei dos
grandes nmeros proposta por Bernoulli. Esse teorema diz o seguinte: numa situao de eventos casuais,
onde as alternativas so independentes, obter coroa em lances de uma moeda de cara ou coroa, tem a
Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 71

probabilidade matemtica exata de 50% (porque somente dois eventos possveis: cara ou coroa), mas na
prtica esta probabilidade de 50% apenas aproximada. E essa aproximao tanto mais exata quanto
maior forem s tentativas que voc fizer de lanar moeda, chegando a quase atingir os exatos 50% se
voc lanar a moeda infinitas vezes. Isto , quanto mais lances voc fizer, menor ser o desvio (erro) em
relao mdia de 50% que o resultado ir produzir. Isso quer dizer que os desvios sero menores na
medida em que sobe o nmero de lances. Desvios grandes so raros e desvios pequenos frequentes,
quanto menores os desvios mais frequentes eles sero, de sorte que, aumentando as tentativas (os lances),
aumenta-se o nmero de desvios pequenos, sobrepujando cada vez mais os desvios grandes, de tal sorte
que, no limite, haver quase somente desvios pequenos, sendo o desvio zero o menor deles e, por
consequncia, o mais frequente.
O matemtico francs Moivre assumiu essa idia de Bernoulli e disse: erros grandes so mais
raros que erros pequenos. Assim, quanto menores os erros, mais frequentes eles sero e quanto maiores,
menos frequentes. Dessa forma, os erros se distribuem equitativamente em torno de um ponto modal, a
mdia, formando uma curva simtrica com pico na mdia e caindo rapidamente para as caudas esquerda
(erros que subestimam a mdia) e direita (erros que superestimam a mdia). Alm disso, essa curva
simtrica permitiu a Moivre calcular uma medida de disperso das observaes em torno da mdia,
medida esta que hoje em dia conhecida como o desvio padro. Moivre, ainda chamou esta curva de
normal, por que a mdia dela representa a norma, isto , as coisas todas deviam ser como a mdia, de
sorte que tudo que se desvia dessa mdia considerado erro, portanto a equivalncia, neste caso, entre
desvio e erro.
Um outro matemtica do sculo XIX, de origem belga, Quetelet, fez uma orgia de medies
sobre eventos do homem, tais como natalidade, mortalidade, alcoolismo, insanidade, medidas
antropomtricas, dentre outros, resultando no Tratado sobre o homem e o desenvolvimento de suas
faculdades (1835), afirmando que tudo no homem e no mundo se distribui segundo a curva normal.
Embora essa afirmao de Quetelet tenha tido reaes contrrias, ela evocou pesquisas sem fim sobre esta
histria da distribuio normal dos eventos, chegando hoje em dia a ser mantida a idia de que,
praticamente, todos os eventos se distribuem assim. Da, a hegemonia da curva normal nas anlises
estatsticas em pesquisas cientficas.
Alis, assumir a distribuio normal em pesquisa est baseado em dois fundamentos:
1 Quando a distribuio da prpria populao for normal, ou
2 Quando a distribuio da populao no for normal, mas se tiver o nmero grande de casos (teorema
de Bernoulli atravs da lei dos grandes nmeros ou o teorema central do limite).

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 72

Esta histria do limite central extremamente complicada, mas os matemticos chegaram a


provar este teorema. Assim, qualquer que seja a distribuio dos seus dados, se voc tiver um nmero
grande de observaes, voc pode usar com tranquilidade a curva normal como uma aproximao
adequada para a anlise dos seus dados. Uma curiosidade: um N de tamanho 30 j considerado um
grande nmero se a distribuio da populao for prximo do normal. Um N bem maior ser necessrio
se a distribuio da populao no for normal.
Hoje em dia, a curva da normal um ganho fundamental na prtica estatstica, pois a
normalidade dos dados ocorre naturalmente em muitas reas cientficas, como na fsica, biologia e nas
reas sociais, e tambm uma distribuio fundamental para a inferncia estatstica. Por exemplo, a sua
aplicao na anlise de dados na rea da biomedicina grande, pois muitas variveis numricas contnuas
comprovaram que tm distribuio normal ou aproximadamente normal. Um outro exemplo que pode ser
citado a altura, o peso, o ndice de massa corporal (IMC) dos indivduos, dentre outras. Alguns dos
principais mtodos empregados na anlise estatstica, como a Anlise de Varincia, a Anlise de
Regresso, dentre outros exigem, como pressuposto que os dados sigam uma distribuio normal para sua
realizao.
Esta nota de aula mostrar o uso prtico da distribuio normal de probabilidade e a sua
importncia tanto na academia quanto no mercado empresarial.

2. DISTRIBUIO NORMAL:
Mas por que esta distribuio tem esse nome? Existe uma explicao plausvel para isto, ser
visto mais adiante.
A distribuio normal uma distribuio de probabilidade usada para variveis aleatrias
contnuas (obtidas por mensurao), com a seguinte notao X ~ N (; ) e sua funo densidade de
probabilidade dada por:
f ( x)

1 x

, para - < x < (ou x ), onde:

X = Varivel aleatria contnua analisada


x = Valor qualquer da varivel aleatria X

= Mdia populacional
= Desvio padro populacional
= 3,1416...
e = 2,7182...

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 73

3. CARACTERSTICAS DA DISTRIBUIO NORMAL:


a) A varivel X pode assumir qualquer valor real (- a +);
b) O grfico da distribuio normal tem uma curva simtrica (a mdia moda mediana) e unimodal na
forma de um sino e apresentado um ponto de inflexo esquerda (x = - 1) e outro direita (x = +
1), ou seja, ou seja, o que define a rea sob a curva so os desvios padro (), assim fixando o valor da
mdia, o achatamento da curva est diretamente ligado ao valor de .

O grfico que mostra os indcios de que os dados de uma distribuio aproximadamente normal
o histograma ou o diagrama de ramo e folhas.
A distribuio normal uma das distribuies fundamentais da moderna teoria estatstica. A
vantagem da distribuio normal reside na facilidade de defini-la com apenas dois parmetros, a mdia
e o desvio padro da distribuio, por exemplo, suponha a seguinte a curva da normal f(x) para = 40 e

Frequncia relativa

= 10, o grfico construdo ser:

Substituindo os parmetros

0,0450

= 40 e = 10 na funo densidade

0,0400

de probabilidade, ser encontrado os

0,0350

seguintes valores:

0,0300

x
f(x)
20
0,0007
30
0,0146
40
0,0399
50
0,0146
60
0,0007
Segue o grfico 1 com a plotagem dos

0,0250
0,0200
0,0150
0,0100
0,0050
0,0000
0

10

20
30
40
50
60
Parmetros da varivel aleatria

70

80

seguintes valores.

Grfico 1: Distribuio Normal com mdia e desvio padro


Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 74

Uma das caractersticas importantes da normal que a partir desses parmetros ser possvel
calcular, por exemplo, a porcentagem de valores que devero estar acima ou abaixo de um determinado
valor da v.a., ou entre esses dois valores definidos.
Analisando a frmula de f(x), observe que para cada par de parmetros e , h uma curva
diferente de f(x) ou que, para qualquer outro par de parmetros e , a curva f(x) ser diferente.
c) Os valores de f(x) nunca tocam o eixo x da curva da Normal, mas f(x) 0, se x ;
d) A rea sob a curva 1.
Como se trata de distribuio de probabilidade contnua, a rea que fica entre a curva e o eixo x
representa a probabilidade. A probabilidade de ocorrer um evento entre os pontos a e b calculada
pela integral definida (visto na disciplina de clculo) da funo entre os pontos a e b, representada
por:
b

P ( a, b)
a

1 x

, graficamente:

Observa-se que o clculo direto de probabilidade envolvendo a distribuio normal exige recursos
de clculo avanado e, mesmo assim, dada a forma da funo densidade de probabilidade (f.d.p), no um
processo muito elementar. Por isso ela foi tabelada, permitindo assim obter diretamente o valor da
probabilidade desejada.
Verifica-se que, no entanto a f.d.p da normal depende de dois parmetros, a e , o que acarreta
um grande trabalhado para tabelar as probabilidades, considerando-se as vrias combinaes de e .
Esse problema pode ser resolvido por meio de uma mudana de varivel, obtendo-se, assim, a
distribuio normal padronizada ou reduzida.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 75

4. A CURVA NORMAL E A CURVA PADRONIZADA (Z):


Os pesquisadores quando falam da curvam normal, tipicamente entendem a curva normal
padronizada (ou igualitria a normal original), a qual definida pela simetria e pela curtose. Mas a curva
normal original definida exclusivamente pela simetria, isto , que as reas sob a curva so idnticas em
ambos os lados da mdia: a curva normal unimodal (tem apenas um pico) e simtrica. Assim, todas as
curvas da figura abaixo so normais, porque tm um pico somente e so simtricas, embora os desvios
sejam diferentes, provocando diferentes nveis de curtose.

1 x


1
Na frmula f ( x )
e 2
2

, observa-se que a parte mais importante o expoente

1 X

, e nele se v que quem comanda as aes so os dados empricos de X e os parmetros de
2
2

sua distribuio ( e ). Agora, tanto os X quanto os parmetros de uma distribuio variam de pesquisa
para pesquisa e, assim, as curvas normais que resultam so diferentes. Portanto, ao invs de trabalhar com
os valores brutos de X, vamos padronizar estes valores e transform-los em valores de Z, ou seja, agora a
distribuio normal ter o seguinte formato:

, com isso f ( Z )

Z2
2

e
2
A vantagem deste curva normal padronizada que em alguns parmetros j esto

automaticamente definidos para qualquer escala de medida que voc utilizar , quais seja, a mdia zero
( = 0) e desvio padro um ( = 1), onde suas probabilidades j foram calculadas e so apresentadas em
uma tabela (ver anexo desta nota de aula) de fcil utilizao. Essa tabela nada mais que uma tabela de
converso do nmero de desvios padro entre x e em um algoritmo.
Em que X uma varivel aleatria normal da mdia e varincia (so constantes), assim:
X ~ N(; ) Z ~ N(0; 1), seu grfico ser:

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 76

A curva normal padronizada definida pela simetria e pela curtose, sendo chamada de
mesocrtica.
A curtose da distribuio normal se refere altura do pico da curva, o qual acontece na mdia da
distribuio: se o pico muito elevado, a curva chamada de leptocrtica, se o pico achatado a curva
chamada de platicrtica, se for mediano, a curva chamada de mesocrtica, sendo esta ltima, a
caracterstica da normal padronizada, como mostra a figura abaixo:

Trabalhar com a curva normal padronizada facilita muito a vida da gente, pois com ela a mdia
sempre ser zero e o desvio padro ser um. Quando no for padronizada, ento teremos que calcular o
valor da mdia e o valor do desvio padro da distribuio e trabalhar com os dois parmetros.

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 77

5. USO DA TABELA NORMAL PADRO (Z):


A tabela oferece a rea entre 0 e Z0 ou P(0 Z Z0), conforme visto no grfico abaixo:

Onde Z0 representa o nmero de desvios padro distante da mdia, ou seja, as informaes


contidas nessa tabela no so sempre idnticas nos diferentes autores de livros de estatstica, mas duas
informaes sempre esto presentes e essas duas so as mais importantes, a saber, o Z e a proporo de
casos que caem na faixa que vai da mdia zero at este valor de Z. Assim, se voc conhece o Z, voc
pode descobrir qual a proporo de casos que corresponde a ele ou, se voc conhece a proporo de
casos, voc pode descobrir qual o Z que lhe corresponde.
OBS: Embora a curva normal v at o infinito (positivo e negativo), voc v que quase a totalidade dos
casos cai entre -3 e 3 desvios padro (ou Z), de fato, 99,74% dos casos, por isso, a tabela (em anexo) varia
-3,99 a 3,99, acima ou abaixo disso 0,499.

6. REGRA EMPRICA (OU REGRA 68-95-99):


Outra regra que auxilia a interpretao de um desvio padro a regra emprica, aplicvel
somente a conjunto de dados com distribuio aproximadamente em forma de sino, pois mostra como a
mdia e o desvio padro esto relacionados com a proporo dos dados que se enquadram em
determinados limites. A regra a seguinte:
Cerca de 68% dos valores esto a menos ou a mais de 1 desvio padro a contar da mdia, o que
justifica o nome da distribuio de probabilidade normal, pois 68% representa a maioria, e a maioria
o que representa ser normal ou que est dentro do padro. Nesse caso, 68% dos elementos (a maioria)
apresentam determinada caracterstica;
Se quiser melhorar esse nvel proporcional de elementos que possuem determinada caracterstica, de 68%
para 95%, ou seja, basta-se pegar 2 desvios padro para mais e para menos a contar da mdia, assim:
Cerca de 95% dos valores esto a menos ou a mais de 2 desvios padro a contar da mdia;
Se quiser ainda aumento esse nvel proporcional de 95% para 99,7%, ento deve-se pegar 3 desvios
padro para mais e para menos a contar da mdia, assim:

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 78

Cerca de 99,74% dos valores esto a menos ou a mais de 3 desvios padro a contar da mdia. Nesse
ltimo caso, a anlise de quase toda a populao possuir determinada caracterstica.
Com isso, se os dados so aproximadamente normais, as porcentagens sero aproximadamente
iguais a 68%, 95% e 100%, respectivamente.
Ver figura da regra emprica.

Portanto, quase nunca preciso prolongar muito as caudas de uma distribuio normal, porque a
rea sob a curva de mais ou menos 4 ou 5 desvios-padro a contar da mdia desprezvel para quase
todos os fins prticos.

Exemplo 1: Encontre a probabilidade de:


a) P(Z 1,34)
d) P(1 Z 3,09)
b) P(Z 1)
e) P( - 3 X + 3)
c) P(-2,55 Z 1,2)

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 79

Exemplo 2: O saldo dirio de caixa de uma determinada empresa de grande porte de Fortaleza nos
ltimos 400 dias tem distribuio normal com mdia R$ 80.000 e desvio padro R$ 40.000. Suponha que
o gerente financeiro desta empresa deseja tomar uma deciso de investimento com seu banco e precisa
com urgncia saber qual a probabilidade do saldo do caixa de hoje s 18 horas fechar:
a) Entre R$ 30.000 e R$ 120.000, pois de acordo o Diretor Geral da empresa se o caixa de hoje fechar
com valores dentro desse intervalo, o gerente financeiro pode arriscar a fazer o investimento, mas isso s
pode ser realizado se a probabilidade for alta (de acordo o Diretor Geral acima de 70%). Portanto
verifique para o gerente financeiro se ele pode ou no fazer o investimento.

b) Suponha que o gerente queira saber qual a probabilidade do caixa fechar com valor acima de 100 mil
reais. Confiando nessa possibilidade, voc o aconselha fazer o investimento financeiro maior pensando
nesse valor em reais?

c) Existe a possibilidade do saldo dirio de caixa ser negativo hoje? Se sim, qual a probabilidade disso
acontecer?

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 80

Anexo 4 Tabelas da Distribuio Normal

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 81

1 LISTA DE EXERCCIOS DE ESTATSTICA PARA AP1


VARIVEIS:
1) Suponha que um mdico est interessado em fazer um levantamento sobre algumas caractersticas de

60 pacientes atendidos em sua clnica neurolgica: sexo, peso, tipo de tratamento, nmero de convulses
e classificao da doena (leve, moderada e severa). Os dados esto organizados no seguinte banco de
dados:
Paciente

Sexo

Peso

1
2
3
...
58
59
60

M
F
M
...
M
M
F

89,79
64,20
91,00
...
71,00
78,80
71,00

Tipo de
Tratamento
A
A
B
...
B
A
B

N. de
convulses
1
3
2
...
0
2
3

Classificao da
doena
Leve
Severa
Moderada
...
Severa
Leve
Moderada

Fonte: Dados hipotticos

De acordo com o banco de dados acima classifique o tipo de varivel para as variveis seguintes:
a) Sexo:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

b) Peso:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

c) Tipo de Tratamento:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

d) Nmero de Convulses:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

e) Classificao da doena:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 82

2) O Governo Federal est exigindo uma quantidade maior de informao antes de aceitar um candidato e
decidir sobre a concesso de uma bolsa para uma faculdade privada de Fortaleza. Assim, classifique cada
uma das informaes dos futuros alunos instituio na ficha de inscrio do vestibular:
a) Quantidade de prmios escolares obtidos:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

b) Classificao de testes de raciocnio:


( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

c) Salrio (em reais) dos pais:


( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

d) Idade do candidato:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua

3) Suponha que foram retirados de vrios questionrios de pesquisas as seguintes perguntas. Classifique
assim o tipo de varivel de cada uma delas:
Pergunta 1: Qual o seu Estado civil?
( ) Solteiro ( ) Casado ( ) Separado ( ) Desquitado ( ) Outro. Qual?___________________

Pergunta 2: Qual a marca de carros que mais passa na cancela do estacionamento deste shopping center?
( ) Marcar A ( ) Marca B ( ) Marca C ( ) Marca D ( ) Outra. Qual?_____________________

Pergunta 3: Qual a sua faixa de Renda familiar mensal (OBS: Identificar a classe social de acordo com a
legenda abaixo)?

Legenda com relao a faixa de renda familiar do pesquisado e sua classe

) At R$ 724,00

social:

) De R$ 724,01 a R$ 2.172,00

At R$ 724,00 Classe E

) De R$ 2.172,01 a R$ 3.620,00

De R$ 724,01 a R$ 2.172,00 Classe D

) De R$ 3.620,01 a R$ 10.860,00

) Mais de R$ 10.860,00

De R$ 2.172,01 a R$ 3.620,00 Classe C


De R$ 3.621,01 a R$ 10.860,00 Classe B
Mais de 10.860,00 Classe A

Pergunta 4: Qual a cor de cabelo de sua preferncia?


( ) Loiro ( ) Preto ( ) Acaj ( ) Outra. Qual?__________________________________________

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 83

Marque a opo correta:


(a) Qualitativa Nominal, Qualitativa Ordinal, Qualitativa Ordinal e Qualitativa Nominal
(b) Qualitativa Nominal, Qualitativa Nominal, Qualitativa Ordinal e Qualitativa Nominal
(c) Qualitativa Nominal, Qualitativa Nominal, Qualitativa Nominal e Qualitativa Nominal
(d) Nenhuma das respostas anteriores

PLANEJAMENTO AMOSTRAL:
4) Identifique o tipo de tcnica de amostragem probabilstica para cada um dos casos abaixo:
a) Suponha que uma pesquisa de opinio pblica ser realizada no Estado do Cear, que constitudo por
184 municpios. Os elementos na populao de interesse so homens e mulheres do Estado com idade
acima de 21 anos. Que tipo de amostragem voc sugeriria sob o ponto de vista econmico-financeiro?
( ) Amostra Aleatria Simples
( ) Amostra Aleatria Estratificada
( ) Amostra Sistemtica
( ) Amostra por Conglomerado

b) Um mdico est interessado em obter informao sobre o nmero mdio de vezes em que 15.000
clnicos gerais, no ano passado, prescreveram certa droga para combater uma gripe. Deseja-se obter uma
amostra 1.600 clnicos gerais. Que tipo de amostragem voc sugeriria e por qu?
( ) Amostra Aleatria Simples ou Amostra Aleatria Estratificada
( ) Amostra Aleatria Simples ou Amostra Sistemtica
( ) Amostra Aleatria Simples ou Amostra por Conglomerado
( ) Nenhuma das Anteriores

c) Suponha que nesta sala de aula existam 50 alunos e deseja-se saber qual o peso (em kg) deles. A
sugesto analisar 30% da populao com escolha atravs da lista de presena do professor. Que tipo de
tcnica de amostragem representa esta situao?
( ) Amostra Aleatria Simples ou Amostra Aleatria Estratificada
( ) Amostra Aleatria Simples ou Amostra Sistemtica
( ) Amostra Aleatria Simples ou Amostra por Conglomerado
( ) Amostra por Conglomerado

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 84

d) Um pesquisador de Educao Fsica seleciona aleatoriamente 10 quarteires de um bairro de Fortaleza,


que comporta por 755 quarteires e pergunta ento a todos os adultos residentes nos quarteires
selecionados se so praticantes de atividades fsicas. Que tipo de amostragem representa esse estudo?
( ) Amostra Aleatria Simples
( ) Amostra Aleatria Estratificada
( ) Amostra Sistemtica
( ) Amostra por Conglomerado

5) Um Psiclogo deseja estudar as condies de vida dos moradores de um determinado bairro de


Fortaleza para com isso elaborar junto a Prefeitura de Fortaleza programas de incluso social. Segundo a
prefeitura, o bairro composto por 3.000 domiclios cadastrados. Ento, com confiana e 95%:
a) E atravs de uma amostra aleatria simples (AAS) correspondente a 40% da populao, qual ser a
margem de erro?
b) Sabendo-se que 1.500 dos domiclios so residenciais, 1.050 so comerciais e o restante so
industriais, extraia uma amostra aleatria estratificada proporcional, com uma margem de erro de 3
pontos percentuais.
c) Se o psiclogo fizer uma amostra por conglomerado para duas categorias apenas (Comerciais e
Industriais), quantos deles sero pesquisados utilizando uma amostra sistemtica em que o sistema
escolhido aleatoriamente foi domiclios pares? Qual a margem de erro para este tipo de amostragem?
d) Dentre as trs tcnicas (Amostra Aleatria Simples, Amostra Aleatria Estratificada e Amostra
Sistemtica), qual delas trar um resultado mais eficaz pesquisa?
Gabarito: a) 2,2%; b) 811; c) 2,58%

MEDIDAS DESCRITIVAS PARA DADOS NO AGRUPADOS:


6) Dentre as afirmativa abaixo, marque a incorreta:
(A) O Q2 igual mediana
(B) Os decis dividem a distribuio em dcimos
(C) As separatrizes so estimativas de disperso
(D) O P60 indica que 40% dos valores so maiores que ele.
(E) O Q4 coincide com o maior valor da amostra.
Gabarito: C

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 85

7) Baseado nos dados abaixo, que representa a temperatura (em graus celcius) de 11 cidades europeias na
noite do reveillon de 2014:
Lisboa
Paris Mnaco
2C
3C
-5C
Assim, determine e interprete:

Cannes
6C

Barcelona Londres Lyon Nice Avignon Lille Porto


-7C
-2C
0C 8C
-3C
5C 10C

a) A temperatura mdia das cidades.


b) A temperatura modal das cidades.
c) A temperatura mediana das cidades.
d) Desvio Padro da temperatura das cidades.
e) Atravs do coeficiente de variao (CV), verifique se as temperaturas so homogneas.
f) Faa um grfico de linhas para os dados e identifique os dados discrepantes ou outliers ou dados
atpicos (ou dados fora do intervalo definido pelo desvio padro encontrado), se houver.
Gabarito: a) 1,54C; c) 2C; d) 5,46C; e) 354,54%; f) Cidades: Mnaco, Barcelona, Nice e Porto.

8) Para dados de observaes das variveis aleatrias y1, y2 e y3 provenientes de uma amostra foram
obtidos os grficos de caixa (box plot) apresentados na figura que se segue:
Segundo estes grficos, possvel afirmar que as
distribuies das variveis aleatrias y1, y2 e y3 so
(aproximadamente), respectivamente:
(A) Assimtrica positiva, simtrica e assimtrica
positiva.
(B) Simtrica, assimtrica positiva e assimtrica
negativa.
(C) Simtrica, assimtrica negativa e assimtrica
positiva.
(D) Assimtrica negativa, assimtrica positiva e
simtrica.
(E) Assimtrica positiva, assimtrica negativa e
simtrica.
Gabarito: B

9) Assinale a afirmativa verdadeira:


(A) Se uma instituio der um aumento de 8% nos salrios de seus servidores, automaticamente o seu
coeficiente de variao eleva-se no mesmo percentual.
(B) Sempre que uma distribuio for simtrica e unimodal, mdia, moda e mediana so iguais.
(C) A vantagem da mdia aritmtica que ela sempre maior que a moda.
(D) Dentre as desvantagens apresentadas pela mdia aritmtica podemos afirmar que ela afetada por
valores extremos e que a soma dos seus desvios sempre maior que zero. Gabarito: B
Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 86

10) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio
padro, 0,8. Em Bioestatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que
disciplina foi maior a disperso relativa? Por qu?
OBS: Disperso absoluta (= desvio padro), Disperso relativa (= CV).
Gabarito: Bioestatstica

11) Considere as informaes apresentadas no grfico de disperso abaixo sobre o desempenho no


Sistema de Avaliao da Educao Bsica (SAEB), no ano de 2005, da Rede Pblica e Privada do Ensino
Mdio.

Pelo grfico de disperso acima:


a) Qual (is) unidade (s) da Federao que apresentou o menor tempo (em anos) de concluso de uma srie
do ensino mdio?
b) Qual o tempo mdio mais frequente para a concluso de uma srie do Ensino Mdio?
c) Qual a mdia da nota padronizada mais frequente para a concluso de uma srie do Ensino Mdio?
d) Qual (is) estado (s) apresentou a menor mdia da nota padronizada nesta edio do SAEB?
e) E qual apresentou a maior?

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 87

CORRELAO E REGRESSO LINEAR


12) Segue abaixo o grfico de disperso construdo atravs do Microsoft Excel que representa as despesas

Grfico 1: Despesas com propaganda (R$ milhes)


versus Vendas (R$ milhes), indstria farmacutica
Xis, 2006 a 2008
30

30

25

25

Vendas (R$ milhes)

Vendas (R$ milhes)

com propaganda (R$ milhes) versus Vendas (R$ milhes), da indstria farmacutica Xis, 2006 a 2008.

20
15
10
5
0
0

10

12

14

Grfico 2: Despesas com propaganda (R$ milhes)


versus Vendas (R$ milhes), indstria farmacutica
Xis, 2006 a 2008

20
15
10

y = 1,3125 + 1,9583x
R2 = 0,9083

5
0
0

Despesas com Propaganda (R$ milhes)

10

12

14

Despesas com Propaganda (R$ milhes)

Fonte: MORETTIN, P (2003, 5 edio)

E atravs do mtodo dos mnimos quadrados (ou mtodo de regresso linear), pergunta-se:
a) De acordo o grfico 1, voc considera que os dados seguem uma linearidade?
( ) No. Por qu?_____________________________________________________________________
___________________________________________________________________________________
( ) Sim. Se sim, qual tipo?
( ) Positiva. Por qu?____________________________________________________________
( ) Negativa. Por qu?__________________________________________________________
b) Atravs do grfico 2, encontre o valor do Coeficiente de Correlao (Rxy)?
c) Atravs da equao de previso (y = a + bx) encontrada, faa uma previso estatstica de quanto
empresa farmacutica teria de vendas (R$ milhes), se investisse 7,5 milhes em propaganda.
d) Se a empresa diz que quer no prximo trimestre um faturamento de vendas no valor de 30 milhes de
reais, quanto ela ter que investir em propaganda?
e) Os 9,17% no grfico 2 so explicados por qual varivel?

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 88

De acordo com a mesma varivel dependente vendas (R$ milhes), a empresa tambm obteve a
temperatura mdia (C) da regio sul do Brasil, onde se encontram os maiores consumidores dos seus
medicamentos, como segue o grfico 3:
Grfico 3: Vendas (R$ milhes) da indstria
farmacutica Xia versus a Temperatura mdia do
trimestre na regio sul do Brasil, 2006 a 2008, Brasil.

f) Para se fazer a previso de vendas (R$


milhes), qual das duas variveis a empresa

Vendas (R$ milhes)

30

deve levar mais em considerao: Despesas


y = 25,71 -1,1258x

25

com

R2 = 0,7666
20

propaganda

(R$

milhes)

ou

Temperatura (C)? Por qu?

15

Soluo:

10

b) 0,953;
c) Aproximadamente 16 milhes;

5
0

10

15

20

d) 14,65 milhes

Temperatura (C)

13) A indstria de automveis FIAT do Brasil, fez um grfico de disperso com uso do Microsoft Excel
que representa os pesos (em toneladas) e as taxas de consumo de combustvel por quilmetro rodado
(km/litro) para uma amostra de 250 automveis de passeio em rodovias federais do Estado do Cear no
ms de Outubro de 2014. O Estudo tem por objetivo fazer uma previso de consumo de combustvel por
quilmetro rodado com relao ao peso do automvel, para com isso verificar se os prximos automveis
a serem confeccionados devem ter o mesmo peso ou no e usar essa informao na sua campanha
publicitria no lanamento de novos modelos em Julho de 2015.
Grfico 1: Peso (toneladas) e taxas de consumos de
combustveis (Km/litro) de automveis de passeio em
rodovias.

Marque a alternativa correta:


13.1. Pelo grfico de disperso 1:

Consumo (Km/litro)

13
12

y = 18,945 - 6,4013x

11

R2 = 0,8588

(a) Os dados seguem uma linearidade


diretamente proporcional ou positiva

10

(b) Os dados seguem uma linearidade

9
8

inversamente proporcional ou negativa

(c) A medida com que o peso dos

6
5
1

1,2

1,4

1,6

Peso (toneladas)

1,8

automveis

(toneladas)

aumenta

consumo (km/litro) permanece constante


(d) Os dados no seguem uma linearidade,
ou seja, no linear
(e) A varivel causa o consumo (km/litro)
e a varivel efeito o peso (toneladas)

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 89

13.2. Pelos dados apresentados no grfico de disperso 1, o Coeficiente de Correlao de Pearson (Rxy)
de quanto?
(a) -92,27%
(b) -92,47%
(c) -92,67%
(d) -92,77%
(e) Os dados no me permite obter tal medida

13.3. Atravs da reta de regresso (y = 18,945 6,4013x) encontrada, a previso do consumo (km/litro) de
automveis que tem 2 toneladas, ser de:
(a) 6,14 km/litro
(b) 6,54 km/litro
(c) 7,14 km/litro
(d) 7,54 km/litro
(e) Os dados no me permite obter tal previso de consumo (km/litro)

13.4. Pelos dados apresentados no grfico de disperso 1, o R2 = 0,8588 significa o qu?


(a) Que a fora existente entre as variveis peso e consumo de 85,88%
(b) Que existe 85,88% de que a previso do consumo (km/litro) no acontea como o previsto
(c) Que 85,88% do consumo (km/litro) que ocorrer conforme o previsto ser por causa do peso
(toneladas) dos automveis
(d) Que 85,88% dos automveis devem ser mais leves para consumir menos combustveis.
(e) Que 14,12% do consumo (km/litro) que ocorrer conforme o previsto ser por causa do peso
(toneladas) dos automveis

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 90

ASSUNTO: DISTRIBUIO DE FREQUNCIAS


14) O histograma abaixo apresenta a distribuio das idades de pacientes atendidos por um nutricionista
de Fortaleza.
14
12

Frequncia

10
8
6
4
2
0
2|---4

4|---6

6|---8

8|---10

10|---12

12|---14

14|---16

Idade

Portanto:
a) Qual a idade mdia dos pacientes?
b) Qual a idade modal dos pacientes?
c) Qual a idade mediana dos pacientes?
d) Pelas medidas descritivas calculadas, os dados so simtricos ou assimtricos?
e) De acordo a curtose do histograma acima, a curva considerada mesocrtica, platicrtica ou
leptocrtica?
f) Quantos pacientes tm idade entre 8 e 10 anos?
g) Quantos pacientes tm idade abaixo de 8 anos?
h) Quantos pacientes tm acima de 10 anos de idade?

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 91

15) Para as 3 distribuies abaixo foram calculadas a produo (em kg) de determinado produto
qumico. O resultado foi o seguinte:
Distribuio A

Classes (kg) fi
2|--- 6
6
6|--- 10
12
10|--- 14
24
14|--- 18
12
18|--- 22
6
Mdia = 12kg
Moda = 12kg
Mediana = 12kg
Desvio Padro = 4,42kg

Distribuio B

Distribuio C

Classes (kg) fi
2|--- 6
6
6|--- 10
12
10|--- 14
24
14|--- 18
30
18|--- 22
6
Mdia = 12,9kg
Moda = 16kg
Mediana = 13,5kg
Desvio Padro = 4,2kg

Classes (kg) fi
2|--- 6
6
6|--- 10
30
10|--- 14
24
14|--- 18
12
18|--- 22
6
Mdia = 11,1kg
Moda = 8kg
Mediana = 10,5kg
Desvio Padro = 4,2kg

Assim, construa o histograma para cada uma das distribuies e verifique se so simtricas ou
assimtricas (positivas ou direita; ou negativas ou esquerda) atravs do coeficiente de assimetria de
Pearson. Para esta alternativa utilize a seguinte notao: CA

3x Moda
S

16) Observe o histograma abaixo:

Pelo histograma apresentado, marque a nica afirmao correta:


(a) O grfico de linha apresentado nas colunas do histograma chamado de Ogiva de Galton
(b) O grfico de linha apresentado nas colunas do histograma chamado de Polgono de Frequncia
(c) Os valores apresentados no histograma acima de cada coluna representa o ponto mdio de cada classe
(d) A quantidade de pessoas pesquisadas foi de 600 indivduos
(e) O grfico acima assimtrico

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 92

2 LISTA DE EXERCCIOS DE ESTATSTICA PARA AP2

PROBABILIDADE:
1) Os 240 cartes de um conjunto so numerados consecutivamente, de 1 a 240. Retirando-se ao acaso
um carto desse conjunto, a probabilidade de se obter um carto numerado com um mltiplo de 13 ?
Gabarito: 0,075

2) Quatro estudantes que chegaram atrasados no dia da prova deram a clssica desculpa do pneu furado.
Na prova de segunda chamada, o professor pediu que os estudantes identifiquem o pneu furado. Se no
houver realmente nenhum pneu furado e os estudantes responderem na base do chute, qual a
probabilidade de todos eles escolherem o mesmo pneu de um carro popular?
Gabarito: 1/64

3) Escolhe-se ao acaso dois nmeros naturais (*) distintos de 1 a 100. Qual a probabilidade de que o
produto dos nmeros escolhidos seja mpar?
Gabarito: 0,2475

4) Dentre os nmeros formados por trs algarismos, qual a probabilidade de encontrarmos um nmero
maior que 930?
Gabarito: 0,0767

5) A e B jogaram 120 partidas de xadrez e A ganhou 60 vezes, B ganhou 40 vezes e em 20 vezes ficaram
empatados. Se A e B concordam em jogar 3 partidas. Qual a probabilidade de:
a) A ganhar todas as trs
b) Duas partidas terminarem empatadas
c) A e B ganharem alternadamente
Gabarito: a) 0,125; b) 0,069; c) 0,134

6) Os 25.000 lugares de um estdio de futebol so numerados de 1 a 25.000. Qual a probabilidade de


escolher um lugar numerado com um nmero mltiplo de 14?
Gabarito: 0,0714

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 93

7) A seguinte tabela mostra a distribuio dos tipos de sangue na populao para uma amostra de 1000
pessoas:

a) Determine a probabilidade de uma pessoa selecionada

Fator/Tipo
A
B AB O Total
RH positivo 340 90 40 380 850
150
RH negativo 60 20 10 60
400 110 50 440 1.000
Total

ter o sangue tipo AB?


b) Determine a probabilidade de uma pessoa selecionada
ter o sangue tipo O e fator RH positivo

c) Sabendo-se que a pessoa tem fator (RH negativo) qual a probabilidade de que ela tenha o sangue tipo
B?
d) Sabendo-se que a pessoa tenha o sangue tipo A, qual a probabilidade de que ela tenha o fator RH
positivo?
e) Calcule a probabilidade de P(A B):
Gabarito: a) 0,05; b) 0,38; c) 0,133; d) 0,85; e) 0

8) Numa urna h 6 bolas azuis numeradas de 1 a 6 e cinco bolas verdes numeradas de 1 a 5. Extraindo ao
acaso uma bola, qual a probabilidade de sair uma bola azul ou com nmero mpar?
Gabarito: 0,818

9) Sejam A e B eventos tais que P(A) = 0,2, P(B) = p, P(AB) = 0,6. Calcular p considerando A e B:
a) mutuamente exclusivos
b) Independentes
Gabarito: a) 0,4; b) 0,5

10) Em dois lanamentos sucessivos de uma moeda, sabe-se que pelo menos numa das vezes deu cara.
Qual a probabilidade de ter dado cara ambas vezes?
Gabarito: 0,3333

11) De uma classe onde h 15 rapazes e 35 moas sero escolhidos dois alunos ao acaso. Qual a
probabilidade de:
a) seres escolhidos duas moas?
b) serem escolhidos um rapaz e uma moa, em qualquer ordem?
Gabarito: a) 0,4857; b) 0,4285

12) Quais dos valores abaixo no pode ser probabilidade?


a) ( ) 0;

b) ( ) 0,0001;

Notas de Aula

c) ( ) -0,2;

Estatstica

d) ( ) 3/2;

e) ( ) 2/3; f) ( )

2 ; g) ( )

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

0,2

Pgina 94

13) Fazendo os lanamentos sucessivos de um dado durante um jogo. Se cair a face 6, o jogo
automaticamente parado. Qual a probabilidade que na terceira tentativa o jogo seja finalizado?
Gabarito: 0,116

14) Os alunos Andr e Bruno tentam, independente, solucionar um problema de Estatstica. A


probabilidade de que Andr o resolva 1/4 e a de Bruno de 1/5. Qual a probabilidade de que:
a) Somente Andr resolva o problema
b) Somente Bruno resolva o problema
c) Exatamente um resolva o problema
d) Os dois resolvam o problema
e) O problema seja resolvido
f) O problema no seja resolvido
Gabarito: a)1/5; b)3/20; c)7/20; d)1/20; e)2/5; f) 3/5

15) Em uma locadora de carro, de cada 100 veculos 30 so de 4 portas e 20 tm motor a gasolina. Se de
cada 100 veculos, 5 so a gasolina e tm 4 portas, qual a probabilidade de carros na locadora que no so
a gasolina e nem tem 4 portas?
Gabarito: 0,55

16) Alguns atletas participam de um triathon (prova formada por 3 etapas consecutivas: natao, corrida e
ciclismo). A probabilidade de que um atleta escolhido ao acaso termine a primeira etapa (natao) 4/7.
Para continuar na competio com a segunda etapa (corrida) o atleta precisa ter terminado a natao. Dos
atletas que terminam a primeira etapa, a probabilidade de que um deles, escolhidos ao acaso, termine a
segunda . Qual a probabilidade de que um atleta que iniciou a prova, e seja escolhido ao acaso,
termine a primeira e a segunda etapa?
Gabarito: 3/7

17) Na Copa do Mundo de 2014, no primeiro jogo de abertura o Brasil jogou contra a Crocia. No
primeiro tempo, a seleo brasileira cometeu 10 faltas, sendo que 3 foram cometidas por Neymar e outras
3 por Fred. No intervalo, os melhores lances foram reprisados, dentre os quais uma falta cometida pelo
Brasil, escolhida ao acaso. Qual a probabilidade de que a falta escolhida seja de Neymar ou de Fred?
Gabarito: 0,6

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 95

DISTRIBUIO NORMAL:
18) Uma fbrica de carros sabe que os motores de sua fabricao tm durao normal com mdia de
150.000 Km e desvio padro de 5.000 Km. Qual a probabilidade de que um carro, escolhido ao acaso, dos
fabricados por essa firma, tenha um motor que dure:
a) Menos de 170.000 Km:
b) Entre 140.000 Km e 165.000 Km?
Gabarito: a) 0,999; b) 0,9759

19) Suponha que o tempo necessrio para que os usurios de uma biblioteca de uma empresa pblica de
Fortaleza leva para encontrar uma determinada informao que deseja utilizando um novo sistema
computacional segue uma distribuio normal com mdia de 8 minutos e desvio padro de 2 minutos.
Assim, calcule:
a) A probabilidade de um usurio qualquer levar mais de 8 minutos para encontrar a informao desejada.
b) Existe a possibilidade de um usurio levar menos de 1 minuto para encontrar a informao desejada?
Se sim, qual essa probabilidade?
Gabarito: a) 0,5; b) 0,0001; b)

20) O trfego areo (nmero de aterrissagens e decolagens) no Aeroporto Internacional de Fortaleza


durante a hora de pico uma varivel aleatria normal com mdia de 80 avies por hora e desvio
padro de 10 avies por hora. Se a capacidade atual de trfego areo no aeroporto de 90 avies por hora,
qual a probabilidade de ocorrer congestionamento do trfego areo?
Gabarito:

Notas de Aula

Estatstica

Professor Ms. Kleison Freitas kfreitas@fanor.edu.br

Pgina 96