Trabalho de Probabilidade e Estatística

Instituto Federal de Educação, Ciência e Tecnologia da Bahia Engenharia Industrial Elétrica/ T01 Disciplina: Probabilidade e Estatística Discente: Priscila Leão Seixas Docente: Dirceu Melo

Trabalho de Probabilidade e Estatística
Modelando Computacionalmente a Estatística Descritiva

Salvador Setembro de 2011

Trabalho de Probabilidade e Estatística

Sumário

2

1. Resumo teórico.......................................................................................03 2. Modelando Computacionalmente a Estatística Descritiva.....................09

3. Tabela.....................................................................................................10 4. Questionário............................................................................................11 5. Referências Bibliográficas.......................................................................27

uma característica comum.Trabalho de Probabilidade e Estatística Resumo Teórico Estatística: É uma parte da matemática aplicada que fornece métodos para coleta. quantidade de carros. Tipo de variáveis: (É o conjunto de resultados possíveis de um fenômeno. análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. • Indutiva: analisa e interpreta dados. qualquer valor entre dois limites. e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais. teoricamente. População: é o conjunto total de elementos portadores de. pelo menos. n° de bactérias por pote de leite. classe social. doente/sadio. estágio da doença (inicial. Quantitativa: *Discretas= só fazem sentido valores inteiros não negativos. 2°. Qualitativa: *Nominal= não existe ordenação dentre as categorias. podem assumir. estado civil. fumante/não fumante. ou seja. Exemplos: escolaridade (1°. resulta normalmente de contagens. 2. Amostra: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população.). *Contínuas= Resulta normalmente de uma mensuração. organização. Frequência: quantidade de vezes que um meso valor de um dado é repetido. Exemplos: sexo. intermediário. fevereiro. mês de observação (janeiro.. divisão do campeonato. descrição. • Descritiva: organiza e descreve os dados experimentais.) 1. n° de cigarros fumados por dia.. cor dos olhos. *Ordinal=existe uma ordenação entre as categorias. 3° graus). Dados Brutos: dados originais que ainda não foram numericamente organizados após a coleta. 3 . terminal).. Exemplos: n° de filhos.

vi) Freqüência Relativa Acumulada (Fri ou Fri%): vii) Ponto Médio de uma Classe é o ponto que divide a classe ao meio. vii) N° de classes (k): Tipos de Gráficos: Gráficos Coluna / Barra Gráficos de Linha Cartograma . Elementos de uma Distribuição de Freqüência i) Freqüência Absoluta: fi A freqüência absoluta de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor.Trabalho de Probabilidade e Estatística Rol: ordenação dos valores obtidos em ordem crescente ou decrescente de grandeza numérica ou qualitativa. o ponto médio da classe i é simbolizado por xi e calculado efetuando-se a média entre os limites da classe. sendo geralmente definida como: a diferença entre os limites superior (Li) e inferior (li) de uma classe. v) Freqüência Absoluta Acumulada (Fi) A freqüência acumulada “abaixo de” uma classe ou de um valor individual é a soma da freqüência simples absoluta dessa classe ou desse valor com as freqüências simples absolutas das classes ou dos valores anteriores. 4 ii) Freqüência Relativa: iii) Freqüência Percentual: conseqüentemente: iv) Amplitude do intervalo de Classe (h): É o comprimento da classe.

Trabalho de Probabilidade e Estatística Pictograma Histograma e Polígono de Frequência Gráfico de Faces (Faces de Chernoff) Dendograma Scatter-Plot (Gráficos de Dispersão) -Medidas de posição As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). 5 Média Geométrica É um valor que pode substituir todos os valores da lista sem alterar seu produto. Média Ponderada Média Aritmética dados agrupados (Sem Intervalos de Classe) As frequências funcionam como fatores de ponderação. . Média Harmônica É um valor que pode substituir todos os valores da lista sem alterar a soma de seus inversos. Média aritmética= X É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. o que nos leva a calcular a média aritmética ponderada.

Trabalho de Probabilidade e Estatística Média Aritmética dados agrupados (Com intervalos de classe) Mediana É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.São a mediana. mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores. e os percentis. Para determinar a posição: Os Decis: são valores que dividem o conjunto de dados ordenados em dez partes iguais. -Separatrizes Não são medidas de tendência central. Os Quartis: dividem um conjunto de dados em quatro partes iguais. . os decis. os quartis. 6 Moda A moda é o valor que ocorre com maior frequência no conjunto de dados.

Trabalho de Probabilidade e Estatística Os Percentis: são valores que dividem o conjunto de dados ordenados em cem partes iguais. s= ∑ ( xi − x) 2 i =1 n n s= Populacional ∑ (x i =1 n i − x) 2 Amostral n −1 Coeficiente de Variação de Pearson O coeficiente de Variação de Pearson é o quociente do desvio-padrão pela média. Variância Baseia-se nos desvios em torno da média aritmética. pois leva em consideração a totalidade dos valores da variável em estudo. CV P = S x Distribuição de frequências . -Dispersão É o quanto os dados numéricos estão dispersos em torno de um valor de tendência central. Desvio em relação à média. 7 Desvio-Padrão É a medida de dispersão mais geralmente empregada. É um indicador de variabilidade bastante estável.

Q1 -Dispersão Inferior: DI= Md-Ei -Dispersão Superior: DS=Es-Md -Valores discrepantes: Inferior: Superior: -Boxplot: 8 -Momento: medidas de assimetria -Coeficiente de assimetria de Pearson -Curtose: nível de achatamento de uma distribuição. .Trabalho de Probabilidade e Estatística .Amplitude Interquartílica: aq= Q3 .

Trabalho de Probabilidade e Estatística Modelando Computacionalmente a Estatística Descritiva Dados: 9 Tabela: .

76 1.61 1.72 1.6 1.5 50 71 86 FILHO S 2 1 2 2 1 3 1 1 3 2 1 3 2 1 1 3 1 2 1 3 2 1 1 1 2 2 2 1 2 4 1 1 3 1 1 1 1 1 1 1 1 2 2 1 1 7 2 1 1 1 FUM A NAO NAO NAO NAO NAO NAO NAO SIM NAO NAO SIM NAO NAO SIM NAO NAO NAO NAO NAO NAO NAO NAO SIM SIM NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO SIM NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO NAO TOLER P M P P M M P I M M I M M I I P P P P M P M I I P I M P P M P P M M M P P I P M I M I P M M M P P P EXE RC 0 0 5 5 2 2 3 2 3 2 10 0 6 5 4 0 3 3 3 7 8 0 5 0 8 6 8 1 3 1 2 1 2 4 7 5 10 6 5 4 5 2 7 5 0 0 4 2 7 7 OPCIN CINE E 1 B 1 B 2 M 2 B 2 B 1 B 1 B 2 M 3 M 2 M 2 B 2 B 1 M 1 M 1 B 1 B 1 B 4 B 2 B 2 B 2 B 3 B 4 B 1 M 5 M 2 B 2 M 1 M 1 B 2 M 2 M 1 B 1 B 2 B 1 B 1 M 2 M 4 B 2 B 1 B 4 B 2 B 0 M 1 B 1 M 1 B 3 B 1 B 0 M 0 M OPT TV V 10 16 R 7 R 15 R 20 R 5 R 2 R 7 R 10 R 12 R 10 R 8 N 0 R 30 R 2 N 10 R 18 R 10 N 10 R 5 R 14 M 5 R 5 R 10 R 28 R 4 N 5 R 5 R 10 R 12 R 2 R 6 N 20 R 14 R 10 R 25 B 14 R 12 N 10 R 12 R 2 R 10 B 25 R 14 N 8 R 10 R 8 R 3 R 5 R 14 R 20 B .2 54.57 1.67 1.82 1.6 1.65 1.62 1.2 48 51.68 1.6 1.6 1.5 63.57 1.65 1.73 1.85 1.85 1.62 1.64 1.78 1.71 1.73 1.68 1.45 1.65 1.9 55 60 58 47 57.76 1.6 57 63 52 49 59 52 73 56 58 87 47 95 84 60 73 55 44 75 55 49 50 54.8 1.7 1.65 1.66 1.55 1.7 1.5 49.83 PESO 60.4 66 85.62 1.69 1.54 1.5 60 58.85 1.5 52.64 1.6 1.7 1.7 1.8 58 70 54 58 68.7 1.58 1.55 1.7 1.5 55 72.5 47.8 80.55 1.63 1.69 1.8 1.Trabalho de Probabilidade e Estatística ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 TURM A A A A A A A A A A A A A A A A A A A A A A A A A A A B B B B B B B B B B B B B B B B B B B B B B B B SEX O F F M M F M F F F F F F F M F F F M F F F F F F F F F F F F F M F F M F M M F M F F M F F F F F M M IDADE 17 18 18 25 19 19 20 18 18 17 18 18 21 19 18 19 17 18 20 18 21 18 18 20 20 19 23 18 18 25 18 17 17 17 18 18 17 21 18 18 17 23 24 18 18 19 19 18 17 18 ALTU RA 1.

44 44 31 0.14 14 38 0. absoluta acumulada. relativa percentual e relativa acumulada percentual para uma variável quantitativa contínua.84 3 0.62 7 0.94 1 0.9 0 0 0 45 0.04 4 47 0.04 4 50 1 50 1 100 355 %Fri 18 62 76 84 90 90 94 96 100 .96 2 0. CLASSES 17 18 19 20 21 22 23 24 25 TOTAL (1°) VARIÁVEL QUANTITATIVA CONTÍNUA: IDADE fri %fri Fi Fri fi 9 0.08 8 42 0.18 18 9 0. Construa uma tabela com frequência absoluta.9 2 0.02 2 48 0.06 6 45 0.18 22 0.Trabalho de Probabilidade e Estatística 11 Questionário 1. (Realizado no Excel) Variável quantitativa contínua escolhida: IDADE.76 4 0.

28 0.56 0. (Realizado no Excel) Variável quantitativa discreta escolhida: N° DE FILHOS.84 0. Faça um polígono de frequências e um gráfico de pareto.02 0. Classes 1 2 3 4 7 5 6 TOTAL fi 28 14 6 1 1 0 0 50 Fi 28 42 48 49 50 50 50 fri 0.98 1 1 1 Fri% 56% 84% 96% 98% 100% 100% 100% .96 0.12 0.02 0 0 1 fri% 56% 28% 12% 2% 2% 0 0 100% Fri 0.Trabalho de Probabilidade e Estatística 12 2.56 0. Escolha uma variável quantitativa discreta.

Calcule o esquema dos 5 números e construa o boxplot da variável filhos e para uma variável qualitativa.Trabalho de Probabilidade e Estatística 13 3. (Realizado no Excel) -Variável qualitativa: FUMAR .

Trabalho de Probabilidade e Estatística Fuma Sim(0) Não(1) total fi 6 44 50 14 -Variável: FILHOS Variável quantitativa discreta: N° DE FILHOS Classes 1 2 3 4 5 6 7 TOTAL fi 28 14 6 1 0 0 1 50 Fi 28 42 48 49 49 49 50 .

8 Positiva 3.Trabalho de Probabilidade e Estatística 15 4. dispersão.fi 17 6 6 102 18 17 23 306 19 5 28 95 20 4 32 80 21 2 34 42 22 0 34 0 23 2 36 46 24 0 36 0 25 1 37 25 TOTAL 37 696 -Variável: PESO Variável Idade Média Mediana Moda Dispersão Assimetria Curtose 18. mediana e moda). (Realizado no Excel) -Variável: IDADE Variável: Idade do sexo feminino Classes fi Fi2 xi.3 (platicúrtica) Dados brutos Peso (sexo feminino) .Com o auxílio do coeficiente de Pearson avalie a dispersão das estudantes das turmas A e B em relação aos respectivos pesos médios. Calcule as medidas de posição (média. assimetria e curtose para a idade e peso dos estudantes do sexo feminino.8 18 18 1.

a média de peso foi de 56.5 55 55 58 47 57. utilizando o coeficiente de Pearson.26 kg e o Coeficiente de Variação .98 5.2 48 51.98.34 SEXO F F F F F F F F F F F F F F F F TURMA B B B B B B B B B B B B B B B B PESO 63 52 49 59 52 56 58 47 60 55 44 55 49 50 54.4 66 54.26 53.75 Simétrica 2.5 47.14 Média 56. SEXO F F F F F F F F F F F F F F F F F F F F F TURMA A A A A A A A A A A A A A A A A A A A A A Turm a A B PESO 60.5 49. Variação de Pearson 10.6 57 Disper são 5.5 50 Coef. relativa à variável peso do sexo feminino.9 (platicúrtica) Avaliação da dispersão das estudantes das turmas A e B em relação aos respectivos pesos médios.5 60 58.5 52.Trabalho de Probabilidade e Estatística 16 Variável Peso Média Mediana Moda Dispersão Assimetria Curtose 55 55 55 5.8 58 70 54 58 63.63% 9.63% A turma A teve uma dispersão de 5.

1153 85 0.Calcule o índice de massa corporal (IMC) de cada alunos das turmas A e B e represente através de gráfico em setores e gráfico de barras ou colunas.5<x <25 x>25 fi 3 22 1 26 fri 0.34 e o Coeficiente de Variação Pearson foi de 10. a média de peso foi de 53.61 % 3.Trabalho de Probabilidade e Estatística Pearson foi de 10. segundo a tabela aseguir: 17 5. Esses dados indicam que a turma A obteve uma média dispersão e a turma B uma baixa dispersão. exerc.63%. relativa à variável peso do sexo feminino. Já a turma B obteve uma disperção de 5. Você consegue estabelecer alguma relação entre o IMC médio das duas turmas juntas e as informações contidas nas variáveis fuma.0384 62 1 %fri 11. Turma A: Classes x<18.14. os alunos que estão abaixo.63%.84% 100% Legenda: x<18. e TV ? (Realizado no Excel).5<x<25 ideal x>25 do peso Abaixo Peso Acima .53 % 84.8461 54 0.5 do peso 18.5 18. acima ou dentro da faixa de peso ideal por turma.

125 1 %fri 8% 80% 12% 100% .0833 33 0.5 18.5<x <25 x>25 total fi 2 19 3 24 fri 0.7916 67 0.Trabalho de Probabilidade e Estatística 18 Turma B: Classes x<18.

. Exerc.Trabalho de Probabilidade e Estatística 19 Relação entre o IMC e as variáveis Fuma. . TV.

da turma A 81% dos alunos não fumam. eles gastam de 4 a 18h assistindo TV por semana.11% estão abaixo do peso e 4% acima do peso. como por exemplo.Trabalho de Probabilidade e Estatística 20 Analisando os gráficos de IMC da Turma A percebe-se que a grande maioria (85%) dos alunos está dentro de uma faixa de peso ideal. já que há pouca atividade física por semana e há muito mais horas gastas na frente da TV. isso se deve ao fato de que a grande a maioria mantém hábitos mais saudáveis. pelo menos 16 alunos praticam de 3h a 10h de atividades físicas semanais e 20 alunos gastam apenas de 0 a 15h assistindo TV por semana. O que explica bastante o peso a mais. pratica apenas 3h de atividade física semanal e assiste 10h de TV por semana. A parcela que está abaixo do peso (11%) pratica de 0 a 8h de atividades físicas semanais e deles 66. A parcela que está acima do peso (4%) não fuma.66% não fumam. .

Trabalho de Probabilidade e Estatística Na turma B a avaliação do IMC indicou que 80% da turma está dentro do peso ideal. Variável: CINE 21 CINE 0 1 2 3 4 5 TOTA L TV 0_4h 5_ 9h 10_14 h 15_19 h 20_24 h 25_30 h total fi 8 13 19 3 3 4 50 fi 3 21 18 3 4 1 50 Variável: TV . Esses dados não são tão bons quanto os da turma A. 6. apesar de que na turma B 96% dos alunos não fumam. o que leva a conclusão de que a pesar de se exercitarem bem durante a semana gastam muitas horas na frente à TV. de 0 a 5h. e optv e descreva o perfil dos alunos da turma B em relação ao hábito de assistir TV e Cinema. A parcela dos alunos que está acima do peso (12%) não fuma. pratica de 7 a 10h de atividades físicas semanais e gasta de 12 a 25h assistindo TV por semana. o que leva a um péssimo condicionamento físico e a depender dos hábitos alimentares leva à diminuição de peso. e ainda gasta de 8 a 14h assistindo TV.A parcela que está abaixo do peso (8%) não fuma. 12% acima do peso e 8% abaixo do peso. (Realizado no Excel).Utilize um gráfico de barras ou boxplot ou gráfico em setores das variáveis cine. tv e opcine. mas pratica pouca atividade física por semana.

Class es 0_4h 5_ 9h 10_14 h 15_19 h 20_24 h 25_30 h total fi 3 5 12 0 2 2 24 CINE 0 1 2 3 4 Total fi 3 11 7 1 2 24 .Trabalho de Probabilidade e Estatística 22 Variável: OPTV OPTV N(não sabe) R(ruim) M(média) B(boa) Total fi 7 39 1 3 50 Alunos da turma B em relação ao hábito de assistir TV e Cinema.

(Realizado no Excel). Para isso ela precisa escolher a melhor estratégia para a campanha e necessita do perfil das turmas A e B. Uma ONG quer fazer uma campanha nas escolas contra o hábito de fumar entre os jovens. gastam de 0 a 14h assistindo TV e 4 alunos gastam de 15 a 30h. 7. Defina uma estratégia para que a ONG alcance seu objetivo. o que não é muito comparado ao hábito de assistir televisão em que pelo menos 20 alunos de um total de 24. . percebe-se que boa parte da turma (46%) vai ao cinema uma vez por semana.Trabalho de Probabilidade e Estatística 23 Analisando os gráficos em relação ao hábito de assistir TV e Cinema da turma B. A primeira escola escolhida foi aquela cujos dados estão tabelados em nosso trabalho. Escolha os gráficos e técnicas da estatística descritiva para realizar essa tarefa.

Trabalho de Probabilidade e Estatística 24 Perfil da Turma A .

possui um filho. possui um IMC dentro da faixa de peso ideal (24. isso significa que de um total de 24 alunos só 1 fuma. e 60% é do sexo feminino. seria aplicável à . e que 60% gasta de 10 a 30h assistindo TV por semana. 20% dos fumantes da turma A está abaixo do peso com IMC de 17.4747174301011. Na turma A 19% dos alunos são fumantes. Analisando os gráficos a respeito dos hábitos desses fumantes foi constatado que eles praticam poucas horas de atividade física por semana.54346). atividades culturais e toda aquela atividade que traga mais segurança e autoestima ao jovem. tem 21 anos. 100% dos fumantes da turma B é do sexo masculino. 100% dos fumantes da turma A têm 1 filho. 80% pratica apenas de 0 a 5h. 20% tem 19 anos e 20% tem 20 anos. é indiferente em relação à tolerância ao cigarro.Trabalho de Probabilidade e Estatística 100% dos fumantes da turma A são indiferentes à tolerância ao cigarro. Uma boa alternativa para a ONG seria promover atividades durante vários dias da semana para ocupar o tempo livre dos jovens. pratica atividade física 6h por semana e assiste 10h de TV por semana. as atividades poderiam ser exercícios físicos regulares. desse total 60% tem 18 anos. Em relação a esses hábitos a atitude de encaixar mais atividades durante a semana dos fumantes ou da turma toda. principalmente mulheres. 25 Perfil da Turma B Na turma B apenas 4% dos alunos são fumantes. que irá deixar o hábito de fumar paulatinamente.

Trabalho de Probabilidade e Estatística turma B também. assistir menos horas de TV por semana e encaixar dentre os seus programas atividades culturais e que estimulem a autoconfiança. seria interessante também estimular essa parcela de 4% a praticar mais horas de atividades físicas por semana. ajudando a desenvolver habilidades. com oficinas interativas. 26 . Apesar do número pequeno de fumantes. para que o aluno deixe o hábito de fumar. que irão trazer maior entusiasmo e segurança.

eb.br/como-fazer-um-grafico-de-pareto-noexcel/>.de9. . br/~aderson/boxplot.Disponível em: <http://www. IMC. (T01). net/imc.copacabanarun ners. Índice de Massa Corporal. Disciplina MAT219. Acesso em: 15 de setembro de 2011. Usando o Excel para criar Boxplots. Como fazer um gráfico de Pareto no Excel. 2° semestre de 2011.pdf > Acesso em: 20 de setembro de 2011. GOUVEIA . Disponível em: <http://www. Disponível em: < http://hitec.ime. Arthur. Instituto Federal de Educação.Trabalho de Probabilidade e Estatística 27 Referências Bibliográficas Material de Probabilidade e Estatística.com. Ciência e Tecnologia da Bahia.arthurgouveia.html> Acesso em: 18 de setembro de 2011.