You are on page 1of 87

Módulo Específico I Técnico em Segurança no Trabalho Carga horária: 30 horas

Criado em 20/09/2011 Versão 0 de 20/09/2011

Conteúdos Formativos
Estatística Descritiva
Representações Gráficas Distribuição de Freqüência

Medidas de Tendência Central e de Dispersão Intervalos de classe Distribuições de Probabilidade Teste de Hipóteses Correlação Elaboração de gráficos estatísticos aplicados à Segurança do Trabalho

Objetivo geral
Compreender os conceitos básicos de estatística, aplicáveis ao Técnico em Segurança do Trabalho.

Aulas
Aulas 1. 03/10 – Estatística Descritiva: Distribuição de Frequências 2. 04/10 – Estatística Descritiva: Representações Gráficas 3. 06/10 – Medidas de tendência central e da dispersão 4. 10/10 – Intervalos de classe 5. 11/10 – Distribuições de probabilidade 6. 13/10 – Teste de hipótese 7. 17/10 – Correlação 8. 18/10 – Elaboração de gráficos estatísticos aplicados a Segurança do Trabalho

Estatística Descritiva Conceitos iniciais Fases do método descritivo Apresentações de dados Tabelas .

Estatística É uma parte da Matemática Aplicada que fornece métodos para a coleta. descrição. organização. análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. .

Conceitos I Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. e variar esta causa de modo que o pesquisador possa descobrir seus efeitos. Método experimental: consiste em manter constantes todas as causas (fatores). menos uma. no resultado final. registrando essas variações e procurando determinar. caso existam. admiti todas essas causas presentes variando-as. . Método estatístico: diante da impossibilidade de manter as causas constantes. que influências cabem a cada uma delas.

gráficos e medidas que resumem a distribuição desta variável. . apresentação e descrição dos dados representativos do comportamento de uma variável.. Podemos dizer que Estatística Descritiva ..Estatística Descritiva A coleta a organização e a descrição dos dados estão a cargo da estatística Descritiva. onde se utilizam tabelas. enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. É o conjunto de métodos para a organização.

frequência de alunos às aulas. como no caso de epidemias que assolam ou dizimam rebanhos inteiros. a fim de atender a uma conjuntura ou uma emergência. como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos. Ocasional: quando feita extemporaneamente. Indireta: quando os dados são obtidos de outro pesquisador. as informações em estado bruto (na forma original) Direta: quando os dados são obtidos pelo próprio pesquisador. ou seja. ou ainda. Periódica: quando feita em intervalos constantes. tal como a coleta das datas de nascimento e óbitos. . podendo ser: Contínua: quando feita continuamente. de uma coleta direta.Fases do método estatístico Coleta de Dados: é o ato de se obter os dados.

que possam influir sensivelmente nos resultados. Interna: quando visa observar os elementos originais dos dados da coleta. ou seja. os erros de registro das informações. .Fases do método estatístico [continuação] Crítica: procura de possíveis falhas e imperfeições. Externa: quando visa as causas dos erros por parte do informante. a fim de não incorrermos em erros grosseiros ou de certo vulto.

. Exposição ou apresentação dos dados: Por mais diversa que seja a finalidade que se tenha em vista.Fases do método estatístico [continuação] Apuração dos dados: nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. os dados devem ser apresentados sob forma adequada (tabelas ou gráficos). tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e anterior obtenção de medidas típicas.

através de métodos da Estatística Indutiva ou Inferencial (tira conclusões). fazemos uma análise dos resultados obtidos.Fases do método estatístico [continuação] Análise dos resultados: o objetivo da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim. que tem por base a indução ou inferência. e tiramos desses resultados conclusões e previsões. realizadas as fases anteriores (Estatística Descritiva). .

Amostra: Parcela ou subconjunto da população. Amostragem: É o processo de formação de amostras. . Censo: Contagem ou medição de toda uma população.Conceitos II População: São todos os itens ou indivíduos sobre os quais se deseja obter informações.

Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas. c. b. Coluna indicadora – parte da tabela que especifica o conteúdo das linhas. .Apresentação dos dados Tabelas: é um quadro que resume um conjunto de observações. É composta por: a.

Quando?. f. Onde?. respondendo às perguntas: O quê?. e. Linhas – retas imaginárias que facilitam a leitura. . Casa ou célula – espaço destinado a um só número. no sentido horizontal.Apresentação dos dados Tabelas d. localizado no topo da tabela. Título – conjunto de informações. as mais complexas possíveis. de dados que se inscrevem nos seus cruzamentos com as colunas.

Apresentação dos dados Tabelas Exemplo 1: .

relação do trabalho com o curso de Estatística. estado civil. meio de informação e número de disciplinas reprovadas dos alunos da disciplina Inferência Estatística do curso de Estatística . número de irmãos. transporte. altura (metro e centímetro).Apresentação dos dados Tabelas Exemplo 2: Informações sobre sexo. procedência. idade (anos). peso (kg).

. O grupo coletará as seguintes informações de cada componente: Nome Idade Sexo Altura Quantidade de irmãos Vamos trabalhar com os dados coletados.Exercício – Coleta de dados Dividir a turma em 9 grupos de 4 pessoas cada. Cada grupo receberá uma letra que o identificará.

Estatística Descritiva Apresentações de dados Tabelas Séries Estatísticas Dados absolutos e dados relativos Distribuição de Frequência .

0. Se os valores são expressos em numerais decimais.. não só quanto à natureza das coisas. nas casas ou células devemos colocar: • Um traço horizontal (-) quando o valor é zero.. precisamos acrescentar À parte decimal um número correspondente de zeros (0. •Um ponto de interrogação (?) quando temos dúvidas quanto à exatidão de determinado valor.. ..) quando não temos os dados. 0. como quanto ao resultado do inquérito. •Três pontos (.000. 0.) .Apresentação dos dados Tabelas De acordo com a Resolução 886 da Fundação IBGE.00. •Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada.

Então podemos inferir que numa série estatística observamos a existência de três elemento ou fatores: O tempo. O espaço. do local ou da espécie. classificada como histórica.Séries Estatísticas [Tabelas] Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época. classificada como específica. . classificada como geográfica e A espécie.

discriminados segundo intervalos de tempo variáveis. . temporais ou marchas Descrevem os valores da variável.Séries Estatísticas [Tabelas] Séries históricas. cronológicas. em determinado local.

. territoriais ou de localização Descrevem os valores. em determinado instante.Séries Estatísticas [Tabelas] Séries geográficas. espaciais. discriminados segundo regiões.

Séries Estatísticas [Tabelas] Séries específicas ou categóricas Descrevem os valores da variável em determinado tempo e local. discriminado segundo especificações ou categorias. .

obtemos uma tabela de dupla entrada.Séries conjugadas [Tabelas] Tabela de dupla entrada Conjuga dois ou mais valores de uma variável em uma única tabela. Em tabelas deste tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e outra vertical (coluna). . Conjugando duas séries.

Séries conjugadas [Tabelas] Exemplo de tabela de dupla entrada .

Distribuição de frequência [Tabelas] .

Exercícios Classifique as séries .

Exercícios Classifique as séries .

Exercícios Classifique a série .

. Os dados relativos são apresentados por meio de percentagens.Dados absolutos e dados relativos Dados absolutos: são os dados resultantes da coleta direta da fonte. coeficientes e taxas. índices. senão a contagem ou medida. por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Dados relativos: são os resultados de comparações. sem outra manipulação.

Estatística Descritiva Distribuição de Frequência Intervalos de Classe .

Exemplo: Estatura dos alunos da turma 166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153 160 173 155 157 165 160 169 156 167 155 151 158 164 164 170 158 160 168 164 161 . ou seja. estão na forma em que foram coletados.Distribuição de Frequência Tabelas Primitivas Dados brutos: são aqueles que não foram numericamente organizados.

150 156 161 164 151 156 161 165 152 157 161 166 153 158 161 167 154 158 162 168 155 160 162 168 155 160 163 169 155 160 163 170 155 160 164 172 156 160 164 173 . em centímetros. Exemplo: Estatura dos alunos da turma.Distribuição de Frequência Tabelas Primitivas Rol: É a organização dos dados brutos em ordem de grandeza crescente ou decrescente.

Distribuição de Frequência É uma tabela onde os dados observados são listados fazendo-se uma correspondência com um número de repetições ou observados de um valor (frequência). .

Distribuição de Frequência em Classes É uma tabela onde os dados são agrupados em classes (intervalos). .

162 Limites de classe: são os extremos de cada classe.Distribuição de Frequência em Classes Elementos da distribuição de frequência em classes: Classes: São os intervalos da variação da classe Exemplo: 158 |-. Exemplo: xi = (li + Li) / 2 . o limite superior (Li). Amplitude do intervalo de classe: é a medida (tamanho) do intervalo que defina a classe: Exemplo: hi = Li – li Ponto médio: é o ponto que divide o intervalo de classe em duas partes iguais. O menor número é o limite inferior (li) e o maior número.

ii. onde n representa o total de observações. h = AT/k.32log(n). Determinar a amplitude do intervalo de classe: i. Determinar a amplitude total dos dados: AT = Xmáx – Xmin iii. sendo que o limite inferior do primeiro intervalo deve ser menor ou igual ao menor valor da série. Estabelecer os limites inferiores e superiores dos intervalos de classe. . Determinar o número de classes: Fórmula de Sturges: k = 1 + 3.Distribuição de Frequência em Classes Construção de uma distribuição de frequência em classes: i.

teremos: Número de classes: k = 6. Amplitude total dos dados: AT = 173 – 150 = 23 iii. Limites inferiores e superiores: li = 150 Li = 150 + 4 = 154 i.3188 ≈ 6 ii.Distribuição de Frequência em Classes No exemplo da estatura dos alunos da turmas.154 . temos a 1ª classe: 150 |-. Então. Amplitude do intervalo de classe: h = 23/6 = 3.83 ≈ 4 iv.

fica assim a 2ª classe: limite inferior = 154 Limite superior = 154 + 4 = 158 Demais classes: repetem-se as atividades para a construção da 2ª classe.Distribuição de Frequência em Classes Tratando as classes 1º classe: 150 |-. Desta forma. .154 2º classe: o limite superior é o limite inferior da classe anterior e o limite superior é o limite inferior somado a amplitude do intervalo de classe. tomando como limite inferior o limite superior da classe imediatamente superior.

Intervalos de classe Representações Gráficas .

que corresponde ao total de observações ∑ = fi = N. A soma das frequências simples é denominada de frequência total. .Distribuição de Frequência em Classes Frequência Simples (fi) é o número de observações correspondentes a uma classe. Frequência Relativa (fri) é a razão entre a frequência de determinada classe e a frequência total. fri = fi / ∑fi.

+ fk Frequência Acumulada Relativa (Fri) é a razão entre a frequência acumulada da classe dividida pela frequência total da distribuição. Fk = f1 + f2 + . Fri = Fi / ∑fi. ou a acumulação da frequência relativa (fri).Distribuição de Frequência em Classes Frequência Acumulada (Fi) é a soma das frequências de todos os valores abaixo do limite superior de uma determinada classe.. ..

Distribuição de Frequência em Classes Frequência Simples Frequência Acumulada Frequência Relativa Frequência Relativa Acumulada .

.. a distribuição é chamada distribuição sem intervalo de classe.Distribuição de Frequência sem Intervalos de Classe Quando se trata de variável discreta de variação relativamente pequena. nesse caso.. Fn ∑f = n .. X1 X1 X2 . Xn F1 F1 F2 . cada valor pode ser tomado como um intervalo de classe e.

Distribuição de Frequências .

Representações Gráficas São formas de apresentação dos dados estatísticos. uma impressão mais rápida e viva do fenômeno em estudo. já que os gráficos falam mais rápido à compreensão que as séries. cujo objetivo é o de produzir. no investigador ou no público em geral. Podem ser de 4 tipos: Diagramas Gráfico Polar Cartograma Pictograma .

Veracidade: deve expressar a verdade sobre o fenômeno em estudo. . retire detalhes desnecessários. Clareza: deve possibilitar uma correta interpretação dos valores.Representações Gráficas [continuação] Requisitos fundamentais: Simplicidade: o gráfico deve ser objetivo.

• Histograma • Ogiva . em geral.Diagramas São gráficos geométricos de. duas dimensões. Y 0 X Podem ser: • Gráfico em linha ou em curva • Gráfico em colunas ou em barras • Gráficos em colunas ou barras múltiplas. no máximo. fazemos uso do sistema cartesiano. para sua construção.

Diagramas Gráfico em Linha ou em Curva Esse tipo de gráfico se utiliza de uma linha poligonal para representar uma série estatística. O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. .

Diagramas (continuação) Distribuições de probabilidade .

Quando em colunas.Diagramas Gráfico de Colunas ou Barras Utilizado na comparação de dados de uma série estatística. São utilizados retângulos dispostos verticalmente (em colunas ou horizontalmente (em barras). . os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. os retângulos tem a mesma altura e os comprimentos são proporcionais aos respectivos dados. Quando em barras.

Diagramas Gráfico de Colunas ou Barras .

.Diagramas Gráfico de Colunas ou Barras Múltiplas Utilizado para representar. dois ou mais fenômenos estudados com o propósito de comparação. simultaneamente.

Diagramas Gráfico de Colunas ou Barras Múltiplas .

A largura dos retângulos são iguais às amplitudes dos intervalos de classe. . Polígono de frequências: é um gráfico em linha que une os pontos médios dos intervalos de classe em um histograma. As alturas devem ser proporcionais às frequências das classes.Diagramas Histograma É o gráfico de colunas utilizado na representação de uma distribuição de frequência em classes. São utilizados retângulos justapostos. sendo a amplitude dos intervalos iguais. de tal forma que seus pontos médios coincidam com os pontos médios dos intervalos de classe.

Diagramas Histograma .

Diagramas Ogiva É um polígono de frequências acumuladas. .

O total é representado pelo círculo. que fica dividido em setores proporcionais às frequências. .Gráfico Polar ou em Setores Utilizado quando desejamos ressaltar a participação do dado no total.

Mediana. Relação entre média. ponderada. mediana e moda. aparada.Medidas de tendência central Média: simples. Medidas de dispersão . de distribuição de frequência e geométrica. Moda.

referir-se ao grupo como tendo “em torno de 70 anos”. O que queremos dizer com isso? . As medidas de tendência central mais utilizadas são: MÉDIA. Satisfaz a pergunta: Onde está o meio dos dados? Exemplo: Pode-se. ao identificar um grupo de idosos. MEDIANA E MODA.Medidas de Tendência Central São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados.

X = R$ 2.300. R$ 2. X = ∑x = soma dos valores .200.000. R$ 2. R$ 2. R$ 6. R$ 2.050. R$ 2.100.350.200. n = quantidade dos valores Exemplo: Média dos salários de 12 empregados de uma empresa: Salários: R$ 500.300.Médias Média aritmética simples: É o quociente da divisão da soma dos valores da variável pelo número (quantidade) deles.366. . R$ 2. R$ 2.150. R$ 2. R$ 2. R$ 2.250.000.

R$ 2.000. R$ 2. X = R$ 2.Médias [continuação] Média aparada: Semelhante à média aritmética simples.000. R$ 2. R$ 2.300.050.6 ≈ 1 salário. R$ 2. descartando-se em partes iguais alguns dos extremos inferior e superior. R$ 6. porém. Então: 5% de 12 salários é igual a 0.190.200.100. Exemplo: Continuando do exemplo anterior.200. R$ 2.150. obteremos a média aparada em 5% dos salários dos 12 empregados de uma empresa. R$ 2. R$ 2.300. R$ 2.250.350. . R$ 2. Salários: R$ 500.

Médias [continuação] Média ponderada: Assemelha-se a média aritmética simples. Xp = ∑(x . sendo: 9. 1) + (8 . 2. 8. 6 e 5 e cada bimestre possui pesos 1. mas atribuise a cada valor um peso (ponderação) que retrate sua importância.3 . Pesos ∑ p = soma dos pesos Exemplo: Considere as notas do Joãozinho em Matemática nos 4 bimestres do ano. 3) + (5 . 4) 1+2+3+4 = 6. Xp = (9 . 3 e 3 respectivamente. 2) + (6 . p) = soma dos valores .

x) = 6.312 840 516 6.166 166 |-.158 158 |-. Estaturas 150 |-.440 X = 161 cm X = ∑(f .154 154 |-.440 ∑p 40 Média da distribuição de frequência Então: .170 170 |-.174 Total Freq.Médias [continuação] Média de distribuição de frequência: É o somatório do produto das médias aritméticas simples pela frequência simples de cada classe dividido pela frequência total da distribuição de frequência.X 608 1. (f) 4 9 11 8 5 3 40 Média Estaturas (x) 152 156 160 164 168 172 f.760 1.404 1.162 162 |-.

xn Exemplo: Supondo que a categoria de operários de uma fábrica teve um aumento de salário de 20% em 1999.2.12 e 1.1287 = 12.87% . 12% em 2000 e 7% em 2001..07 = 3√1.12 . devemos multiplicá-lo por 1. 1. xg = ⁿ√x₁ . Então: xg = 3√1..07 que são os fatores correspondentes a tais percentuais.2 .43808 = 1. 1. 1. x₂ . Qual o percentual médio anual de aumento? Para calcularmos o aumento médio.Médias [continuação] Média geométrica: É obtida através da raiz n da multiplicação dos valores. onde n é o número (quantidade) de valores.

344.442.200.00 R$ 1.00 R$ 1.276.000.200.87% 12.87% 12.00 R$ 1.00 R$ 1.00 +% informado 13% 13% 13% .000.00 R$ 1.344.87% Salário final R$ 1.00 R$ 1.00 R$ 1.200.274.00 Salário inicial R$ 1.00 +% informado 12.438.00 Se calcularmos a média aritmética simples teremos 13% (20 + 12 + 7 dividido por 3).344.200.00 R$ 1.00 R$ 1.128.90 Salário final R$ 1.438.00 R$ 1.344.90 R$ 1.000. Salário inicial R$ 1.130.00 +% informado 20% 12% 7% Salário final R$ 1.00 R$ 1.Médias [continuação] Média geométrica (continuação): Salário inicial R$ 1.

.Mediana É o valor central de um conjunto de dados ordenado.

.Moda É o valor que mais se repete em um conjunto de dados. Na linguagem coloquial. moda é algo que está em evidência.

mediana e moda coincidem. . chamamos a distribuição dos dados de simétrica.Relação entre média. mediana e moda Quando a média.

mediana e moda (continuação) Quando a média. . mediana e moda não coincidem. chamamos a distribuição dos dados de assimétrica.Relação entre média.

Na maioria dos casos existirá variação em um conjunto de dados independente da característica que você está medindo.Medidas de dispersão O termo “variação” ou “dispersão” sugere tornar vário ou diverso. discrepar. pois nem todos os indivíduos terão o mesmo exato valor para todas as variáveis. não ser conforme. . alterar. diversificar. mudar. ser inconstante.

Há variação de notas e. Vejamos a seguir! . Maria. é bem discrepante. José e Mário foi 7. no caso de João e José. não notaremos qualquer diferença entre os quatro alunos. Se considerarmos apenas a Média. observa-se que as notas são muito diferentes em relação a Média.0.Medidas de dispersão [continuação] Exemplo: Durante o ano letivo a Média das notas de João. No entanto.

Medidas de dispersão [continuação do exemplo] .

. O desvio padrão é um modo que se usa para medir a variabilidade entre os números em um conjunto de dados.Medidas de dispersão [continuação] Variância e Desvio padrão São medidas que representam um valor médio de variação em torno da média.

. se elevarmos os desvios ao quadrado. pois qualquer número elevado ao quadrado resulta em um valor positivo. teremos sempre valores positivos. Temos um problema! Mas.Medidas de dispersão [continuação] Variância e Desvio padrão A soma dos desvios sempre dará 0 (zero).

A divisão por n – 1 aparece por fornecer um melhor resultado do que a divisão por n. representada por S².Medidas de dispersão [continuação] Variância amostral É a média dos quadrados dos desvios. .

temos que Desvio padrão que é a raiz quadrada da variância amostral. não é correto obter a raiz quadrada para desfazer a potenciação? Então. . se elevamos os desvios padrões ao quadrado para obter sua média.Medidas de dispersão [continuação] Desvio padrão amostral Mas.

. José e Mário.Medidas de dispersão [continuação] Calculando a variância e o desvio padrão das notas de Maria.

Medidas de dispersão [continuação] Calculando a variância e o desvio padrão das notas de Maria. . José e Mário.

José e Mário. .Medidas de dispersão [continuação] Calculando a variância e o desvio padrão das notas de Maria.

Probabilidade
Conceitos
Experimento/fenômeno aleatório: são aqueles que mesmo repetidos várias vezes, sob condições semelhantes, apresentam resultados imprevisíveis. Espaço amostral: É o conjunto de resultados possíveis de um experimento. Representado pela letra S. Exemplo: Smoeda = {Ca, Co} Sdado = {1, 2, 3, 4, 5, 6}

Probabilidade
[continuação]

Conceitos
Ponto amostral: é cada um dos elementos de S Exemplo: Ca ∈ Smoeda 2 ∈ Sdado Evento: É qualquer subconjunto “E” do espaço amostral S.
Se E = S, E é chamado evento certo. Se E ⊂ S e E é um conjunto unitário, E é chamado de evento elementar. Se E = ∅, E é chamado de evento impossível.

Probabilidade
[continuação]

Probabilidade Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.
Chamamos de probabilidade de um evento A (A ⊂ S) o número real P(A), tal que: P(A) = n(A) / n(S) Onde: n(A) é o número de elementos de A n(S) é o número de elementos de S

Probabilidade
[continuação]

Probabilidade Exemplo: Considerando o lançamento de uma moeda e o evento A “obter cara”, temos: S = {Cara, Coroa} ⇒ n(S) = 2 A = {Cara} ⇒ n(A) = 1 Logo: P(A) = 1 / 2 O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos 50% de chance de que apareça cara na face superior.

07 = 7% ocorrer três acidentes: p = 1/30 ⇒ = 0.17 = 17% ocorrer dois acidentes: p = 2/30 ⇒ 0. Em um dia. a probabilidade de: não ocorrer acidentes: p = 22/30 ⇒ 0.03 = 3% .73 = 73% ocorrer um acidente: p = 5/30 ⇒ 0.Distribuições de Probabilidade Considere a distribuição de frequências relativa ao número de acidentes diários em um estacionamento.

.. então.. A cada valor x1 correspondem pontos do espaço amostral.. Xn. a probabilidade p1 de ocorrência de tais pontos no espaço amostral. x2. Assim. a cada valor X1.Distribuições de Probabilidade Então podemos escrever: Seja X uma variável aleatório que pode assumir os valores x1. . x2.. .. Associamos. temos: ∑p1 = 1 Os valores x1. xn e seus correspondentes .