Professional Documents
Culture Documents
Tema 1 - Introdução À Estatística.
Tema 1 - Introdução À Estatística.
Introdução à Estatística
1
Estatística é a ciência que estuda as técnicas e métodos de colecta, organização, análise e interpretação
dados para a tomada de decisões.
Analisando estas definições pode-se notar que o objecto do estudo da Estatística são os dados.
Dados são um conjunto de valores ou ocorrências em um estado bruto com o qual são
obtidas informações com o objectivo de adquirir conhecimentos sobre um fenómeno (Wikipedia).
Dados brutos (raw data) designam os dados recolhidos e armazenados/arquivados tal qual foram
colectados, sem terem sofrido o menor tratamento. Apresentam-se como um conjunto de números,
caracteres, imagens ou outros símbolos.
Segundo Larson (2010:3), o uso de dados estatísticos remonta aos tempos da antiga Babilónia, no Egipto e
mais tarde, no Império Romano, quando os dados eram colectados sobre assuntos relacionados ao Estado,
tais como nascimentos e óbitos. A palavra estatística é derivada da palavra latina “status”, que em
português significa estado.
Actualmente a Estatística tem em várias áreas: Gestão empresarial, análises económicas, análises de
fenómenos sociais, demografia, meteorologia, entre outras.
A aplicação correcta das técnicas da Estatística na análise de um conjunto de dados permite extrair
informações importantes que poderão ser usadas para apoiar a tomada de decisões.
Estatísticas educacionais
Estatísticas de saúde
Estatísticas económicas
Estatísticas agrárias
Estatísticas de um jogo
Etc.
2º no singular e com inicial maiúscula (Estatística) significa uma ciência ou área de estudo como foi
definido anteriormente.
Como ciência a Estatística divide-se em duas grandes áreas: Estatística Descritiva e a Estatística
Inferencial (ou Inferência Estatística)
A Estatística Descritiva é a parte da Estatística que estuda as técnicas e métodos de recolha, organização,
apresentação, descrição e exploração de dados. Procura-se resumir e representar de forma compreensível a
informação contida num conjunto de dados. Esse processo adquire muita importância quando o volume de
dados for muito grande. Esse resumo faz-se através de construção de tabelas, gráficos e cálculos de
algumas medidas numéricas que representam coniventemente a informação contida nos dados.
A Inferência Estatística é a parte da Estatística que estuda as técnicas e métodos de estudo das
características de uma população através de amostras. Permite tirar conclusões sobre as características de
uma população a partir da análise dos dados de uma amostra seleccionada dessa população.
Para que as conclusões tiradas da amostra possam ser inferidas ou estendidas à toda a população a amostra
deve ser representativa da população onde foi seleccionada. Uma amostra representativa da população é
aquela que possui características similares as que observariam se toda a população fosse estudada.
A Teoria de Amostragem fornecem técnicas que permitem obter amostras representativas, realizar
inferências e controlar e medir o grau de incerteza que as conclusões possam conter. A base da Inferência
Estatística é a Teoria de Probabilidades.
A Estatística é a ciência que estuda as técnicas de recolha, tratamento, análise e interpretação de dados
sobre as características de uma população para a tomada de decisões informadas. Esse estudo pode ser
feito usando toda a população ou uma parte da população (amostra).
Amostra é uma parte ou subconjunto dos elementos de uma população seleccionados com o objectivo de
estudar uma ou várias características da população.
Os elementos da população chamam-se unidades estatísticas. Uma unidade estatística (ou unidade de
observação) é um elemento da população sobre o qual a informação é recolhida. No caso de populações
humanas as unidades de observação são os indivíduos.
Uma população pode ser finita ou infinita. Considera-se uma população infinita quando o número de
unidades estatísticas é infinito ou quando é tão grande que não podemos contar, como por exemplo:
População de peixe na Baia de Maputo; população de estrelas etc.
Quando o nº de elemento de uma amostra é menor que 30 diz-se que a amostra é pequena e quando é
maior ou igual a 30 a amostra é grande.
1.3 Variáveis
As características de uma população chamam-se variáveis. Uma variável é uma característica (ou
propriedade) comum de uma população que pode assumir valores diferentes dentro do seu domínio.
Por exemplo, uma população de trabalhadores pode ser caracterizada pelas seguintes variáveis:
Sexo;
Idade;
Estado civil;
Número de filhos;
Anos de experiência;
Grau académico;
Categoria profissional;
Salário mensal;
Tipos de variáveis
Dependendo do seu domínio, as variáveis podem ser classificadas em 2 grandes grupos: qualitativas e
quantitativas
Sexo (M;F);
Mas os códigos atribuídos não tem significados numéricos, pelo que não se pode aplicar operações
matemáticas (adição, multiplicação etc.) com esses códigos.
As variáveis qualitativas nominais são aquelas cujos valores são nomes, categorias, rótulos e etiquetas.
Exemplo:
Sexo (M;F);
Nesta classe, não se pode estabelecer uma ordem de grandeza entre os valores da variável.
As variáveis qualitativas ordinais são aquelas em que se pode estabelecer uma certa ordem de grandeza
entre os valores da variável.
Exemplo:
As variáveis quantitativas são aquelas que podem tomar valores numéricos resultantes de contagem ou
de medições.
As variáveis quantitativas discretas: tomam valores numéricos num conjunto finito ou infinito
enumerável. Normalmente são obtidos através de processos de contagem.
As variáveis quantitativas contínuas podem tomar qualquer valor numérico dentro de um intervalo
infinito fechado ou aberto. Este tipo de variáveis normalmente é obtido através de processos de medição.
Escalas de mensuração
Para uma aplicação adequada das técnicas estatísticas para além do tipo de variáveis é necessário conhecer
a escala de mensuração (medição) das variáveis. Quanto a escala de mensuração as variáveis
enquadram-se em 4 níveis seguintes: Nominal, ordinal, intervalar e de razão (rácio).
Os dados na escala nominal são qualitativos categorizados por nomes ou rótulos. Neste nível de escala
não se pode estabelecer uma relação de ordem entre os valores das variáveis e muito menos cálculos
matemáticos, exemplos: sexo (M/F); raça; religião etc.
Os dados nominais podem ser atribuídos códigos numéricos para facilitar o processamento informático
mas esses números não tem valor numérico. Por exemplos, números que se usam para identificar os
jogadores de futebol; os nuits, nº de estudante, estradas, casas etc.
Os dados escala ordinal são qualitativos mas já é possível estabelecer uma relação de ordem entre os
valores das variáveis mas também não se pode fazer cálculos matemáticos. Exemplos, classificação dos
estudantes em (mau; bom; excelente); estado de um doente (grave, melhor, bom).
As dados na escala intervalar são de tipo quantitativo. Nesta escala, para além da operação da ordenação
é possível calcular diferenças entre os valores da variável. Nesta escala o valor zero (nulo) não significa
ausência da característica medida, representa apenas uma posição relativa na escala. Diz-se que o zero
nesta escala é um valor arbitrário e não absoluto. Por esse motivo não se pode calcular razoes (quocientes,
proporções) entre os valores da variável. Por exemplos: na medição da temperatura em graus Célsius, o
zero não significa ausência de temperatura; também não se pode dizer que 50ºC é duas vezes mais quente
que 25ºC e nem que 20º C é metade de 40º C. Resultados de testes de QI. Não se pode dizer que um
indivíduo com QI=0 não tem alguma inteligência. No calendário gregoriano, o ano zero não significa
ausência de tempo.
Os dados na escala de rácio são também de tipo quantitativo. Nesta escala, para além das operações da
ordenação e diferenças já é possível calcular quocientes (razões) entre os valores da variável. Nesta escala
o valor zero (nulo) significa ausência da característica medida. Diz-se que o zero nesta escala é um valor
absoluto representa a origem da escala.
Neste caso uma pessoa com 50 anos de idade tem o dobro da idade de uma pessoa com 25 anos; um saco
de arroz com 50 kg tem metade de peso de um saco com 100 kg; uma pessoa com zeros meticais significa
que não tem dinheiro.
Exercícios