You are on page 1of 10

1.

Introdução à Estatística
1

1.1 O que é Estatística?

Podemos encontrar várias definições para Estatística, algumas são as seguintes:

A Estatística é um conjunto de técnicas e métodos de recolha e tratamento de dados.

Estatística é um conjunto de instrumentos e procedimentos usados na recolha, descrição, exploração,


análise e interpretação de dados.

Estatística é a ciência que estuda as técnicas e métodos de colecta, organização, análise e interpretação
dados para a tomada de decisões.

Analisando estas definições pode-se notar que o objecto do estudo da Estatística são os dados.

Dados são um conjunto de valores ou ocorrências em um estado bruto com o qual são
obtidas informações com o objectivo de adquirir conhecimentos sobre um fenómeno (Wikipedia).

Dados brutos (raw data) designam os dados recolhidos e armazenados/arquivados tal qual foram
colectados, sem terem sofrido o menor tratamento. Apresentam-se como um conjunto de números,
caracteres, imagens ou outros símbolos.

Os dados são obtidos através de observações, contagens, medições e respostas.

Informação é a resultante do processamento, manipulação e organização de dados, de tal forma que


represente uma modificação (quantitativa ou qualitativa) no conhecimento do sistema (humano, animal ou
máquina) que a recebe.

Segundo Larson (2010:3), o uso de dados estatísticos remonta aos tempos da antiga Babilónia, no Egipto e
mais tarde, no Império Romano, quando os dados eram colectados sobre assuntos relacionados ao Estado,
tais como nascimentos e óbitos. A palavra estatística é derivada da palavra latina “status”, que em
português significa estado.

Actualmente a Estatística tem em várias áreas: Gestão empresarial, análises económicas, análises de
fenómenos sociais, demografia, meteorologia, entre outras.

A aplicação correcta das técnicas da Estatística na análise de um conjunto de dados permite extrair
informações importantes que poderão ser usadas para apoiar a tomada de decisões.

O termo estatística tem dois significados:

Atanasio Matsimbe Maputo, 2019


2

1º no plural (estatísticas) significa um conjunto de dados numéricos:

 Estatísticas educacionais
 Estatísticas de saúde
 Estatísticas económicas
 Estatísticas agrárias
 Estatísticas de um jogo
 Etc.

2º no singular e com inicial maiúscula (Estatística) significa uma ciência ou área de estudo como foi
definido anteriormente.

Como ciência a Estatística divide-se em duas grandes áreas: Estatística Descritiva e a Estatística
Inferencial (ou Inferência Estatística)

A Estatística Descritiva é a parte da Estatística que estuda as técnicas e métodos de recolha, organização,
apresentação, descrição e exploração de dados. Procura-se resumir e representar de forma compreensível a
informação contida num conjunto de dados. Esse processo adquire muita importância quando o volume de
dados for muito grande. Esse resumo faz-se através de construção de tabelas, gráficos e cálculos de
algumas medidas numéricas que representam coniventemente a informação contida nos dados.

A Inferência Estatística é a parte da Estatística que estuda as técnicas e métodos de estudo das
características de uma população através de amostras. Permite tirar conclusões sobre as características de
uma população a partir da análise dos dados de uma amostra seleccionada dessa população.

Para que as conclusões tiradas da amostra possam ser inferidas ou estendidas à toda a população a amostra
deve ser representativa da população onde foi seleccionada. Uma amostra representativa da população é
aquela que possui características similares as que observariam se toda a população fosse estudada.

A Teoria de Amostragem fornecem técnicas que permitem obter amostras representativas, realizar
inferências e controlar e medir o grau de incerteza que as conclusões possam conter. A base da Inferência
Estatística é a Teoria de Probabilidades.

Atanasio Matsimbe Maputo, 2019


3

1.2 Conceitos de População, Amostra, Censo e Amostragem

A Estatística é a ciência que estuda as técnicas de recolha, tratamento, análise e interpretação de dados
sobre as características de uma população para a tomada de decisões informadas. Esse estudo pode ser
feito usando toda a população ou uma parte da população (amostra).

Uma população é um conjunto universal de elementos (indivíduos, objectos, medições ou contagens)


sobre o qual se pretende estudar uma ou várias características comuns.

Amostra é uma parte ou subconjunto dos elementos de uma população seleccionados com o objectivo de
estudar uma ou várias características da população.

Os elementos da população chamam-se unidades estatísticas. Uma unidade estatística (ou unidade de
observação) é um elemento da população sobre o qual a informação é recolhida. No caso de populações
humanas as unidades de observação são os indivíduos.

Uma população pode ser finita ou infinita. Considera-se uma população infinita quando o número de
unidades estatísticas é infinito ou quando é tão grande que não podemos contar, como por exemplo:
População de peixe na Baia de Maputo; população de estrelas etc.

Quando o nº de elemento de uma amostra é menor que 30 diz-se que a amostra é pequena e quando é
maior ou igual a 30 a amostra é grande.

Atanasio Matsimbe Maputo, 2019


4

1.3 Variáveis

As características de uma população chamam-se variáveis. Uma variável é uma característica (ou
propriedade) comum de uma população que pode assumir valores diferentes dentro do seu domínio.

Por exemplo, uma população de trabalhadores pode ser caracterizada pelas seguintes variáveis:

 Sexo;
 Idade;
 Estado civil;
 Número de filhos;
 Anos de experiência;
 Grau académico;
 Categoria profissional;
 Salário mensal;

Tipos de variáveis

Dependendo do seu domínio, as variáveis podem ser classificadas em 2 grandes grupos: qualitativas e
quantitativas

As variáveis qualitativas são aquelas que tomam valores não numéricos.

Assim, no exemplo anterior as variáveis qualitativas são:

Sexo (M;F);

Estado civil (S; C; D; V)

Grau académico (Básico, Médio, Superior);

Categoria profissional (A; B; C)

Para facilitar o processamento informático costuma-se atribuir códigos numéricos

Assim, no exemplo anterior temos:

Sexo (1=M; 2=F);

Atanasio Matsimbe Maputo, 2019


5

Estado civil (1=S, 2=C; 3=D; 4=V)

Mas os códigos atribuídos não tem significados numéricos, pelo que não se pode aplicar operações
matemáticas (adição, multiplicação etc.) com esses códigos.

As variáveis qualitativas ainda se podem classificar em variáveis qualitativas nominais e qualitativas


ordinais:

As variáveis qualitativas nominais são aquelas cujos valores são nomes, categorias, rótulos e etiquetas.

Exemplo:

Sexo (M;F);

Estado civil (S; C; D; V)

Nesta classe, não se pode estabelecer uma ordem de grandeza entre os valores da variável.

As variáveis qualitativas ordinais são aquelas em que se pode estabelecer uma certa ordem de grandeza
entre os valores da variável.

Exemplo:

Grau académico (Básico, Médio, Superior);

Categoria profissional (A; B; C).

As variáveis quantitativas são aquelas que podem tomar valores numéricos resultantes de contagem ou
de medições.

Ex: idade, número de filhos; anos de experiência; salário mensal.

Por sua vez as variáveis quantitativas classificam-se em discretas e contínuas:

Atanasio Matsimbe Maputo, 2019


6

As variáveis quantitativas discretas: tomam valores numéricos num conjunto finito ou infinito
enumerável. Normalmente são obtidos através de processos de contagem.

Ex: número de filhos (0; 1; 2;....);

As variáveis quantitativas contínuas podem tomar qualquer valor numérico dentro de um intervalo
infinito fechado ou aberto. Este tipo de variáveis normalmente é obtido através de processos de medição.

Exemplo: Salário mensal

Atanasio Matsimbe Maputo, 2019


7

Escalas de mensuração

Para uma aplicação adequada das técnicas estatísticas para além do tipo de variáveis é necessário conhecer
a escala de mensuração (medição) das variáveis. Quanto a escala de mensuração as variáveis
enquadram-se em 4 níveis seguintes: Nominal, ordinal, intervalar e de razão (rácio).

Os dados na escala nominal são qualitativos categorizados por nomes ou rótulos. Neste nível de escala
não se pode estabelecer uma relação de ordem entre os valores das variáveis e muito menos cálculos
matemáticos, exemplos: sexo (M/F); raça; religião etc.

Os dados nominais podem ser atribuídos códigos numéricos para facilitar o processamento informático
mas esses números não tem valor numérico. Por exemplos, números que se usam para identificar os
jogadores de futebol; os nuits, nº de estudante, estradas, casas etc.

Os dados escala ordinal são qualitativos mas já é possível estabelecer uma relação de ordem entre os
valores das variáveis mas também não se pode fazer cálculos matemáticos. Exemplos, classificação dos
estudantes em (mau; bom; excelente); estado de um doente (grave, melhor, bom).

As dados na escala intervalar são de tipo quantitativo. Nesta escala, para além da operação da ordenação
é possível calcular diferenças entre os valores da variável. Nesta escala o valor zero (nulo) não significa
ausência da característica medida, representa apenas uma posição relativa na escala. Diz-se que o zero
nesta escala é um valor arbitrário e não absoluto. Por esse motivo não se pode calcular razoes (quocientes,
proporções) entre os valores da variável. Por exemplos: na medição da temperatura em graus Célsius, o
zero não significa ausência de temperatura; também não se pode dizer que 50ºC é duas vezes mais quente
que 25ºC e nem que 20º C é metade de 40º C. Resultados de testes de QI. Não se pode dizer que um
indivíduo com QI=0 não tem alguma inteligência. No calendário gregoriano, o ano zero não significa
ausência de tempo.

Os dados na escala de rácio são também de tipo quantitativo. Nesta escala, para além das operações da
ordenação e diferenças já é possível calcular quocientes (razões) entre os valores da variável. Nesta escala
o valor zero (nulo) significa ausência da característica medida. Diz-se que o zero nesta escala é um valor
absoluto representa a origem da escala.

Exemplos: altura, peso, notas, tempo etc.

Atanasio Matsimbe Maputo, 2019


8

Neste caso uma pessoa com 50 anos de idade tem o dobro da idade de uma pessoa com 25 anos; um saco
de arroz com 50 kg tem metade de peso de um saco com 100 kg; uma pessoa com zeros meticais significa
que não tem dinheiro.

Atanasio Matsimbe Maputo, 2019


9

Exercícios

1. Procure alguns exemplos de aplicação de Estatística publicados num jornal, relatórios ou


outros documentos.
2. Apresente um exemplo de utilização da Estatística na sua área de formação.
3. Explique a diferença entre uma população e uma amostra. Dê um exemplo.
4. O Ministério da Educação, contratou um investigador educacional para avaliar a eficácia de um
novo programa de ensino de leitura e escrita para alunos do ensino primário do 1º grau. Para o
efeito, o investigador selecciona 1200 alunos da 5ª classe e submete-os a uma prova de escrita
através de um ditado com a cotação de 0 a 20 valores e uma prova de leitura avaliada em mau,
bom e muito bom.
a) Indique a população desse estudo?
b) Identifique as variáveis de interesse e os respectivos tipos.
c) Qual a amostra para esse estudo?
d) Explique por que razão se usou uma amostra em vez do censo.
5. Identifique o tipo e a escala de cada uma das seguintes variáveis:
a) Idade do aluno
b) Sexo do aluno
c) Nº de irmãos
d) Classe que frequenta
e) Nº de alunos da escola
f) Tamanho do quadro (pequeno, médio, grande)
g) Comprimento da sala
h) Notas dos alunos
i) Resultado final (excluído, aprovado, reprovado)
j) Modalidade do ensino (presencial, semi-presencial, a distancia)
k) Temperatura da sala em graus Célsius.

Atanasio Matsimbe Maputo, 2019

You might also like