WEB aula 1

Dados: São os valores da variável em estudo, obtidos por meio de uma amostragem. Os dados são do mesmo do tipo que as variáveis, por exemplo, uma variável discreta produz dados discretos. Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados ou dados brutos. Exemplo: 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: É a tabela obtida após a ordenação dos dados brutos (de forma crescente ou decrescente). Exemplo: 41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 A Estatística é dividida basicamente em duas áreas: Estatística Descritiva e Inferencial. No nosso curso serão abrangidas ambas as áreas conforme veremos. Estatística Descritiva: Os objetivos da estatística descritiva envolvem coleta, organização e descrição de um conjunto de dados quantitativos ou qualitativos. Com a construção de gráficos, tabelas e com o cálculo de medidas com base em uma coleção de dados numéricos, poderemos compreender melhor o comportamento da variável expressa no conjunto de dados sob análise. Estatística Inferencial: È a área da estatística responsável pela análise e interpretação dos dados, associado a uma margem de incerteza. Nesta fase, são empregados métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais.

1º Fase - Definição do Problema, Definir Objetivos: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema inicial. 2º Fase - Planejamento da pesquisa: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Cronograma de atividades? Custos envolvidos? Etc... Segue abaixo algumas perguntas que precisam ser respondidas no planejamento de um levantamento de dados estatísticos
o o o

O quê? – Características a serem observadas: VARIÁVEIS Quem? – Os elementos a serem pesquisados: POPULAÇÃO / AMOSTRA Como? – O instrumento de coleta de dados: MÉTODO DE AMOSTRAGEM A SER UTILIZADO, QUESTIONÁRIO /ENTREVISTA ESTRUTURADA, ETC.

3º Fase - Execução da Pesquisa, Coleta de Dados: Fase operacional. É o registro sistemático de dados, focando o objetivo determinado inicialmente.
o

Dados primários (coleta direta): Quando são publicados pela própria pessoa ou organização que os tenha coletados. Exemplos: Tabelas do censo demográfico do IBGE, uma empresa realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. Dados secundários (coleta indireta): Quando são publicados por outra organização.Exemplo: Quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.

o

Observação: É mais seguro trabalhar com dados primários. O uso de dados secundários traz o grande risco de erros de transcrição. 4º Fase - Apuração dos Dados: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. 5º Fase - Análise e Apresentação dos Dados: Há duas formas de apresentação, que não se excluem mutuamente:
o

Apresentação de dados em tabelas - É uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, construídas segundo normas técnicas citadas pelaFundação Instituto Brasileiro de Geografia e Estatística (IBGE, 1993) Apresentação gráfica dos dados numéricos - constitui uma apresentação gráfica permitindo uma visão rápida e clara da variável estudada.

o

6º Fase - Interpretação dos Dados e Conclusões Obtidas a partir dos dados (estatística inferencial): A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever a variável estudada. Uma tabela deve apresentar a seguinte estrutura:
  

Cabeçalho; Corpo; Rodapé;

O cabeçalho da tabela especifica o conteúdo das colunas, com palavras claras e concisas, sem abreviações. Deve conter o suficiente para que sejam respondidas as questões: O que está representado (fato)? Onde ocorreu (local)? Quando ocorreu (tempo)? O corpo da tabela é representado por colunas e subcolunas dentro dos quais serão registrados os dados numéricos e informações.

O rodapé é reservado para observações pertinentes à tabela, bem como para registro e identificação da fonte de dados. A fonte dos dados é a entidade responsável pelos dados numéricos, deverá ser colocada na parte inferior, por extenso, precedida da palavra Fonte ou Fontes (IBGE, 1993). As notas esclarecem aspectos relevantes do levantamento dos dados

Conforme critério de agrupamento as tabelas podem representar diversas séries estatísticas que são descritas a seguir. a) Série Cronológica É a série estatística em que todos os dados são observados segundo a época de ocorrência. Nesta série a variável é o tempo, sendo que o fato e o local permanecem fixos. A Tabela 02 apresenta um exemplo de tabela que descreve uma série cronológica. Tabela 02. Vendas da Companhia Alfa – 2004 - 2008

Fonte: Departamento e Marketing da Companhia Alfa (Dados Fictícios) b) Série Geográfica ou de Localização É a série estatística em que os dados são observados segundo a localidade de ocorrência. Neste tipo de série a variável é o local e são fixos o fato e a época. Exemplo - Tabela 03. Tabela 03. Vendas de Computadores por Empresa – 2006 (Alagoinhas – Bahia)

Fonte: Dados Fictícios c) Série Específica

É a série estatística em que os dados são agrupados segundo a modalidade de ocorrência, ou seja, varia o fato e permanece constante a época e o local. Exemplo (Tabela 04) Tabela 04. Regime de Trabalho dos Professores de Química – 2010 (Londrina – Jd Piza)

Fonte: Coordenadoria de Recursos Humanos (Unopar) d) Distribuição de Frequências È uma série estatística em que os dados são agrupados com suas respectivas frequências absolutas. Nas tabelas de distribuição de frequências, é usual fornecer a proporção (frequência relativa) de unidades que caem em cada categoria. A frequência relativa é dada por:

Apresentação de Dados Qualitativos: Quando observamos dados qualitativos, classificamos cada unidade da amostra em uma dada categoria. A idéia é resumir as informações na forma de uma tabela que mostre as contagens (frequências) em cada categoria, obtendo então uma tabela de distribuição de frequência. A Tabela 05 apresenta um exemplo de distribuição de frequência de dados qualitativos. Tabela 05. Opinião dos consumidores sobre determinado produto

Fonte: Dados Fictícios

Apresentação de Dados Quantitativos: Os dados numéricos são apresentados na ordem em que são coletados. Dados numéricos podem ser apresentados em tabelas de distribuição de frequências (com ou sem intervalos de classe) conforme veremos a seguir. Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Exemplo - Tabela 06. Tabela 06. Distribuição do número de faltas de 30 empregados de uma determinada empresa no semestre.

Fonte: Dados Fictícios Para uma amostra de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Tabelas com grande número de dados não oferecem ao leitor visão rápida e global do fenômeno. Por esta razão, tanto dados discretos quanto contínuos, desde que em grande número, devem ser apresentados em tabelas de distribuição de frequência com intervalos de classes, conforme veremos a seguir. Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado, é mais indicado efetuar o agrupamento dos valores em vários intervalos de classe. Para construir uma tabela de distribuição de frequência com intervalos de classe siga os procedimentos a seguir. Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado, é mais indicado efetuar o agrupamento dos valores em vários intervalos de classe. Para construir uma tabela de distribuição de frequência com intervalos de classe siga os procedimentos a seguir. 1º Passo) Organize os dados brutos em um ROL; 2º Passo) Encontre o valor máximo e mínimo do conjunto de dados e calcule a Amplitude Total (A), que a diferença entre os valores máximo e mínimo, portanto:

3º Passo) Calcule o número de classes (K): O número de classes de uma representação será um número inteiro próximo de K, que pode ser obtido por vários métodos, sendo os mais usuais:

Regra de Sturges:

Onde: K é o número de classes, e n é o número de dados (tamanho da amostra). O indicado é sempre o arredondamento do valor de K obtido para um valor mais alto. Observação: O cálculo de K por meio de fórmulas pode servir como referência, mas não deve ser entendido como obrigatório. 4º Passo) Decidido o números de classes, calcule então o tamanho do intervalo de classe (h), que é definido por:

Assim como no caso do número de classes (K), o tamanho do intervalo de classe (h) deve ser aproximada para o maior valor inteiro. Por exemplo, assim, se K=6,61, usa-se K=7; e h=1,7, usa-seh=2. 5º Passo) Organize as classes, de maneira que a primeira contenha o menor valor observado. O primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe anterior Exemplo (Construção de uma tabela de distribuição de frequência com intervalos de classe): Vamos construir uma tabela de distribuição de freqüências das idades dos funcionários de uma amostra de 50 elementos selecionados de uma empresa.

Dados Brutos:

1º Passo) A partir dos dados brutos construir o ROL (ordenação dos dados em ordem crescente)

2º Passo) Determinar a Amplitude Total (A):

3º Passo) Como os dados serão agrupados em classes, é preciso escolher o número de classes (K):

Pela Regra de Sturges temos que: portanto:

, sendo que n=50,

4º Passo) Cálculo do Tamanho do intervalo de classe (h):

Quanto aos limites das classes, utilizaremos o seguinte critério a l - b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b). A Tabela 07 mostra um exemplo de uma tabela de distribuição de frequência para variável contínua. Tabela 07. Distribuição de frequências que representa a idade dos funcionários de certa empresa (n=50)

APRESENTAÇÃO DE DADOS EM GRÁFICOS Gráficos ajudam a visualizar a distribuição das variáveis. Nesta etapa serão apresentadas as formas de apresentar dados em gráficos, seguindo as normas nacionais ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). Todo gráfico deve apresentar título e escala. O título deve ser colocado abaixo do gráfico. As escalasdevem ser crescentes da esquerda para a direita e de baixo para cima. Gráficos de Linhas e Dispersão Os gráficos de linhas e dispersão exibem uma série como um conjunto de pontos conectados por uma única linha. As linhas dos gráficos são usadas para representar grandes quantidades de dados que ocorrem em um período de tempo contínuo. É o gráfico que melhor representa a evolução conjunta de duas variáveis quantitativas, sendo que X é considerada a variável independente e Y a variável dependente. A Figura 01 mostra um gráfico de linhas que contém três séries.

Figura 01: Gráfico de Linhas (Exemplo) Gráficos de Colunas e Barras No gráfico de colunas as barras são apresentadas na posição vertical. Para ilustrar o gráfico de colunas serão utilizados os dados apresentados na Tabela 05, originando assim a Figura 02 (gráfico de colunas com linhas auxiliares – grades e rótulos).

Figura 02: Opinião dos consumidores sobre determinado produto (Gráfico de Colunas)

No gráfico de barras, as barras são apresentadas na posição horizontal, como apresentado na Figura 03.

Figura 03: Opinião dos consumidores sobre determinado produto (Gráfico de Barras) Gráficos de Setores É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado quando se pretende comparar cada valor da série com o total. A partir dos dados apresentados na Tabela 02, foi obtido o gráfico de setores apresentado na Figura 04.

Figura 04. Vendas da Companhia Alfa – 2004 - 2008 (Gráfico se setores)

Histograma É o gráfico que melhor apresenta as frequências de uma variável quantitativa contínua agrupada em classes. Quando os dados são contínuos e a amostra é grande é mais conveniente condensar os dados, isto é, organizar uma tabela de distribuição de frequências, agrupar os dados em classes e a partir desta desenhar um histograma. O histograma é a representação gráfica de uma distribuição de frequência, formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe.

Figura 05. Histograma para idade de 50 funcionários de certa empresa O histograma dispõe de informações de modo que seja possível a visualização da forma de distribuição do conjunto de dados e também a percepção do valor central e da dispersão dos dados em torno deste valor central. Pelos dados da Figura 04 fica fácil perceber que a maior quantidade de funcionários tem idade entre 32 e 38 anos.