You are on page 1of 11

ESTATÍSTICA

Estatística

Estatística é a ciência que utiliza-se das teorias probabilísticas para explicar a frequência da
ocorrência de eventos,[1] tanto em estudos observacionais quanto em experimentos
para modelar a aleatoriedade e a incerteza de forma a estimar ou possibilitar a previsão de fenômenos
futuros, conforme o caso.

A estatística é uma ciência que se dedica à coleta, análise e interpretação de dados. Preocupa-se com
os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como
tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor
compreender as situações.

Algumas práticas estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação
de observações. Dado que o objetivo da estatística é a produção da melhor informação possível a
partir dos dados disponíveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.

Devido às suas raízes empíricas e seu foco em aplicações, a estatística geralmente é considerada uma
disciplina distinta da matemática, e não um ramo dela.

Etimologia

O termo "estatística" surge da expressão em latim statisticum collegium palestra sobre os assuntos
do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado",
ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi
proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Jena e
adotada pelo acadêmico alemão Godofredo Achenwall. Aparece como vocabulário na Enciclopédia
Britânica em 1797, e adquiriu um significado de coleta e classificação de dados, no início do século
XIX.

De acordo com a Revista do Instituto Internacional de Estatística, Cinco homens, Hermann
Conring, Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William Petty já receberam a
honra de serem chamados de fundadores da estatística por diferentes autores.[4]

Alguns autores dizem que é comum encontrar como marco inicial da estatística a publicação
do "Observations on the Bills of Mortality" (Observações sobre os Censos de Mortalidade, 1662) de
John Graunt. As primeiras aplicações do pensamento estatístico estavam voltadas para as
necessidades de Estado, na formulação de políticas públicas, fornecendo
dados demográficos e econômicos. A abrangência da estatística aumentou no começo do século XIX
para incluir a acumulação e análise de dados de maneira geral. Hoje, a estatística é largamente
aplicada nas ciências naturais, e sociais, inclusive na administração pública e privada.

Seus fundamentos matemáticos foram postos no século XVII com o desenvolvimento da teoria das
probabilidades por Pascal e Fermat, que surgiu com o estudo dos jogos de azar. O método dos
mínimos quadrados foi descrito pela primeira vez por Carl Friedrich Gauss, aproximadamente no ano
de 1794. O uso de computadores modernos tem permitido a computação de dados estatísticos em
larga escala e também tornaram possível novos métodos antes impraticáveis.

Fundamentos

Ligações para estatística observacional fenômeno são coletados pelos fenômenos estatísticos.

• Estatística inferencial é o conjunto de técnicas utilizadas para identificar relações entre variáveis que
representem ou não relações de causa e efeito;

• Estatística robusta é o conjunto de técnicas utilizadas para atenuar o efeito de outliers e preservar a
forma de uma distribuição tão aderente quanto possível aos dados empíricos.

A estatística não é uma ferramenta matemática que nos informa sobre o quanto de erro nossas
observações apresentam sobre a realidade pesquisada. A estatística baseia-se na medição do erro
que existe entre a estimativa de quanto uma amostra representa adequadamente a população da qual
foi extraída. Assim o conhecimento de teoria de conjuntos, análise combinatória e cálculo são

WWW.DOMINACONCURSOS.COM.BR 1

A revolução informática também tem levado a um aumento na ênfase na estatística "experimental" e "empírica". Estatística Computacional O crescimento rápido e sustentados no poder de processamento dos computadores a partir da segunda metade do século XX teve um forte impacto na prática da estatística. Nós descrevemos o nosso conhecimento de forma matemática e tentamos aprender mais sobre aquilo que podemos observar.BR 2 . Entretanto. causaram um aumento do interesse nos modelos não- lineares (especialmente redes neurais e árvores de decisão) assim como na criação de novos tipos. a estatística tem como objetivo principal fornecer ferramentas que ao serem utilizadas permite lidarmos com situações sujeitas a incertezas. Entretanto. processamento.obter um consenso sobre o que as observações nos dizem sobre o mundo que observamos. mas os computadores modernos. A faceta dessa ferramenta mais palpável é a estatística descritiva. nomeadamente mineração de dados (data mining). É o erro (erro amostral) que define a qualidade da observação e do delineamento experimental.COM. Normalmente aproximamos a probabilidade de alguma coisa para cima ou para baixo porque elas são tão prováveis ou improváveis de ocorrer. riquezas. enquanto técnicas como a amostragem de Gibbs tem feito com que os métodos de Bayes fiquem mais fáceis. ESTATÍSTICA indispensáveis para compreender como o erro se comporta e a magnitude do mesmo. coleta de dados. como o modelo linear generalizado e o modelo multi-nível. Portanto. como testes de permutação e bootstrap. A descrição dos dados coletados é comumente apresentado em gráficos ou relatórios e serve tanto a prospecção de uma ou mais variáveis para posterior aplicação ou não de testes estatísticos bem como a apresentação de resultados de delineamentos experimentais. O crescente aperfeiçoamento e desenvolvimento da estatística no decorrer da história sempre visaram à melhora nos processos de obtenção e recolhimento de informações. entre outras situações que levassem ao enfraquecimento do poderio militar dos povos. representações gráficas. análise e divulgação das informações.DOMINACONCURSOS. casos de doenças. se você espera atravessar uma estrada 105 ou 106 vezes na sua vida. Os governantes passaram a realizar pesquisas WWW. Isto requer: • O planejamento das observações por forma a controlar a sua variabilidade (concepção do experimento). A Estatística é o ramo da Matemática responsável por métodos e técnicas de pesquisa envolvendo experimentos. uma probabilidade de 10−4 e uma de 10−9. O aumento na capacidade de computação também tem levado à popularização de métodos que demandam muitos cálculos baseados em reamostragem (em inglês e no jargão do meio resampling). Os povos da Antiguidade utilizavam das técnicas estatísticas a fim de obter informações sobre o número de habitantes. • Sumarização da coleção de observações. Em algumas formas de estatística descritiva. os segundo e terceiro passos tornam-se normalmente mais importantes que o primeiro. isso pode levar a desentendimentos e comportamentos perigosos. Um grande número de softwares estatísticos. um risco de 10−4 significa que é bem provável que você tenha um acidente. de uso tanto geral como específico estão disponíveis no mercado. • Inferência estatística . fatos. junto com algoritmos numéricos apropriados.01% pareça muito baixo. A probabilidade de um evento é definida como um número entre zero e um. a despeito da grande diferença numérica entre elas. porque é difícil distinguir entre. Por exemplo. permitindo o estudo adequado de diversos fenômenos. mesmo que intuitivamente um risco de 0. definir o risco de atravessá-la em 10−9 significa que você está bem seguro pelo resto da sua vida. eventos e ocorrências nas diversas áreas do conhecimento humano. que é fácil de reconhecê-las como probabilidade de um ou zero. Os modelos estatísticos mais antigos eram quase sempre lineares.

Por exemplo. Monta banco de dados para os mais diversos usos. medições e análise desses dados. ou densidade de uma variável aleatória contínua. órgãos como o IBGE (Instituto Brasileiro de Geografia e Estatística) e instituições como a FGV (Fundação Getúlio Vargas) têm por objetivo a coleta. Em vez disso. ou ainda pode ser uma função massa de probabilidade (FMP). Os levantamentos estatísticos são divulgados em jornais. educacional. social. A probabilidade da variável aleatória cair em uma faixa particular é dada pela integral da densidade dessa variável sobre tal faixa . a FMP é usada no contexto de variáveis aleatórias discretas (variáveis aleatórias que tenham valores de um conjunto discreto).BR 3 . No entanto. e (0. poderíamos perguntar: qual é a probabilidade de que a bactéria morra entre 5 horas e 5. A função densidade pode ser obtida a partir da função distribuição acumulada a partir da operação de derivação (quando esta é derivável). enquanto FDP é usado no contexto de variáveis aleatórias contínuas. a análise e a interpretação de dados numéricos no estudo de fenômenos naturais. Existem outras confusões da terminologia porque função densidade também tem sido usado para o que é aqui chamado de função massa de probabilidade (FMP). Organiza. Formalmente.isto é. denotada por fx(x). Ele planeja e coordena o levantamento de informações por meio de questionários. analisa e interpreta os resultados para explicar fenômenos sociais. segurança.DOMINACONCURSOS.01 horas entre 5 e 5. econômicos e sociais. a função densidade de probabilidade (ou fdp). A probabilidade de que a bactéria morre entre 5 horas e 5. alimentos.001 horas? A resposta é provavelmente em torno de 0. pois envolvem temas relacionados a hábitos da população em geral. produção de bens. comumente possuem relação direta com a vida das pessoas. uma vez que este é um décimo do intervalo anterior.02 de morte no intervalo de 0. acompanha testes de qualidade e ajuda a fazer a previsão de vendas com base em modelos matemáticos. há uma probabilidade de 0. a função densidade de probabilidade (FDP).0001 horas é provavelmente cerca de 0. x+dx] tem probabilidade f(x) dx. Nestes três exemplos. e igual a 2 por hora (ou 2 horas-1).01 horas. Na indústria. porém. função de distribuição de probabilidade pode ser utilizado quando a distribuição de probabilidade é definida como uma função sobre conjuntos de valores. noticiários de televisão e revistas. Se uma variável aleatória tem densidade dada por f(x).COM. saúde e diversos ramos da sociedade. A seguir: qual é a probabilidade de que a bactéria morra entre 5 horas e 5. Em outras fontes. entrevistas.02 de WWW. esse uso não é padrão entre estatísticos. ESTATÍSTICA estatísticas referentes às variáveis econômicas: comércio. Qual é a probabilidade de que uma bactéria viva exatamente 5 horas? A resposta é de 0%. análise e divulgação de informações relacionadas ao meio político. e assim por diante. A função densidade de probabilidade é não negativa sempre. No Brasil. Em geral. Internet. mas não há nenhuma chance de que qualquer bactéria morra em exatamente 5. ou pode referir- se a função distribuição acumulada. exportações de produtos entre outras.002.0002. a relação (probabilidade de morrer durante um intervalo)/(período de duração do intervalo) é aproximadamente constante. então o intervalo infinitesimal [x. O estatístico é um especialista no ramo da matemática voltado para a coleta. de uma variável aleatóriacontínua X é a função que satisfaz Os termos função distribuição de probabilidade e função de probabilidade por vezes foram sido utilizados para denotar a função de densidade de probabilidade.02 (ou seja. econômicos ou naturais. 2%). em vez de densidade. Em teoria das probabilidades e estatística. é dada pela área abaixo da função densidade mas acima do eixo horizontal e entre o menor e o maior valor dessa faixa. Exemplo Suponhamos que uma espécie de bactérias normalmente vive por 4 a 6 horas.000000000 horas. e sua integral sobre todo o espaço é igual a um.01 horas? Vamos dizer que a resposta é de 0. Muitas bactérias vivem por aproximadamente 5 horas. e ajudar na tomada de decisões em empresas públicas e privadas. é uma função que descreve a probabilidade relativa de uma variável aleatória tomar um valor dado. econômico.

2. A função massa de probabilidade de uma variável aleatória discreta é a densidade no que diz respeito à medida contável sobre o espaço da amostra (normalmente o conjunto de números inteiros. chegaremos ao seguinte: Ou seja. ao contrário. Por exemplo.DOMINACONCURSOS. que serve para o caso de variáveis aleatórias discretas.6 × 1012 nanossegundos = 1 hora). Por exemplo. mas uma melhor resposta pode ser escrita como (2 horas- 1 ) dt. Portanto. mas inútil. Por exemplo. se simplesmente tentarmos calcular p(x=x) como faz uma função de probabilidade para uma variável aleatória discreta. a medida de referência é a medida de Lebesgue. tem um número infinito de ocorrências. a variável aleatória "idade de cada empregado de uma empresa" pode assumir infinitos valores. e sim com intervalos infinitesimais . A integral de f sobre qualquer janela de tempo (não apenas janelas infinitesimais. 30. é preciso entender bem a diferença entre eles. quando ela existe. Esta quantidade de 2 horas-1 é chamada de densidade de probabilidade para a morte em cerca de 5 horas. 20. não se pode escolher a medida contável como uma referência para uma variável aleatória contínua). isto é. ESTATÍSTICA probabilidade / 0. 18. o mesmo vale para conjuntos finitos e contáveis. Além disso. a função de probabilidade a ela associada também só pode assumir 6 valores (1/6 cada uma.5 e 6. a "função densidade de probabilidade" não trabalha com valores pontuais. Existe uma função de densidade de probabilidade com f sendo f (5 horas) = 2 horas-1. que necessariamente somarão 1.1 anos. a probabilidade de que ela viva por mais do que 5 horas. a probabilidade de a variável aleatória contínua X assumir um determinado valor x é zero.ela informa a probabilidade de a variável X assumir um valor naquele intervalo. a densidade é em quase todos os lugares únicas. mas menos do que (5 horas + 1 nanossegundo). Por isso. nem a distribuição de Cantor. não atribui probabilidade positiva para qualquer ponto individual. Uma variável aleatória contínua. mas também grandes janelas) é a probabilidade de que a bactéria morra nessa janela. Uma variável aleatória discreta tem um número definido de possíveis ocorrências. se o dado não for viciado).01 horas) = 2 horas-1. Se uma distribuição de probabilidade admite uma densidade.341 anos. a variável aleatória "resultado de um dado" tem apenas 6 possíveis ocorrências: 1. No caso univariado contínuo acima. Note-se que não é possível definir uma densidade referindo a uma medida arbitrária (por exemplo. Por isso. é (2 horas-1) x (1 nanosegundo) ≃ 6 × 10-13 (usando a conversão de unidade 3. WWW. ou um subconjunto dos mesmos).COM.BR 4 . No entanto. mesmo ela não tendo qualquer componente discreto. Diferença entre "função de probabilidade" e "função densidade de probabilidade" O conceito de "função densidade de probabilidade" é muito semelhante ao conceito de "função de probabilidade". Esta é a probabilidade de que a bactéria morra dentro de um pequeno (infinitesimal) a janela de tempo de cerca de 5 horas. Por isso. é 0. Duas densidades de probabilidade f e g'’ representam precisamente a mesma distribuição de probabilidade se eles diferem apenas em um conjunto com medida de Lebesgue zero.3167 anos etc. a resposta literalmente correta. por exemplo 18. Nem toda distribuição de probabilidade tem uma função densidade: as distribuições de variáveis aleatórias discretas não possuem.23 anos.4. em resposta à pergunta qual é a probabilidade de que a bactéria morra em 5 horas?. onde dt é a duração da janela.3. então a probabilidade de cada conjunto de um ponto {a} é zero.

são partes do fator de normalização de uma distribuição (o fator multiplicativo que garante que a área sob a densidade . a expressão acima permite determinar características estatísticas de uma variável discreta (tais como a sua média e variância). denotada. os parâmetros são constantes e termos de uma função densidade que contêm apenas os parâmetros.BR 5 . este espaço de amostra é o domínio da família de variáveis aleatórias que esta família de distribuições descreve. para se obter uma caracterização de uma variável aleatória diferente na família. o estimador para a média da população é a média amostral. considere uma variável aleatória discreta binária tendo uma distribuição de Rademacher – isto é. Famílias De Densidades É comum para funções densidade de probabilidade (e funções massa de probabilidade) serem parametrizadas. Em geral utiliza-se um estimador (caso particular de estatística) para chegar num valor numérico que estima um parâmetro. Este termo provém do primeiro uso da estatística eu tinha como função o registro de dados (nº de habitantes da população.COM. serem caracterizadas por parâmetros não especificados. Do ponto de vista de uma dada distribuição.. Por exemplo. ESTATÍSTICA No campo da física estatística. que não é calculável da amostra. é mais complicado e exige mais trabalho: consulte a seção abaixo sobre a mudança de variáveis. a média amostral é uma estatística. Isso unifica substancialmente o tratamento de distribuições de probabilidade discretas e contínuas. Este termo é utilizado usualmente tanto para a função quanto para o particular valor numérico da função aplicada a uma dada amostra observada. tirando conclusões sobre o conjunto todo a partir de amostras representativas. Uma boa definição de estatística é a de ser um conjunto de métodos especialmente apropriados à WWW.) e a elaboração de tabelas e gráficos para descrever resumidamente um determinado país em números. re parametrizar uma densidade em termos de diferentes parâmetros. Um determinado conjunto de parâmetros descreve uma única distribuição dentro da família compartilhando a forma funcional da densidade. tornando-se uma ampla e complexa ciência. Por exemplo. Por exemplo. nº de casamentos. A palavra estatística é do latim e significa “estado”.a probabilidade de algo no domínio ocorrer . no entanto. mas não variáveis. Ligação Entre Distribuições Discretas E Contínuas É possível representar certas variáveis aleatórias discretas. É importante ter em mente a diferença entre o domínio de uma família de densidades e os parâmetros da família. enquanto que a média de uma população é um parâmetro. Este fator de normalização é fora do kernel da distribuição. Uma vez que os parâmetros são constantes. significa simplesmente substituir os novos valores de parâmetros para a fórmula em lugar dos antigos. usando a função delta de Dirac. a Teoria Estatística define uma estatística como uma função de uma amostra em que a função por si mesma é independente da distribuição que gerou a amostra. isto é. bem como variáveis aleatórias que envolvem tanto uma parte contínua e uma parte discreta com uma função densidade de probabilidade generalizada. Passado muito tempo a estatística evoluiu. Alterar o domínio de uma densidade de probabilidade. a partir das fórmulas dadas para uma distribuição contínua da probabilidade. Diferentes valores dos parâmetros descrevem diferentes distribuições de diferentes variáveis aleatórias no mesmo espaço de amostra (o mesmo conjunto de todos os valores possíveis da variável). Uma estatística não representa o mesmo conceito que um parâmetro estatístico. Uma estatística é uma função (qualquer) das variáveis observáveis que não contém qualquer parâmetro desconhecido. Por exemplo. com probabilidade ½ cada.é igual a 1). assumindo valores −1 ou 1. uma reformulação não formal da relação acima entre a derivada da função distribuição acumulada e a função densidade de probabilidade é geralmente utilizada como a definição da função densidade de probabilidade. Mais formalmente.DOMINACONCURSOS. No exemplo anterior. a distribuição normal é parametrizada em termos da média e da variância..

a). Nesse post vou mostrar como é possível calcular a função densidade de probabilidade via Fast-Fourier Transform (FFT).COM. tendo como objetivo a compreensão de uma realidade específica para a tomada da decisão. mas pode ser escrita por meio de sua função característica (Rachev e Mittnik. em geral.BR 6 . Doganoglu e Chenyao (1999). porque incluem a distribuição normal como um caso especial. mas sim aplicações específicas de estatística em determinadas áreas. -A aplicação dos testes de hipótese em relação aos parâmetros. Distribuições estáveis paretianas têm propriedades atraentes para modelagem empírica em finanças. resumo e descrição). a sintetização e a apresentação de dados. mas também pode permitir caudas mais pesadas e assimetria. em geral. A distribuição alfa-estável. A Estatística Pode Ser Dividida Em Duas: -Estatística descritiva: é a parte que procura os melhores métodos para coletar. -A análise da relação entre duas ou mais variáveis. não há expressão de "forma fechada" para a a função de densidade de probabilidade.DOMINACONCURSOS. ESTATÍSTICA coleta. -Estatística experimental: é a parte que fornece os métodos de análise e interpretação dos resultados dos experimentos. a função é dada por: __________________________________________________________________________________ __________________________________________________________________________________ WWW. Mais precisamente a estatística se preocupa com: -A coleta. Apesar de a estatística se preocupar em obter informações sobre a população. à apresentação (organização. O trabalho original sobre esse assunto foi produzido por Mittnik. Não existem estatísticas especiais. a organização. A estatística trabalha com dois conjuntos de dados: o universo e a amostra. como bioestatística e estatística econômica.d. dificilmente ela estuda todos os componentes da mesma (censo). é o parâmetro de assimetria. e que as aproximações numéricas computacionais são não-triviais e computacionalmente extensivas. o que leva a dividir a estatística especificamente para questões didáticas.d. -A estimativa dos parâmetros da população e a determinação da precisão das estimativas. à análise e à interpretação de dados de observação. Uma razão principal para a pouca utilização dessa distribuição em trabalhos acadêmicos aplicados é devido ao fato de que.p) ou ainda para a sua função distribuição acumulada (f. A Distribuição Alfa-Estável. é o parâmetro de escala e é o parâmetro de locação. 2000 ): onde é o expoente da distribuição ou índice de cauda. ordenar e sumarizar os dados dos experimentos. não possui expressão analítica para sua função densidade de probabilidade (f. -A medição da variação nos dados e levantamento de dados.

DOMINACONCURSOS. WWW.). A função densidade de probabilidade pode ser aproximada utilizando o método FFT (Fast Fourier Transform) o qual é computacionalmente eficiente e permite um processo de aproximação mais rápido do que expansão por séries (Bergström. segue uma distribuição normal. 5 em 10. 2001. a frequência relativa deste intervalo.COM. sendo também substituída por algumas palavras como “sorte”. o qual é um resultado fundamental em aplicações práticas e teóricas. Por exemplo. “duvidoso”. As probabilidades podem ser expressas de diversas maneiras. Mittnik e Doganoglu (1999) sugerem que os valores de e devem ser respectivamente e para que uma boa aproximação seja possível. menores são as chances de ocorrer o resultado e quanto mais próxima de um for a probabilidade. a chance de ocorrer uma medida em um determinado intervalo.. Experimento Aleatório Experimento é qualquer atividade realizada que pode apresentar diferentes resultados. maiores são as chances. em outras palavras: A integral acima pode ser calculada para pontos igualmente espaçados com distância e soma resultante pode ser computada por meio do método FFT (Fast Fourier Transform). provável é uma das muitas palavras utilizadas para eventos incertos ou conhecidos. Um experimento é dito equiprovável se todos os possíveis resultados possuem a mesma chance de ocorrer. é a aproximação da probabilidade. Um experimento é dito aleatório quando não conseguimos afirmar o resultado que será obtido antes de realizar o experimento. a chance de ocorrência de um determinado evento pode ser expressa como 10%. Segundo Durrett (2010) página 106 uma função densidade de probabilidade pode ser escrita pela Transformada de Fourier da função característica. A palavra probabilidade deriva do Latim probare(provar ou testar). inclusive decimais. Entre outras características físicas e sociais tem um comportamento gaussiano. Informalmente. muitas variáveis observadas possuem uma distribuição de frequências que é. “risco”. observada à partir de uma amostra de medidas. “azar”. Podemos citar como exemplo a altura de uma determinada população em geral segue uma distribuição normal. Quanto mais próxima de zero for a probabilidade. Além disso diversos estudos práticos tem como resultado uma distribuição normal. E a distribuição de frequências é a aproximação da distribuição de probabilidades. “incerteza”. 0. ESTATÍSTICA A distribuição alfa-estável representada acima e definida pela notação é denominada parametrização segundo Nolan (2010). isto é. uma distribuição de probabilidade Normal. Maximum likelihood estimation of stable parameters. Sua importância se deve a vários fatores. frações e percentagens. 1952) ou integração direta (Nolan. P. Probabilidade é a chance real de ocorrer um determinado evento.BR 7 . entre eles podemos citar o teorema central do limite. dependendo do contexto. aproximadamente. J. A probabilidade é um número que varia de 0 (zero) a 1 (um) e que mede a chance de ocorrência de um determinado resultado.20 ou 1/7. Embora as distribuições de muitos processos possam assumir uma variedade de formas. A variação natural de muitos processos industriais é realmente aleatória. ou seja. pois ele garante que mesmo que os dados não sejam distribuídos segundo uma normal a média dos dados converge para uma distribuição normal conforme o número de dados aumenta. A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a mais importante distribuição contínua. Manuscrito não publicado. Por exemplo.

Desta forma. medidos. 6. 4. a construção de modelos. interpretá-los e deles extrair conclusões. devemos considerar: Espaço Amostral (E) Espaço amostral é o conjunto E cujos elementos são todos os possíveis resultados que podem ser obtidos na realização de um experimento. 7. capaz de sumariar todas as informações de modo a facilitar as inferências sobre os dados. Noções De Estatística Amostra São elementos coletados dentro do vasto universo. Definição A estatística é uma coleção de métodos para planejar experimentos. resumi-los. 7.COM. A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de compactar o enorme volume de dados. por exemplo. analisá-los. 8. ESTATÍSTICA Espaço Amostral E Evento Em uma tentativa com um número limitado de resultados. obter dados e organiza-los. 8. ▪ n(E) é o número de elementos do espaço amostral Estatística A Estatística está presente em todas as áreas da ciência que envolvam o planejamento do experimento.DOMINACONCURSOS. 8. WWW. 7.BR 8 . temos: (4. o processamento e a análise de dados e sua consequente transformação em informação. a Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. Evento (A) Evento é qualquer subconjunto de um espaço amostral. em uma simples tabela ou uma equação. a coleta. para validar hipóteses científicas sobre um fenômeno observável. 8) ou (8. Apresentando esses dados em rol. Exemplo: Os cincos alunos de uma amostra apresentaram as seguintes notas na prova bimestral de matemática 6. 6. 8. 4). em uma estação. todos com chances iguais. Cálculo De Probabilidades Seja um evento A de um espaço amostral referente a um experimento aleatório e equiprovável. ROL É toda sequência de dados numéricos. A probabilidade P(A) de se obter o evento A é dada por: Onde: ▪ n(A) é o número de elementos do evento A.

COM. As medidas de tendência central mais utilizadas são: média aritmética. isto é: Nota: “peso” é sinónimo de “ponderação Moda: (MO) É o valor que ocorre com maior frequência. de forma que cada um esteja sujeito a um peso (valor que indica a quantidade de vezes em que cada número se repete). Medidas De Posição São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. Média Aritmética É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. e o conjunto se diz BIMODAL. quando os valores estão dispostos em ordem crescente ou decrescente. a mediana é o número localizado no meio da lista. As medidas de posições mais importantes são as medidas de tendência central ou pro médias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). cada um deles é chamado de uma moda. Se mais de dois valores ocorrem com a mesma frequência máxima. dividida pelos somatórios dos seus pesos. Média Aritmética Ponderada Consideremos uma coleção formada por n números. A média aritmética ponderada desses n números é a soma dos produtos de cada um por seu peso. moda e mediana. WWW. Quando nenhum valor é repetido o conjunto não tem moda Mediana (MD) Valor do meio do conjunto de dados. Quando dois valores ocorrem com a mesma frequência.DOMINACONCURSOS. Para calcular: ▪ Disponha os valores em ordem (crescente ou decrescente) ▪ Se o número de valores é ímpar. cada um deles é uma moda e o conjunto é MULTIMODAL. ESTATÍSTICA Classes Qualquer intervalo real que contenha um rol da amostra. divide um conjunto de dados em duas partes iguais.BR 9 .

DOMINACONCURSOS. os desvios para o nosso conjunto de dados serão: Observação: a soma dos desvios é sempre nula. Onde a média aritmética é 7. O jogador 1 tem 45 anos. 14. o conjunto de dados: 2. que procuram mostrar como os elementos do conjunto se comportam em torno da região central. a mediana é a média aritmética dos dois valores do meio. Chamamos variância de um conjunto de dados a média aritmética dos quadrados dos desvios. O jogador 2 tem 24 anos. ou seja. No nosso exemplo. as idades da equipe B estão bem mais dispersas em torno da média do que as idades da equipe A. por exemplo. A diferença entre cada valor é a média é chamada desvio. 8. são conhecidas as idades dos jogadores: Equipe A Equipe B O jogador 1 tem 26 anos. O jogador 2 tem 5 anos. num jogo de duplas de tênis. 25 anos. Variância Veja. nos dois casos. ESTATÍSTICA ▪ Se o número é par.BR 10 . 5. medidas que mostram se eles estão mais ou menos dispersos. Medidas De Dispersão Existem algumas medidas chamadas medidas de dispersão. temos: A variância é : WWW. No entanto. ou seja. Assim. Veja que. 6. Por exemplo. Duas medidas de dispersão são chamados de Variância e Desvio-Padrão.COM. a média das idades é a mesma.

no nosso exemplo.DOMINACONCURSOS. ESTATÍSTICA Desvio-Padrão O desvio-padrão é definido como a raiz quadrada da variância.COM.BR 11 . sendo indicado por Assim. temos: __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ __________________________________________________________________________________ WWW.