Eu (professor Arthur Lima) e 0 professor Hugo Lima elaboramos este resumo de Férmulas de
Estatistica para o concurso da Policia Federal 2021. Aproveitamos para incluir alguns conceitos
muito cobrados que podem ajudar a acertar varias questdes nas provas!
Somos Engenheiros pelo Instituto Tecnolégico de Aeronautica (ITA) e fomos aprovados nos
concursos da Receita Federal para o cargo de Auditor-Fiscal. Também somos os professores
responsdveis pelas disciplinas de Raciacinio Légico, Matematica, Matematica Financeira e
Estatistica no Direpao Concursos.
Mantenham este resumao sempre acessivel para revisarem varias vezes as formulas de
Estatistica até a prova da Policia Federal, ok?
Bons estudos! Nos vemos na ANP ainda este ano!
01 | RESUMAD DE ESTATISTICA PARA POLICIA FEDERAL 7) DIRECAOatl
DE ESTATIST
PROFESSORES ARTHUR LIMA E HUGO LIMA
Ps GEM 3 a ea EL
Cl
Dados em rol (Lista):
Soma _ 2X,
quantidade
Média(X):
Tabela de frequéncias (e média ponderada,
usando os pesos no Lugar de fi):
DX,
ahi
Dados agrupados em intervalos (usar
ponto médio — PM):
> PM,x
Lf
+ Média é afetada por todos os valores da
distribuicao
+ Se somarmos / subtrairmos ou
multiplicarmos / dividirmos todos os termos de
uma distribuicao pelo mesmo numero, a media
sofrerd 0 mesmo efeito
x
O2 | RESUMAD DE ESTATISTICR PARA POLICIA FEDERAL
Passos:
1 - colocar dados em ordem crescente;
2 ~ calculara posicao da mediana:
Hye
3 - localizar a mediana (catcular a média entre
2 valores, se necessario).
+ Mediana nao é afetada pelas mudancas de
valores extremas da distribuic0
Eo valor com maior numero de frequéncias
(epeticées).
+ Moda nao é afetada pelas mudaneas de
valores extremos da distribuigso
Ett
Eo valor com maior numero de frequéncias
(repetigdes).
Simetria d
‘Simétrica Média = Mediana = Moda
‘Assimétrica positive
Média > Mediana > Moda
(@ direita)
‘Assimétvica negativa
Média < Medi < Mode
@esquersa) ee teeereeuee
9) DIRECAORESUMAO DE ESTATISTICA PARA PF
Sea
ESPERANCA OU VALOR ESPERADO
blah
|
E(X|=). x. p(x)
MEDIDAS SEPARATRIZES - QUARTIS
Quartil Posicao
1 wy
2 aay
3 Bina
PGT Ee
Valores
Lim. superior -~
38 quartil ~~
Mediana |~~
12 quartil |-~
Limite Superior -> MENOR valor entre o valor
maximo e 93 +1.5(03-Q))
Limite Inferior -> MAIOR valor entre o valor
minimo e Ql — 1.5(93 - Ql)
Outliers (valores atipicos) -> acima do Limite
Superior ou abaixo do Limite Inferior
De
03 | RESUMAD DE ESTATISTICA PARA POLICIA FEDERAL
TECNICAS DE AMOSTRAGEM
+ Aleatéria Simples: é preciso ter acesso a
todos 0s elementos da populacdo; todos os
elementos precisam ter a mesma chance de
serem escolhidos para a amostra; populacao Unica;
com ou sem reposi¢ao.
+ Sistematica: regra objetiva / légica /
sistema para selecao dos elementos da amostra
+ Estratificada: populacdo é dividida em
estratos (agrupamentos mais homogéneos entre si)
e sao selecionados ALGUNS elementos de TODOS
os estratos.
+ Por conglomerados: populacao é dividida
em subgrupos (conglomerados, ndo
necessariamente mais homogéneos entre si), €
TODOS os elementos de ALGUNS subgrupos so
anatisados,
a GE TE eae}
Varidncia|o°|= E|x°)~|
(eixiP
Tabela de Frequéncias:
x
Variéneia|o?|=
Intervalos de Classes:
rpm
Narincialo"\=
Para calcular a variancia AMOSTRAL, substitua n
Por ‘n-7' no denominador das formulas acima_
DIRECAO
JeT
Led
LT)
Desvio padrdio\o|=VVaridncia
+ Somas/subtracées nao afetam o desvio
padréo e nem a variancia
+ Se multiplicarmos/dlividirmos todos os
termas da distribui¢o pelo mesmo nlimero, 0
desvio padrao é multiplicado/dividido pelo numero,
e a variancia pelo quadrado do ntimero
De part inde
aaa aT
+ Medida de dispersao RELATIVA (boa para
comparagées entre distribuicées)
+ Nao tem unidade
Coeficiente Percentilico=:
Q3+Q1-2.Md
Q3-Q1
DesvioPadrao
Coeficiente Quartitico=
Primeiro coeficiente de Pearson=
(Média—Mediana)
Segundo coeficientede Pearson=3, “HOS Diam
Medem o grau de achatamento de urna
distribui¢do em relacdo a distribui¢ao normal.
(C= m/s")
Platiourtica (mais achatad) c<3
Mesocurtica c=3
Leptocurtica c>3
=, 98-01
Platicurtica (mais achatada) c<3
Mesocurtica o=3
Leptocuttica c23
+ Distribuicao normal é mesocuitica
Probabilidade do evento = numero de
resultados favordveis / numero total de
resultados
Eventos independentes:
P (AnB) = P(A) X P(B)
Probabilidade da uniao de eventos:
P (AUB) = P(A) + P(B)- P(AnB)
Eventos mutuamente excludentes:
P(AnB)=0
Eventos complementares:
Probabilidade (E) = 1 - Probabilidade (E*)
Probabilidade condicional:
P (A/8) = P(ANB)/P (B)
CTH.)
rn
04 | RESUMAG DE ESTATISTICA PARA POLICIA FEDERAL 7) DIRECAOae iT ey ean
Coe ey
POG ER UGE Seas aE Le aud
DISTRIBUICAO, COMO IDENTIFICAR VALOR ESPERADO (MEDIA) | __VARIANCIA
Ltentativa - = p(t
Bemoutl 2 resultados possiveis EO)"P VaX)~ POs)
“n" tentativas independentes:
Binomial 2 resultados possiveis EQX)=np Var(X)= np(-p)
Probabilidade de sucesso constante
Fendmeno que se estende no tempo ou
Poisson espaco com independéncia EQ)=\ Var(X) =
regularidade conhecida
Probabilidade de "rf tentativas até o - _
Geomeétrica primeira sucesso EX)=Vp Var(X) = (1-0)/02
POPES E Eee
yr
P(k,n,p)=C\n,k).p*.(1—p
(probabilidade de k sucessos em n tentativas com probabilidade p de sucesso a cada tentativa)
OG eG saa Ee |
eat
f\k,a\ mn
(probabilidade de k repetices do evento durante o periodo abservado)
POE EEE Gata Ge
P(X =n) = p.(1-p)™
AE Eee LLU) oe Dy
DISTRIBUIGAO VALOR ESPERADO (MEDIA) VARIANCIA
Uniforme E(X) = (Maximo*Minimoy/2. ‘Var(X) = (maximo-minimo}*/12
Exponencial EQ)=1/A Var) = 1/8
Qui-quadrado EQ)=n Var(X) = 2n
- Nas distribuigses continuas, a probabilidade de qualquer valor exato é ZERO
- Fungo de distribui¢ao acumulada exponencial: F(X%)=1e™"
- Qui-quadrado é obtida pela soma dos quadrados de “n’" distribuicdes normais padronizadas independentes.
cert et aad
COM CUPOM DE 15% CLIQUE AGUI
Y) DIRECAO
OS | RESUMAD DE STATISTICA PARA POLICIA FEDERALRESUMAO DE ESTATISTICA PARA PF
Coe ey
Distribui¢do Normal
+ Presente em fenémenos da natureza em que
‘a maior parte dos valores esta préxima da média,
mas ha valores mais afastados da média para
‘ambos os Lados;
+ Se os dacios tem distribuieao normal, pode-se
dizer que cerca de 68% encontram-se entre poe
to. Da mesma forma, 95% dos dados
encontram-se entre p20 e ut2g,e 99.7% entre
130 e Ut39,
+ A distribuicao normal padrao tem média Oe
desvio padrao 1;
+ Para transformar uma distribuie3o normal
qualquer em uma normal padrao, basta usar a
transformagao: Zuo,
+ A distribuicao é simétrica, de modo que
P(X > a)é igual a P(X<-aje
média = mediana = moda,
+ Se Xe Y forem independentes e sequirem
distribuigao normal, entao X#Ye XY também terdo
distribuigao normal, e
EOH) = EO) + E(Y)
Var(X+Y) = Var(X) + VartY)
a EGET LL
+ Pardmetro: caracteristica da populacao (ex.
idade média populacional)
+ Estimativa: valor obtido a partir de uma
amostra (ex. média amostral),
+ Estimador: fungéio matemitica usada para
obter a estimativa (ex: somar todos os valores
dividir pela quantidade),
a
O6 | AESUMAD OE ESTATISTICA PARA POLICIA FEDERAL
+ Vigs: “parcialidade” ou “tendéncia’ do
estimador. Um estimador nao viesado tem como
valor esperado 0 préprio valor do parametro;
+ Consisténcia: um estimador consistente
converge para 0 valor do parémetro & medida
que 0 nimero de observagées aumenta (ea sua
variancia tende a zero);
+ Eficiéncia: entre dois estimadores, 0 mais
eficiente € 0 que possui MENOR variancia;
+ Suficiéncia: o estimador suficiente capta
todas as informacdes sobre o parémetro a ser
estimado.
el aT
Nao-viesado (nao tendencioso), consistente,
eficiente e suficiente.
Gas anes)
A MEDIA
+ média amostral: é nao-viesada e
consistente
+ mediana amostral: € nao-viesada e
consistente, mas € menos eficiente que a média
amostral
+ primeiro item coletado: € nao-viesado, mas
nao é consistente
Eh lle Ge
+ Variancia (com “n’ no denominador): é
viesado. Colocando-se n-1 no denominador, fica
nao-viesado (variancia amostral).
+ Desvio padrao (com “n’ ou com “n-l" no
denominador} é viesado.
=]
o
iH
A MAIOR OPERAGAO
eS
ne aa
cL
Yq) DIRECAORESUMAO DE ESTATISTICA PARA PF
Sea
ESTIMAGAQ INTERUALAR
apa Pea aL
bea ol SAG SG a9
A distribuigao amostral da média é NORMAL,
com:
‘Média=médiada populacao ||
o
vn
Ta
o
BF. ~ eropadrao naestimatvade médias
Desvio padri
={PA=P err padrdonaestintivade proporges
aa ee ea ae
ai)
& ou Médiaamostral:st,. >
Média amostral=2...-% Te
aU alate a
Nea UTM eel eat aE EST
intervalos de intervalos de
Confianca Credibitidade
Estatistica Frequentista Estatistica Bayesiana
Utiizam inforaces da
Ne dependem dl | cistrinuicgo a prion (cra intervalo
distribuieao a priori | Ge probabildade a posterior)
i St
~ paraestimativa demédias
fn poten eect
+ As formulas acima consideram que a
populagao € infinita (amostragem com
reposi¢ao)
+ Quando p € q forem desconhecidos, usar
=05
+ Usar a segunda SOMENTE quando n<30 e
0 desvio padrao populacional for desconhecido
+ Numero de graus de liberdade (t de
Student) =n -1
us)
o
ova
Amplitude dointervalo=2.Z,
ou
Amplitude dointervalo =2.,
vn
Gain asain)
bag
Proporgaoamosial(p)3Z..4 pF.
Amplitude dointervalo=2.2..1 p.~—>
‘Margemde erro=.
07 | RESUMAD DE ESTATISTICA PARA POLICIA FEDERAL
RECEITA DE BOLO — TESTES DE
HIPOTESES PARA MEDIAS
1 — Formular a hipétese nula (H,) e a
hipstese alternativa (H,) — mutuamente
excludentes
2 — Rascunhar a curva normal, marcando
as regides de aceitacao e de rejeicao (regio
critica) de acordo com o nivel de significancia a
€ 0 tipo de teste (bilateral, se H, for do tipo
“média diferente de’, ou unilateral, se H, for do
tipo “maior que” ou “menor que")
3 — Obter Z,,...,4, 60m base no nivel de
significancia e tipo de teste
4 — Obter Z.,...,., Por meio da expressao:
Zealculado=*—#
vn
5 —Posicionar Z,,..4) NO grafico e obter a
conclusao do teste — aceitacao ou rejeicdo de H.,
DIRECAO
JRESUMAO DE ESTATISTICA PARA PF
Sea
Usar t de Student se n< 30 e o desvio
padrao populacional for desconhecido. Neste
caso,
vn
Numero de graus de liberdade =n — 1
Correlacao(XY)=(couXY)AG, 6,)
Se for um teste de hipoteses para
proporcées, usar
(=P)
1—py
Z.
ealelado=
Po-
n
onde p é a propareéo abtida na amastra ep,
estd nas hipdteses do teste.
+ Varia de -1 (correlapao fortemente negativa)
a +1 (correlacao fortemente positiva)
+ Se varidveis sao INDEPENDENTES, entao a
correlagao é NULA (0 contrario nao é
necessariamente verdad)
Ee es)
Correlacao(X,X) = 1
Correlacao(a.X + b, cY + d) = (sinal de ac)
x Correlacao(XY)
Y=a+B.X +e,
- a € 0 coeficiente linear, B é 0 coeficiente
angular, €, 6 0 erro aleatorio
- X éa variavel independente, Y é a varidvel
Hye verdadeia Hye Fas
dependente
Hye Acita = pnlH-ExEy
fiesta] Caso pest.) Gay n(x}
TA aL eee 7
HIPOTESES p2oouX.¥)
Var |X}
+ Poder (Poténcia) do Teste: probabilidade
de rejeitar corretamente a hipétese nula (1-8)
+ p-valor (nivel descritivo, probabilidade de
significancia): p-valor < a> rejeitar H,
NRE eat el)
Cov(XY) = EQKY) — EQ)ENY)
+ Positiva: as duas variaveis tendem a crescer
/ decrescer juntas
+ Negativa: quando uma variavel cresce, a
outra tende a decrescer
Var(X + Y) = Var(X) + Var(Y) + 2abcov(Xy)
Var(X — Y) = Var(X) + Var(Y) — 2.ab.cov(XY)
Covax + b, cY +d) = ac.cov(XY)
08 | RESUMAD DE ESTATISTICA PARA POLICIA FEDERAL
Relagdoentre asmédias: ¥=a+P.X
QUER AJUDA EM
INFORMATICA?
ry) DIRECAO
Pel Roel
PT) ad Te ela
PF + PRF
BE
7) DIRECAORESUMAO DE ESTATISTICA PARA PF
Sea
COEFICIENTE DE DETERMINAGAO R?
+ £0 quadrado do coeficiente de correlagao
+ Mede o ajustamento da regresso a0
modelo linear
+ Varia entre O e 1 (quanto mais préximo de
1, methor o ajustamento)
+ Interpretagdo: ¢ o percentual das variacdes
da variavel dependente que sao explicadas pela
varidvel independente.
a eT)
- usada para comparacao de médias entre 3
‘ou mais grupos;
Hipdtese nula (H,): as médias nda possuem
diferenca significativa
Hipétese altemativa (H,): pelo menos uma
média difere das demais
PED age)
+ Afirmam que a média amostral converge
para média populacional 4 medida que
aumentamos 0 tamanho da amostra.
Lel FRAGA dos Lel FORTE dos,
grandes numeros grandes numeros
Aconvergéncia ocore em | Acconvergencia ¢ CERTA /
PROBABIIDADE ‘QUASE CERTA
‘Se o nlimero de elementos da] _A parti de um tamanho de
‘amostra é suficientemente | amostia‘n’ suficientemente
‘grande, convergénciaé |" grande, @ convergéncia &
PROVAVEL CERTA / QUASE CERTA
GAEL easy
+ Trata-se do estudo do camportamento do
residuo (erro aleatério) da regressao linear,
+ Caracteristicas desejaveis do residuo:
- média igual a zero;
- variéncia constante (homocedasticidade, e
NAO heterocedasticidade),
normalidade (residues com distribuicao
normal em torno do zero);
+ Diagrama de dispersao de residuos (grafico
de residuos): permite verificar a
homocedasticidade e a presenca de outliers;
+ Quando a suposi¢ao da homocedasticidade
€ violada, a distribuiga0 de probabilidade do
modelo ¢ afetada, mas nao o valor esperado.
9 | RESUMAQ DE ESTATISTICA PARA PF
7) DIRECAOail ee aac
Coe ey
Fontes de variaao | Soma de quadrados | Graus de Liberdade | Quadrados médios (soma/at) F
ane =SQE/ y |F=QMeE/QMR
(equacéo) ‘SQE Grupos — 1 QME = SQE / (Grupos ~ 1) Q Q
Dentr ru
Jentro dos grupos en N—Grupos QM = SQR/ (N — Grupos)
(residuo}
QMT=SQT/ (NJ)
Total (modelo)
‘SQE + SQR = SQT
RP = SOE / SQT
B-Ro,/o,
‘As variancias sao os Quadrados Médios do quadro acima
10 | RESUMAO DE ESTATISTICA PARA PF Y) DIRECAO