Professional Documents
Culture Documents
→ L'estadística ens permet quantificar fins a quin grau de certesa podem dir que això és
degut a a la casualitat o és degut a si és millor o no.
DEFINICIÓ
→ L’estadística és una branca de les matemàtiques (o no) que té per objectiu recollir,
presentar, analitzar i interpretar dades, predir variables no observades i estudiar les
propietats dels mètodes utilitzats per dur a terme aquestes tasques.
→ L’estadística és una disciplina que permet modelitzar i prendre decisions davant la
presència de la incertesa, és a dir, fenòmens aleatoris. S’utilitza en diverses ciències
aplicades, com ́es l’economia.
ESTADÍSTICA INFERENCIAL
Utilitzar les dades per arribar a conclusions, fa prendre decisions, és diferent a l'estadística
descriptiva (gràfics, mitjanes…)
Una mostra X n = X 1 , X 2 , ..., X n és una col·lecció de variables aleatories independents
identicament distribuides: M
ajúscules (Variables aleatòries, no se sap el resultat d'aquesta
Realització de la mostra : M
inúscula (Quan ja hem pres la mostra i sabem el seu resultat)
No es pot dir que una realització d’una mostra sigui un conjunt de variables aleatòries (es
una variable que dependrà a la persona que se li faci) . No es igual la variable aleatoria que
els possibles valors d’aquesta
DISTRIBUCIÓ MOSTRAL
BLOC 1
Estadístic: És una funció de la mostra (Qualsevol funció de la mostra, mitjanes, màxims,
mínims, quartils, variància, esperança…), qualsevol cosa que podem calcular amb la mostra,
(El màxim de X1 Xn, el màxim de la mostra, si per exemple la variable X és el nombre de
germans, el màxim de nombre de germans per cada persona seria Estadistics)
Un estimador és un estadístic que utilitzem per estimar un paràmetre, aquest no pot tenir
biaix
→ El resultat d’un estadístic és aleatòria, la distribució de l'estadístic l'anomenem
Distribució mostral
MITJANA MOSTRAL (S) o X : L'estadístic que (sota certes condicions) aproxima millor p és la
corresponent mitjana mostral (proporció mostral)
X 1 +X 2 +...+X n
S= n
V ar(X)
E (S) = E (X) = μ V ar(S) = n
Al ser idènticament distribuïdes, tenen la mateixa esperança. I al ser independents és
compleix l'equació de la variància (sino no seria possible)
TEOREMA CENTRAL DEL LÍMIT: ens diu que si n és gran la distribució mostral de S és
aproximadament Normal d
e mitjana E(S) i variància Var(S).
→ X pot ser qualsevol distribució que S sempre serà normal si s’aplica aquest
teorema
︿
Proporció mostral: (p) Cas particular de la mitjana mostral, quan és Bernoulli → Suma de
totes les respostes d’èxit, dividida entre el nombre total de respostes (èxit + fracàs)
︿ ︿ p(1−p)
E (p) = E (X) = p V ar(p) = n
ESTIMADOR PUNTUAL
︿
→ θ → És el paràmetre de la població que volem estimar. Un estimador puntual és θ n i és
del paràmetre θ és una variable aleatoria , l’estimador dependrà del resultat de la mostra
︿ ︿
biaix(θ n ) = E (θ n ) − θ
ficiència
La desviació típica de l’estimació puntual s’anomena error estàndard. E
︿ ︿
se(θ n ) = √V ar(θ n)
Si un estimador té una desviació típica menor que un altre, diem que el primer és més
eficient.
ERROR DE MITJANA QUADRÀTICA És el valor esperat del quadrat de la dif entre
l’estimador del paràmetre. Consistència
BLOC 1
︿ ︿ ︿ ︿
E M Q (θ n ) = E (θ n − θ)2 = biaix(θ n )2 + se(θ n )2
Un estimador es consistent amb mitjana quadràtica, quan EMQ és 0 quan n tendeix al
infinit
No tots els paràmetres que volem estimar s’estimen amb la mitjana mostral o amb la
proporció mostral, com ara voler estimar la lambda d’una exponencial
Els moments d’una variable aleatòria és l’esperança de X (en el moment de 1r ordre). El
moment de 2n ordre és E(X^2), el moment de 3r ordre és E(X^3)
︿
θ → Estimador dels moments
Sigui θ el paràmetre d’interès associat a la població. La relació funcional entre el moment
de primer ordre de la distribució de la població i θ es coneguda.
E (X) = g (θ)
︿
L’Estimador dels Moments es defineix com la solució θ n de l'equació, ja que sabem
que E (X) ≃ X n , l’estimador de moments passa a ser: la X n ja la sabem i així hem de
calcular el paràmetre.
︿
X n = g (θ n )
Exemple típic → Exponencial, a la diapo, on hem d’aïllar el paràmetre, en aquest cas
la lambda
No sempre la podem calcular, per tant ens adaptem al màxim de versemblança (allò que
enganxa més amb les observacions, busquem el paràmetre que maximitza la probabilitat
que passi allò que hem observat)
BLOC 1
Sigui X ∼ F (θ) amb funció de probabilitat/densitat f(x,θ) on θ és el paràmetre desconegut
que ens interessa estimar.
Ln (θ; X 1 , ..., X n ) = Π f (X i ; θ)
MÀXIM DE VERSEMBLANÇA: Buscar la p que fa màxima la probabilitat el que hem
observat → Ho trobem derivant directament, o sino fent el logaritme de la funció de
versemblança i un cop tenim aquest, el derivem. → ( Acostuma a ser més fàcil)
BLOC 1
Considerem dos valors θ1 i θ2 tals que Ln(θ1; x) > Ln(θ2; x).
Això implica que la probabilitat d’observar la mostra que tenim és més gran si θ1
és el valor del paràmetre que si ho és θ2 → Direm que θ1 és millor que θ2