You are on page 1of 6

Tema 3: Models de distribució de probabilitats

Distribucions discretes:

Distribució de Bernouilli:
Aquesta distribució pren aquest nom quan la v.a. pot prendre dos valors, 0 i 1. Ω serà l'espai mostral (és a dir, creu o
cara...). Tenint en compte que p és la probabilitat 1 i q de 0, l'esperança equivaldrà a p i la variància a q.

Distribució binomial:
És la repetició de n vegades d'una experiència Bernouilli. La X equivaldrà al nombre de vegades que apareix el valor 1.
És a dir, X estarà ente 0 i n.
Depenent de dos paràmetres (n=nombre de vegades que s'ha repetit l'experiment Bernouilli i p=és la probabilitat
d'obtenir el valor 1),la distribució Binomial la denotarem B(n,p) i amb la següent fórmula:
𝑛!
𝑝 𝑘 = 𝑘! 𝑛−𝑘 ! 𝑝𝑘 (1 − 𝑝)𝑛−𝑘 (la k=al número pel qual busquem la probabilitat)
L'esperança serà igual a np i la variància npq .
*Si ens pregunten un número exacte apliquem la fórmula substituint k pel nombre que ens hagin donat i, si ens
pregunten de x a y, sumem les probabilitats incloent-hi les de x i y o sumar les restant i restar-les de 1. Si ens
pregunten la probabilitat de 0, haurem de substituir únicament el valor de p per (1-p).

Distribució de Poisson:
𝜆𝑘
Aquesta distribució amb el paràmetre λ ve donada per: 𝑝 𝑘 = 𝑃 𝑋 = 𝑘 = 𝑒 −𝜆 𝑘! Aquí E(x) = Var(x) = 𝜆
*Si ens demanen la probabilitat de que passi tantes vegades una determinada cosa per n vegades el període de temps
que se'ns ha determinat la 𝜆, només s'haurà de multiplicar 𝜆 per n vegades. Els criteris descrits en l'anterior distribució
(menys el de la probabilitat de 0) també son vàlids per aquesta.
Ex: Ous trencats de mitjana cada x temps

Distribució uniforme discreta:


Aquesta ve donada per una v.a que pot prendre n valors diferents amb la mateixa probabilitat.
1 n+1 𝑛 2 −1
Així doncs, 𝑝 𝑘 = 𝑛 *E (x)= i Var(x)=
2 12

Distribucions contínues:

Distribució uniforme contínua:


1
Aquesta és el resultat d'escollir un nombre a l'atzar dins d'un interval on la funció densitat és 𝑓(𝑥) 𝑠𝑖 𝑥 ∈ (𝑎, 𝑏)
b−a
𝑎+𝑏 (𝑏−𝑎)2 𝑦 1
E(x)= i Var(x)= . Així doncs, davant d'un interval de x a y (sent x<𝑦) realitzarem 𝑥 (𝑏−𝑎)
.
2 12
Ex: Autobús cada 20 minuts

Distribució exponencial:
Segueix aquest distribució si la seva funció densitat és 𝜆𝑒 −𝜆𝑥 𝑠𝑖 𝑥 > 0
𝟏 1 𝑏
Mitjana=E(x)= 𝝀 i Var(x)= . Fem 𝜆𝑒 −𝜆𝑥 Sent b > 𝑎.
𝜆2 𝑎

Llei Norma general: N 𝝁 𝐄 𝐱 , 𝝈 𝐃𝐞𝐬𝐯 𝐱

*Teorema de l'addicció (teorema 1 del límit central): Si existeix un X variable que es la suma de n variables normals
independents (amb Var(x) i E(x) diferents) la variable Xtotal seguirà els següents paràmetres 𝑋~𝑁( 𝜇 , 𝜎 2 ). Exemple
dels elefants.

*Teorema del límit central


Teorema 2:
Per poder estandarditzar certs valors necessitarem aplicar la següent fórmula 𝑁 𝑛𝜇, 𝜎 𝑛 Ex del trajecte de TGN a
MNT i dels atletes que fan 1Km per 4 minuts a una desviació de 0'5 min. Això acabarà sent 𝑁 400, 5
Teorema 3:
En aquest casos, com el de "temps mitjà que es tarda de casa a la universitat en 60 dies" amb 23 min de mitjana i 4 min
𝜎
de desv cada dia, s'aplica la següent relació 𝑁(𝜇, 𝑛 ) quan 𝑛 ≥ 30, que seria, en aquest cas particular, 𝑁(23.0, 0.52).
Ús de les taules estadístiques:
1r La taula normal estàndard:
Només serà necessari fer sempre un esquema per tal de facilitar la contextualització de la situació particular. Aquesta
𝑥−𝜇
serà la fórmula 𝑍 = 𝜎
*Si ens pregunten la probabilitat que deixa un punt a la dreta serà només necessari mirar-ho a la taula en el cas que
𝑍 > 0 i, en el cas de ser 𝑍 < 0 serà necessari buscar el punt que deixaria el valor positiu a la taula i resta'l d'1. En el
cas que ens demanés la probabilitat que deixa a l'esquerra la gestió seria diferent. Primerament, si 𝑍 > 0, buscarem la
probabilitat que deixa aquest punt a taula i el restarem d'1. Per l'altra banda, si 𝑍 < 0, buscarem el valor de la
probabilitat que deixaria el punt positiu, gràcies a la simetria que presenta la taula normal estàndard.
*En el cas de treballar amb intervals, si els dos punts es troben a la mateixa banda només serà necessari restar les dues
probabilitat i, en el cas de que es trobin en costats diferents, s'hauran de sumar i restar-ho d'1.
*Buscar 𝑥 posant "z" amb el seu signe real (negatiu o positiu) tenint en compte la premissa de l'enunciat.

2n Khi Quadrat:
No és simètrica i té graus de llibertat. S'ha de tenir en compte que, en la taula, la fila cabdal són probabilitats i els
números restant són punts. (OJU als signes)

3r Fischer:
No és simètrica i té els graus de llibertats en la columna i la fila, i n'hi ha tres , una per a cada probabilitat que deixa a la
dreta.
*Quan ens demanen la probabilitat d'un cert punt només és necessari buscar a les tres taules el valor donat amb els
graus de llibertat (precaució amb el signe < o >. En el cas contrari, és a dir, quan ens donin la probabilitat hi haurà dos
casos: El primer cas, quan el valor de la probabilitat sigui 0.05, 0.025 o 0.01 quan P(X>x) o 0.95, 0.975 o 0.99 quan
P(X<x), es tracta solament de buscar el punt en la taula corresponent amb el graus de llibertat tal qual. El segon cas,
quan el valor de la probabilitat sigui 0.05, 0.025 o 0.01 quan P(X<x) o 0.95, 0.975 o 0.99 quan P(X>x) haurem de buscar
a la taula de la probabilitat corresponent el punt amb el graus de llibertat girats i ho divideixes a 1.

4rt T de student:
Et dona els graus de llibertat i és simètrica.
*Treballarem amb ella com ho faríem amb la normal estàndard, tot i que al mig tenim punts, a d'alt probabilitats i a
l'esquerra els graus de llibertat

Tema 4: Intervals de confiança


El procés per realitzar un interval de confiança serà sempre el mateix:
1.-LLEGIR BÉ!!!
2.-Determinar de què es vol fer l'interval (una mitjana, variància,(...) o proporció poblacional), determinar les
condicions generals de l'exercici i consultar la línia de la taula adient.
3.-Consultar les taules estadístiques i determinar el valor per calcular el marge d'error. (Sempre buscarem punts que a
la seva dreta deixin (𝛼 2 𝑜 1 − 𝛼 2) 4.-Calcular amb el marge d'error de l'interval els extrems i, per tant l'interval de
confiança.

*Fórmules addicionals Interval 10


Tema 5: Contrastos d'hipòtesis
El procés per realitzar un contrast d'hipòtesis sempre serà el següent:

1.-LLEGIR BÉ!!!

2.-Determinar la hipòtesi nul·la i l'alternativa. L'alternativa sempre serà el que es vol provar, no portant el signe igual, i
la nul·la sempre serà "conservadora". Després és important determinar si és bilateral, unilateral dreta i unilateral
esquerra (que sempre fa referència a H1).

3.-Observar les característiques generals i determinar en quina línia estem treballant.

4.-Quan ens demanen l'interval de la taula estadística haurem de buscar els punts que deixen 𝛼 a l'esquerra o a la
dreta o bé, 𝛼 2 a costat i costat. i posar, coherentment els infinits a H1 o a H0. El valor de l'estadístic de prova s'utilitza
per determinar quina hipòtesis ens quedem emprant l'interval que surt del valors de les taules.

5.-Quan ens demanen l'interval de la magnitud que s'està estudiant, hem d'igualar la fórmula de l'estadístic de prova a
el valor de les taules i aïllar la magnitud a analitzar. A diferència d'abans, la magnitud mostral que ens donin la
emprarem per determinar la hipòtesis a partir de l'interval "mostral". 6.-𝛼 c o nivell de significació crític és
la probabilitat que l'estadístic de prova té dins les taules (dreta o esquerra i OJU amb les bilaterals que s'ha de
multiplicar per dos). El significat d'aquest mesura és la probabilitat que sigui certa la H0. I que en servirà per
determinar, comparant-ho amb el nivell d'error, si ens quedem amb H1 o H0

Tema 6: Anova
1.-Primer determinar H0 i H1.

2.-Consultar sempre la F de fischer amb el graus de llibertat (k-1, n-k), sent k la varietat de mostres i n el nombre de
mostres, per obtenir el valor crític de F (Fc)que és el punt que deixa a la seva dreta l'àrea igual a 𝛼. Tenint en compte
això l'interval per H0 serà (0, Fc) i H1 (Fc, +∞).

3.- La determinació de la hipòtesi vàlida es realitzarà a partir de l'estadístic de prova, comprant-ho amb els intervals
donats pel "valor crític de F" o Fc
Anova dues variàncies amb una mostra.

1.-Primer determinar H0 i H1.

2.-Consultar sempre la F de fischer amb el graus de llibertat, que pel factor fila/columna serà (nombre de
files/columnes-1,(nombres de files-1)*(nombre columnes -1)), per obtenir els respectius valor crític de F (Fc)que és el
punt que deixa a la seva dreta l'àrea igual a 𝛼. Tenint en compte això l'interval per H0 serà (0, Fc) i H1 (Fc, +∞).

3.- La determinació de la hipòtesi vàlida es realitzarà a partir de l'estadístic de prova, comprant-ho amb els intervals
donats pel "valor crític de F" o Fc

Anova dues variàncies amb vàries mostres.

1.-Primer determinar H0 i H1.

2.-Consultar sempre la F de fischer amb el graus de llibertat,que es


calcularan(el primer és com està escrit en l'anterior a partat)/(nombre de
files*nombre de columnes*(r-1), sent r les mostres de cada tipus donades per
les combinacions possibles entre files i columnes, per obtenir els respectius
valor crític de F (Fc)que és el punt que deixa a la seva dreta l'àrea igual a 𝛼.
Tenint en compte això l'interval per H0 serà (0, Fc) i H1 (Fc, +∞).

3.- La determinació de la hipòtesi vàlida es realitzarà a partir de l'estadístic de prova, comprant-ho amb els intervals
donats pel "valor crític de F" o Fc.

Tema 7: Regressió lineal


1.-Ens donaran tots els sumatoris necessaris.

2.- 𝑌 = 𝛼 + 𝛽𝑥

3.-Així doncs, mitjançant les següents fórmules s'estimaran els valors de 𝛼 𝑖 𝛽.

4.- Tan Y i X amb barret són les mitjanes dels valors que es donen de X i de Y (suma de (X o Y)/n)

·Mesures de bondat d'ajustament

1.-Coeficient de relació 𝒓:
És la relació lineal que hi ha entre dues variables i es
calcula mitjançant la fórmula següent:

·Té les següents propietats: -𝒓 és un estimador del


coeficient de correlació poblacional 𝝆

· −1 ≤ 𝑟 ≤ 1 El signe positiu d'aquest valor significa que presenten una correlació positiva, és a dir, indica la relació
proporcional entre la variable X i la variable Y. En el cas contrari, quan aquest valor es negatiu, la correlació serà
negativa. Indicant, així, que, entre la variable X i la Y, existeix una relació inversament proporcional.

·En el cas de ser 𝑟 ± 1 ens trobaríem en els dos casos de correlació total. I, en el cas de 𝑟 = 0, que les variables estan
incorrelacionades.

2.-Coeficient de determinació 𝒓𝟐 :
·Com més proper sigui aquest coeficient a 1 més significativa serà la relació lineal entre X i Y, és a dir, la Y queda molt
ben explicada per X. Sent 1 el valor de màxima perfecció i el 0 el de màxim desastre lineal...

3.-Error estàndard 𝒔𝒖 :
Determinació de si el coeficient de correlació és significatiu. Contrast d'hipòtesis

*Aquesta determinació vindrà donada per un contrast d'hipòtesis sobre el coeficient de correlació poblacional 𝝆:
1.-Determinar les hipòtesis nul·la i alternativa sent H0 𝜌 = 0 i H1 𝜌 ≠ 0.
2.-Determinar, consultant la taula t de Student amb 𝑛-2 graus de llibertat, el punt que deixa a la seva dreta 𝛼 2, sent 𝛼

el nivell de significació. I amb això l'interval on s'acceptarà la H0 i la H1 .


3.-Determinar la zona de l'estadístic mostral on s'accepta la H0 i la H1

4.- Calcular l'estadístic de prova t:

5.-Segons els valor de 𝒓 i 𝒕 decidirem quin és la hipòtesis vàlida. I, a més calcularem 𝜶 𝒄𝒓𝒊𝒕𝒊𝒄

Al realitzar una predicció hem d'aplicar-la amb l'equació linealitzada, sent 𝛽 el valor estimat de la
pendent, 𝛼 l'ordenada a l'origen estimada i 𝑋𝑖 el valor determinat que ens donin.

Regressió no lineal
1r Cas 1 e^y=a*x^b
1.-Primer pas apliquem logaritmes a les dues bandes (Y=lna+b*lnx)
2.-Ara linealitzem la funció (Y=α+b*X’)
3.-Un cop tenim la funció linealitzada es treballa igual que si fos una regressió lineal tenint en compte que el sumatori
de x serà aquell al que se li hagin aplicat el LN i la Y serà la inicial. (Per calcular ALPHA s'utilitza les mitjanes de Y i de
LN(X)!!!) Tenir en compte que, si ens demanen els valors de a i b inicials, el valor de b no varia o sigui es el mateix que
quan teníem la funció sense linealitzar però el valor de a s'hauran de desfer els logaritmes mitjançant els logaritmes, és
a dir, a=e^α.

Cas 2 y=a*x^b
1.-Primer pas apliquem logaritmes a les dues bandes
lnY=lna+b*lnx
2.-Ara linealitzem la funció
Y’=α+b*X’
3.-Un cop tenim la funció linealitzada es treballa igual que si fos una regressió lineal tenint en compte que la y i la x que
hem d’agafar són aquells sumatoris als quals se’ls hi hagi aplicat els logaritmes Tenir en compte que si ens demanen els
valors de a i b inicials el valor de b no varia o sigui es el mateix que quan teníem la funció sense linealitzar però el valor
de a serà desfer els logaritmes es a dir a=e^α

Cas 3 y=a+b*lnx
1.-Linealitzem la funció
Y=α+b*X’
2.-Un cop tenim la funció linealitzada es treballa igual que si fos una regressió lineal tenint en compte que el sumatori
de x será aquell al que se li hagin aplicat ln i la Y la inicial.
3.-Els valors de a i de b seran els mateixos un cop linealitzada la funció

You might also like