Professional Documents
Culture Documents
Introducció
En aquest tema estudiarem la probabilitat, que consisteix en fer prediccions sobre les
possibilitats de que un fenòmen tingui lloc o no.
No obstant això, la definició clàssica només és aplicable si tots els esdeveniments tenen la
mateixa possibilitat de succeir. Si llancem 1 dau amb 6 números, tenim una probabilitat 1 de
treure sis o menys. En canvi, tenim una probabilitat de 0,5 (50%) d'obtenir un resultat de 1-3.
Exemples: Quan llancem una moneda (cara / creu) o un dau (1; 2; 3; 4; 5; 6), tots els
esdeveniments tenen les mateixes possibilitats de succeir, és a dir, tenim les mateixes
possibilitats de treure cara o creu ( 0,5), o qualsevol nombre del dau (0,6). En aquests casos SÍ
que és possible aplicar la definició clàssica de probabilitat.
La definició clàssica no és aplicable als esdeveniments que no tenen les mateixes probabilitats
de succeir. Així, en el cas de la depressió hi ha dos possibles esdeveniments: SI o NO. Com que
les persones no tenim les mateixes possibilitats de tenir o no depressió, en aquests casos hem
d'aplicar la definició empírica.
(n tendeix a infinit)
Exemple: Agafo infinits subjectes i vaig registrant qui té depressió i qui no. Com que infinit no
és un nombre, agafem per exemple 1 milió de subjectes i mirem qui té depressió. En aquest
cas, si trobem depressió en 0,3 (300.000) milions de persones (esdeveniment A és Depressió
SI), llavors dividim 300.000 per 1.000.000. El resultat sera P (A) = 0,3.
Els axiomes de probabilitat són tres lleis o condicions que s'han de donar sempre per
poder calcular una probabilitat. Són els següents:
Bàsicament el que diuen els dos primers axiomes és que una probabilitat ha
d’estar sempre entre 0 i 1. Mai trobarem probabilitats inferiors a 0 o superiors a
1. Si en un càlcul ens surt -0,34 o 5,48 algo no hem fet bé.
Exemple: Tots els resultats d’un dau són mútuament excloents: si traiem un dos, no podem
treure un 1. La possibilitat de treure els esdeveniments units 1 i 2 (AUB) és igual a la suma de la
probabilitat que tots dos succeeixin per separat. Tenint en compte que la probabilitat de
treure qualsevol nombre és de 0,16, la probabilitat de treure 1-2 és de 0,33 (0,16 + 0,16 ). I la
Probabilitat de Treure 1-3? 0,5.
2. Variables i probabilitat
Tant les variables qualitatives com qualitatives són esdeveniments, i es per aixo que jo puc
associar una probabilitat de que cada esdeveniment succeeixi.
La diferència, però, és que les qualitatives no són esdeveniments aleatoris, mentre les
quantitatives si. Per això, quan parlem de variables aleatòries parlem sempre de variables
quantitatives.
Expressa la probabilitat de que succeeixi cada un dels valors de manera aïllada o independent.
Es a dir, assigna probabilitat a cada variable.
Exemple: Quines son les probabilitats que tinc d’obtenir cada un dels 12 valors al llançar 2
daus? Això ho podem representar per mitjà d’una taula o d’un gràfic.
• Funció de distribució:
Exemple: Quines son les probabilitats acumulades que tinc d’obtenir cada un dels 12 valors al
llançar 2 daus? Això ho podem representar per mitjà d’una taula o d’un gràfic.
• Funció de densitat:
persona medirà 180’2136..., l’altre 18’2748.., etc.). En aquest sentit, entre 180 i 181 cm
existeix una infinitat de números possibles.
• Funció de distribució:
Si tenim una família amb tres nens de sexe masculi i sabem que la probabilitat estadística que
un nen pateixi TDH és del 0,04 ... quina probabilitat hi ha de què si tinc tres fills, cap, un, dos, o
tres d'ells tinguin TDH?
En aquest esquema es poden observar els 8 tipus de combinacions possibles. Si volem calcular
la probabilitat d'una d'aquestes combinacions, només hem d'unir els cercles seguint les línies
(encara que n'hi hauria prou aplicar una fórmula matématica que veurem amb les binomials).
Per cada cercle SI es multiplicarà la probabilitat per 0,04, i per cada no per 0,96. Així, per
exemple, la probabilitat que els tres nens tinguin TDH és de 0,043 (0,043 x 0,043 x 0,043 =
0,000064).
Si calculem la probabilitat de cada valor, podem elaborar una taula de freqüències com la
següent:
Xi p (X = Xi)
1 “” 0, 110592
2 „“ 0, 004608
3 „“ 0,000064
Exemples
- * Probabilitat que el primer nen tingui TDH (Estem agafant a un individu o valor aïllat, sense
tenir en compte el resultat dels altres nens)? 0,04
- Probabilitat que com a molt dos nens tinguin TDH (cal sumar la probabilitat associada als
valors 0, 1 i 2)? 0,999936
- Probabilitat que almenys dos nens tinguin TDH (cal sumar la probabilitat associada a 2 i 3)?
0,004672
- * Probabilitat que com a molt tres nens tinguin TDH? 1 (sumem tots els valors)
* Preguntes trampa
Funcions i paràmetres
1. Paràmetres
Tant les variables aleatòries discretes com les continues també son definides per 2
paràmetres: esperança matemàtica o E(x) i variancia o σ2.
• ̅
Esperança matemàtica → E(x) o 𝐗
Així doncs, la mitjana és el centre de la probabilitat, pel que a mesura que els valors s’allunyen
de la mitjana es de esperar que les seves probabilitats també vagin disminuint, com es pot
veure en la següent representació gràfica.
Si la distribució és simètrica (com en la gràfica), E(x) coincidirà amb la mediana (Md), ja que
serà el valor central tant de la distribució dels valors com de la distribució de probabilitats.
Com es calcula?
Es calcula multiplicant cada valor de la variable per la seva probabilitat associada (que abans
em d’haver calculat) i sumant tots els resultats.
E(x) = π · n
Exemple 1
Xi p (X = Xi)
0 · 0,884736 = 0
1 · 0, 110592 = 0,110592
2 · 0,004608 = 0,009216 = 0,12 (El promig de tenir un fill de tres anys amb
3 · 0,000064 = 0,000192 TDH és un 12%)
Exemple 2: Vull saber quina és la mitja d’alumnes amb actitud hostil si faig cinc
mesures . Si se que la probabilitat de que un alumne aïllat presenti AH és de 0,55,
i agafo una mostra de 5 persones, la mitja esperada és que trobes 2,75 alumnes
amb AH. Si en canvi la meva mostra fos de 10 persones, E seria 5’5.
Ens indica si la probabilitat esta molt dispersa o concentrada. Com més gran sigui la variança,
més gran serà la dispersió. Així doncs, es tracte d’una mesura de dispersió de probabilitat.
Mesura variabilitat.
Exemple: Vull saber quina és la variabilitat de AH si faig cinc mesures . Var (x) = 5
· 0’55 · 0,45 = 1’2375.
ALERTA! E(x) i Var …o… μ i σ2 ...no és el mateix? Si i no. És tracte dels mateixos conceptes,
però aplicats de formes diferents. En estadística els indicadors estadístics és representen amb
lletres llatines, mentre que els paràmetres amb lletres gregues.
A més, qualsevol variable queda definida per 2 indicadors de forma: la simetria i kurtosis (no hi
entrem!!!)
Les variables aleatòries discretes (v.a.d.) solen seguir models o lleis de distribució coneguts.
Per tal de obtenir aquests models necessitarem les funcions i paràmetres anteriors. N’hi ha
molts, però nosaltres nomes en veurem tres:
Cada una de les mesures de la distribucio binomial s’anomenen assajos de Bernoulli, i el cojunt
de totes aquestes mesures formen la Llei Binomial.
És com Bernoulli però repetim la mesura diverses vegades. En aquests sentit, podem utilitzar-la
quan tenim una v.a. discreta (quantitativa) derivada d’una v. qualitativa dicotòmica.
“Dicotòmica” vol dir que si tires moneda pot sortir o cara o creu, és a dir, es pot donar o una
cosa o l’altra.
“Quantitativa discreta derivada d’una qualitativa dicotòmica” seria el número de vegades que
surt cara d’1 a 5 per exemple). Un altre exemple: patir depressio o no en 8 persones és una
variable qualitativa dicotòmica, i la quantitativa discreta seria el número de persones que
tenen depressio dins d’aquests 8 subjectes.
1. Es pot repetir una mesura o assaig tantes vegades com es desitgi. No hi ha límit, jo puc
llançar una moneda 10 vegadas o 10.000. (puc llançar la moneda a l’aire n vegades, o
puc mesurar n persones...).
2. Els resultats de les mesures son independents. Això vol dir que el fet d’obtenir un
resultat en una mesura no afecta al resultat següent. En aquest sentit, la probabilitat es
manté sempre constant. (el fet que jo llenci una moneda per 1r cop i surti cara es
independent de que la llenci una 2a vegada i surti cara, o el fet que jo diagnostiqui una
persona de depressio es independent de qe una persona no tingui depressio)
3. Jo no sé el resultat fins que no faig la mesura. No sé si sortira cara o creu fins que no tiro
la moneda a l’aire, o jo no ser el diagnostic si no faig la mesura.
En aquets dos gràfics podem observar la distribució binomial de la variable “Nombre d’encerts”
en un test, i la probabilitat associada a cada una de les puntuacions (funció de massa). Veiem
com la E(x) es troba en els 5 encerts (“valor esperat” o mitjana) i a mesura que els valors
s’allunyen d’aquest centre la seva probabilitat decreix. Cal recordar que les variables discretes
es representen en forma de barres separades o bé linees separades en puntets com aquí. Les
separacions expressen que no hi ha continuïtat entre els valors, es a dor, pots obtenir 4, 5 o 7
encerts, però no 5,2 encerts. En el segon gràfic es presenta la funció de distribució, amb la seva
forma típica de escalera ascendent fins arribar a d’alt de tot (probabilitat 1), ja que els valors
son acumulatius, es a dir, es suma cada valor a tots els seus anteriors.
Formula matemática simplificada (no l’hem de saber de memòria, però si l’hem de saber
aplicar):
Mostra tots els que estem a l’aula (n=60). Els que presenten hostilitat davant l’assignatura son
(AH= 30 → frequencia de quantes persones presenten actituds hostils). Per saber la
probabilitat de presentar actituds hostils → P(AH)= 30/60 = 0,55 (aplicacio de la definicio
empirica de probabilitat) Prob de no presentar-les = 0,45
Quali dicotomica: presentar actituds hostils o no →quanti discreta seria agafar 5 persones i
numero de vegades que presenten actituds hostils aquestes 5).
Quina es la probabilitat de que les 5 que he escollit nomes 1 presenti atituds hostils? →
V a discreta (Xi) pot pendre 5 valors (opcions que hi ha):
Xi
0 -> cap presenti
1 -> 1 presenti
2 -> 2 presentin
3 -> 3 presentin
4 -> 4 presentin
5 -> 5 presentin
Prob associada al valor 1 (Xi=1) →
Multiplico 0,55 · 0,45 · 0,45 · 0,45 · 0,45 = 0,55 · 0,454 = 0,022553
Però aixo seria la prob de que la Cristina presenti actituds hostils, no 1 qualsevol (poden haver-
hi diferents combinacions → fer diagrama d’arbre pq fer combinacions de 5 elements agafats
d’1 en 1 n’hi ha mes d’1, i nomes n’hem mesurat 1)
Formula:
𝑛 𝑛! 5 5! 5 5·4·3·2·1
C( ) = → C( ) = → C( ) =
𝑘 𝑘! · (𝑛 − 𝑘)! 0 0! · (5 − 0)! 0 1·5·4·3·2·1
5 5·4·3·2·1 5 1
C( ) = → C( ) = =𝟏
0 1·5·4·3·2·1 0 1
És una binomial, però que presenta dues característiques claus que fan que la distribució es
comporti una mica diferent:
Degut a aquestes dues característiques, seria molt difícil calcular la probabilitat de totes i
cadascuna de les probabilitats seguint la fórmula binomial. Per això, fem servir una formula
simplificada que ens dona un resultat aproximat. A més, degut a que n tendeix a infinit i π a
cero, resulta que quan calculem la E(x) i la Var son pràcticament el mateix numero, pel que en
Poisson, aquests dos paràmetres es coneixen amb un únic nom: lambda (λ). Així doncs, per
obtenir lambda podem fer-ho per mitjà de E(x) o Var, encara que E(x) és més senzill
(simplement λ = π · n).
*Nota: Recorda. Si a més, sabem que és λ = s , llavorç `per calcular s2, nomes hem de fer √𝜆.
𝝀𝒌 · 𝒆−𝝀
𝐩 (𝐱) =
𝒌!
La lletra “e”, a diferencia de pi (π), és un valor fix que el podem introduir en qualsevol
calculadora (e = 2.71828…).
Bàsicament vol dir fer el càlcul de la funció de massa i després fer el sumatori.
Si sabem que la probabilitat de que una persona en la nostra societat presenti personalitat
negativista desafiant és de 0’001, quina és la probabilitat de que si escullo 5.000 persones a
l’atzar, vuit d’elles presentin personalitat negativa desafiant?
n = 5.000
π = 0’001: prob que es presenti conducta negativa desafiant
𝜆 = 5000 𝑥 0,001 = 5
58 · 𝑒 −5
prob 8 persones amb aquesta conducta p (x = 8) = = 0’06528
8!
I quin seria el valor esperat de persones que esperaríem trobar en aquesta mostra (Esperança
Matemàtica):
E (x) = n · π = 5
- Multinominal
- Geometric
- Hipergeometric
- Binomial negativa
- Etc
• 68% central: Entre els dos punts d’inflexió sempre tenim el 68% de la distribució
Formula:
X = Variable
~ = “Segueix”
σ2 = Variança2
2) Un cop interpretat, ens formularan 4 tipus de pregunta diferents. Per tal de contestar-les, és
molt molt recomanable dibuixar una representació gràfica en base a les dades que ens aporta
R-Commander.
*Trucs:
La probabilitat de la mitjana és sempre 0’5, ja que divideix la distribució en dues parts, havent-
hi exactament una probabilitat de 0,5 des de aquest punt cap a les cues. Em de jugar amb
aquesta informació, perquè a voltes la necessitarem per poder contestar una pregunta.1
Podem invertir la direccionalitat de les fletxes simplement fent la resta de 1-π. Així, si per
exemple, sabem que a partir de un punt, la probabilitat és de 0,16 i volem saber quina es la
probabilitat que hi ha a partir d’aquell punt en direcció inversa, sols em de restar 1-0,16: 0,84.
Aquest pantallazo ens esta dient que tenim una mitjana de 32 amb una desviació típica de 8. A
més, ens diu que la probabilitat de tota la distribució a partir del valor 20 cap a baix (TRUE) és
de 0.0668072. Si representem gràficament la informació que ens donen, podríem dibuixar
sense problemes un gràfic així:
Però la pregunta que em fan és: “Quina probabilitat hi ha de trobar una persona de més de 20
anys?”. Aquesta informació jo no la tinc directament, però la puc obtenir fàcilment, ja que ens
esta demenant quina és la probabilitat que queda a la franja dreta del valor 20 (>20 anys).
Basta que invertim la direcció de la franja. Si sabem que tota la probabilitat és = 1 i que la
franja que queda a l’esquerra de vint te una p = 0.00668072, basta restar 1 – 0.00668072 → La
probabilitat de que una persona de la mostra tingui vint anys o més és de 0.9332.
Però la cosa es pot complicar si ens demanen que calculem un interval entre dos talls.
Suposem que ens donen el següent pantallazo. A partir d’aquest podem fer el següent gràfic:
Així doncs, sabem que els valors 20 i 40 deixen a la seva esquerra una franja de distribució amb
unes probabilitats de 0.0668072 i 0.8413447 respectivament. Però la pregunta és, “Quina
probabilitat hi ha de trobar-me una persona entre 20 i 40 anys?” Lo únic que em de fer és
invertir la direccionalitat d’una de les fletxes de forma que ambdues estinguin en la mateixa
direcció (es indiferent quina). Recorda que per fer-ho sols has de restar 1menys la probabilitat
de la fletxa que vulguis invertir. Si invertim la del valor 40, 1- 0.1586553 = 0.8413447.
Llavors sols em de restar les probabilitats d’una i l’altra per tal de saber la p de la franja que
queda enmig de les dues. En aquest cas restem 0.0668072 - 0.84413447 = 0.77732727. Es a
dir, la p de trobar una persona entre 20 i 40 anys és de 0.77732727.
Per últim, a l’examen ens poden demanar per un valor en comptes d’una probabilitat.
Imaginem que ens donen el següent pantallazo. A partir d’aquest podem elaborar el següent
gràfic.
A continuació ens demanen “Quina edat limita el 35% més jove de la classe?”. Fàcil. Ja ens ho
diu l’output de R-Commander = és el valor que deixa al 35% de la distribució a la seva esquerra
és 28.91744 anys.
-Z : Tots els valors que quedin a la cua esquerra seran negatius (-1.-2-3... -∞)
Z = 0 (= μ)
+Z : Tots els valors que quedin a la cua dreta seran positius (1, 2, 3... ∞)
Aquesta llei pot expressar-se de forma resumida de la següent forma:2
Z ~ N (0 ; 1)
Bàsicament la formula diu que “Z segueix la llei normal, on la mitjana és sempre 0 i la variança
sempre 12 (és a dir, 1).” S’assemble molt a l’expressió matemática de la llei normal simple (de
Gauss).
DNE ens és molt útil perquè ens serveix com a model de referència per comparar dues
Distribucions Normals (DN) en escales diferents. Dit amb altres paraules, quan agafam dues DN
i estandaritzam els seus valors el que fem es passar aquests valors a una escala comuna per tal
de poder comparar-los.
Exemple: QI
Si sabem que la mitjana de quocient intel·lectual és 100 i la desviació típica 15, i volem
transformar (estandarditzar) el valor 75 a Z, com ho em de fer?
𝒙 − 𝝁 𝟕𝟓 − 𝟏𝟎𝟎
𝒁= 𝒁= = 1,66
𝝈 𝟏𝟓