Professional Documents
Culture Documents
vo U
Estadística – Grau Bioquímica
Tema 5. Models continus.
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística
iq ad
M st
1
Funció de distribució discreta vs continua
B
vo U
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 3
iq ad
M st
la densitat discreta
pren valors positius únicament en els punts del recorregut
t.
la densitat continua
pren valors en el conjunt dels reals
no és una probabilitat, en particular, no està acotada per 1
D
2
Probabilitat en intervals: densitat continua
B
b
p ( X b) p ( X b ) F ( b) f ( x ) dx
vo U
al a -
cua dreta de la distribució
p( X a ) p( X a ) 1 F (a ) f ( x) dx
l C tic a
ue ís
Miquel Calvo - Departament d’Estadística 5
iq ad
M st
b
a
f ( x ) dx F (b) F ( a )
ep
p( a X b )
p( a X b )
p( a X b )
p( a X b )
D
tota v.a. absolutament continua verifica:
f ( x ) dx 1
3
El model Uniforme
el model continu més simple: la variable pren valors dins l’interval definit pels
paràmetres a i b imposant la condició que tots els intervals de mateixa longitud
continguts en [a,b] tinguin la mateixa probabilitat de ser observats
B
és el model probabilístic corresponent a triar un nombre real a l’atzar dins de [a, b]
la funció de densitat es defineix com
vo U
1
f ( x) on a x b
ba
al a -
la uniforme (0,1) es representa com:
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 7
iq ad
M st
El model Uniforme - 2
E
F ( x) f (t )dt dt si a x b
0 ba ba
per tant en el cas de la U(0,1)
ep
F ( x) x si 0 x 1
D
4
Esperança i variància dels models continus
• sigui X una v.a. absolutament continua amb funció de densitat f(x). L'esperança
matemàtica de X és (suposant que existeixi la integral.)
B
E ( X ) x f ( x ) dx
vo U
la variància d'una v.a. quantifica la dispersió respecte a la seva esperança. És un
paràmetre de dispersió. La definició és:
var( X ) E (( X E ( X )) 2 ) ( x E ( X ) 2 f ( x ) dx
al a -
i és el promig teòric de las desviacions al quadrat dels diferents valors que pren la
variable respecte al seu valor mig teòric o esperança.
una expressió equivalent tant per discretes com per contínues és:
l C tic var( X ) E ( X 2 ) E 2 ( X )
ue ís
Miquel Calvo - Departament d’Estadística 9
iq ad
M st
El model Uniforme - 3
E
b
t.
b x x2 b2 a 2 b a
E( X ) x f ( x )dx dx
a ba 2(b a ) a 2(b a ) 2
ep
b
b x2 x3 b3 a 3 b2 ab a 2
E( X 2 ) dx
a ba 3(b a ) a 3(b a ) 3
D
b2 ab a 2 b a b a
2 2
var( X )
3 2 12
5
B
vo U
El model normal
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 11
iq ad
M st
El model Normal
E
1 ( x )2
f ( x) exp on - x
2 2 2
D
6
Els paràmetres μ i σ en el model Normal
E(X) = μ
B
Simètrica respecte a la mitjana μ
Mitjana, moda i mediana són iguals (μ)
vo U
al a -
Var(X) = σ2, la desviació típica és σ.
l'àrea sota la densitat entre -∞ i x
correspon (com a totes les contínues)
l C tic
al valor de la distribució en el punt x:
ue ís
Miquel Calvo - Departament d’Estadística 13
iq ad
M st
7
Densitat i distribució del model Normal
en principi, la distribució es calcula integrant la funció de densitat:
x
1 (t ) 2
F ( x ) p( X x ) exp dt
B
2 2 2
malauradament, no hi ha una expressió analítica per aquesta integral. Si no es
vo U
poden calcular probabilitats directament, com solucionar el problema ?
una possibilitat és aproximar la integral mitjançant tècniques de càlcul
numèric. Però μ i σ poden prendre infinits valors, caldria avaluar la integral
per cada possible parella de valors.
al a -
una propietat important es refereix a la seva transformació lineal:
si X ~ N(μ,σ) i definim Y = aX+b (amb a ≠ 0), aleshores Y ~ N(aμ+b , |a|σ)
aquesta propietat permet resoldre la integració numèrica en termes d'una
l C tic
única normal: aquesta densitat de referència és la normal tipificada N(0,1)
ue ís
Miquel Calvo - Departament d’Estadística 15
iq ad
M st
X x x x
FX ( x ) p( X x ) P P Z FZ
t.
5,06 3
FX (5,06) p( X 5,06) P Z FZ 1,03
2
les taules estadístiques que es poden trobar en molts texts clàssics no s'utilitzen
actualment, es pot aconseguir accés fàcilment tant a programes específics (paquets
estadístics com R) o els d‘ús general (fulls de càlcul com Excel o Calc)
8
Calcular probabilitats amb R
per tal de calcular FZ (1,03), la crida a pnorm amb tots els paràmetres és
B
la normal tipificada permet escurçar la crida utilitzant les opcions per defecte
vo U
també podem evitar la tipificació
al a -
alguns valors extrems amb Z
l C tic
qualsevol normal inclou el 99.7% de valors a ± 3σ
ue ís
Miquel Calvo - Departament d’Estadística 17
iq ad
M st
per calcular el quantil que acumula el 95% d’una Z la crida a qnorm és:
t.
de nou, amb Z podem escurçar la crida utilitzant les opcions per defecte
ep
o evitar la tipificació
D
9
Alguns exemples de càlculs
El pes dels individus d'una població té distribució normal amb paràmetres que
depenen del sexe: els homes tenen una distribució N(μ=76; σ=5), i les dones una
N(μ=68 ; σ=6). En aquest context:
B
1. S'escull un home a l'atzar, quina probabilitat té de pesar entre 72 i 78 kg?
vo U
2. Quina és la proporció de dones de més de 76 kg? I la d'homes?
al a -
4. En la població de dones, quin és el pes corresponent al tercer quartil?
l C tic
l’assignatura per tal de resoldre les 4 qüestions amb R-Commander. Aquest
document inclou també les comandes de R de les 2 transparències anteriors.
ue ís
Miquel Calvo - Departament d’Estadística 19
iq ad
M st E
t.
ep
10
Combinacions lineals de Normals
la suma de 2 v.a normals independents és també normal, i per extensió, també ho
és qualsevol combinació lineal de normals independents
B
cas particular: si considerem n v.a. independents amb distribució Xi ~ N(μi,σi) per
a i=1 , 2 , ... , n la suma X1 + X2+ ... + Xn, té com a model:
n
vo U
n n
X i ~ N i ,
i 1 i
2
i 1 i 1
si les n v.a. tenen idèntica distribució Xi ~ N(μ,σ) aleshores es simplifica a:
al a -
n
1 n
X
i 1
i ~ N n , n , Xn X i ~ N , n
n i 1
exemple: assumim que el pes dels homes ~ N(76;5) i el de les dones ~ N(68;6).
l C tic
Un edifici disposa d'un ascensor que admet una carrega màxima de 300 Kg.
Calculeu la probabilitat que el ascensor no arranqui per excedir el pes:
1. quan pugen 4 dones 2. quan pugen 2 dones i 2 homes
ue ís
Miquel Calvo - Departament d’Estadística 21
iq ad
M st
Sumes de binomials
E
a continuació es representen les binomials amb n=5, 20 i 50, totes 3 amb p=0.5
ep
(punts negres) juntament amb la densitat normal (corba vermella), de mitjana n/2 i
variància n/4.
D
11
Sumes de Poissons
en sumar 2 Poissons independents resulta una nova variable que també és Poisson.
per tant, una variable aleatòria Poisson X~P(λ) es pot considerar com una suma de
B
n Poissons independents de la forma:
X1+...+Xn ~ P(λ) i cada Xi ~ P(λ/n)
vo U
així, si considerem la Poisson Pn ~ P(n), es pot considerar la suma de n P(1).
a continuació es representen les Poissons amb λ=1, 5 i 20, (punts negres)
juntament amb la densitat normal (corba vermella) amb μ = λ i σ2 = λ.
al a -
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 23
iq ad
M st
12
Aproximacions de la binomial
1er resultat demostrat de convergència a una normal per de Moivre, 1733.
L
B ( n, p ) N np , npq
B
l'estudi numèric de l'error comès al aproximar la binomial per la normal permet
establir regles generals per una binomial amb n finit:
vo U
n ≥ 30 0.1 ≤ p ≤ 0.9 aproximar a normal mitjana μ=np, σ2=np(1-p)
n ≥ 30 0 < p < 0.1 aproximar a Poisson λ=np
n ≥ 30 0.9 < p < 1 aproximar la v.a. recíproca* a Poisson λ=n(1-p)
al a -
n < 30 p qualsevol no aproximar, calcular amb variable original
nota: si la binomial correspon al nº de vegades que apareix A en n repeticions, la
variable recíproca serà el nº de vegades que apareix AC, per tant, una B (n, 1-p).
Exemples:
l C tic
1. una B (36; 0,5) és aprox. N(18, 3).
3. una B (100; 0,01) és aprox. P(1).
2. una B (100; 0,9) és aprox. N(90, 3).
4 una B (100; 0,95) s'aproxima mitjançant
la recíproca, (B(100;0,05)), aprox. P(5).
ue ís
Miquel Calvo - Departament d’Estadística 25
iq ad
M st
k 0,13 0,87
k 0
representa un cert esforç numèric. En canvi, plantejat en termes aproximats:
X ~ N 1000 0,13, 1000 0,13 0,87 N (130,10,635)
100 130
prob( X 100) 1 prob Z 1 prob Z 2,821
10,635
1 (1 0,9976) 0,9976
Miquel Calvo - Departament d’Estadística 26
13
Aproximacions de la Poisson
asimptòticament Normal de mitjana nλ y variància nλ.
L
P ( ) N ,
B
l'estudi numèric de l'error comès al aproximar la Poisson per la normal permet
vo U
establir regles generals per una Poisson amb λ finit:
al a -
Exemples:
1. una Poisson (16) és aproximadament una normal (16, 4).
l C tic
2. una Poisson (100) és aproximadament una normal (100, 10).
3. una Poisson (5) no es pot aproximar.
ue ís
Miquel Calvo - Departament d’Estadística 27
iq ad
M st
per exemple, un estudi sobre el pes dels homes de 18 anys a Catalunya presenta el
següent histograma:
D
14
Variables aproximadament normals (2)
B
es pot associar a la suma de moltes variables, amb diferents grau d'influència. El
vo U
TCL explica que aparegui una distribució aprox. normal.
al a -
biomètriques (alçades, longituds, concentracions metabòliques, distribucions
d'edat, ...) així com de la de moltes variables quantitatives d’altres camps del
coneixement com de les ciències experimentals, socials, les enginyeries, ...
Material complementari
D
15
El model Exponencial
associat a variables que mesuren l’interval de temps/longitud/àrea/volum que
transcorre entre 2 esdeveniments en un procés de Poisson, on els esdeveniments
succeeixen contínua i independentment d’acord a una taxa en promig constant.
B
1 x
f ( x ) exp on 0 x
la funció de densitat es defineix com
vo U
x
de forma que la distribució és F ( x ) 1e t / dt 1 e x / si x 0
0
i els paràmetres principals
al a -
E(X) = α, var(X) = α2
l C tic
l’exponencial Exp(α) recull la magnitud
de l’interval entre 2 esdeveniments
consecutius. En aquest context, λ= α-1
ue ís
Miquel Calvo - Departament d’Estadística 31
iq ad
M st
de forma intuïtiva 2 v.a. són independents si el valor que pren una d'elles no
afecta a la probabilitat de cap valor de l'altre.
llançant un dau i una moneda les v.a "Puntuació del dau“ i "Indicador de cara".
altres cops només es pot intuir la possible dependència: per exemple. "alçada en
cm." i "pes en Kg."
16
Independència de variables aleatòries (2)
la definició formal passa per recordar la regla del producte per 2 esdeveniments.
Aplicant la definició a esdeveniments del tipus X ≤ a :
B
2 v.a. X, Y són independents si i només si
P( X ≤ a ∩ Y ≤ b ) = P( X ≤ a ) ꞏ P( Y ≤ b ) = FX(a) ꞏ FY(b)
vo U
una conseqüència immediata de la independència de X i Y és que
al a -
P( a < X ≤ c ∩ b < Y ≤ d ) = P( a < X ≤ c ) ꞏ P( b < Y ≤ d )
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 33
iq ad
M st
17
Sumes de variables aleatòries
la suma de 2 v.a. X1, X2 , definides sobre Ω, correspon a la següent aplicació: :
B
vo U
la suma de 2 v.a. pot generalitzar-se a sumes de 3, 4,... i, en general, n variables aleatòries.
el TCL s'ocupa de successions de v.a.: un conjunt on el 1er element és una v.a, el 2on la
suma de 2 v.a., el 3er una suma de tres, i així successivament.
al a -
una successió és un conjunt amb ∞ elements, designat simbòlicament com {Xn}.
cada element de {Xn} porta associada una determinada funció de distribució:
l C tic Xn → Fn
ue ís
Miquel Calvo - Departament d’Estadística 35
iq ad
M st
Aleshores
ep
Corolꞏlaris importants
D
18
Taula de la funció de distribució N(0,1)
B
vo U
F(1,03) = 0,8485
al a -
F-1(0,9798) = 2,5
l C tic
ue ís
Miquel Calvo - Departament d’Estadística 37
iq ad
M st
F(4) = 0,99997
D
F(1,645) = 0,950
19