You are on page 1of 16

Семинарска задача

Теорија на веројатност и математичка статистика за инжењери

Содржина:

1. Дефиниција и основни поими на математичка статистика


2. Претставување на статистички податоци (табеларно и графички)
3. Карактеристики на емпириската распределба (аритметичка средина и
дисперзија)
4. Нормална распределба ( карактеристики, параметри, примери)
5. Тест на Колмогоров и χ2 тест

Пример:

Tежината во килограми на 100 студенти од еден факултет е дадена во следната


табела:

69.5 70.2 70.6 71.1 71.6 72.1 72.6 73.4 73.9 74.1
74.9 75.1 70.9 71.2 71.7 72.1 72.7 73.1 73.8 74.3
74.8 75.4 71.4 71.9 72.3 72.8 73.2 73.7 74.2 73.7
71.2 71.6 72.4 72.9 73.3 73.6 74.4 74.9 71.3 71.8
72.3 72.9 73.1 73.6 74.3 71.9 72.2 72.7 73.4 73.8
74.1 71.6 72.2 72.8 73.3 73.9 74.2 71.7 72.1 72.6
73.2 73.9 74.4 71.6 72.4 72.6 73.2 73.6 74.1 72.3
72.9 73.4 73.8 74.2 72.2 72.9 73.1 73.8 72.4 72.8
73.1 74.7 72.2 72.7 73.3 72.9 72.6 72.6 72.7 72.8
72.9 72.7 73.2 73.4 73.1 73.2 73.3 73.4 73.3 73.1

Да се нацрта хистограм и полигон на емпириска распределба, да се пресмета средна


вредност и стандардното отстапување и да се провери со тест по избор дали
распределбата на резултатите од мерењата може да се смета за нормална (Гаусова)
распределба.
1. Definicija i osnovni poimi na matemati~ka statistika

Matemati~kata statistika, kako {to ka`uva i samiot naslov, e matemati~ka


disciplina. Nejzinata to~na formulacija po~nala da se razviva od dvaesettite
godini na XX vek.
Statistikata mo`e da se definira kako kvantitativna metoda. Imeno, taa gi
ispituva pojavite na pove}e slu~ai, a ne individualno, i zatoa takvoto ispituvawe
ima kvantitativen, a ne kvalitativen karakter. Bidej}i individualnite slu~ai
poka`uvaat pomalo ili pogolemo otstapuvawe od prose~noto, neophodno e tie da se
ispituvaat vo golem broj, vo masa, so cel vo niv da se otkrie ona {to e op{to i
zakonito - zakonitosta se manifestira vo masa; taa ima masoven karakter.
Predmet na izu~uvawe na matemati~kata statistika se mno`estvata, ~ii
elementi se objekti ili pojavi od razsli~en karakter. Tie mno`estva }e gi
narekuvame statisti~ki mno`estva ili populacija, a nivnite elementi
statisti~ki edinki. Edinkite na edno statisti~ko mno`estvo se povrzani
me|usebno se nekoe obele`je, koe se menuva od edna do druga statisti~ka edinka.
Zna~i obele`jeto e karakteristika na populacijata.
Osnovna karakteristika na statisti~koto mno`estvo e homogenosta. Toa zna~i
statisti~kite edinki razgleduvani vo celost se sli~ni, a poka`uvaat razliki samo
vo odnos na obele`jeto koe se ispituva. Statisti~kite edinki mora da se istorodni,
primer transportni sredstva za prevoz na stoka, transportni sredstva za prevoz na
patnici i sli~no.
Sekoja statisti~ka edinka ima golem broj obele`ja. Pri razgleduvaweto na
odredena pojava nekoi od tie obele`ja se su{tinski, a nekoi ne. Primer, ako go
razgleduvame proizvodstvoto na edno transportno pretprijatie, toga{ su{tinski
obele`ja }e bidat koli~inata i vidot na prenesenata stoka, brojot, vidot i
tehni~kata ispravnost na transportnite sredstva, vozrasta i rabotniot sta` na
rabotnicite i sli~no, dodeka nesu{tinski obele`ja }e bidat nacionalnosta,
semejnata polo`ba na rabotnicite i sli~no.
Obele`jata isto taka se delat na numeri~ki i atributni. Numeri~kite obele`ja
se izrazuvaat samo so broj, a atributnite samo opisno. Primer, starosta, visinata,
te`inata se numeri~ki obele`ja, dodeka polot, zanimaweto se atributni obele`ja
na ~ovekot.
Statistikata gi izu~uva su{tinskite, numeri~ki obele`ja na edno statisti~ko
mno`estvo, pa zatoa takvite obele`ja se narekuvaat statisti~ki obele`ja.
Ako se izu~uva samo edno obele`je na edinkite na statisti~koto mno`estvo,
toga{ velime deka statisti~koto mno`estvo e ednodimenzionalno, vo sprotivno
zboruvame za pove}edimenzionalno statisti~ko mno`estvo.
Vo matemati~kata statistika se smeta deka obele`jeto e slu~ajna promenliva i
se ozna~uva so X, Y, Z...
Vo praksa retko se vr{i ispituvawe na celo statisti~ko mno`estvo, bidej}i toa
mo`e da ima golem broj na elementi ili so ispituvaweto da se uni{tuvaat
elementite na toa mno`estvo ili pak da e skapo ispituvaweto. Primer, ako se
ispituba kvalitet na edna serija avtomobili, toga{ bi trebalo da se ispita sekoj
proizveden avtomobil, {to bi nanelo ogromna {teta. Zatoa od statisti~koto
mno`estvo se bira edno podmno`estvo, nare~eno primerok. Brojot na elementi na
primerokot se narekuva obem na primerokot. Vo matemati~kata statistika,
postapkata na ispituvawe e sledna: se vr{at site ispituvawa na primerokot, se
dobivaat rezultati, vrz baza na tie rezultati se izveduvaat zaklu~oci i se smeta
deka tie va`at za celo statisti~ko mno`estvo, no so odredena verojatnost. Zatoa,
neophodno e primerokot da bide reprezentativen, t.e. pravilno da ja pretstavuva
populacijata, sekoja edinka da ima ednakvi {ansi da vleze vo primerokot i toj da
bide dovolno broen. ^esto, primerokot se narekuva populacija vo malo. Teoriski,
eden primerok da e reprezentativen, zna~i da e rezultat na nezavisni i ednakvi
eksperimenti.
Od teorija na verojatnost znaeme deka potpolna karakteristika na slu~ajnite
promenlivi e nivnata raspredelba. Obi~no ovaa raspredelba se narekuva teoriska
raspredelba i se ozna~uva so F(x), za razlika od raspredelbata na frekvenciite na
primerokot koja se narekuva empiriska raspredelba i se ozna~uva so F,(x), pri {to n go
ozna~uva obemot na primerokot.
Matemati~kata vrska pome|u populacijata i primerokot se zadava preku vrskata
pome|u F(x) i F,(x). So ovoj problem se zanimavale pove}e matemati~ari kako
Kolmogorov, Smirnov, Glivenko i dr.
Teorema na Glivenko: Ako vrednostite na obele`jeto H me|u sebe se nezavisni,
toga{:
P(sup ‫ ׀‬Fn(x) - F(x) ‫→׀‬0)=1
Ovaa teorema go ima slednoto zna~ewe: Dokolku primerokot e dovolno golem,
toga{ so verojatnost pribli`no ednakva na eden empiriskata raspredelba se
razlikuva od teoriskata. Zna~i, kolku primerokot e pobroen tolku e
poreprezentativen. Vo praksa ~esto se slu~uva od interes da se samo srednata
vrednost i standardnoto otstapuvawe na obele`jeto H, a ne i funkcijata na
raspredelbata. Se postavuva pra{awe dali za opredeluvawe na tie parametri e
potrebno da se znae i funkcijata na raspredelba na obele`jeto. Spored teoremata
na Glivenko, bidej}i za dovolno golema vrednost na n empiriskata raspredelba
malku se razlikuva od teoriskata, pa i parametrite na dvete raspredelbi me|u sebe
malku }e se razlikuvaat. Zna~i parametrite presmetani za primerokot, mo`at da se
iskoristat za ocenka na parametrite na populacijata. Tuka se sre}avame so eden nov,
dosta va`en poim od statistikata - ocenka ili estimacija. Vo matemati~kata
statistika postoi cela oblast koja gi izu~uva ocenkite, nare~ena teorija na ocenki.

2. Pretstavuvawe na statisti~ki podatoci (tabelarno i grafi~ki)

Od podatocite dobieni pri nabquduvawe ili eksperiment te{ko e odma da se


sogleda bilo kakva pravilnost. Zatoa e potrebno da se izvr{i nekoe podreduvawe i
da im se zadade pogoden oblik za ponatamo{no ispituvawe. Vo taa podgotovka spa|a
formiraweto na tabeli, koe ja olesnuva ponatamo{nata statisti~ka analiza.
Neka obele`jeto H prima n vrednosti h1, h2 ........ hn, koi se pojavuvaat vo N
eksperimenti, soodvetno f1, f2 ..... fn pati. Veli~inite f1, f2 ..... fn go ispolnuvaat
uslovot
f1+ f2 +.....+ fn = N
i se narekuvaat apsolutni frekvencii ili samo frekvencii. Veli~inite h1,
h2........hn go so~inuvaat primerokot ili empiriskata populacija. Vrednostite h1, h2
........ hn podredeni vo raste~ki redosled, zaedno so soodvetnite frekvencii ja
formiraat statisti~kata tabela:
X x1 x2 ....... xn
fx f1 f2 ....... fn N

Geometriskata ilustracija na statisti~kata tabela se narekuva poligon na


empiriskata raspredelba.
POLIGON NA EMPIRISKA RASPREDELBA

x1 x2 x3 x4 x5 x6 … … … … … xn x

Ako brojot na podatoci N i brojot na vrednosti {to gi prima obele`jeto H e


golem, toga{ intervalot (a,b), se deli na n,
Interval sredina na intervalot frekvencija
u0 do u1 x1 f1
u1 do u2 x2 f2
....... ....... .......
un-1 do un xn fn
N

podintervali ili klasi: (a=u0,u1), (u1,u2)...... (un-1,b=un), ~ii sredini se


 u + u1 
x1  x1 = 0 , x 2 ,........, x n . Frekvenciite f1, f2 ..... fn ozna~uvaat kolku vrednosti na H se
 2 
nao|aat vo prviot, vtoriot, ...... , n - tiot interval, soodvetno, pri {to vo nekoi
intervali treba da se vklu~at i grani~nite vrednosti. Vo ovoj slu~aj tabelata so
raspredelbi na frekvenciite ima oblik kako vo Tabela 2. Geometriskata
ilustracija na ovaa tabela se narekuva histogram na raspredelbata na
frekvenciite. Histogramot e niza od pravoagolnici, ~ija edna strana le`i na h-
oskata i ja ozna~uva dol`inata na intervalot, a visinata im e ednakva na
frekvencijata na sekoj od intervalite.
f HISTOGRAM NA EMPIRISKA RASPREDELBA

x1 x2 x3 x4 x5 x6 … … … … … xn x
3. Karakteristiki na empiriskata raspredelba (aritmeti~ka sredina i
disperzija)

Kako {to raspredelbata na verojatnostite na slu~ajna promenliva se


karakterizira so sredna vrednost i standardno otstapuvawe, taka i empiriskata
raspredelba na oble`jeto se opi{uva so karakteristiki koi ~esto se narekuvaat
statistiki i pretstavuvaat funkcii od vrednostite na obele`jeto h1, h2 ........ hn i
soodvetnite frekvencii f1, f2 ..... fn.

Aritmeti~ka sredina

Pod sredna vrednost x na statisti~ko mno`estvo se podrazbira veli~inata:


1 n n 
x = ∑ xi f i , ∑ f i = N 
N i =1  i =1 
koja se narekuva aritmeti~ka sredina na vrednostite na obele`jeto H so
frekvencii f1, f2 ..... fn. Srednata vrednost e najprosta i najva`na od site
karakteristiki na centarot na rasturawe. Ako broevite hi se golemi i poradi toa
presmetuvaweto na x e ote`nato, za poednostavno presmetuvawe se voveduva t.n.
rabotna nula x0 na sledniot na~in:
n n n
1 1 1 1 n
x=
N

i =1
f i xi =
N

i =1
f i ( x1 − x0 + x0 ) =
N

i =1
f i ( x1 − x 0 ) + ∑ f i x0 ,
N i =1
n
1
t.e. x = ∑ f i ( xi − x 0 ) + x 0 .
N i =1
Brojot h0 e proizvolen i se bira taka da proizvodite f i ( xi − x0 ) se {to pomali
pogodni za brzo presmetuvawe. Presmetuvaweto u{te pove}e se poednostavuva so
voveduvawe na vrednostite:
x − x0
ti = i ,
d
kade d e {irina na intervalot. So toa za aritmeti~kata sredina imame:
d n
x = ∑ f i t i + x0 .
N i =1
Za presmetuvawe na aritmeti~kata sredina, statisti~kata tabela se pro{iruva
so novi koloni za vrednostite t i i proizvodite f i t i .
Svojstva na aritmeti~kata sredina:
• Aritmeti~kata sredina x sekoga{ e pogolema od najmalata vrednost na
obele`jeto H. So drugi zborovi, ako vrednostite na obele`jeto H se podredeni
vo golemina taka {to x1 < x 2 < ..... < x n toga{ x1 < x < x n .
• Zbirot od otstapuvawata na vrednostite na obele`jeto H od nivnata sredna
vrednost zemena tolku pati kolku {to se pojavuva sekoja vrednost na
n
obele`jeto e ednakva na nula, t.e. ∑ f (x
i =1
i i − x) = 0

• Zbirot od kvadratite od otstapuvawata na vrednostite na obele`jeto H od


aritmeti~kata sredina e pomal od zbirot od kvadratite od otstapuvawata na
vrednostite na obele`jeto H od proizvolna druga veli~ina, t.e.
n n

∑ f (x
i =1
i i − x) 2 < ∑ f i ( xi − a ) 2 , za a ≠ x .
i =1

• Neka S1 e statisti~ko mno`estvo so n1 elementi i aritmeti~ka sredina x1 , a


S 2 e statisti~ko mno`estvo so n 2 elementi i aritmeti~ka sredina x 2 . Toga{
statisti~koto mno`estvo S {to se sostoi od statisti~kite mno`estva S1 i S 2
n1 x1 + n 2 x 2
so n1 + n 2 elementi ima aritmeti~ka sredina x = .
n1 + n 2

Disperzija

Za statisti~koto obele`je H koe prima n vrednosti x1 , x 2 ,....., x n so frekvencii


n
f 1 , f 2 ,....., f n (∑ f i = N ) se poka`uva deka najdobra mera na rasturaweto e sredniot
i =1

kvadrat na otstapuvawata na vrednostite xi od aritmeti~kata sredina x :


1 n 1 n 2
s = ∑ f i ( x i − x) = ∑ xi f i − x .
2 2 2

N i =1 N i =1
Sredniot kvadrat na otstapuvawata s 2 empiriski soodvetstvuva na disperzijata σ 2
i zatoa se narekuva u{te i empiriska disperzija.

4. Normalna raspredelba (karakteristiki, parametri, primeri)

Normalnata raspredelba ja vovel germanskiot matemati~ar Karl Gaus,


obrabotuvaj}i gi rezultatite od merewata, a posebno pri ocenuvaweto na gre{kite.
Zatoa u{te se narekuva Gausova raspredelba.
Normalnata raspredelba ima najgolemo zna~ewe me|u raspredelbite na
neprekinata slu~ajna promenliva od slednite pri~ini:
a. Mnogu slu~ajni promenlivi koi se odnesuvaat na nastani od prirodata
imaat normalna raspredelba.
b. Golem broj slu~ajni promenlivi aproksimativno imaat normalna
raspredelba.
c. Ako edna slu~ajna promenliva nema normalna raspredelba ni
aproksimativno, toga{ mo`e da se transformira vo normalna slu~ajna
promenliva so soodvetna transformacija.
d. Nekoi poslo`eni raspredelbi mo`at da se aproksimiraat so normalna
raspredelba.
e. Nekoi slu~ajni promenlivi koi se koristat pri proveruvaweto na
statisti~kite testovi imaat normalna raspredelba.
Neprekinatata slu~ajna promenliva H ima normalna raspredelba so parametri
µ i σ , i se ozna~uva X ≈ N ( µ , σ ) , ako nejzinata gustina na raspredelba na
verojatnostite e od oblik
( x− µ )2
1
f ( x) = e 2σ 2
, za − ∞ < x < ∞ .
σ 2π

Da poka`eme deka gustinata na raspredelba go ispolnuva uslovot ∫ f ( x)dx = 1 . Ako vo
−∞

x−µ
integralot ∫ f ( x)dx
−∞
zamenime t =
σ
, dobivame

∞ t2 ∞ u2 ∞ ∞ 1
1 − − 1 − ( u 2 +t 2 )

2π −∫∞ ∫−∞ 2π −∫∞−∫∞


I = 2
e 2
dt e 2
du = e 2
dudt .

Voveduvaj}i polarni koordinati u = r cos θ , t = r sin θ , imame dudt = rdrdθ , za 0 ≤ θ ≤ 2π


i 0 ≤ r < ∞ . Sleduva

2π ∞ r2  −r 
2
1 − 1
I2 = ∫ ∫ re 2
drdθ = [θ ]02π − e 2  = 1,
2π 0 0
2π   0
{to go poka`uva ravenstvoto
∞ ( x−µ )2
1 −
I= ∫e
2π − ∞
dx = 1 . 2σ

Grafikot na gustinata na raspredelba za normalnata raspredelba e vo oblik na


 1 
osen presek na yvono so maksimum vo to~kata  µ ,  i simetri~en odnos na
 σ 2π 
pravata x = µ , {to zna~i deka M e = µ .

Brojni karakteristiki na normalnata raspredelba:


Bidej}i funkcijata izvodnica e
∞ ( x−µ )2
1 −
g x (t ) = M (e ) = ∫e 2σ 2
dx =
tX tx
e
−∞ σ 2π


1 −
1
[x 2
− 2 x ( µ + tσ 2 ) + µ 2 ] ∞
1 −
1 
(
2σ 2 
)
x − µ −tσ 2 − 2 µtσ 2 − t 2σ 4 
2

=
−∞
∫σ 2π
e 2σ 2
dx =
−∞
∫σ 2π
e dx =

1 −
µt + t 2σ 2
1 [x − (µ + tσ 2 )]
∞ 1 2

=e ∫ 2

− ∞ σ 2π
e 2σ 2
dx ,

a integralot e ednakov na edinica, imame


1
µt + t 2σ 2
g x (t ) = e 2
, od kade sleduva
1
µt + t 2σ 2
g x ' (t ) = ( µ + tσ 2 )e 2
i
M ( X ) = m1 = g x ' (0) = µ .
Nao|aj}i go vtoriot izvod
1 1
g x ' ' (t ) = σ 2 e 2
µt + r 2σ 2
+ µ + tσ 2 e 2 , ( ) 2 µt + r 2σ 2

dobivame
m 2 = g x ' ' ( 0) = σ 2 + µ 2 .
Spored toa,
D ( X ) = m 2 − m12 = σ 2 + µ 2 − µ 2 = σ 2 .

Verojatnosta slu~ajnata promenliva X ≈ N (µ ,σ ) da primi vrednost od


intervalot (a, b) e
b b ( x−µ )2
1 −
P (a < X < b) = ∫ f ( x)dx = ∫e 2σ 2
dx .
a σ 2π a
Vr{ej}i normirawe (standardizirawe) na slu~ajnata promenliva H so slu~ajnata
X −µ
promenliva T = , koja ima normalna raspredelba N (0,1) , imame:
σ
t2 t2
a−µ X −µ b−µ 1 −
P ( a < X < b) = P (
σ
<
σ
<
σ
) = P (t1 < T < t 2 ) =

∫e
t1
2
dt ,

t2
a−µ b−µ −
kade t1 =
σ
i t2 =
σ
. Bidej}i neopredeleniot integral ∫e 2
dt nema primitivna
funkcija, vrednostite na opredeleniot integral za razli~ni vrednosti na t (0,00;
0,01; 0,02;....) se presmetani i se dadeni vo tabela kako vrednosti na funkcijata
t u2
1 −
Φ (t ) =
2π 0
∫ e du , 2

koja se narekuva funkcija na Laplas ili Laplasova funkcija. Taa gi ima slednite
svojstva:
1) Φ (0) = 0 , bidej}i za t = 0 granicite na integralot se poklopuvaat;
∞ u2 ∞ u2
2π − −
2) Φ (+∞) = 0.5 , bidej}i od
−∞ 0
2 ∫e
, pa Φ (−t ) = −Φ (t ) . 2
du = 2π , imame ∫ e 2
du =

3) Funkcijata na raspredelba za slu~ajna promenliva so normalna raspredelba


mo`e da se izrazi preku Laplasovata funkcija na sledniot na~in:

X −µ x−µ x−µ x−µ


F ( x) = P (−∞ < X < x) = P (−∞ < < ) = P (−∞ < T < ) = P (−∞ < T < 0) + P (0 < T < )
σ σ σ σ
odnosno
x−µ
F ( x ) = 0 .5 + Φ  .
 σ 
Dodeka pak verojatnosta slu~ajnata promenliva X ≈ N ( µ , σ ) da primi vrednost
od intervalot (a, b) izrazena preku Laplasovata funkcija e od oblik
t2 t2 t2 t2 t1 t2
1 − 1 − 1 −
P ( a < X < b) =

∫e
t1
2
dt =
2π −∞
∫e 2
dt −

∫e
−∞
2
dt =

t2 t2 t1 t2
1 − 1 −
= 0 .5 +

∫e
0
2
dt −

∫e
0
2
dt = Φ(t 2 ) − Φ(t1 )
Se postavuva i obratnoto pra{awe, odnosno dali mo`e na apcisnata oska da se
odredi interval na koj slu~ajnata promenliva H prima vrednosti so odnapred
zadadena verojatnost p ? Zna~i zada~ata se sveduva na odreduvawe na simetri~en
interval okolu srednata vrednost µ vo koj slu~ajnata promenliva H }e gi prima
vrednostite so verojatnost p , t.e.
P( µ − a < X < µ + a ) = p .
Imame
 a X −µ a  a a
P − < <  = p ili P − < T <  = p ,
 σ σ σ  σ σ
od kade
a  a a
Φ  − Φ −  = p ili 2Φ  = p
σ   σ σ 
a p
t.e. Φ  = .
σ  2
Zna~i zada~ata se sveduva na opredeluvawe na vrednost t 0 , koja se ~ita od
tablicata za Laplasova funkcija i a = σt 0 .
Primer: Slu~ajnata promenliva H ima normalna raspredelba N (0,1) . Da se
odredi:
1) P (0 < X < 1.42) ;
2) P (−0.73 < X < 0) ;
3) P (−1.37 < X < 2.01) ;
4) P (0.65 < X < 1.26) ;
5) P (−1.79 < X < −0.54) ;
6) P ( X > 1.13) ;
7) P ( X > 0.5) ;
8) t , ako P ( X < t ) = 0.7967 ;
9) t , ako P (t < X < 2) = 0.3772 .

Re{enie:
1) P (0 < X < 1.42) = Φ (1.42) = 0.4222

2) P (−0.73 < X < 0) = P (0 < X < 0.73) = Φ (0.73) = 0.2673

3) P (−1.37 < X < 2.01) = P (−1.37 < X < 0) + P(0 < X < 2.01) =
= Φ (1.37) + Φ (2.01) = 0.4147 + 0.4778 = 0.8925
4) P (0.65 < X < 1.26) = P (0 < X < 1.26) − P (0 < X < 0.65) =
= Φ (1.26) − Φ (0.65) = 0.3962 − 0.2422 = 0.1540

5) P (−1.79 < X < −0.54) = P (0.54 < X < 1.79) = Φ (1.79) − Φ (0.54) = 0.4633 − 0.2054 = 0.2579

6) P ( X > 1.13) = P ( X > 0) − P (0 < X < 1.13) = 0.5 − Φ (1.13) = 0.5 − 0.3708 = 0.1292

7) P ( X > 0.5) = P (−0.5 < X < 0.5) = 2 P (0 < X < 0.5) = 2Φ (0.5) = 2 ⋅ 0.1915 = 0.3830
8) Bidej}i P ( X < t ) = 0.7967 e verojatnost pogolema od 0.5, treba
P (0 < X < t ) = P ( X < t ) − 0.5 = 0.7967 − 0.5 = 0.2967 .
Od tablicata ~itame deka t = 0.83 .

9) Bidej}i P (0 < X < t ) = P (0 < X < 2) − P (t < X < 2) = 0.4772 − 0.3772 = 0.1 , od tablicata
dobivame deka t = 0.25 .
5. Test na Kolmogorov i χ 2 test

Hi - kvadrat test (Pirsonov hi-kvadrat test)

Kako mera na otstapuvaweto pome|u empiriskata i o~ekuvanata


(pretpostavenata) teoretska frekvencija, vo 1900 godina Pirson ja vovel hi-kvadrat
promenlivata:
( f 1 − f t1 ) 2 ( f 2 − f t 2 ) 2 ( f r − f tr ) 2 ( f i − f ti ) 2
r r 2
fi
χ =
2
+ + ... + =∑ =∑ −N (*)
f t1 ft2 f tr i =1 f ti i =1 f ti

kade f i e frekvencija na i -tata vrednost na slu~ajnata promenliva vo primerokot


ili frekvencija na i -tiot interval. f ti e soodvetnata teoretska frekvencija, r e
r r
brojot na intervali (klasi) i N = ∑ f i = ∑ f ti . Hi - kvadrat testot se primenuva za
i =1 i =1
verifikacija na hipotezata za sovpa|awe na empiriskata so pretpostavenata
teoretskat raspredelba, formiraj}i ja veli~inata χ 2 od gorniot oblik, pod uslov
teoretskite frekvencii f ti da se pogolemi od 5. Ako f ti <5, {to ~esto se slu~uva vo
po~etnite i krajnite intervali, toga{ tie intervali se priklu~uvaat vo sosednite.
Nekade, vo nekoja literatura, se prepora~uva teoretskite frekvencii f ti da ne
bidat pomali od 10.
Vo tabela (Hi - kvadrat raspredelba za P ( χ 2 > χ α2 ) = α ) za razni vrednosti na k
(stepenot na sloboda), se dadeni vrednostite na χ 2 koi odgovaraat na verojatnosta
α spored relacijata P ( χ 2 > χ α2 ) = α za α = 0.99;0.95;...;0.10;0.05;0.01 .
Verojatnosta α se narekuva kriti~en koeficient na hipotezata za sovpa|awe na
empiriskata i teoretskata raspredelba ( α e rizik za prifa}awe na hipotezata, a
1 − α e doverba za hipotezata). Vo praksa kriti~niot koeficient se bira ili da e
0.05 ili 0.01. Brojot na stepeni na sloboda se presmetuva od izrazot
k = r − l − 1,
kade r e broj na sobiroci vo sumata za χ 2 , a l e broj na nepoznati parametri vo
pretpostavenata raspredelba presmetani od primerokot. Taka, brojot na stepeni na
sloboda kaj ramnomernata raspredelba (l = 0) e k = r − 1 ; kaj binomnata raspredelba
k = r − 2 ; kaj normalnata k = r − 3 ; kaj Puasonovata k = r − 2 .
Imaj}i ja vrednosta za α i brojot na stepeni na sloboda k , od gorespomenatata
tabela ja ~itame vrednosta za χ α2 . Ako:
1) presmetanata vrednost χ α2 spored formulata (*) e pogolema od χ α2 , toga{
hipotezata ja otfrlame, smetaj}i deka se bitni otstapuvawata na empiriskata
raspredelba od pretpostavenata. Bidej}i vo ovoj slu~aj P ( χ 2 > χ α2 ) = α , mo`eme da
bideme sigurni deka ovie otstapuvawa se bitni; na{iot zaklu~ok bi bil ispraven
okolu 95% (99%) od slu~aite za α = 0.05 (α = 0.01) ;
2) presmetanata vrednost χ 2 e pomala od χ α2 , toga{ nemame osnova da ja
otfrlime hipotezata, {to ne zna~i deka hipotezata e potpolno to~na. Za da ja
prifatime hipotezata za to~na, treba da ja proverime na nekolku drugi primeroci.
Vo vrska so hi-kvadrat testot e testot na Romanovski, koj se sostoi vo
slednoto:
Otstapuvaweto na empiriskata od teoretskata raspredelba ima slu~aen
karakter, t.e. hipotezata se prifa}a ako
χ2 −k
< 3,
2k
a se otfrla, ako
χ2 −k
> 3,
2k
kade k e broj na stepeni na sloboda.

Test na Kolmogorov i Smirnov

Vo slu~aite koga empiriskata raspredelba se sporeduva so teoretskata


neprekinata raspredelba za verifikacija na hipotezata za nivno sovpa|awe se
koristi testot na Kolmogorov. Kolmogorov poka`al deka apsolutnata vrednost na
maksimalnata razlika pome|u empiriskata funkcija na raspredelba i
pretpostavenata teoretska
Dn = max Fn ( x) − F ( x)
− ∞< x <∞
(kade n e brojot na elementi na primerokot) e slu~ajna promenliva koja ima svoja
raspredelba na verojatnostite. Vsu{nost, toj do{ol do funkcijata na raspredelba na
verojatnostite na slu~ajnata promenliva Dn n :
λ ∞

∑ (−1) λ
2 2
lim P ( Dn n < λ ) = lim P ( Dn < ) = Q (λ ) = . k
e −2k
n k = −∞
Za razli~ni vrednosti na λ , vrednostite na Q (λ ) se dadeni vo tabela.
Neka pretpostavime deka obele`jeto H vo dadena populacija ima neprekinata
raspredelba okarakterizirana so funkcija na raspredelba F ( x) . Od nea
izvlekuvame primerok so najmalku deset elementi i ja formirame empiriskata
funkcija na raspredelba Fn ( x) i veli~inata Dn . Za da ja verifikuvame hipotezata
za sovpa|awe na empiriskata i pretpostavenata teoretska raspredelba so doverba
1 − α , vo tabelata nao|ame vrednost λα , taka da Q (λα ) = 1 − α . Ako Dn n < λα toga{
nema osnova da se otfrli hipotezata za sovpa|awe na empiriskata i
pretpostavenata teoretska raspredelba, a ako Dn n ≥ λα toga{ hipotezata ja
otfrlame so rizik α .
Testot na Kolmogorov mo`e da se koristi namesto hi-kvadrat testot vo pove}e
slu~ai. Sporeduvaj}i gi λ testot i χ 2 testot, bilo poka`ano deka λ testot na
Kolmogorov ima mnogu pomalku presmetuvawa (Walker i Lew).
Пример:

Tежината во килограми на 100 студенти од еден факултет е дадена во


следната табела:

69.5 70.2 70.6 71.1 71.6 72.1 72.6 73.4 73.9 74.1
74.9 75.1 70.9 71.2 71.7 72.1 72.7 73.1 73.8 74.3
74.8 75.4 71.4 71.9 72.3 72.8 73.2 73.7 74.2 73.7
71.2 71.6 72.4 72.9 73.3 73.6 74.4 74.9 71.3 71.8
72.3 72.9 73.1 73.6 74.3 71.9 72.2 72.7 73.4 73.8
74.1 71.6 72.2 72.8 73.3 73.9 74.2 71.7 72.1 72.6
73.2 73.9 74.4 71.6 72.4 72.6 73.2 73.6 74.1 72.3
72.9 73.4 73.8 74.2 72.2 72.9 73.1 73.8 72.4 72.8
73.1 74.7 72.2 72.7 73.3 72.9 72.6 72.6 72.7 72.8
72.9 72.7 73.2 73.4 73.1 73.2 73.3 73.4 73.3 73.1

Да се нацрта хистограм и полигон на емпириска распределба, да се


пресмета средна вредност и стандардното отстапување и да се провери
со тест по избор дали распределбата на резултатите од мерењата
може да се смета за нормална (Гаусова) распределба.

Re{enie:

Bidej}i xmax=75.4, xmin=69.5, varijacioniot interval e 75.4-69.5=5.9. Brojot


na intervali mo`eme da go zememe 10, pa {irinata na sekoj interval }e
bide d=5.9:10=0.59. Vo narednata tabela se dadeni intervalite i
soodvetnite frekvencii.

sredina na frekvencija
interval ti f it i f it i2
interval xi fi
69,50 70,09 69,795 1 -5,00 -5,00 25,00
70,09 70,68 70,385 2 -4,00 -8,00 32,00
70,68 71,27 70,975 4 -3,00 -12,00 36,00
71,27 71,86 71,565 9 -2,00 -18,00 36,00
71,86 72,45 72,155 15 -1,00 -15,00 15,00
72,45 73,04 72,745 20 0,00 0,00 0,00
73,04 73,63 73,335 24 1,00 24,00 24,00
73,63 74,22 73,925 15 2,00 30,00 60,00
74,22 74,81 74,515 6 3,00 18,00 54,00
74,81 75,40 75,105 4 4,00 16,00 64,00
100 30,00 346,00
POLIGON NA EMPIRISKA RASPREDELBA

30

25

20
frekvencija

15

10

0
69,795 70,385 70,975 71,565 72,155 72,745 73,335 73,925 74,515 75,105
sredina na interval

HISTOGRAM NA EMPIRISKA RASPREDELBA

30

25

20
frekvencija

15

10

0
69,795 70,385 70,975 71,565 72,155 72,745 73,335 73,925 74,515 75,105
intervali
Sredna vrednost na statisti~koto mno`estvo e:

1 n
n 
x=
N

i =1
xi f i , ∑ f i = N 
 i =1 
1
x= 7292 = 72.92
100

x se nao|a vo intervalot 72.45 - 73.04, pa taka za rabotna nula ili h0, ja


zemame srednata vrednost na toj interval h0=72.745.

Za presmetuvawe na standardnoto otstapuvawe, vo gornata tabela se


dodadeni kolonite so ti , f i ti i f i ti 2, kade:
x − x0
ti = i
d
Taka {to sredniot kvadrat na otstapuvawata y2 e:
d2  n   0.59 2 
2
1 n 1 
s = ∑ f i t i −  ∑ f i t i   = −
2 2
346 30 2 
N  i =1 N  i =1   100  100 
s 2 = 1.173
Dodeka standardnoto otstapuvawe y, e:
s = s 2 = 1.173
s = 1.083

So nivo na zna~ajnost α = 0.05 , so koristewe na Pirsonoviot χ 2 -


kriterium, ja proveruvame hipotezata deka obele`jeto X ima normalna
raspredelba.
Treba da se proveri hipotezata H 0 : X ima N (a, σ 2 ) raspredelba. Bidej}i,
vo pretpostavenata raspredelba ima j = 2 nepoznati parametri, najnapred
niv gi zamenuvame so nivni ocenki vrz osnova na dadeniot primerok, i
kako a = MX i σ 2 = DX , ocenkite za nepoznatite parametri se a = x = 72.92
i σ 2 = s 2 = 1.083 2 , pri {to n = 100 e goleminata na dadeniot primerok.
Za presmetuvawe na Pirsonovata χ 2 - statistika vrz osnova na dadeniot
primerok ja formirame slednata tabela:
i 1 2 3 4 5 6 7 8 9 10
69,79 70,38 70,97 71,56 72,15 72,74 73,33 73,92 74,51 75,10
xi
5 5 5 5 5 5 5 5 5 5
fi 1 2 4 9 15 20 24 15 6 4
0,007 0,027 0,068 0,133 0,193 0,483 - 0,049
pi 0,002 0,057
6 1 7 5 6 7 0,044 1
np i 0,2 0,76 2,71 6,87 13,35 19,36 48,37 5,7 -4,4 4,91
( f i − np i ) 2 0,64
1,537 1,664 4,536 2,722 0,409
593,9 86,49
108,1 0,828
6 1 9 5 6 6 1
( f i − np i ) 2
-
np i 3,20 2,02 0,61 0,66 0,20 0,02 12,28 15,17 0,17
24,58
kade verojatnostite pi , i = 1,2,...,10 , pod pretpostavka deka hipotezata
H 0 : X ima N (72.92,1.083 2 ) raspredelba e to~na, se baraat na sledniot
na~in

 X − 72.92 69.795 − 72.92 


p1 = F ( x1 ) − F ( x0 ) = F (69.795) − F (−∞) = P ( X ≤ 69.795) − 0 = P ≤ =
 1.083 1.083 
1  69.795 − 72.92 
= + Φ0  = 0.5 + Φ 0 (−2.885) = 0.5 − Φ 0 (2.885) = 0.5 − 0.498 = 0.002
2  1.083 

p 2 = F ( x 2 ) − F ( x1 ) = F (70.385) − F (69.795) = P (69.795 ≤ X ≤ 70.385) =


 69.795 − 72.92 X − 72.92 70.385 − 72.92   70.385 − 72.92   69.795 − 72.92 
= P ≤ ≤  = Φ0  − Φ0  =
 1.083 1.083 1.083   1.083   1.083 
= Φ 0 (−2.34) − Φ 0 (−2.88) = −0.4904 + 0.498 = 0.0076

p3 = F ( x3 ) − F ( x 2 ) = F (70.975) − F (70.385) = P (70.385 ≤ X ≤ 70.975) =


 70.385 − 72.92 X − 72.92 70.975 − 72.92   70.975 − 72.92   70.385 − 72.92 
= P ≤ ≤  = Φ0   − Φ0  =
 1.083 1.083 1.083   1.083   1.083 

= Φ 0 (−1.795) − Φ 0 (−2.34) = −0.4633 + 0.4904 = 0.0271

p 4 = F ( x 4 ) − F ( x3 ) = F (71.565) − F (70.975) == Φ 0 (−1.25) − Φ 0 (−1.79) = −0.3946 + 0.4633 = 0.0687

p 5 = F ( x5 ) − F ( x 4 ) = F (72.155) − F (71.565) == Φ 0 ( −0.71) − Φ 0 (−1.25) = −0.2611 + 0.3946 = 0.1335

p 6 = F ( x 6 ) − F ( x 5 ) = F (72.745) − F (72.155) == Φ 0 ( −0.17) − Φ 0 (−0.71) = −0.0.675 + 0.2611 = 0.1936

p 7 = F ( x 7 ) − F ( x 6 ) = F (73.335) − F (72.745) == Φ 0 (0.38) − Φ 0 ( −0.17) = 0.4162 + 0.0675 = 0.4837

p8 = F ( x8 ) − F ( x 7 ) = F (73.925) − F (73.335) == Φ 0 (0.93) − Φ 0 (0.38) = 0.4732 − 0.4162 = 0.057

p 9 = F ( x9 ) − F ( x8 ) = F (74.515) − F (73.925) == Φ 0 (1.47) − Φ 0 (0.93) = 0.4292 − 0.4732 = −0.044

p10 = F ( x10 ) − F ( x9 ) = F (75.105) − F (74.515) == Φ 0 ( 2.02) − Φ 0 (1.47) = 0.4783 − 0.4292 = 0.0491


X − 72.92
zatoa {to ako X : N (72.95,1.083 2 ) , toga{ : N (0,12 ) .
1.083
Toga{ Pirsonovata χ 2 -statistika vrz osnova na dadeniot primerok, kade
( f i − np i ) 2
10
r = 10 e: χ = ∑
2
n = 9.76 .
i =1 np i
Od tablicata na χ 2 -raspredelba, za nivo na zna~ajnost α = 0.05 i broj na
stepeni na sloboda za normalna raspredelba k = r − 3 = 10 − 3 = 7 , go ~itame
χ 2 = 14.076 . Bidej}i χ n2 = 9.76 ≤ 14.076 = χ 2 , hipotezata se prifa}a.

You might also like