You are on page 1of 17

Semestrlna prca

( Pravdepodobnos a tatistika )
. zadania : 249344


















Vypracoval: Jakub Tomo
Ronk : 2.
tud. skupina : 5.

Technick univerzita Ekonomick fakulta
2

Obsah
vod ...................................................................................................................................... 3
1 Zadanie ................................................................................................................................ 4
2 Vypracovanie ...................................................................................................................... 6
2.1 loha A.1..................................................................................................................... 6
2.2 loha A.2 a.) ............................................................................................................. 10
2.3 loha A.2 b.) ............................................................................................................. 13
2.4 loha A.3................................................................................................................... 14
2.5 loha B ...................................................................................................................... 15
3 Zver ................................................................................................................................. 17


Technick univerzita Ekonomick fakulta
3



vod


Hlavnm cieom tejto semestrlnej prce je pouitm nadobudnutch poznatkov
z predmetu Pravdepodobnos a tatistika vyriei dva typy loh. Na ich vyrieenie budem
pouva tatistick funkcie tabukovho editora, programu Microsoft Excel.

Technick univerzita Ekonomick fakulta
4

1 Zadanie
Kadmu tudentovi bolo nhodne vygenerovan individulne zadanie.
Moje slo zadania je 249344.

slo zadania: 249344

A
Majme vber pozorovan: poet uchdzaov o zamestnanie vo veku 15 - 24 rokov v rokoch
2001 2009 na rovni okresov SR v lenen poda pohlav (tzn. 1.) mui a 2.) eny, teda
mme dva vberov sbory). (daje stiahnete z regionlnej databzy SR).

A.1.
Pre druh z tchto tatistickch sborov:
a) zostrojte tabuku poetnost, ktor bude obsahova jednoduch absoltne a relatvne
poetnosti a kumulatvne absoltne a relatvne poetnosti,
b) vytvorte bodov graf a kolov graf
c) urte zkladn charakteristiky tatistickho sboru.

A.2.
Pre prv z tchto tatistickch sborov:
a) na hladine vznamnosti 0,05 testujte, i vber mono poklada za vber zo
zkladnho sboru s normlnym rozdelenm pravdepodobnosti,
b) bez ohadu na zver v lohe 2a) predpokladajme, e ide o vber zo zkladnho sboru
s normlnym rozdelenm a vypotate pravdepodobnos, e hodnota ukazovatea
poet uchdzaov o zamestnanie vo veku 15 - 24 rokov bude via ako hodnota 3.
najmenieho pozorovania v sbore.


A.3.
Na zklade zskanch dajov testujte na hladine vznamnosti 0,01, i existuj rozdiely
v strednej hodnote ukazovatea: poet uchdzaov o zamestnanie vo veku 15 - 24 rokov
medzi tmito dvoma pohlaviami (predpokladme pritom normalitu rozdelenia sborov).


Technick univerzita Ekonomick fakulta
5

B
Star automobil uritho typu je pojazdn za predpokladu, e sa na om vyskytne
maximlne 5 porch. Automobil sme pouvali skoro kad de poas celho minulho
roka, ani raz sa nestalo, eby sa vyskytlo viac ako 5 porch.
Kad de sme zaznamenali poet porch (stpec 249344 sboru udaje_3.xls) a auto
nsledne opravili.
a) Urte teoretick rozdelenie pravdepodobnosti, ktorm sa riadi poet porch na
automobile.
b) Na hladine vznamnosti 0,05 testujte zhodu so zvolenm teoretickm
rozdelenm pravdepodobnosti

Technick univerzita Ekonomick fakulta
6

2 Vypracovanie

2.1 loha A.1

A.1. Pre druh z tchto tatistickch sborov:
a) zostrojte tabuku poetnost, ktor bude obsahova jednoduch absoltne a relatvne
poetnosti a kumulatvne absoltne a relatvne poetnosti,
b) vytvorte bodov graf a kolov graf,
c) urte zkladn charakteristiky tatistickho sboru

2.1.1 Rieenie:
a) Tabuku poetnost som zostrojil na zklade dajov, ktor som zskal z regionlnej
databzy SR. Vytvral som ju pre druh vberov sbor, ktorho zkladne znaky
boli:
- uchdza o zamestnanie bola ena
- uchdza o zamestnanie bol vo veku 15 - 24 rokov
- uchdza sa zaujmal o zamestnanie v rokoch 2001 2009
- uchdza sa zaujmal o zamestnanie v niektorom z jednotlivch okresov SR (spolu 79
okresov)

Tabuku poetnost som zaal vytvra najprv pomocou nstroja programu Excel
Analza dt Histogram. Zskal som jednotliv triedy a absoltne jednoduch poetnosti.

Relatvnu jednoduch poetnos som zskal pomocou vzahu
n
n
f
i
i
= ,
kde n predstavuje celkov poet pozorovan, ie rozsah vberu (v naom prpade 711).
Set relatvnych poetnost sa rovn 1.


Technick univerzita Ekonomick fakulta
7

Absoltnu kumulatvnu poetnos som vytvoril nasledovne:
- prv hodnota absoltnej kumulatvnej poetnosti sa rovn prvej hodnote
jednoduchej absoltnej poetnosti
- alie hodnoty absoltnej kumulatvnej poetnosti som vypotal poda
vzahu:

=
=
j
i
j j
n N
1

Relatvnu kumulatvnu poetnos som zskal poda vzahu
n
N
F
i
i
=


Jednoduch poetnos Kumulatvna poetnos
Triedy Absoltna Relatvna Absoltna Relatvna
13 1 0,00140647 1 0,00140647
93,76923 45 0,063291139 46 0,06469761
174,5385 118 0,165963432 164 0,23066104
255,3077 119 0,167369902 283 0,39803094
336,0769 89 0,125175809 372 0,52320675
416,8462 70 0,098452883 442 0,62165963
497,6154 45 0,063291139 487 0,68495077
578,3846 53 0,074542897 540 0,75949367
659,1538 26 0,036568214 566 0,79606188
739,9231 32 0,045007032 598 0,84106892
820,6923 22 0,030942335 620 0,87201125
901,4615 19 0,026722925 639 0,89873418
982,2308 13 0,018284107 652 0,91701828
1063 12 0,016877637 664 0,93389592
1143,769 8 0,011251758 672 0,94514768
1224,538 10 0,014064698 682 0,95921238
1305,308 6 0,008438819 688 0,9676512
1386,077 3 0,004219409 691 0,9718706
1466,846 3 0,004219409 694 0,97609001
1547,615 2 0,00281294 696 0,97890295
1628,385 5 0,007032349 701 0,9859353
1709,154 1 0,00140647 702 0,98734177
Technick univerzita Ekonomick fakulta
8

1789,923 1 0,00140647 703 0,98874824
1870,692 3 0,004219409 706 0,99296765
1951,462 1 0,00140647 707 0,99437412
2032,231 2 0,00281294 709 0,99718706
Dal 2 0,00281294 711 1
E 711 1

b) Na zklade tabuky poetnost som zostrojil bodov graf a kolov graf.






1
45
118
119
89
70
45
53
26
32
22
19
13
12
8
10
6
3
3
2
5
1
1
3
1
2
2
Absoltna poetnos
13
93,76923077
174,5384615
255,3076923
336,0769231
416,8461538
497,6153846
578,3846154
659,1538462
739,9230769
0
20
40
60
80
100
120
140
0 5 10 15 20 25 30
Absoltna poetnos
Absoltna
Technick univerzita Ekonomick fakulta
9


c) Zkladn charakteristiky som zistil pomocou tatistickho nstroja Analza dt
Popisn tatistika. Tieto charakteristiky by sa dali vypota aj pomocou funkci
programu Excel.

Stredn hodnota (aritmetick priemer) vberovho sboru je 432,5 o
znamen, e v priemere 433 ien vo veku 15 a 24 rokov sa uchdzalo o zamestnanie
v rokoch 2001 a 2009 (priemer je vypotavan za vetky okresy a za vetky roky
in by bol vpoet naprklad priemeru za jednotliv okres alebo rok)
Rozptyl vberu, o predstavuje priemer tvorcov odchlok jednotlivch
hodnt znaku od ich aritmetickho priemeru je 128831,7571 vek rozptyl.
Smerodajn odchlku dostaneme ako druh odmocninu z rozptylu, t.j.
358,93.
picatos rozdelenia, ie porovnanie stupa koncentrcie hodnt
prostrednch vekost so stupom nahustenia ostatnch hodnt je 3,667. Z toho
meme kontatova, e rozdelenie je picat. Koeficient picatosti 3,667 > 0.
ikmos rozdelenia, ie porovnanie stupa koncentrcie malch hodnt
sledovanho tatistickho znaku so stupom koncentrcie vekch hodnt tohto znaku
je 1,764. Rozdelenie nie je symetrick, je natiahnut doprava. Koeficient ikmosti
1,764 > 0, o znamen, e vina hodnt le napravo od aritmetickho priemeru.
Modus vyjadruje najpoetnejiu hodnotu tatistickho sboru, o v naom
prpade je 250.
Medin je prostredn hodnota tatistickho sboru, ktor rozdeuje dan
tatistick sbor na dve rovnak asti. V naom prpade je to 307.
Ostatn charakteristiky, okrem tchto zkladnch by sme mohli vypota
poda tatistickch funkci programu Excel (HARMEAN, GEOMEAN, KVANTILY
at.), ale nakoko neboli v zadan tak som sa nimi nezaoberal.

Technick univerzita Ekonomick fakulta
10





















2.2 loha A.2

A.2. Pre prv z tchto tatistickch sborov:
a) na hladine vznamnosti 0,05 testujte, i vber mono poklada za vber zo zkladnho
sboru s normlnym rozdelenm pravdepodobnosti,
b) bez ohadu na zver v lohe 2a) predpokladajme, e ide o vber zo zkladnho sboru s
normlnym rozdelenm a vypotate pravdepodobnos, e hodnota ukazovatea poet
uchdzaov o zamestnanie vo veku 15 - 24 rokov bude via ako hodnota 3.najmenieho
pozorovania v sbore.

ENY

Str. hodnota 432,5161744
Chyba str.hodnoty 13,46097956
Medin 307
Modus 250
Smer. odchylka 358,9314101
Rozptyl vberu 128831,7571
picatos 3,667318696
ikmos 1,764471449
ikmos rozdelenia 2100
Minimum 13
Maximum 2113
Set 307519
Poet 711
Najv (1) 2113
Najmen (1) 13
Hladina spol. (95,0%) 26,42808624
Technick univerzita Ekonomick fakulta
11


2.2.1 Rieenie

A.2. a)
Nasledujce lohy som vypotaval pre prv muov.
Pri rieen tejto lohy bolo potrebn si najprv stanovi podmienky pre hypotzy H0 a H1.
H0: Vber pochdza zo zkladnho sboru s norm. rozdelenm
H1: Vber nepochdza zo zkladnho sboru s normlnym rozdelenm

Na rieenie tejto lohy som pouil Pearsonov test, priom = 0,05
Triedy Poetnos

F(b) pj n*pj

test. char.
16 1

0,157528 0,157528 112,0027

110,0116213
144,8462 118

0,220378 0,062849 44,68583

120,2835138
273,6923 154

0,295575 0,075198 53,46566

189,0400903
402,5385 104

0,380785 0,08521 60,58407

31,11284309
531,3846 67

0,472228 0,091443 65,01603

0,060541105
660,2308 56

0,565166 0,092938 66,07861

1,537235538
789,0769 45

0,654622 0,089456 63,60333

5,441286393
917,9231 35

0,736169 0,081547 57,97988

9,107898148
1046,769 28

0,806571 0,070402 50,05566

9,718222272
1175,615 17

0,864133 0,057562 40,92676

13,98815432
1304,462 15

0,908706 0,044573 31,69128

8,791024528
1433,308 9

0,941393 0,032687 23,24076

8,726012957
1562,154 18

0,964095 0,022702 16,1413

0,214031639
1691 7

0,979028 0,014933 10,61707

1,232279052
1819,846 5

0,98833 0,009302 6,613755

0,39375612
1948,692 4

0,993818 0,005488 3,901834

0,002469767
2077,538 6

0,996884 0,003066 2,180049

6,693440069
2206,385 5 22 0,998507 0,001622 1,15356 2,153689 182,8843674
2335,231 3

0,99932 0,000813 0,578083
2464,077 5

0,999705 0,000386 0,274357

Technick univerzita Ekonomick fakulta
12


Najprv som urobil tabuku hodnt. Op som vyuil program Excel Analza dt. Zaal
som histogramom, alm krokom bolo dopotanie F (b) pomocou funkcie NORMDIST,
pravdepodobnosti pj a nakoniec n*pj.

Vyuitm Cochranovho pravidla som zlil niekoko tried, pretoe tie nespali
poiadavku tohto pravidla = n*pj 1 ako je zobrazen tato podmienka v modrej tabuke.
Potom som vypotal test. charakteristiku nadefinovanm potrebnho vzorca -
( )

=
K
j j
j j
np
np n
1
2
2
_ urobil set a funkciou CHIDIST vypotal p-hodnotu.





Zver:

Kee p-hodnota vyla vemi mal slo v porovnan s hladinou vznamnosti ,
mem kontatova, e hypotzu H0 zamietame a to znamen, e vber nepochdza zo
zkladnho sboru s normlnym rozdelenm pravdepodobnosti.


2592,923 2

0,999879 0,000173 0,123315
2721,769 0

0,999953 7,38E-05 0,052492
2850,615 3

0,999982 2,98E-05 0,021161
2979,462 2

0,999994 1,14E-05 0,008079
3108,308 0

0,999998 4,11E-06 0,002921
3237,154 1

0,999999 1,41E-06 0,001
Dal 1

1 6,52E-07 0,000464


711

1 711

699,2387878
k-1-r
ak k-1-r 6, tak n*pj 1
27-1-2 = 24
p-
hodnota
2,7014E-
139
Technick univerzita Ekonomick fakulta
13


2.3 loha A.2. b)

Pri rieen tejto lohy bolo potrebn najprv zisti, ktor je hodnota 3. najmenieho
pozorovania v danom sbore. Preto som najprv vytvoril varian rad pre daje
pochdzajce zo tatistickho vberovho sboru mui. Zistil som, e tretia najmenia
hodnota je 21. Mal som vypota pravdepodobnos, e hodnota ukazovatea poet
uchdzaov o zamestnanie vo veku 15 - 24 rokov bude via ako hodnota 3. najmenieho
pozorovania v sbore.

Teda:
P(X>21) = 1 - P(X<21) = 1 - F(21)

Distribun funkciu v bode 21 som vypotal pomocou funkcie NORMDIST, priom
aritmetick priemer a smerodajn odchlku som zistil z danch dajov zo tatistickho
sboru mui pomocou funkci AVERAGE, resp. STDEV. Poadovan
pravdepodobnos sme zskali po odtan vypotanej distribunej funkcie v bode 21 od
sla 1.


Priemer 569,7876
Vb.odchlka 551,2146

F(21) = 0,159723
P(X>21) = 1- 0,159723 = 0,840277

Zver:
Pravdepodobnos, e hodnota ukazovatea poet uchdzaov o zamestnanie vo
veku 15 - 24 rokov bude via ako hodnota 3. najmenieho pozorovania v sbore je 84%.

Technick univerzita Ekonomick fakulta
14

2.4 loha A.3.

A.3. - Na zklade zskanch dajov testujte na hladine vznamnosti 0,01, i existuj
rozdiely v strednej hodnote ukazovatea: poet uchdzaov o zamestnanie vo veku 15 - 24
rokov medzi tmito dvoma pohlaviami (predpokladme pritom normalitu rozdelenia
sborov).

2.4.1 Rieenie:
Pri rieen tejto lohy bolo potrebn si najprv stanovi podmienky pre hypotzy H0 a H1.
H0: stredne hodnoty s rovnak
H1: stredne hodnoty nie s rovnak

Na porovnanie jednotlivch strednch hodnt v danch sboroch som vyuil Z-test
pre stredne hodnoty, kee ide o vek sbory.

MUI ENY
Str. hodnota 569,7876231 432,5161744
Znmy rozptyl 303837,56 128831,76
Pozorovanie 711 711
Hyp. rozdiel sr.
hodnt 0
Z 5,564638636
P(Z<=z) (1) 1,31348E-08
z krit (1) 2,326347874
P(Z<=z) (2) 2,62696E-08
z krit (2) 2,575829304

Zver:
Pomocou tohto testu som zistil, e p-hodnota je rovn vemi malmu slu, t.j.
2,62696E-08, o znamen, e oproti hladine vznamnosti = 0,01 je neporovnatene mal.
ie hypotzu H0 zamietame. Stredn hodnoty nie s rovnak, teda existuj rozdiely v
strednch hodnotch.
Technick univerzita Ekonomick fakulta
15

2.5 loha B

Star automobil uritho typu je pojazdn za predpokladu, e sa na om vyskytne
maximlne 5porch. Automobil sme pouvali skoro kad de poas celho minulho
roka, ani raz sa nestalo, eby sa vyskytlo viac ako 5 porch. Kad de sme zaznamenali
poet porch a auto nsledne opravili.
a) Urte teoretick rozdelenie pravdepodobnosti, ktorm sa riadi poet porch na
automobile.
b) Na hladine vznamnosti 0,05 testujte zhodu so zvolenm teoretickm rozdelenm
pravdepodobnosti.

2.5.1 Rieenie:
a) Teoretick rozdelenie pravdepodobnosti, ktorm sa riadi poet porch na automobile
v naom prpade je diskrtne rozdelenie, konkrtne ide o BINOMICK rozdelenie.
b) Op si najprv nadefinujeme poiaton podmienky pre hypotzy H0 a H1.

H0: Vber pochdza zo zkladnho sboru s binomickm rozdelenm pravdepodobnosti
H1: Vber nepochdza zo zkladnho sboru s binomickm rozdelenm pravdepodobnosti

Potom pomocou funkcie AVERAGE som vypotal aritmetick priemer danho
sboru. Kee pre stredn hodnotu binomickho rozdelenia plat p n X E * ) ( = ,
potom pravdepodobnos nasttia javu v kadom pokuse som vypotal ako
n
X E
p
) (
= , kde n = 5


Priemer 2,495

p - pravdepodobnos nasttia javu v kadom
pokuse


0,499

Technick univerzita Ekonomick fakulta
16

alm krokom bolo vytvorenie tabuky poetnost, pri ktorej som vyuil funkciu
FREQUENCY. Pravdepodobnos pj som vypotal pomocou funkcie BINOMDIST,
potom n*pj a testovaciu charakteristiku nadefinovanm potrebnho vzorca, ktor som u
uvdzal pri lohe A.2. za a). Op som vyuil Cochranovo pravidlo a tak som zistil, e nie
je potrebne zluova iadne triedy, kee kad hodnota n*pj spa tto podmienku.

xj nj

pj n*pj

test.
charakt.
5 7

0,030939 6,18775

0,227990625
4 32

0,155314 31,06275

23,57783689
3 62

0,311873 62,3745

56,51879073
2 58

0,313122 62,6245

58,68837177
1 34

0,157189 31,43775

29,46955839
0 7

0,031564 6,312751

6,312750501
E 200

1 200

174,7952989

Cochranovo pravidlo
k-1-r
ak k-1-r 3, tak n*pj 4
k-1-r = 6-1-1 = 4

Zskan p-hodnotu, ktor som vypotal pomocou funkcie CHIDIST som porovnval so
zadanou hladinou vznamnosti = 0,05.

Zver:
Kee p-hodnota vyla menia ako dan hladina vznamnosti, meme
kontatova, e vber nepochdza zo zkladnho sboru s binomickm rozdelenm
pravdepodobnosti a hypotzu H0 budeme zamieta.


Technick univerzita Ekonomick fakulta
17

3 Zver
Vyrieenie loh sce pre ma nebolo najjednoduchie, musm uzna, e by som ho
nezvldol bez pomoci tdia skrpt Pravdepodobnos a tatistika a rd kolegov z mjho
odboru, ale tto prca mi rozrila vedomos z tohto predmetu, o ma poteilo. Dfam, e
sa Vm moja prca pila.

You might also like