Professional Documents
Culture Documents
1
Kazalo:
1. STATISTIKA-......................................................................................................................................................4
2. VRSTE SPREMENLJIVK (izražajo vrednost)....................................................................................................4
3. STATISTIČNE SPREMENLJIVKE ALI ZNAKI:..............................................................................................4
4. ATRIBUTIVNE SPREMENLJIVKE:..................................................................................................................5
5. NUMERIČNE SPREMENLJIVKE:.....................................................................................................................5
6. OZNAČEVANJE SPREMENLJIVK:..................................................................................................................5
7. UREJANJE STATISTIČNIH PODATKOV:.......................................................................................................5
8. RANŽIRNA VRSTA IN RANG:.........................................................................................................................5
9. FREKVENČNA PORAZDELITEV KVANTITATIVNIH SPREMENLJIVK:..................................................6
10. PRIKAZOVANJE STATISTIČNIH PODATKOV............................................................................................6
11. GRAFIKON, HISTOGRAM-.............................................................................................................................6
12. SREDNJE VREDNOSTI-...................................................................................................................................6
13. MEDIANA-.........................................................................................................................................................7
14. MODUS:.............................................................................................................................................................7
15. ARITMETIČNA SREDINA ALI POVPREČJE-...............................................................................................7
(literatura)Kvadratična sredina:................................................................................................................................7
(literatura)Harmonična sredina:................................................................................................................................7
(literatura)Geometrična sredina:...............................................................................................................................8
16. MERE VARIACIJE: (mere variranja)................................................................................................................8
VARIANCA IN STANDARDNA DEVIACIJA:.....................................................................................................8
Koeficient variacije :.................................................................................................................................................9
17. KVANTILNI RAZMIKI:....................................................................................................................................9
18. MERE ASIMETRIJE: (literatura).......................................................................................................................9
MERE SPLOŠČENOSTI:.........................................................................................................................................9
19. VERJETNOST:.................................................................................................................................................10
20.TEORETIČNE PORAZDELITVE:...................................................................................................................10
NORMALNA PORAZDELITEV...........................................................................................................................10
Standardizirana normalna porazdelitev:..................................................................................................................11
STUDENTOVA PORAZDELITEV t :...................................................................................................................11
F PORAZDELITEV: (literatura)............................................................................................................................12
2 PORAZDELITEV: (literatura)...........................................................................................................................12
BINOMSKA PORAZDELITEV :..........................................................................................................................12
21. VZORČENJE IN VZORCI :.............................................................................................................................12
NAKLJUČNI VZOREC :.......................................................................................................................................13
VZORČNA PORAZDELITEV ARITMETIČNIH SREDIN :...............................................................................13
VZORČNA PORAZDELITEV RAZLIK DVEH POVPREČIJ:............................................................................14
22. POSKUŠANJE DOMNEV...............................................................................................................................14
OSNOVNA IN NIČELNA DOMNEVA................................................................................................................14
STATISTIČNA ZNAČILNOST REZULTATOV:................................................................................................14
NAPAKE PRI PREISKUŠANJU DOMNEV.........................................................................................................15
23. PARAMETIČNI IN NEPARAMETRIČNI TESTI:........................................................................................15
KAJ JE ZNAČILNO ZA PARAMETRIČNE TESTE. NAŠTEJ KATERE POZNAŠ IN OPIŠI..........................15
KAJ SO NEPARAMETRIČNI TESTI. NAŠTEJ TISTE, KI JIH POZNAŠ IN OPIŠI.........................................15
POSTOPEK pri preizkušanju domnev:...................................................................................................................16
24. ANALIZA KVANTITATIVNIH SPREMENLJIVK.......................................................................................16
OCENA POVPREČJA POPULACIJE...................................................................................................................16
OCENA POVP. Z VELIKIM VZORCEM.............................................................................................................16
OCENA POVP Z MAJHNIM VZORCEM............................................................................................................17
25. PREIZKUŠANJE DOMNEVE O RAZLIKI MED POVPREČJEM VZORCA IN POPULACIJE S TESTOM
»z« (str.79)..............................................................................................................................................................17
26. PREIZKUŠANJE DOMNEVE O RAZLIKI MED POVPREČJEM VZORCA IN POPULACIJE S TESTOM
»t« (str.80)...............................................................................................................................................................17
27. PREIZKUŠANJE DOMNEVE O RAZLIKI MED POVPREČJEMA DVEH NEODVISNIH VZORCEV...17
a. RAZLIKA MED POVPREČJEM DVEH VELIKIH VZORCEV (str. 82):...................................................17
b. RAZLIKA MED POVPREČJEM DVEH VELIKIH VZORCEV (str. 82) (test F):......................................18
28. WILCOXONOV TEST Z VSOTO RANGOV/FREKVENČNIH RANGOV.................................................18
POVPREČNA RAZLIKA PRI PARNIH, MED SEBOJ ODVOSNIH VZORCIH...............................................18
29. ANALIZA PARNIH PODATKOV S TESTOM »T«......................................................................................19
2
30. ANALIZA Z WILCOXONOVIM TESTOM PREDZNAČENIH RANGOV.................................................19
31. PRIMERJAVA VEČ VZORCEV.....................................................................................................................19
a. ANALIZA VARIANCE (F porazdelitev)...........................................................................................................19
b. KRUKAL-WALLISOV TEST...........................................................................................................................19
32. TEST HI-KVADRAT.......................................................................................................................................20
33. KOLERACIJA IN REGRESIJA.......................................................................................................................20
34. KOEFICIENT KOLERACIJE PO PEARSONU..............................................................................................21
35. KAJ JE LINEARNI PROGRAM.KAKO IZ PRIMARNEGA DOBIMO DUALNI PROGRAM. KAJ
POMENI, ČE NEKA DUALNA SPREM. ENAKA 0...........................................................................................21
36. KAJ JE MATRIČNA IGRA Z VSOTO NIČ. KAKO IŠČEMO OPTIMALNO STRATEGIJO ZA OBA
IGRALCA, ČE IMA MATRIKA SEDLO IN KAKO ČE GA NIMA. KAJ JE CENA IGRE...............................21
37. MREŽNO PLANIRANJE RAZLOŽI POJMA KRITIČNA POT IN KRITIČNA..........................................22
AKTIVNOST..........................................................................................................................................................22
38. KAJ POMENI KRATICA DDDP RAZLOŽI KATERI SO OSNOVNI ELEMENTI DDDP IN OPIŠI
RAZLIKO MED DDDP IN MREŽNIM PLANIRANJEM....................................................................................22
39. METODA SIMPLEX-......................................................................................................................................22
40. NAŠTEJ VSE PRINCIPE ODLOČANJA ZA PRIMER HEVRISTIČNEGA ODLOČANJA VSAKEGA
OPIŠITE..................................................................................................................................................................22
41. SISTEM LINEARNIH ENAČB.......................................................................................................................23
42. SISTEM LINEARNIH NEENAČB..................................................................................................................23
43. MATRIKA........................................................................................................................................................24
3
1. STATISTIKA-
je veda, ki kvantitativno proučuje masovne pojave v naravi in družbi ter tako z metodami, ki so njej lastne,
odkriva zakonitosti teh pojavov. Kot znanost je del matematike. Proučuje množične pojave. Zaradi
prilagojenosti statističnih metod problemom stroke govorimo ponavadi o statistikah v posameznih vejah
znanosti oz. strokah (ekonomiji, družboslovju…) kot ločenih vejah statistike. Statistika nam po eni strani
pomaga zbirati, urejati in prikazovati statistične podatke, ta del imenujemo deskriptivna statistika (starejši
del), v tem stoletju pa so se razvile tudi statistične analize, ki omogočajo sklepanje tudi iz podatkov, na
majhnih skupinah – to je analitična statistika
Imamo vzorec in populacijo. Kadar imamo veliko vzorcev vzamemo en del iz množice. Množice imajo
veliko elementov. Elemente merimo. Imamo statistične znake.
To so lastnosti elementov.
OSNOVNI POJMI: - enota – statistična enota je posamezen preučevani element (npr. ljudje), na enotah merimo
in dobimo podatke
Populacija N – je množica vseh preučevanih elementov oz. statističnih enot. Pogoji, ki populacijo načno
opredeljujejo so vsebinski, časovni in krajevni (opisane – realne populacije, umišljene hipotetične
populacije)
vzorec n– je podmnožica populacije vzorčenja, torej je to le del populacije, izbran za študij določenih
značilnosti te populacije.
Numerične opisne mere – npr. Povprečje in standardno deviacijo izračunane za populacijo imenujemo
parametre populacije, iste mere izračunane za vzorec pa statistike
spremenljivka (statistične spremenljivke/statistični znaki)– to je lastnost enote (teža, višina, dohodek..),
imamo oznake x, y, z vsaka od spremenljivk ima svojo vrednost x1=1, x2=2.
Spremenljivke so različne.
4
Tako izbrane in definirane značilnosti imenujemo statistične spremenljivke ali statistične znake. Statističnih
spremenljivk je več vrst. Statistične spremenljivke so atributivne in numerične.
4. ATRIBUTIVNE SPREMENLJIVKE:
ali opisne so tiste, katerih vrednost opisujemo z besedami. Lahko imamo tudi atributivne znake, ki imajo samo
dve vrednosti, ki se dajo urediti oziroma razvrstiti v logično zaporedje, pogosto po velikosti ali po stopnjah
kvalitete.V takem primeru govorimo o originalnosti statističnega znaka.
5. NUMERIČNE SPREMENLJIVKE:
so tiste, katerih vrednost izražamo s številkami. Numerične spremenljivke delimo na nezvezne ali diskontirne
oziroma kvantalne in na in na zvezne ali kontinuirne oziroma kvantitativne spremenljivke. Nezvezne numerične
spremenljivke imajo vrednosti podane samo s celimi števili, ugotavljamo pa jih s štetjem. Zvezne numerične
oziroma kvantitativne spremenljivke dobimo v glavnem z merjenjem. Teoretično ima lahko kvantitativna
spremenljivka neke enote katerokoli vrednost znotraj določenega razreda. Omejuje jih le natančnost metode, s
katero smo spremenljivko merili.
6. OZNAČEVANJE SPREMENLJIVK:
Vsak statistična spremenljivka ima lahko več možnih vrednosti dihotomnih (dve) do neskončnosti pri zveznih
NS. Vsaka statistična spremenljivka lahko označimi x, y, kadar pa želimo označiti, da gre za katero koli jo
označimo xi, kjer je i=1-n.
Zbiranje statističnih podatkov: statistične podatke lahko pridobimo na različne načine, pri tem je potrebno
paziti, da so podatki točni zanesljivi oziroma da je čim manj napak. Do kakšnih napak pri zbiranju podatkov
lahko pride je odvisno glede na vrsto podatkov in na način pridobivanja. Vedno pa napake lahko razdelimo v dve
skupini v slučajne ( premajhne natančnosti merskih metod ali malomarnosti zbirateljev podatkov-preveliki,
premajhni, te napake povečujejo variranje podatkov, na končni rezultat pa ponavadi ne vplivajo saj se pri
velikem številu – in + med seboj izničijo) in v sistematične ( te pa so posledica konstantnih vzrokov, ki
sistematično delujejo na vrednost posamezne enote in vedno v isto smer, tu pa se z večanjem števila enot napaka
ne izniči, ampak se sumira – popolno spremenijo sliko/napačne odločitve- potrebno jih je preprečevati) napake.
5
9. FREKVENČNA PORAZDELITEV KVANTITATIVNIH SPREMENLJIVK:
kadar imamo veliko kvantitativnih podatkov, urejanje v ranžirno vrsto ne zadostuje, ampak dobimo pregled nad
njimi le, če podatke uredimo v skupine, ki jih imenujemo razredi. Ker so podatki kontinuirani, moramo razrede
in njihove meje določiti sami. To napravimo tako, da najprej ugotovimo razliko med najvišjo in najnižjo
vrednostjo podatkov, kar imenujemo variacijski razmik, razpon ali variacijsko skupino (R=xmax-xmin). Nato se
odločimo za primerno število razredov in z njimi delimo celotni variacijski razmak. Tako dobimo razredni
interval ali razredno širino, praviloma so enaki. Razredov naj bo med 10in 20 odvisno od števila enot, če je
razredov preveč, ne dobimo dobrega pregleda nad podatki, če jih je premalo skrijejo bistvo (kadar smo v dilemi
se odločimo za večja število, saj jih kasneje lahko združimo). Začetek prvega razreda postavimo nekaj pod
najmanjšo vrednostjo, konec pa nekaj nad največjo vrednostjo spremenljivk in s tem primerno zaokrožimo
razredne intervale. (na začetku in na koncu so lahko razredi izjemoma odprti –določena samo ena meja; ni
sredine). Meje naj bodo določene s natančnostjo osnovnih podatkov in ne bolj natančno. Biti morajo natančno
določene tako, da vemo za vsako vrednost spremenljivke v kateri razred spada. Sredina razreda (xi) je zelo
pomembna, ker nam rabi kot cenilka povprečne vrednosti spremenljivke vseh enot v tem razredu. Pri določanju
sredine razreda moramo paziti na prave meje meje razreda, ki se pogosto razlikujejo od navedenih v tabeli in so
odvisne od zaokroževanja podatkov pri meritvah. Število podatkov, razvrščenih v isti razred, imenujemo
absolutna frekvenca tega razreda (fi). Takšno ureditev statističnih podatkov imenujemo frekvenčna
porazdelitev. Absolutna frekvenca ni odvisna le od tega, za kateri razred gre, ampak tudi od skupnega števila
podatkov. Strukturni delež posameznega razreda v celotni statistični masi imenujemo relativna frekvenca (fio
ozi. f%fo= fi/n). Včasih potrebujemo tudi komulativno frekvenčno porazdelitev. Kumulativna frekvenca Fi
razreda nam pove, koliko enot ima vrednost pod spodnjo mejo ustreznega razreda (F i+1= Fi+fi). Potem poznamo
še relativno komulativno frekvenco (Fio+1 = Fio + fo).
Torej nalogo začnemo lahko reševati z ražirno vrsto ali pa z razredi oziroma frekvenčno porazdelitvijo.
6
imenujemo parameter, srednjo vrednost vzorca, ki je pomembna predvsem za oceno ustreznega parametra
populacije pa imenujemo statistika.
(literatura)Kvantilni rang : je število, ki nam pove koliko % je manjših od tega števila, ki ga imenujemo
kvantil, in koliko % je večjih, če je npr. kvantilni rang Px= 0,25, pomeni da je 25 % manjših in 75 % večjih od
kvantilnega ranga. Kvantili : Xp, kjer imajo p vrednosti od 0-1, Kvantili so: 1.Kvartili:X0,25 (prvi); X0,5
(drugi); X 0,75 (tretji);… 2.Decili:X 0,1; …; X 0,9; 3. Centili: X 0,01; …; X 0,99
Px= (Rx-0,5)/N – kvantilni rang, Rx= Fo+(fo. (Xp-xomin)/io) – rang Xp-ja; Xp=xomin+(io. (Rx-Fo)/fo) –
kvantil; Rx=Px.N+0,5; FoRxF1; io=je razredni interval z največjo frekvenco
13. MEDIANA-
ali centralna vrednost je tista vrednost spremenljivke od katere ima polovica enot manjših, polovica pa večjih
vrednosti spremenljivk. Če je število enot liho, je mediana enaka vrednosti srednje enote v ranžirni vrsti, če pa je
število enot sodo je mediana povprečje srednjega para podatkov. Medijano računamo takrat, ko imamo ranžirno
vrsto in rang (od najmanjšega do največjega). (npr. Me=X 0,5 (peti decil, drugi kvartal; namesto Px=0,1 imamo X
0,5, računamo kot v nalogi kvantil – zvezek)
Me = medijana Me= xomin+(io. (Rx-Fo)/fo)
Mediana je neobčutljiva za spremembe posameznih vrednosti, če pri tem enota ostane v isti polovici ranžirne
vrste. V statističnem pomenu je mediana manjšega pomena kot aritmetična sredina, v nekaterih primerih pa je
zelo primerna srednja vrednost in bolje predstavlja statistično maso kot aritmetična sredina (kadar je statistična
masa porazdeljena nesimetrično). Če so podatki urejeni v frekvenčni tabeli, lahko mediano le ocenimo, ocena
temelji na domnevi, da so enote v razredu enakomerno porazdeljene od ene do druge meje.
14. MODUS:
je najpogostejša vrednost spremenljivke oziroma mesto največje gostitve podatkov. Pomanjkljivost modusa kot
srednje vrednosti je v tem, da ga lahko ugotovimo le za razmeroma veliko populacijo. Pri manjših vzorcih ga ni
mogoče ugotavljati, zato je statistično praktično neuporaben, operiramo z njim predvsem v zvezi z opisom
populacij. Imeti moramo frekvenčno porazdelitev.
Postopek izračuna: najprej poiščemo razred z največjo frekvenco fo, nato izberemo en razred spodaj f -1 in en
razred zgoraj f+1, nato izračunamo d-1=fo-f-1 in d+1=fo-f+1; nato pa še modus: Mo=xomin+io.d-1/(d-1+d+1)
(literatura)Harmonična sredina:
Dobimo jo lahko tudi iz aritmetične sredina, tako, da izračunamo najprej aritmetično sredino harmonična pa je
njena recipročna vrednostH=1/aritmetična sredina. Uporablja se predvsem pri izračunih - koliko proizvodov
na uro? oziroma proizvodno storilnost.
n
H
1 1 1 harmonična sredina
...
x1 x 2 xn
(literatura)Geometrična sredina:
uporablja se verižnih indeksih:
7
G n x1 .x 2 ...x n
PRAVILO: H<G< x <K
2
, populacija; s 2
, vzorec
n n 1
Imenovalec v enačbi za vzorec je zmanjšan za eno, ker je le tako varianca vzorca lahko nepristranska ocena
variance populacije. Vemo pa, da se varianca vzorca prav največkrat uporablja prav v ta namen.
Poznamo tudi naslednji način izračuna, ki je manj zamuden.
x 2
x 2
x 2
n
x 2
n
2
, populacija; s 2
, vzorec
n n 1
Kadar pa imamo podatke urejene v frekvenčni tabeli pa dodamo se absolutno frekvenco fi in x ne pomeni več
posamezne vrednosti temveč sredino posameznega razreda xi.
f . x f . x
2 2
i i i i x
2
, populacija; s 2
, vzorec
n n 1
Po tem postopku je seveda le ocena prave variance, ki bi jo izračunali iz posameznih podatkov, ocena je
nekoliko prevelika, ker temelji na domnevi, da so podatki v posameznem razredu enakomerno porazdeljeni okoli
sredine razreda – kar ne drži popolnoma. Zato je ta napaka čim večja tem večji je intervalni razredni interval (i)
– veliko podatkov, vendar v splošnem ni velika. To popravimo s Sheppardovim popravkom (i2/12) : 2 pop=2
– i2/12
Standardno deviacijo /odklon dobimo tako, da izračunamo kvadratni koren variance: 2 ; s s 2
Analiza variante temelji na dejstvu, da varianca nekega vzorca, vzetega iz iste populacije, predstavlja
nepristransko oceno variance populacije.
(literatura)
x aritmetična sredina vzorca ocenjuje (dobra cenilka) aritmetično sredino populacije .
x je nepristranska cenilka , povprečno vrednost dobro povprečuje vzorec
2 x pristranska cenilka 2 populacije
s2 je nepristranska cenilka za 2
Koeficient variacije :
pogosto želimo primerjati variiranje različnih spremenljivk, ki so med seboj v vsebinski zvezi, ne moremo
primerjati absolutnih mer variacije, ker imajo spremenljivke različne enote mere ali pa različne vrednosti
podatkov z istimi enotami mere. Vseh teh težav se rešimo, če podamo mero variacije v odnosu na ustrezno
s
srednjo vrednost : KV .100; populacija; KV .100; vzorec
x
8
aritmetične sredine, je varianca neustrezna mera variranja. Takrat je bolje uporabiti za mero variiranja kvartilni
razmik ali razmik, v katerem je določen odstotek vseh podatkov. Kvartili centili in decili so oblike kvantilov.
Npr. kvartili so trije in delijo ranžirno vrsto na štiri enake dele ter srednji kvartil obenem tudi mediana. Kvartilni
razmik je razmik med spodnjim in zgornjim kvartilom(Q=Q3-Q1=X 0,75-X0,25) in obsega srednjo polovico
podatkov, četrtina jih je pod spodnjim in četrtina nad zgornjim kvartilom.
Decilni razmik : D=D9-D1=X0,9-X0,1 –zajema 80%, 10% spod , 10% nad
Med njimi se najbolj uporabljajo centili, ki jih je 99 in razdelijo niz po velikosti na 100 delov in kjer je v vsakem
delu enaka frekvenca podatkov Centili delijo podatke na v ranžirni vrsti na sto skupin in vsak centil obsega 1%
podatkov, če npr. odštejemo zgornje in spodnje tri centile dobimo 94 % vseh podatkov.
Računanje kvantilnih razmikov je možno samo pri sorazmerno velikem številu podatkov.
Variacijski razmik: je razlika med največjim in najmanjšim podatkom: R=xmax-xmin. Ta mera variacije ima v
primerjavi z varianco precej pomanjkljivosti, saj je odvisna samo od skrajnih vrednosti, pove pa nič o variranju
podatkov, saj te vrednosti nanjo ne vplivajo.
Odkloni posameznih enot od aritmetične sredine tudi ne dajejo uporabne mere za variacijo, saj je njihova vsota
enaka nič. (vsota pozitivnih odklonov od AS je enak vsoti negativnih odklonov-(x- x )=0). Če pa bi vzeli
absolutne vrednosti odklonov bi dobili povprečni absolutni odklon od aritmetične sredine– absolutne vrednosti
odklonov bi delili s številom enot n : AD x = 1/n .x- x povprečni absolutni odklon, večje so vrednosti bolj
je variabilni je odklon
Poznamo tudi povprečni absolutni odklon od mediane : ADMe= 1/n .x-Me
-asimetrija:
1
3
. x x
A n
3
19. VERJETNOST:
Pri večini dogodkov govorimo, da se pojavljajo z večjo ali manjšo verjetnostjo. Verjetnost posameznih
dogodkov računamo z verjetnostnim računom. Tudi metode za statistično analizo podatkov, dobljenih na
vzorcih, in sklepanje o lastnostih populacije temelje na verjetnostnem računu.
Verjetnost nekega dogodka, kot jo razumemo v statistiki, je pravzaprav relativna frekvenca tega dogodka v
naključno izbranem zaporedju opazovanj, kadar je število opazovanj zelo veliko in raste čez vse meje.
Verjetnost zato izrazimo podobno kot relativno frekvenco s kvocientom med številom pričakovanih dogodkov in
celotnim številom dogodkov oziroma opazovanj. Ta kvocient označimo s črko p in ima vrednost med 0 in 1. 0
pomeni dogodek ni mogoč. 1 pomeni, da je dogodek zanesljiv. V praksi nikoli ne dobimo 0 ali 1, pač pa
govorimo, da se p bliža 0 in, da je dogodek praktično nemogoč. In, da se bliža 1, da je praktično zanesljiv.
Verjetnost včasih izražamo tudi z ulomkom ali z odstotkom.
Verjetnost komplementarnega dogodka, torej verjetnost, da pričakovanega dogodka ne bo, je enaka 1,
zmanjšana za verjetnost pričakovanega dogodka.v statistiki to imenujemo tudi riziko ozi. tveganje.
9
Seštevanje :Verjetnost več dogodkov lahko med seboj seštevamo, kadar gre za dogodke, ki se med seboj
izključujejo. V takem primeru je verjetnost, da bo nastopil eden ali drug dogodek enaka vsoti verjetnosti
vsakega posameznega dogodka. (verjetnost ali ali +). Vsota verjetnosti vseh dogodkov, ki se med seboj
izključujejo je enaka 1.
Množenje: Kadar so dogodki med seboj neodvisni, je verjetnost, da se skupaj pojavi več dogodkov, enaka
produktu verjetnosti vsakega teh dogodkov. (npr. mečemo dve kocki hkrati) (hkrati x).
Kadar si neodvisni dogodki lahko sledijo na več kot en način, je skupna verjetnost vseh načinov enaka vsoti
verjetnosti vsakega od možnih načinov. (npr. dve kocki na prvi 3 na drugi 6 oz. na prvi 6 in na drugi 3 :
p= 1/6 .1/6 +1/6 .1/6 = 1/18
20.TEORETIČNE PORAZDELITVE:
Sedaj smo govorili o stvarnih porazdelitvah spremenljivk – frekvenčna porazdelitev. Poleg teh pa poznamo
tudi teoretične porazdelitve,med katerim je najbolj pomembna normalna porazdelitev, porazdelitev t
(studentova) in binomska porazdelitev. Razen teh bomo spoznali še porazdelitev 2 in porazdelitev F.
Teoretične porazdelitve so pomembne, saj predstavljajo pravzaprav matematično idealizacijo stvarnih
porazdelitev, če te zadoščajo istim zahtevam kot teoretične. Pogosto pa je da stvarne porazdelitve v določeni
populaciji ne poznamo v celoti, lahko jo pa ocenimo, da je podobna eni od teoretičnih porazdelitev. V tem
primeru lahko zakonitosti, ki veljajo za teoretično porazdelitev, uporabimo tudi pri stvarnih porazdelitvi
populacije.
Še važnejša pa je uporaba teoretičnih porazdelitev kot verjetnostnih porazdelitev pri vzorčenju. Posamezne
slučajnostne spremenljivke v pravilno izbranem vzorcu se namreč porazdeljujejo v določene teoretične
porazdelitve, ki jih v takem primeru imenujemo tudi verjetnostne porazdelitve. Verjetnost posameznih vrednosti
spremenljivke je tu prikazana kot funkcija te vrednosti, vsota verjetnosti za vrednosti spremenljivk vseh enot
mora biti ena (kvocient) ali 100% (odstotki).
NORMALNA PORAZDELITEV
je najpomembnejša teoretična porazdelitev in jo imenujemo normalna ali Gaussova porazdelitev in spada
med zvezne porazdelitve
če si zamislimo, da imamo populacijo z velikim številom enot in večje število razredov, bi frekvenčni
poligon dobil obliko unimodalne, zvonaste, bolj ali manj simetrične oblike, ki bi bila podobna normalni
krivulji. Torej je normalna porazdelitev – normalna krivulja simetrična in zvonaste oblike.
pomen normalne porazdelitve je posebno v tem, da ima ključno vlogo pri mnogih metodah za statistično
analizo podatkov in to celo takih, ki so dobljeni na vzorcih iz populacije, katere porazdelitev se občutno
razlikuje od normalne. Poleg tega je normalna porazdelitev osnova za nekatere druge teoretične
porazdelitve – npr. porazdelitev t; Večina teoretičnih porazdelitev (binomska, t) v določenih razmerah
asimptotično prehajajo v normalno porazdelitev.
normalna krivulja je podana z dvema parametroma z aritmetično sredino in s standardno deviacijo
(odklonom). Aritmetična sredina določa, kje na številčnici premica normalne porazdelitve leži, standardna
deviacija pa , kakšno širino obsega. Čeprav imajo normalne porazdelitve različne parametre – različne
aritmetične sredine in standardne deviacije, so si med seboj podobne in imajo določene skupne lastnosti.
Zaradi simetričnosti je polovica posameznih vrednosti vedno pod vrednostjo aritmetične sredine in polovica
nad njo, ne glede na velikost parametrov je relativna frekvenca vedno 0,6826 (glede na različne stopnje
zaupanja je razmik med standardnima deviacijama 68,26% (5%), 95,44% (1%), 99,73 % (0,1%)).
Te značilnosti normalne porazdelitve nam pomagajo pri računanju verjetnosti za vrednosti spremenljivk, če
je njihova porazdelitev podobna normalni.
Pri kvantitativnih (zvezne-numerične-merjenje) spremenljivkah ne moremo govoriti o verjetnostni ene
same spremenljivke (odvisne od natančnega merjenja), za kvantalnih (nezvezne – numerične-štetje) oz.
atributivnih (opisne)spremenljivkah pa lahko napovemo verjetnost posamezne vrednosti ali kategorije.
Kvantitativne spremenljivke so odvisne od natančnega merjenja, vrednosti znotraj intervala, zaokroževanje.
metode slone na dejstvu, da se povprečje vzorcev vzetih iz iste populacije porazdelijo normalno, čeprav
sama populacija iz katere ti vzorci izhajajo ni normalno porazdeljena
- Z = normirani ali standardizirani odklon
- a = x ali ; zveza med frekvenco in verjetnostjo p= f/n
- spremenljivka X je poljubnaXN(, ) ali XN(a, ) pri populaciji,
x x
- spremenljivka X je poljubnaXN( x , ) ali XN(a, ) pri vzorcu, pop x , torej
n n
standardni odklon populacije pristranska cenilka standardnemu odklonu vzorca,
p.1 p
- pri deležu je a= x = p (delež v %) in velja N(p, ),
n
10
12 22
- če nas zanima razlika med podatki in porazdelitev je normalna, velja: N(0, ),
n1 n2
0 = x1 - x 2
P (x1<X<x2) = ((x2-a)/)- ((x1-a)/)
N normalna porazdelitev
((x2-a)/) zgornja meja
((x1-a)/) spodnja meja
Standardizirana normalna porazdelitev:
- Z = normirani ali standardizirani odklon
N(a,)
- Z N (0, 1) /2 + /2 + 1 - = 1; = stopnja tveganja (da pademo izven); 1- = stopnja zaupanja;
da dobimo verjetnost med –Z in +Z je 1-; je lahko 5%, 1 % ali 0,1 %.
- P (0<Z1-<Zo) = (Zo); P (a<Z<b) = (b) -(a); () = 0,5 in (-Z) = - (Z)
Če pri normalni porazdelitvi odklonov posameznih vrednosti od aritmetične sredine ne izražamo več v enotah
mere statistične spremenljivke, ampak vzamemo za enoto kar ustrezno standardno deviacijo, dobimo novo enoto
za merjenje teh odklonov, to je tako imenovani standardizirani odklon označujemo ga s črko »z«
x xx
Z za populacijo Z za vzorec - (n>30);
s
Če je porazdelitev vrednosti Z, ki ima aritmetično sredino enako nič in standardni odklon eni, s pomočjo te
porazdelitve lahko dajemo splošne podatke o katerikoli normalni porazdelitvi, pri tem si pomagamo s tabelami,
ki nam povedo odnos med verjetnostjo in deležem površine pod krivuljo, ki jo ta vrednost omejuje.
S tem načinom lahko ugotovimo, npr. kolikšen delež populacije ima večje oziroma manjše vrednosti, kolikšen
delež populacije ima vrednost spremenljivke znotraj določenega razmika, kolikšen delež enot je v populaciji
pod določeno vrednostjo in kolikšen nad njo.
Z: Z0,05=1,96; Z0,01=2,58; Z0,001=3,29
/2 + /2 + 1 - = 1 dvostransko gledanje
+ 1 - = 1 enostransko gledanje
STUDENTOVA PORAZDELITEV t :
standardizirana normalna porazdelitev se torej zelo uspešno uporablja, kadar gre za realne populacije, katere
parametri so nam poznani. Ponavadi imamo samo podatke o vzorcih in njihove statistike nam rabijo za oceno
parametrov populacije. Ta ocena pa je nezanesljiva čim manjši vzorec je. V takem primeru namesto normalne
porazdelitve uporabljamo studentovo porazdelitev, oziroma porazdelitev t-e porazdelitev . Studentova
porazdelitev je modifikacija normalne porazdelitve, ki omogoča sklepanje o parametrih populacije tudi z oceno,
dobljenih na majhnih vzorcih (n<30):
x
t studentova porazdelitev t za majhne vzorce (n<30),
s
torej porazdelitev t je podobna normalni porazdelitvi, razlika med njima je odvisna od velikosti vzorca, kot
ocena za standardni odklon. Merilo za velikost vzorca so stopinje prostosti (m) in ki so vedno enake
imenovalcu v enačbi za ustrezno oceno standardnega odklona, če gre za oceno standardnega odklona
populacije, bo m = n – 1.Za vsako stopnjo prostosti oz. velikost vzorca je porazdelitev t nekoliko drugačna, vse
so podobne normalni, le da je proti obema skrajnima vrednostima delež celotne površine pri njih večji kot pri
normalni porazdelitvi, ta razlika je čim večja tem nižji je m. Ko se število prostosti povečuje, se porazdelitev t
vse bolj približuje normalni. Podobno kot pri normalni porazdelitvi so tudi tukaj podatki o porazdelitvi t podani
v tabelah, ampak ne o krivuljah v celoti, ampak samo kritične vrednosti t pri različnih stopnjah tveganja ( ) in
različne stopnje prostosti (m). Pri 30 stopinjah prostosti je tista meja, kjer velja, da od nje naprej navzgor lahko
razliko zanemarimo.
Kadar n<30 uporabimo studentovo porazdelitev t, če pa je n>30 pa normalno porazdelitev z.
t (m =1-30) tu imamo en parameter
F PORAZDELITEV: (literatura)
Uporablja se pri variancah, odvisna je od parametrov m1 in m2: F (m1, m2)
2 PORAZDELITEV: (literatura)
2 (m) če je parameter večji od 30 preide v normalno.
BINOMSKA PORAZDELITEV :
Binomska porazdelitev je nezvezna verjetnostna porazdelitev, pove verjetnost pr, kar pomeni, da bomo dobili
določeno število r pričakovanih dogodkov v nizu n neodvisnih opazovanj, kadar imamo pri vsakem opazovanju
samo dva možna dogodka oz. vrednosti znaka (dihitomnost znaka).
11
Kadar je verjetnost pričakovanega dogodka v populaciji znana i se ne spreminja od opazovanja do opazovanja,
označimo verjetnost pričakovanega dogodka v populaciji s (v vzorcu s p)
Tu gre za dihotomne spremenljivke z dvema možnima vrednostima (npr. učinkuje, neučinkuje), npr,. na dveh
bolnikih so možni so trije izidi – učinkuje pri obeh, pri enem, pri nobenem.
-pri obeh: =0,9; pr=2 = 0,9.0,9=0,81 (neodvisni – x)
-pri enem: =0,9; pr=1 = 0,9.0,1 + 0,9.0,1=0,18 (neodvisni – x, izključujeta - +))
-pri nobenem: =0,9; pr=0 = 0,1.0,1=0,01 (neodvisni – x)
-p=1
skupni izraz za zgoraj navedeni izračun je : 1 1 za dve opazovanji,
2
1 n 1 za n število opazovanj,
Važno je če se število opazovanj veča, se binomska porazdelitev približuje normalni porazdelitvi. Približevanje
je tem hitrejše, čim bolj se verjetnost dogodka v populaciji približuje vrednosti 0,5. (slika str.55), kadar je
zmnožek verjetnosti v populaciji in števila opazovanj enak ali večji od pet (n.5) je binomska porazdelitev že
tako podobna normalni, da razliko lahko zanemarimo.
12
Poleg naključnega vzorca poznamo še alternativne oblike naključnega vzorca – sistematični vzorec, stratificirani
vzorec in vzorec v več stopnjah.
Sistematični vzorec uporabljamo, kadar so podatki o enotah oz. posameznikih v populaciji že urejeni v seznamih,
kartotekah ali kako drugače. Prvo enoto izberemo po slučajnostnem načelu, vse drugo pa po vzorčni shemi, ki
smo jo postavili (npr. želimo imeti vzorec po eno enoto od petdesetih, prvo izberemo iz tabliv naključnih števil,
nato pa vsako petdeseto –39, 89, 139,…). Tako vzorčenje je naključno, pristransko pa je le v primeru, če se
interval (npr. 50) sovpada s katerim od dejavnikov.
Stratificiran (heterogen) vzorec dobimo, če pri populaciji, razdeljeni na sloje, jemljemo naključni vzorec
določene velikosti iz vsakega sloja posebej. Izbira slojev je odvisna od problema, ki ga raziskujemo (spol,
starost, izobrazba, poklic…). S stratificiranim vzorcem je ocena parametra natančnejša, poleg tega pa lahko
ocenjujemo tudi parametre vsakega sloja posebej.
Vzorčenje v več stopnjah poteka tako, da najprej izberemo med enotami prve stopnje, nato pa iz izbranih enot
prve stopnje izberemo enote druge stopnje, ki jih nato vključimo v opazovanje (npr. najprej delovne
organizacije, nato pa izmed temi organizacijami izberemo vzorec delavcev). Pri obeh mora biti izbor naključen.
Tako vzorčenje je hitro in preprosto.
Da bi lahko izračunali potrebno velikost vzorca za oceno povprečja populacije, bi torej potrebovali podatke o
standardnem odklonu populacije, tega pa ponavadi ne poznamo.
(Kasneje Str.130 in 75)
VZORČNA PORAZDELITEV ARITMETIČNIH SREDIN :
x aritmetična sredina vzorca
s standardni odklon vzorca
Te vrednosti v populaciji imenujemo parametre v vzorcu pa statistike, ki jih rabimo za oceno parametrov
(aritmetične sredine in standardnega odklona).
Da bi lahko iz aritmetičnih sredin vzorcev ocenjevali aritmetično sredino populacij, moramo vedeti, kakšna je
porazdelitev povprečij vzorcev, izbranih iz te populacije (kakšna je vzorčna porazdelitev).
To porazdelitev bomo bolje razumeli, če si predstavljamo, da iz znane populacije izbiramo naključne vzorce s po
»n« enotami, vsakemu od teh določimo aritmetično sredino, nato enote vrnemo v populacijo. Postopek
ponavljamo, da dobimo vrsto povprečij naključnih vzorcev z »n« enotami. In če sedaj ta povprečja vzamemo kot
spremenljivke in jih uredimo kot v frekvenčno porazdelitev, dobimo vzorčno porazdelitev povprečij.
Praktično tega ne bomo delali, saj postopek ne bi imel smisla, pomembno je samo poznati lastnosti, tako
umišljene porazdelitve, saj nam to dovoljuje sklepati iz enega samega vzorca, kot v praksi tudi ponavadi je.
Aritmetična sredina vzorčne porazdelitve povprečij je enaka aritmetični sredini populacije.
1. x =
x SE standardni odklon vzorčne porazdelitve povprečij, ki je sorazmeren s standardnim odklonom
n
populacije in obratno sorazmeren s korenom števila enot v vzorcu .
Standardni odklon vzorčne porazdelitve povprečij imenujemo tudi standardni pogrešek ocene povprečij in ga
označujemo z SE. Ker je vzorčna porazdelitev povprečij normalna (2.), veljajo tudi zanjo značilnosti normalne
porazdelitve (Gausova krivulja), prav ta značilnost, pa nam dovoljuje, da z uporabo standardnega pogreška
ocenimo interval, v katerem lahko z določeno verjetnostjo pričakujemo povprečje populacije.
Tretja značilnost vzorčne porazdelitve povprečij je ta, da je porazdelitev približno normalna tudi takrat, ko
populacija sama ni normalno porazdeljena, če so le vzorci dovolj veliki. To je zelo pomembna lastnost vzorčne
porazdelitve povprečij, saj pomeni, da lahko uporabimo normalno porazdelitev pri statističnem sklepanju tudi
takrat, pri katerih populacija ni normalno porazdeljena. Za razliko od prvih dveh , ki sta pričakovani (aritmetična
sredina vzorčne porazdelitve povprečij=aritmetični sredini populacije; vzorčne porazdelitev povprečij ima
značilnost normalno porazdelitev), nas tretja preseneča.
Kako velik mora biti vzorec, da lahko pričakujemo normalno vzorčno porazdelitev povprečij tudi pri populaciji,
ki ni normalno porazdeljena, je odvisno od velikosti odstopa od normalne porazdelitve, čim večja je razlika, tem
večji mora biti vzorec.
x
Zx
standardizirani odklon za vzorčno porazdelitev povprečij
n
Standardizirana vzorčna porazdelitev povprečij pa nam lahko koristi kot verjetnostna porazdelitev. Pri statični
analizi podatkov tako ocenjujemo verjetnost, da bi iz znane populacije izbrali vzorec, ki bi imel povprečje v
določenem razmiku vrednosti.
VZORČNA PORAZDELITEV RAZLIK DVEH POVPREČIJ:
Tu primerjamo dva vzorca, od katerih je eden tretiran drugi pa je prvemu v kontrolo. Za ocenjevanje razlik med
njima moramo poznati glavne značilnosti vzorčne porazdelitve razlik dveh povprečij.
13
Umišljeni poskus: iz ene populacije izberemo dva slučajna vzorca x1 z n1 številom enot in x2 z n2 enotami. Enot
v obeh vzorcih je lahko enako ni pa nujno. Povprečje drugega vzorca odštejemo od prvega in dobimo razliko:
x 1 - x 2. Enote obeh vzorcev vrnemo v populacijo in vse zopet večkrat ponovimo. Če razlike obeh povprečij
vzamemo za spremenljivko in jih frekvenčno uredimo, dobimo vzorčno porazdelitev razlik povprečij dveh
vzorcev z n1 in n2 enotami. Tudi tukaj velja enako kot za vzorčno porazdelitev povprečij, je pomembna samo
zato, ker na omogoča analizirati rezultate, iz ene same razlike dveh povprečij.
Vzorčna porazdelitev razlike dveh povprečij je normalna. Aritmetična sredina je enaka nič. Varianca te
porazdelitve je vsota variance povprečij prvega vzorca in variance povprečij drugega vzorca. Standardni odklon
razlik povprečij dveh vzorcev je:
12 22
x1 x 2 standardni odklon razlik povprečij dveh vzorcev
n1 n2
Standardni odklon vzorčne porazdelitve razlik povprečij dveh vzorcev imenujemo tudi standardni pogrešek
ocene razlik dveh povprečij dveh vzorcev, tudi ta ima značilnosti normalne porazdelitve.
x1 x 2
Z x1 x 2
12 22 standardizirani odklon vzorčne porazdelitve razlik dveh povprečij
n1 n2
14
lahko naredimo napako prve vrste, če pa ničelno sprejmemo in s tem zavrnemo osnovno, lahko tvegamo s
napako druge vrste.
Tej nevarnosti se izognemo tako, da v primeru, ko je tveganje preveliko, naredimo ničelne domneve ne
zavrnemo in osnovne ne sprejmemo. Torej v tem primeru ostane osnovna domneva , ki jo statistično preverjamo
– nepotrjena ne pa ovržena.
Verjetnost, da z določenim testom ne bomo naredili napake druge vrste 1 - , imenujemo moč testa (odkriva
statistične značilnosti). To pomeni verjetnost, da bomo z testom zavrnili ničelno domnevo, kadar ni pravilna in jo
je treba zavrniti
15
Če dobljena vrednost pade v kritično območje, zavrnemo ničelno domnevo in sprejmemo osnovno
domnevo ( v tem primeru pravimo, da so rezultati statistično značilni)
Če pa je vrednost zunaj tega območja ničelne domneve ne moremo zavrniti, in osnovna domneva ostane
nepotrjena (ne sprejmemo).
16
Domnevo preverjamo tako, da ugotovimo kakšna je verjetnost, da bi iz znane populacije po naključju izbrali
vzorec, katerega povprečje potem primerjamo. Če je verjetnost manjša kot stopnja tveganja, za katero smo se
odločili Ho zavrnemo in H1 sprejmemo, ki trdi vzorec ne izhaja iz znane populacije in da se od nje značilno
razlikuje. Tu uporabimo enačbo :
x
Zx
( standardizirani odklon za vzorčno porazdelitev povprečij ) in z test
n
17
x 2
x 2
3
vzorcu
POVPREČNA RAZLIKA PRI PARNIH, MED SEBOJ ODVOSNIH VZORCIH
Doslej imeli kvantitativne spremenljivke in med seboj neodvisne vzorce. Vemo pa, da imamo velikokrat opraviti
s parnimi vzorci (odvisnimi) , en podatek v prvem vzorcu ima par v druge vzorcu in jih primerjamo. Parne
podatke dobimo v navzkrižnih poskusih z istimi subjekti, ki jih enkrat tretiramo, drugič pa nam rabijo za
kontrolo.
d 2
d d 2
n
t ; sd
sd n 1
n
m=n-1; n= število parov (tabela B)
18
takem primeru nujna več vzročna analiza, to najpogosteje primerjamo z analizo variance ali z alternativnim
nepararmetričnim Krukal-Walilisovim testom.
a. ANALIZA VARIANCE (F porazdelitev)
Analiza variance temelji na dejstvu, da varianca vsakega vzorca vzetega iz populacije, predstavlja nepristransko
oceno variance populacije. Vzorčno porazdelitev razmerij teh varianc imenujemo tudi porazdelitev F.
Analiza variance je parametrična analiza, zato jo lahko uporabljamo samo pri normalnih populacijah, poleg tega
se variance med seboj ne smejo preveč razlikovati.
Bistvo analize variance je v tem, da se celotno varianco vseh enot iz vseh vzorcev razstavimo na komponente, iz
katerih je sestavljen.
Ho trdi, da vsi vzorci izhajajo iz populacije z enakim povprečjem in, da varianca med skupinami ni večja od
variance znotraj teh skupin. Kritične vrednosti porazdelitve F pri 5% tveganju dobimo v tabeli D, če dobljena
vrednost F presega kritično vrednost, zavrnemo ničelno domnevo, sprejmemo sklep, da vzorci izhajajo iz
različnih populaci.
b. KRUKAL-WALLISOV TEST
za večvzorčno analizo enega samega faktorja,
to je neparametričen test z značilnimi prednostmi in pomanjkljivostmi te skupine testov,
uporabljamo lahko tudi kadar podatki ne izvirajo iz normalne distribuirane populacije in kadar so variance
vzorcev niso homogene
postopek podoben kot pri Wilcoxonovem testu vsote rangov,
podatke rangiramo ne glede nato iz katere skupine je posamezna enota, range seštejemo in podatke vnesemo
v izraz:
12 Tv2
H
n. n 1
n 3. n 1 , n je število vseh enot, nv je število enot v posameznem vzorcu in Tv je
v
vsota rangov v posameznem vzorcu, izračunane vsote rangov preverimo z enačbo:
n(n 1)
Tv
2
Če so vzorci dovolj veliki, večji kot po pet enot, postane porazdelitev H tako podobna hi-kvadrat, da lahko za
oceno značilnosti uporabljamo kar tabele hi-kvadrat z m=k-1, ke je število skupin.
Iz tabele F pri 5% tveganju in pri določenih stopinjah prostosti izberemo kritično vrednost, če je H presega od
kritične vrednosti, lahko Ho zavrnemo.
32. TEST HI-KVADRAT
Se uporablja pri statistični obdelavi podatkov, kadar želimo vedeti ali se ugotovljene frekvence razlikujejo od
frekvenc, ki bi jih pričakovali na temelju analize.
Za vsako kategorijo najprej izračunamo razliko med ugotovljeno in pričakovano frekvenco, nato pa razmerje
med kvadratom te razlike in pričakovano frekvenco.
m= k- 1
fu - dano v nalogi
fp - 40% od vseh udeleženih
(fu – fp)
(fu – fp)k
(fu – fp)˛k
(fu – fp)˛k
fp na koncu obe kategoriji seštejemo = X2
19
ANALIZA DVEH ALI VEČ VZORCEV
Kadar imamo podatke prikazati v tabeli s štirimi polji, ki jo imenujemo 2x2 kontigenčna tabela. Stopinje
prostosti dobimo tako, da od števila vrstic odštejemo ena in od števila stolpcev ena in to pomnožimo.
Določimo ničelno domnevo (da med kofeinom in budnostjo ni zveze) ali pri tem izračunamo kakšno frekvenco
bi pričakovali, če bi ta trditev držala.
Pričakovano frekvenco pa dobimo tako, da za vsako polje v tabeli pomnožimo vsoto v ustrezni vrstici z vsoto v
ustreznem stolpcu ter zmnožek delimo s skupno vsoto vseh enot.
a ba+b
c d c+d
Če pa je tabela večja kot 2x2 m=v-1*s-1 stopinje prostosti
Izračunamo pričakovano frekvenco tako, da vzamemo seštevek vseh skupnih enot delimo z vsoto vrstice krat
vsota skupaj delimo z vsoto v stolpcu in pomnožimo z vso vsoto.
LINEARNA REGRESIJA-naloga je določiti enačbo krivulje, ki se najbolj prilega podatkom dveh spremenljivk
pri istih enotah, če so podatki prikazani na koleracijskem diagramu.
Y = a + bx = y + b (x – x)
KOLERACIJA- ne pomeni, da sta spremenljivki med seboj povezani kot vzrok in posledica. Nasprotno, zelo
pogosto sta obe spremenljivki odvisni od nekega tretjega dejavnika, katerega pogosto niti ne poznamo. Se
razlikuje glede na smeri, zato govorimo o pozitivni in negativni.
Pozitivna je kadar vrednost ene spremenljivke narašča z vrednostjo druge; negativna pa je če vrednost ene
spremenljivke pada, če vrednost druge narašča. Je lahko pa tudi večja ali manjša.
Koeficient koleracije je merilo za stopnjo povezanosti in pove samo, da kako velika je koleracija, nikakor pa ne
pove, če je povezanost značilna ali ne.
Ocenjujemo jo s testom T pri m=n-2 stopinjah prostosti.
20
36. KAJ JE MATRIČNA IGRA Z VSOTO NIČ. KAKO IŠČEMO OPTIMALNO STRATEGIJO ZA
OBA IGRALCA, ČE IMA MATRIKA SEDLO IN KAKO ČE GA NIMA. KAJ JE CENA IGRE.
Matrična igra ali stateška igra, pri kateri gre za odločitve, kjer nastopata dva odločevalca. Vsak odločevalec
izbere odločitev neodvisno od drugega odločevalca v sistemu, s čimer vpliva na rezultat oz. korist, ki jo doseže
drugi odločevalec z izbiro svoje alternative. Kadar se interes enega odloč. križa z interesom drugega imenujemo
to konfliktna situacija. Konfliktno situacijo primerjamo s potekom strateških iger npr. šaha. Odločevalec A ima
na razpolago toliko alternativ kot ima matrika plačil vrstic in odločevalec B ima toliko alternativ na razpolago
kolikor ima matrika plačil stolpcev.
Strateška igra s sedlom: kadar je maximinj=aik=minmaxij=aik;
SEDLO pove katero čisto strategijo naj odločevalca A oz. B izbereta in vrednost, ki jo A najmanj dobi in B
največ plača. (to je čista strategija).
Omega je cena igre. Čista stateg. je takrat, kadar je srateg.odločevalca enaka 1, vse ostale pa so nič. Npr:(0,1,0)
sicer pa je mešana stategija. V matričnih igrah s sedlom je optimalna strategija za oba odločevalca vedno čista
strategija.
Strateška igra brez sedla: v tem primeru govorimo o mešani strategiji igralcev. Matrična igra nima sedla npr.
če je maxmin=0=minmax=3. Matriko potem reduciramo, tako da poiščemo za oba odločevalca prevladujoče
alternative in nato s pomočjo minmax pravila poiščemo optimalno strategijo za odločevalca A in B. Eksistirane
alternative uporabimo, ostale pa z reduciramo. Nato ugotovimo ali obstoji sedlo, vendar pravilo velja, da tudi v
reducirani matriki ni sedla, poiščemo mešano strategijo in ceno igre. V matrični igri brez sedla je vedno
optimalna mešana strategija.
CENA IGRE- ima naslednji pomen; če odločevalec A izbere alternativo a*i (alternativa v vrstici – maxminai ), si
s tem zagotovi, da bo zanesljivo dobil najmanj , odločevalec B pa mu s pravilno izbiro lahko vselej prepreči, da
ne bo dobil več kot . Odločevalec B pa si s podobnim razmišljanjem, to je z izbiro alternative b*j(alternativa v
stolpcu – minmaxai), zagotovi, da ne plača več kot . Tako odločevalca A in B lahko dosežeta neke vrste
ravnovesja. Q ravnovesju govorimo takrat, kadar odločevalca opravita več potez kar pa je povezano s pojmom
strategija.
38. KAJ POMENI KRATICA DDDP RAZLOŽI KATERI SO OSNOVNI ELEMENTI DDDP IN OPIŠI
RAZLIKO MED DDDP IN MREŽNIM PLANIRANJEM
Kratica DDDP pomeni diskretno deterministično dinamično programiranje. Z dinamičnim programiranjem lahko
glede na izbran kriterij poiščemo optimalno vodenje procesa, ki se odvija v več fazah. Pri več faznih procesih se
moramo v vsaki fazi odločiti, kako naj vodimo nadaljnji del procesa. Vseh odločitev ne določimo hkrati, pač pa
zaporedno drugo za drugo (zaradi tega pravimo, da je problem dinamičen) in pri tem iščemo tako zaporedje
odločitev, ki nam da glede na izbran kriterij optimalen učinek. Obravnavali bomo le procese, ki imajo končno
število faz in vse množice, ki v procesu nastopajo bodo diskretne in končne (zaradi tega pravimo, da je
programiranje diskretno). Vsak problem, ki ga lahko rešimo v fazah je dinamičen problem. V vsaki fazi
sprejmemo odločitev in odločitev vpliva na vse ostale. Poiskati moramo tako odločitev, da bo posledica
optimalna.
Sestavljena je iz več faz:
faza: povemo iz koliko faz oz. korakov je sestavljen proces
faza: v vsakem trenutku imamo stanje Xij
faza: v vsakem stanju imamo na razpolago končno množico odločitev dxij
faz: enačba prehoda
21
faza: donesek oz. dobiček
faza: grafično ponazorimo z grafom
faza: optimiziramo s kontitativnimi metodami Beleman (od leve proti desni)
na koncu še sledi komentar
RAZLIKA: DDDP upošteva faze, ima lahko več končnih stanj, vrednost končnega stanja je lahko 0 ali ni enaka
nič, iščemo retrogradno min ali max. 0 so stanja, imamo prehod, optimalna politika.
Mrežno planiranje-nima faz, nujno imamo en končni dogodek, kjer se proces konča, vrednost končnega stanja je
vedno nič, iščemo samo max. 0 so dogodki, imamo aktivnost, kritična pot.
2) MAXMAX pravilo: po katerem veliko tvegamo. Tu nas zanimajo največji rezultati in kot optimalno odločitev
izberemo tisto, pri kateri je rezultat, izbran izmed največjih, najmanjši.
ai = aj ? maxUik = maxUjk
k k
3) HURWICZOV PRINCIP- kjer k najboljšemu rezultatu vzamemo najslabšega in se nato odločimo na osnovi
konveksne linearne kombinacije obeh. (je linerna sestava na osnovi konveksne linearne kombinacije in vsak
koeficient je element iz intervala [0,1]
Čim večji je α tem večji je optimizem tistega, ki sprejme odločitve.
H(a1)= αmaxÌUik + (1-α)minUjk; α= 0,4
k
4) LAPLACEVO pravilo- kjer seštejemo vse rezultate, ki pripadajo odločitvi in kot optimalno odločitev
izberemo tisto, pri kateri je vsota rezultatov največja.
a1 = aj ? Uik = Ujk
k k
22
E(a1) = Uik · pik (1/3=n; ali dano 0,45=s)
6) MINIMAX pravilo priložnostnih izgub:
- v osnovni preglednici poiščemo največje število (maximum) in ga prikažemo kot št. 0,
nato pa vsa ostala podana števila odštejemo od tega maximuma.
- tu nas zanima, kakšne so posledice če ne sprejmemo optimalne odločitve. Če se odločevalec ne odloči za
optimalno odločitev, nekaj izgubi, kar je sicer imel priložnost dobiti.. To izgubo imenujemo priložnostna izguba.
Za vsako odločitev poiščemo maxsimalno priložnostno izgubo in kot optimalno odločitev izberemo tisto, pri
kateri je priložnostna izguba izbrana izmed največjih, najmanjša.
43. MATRIKA
- seštevanje, odštevanje, množenje matrike s skalarjem, množenje matrike z matriko.
- inverzna matrika A-1 = 1/detA d -b
-c a A*X = B X*A = B
X = A-1B X = BA-1
- enotska matrika 1 0
0 1
Kranj, 2002
RO
23