You are on page 1of 16

UNIVERZITET U TUZLI

MAŠINSKI FAKULTET

AKADEMSKA 2016/17

Statistika u mašinstvu

Semestralni rad

Predmetni profesor: Dr. sc. Emir Šarić, vanr. prof.

Student: Almedin Vejzović


Zadatak 1

Za dati uzorak populacije izračunati ̅ , σ , M (medijanu), (interkvartilni


rang), konstruisati histogram podataka i box-plot.

30,7531686541604
29,7130541149366
36,3913395764331
41,6929063360337
27,9997864710026
32,3924217307243
31,4202405915793
19,1645804400547
31,4269019187038
36,4186133954863
24,7081449174089
33,2712749461526
30,0946644854661
34,5951109615121
24,3166843394788
23,8678438252618
33,6605696326084
42,0839668605448
30,6152402582787
36,0732109667095
24,9556377555788
22,1592955475372
30,9587876324801
28,8487591959974
32,2130492913139
26,6539935089671
31,1792363586159
32,7079814839893
24,6276053316994
27,0217547190014
Dati niz demo sortirati po veličini:

19,1645804400547
22,1592955475372
23,8678438252618
24,3166843394788
24,6276053316994
24,7081449174089
24,9556377555788
26,6539935089671
27,0217547190014
27,9997864710026
28,8487591959974
29,7130541149366
30,0946644854661
30,6152402582787
30,7531686541604
30,9587876324801
31,1792363586159
31,4202405915793
31,4269019187038
32,2130492913139
32,3924217307243
32,7079814839893
33,2712749461526
33,6605696326084
34,5951109615121
36,0732109667095
36,3913395764331
36,4186133954863
41,6929063360337
42,0839668605448

Srednju vrijednost uzorka izuzetog iz neke populacije računamo po formuli:


̅

Za n=30 srednja vrijednost iznosi:

Varijansu uzorka računamo po izrazu:

∑ ̅

Dok standardnu devijaciju računamo kao:


Median

n=30, paran broj, uzimamo aritmetičku sredinu između broja na 15. i 16. mjestu sortiranog
niza.

Kvartili:

Q1 - Median između minimuma i originalne medijane

Q2 - Usvajamo median sortiranog niza

Q3 - Median između maksimuma i originalne medijane

Median polovi niz brojeva na dva dijela. Na osnovu prvog niza sa medianom imamo 16 brojeva pa Q1
računamo preko prethodnog obrasca uključujući i medianu:

19,1645804400547
22,1592955475372
23,8678438252618
24,3166843394788
24,6276053316994
24,7081449174089
24,9556377555788
26,6539935089671
26,8378741174532
27,0217547190014
27,9997864710026
28,8487591959974
29,7130541149366
30,0946644854661
30,6152402582787
30,68420445

Za ovaj niz je median Q1 = (26,6539935089671+27,0217547190014)/2 ,za Q3 se treba uraditi isto, s


tim što se uzima drugi dio niza.

Interkvartilni rang određujemo kao razliku: Q3-Q1 = 5.7123275

5.7123275 * 1.5 = 8.56849125


Zadnje dvije vrijednosti u nizu ne pripadaju intervalu 18.269382 - 41.118692 pa su te dvije
vrijednosti ekstremi.

Box-plot

Broj podioka histograma ima vrijednost √ = 5.47722 = usvajamo 6 (5-20


preporučeno).

Širina svakog podioka je (maksimum - minimum)/6 = 3.81989, tako da prvi podiok


pokriva interval od 19.16458 do 19.16458 +3.81989 što iznosi 22.98447, drugi podiok od
22.98447 do 26.80436, itd.

Frekvencija pojavljivanja je apsolutna.


Histogram apsolutne frekvencije


Zadatak 2

Izračunati koeficijent korelacije i prokomentarisati rezultat:

X Y
1 0,709203
2 2,075689
3 3,303230
4 5,797680
5 6,065171
6 4,591423

Ako iskonstruišemo graf datih vrijednosti, iz prvog pogleda ne možemo donijeti zaključke o
zavisnosti dvije populacije.

Tražimo kovarijansu:

∑ ̅ ̅

Za vrijednosti :

̅
Kovarijansa je pozitivan broj, što znači da priraštaju koordinate x, odgovara priraštaj
koordinate y.

Korelaciju izražavamo preko koeficijenta korelacije:

Za vrijednosti :

Koeficijent korelacije može imati vrijednosti intervala od -1 do 1. Za podinterval od 0 do -1


kažemo da je negativna korelacija, a za interval od 0 do 1 pozitivna korelacija. Korelacija je
veda što je koeficijent korelacije približniji 1 odnosno -1. Za vrijednosti 0-0.3 odnosno -0.3 do
0 kažemo da je slaba korelacija, za 0.3 do 0.5 je dobra, a od 0.8 do 1 snažna korelacija, što je
u našem slučaju.
Zadatak 3

Odrediti koeficijente a i b za prostu linearnu regresiju, a zatim koeficijente a, b i c za


prostu nelinearnu regresiju.

X Y
1 5,6653
2 1,7964
3 13,7460
4 6,2307
5 28,4350
6 36,6864

Predstavimo podatke pomodu grafa:

Graf podataka

Kroz dati set treba povudi pravac y=ax+b kako bi zadovoljio minimum vertikalnog odstupanja
od postavljenih tačaka. Da bi postavili takav pravac, potrebno je napisati jednačinu
odstupanja:


Ako pronađemo parcijalne izvode jednačine odstupanja po koeficijentima a i b, dobijamo
sistem dvije linearne jednačine sa dvije nepoznate, čijim rješenjem dolazimo do koeficijenata
a i b.

∑ ∑ ∑
∑ ∑

∑ ∑ ∑ ∑
∑ ∑

Za naš konkretan slučaj vrijednosti pojedinih suma su:

∑ ∑ ∑ ∑

Sada možemo dati aproksimirani pravac:

y = 6.5001 x - 7.3239

Za nelinearnu regresiju uzimamo parabolu oblika y=ax2+bx+c. Sumu odstupanja ove krive
možemo napisati u obliku:

Ako iz datom izrazu priredimo parcijalne izvode po parcijalnim koeficijentima a,b,c ,


dobijamo sistem od tri jednačine sa tri nepoznate koje su naši koeficijenti:

(∑ ) (∑ ) ∑

(∑ ) (∑ ) (∑ ) ∑

(∑ ) (∑ ) (∑ ) ∑

Za vrijednosti:


Dobijamo sljedeća rješenja:

Datu parabolu opisanu jednačinom:

možemo prikazati grafom:


Zadatak 4

Donijeti statistički zaključak o jednakosti srednjih vrijednosti i varijansi dva seta


podataka (A i B).

A B
4,1102 4,8043
4,1835 4,9997
3,8083 4,8654
3,9711 4,1896
3,8634 4,4004
3,7842 5,0775
3,7234 5,5664
4,0198 5,1647
3,9886 5,0338
4,2785 5,6620
3,6947 4,6339
3,8000 4,3682
3,9684 4,9738
4,1212 4,7088
3,7933 5,0036
3,9682 4,8242
4,1002 4,9066
3,9076 5,4777
3,9989 5,2797
3,9350 5,2803
3,6270 5,0709
4,1039 5,2838
4,0294 4,8115
4,0399 4,6428
4,1628 4,6194
4,8709
5,3840
4,8726
5,1084
5,0838

Stepen slobode:
Studentov T test:

Zbog veličine uzorka B, test statistiku računamo kao:

̅̅̅ ̅̅̅ ̅̅̅ ̅̅̅

Vodeći se pretpostavkom o jednakosti srednjih vrijednosti populacija ̅̅̅ ̅̅̅ ;


računamo odgovarajuće statističke pokazatelje:

̅̅̅

̅̅̅

Zajedničku varijansu računamo pomodu izraza:

S = 0.2788

Sada uporedimo izračunato t sa tKRIT iz statističkih tabela:


Vidimo da tKRIT ima vrijednosti 2,00 do 2,01 za stupnjeve slobode 50 i 60, i za statističku
signifikansu 95%. Vidimo da je t mnogo vede od tKRIT pa zaključujemo da postoji značajna
razlika između srednjih vrijednosti populacija uzoraka.
Fišerov F test:

F test izvodimo računajudi F vrijednost:

Ovaj izraz je obrnuto proporcionalan teoretskom jer se za nazivnik uzima uvijek veda
varijansa, pa stoga F ima vrijednost:

Za F test računamo dva stepena slobode:

Sada uporedimo kritičnu vrijednost FKRIT iz tabela sa izračunatom:

Zaključujemo da postoji značajna razlika između varijansi uzoraka za statističku značajnost 95 %.

http://www.danielsoper.com/statcalc/calculator.aspx?id=4

You might also like