You are on page 1of 6

Име, презиме и број индекса:

Статистичке напредне методе

09.02.2017.

1.У табели је приказан проценат памука у материјалу коришћеном за израду спортиских мајица:

94.1 88.2 86.1 95.1 90.0 87.3 86.4 84.5 92.4 87.3
86.6 91.2 86.1 90.4 89.1 87.3 84.1 90.1 93.2 90.6
91.4 95.2 86.1 94.3 93.2 86.7 83.0 95.3 94.1 97.8
93.1 86.4 87.6 94.1 92.1 96.4 88.2 86.4 85.0 84.9
78.3 89.6 90.3 93.1 94.6 96.3 94.7 91.1 92.4 90.6
89.1 88.8 86.4 85.1 84.0 93.7 87.7 90.6 89.4 88.6
84.1 82.6 83.1 84.6 83.6 85.4 89.7 87.6 85.1 89.6
90.0 90.1 94.3 97.3 96.8 94.4 96.1 98.0 85.4 86.6
91.7 87.5 84.2 85.1 90.5 95.6 88.3 84.1 83.7 82.9

Total
Variable Count Mean StDev Variance CoefVar Minimum Q1 Median Q3
Maximum
C1 90 89.376 4.316 18.627 4.83 78.300 86.100 89.250 93.125
98.000

N for
Variable Range IQR Mode Mode Skewness Kurtosis
C1 19.700 7.025 86.4 4 0.10 -0.75

а) Одредити обим, модус, минимум, максимум и опсег узорка. Израчунати аритметичку


средину, узорачку дисперзију и стандардну девијацију као и коефицијент варијације
узорка.

Obim uzorka je broj elemenata uzorka i iznosi 90


Modus je element uzorka koji se najvise puta pojavljuje u uzorku(ima najvecu frekfenciju
pojavkjivanja) i iznisu 86,4 i pojavljuje se 4 puta
Minimum je element uzorka koji ima najmanju vrijedenost obiljezja i iznosi 78,3
Maksimum je element uzorka sa najvecom vrijednosti obiljezja 98
Opseg je razlika maksimuma i minimuma i iznosi 19,7
Aritmeticka sredina predstavlja srednju vrijednost obiljezja elemenata uzorka tj. x90 (suma
obiljezja svih elementa uzoraka) / 90 i iznosi 89,376
Uzoracka disperzija predstavlja jednu od mjera rasipanja elemenata uzorka u odnosu na
aritmeticku sredinu uzorka i racuna se kao srednje kvadratno odstupanje elemenata uzorka od
aritmeticke sredine uzorka, tj. Sn2 = 1/90 * suma(Xi-Xn)2 i iznosi 18,627
Uzoracka devijacija je mjera rasipanja elemenata uzorka jednaka je korenu standardne devijacija
i iznosi 4,316
Keficijent varijacije je kolicnik standardne devijacije i aritmeticke sredine i iznosi 4,83
б) Наћи медијану, прву и трећу квартилу и интерквартилни опсег узорка. Kонструисати
хистограм и представити добијени узорак користећи individual value plot и box plot.

Medijana je broj koji djeli uzorak na dva jednaka djela tako da je lijevo broj jednak desno od
medijane i ima ih jedank broj sa lijeve i desne strane i iznosi 89,50
Prva kvartila je broj koji djeli uzorak na dva djela tako da lijevo od prve kvartile su elementi
uzorka cije je obiljezje manja ili jedanaka od nje i ima ih 25 % i desno 75% sa vrijednosti
obiljezja vecim ili jednaki od nje. Prva kvartila iznosi 86,1
Treca kvartila je broj koji djeli elemente uzorka na dva djela tako da je lijevo od nje 75%
procenata elemenata uzorka sa vrijednsti obiljezja manjim ili jednakim od nje a desno 25 %
vrijednosti elementa uzorka sa obiljezima vecim ili jednakim od nje, i iznosi 93,125
Interkvatilni opseg (IQR) je razlika trece i prve kvartile i takodje se moze razmatrati kao jedna
od mjera rasipanja elemenata uzorka. Vrijednst je 7,025

Histogram – sluzi za graficko predstavljanje elemenata uzoraka koje se sajstoji od pravougaonika


cija je jedna osnova interval u kome se nalaze elementi uzorka (minitab automatski odredjuje
sirinu dva), a druga stranica (visina pravougaonika) ima duzinu koja je jednaka frekfenciji
elemenata uzorka koji pripadaju odgovarajucem intervalu

Histogram of C1
18

16

14

12
Frequency

10

0
80 84 88 92 96
C1

Individual value plot – sluzi za graficko prikazivanje uzorka gdje je svaki element uzorka
prikazan jednom tackom
Individual Value Plot of C1

80 85 90 95 100
C1

Box plot -

Boxplot of C1
100

95

90
C1

85

80
в) Тестирати претпоставку да је узорак узет из популације чије обележје има нормалну
расподелу користећи normal probability plot и Колмогоров-Смирнов тест нормалности.
Тестирати хипотезу да је средина обележја популације 89.4 килограм са прагом
значајности α=0.05 користећи одговарајући интервал повјерења. Шта интервал повјерења
за непознати параметар расподјеле представља? Дати његову интерпретацију? Одредити
p-вредност овог теста. Шта p-вредност теста представља?

Probability Plot of C1
Normal
99.9
Mean 89.38
StDev 4.316
99 N 90
AD 0.731
95 P-Value 0.055
90
80
70
Percent

60
50
40
30
20
10
5

0.1
75 80 85 90 95 100 105
C1

Elementi uzorka ne odstupaju znacajnije od prave linije pa pretpostavka da je uzorak uzet iz


populacije sa normalonom raspodjelom obilezja mozemo smatrati zadovoljenom.

Kolmogoro – Sminrof test normalnosti na osnovu realizovanog uzorka daje P vrijednost vecu od
0.15. Kako je P vrijednost testa najmanji prag znacajnosti za koji nultu hipotezu odabacujemo to
za nas zadati prag znacajnosi Alfa = 0,05 zakljucujemo da je uzorak uzet iz populacije sa
normalnom raspodjelom obliljezja zadovoljen.

Interval povjerenja za zadati nivo povjerenja, Beta jednako 0,95 , predstavlja interval koji od sto
slucjano izabranih uzoraka njih bar 95 ce dati ocjenu nepoznate sredine obiljezja populacije koji
pripada tom intervalu povjerenja.

Na osnovu praga znacajnoci alfa 0.05 interval povjerenja za nepoznatu sredinu obiljezja
populacije je (88.472, 90.280). Posto pretpostavljena vrijednost sredine obiljezja populacije 89.4
pripada ovom intervalu povjerenja nultu hipotezu ne odbacujemo pri ovom realizovanom uzorku
i sa pragom znacajnosti alfa 0.05. P vrijednost ovog testa je 0.957.Kako je p vrijednsot testa
najmanji prag znacajnosti za koji nultu vrijednost odbacujemo to za zadato alfa jednako 0.05
slijedi da nultu hipotezu ne odbacujemo.

Odatle slijedi da su zakljuci dobijeni na osnovu intervala povjerenja i p vrijednosti testa


medjusobno usaglaseni.

г) Да би се утврдила зависност између процента памука коришћног за израду спортских


мајица и да ли секупци баве спортом професионално, аматерски или се не баве спортом,
купци су разврстани према проценту памука садржаног у мајици коју су купили у
категорије 1, 2 и 3 и према томе да ли се баве спортом на оне који се баве професионално,
аматерски и оне који се не баве спортом. Добијени су следећи резултати:

Професионално Аматерски Не баве се спортом


Категорија 1 11 9 12
Категорија 2 13 11 7
Категорија 3 8 9 10

Са прагом значајности α=0.05 тестирати да ли постоји статистичка (не)зависност између


масе студената и да ли се студент бави спортом.

2. Петнаест особа узраста између 35 и 50 година је учествовало у испитивању ефеката


дијете и физичке активности на ниво холестерола у крви. Пре и након тромесечног
третмана мерен је ниво холестерола у крви и добијени су следећи резултати:

Пре третмана Након третмана:


265 240 258 295 251 229 231 227 240 238

245 287 314 260 279 241 234 256 247 239

283 240 238 225 247 246 218 219 226 233

а) Конструисати normal probability plot за оба узорка и испитати да ли је задовољена


претпоставка да су добијени резултати из популација са нормалном расподелом обележја.
Да ли можемо претпоставити једнакост варијанси популација?

б) Са прагом значајности α=0.05 тестирати да ли је примењени третман има практичну


вредност у погледу смањивања средње вредности нивоа холестерола у крви пре и после
примењеног третмана. Одредити p-вредност овог теста. Шта p-вредност теста
представља?

в) Одредити 95% доње-једнострани интервал поверења за разлику средњих вредности


нивоа холестерола мерених пре и после примењеног третмана. Интерпретирати интервал
поверења. Да ли је добијени интервал поверења у сагласју са закључком добијеним под б).
Добијени одговор образложити.
г) Са прагом значајности α=0.01 тестирати да ли су једнаке пропорције особа чији је ниво
холестерола у крви непаран број.

д) Одредити 99% двострани интервал поверења за разлику пропорција особа чији је ниво
холестерола у крви непаран број. До каквог закључка можемо доћи користећи добијени
интервал поверења и да ли је он у сагласју са закључком добијеним под г).

3. Услед неодговарајуће провере техничке исправности аутомобила током техничког


прегледа просечно 35% возача технички неисправних возила добије сертификат да је
њихов возило технички исправно. Нека случајна променљива X представља број возача
чија ће возила проћи технички преглед иако њихова возила нису технички исправна од
посматраних 543 возила током једног месеца.

а) Израчунати вероватноћу да ће мање од 173 возача добити сертификат иако је њихово


возило технички неисправно. Израчунати вероватноћу да ће између 358 и 443 возача неће
добити сертификат о техничкој исправности њиховог возила. Скицирати добијене
вероватноће на графику расподеле вероватноћа случајне променљиве X.

б) Користећи одговарајућу апроксимацију случајне променљиве X израчунати приближне


вероватноће под а) а затим их представити на графику расподела вероватноћа приближне
случајне променљиве.

в) Којом расподелом се случајна променљива X може апроксимирати и зашто таква


апроксимација не би била одговарајућа. Образложити одговор.

г) Од возача чија су возила била на техничком прегледу случајно је одабрано њих 7 за које
је мерено одступање дужине кочионог пута од вредности које стандардне у односу на
масу возила. Забележена одступања дужина кочионог пута возила заједно са њиховим
масама дата су у табели:

Одступања дужина 2.7 2.4 2.9 1.8 2.9 2.3 3.1


кочионог пута [m]
Maса возила [kg] 1264 1235 1315 1224 1433 1308 1392

Конструисати scatter diagram добијених података (диаграм расипања), израчунати


коефицијент корелације и окарактерисати јачину и смер корелације између одступања
дужина кочионог пута од стандардне вредности и масе возила код 7 случајно одабраних
возила.

Koeficijent korelacije po

д) Написати једначину праве линеарне регресије одступања дужина кочионог пута (y) у
зависности од масе возила (x) и на основу ње предвидети одступање дужине кочионог
пута ако је маса возила 1356 kg..

You might also like