Professional Documents
Culture Documents
Uprava kompanije koja se bavi distribucijom organske hrane eli saznati ta utie na mjesena
izdvajanja na organsku hranu [expenditure]. Na bazi sluajnog uzorka anketirano je 173 potroaa. Na
sedmostepenoj Likertovoj skali mjereni su razliiti stavovi prema organskoj hrani (varjable x1-x8).
Ispitanicima su postavljena i pitanja gdje najee kupuju organsku hranu [place] i koju vrstu organske
hrane najee kupuju [vegetables-honey]. Pitanje o vrsti hrane je bilo formulisano kao pitanje sa
viestrukim odgovorima.
Na kraju upitnika su bila pitanja vezana za demografske podatke kao to su: spol [gender], broj
lanova domainstva [sizehouse] i da li je prosjeni mjeseni prihod domainstva vei od 2.000 KM
[income]. Upitnik koji je koriten u istraivanju se nalazi u prilogu, a sakupljeni podaci su spremljeni u
bazu sa podacima pod nazivom org_hrana1.dta.
Zadaci i pitanja:
1. Primjenite faktorsku analizu kako bi ste identifikovali dimenzije koje eventualno postoje
unutar ocijena vezanih za stavove prema organskoj hrani [varijable x1-x8]. Kao metod za
ekstrakciju faktora odaberite Principal component analysis. Za odreivanje broja faktora
koristite Kajzerov kriterij i izvrite Varimax rotaciju.
U samoj analizi a zbog postojanja nedostajuih podataka (listwise deletion), finalna veliina uzorka je
obuhvatila 164 ispitanika.
Obzirom na mali obim nedostajuih podataka (5,2%) i na veliki broj opservacija po varijabli moemo
zakljuiti da je veliina uzorka adekvatna za faktorsku analizu, jedino na ta bismo trebali obratiti
panju jeste da prikupimo dodatan broj ispitanika jer se broj od 300 ispitanika smatra dobrim.
1
2. Da li je skup podataka prigodan za faktorsku analizu?
factortest x1- x8
Chi-square = 409.316
Degrees of freedom = 28
p-value = 0.000
H0: variables are not intercorrelated
Na osnovu svega navedenog zakljuujemo da je dati skup podataka pogodan za faktorsku analizu.
1. Inicijalno rjeenje
--------------------------------------------------------------------------
Factor | Eigenvalue Difference Proportion Cumulative
-------------+------------------------------------------------------------
Factor1 | 2.54375 0.69115 0.3180 0.3180
Factor2 | 1.85260 0.50460 0.2316 0.5495
Factor3 | 1.34800 0.71463 0.1685 0.7180
Factor4 | 0.63337 0.02652 0.0792 0.7972
Factor5 | 0.60685 0.06736 0.0759 0.8731
Factor6 | 0.53948 0.19629 0.0674 0.9405
Factor7 | 0.34319 0.21043 0.0429 0.9834
Factor8 | 0.13276 . 0.0166 1.0000
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(28) = 412.13 Prob>chi2 = 0.0000
2
Inicijalno rjeenje na bazi Kajzerovog kriterija i koritenjem Principal Component analize rezultiralo je
ekstrakcijom 3 faktora.
--------------------------------------------------------------------------
Factor | Variance Difference Proportion Cumulative
-------------+------------------------------------------------------------
Factor1 | 2.33387 0.36706 0.2917 0.2917
Factor2 | 1.96681 0.52313 0.2459 0.5376
Factor3 | 1.44368 . 0.1805 0.7180
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(28) = 412.13 Prob>chi2 = 0.0000
-----------------------------------------------------------
Variable | Factor1 Factor2 Factor3 | Uniqueness
-------------+------------------------------+--------------
x1 | 0.6958 | 0.4365
x2 | 0.8250 | 0.3079
x3 | 0.9071 | 0.1563
x4 | 0.8166 | 0.3158
x5 | 0.8647 | 0.2478
x6 | 0.7930 | 0.3530
x7 | 0.8182 | 0.3132
x8 | 0.9235 | 0.1250
-----------------------------------------------------------
(blanks represent abs(loading)<.4)
. sortl
----------------------------------------------------------
Variable | Factor1 Factor2 Factor3 | Uniqueness
-------------+------------------------------+-------------
x8 | 0.9235 -0.1476 -0.0172 | 0.1250
x3 | 0.9071 -0.1376 -0.0432 | 0.1563
x6 | 0.7930 0.1201 -0.0606 | 0.3530
x5 | -0.0590 0.8647 0.0326 | 0.2478
x7 | -0.0851 0.8182 -0.1010 | 0.3132
x1 | 0.0167 0.6958 0.2811 | 0.4365
x2 | 0.0322 0.1016 0.8250 | 0.3079
x4 | -0.1310 0.0126 0.8166 | 0.3158
----------------------------------------------------------
Nakon komande sortl uoio sam da je moje inicijalno rjeenje ujedno i konano i da nije potrebno
izbaciti niti jednu varijablu.
1. Ekstrahovanim faktorima dodijelite smislene nazive koji e uhvatiti sutinu konstrukta na koji
se faktor odnosi.
3
2. Imenovanje faktora
FAKTOR 1 - Tvrdnje koje ulaze u faktor 1 odnose se na x8- Organska hrana je zdravija , x3- Organska
hrana je visoko kvalitetna, x6- Organska hrana je ukusnija. Faktor 1 moemo nazvati PREDNOSTI
KONZUMIRANJA ORGANSKE HRANE.
FAKTOR 2 - Tvrdnje koje ulaze u faktor 2 odnose se na X5 - Moje znanje o organskoj hrani je vie od
skromnog , X7 - U sporedbi sa drugim ljudima dosta znam o organskoj hrani, X1 - Smatram da sam
dovoljno educiran/a po pitanju organske hrane. Faktor 2 moemo nazvati POZNAVANJE ORGANSKE
HRANE.
FAKTOR 3 - Tvrdnje koje ulaze u faktor 3 odnose se na X2 - Organsku hranu teko je lako nai na
mjestima na kojima kupujem , X4 - Razmislio/la bih o kupovini organske hrane da je ista manje
dostupna na mjestima. Faktor 3 moemo nazvati DOSTUPNOST ORGANSKE HRANE.
1. Analiza pouzdanost
average
item-test item-rest interitem
Item | Obs Sign correlation correlation covariance alpha
-------------+-----------------------------------------------------------------
x8 | 172 + 0.9082 0.7819 1.111428 0.6757
x3 | 168 + 0.8942 0.7627 1.190018 0.7081
x6 | 169 + 0.8140 0.5498 1.596557 0.9261
-------------+-----------------------------------------------------------------
Test scale | 1.299864 0.8357
-------------------------------------------------------------------------------
Ukupni Alpha za faktor 1 iznosi 0.8357 to je u omjeru izmeu 0,8 i 0,9 to znai da je interna
konzistentnost odgovora na postavljena pitanja dobra. Ova interna konzistentnost bi se mogla
poveati izbacivanjem varijable x6 i u tom sluaju novi ukupni alpha bi iznosio 0.9261.
alpha x5 x7 x1, item
Test scale = mean(unstandardized items)
average
item-test item-rest interitem
Item | Obs Sign correlation correlation covariance alpha
-------------+-----------------------------------------------------------------
x5 | 169 + 0.8533 0.6324 .8885087 0.5095
x7 | 169 + 0.8082 0.5665 1.169376 0.5993
x1 | 170 + 0.7424 0.4363 1.600442 0.7475
-------------+-----------------------------------------------------------------
Test scale | 1.219442 0.7159
4
Ukupni Alpha za faktor 2 iznosi 0.7159 to je u omjeru izmedju 0,7 i 0,8 to znai da je interna
konzistentnost odgovora na postavljena pitanja prihvatljiva. Ova interna konzistentnost bi se mogla
poveati izbacivanjem varijable x1 i u tom sluaju novi ukupni alpha bi iznosio 0.7475 .
Ukupni Alpha za faktor 2 iznosi 0.5699 to je u omjeru izmedju 0,5 i 0,6 to znai da je interna
konzistentnost odgovora na postavljena pitanja poor (siromana), odnosno loa.
1. Zbirne skale
. egen prednosti = rmean (x8 x3 x6)
Ovako uneene zbirne skale unio sam u regresioni model. to je objanjeno u nastavku izvjetaja.
4. Upotrijebite tako dobijene zbirne skale kao nezavisne varijable u regresionom modelu kako bi
vidjeli ta utie na mjesena izdvajanja na organsku hranu [expenditure]. Pored toga u
regresionom modelu kao kontrolne varijable koristite broj lanova domainstva [sizehouse] i
dummy varijablu za mjeseni prihod domainstva [income].
5. Interpretirajte dobijene koeficijente. ta najvie utie na mjesena izdvajanja na organsku
hranu? ta uopte ne utie?
6. Koliko je estimirani regresioni model reprezentativan?
REGRESIONA ANALIZA
5
PITANJA 6 I 7:
. regress expenditure sizehouse income prednosti poznavanje dostupnost, beta
------------------------------------------------------------------------------
expenditure | Coef. Std. Err. t P>|t| Beta
-------------+----------------------------------------------------------------
sizehouse | -29.80616 3.965518 -7.52 0.000 -.4239353
income | 73.11928 8.744592 8.36 0.000 .47431
prednosti | 13.79282 3.225162 4.28 0.000 .2417674
poznavanje | 11.95155 3.176495 3.76 0.000 .2146855
dostupnost | -2.438034 3.090354 -0.79 0.432 -.04496
_cons | 35.78552 28.50158 1.26 0.211 .
Model objanjava 54,84% varijabiliteta zavisne varijable (expenditure), i moemo rei da je djelimino
reprezentativan obzirom da 45,16% modela ostaje neobjanjeno.
Rezultat analize varijanse (ANOVA), kojom se testira da li je model znaajno bolji u predvianju
vrijednosti zavisne varijable u odnosu na sluaj kada za predvianje koristimo samo aritmetiku
sredinu, je signifikantan (F(5, 139) = 35.97, p < .01). Obzirom da je model signifikantan, moemo
pristupiti daljoj interpretaciji dobijenih rezultata.
Kad je rije o koeficijentima, inicijalni rezultat pokazuje da su prediktori sizehouse, income, prednosti,
poznavanje koritenja organske hrane i dostupnost organske hrane signifikantni prediktori, dok je
dostupnost nesignifikantan prediktor organske hrane, te zbog toga nema statistinu znaajnost.
Najvei utjecaj ima income sa beta vrijednosti 0.47431, zatim sizehouse, a slijede prednosti i
poznavanje organske hrane. Dostupnost organske hrane je nesignifikantan prediktor, pa ne moemo
tvrditi da ima bilo kakav utjecaj.
Sizehouse ima negativan utjecaj to znai da e se sa poveanjem broja lanova domainstva, smanjiti
mjesena izdvajanja za organsku hranu.
Income ima pozitivan utjecaj to znai da e se poveanjem prihoda domainstva poveati i mjeseni
izdaci za organsku hranu.
Dostupnost organske hrane je nesignifikantan prediktor tako da ga nisam komentario jer nema
statistiku znaajnost.
6
7. Ispitajte sljedee pretpostavke OLS regresionog modela:
a. Da li postoje netipine vrijednosti koje naruavaju preciznost (outliers)? Kao kriterij za
identifikaciju koristite Cook's distance d > 1 kriterij.
b. Da li je ispunjena pretpostavka o ne postojanju multikolinearnosti izmeu nezavisnih
varijabli?
c. Da li je zadovoljena pretpostavka o linearnosti? 1
d. Da li je ispunjena prepostavka o homoskedastinosti?
e. Da li postoji autokrelacija tj. da li su reziduali meusobno nezavisni?
f. Da li greke reziduali imaju normalan raspored?2
PITANJE 8
. predict d, cooksd
(28 missing values generated)
. list d if d>4/145
+----------+
| d |
|----------|
7. | .0842629 |
18. | .1321644 |
19. | .0504849 |
31. | . |
32. | . |
|----------|
33. | .0442356 |
37. | .0936882 |
40. | . |
45. | . |
46. | . |
|----------|
48. | . |
50. | . |
52. | . |
53. | . |
54. | . |
|----------|
57. | . |
71. | .0337311 |
75. | . |
77. | . |
85. | . |
|----------|
95. | . |
116. | . |
120. | . |
122. | . |
126. | .0369015 |
|----------|
133. | . |
139. | . |
143. | . |
148. | . |
150. | .0453817 |
|----------|
151. | . |
156. | . |
159. | . |
162. | . |
1
Koristite samo arcplot dijagnostiki alat.
2
Koristite Kernel density dijagnostiki alat i odgovarajue testove.
7
163. | .0740837 |
|----------|
164. | . |
165. | .0309828 |
173. | . |
Vidimo da niti jedna vrijednost koristenjem Cook distance metoda nema vrijednost veu od 1, tako da
ne postoji razlog za zabrinutost.
MULTIKOLINEARNOST
. vif
Pregledom korelacione matrice nismo uoili velik iznos korelacije (iznad 0,7) izmedju varijabli.
Provoenjem testa takoer vidimo da je prosjeni VIF oko 1, vrijednosti VIF su manje od 5 i 10, a
vrijednosti 1/vif su vee od 0,1 i 0,2, prema tome na osnovu svega zakljuujemo da ova pretpostavka
nije naruena.
LINEARNOST
. acprplot prednosti, lowess lsopts(bwidth(1))
8
Varijabla sizehouse uzraava donekle nelinearan trend.
HOMOSKEDASTICNOST
. rvfplot, yline (0)
. estat hettest
chi2(1) = 29.42
Prob > chi2 = 0.0000
Za ispitivanje ove pretpostavke nacrtali smo dijagram rasipanja reziduala naspram predvienih
vrijednosti. Na dijagramu uoavamo sumnjiv oblik, meutim proveo sam test da potvrdim.
AUTOKORELACIJA
. tsset id
time variable: id, 5 to 339, but with gaps
delta: 1 unit
. dwstat
NORMALNOST
. predict r, resid
(28 missing values generated)
. kdensity r, normal
. swilk r
9
Variable | Obs W V z Prob>z
-------------+--------------------------------------------------
r | 145 0.92603 8.360 4.806 0.00000
. sktest r
Na grafikonu sam primjetio da raspored odstupa od normalnog rasporeda, ali sam proveo testove da
potvrdim, oba testa su signifikantna cime sam potvrdio da distribucija reziduala odstupa od normalne
distribucije.
8. U kontekstu razmatranja razvoja distribucije, dajte preporuku na koje vrste prodajnih mjesta
bi se najvie trebala fokusirati distribucija organske hrane.
. tab place
9. U kontekstu kreiranja proizvodnog miksa, navedite koju vrstu organske hrane potroai
najvie kupuju?
| Percent of Percent
Vrste organske hrane | Frequency responses of cases
------------------------------------------+-----------------------------------
vegetables [Svjee voe i povre] | 156 32.43 91.23
milk [Mlijeko i mlijeni proizvodi] | 97 20.17 56.73
meat [Meso i proizvodi od mesa] | 58 12.06 33.92
bread [Hljeb/kruh i proizvodi od | 64 13.31 37.43
itarica] |
nonalbever [Bezalkoholni napici] | 21 4.37 12.28
honey [Med] | 85 17.67 49.71
------------------------------------------+-----------------------------------
Total | 481 100.00 281.29
Moemo vidjeti da je najei odgovor Svjee voe i povre sa 156 odgovora, to je 32,43%. U koloni
Percent of cases vidimo da je 91,23% ispitanika odgovorilo da najee kupuju svjee voe i povre.
---
10
10. Da li postoji statistiki znaajna razlika izmeu mukaraca i ena [gender] u pogledu
mjesenih izdvajanja na organsku hranu [expenditure]?
Ispod tabele gledamo srednju kolonu (Ha:ratio ! = 1) u kojoj je prikazana vjerovatnoa da dvije grupe
(mukarci i ene) imaju razliite varijanse. Obzirom da je p = 0.2086 zakljuujemo da je test nije
signifikantan, te da je naruena pretpostavka o homogenosti varijanse.
11
Obzirom da je p = 0,6336 i da je to vee od potrebnih p < 0,05 moemo zakljuiti da ne postoji
statistiki signifikantna razlika u pogledu mjesenih izdvajanja za organsku hranu izmeu mukaraca i
ena.
12