You are on page 1of 12

Kupovina organske hrane

Uprava kompanije koja se bavi distribucijom organske hrane eli saznati ta utie na mjesena
izdvajanja na organsku hranu [expenditure]. Na bazi sluajnog uzorka anketirano je 173 potroaa. Na
sedmostepenoj Likertovoj skali mjereni su razliiti stavovi prema organskoj hrani (varjable x1-x8).

Ispitanicima su postavljena i pitanja gdje najee kupuju organsku hranu [place] i koju vrstu organske
hrane najee kupuju [vegetables-honey]. Pitanje o vrsti hrane je bilo formulisano kao pitanje sa
viestrukim odgovorima.

Na kraju upitnika su bila pitanja vezana za demografske podatke kao to su: spol [gender], broj
lanova domainstva [sizehouse] i da li je prosjeni mjeseni prihod domainstva vei od 2.000 KM
[income]. Upitnik koji je koriten u istraivanju se nalazi u prilogu, a sakupljeni podaci su spremljeni u
bazu sa podacima pod nazivom org_hrana1.dta.

Nakon to je uraena inicijalna regresiona analiza kojom se predviala mjesena izdvajanja na


organsku hranu [expend], ljudi iz Uprave su se poalili da je u model ukljueno previe varijabli da bi
se mogao izvui jasan i upotrebljiv zakljuak. Zbog toga ste angaovani kao marketing analitiar i
trebate kreirati regresioni model sa manjim brojem varijabli na bazi kojeg bi se izvukli jasniji zakljuci
o vezi izmeu stavova prema organskoj hrani sa jedne strane, te namjere kupovine organske hrane s
druge strane.

Zadaci i pitanja:

1. Primjenite faktorsku analizu kako bi ste identifikovali dimenzije koje eventualno postoje
unutar ocijena vezanih za stavove prema organskoj hrani [varijable x1-x8]. Kao metod za
ekstrakciju faktora odaberite Principal component analysis. Za odreivanje broja faktora
koristite Kajzerov kriterij i izvrite Varimax rotaciju.

1. Da li je veliina uzorka adekvatna?

Ukupno su prikupljeni odgovori od 173 ispitanika.

U samoj analizi a zbog postojanja nedostajuih podataka (listwise deletion), finalna veliina uzorka je
obuhvatila 164 ispitanika.

Obzirom da su mjerene perceprije 8 atributa, postignut je omjer od 20,5 ispitanika po varijabli, to je


znatno iznad poeljnog omjera od 1:5, 1:10 i 1:15.
8 (broj varijabli) : 164 (broj opservacija) = 1:20,5

Nedostajuih podataka imamo 173-164 = 9, 9/173 = 0,052 * 100% = 5,2%.

Obzirom na mali obim nedostajuih podataka (5,2%) i na veliki broj opservacija po varijabli moemo
zakljuiti da je veliina uzorka adekvatna za faktorsku analizu, jedino na ta bismo trebali obratiti
panju jeste da prikupimo dodatan broj ispitanika jer se broj od 300 ispitanika smatra dobrim.

1
2. Da li je skup podataka prigodan za faktorsku analizu?

factortest x1- x8

Determinant of the correlation matrix


Det = 0.060

Bartlett test of sphericity

Chi-square = 409.316
Degrees of freedom = 28
p-value = 0.000
H0: variables are not intercorrelated

Kaiser-Meyer-Olkin Measure of Sampling Adequacy


KMO = 0.631

Kaiser-Mayer-Oklin mjera adekvatnosti uzorka iznosila je 0.631, to je iznad preporuenih 0,5 i


predstavlja dobar rezultat, na osnovu ega zakljuujemo da je korelacijska matrica pogodna za
faktorsku analizu.

Bartlettov test sfericiteta (2 (28) = 409.316, p = 0.000)) je signifikantan, to znai da se opservirana


matrica znaajno razlikuje od matrice identiteta i da je primjena faktorske analize opravdana.

Determinanta korelacione matrice iznosi 0.060 i vea je od 0.00001, to upuuje na to da problem


multikolinearnosti ne postoji.

Na osnovu svega navedenog zakljuujemo da je dati skup podataka pogodan za faktorsku analizu.

1. Inicijalno rjeenje

factor x1-x8, mineigen(1) pcf


(obs=150)

Factor analysis/correlation Number of obs = 150


Method: principal-component factors Retained factors = 3
Rotation: (unrotated) Number of params = 21

--------------------------------------------------------------------------
Factor | Eigenvalue Difference Proportion Cumulative
-------------+------------------------------------------------------------
Factor1 | 2.54375 0.69115 0.3180 0.3180
Factor2 | 1.85260 0.50460 0.2316 0.5495
Factor3 | 1.34800 0.71463 0.1685 0.7180
Factor4 | 0.63337 0.02652 0.0792 0.7972
Factor5 | 0.60685 0.06736 0.0759 0.8731
Factor6 | 0.53948 0.19629 0.0674 0.9405
Factor7 | 0.34319 0.21043 0.0429 0.9834
Factor8 | 0.13276 . 0.0166 1.0000
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(28) = 412.13 Prob>chi2 = 0.0000

2
Inicijalno rjeenje na bazi Kajzerovog kriterija i koritenjem Principal Component analize rezultiralo je
ekstrakcijom 3 faktora.

rotate, kaiser blank (.40)

Factor analysis/correlation Number of obs = 150


Method: principal-component factors Retained factors = 3
Rotation: orthogonal varimax (Kaiser on) Number of params = 21

--------------------------------------------------------------------------
Factor | Variance Difference Proportion Cumulative
-------------+------------------------------------------------------------
Factor1 | 2.33387 0.36706 0.2917 0.2917
Factor2 | 1.96681 0.52313 0.2459 0.5376
Factor3 | 1.44368 . 0.1805 0.7180
--------------------------------------------------------------------------
LR test: independent vs. saturated: chi2(28) = 412.13 Prob>chi2 = 0.0000

Rotated factor loadings (pattern matrix) and unique variances

-----------------------------------------------------------
Variable | Factor1 Factor2 Factor3 | Uniqueness
-------------+------------------------------+--------------
x1 | 0.6958 | 0.4365
x2 | 0.8250 | 0.3079
x3 | 0.9071 | 0.1563
x4 | 0.8166 | 0.3158
x5 | 0.8647 | 0.2478
x6 | 0.7930 | 0.3530
x7 | 0.8182 | 0.3132
x8 | 0.9235 | 0.1250
-----------------------------------------------------------
(blanks represent abs(loading)<.4)

Principal-component analiza (PCA) sa Varimax rotacijom, provedena nad 8 varijabli, rezultirala je sa


ukupno 3 faktora koji objanjavaju 71,80% varijanse poetnog skupa varijabli, to je dobro obzirom da
je kriterij 50% ili vie za uzorak izmeu 100 i 200 ispitanika.

. sortl

Rotated factor loadings (pattern matrix) and unique variances sorted

----------------------------------------------------------
Variable | Factor1 Factor2 Factor3 | Uniqueness
-------------+------------------------------+-------------
x8 | 0.9235 -0.1476 -0.0172 | 0.1250
x3 | 0.9071 -0.1376 -0.0432 | 0.1563
x6 | 0.7930 0.1201 -0.0606 | 0.3530
x5 | -0.0590 0.8647 0.0326 | 0.2478
x7 | -0.0851 0.8182 -0.1010 | 0.3132
x1 | 0.0167 0.6958 0.2811 | 0.4365
x2 | 0.0322 0.1016 0.8250 | 0.3079
x4 | -0.1310 0.0126 0.8166 | 0.3158
----------------------------------------------------------

Nakon komande sortl uoio sam da je moje inicijalno rjeenje ujedno i konano i da nije potrebno
izbaciti niti jednu varijablu.

1. Ekstrahovanim faktorima dodijelite smislene nazive koji e uhvatiti sutinu konstrukta na koji
se faktor odnosi.

3
2. Imenovanje faktora

FAKTOR 1 - Tvrdnje koje ulaze u faktor 1 odnose se na x8- Organska hrana je zdravija , x3- Organska
hrana je visoko kvalitetna, x6- Organska hrana je ukusnija. Faktor 1 moemo nazvati PREDNOSTI
KONZUMIRANJA ORGANSKE HRANE.

FAKTOR 2 - Tvrdnje koje ulaze u faktor 2 odnose se na X5 - Moje znanje o organskoj hrani je vie od
skromnog , X7 - U sporedbi sa drugim ljudima dosta znam o organskoj hrani, X1 - Smatram da sam
dovoljno educiran/a po pitanju organske hrane. Faktor 2 moemo nazvati POZNAVANJE ORGANSKE
HRANE.

FAKTOR 3 - Tvrdnje koje ulaze u faktor 3 odnose se na X2 - Organsku hranu teko je lako nai na
mjestima na kojima kupujem , X4 - Razmislio/la bih o kupovini organske hrane da je ista manje
dostupna na mjestima. Faktor 3 moemo nazvati DOSTUPNOST ORGANSKE HRANE.

2. Uradite analizu pozdanosti za dobijene faktore.

1. Analiza pouzdanost

Analizu pouzdano radimo da bi provjerili internu konzistentnost odgovora na postavljena pitanja.

alpha x8 x3 x6, item

Test scale = mean(unstandardized items)

average
item-test item-rest interitem
Item | Obs Sign correlation correlation covariance alpha
-------------+-----------------------------------------------------------------
x8 | 172 + 0.9082 0.7819 1.111428 0.6757
x3 | 168 + 0.8942 0.7627 1.190018 0.7081
x6 | 169 + 0.8140 0.5498 1.596557 0.9261
-------------+-----------------------------------------------------------------
Test scale | 1.299864 0.8357
-------------------------------------------------------------------------------
Ukupni Alpha za faktor 1 iznosi 0.8357 to je u omjeru izmeu 0,8 i 0,9 to znai da je interna
konzistentnost odgovora na postavljena pitanja dobra. Ova interna konzistentnost bi se mogla
poveati izbacivanjem varijable x6 i u tom sluaju novi ukupni alpha bi iznosio 0.9261.
alpha x5 x7 x1, item
Test scale = mean(unstandardized items)
average
item-test item-rest interitem
Item | Obs Sign correlation correlation covariance alpha
-------------+-----------------------------------------------------------------
x5 | 169 + 0.8533 0.6324 .8885087 0.5095
x7 | 169 + 0.8082 0.5665 1.169376 0.5993
x1 | 170 + 0.7424 0.4363 1.600442 0.7475
-------------+-----------------------------------------------------------------
Test scale | 1.219442 0.7159

4
Ukupni Alpha za faktor 2 iznosi 0.7159 to je u omjeru izmedju 0,7 i 0,8 to znai da je interna
konzistentnost odgovora na postavljena pitanja prihvatljiva. Ova interna konzistentnost bi se mogla
poveati izbacivanjem varijable x1 i u tom sluaju novi ukupni alpha bi iznosio 0.7475 .

. alpha x2 x4, item

Test scale = mean(unstandardized items)

Average interitem covariance: 1.033288


Number of items in the scale: 2
Scale reliability coefficient: 0.5699

Ukupni Alpha za faktor 2 iznosi 0.5699 to je u omjeru izmedju 0,5 i 0,6 to znai da je interna
konzistentnost odgovora na postavljena pitanja poor (siromana), odnosno loa.

3. Izraunajte zbirne skale za dobijene faktore.

1. Zbirne skale
. egen prednosti = rmean (x8 x3 x6)

(1 missing value generated)

. egen poznavanje = rmean (x5 x7 x1)

(2 missing values generated)

. egen dostupnost = rmean (x2 x4)

(8 missing values generated)

Ovako uneene zbirne skale unio sam u regresioni model. to je objanjeno u nastavku izvjetaja.

4. Upotrijebite tako dobijene zbirne skale kao nezavisne varijable u regresionom modelu kako bi
vidjeli ta utie na mjesena izdvajanja na organsku hranu [expenditure]. Pored toga u
regresionom modelu kao kontrolne varijable koristite broj lanova domainstva [sizehouse] i
dummy varijablu za mjeseni prihod domainstva [income].
5. Interpretirajte dobijene koeficijente. ta najvie utie na mjesena izdvajanja na organsku
hranu? ta uopte ne utie?
6. Koliko je estimirani regresioni model reprezentativan?

REGRESIONA ANALIZA
5
PITANJA 6 I 7:
. regress expenditure sizehouse income prednosti poznavanje dostupnost, beta

Source | SS df MS Number of obs = 145


-------------+------------------------------ F( 5, 139) = 35.97
Model | 439134.816 5 87826.9633 Prob > F = 0.0000
Residual | 339376.607 139 2441.55832 R-squared = 0.5641
-------------+------------------------------ Adj R-squared = 0.5484
Total | 778511.423 144 5406.32933 Root MSE = 49.412

------------------------------------------------------------------------------
expenditure | Coef. Std. Err. t P>|t| Beta
-------------+----------------------------------------------------------------
sizehouse | -29.80616 3.965518 -7.52 0.000 -.4239353
income | 73.11928 8.744592 8.36 0.000 .47431
prednosti | 13.79282 3.225162 4.28 0.000 .2417674
poznavanje | 11.95155 3.176495 3.76 0.000 .2146855
dostupnost | -2.438034 3.090354 -0.79 0.432 -.04496
_cons | 35.78552 28.50158 1.26 0.211 .

Model objanjava 54,84% varijabiliteta zavisne varijable (expenditure), i moemo rei da je djelimino
reprezentativan obzirom da 45,16% modela ostaje neobjanjeno.

Rezultat analize varijanse (ANOVA), kojom se testira da li je model znaajno bolji u predvianju
vrijednosti zavisne varijable u odnosu na sluaj kada za predvianje koristimo samo aritmetiku
sredinu, je signifikantan (F(5, 139) = 35.97, p < .01). Obzirom da je model signifikantan, moemo
pristupiti daljoj interpretaciji dobijenih rezultata.

Kad je rije o koeficijentima, inicijalni rezultat pokazuje da su prediktori sizehouse, income, prednosti,
poznavanje koritenja organske hrane i dostupnost organske hrane signifikantni prediktori, dok je
dostupnost nesignifikantan prediktor organske hrane, te zbog toga nema statistinu znaajnost.

Najvei utjecaj ima income sa beta vrijednosti 0.47431, zatim sizehouse, a slijede prednosti i
poznavanje organske hrane. Dostupnost organske hrane je nesignifikantan prediktor, pa ne moemo
tvrditi da ima bilo kakav utjecaj.

Sizehouse ima negativan utjecaj to znai da e se sa poveanjem broja lanova domainstva, smanjiti
mjesena izdvajanja za organsku hranu.

Income ima pozitivan utjecaj to znai da e se poveanjem prihoda domainstva poveati i mjeseni
izdaci za organsku hranu.

Prednosti i poznavanje organske hrane takoer imaju pozitivan utjecaj to znai da e se sa


poveanjem prednosti i poznavanja poveati i izdaci za organsku hranu.

Dostupnost organske hrane je nesignifikantan prediktor tako da ga nisam komentario jer nema
statistiku znaajnost.

6
7. Ispitajte sljedee pretpostavke OLS regresionog modela:
a. Da li postoje netipine vrijednosti koje naruavaju preciznost (outliers)? Kao kriterij za
identifikaciju koristite Cook's distance d > 1 kriterij.
b. Da li je ispunjena pretpostavka o ne postojanju multikolinearnosti izmeu nezavisnih
varijabli?
c. Da li je zadovoljena pretpostavka o linearnosti? 1
d. Da li je ispunjena prepostavka o homoskedastinosti?
e. Da li postoji autokrelacija tj. da li su reziduali meusobno nezavisni?
f. Da li greke reziduali imaju normalan raspored?2

PITANJE 8
. predict d, cooksd
(28 missing values generated)

. list d if d>4/145

+----------+
| d |
|----------|
7. | .0842629 |
18. | .1321644 |
19. | .0504849 |
31. | . |
32. | . |
|----------|
33. | .0442356 |
37. | .0936882 |
40. | . |
45. | . |
46. | . |
|----------|
48. | . |
50. | . |
52. | . |
53. | . |
54. | . |
|----------|
57. | . |
71. | .0337311 |
75. | . |
77. | . |
85. | . |
|----------|
95. | . |
116. | . |
120. | . |
122. | . |
126. | .0369015 |
|----------|
133. | . |
139. | . |
143. | . |
148. | . |
150. | .0453817 |
|----------|
151. | . |
156. | . |
159. | . |
162. | . |

1
Koristite samo arcplot dijagnostiki alat.
2
Koristite Kernel density dijagnostiki alat i odgovarajue testove.

7
163. | .0740837 |
|----------|
164. | . |
165. | .0309828 |
173. | . |

Vidimo da niti jedna vrijednost koristenjem Cook distance metoda nema vrijednost veu od 1, tako da
ne postoji razlog za zabrinutost.

MULTIKOLINEARNOST

. pwcorr sizehouse income prednosti poznavanje dostupnost

| sizeho~e income predno~i poznav~e dostup~t


-------------+---------------------------------------------
sizehouse | 1.0000
income | -0.0281 1.0000
prednosti | -0.0486 0.0657 1.0000
poznavanje | -0.1035 0.0707 -0.0854 1.0000
dostupnost | -0.0338 0.1101 -0.1035 0.1151 1.0000

. vif

Variable | VIF 1/VIF


-------------+----------------------
poznavanje | 1.04 0.963272
dostupnost | 1.04 0.965632
income | 1.03 0.974681
prednosti | 1.02 0.981318
sizehouse | 1.01 0.985860
-------------+----------------------
Mean VIF | 1.03

Pregledom korelacione matrice nismo uoili velik iznos korelacije (iznad 0,7) izmedju varijabli.
Provoenjem testa takoer vidimo da je prosjeni VIF oko 1, vrijednosti VIF su manje od 5 i 10, a
vrijednosti 1/vif su vee od 0,1 i 0,2, prema tome na osnovu svega zakljuujemo da ova pretpostavka
nije naruena.

LINEARNOST
. acprplot prednosti, lowess lsopts(bwidth(1))

. acprplot poznavanje, lowess lsopts(bwidth(1))

. acprplot dostupnost, lowess lsopts(bwidth(1))

. acprplot sizehouse, lowess lsopts(bwidth(1))

. acprplot income, lowess lsopts(bwidth(1))


income^2 is collinear with income

8
Varijabla sizehouse uzraava donekle nelinearan trend.

Varijabla income je kolinearna.

Varijabla poznavanje, prednosti i dostupnost takoer izraavaju nelinearan trend.

Prema tome pretpostavka o linearnosti je naruena.

HOMOSKEDASTICNOST
. rvfplot, yline (0)

. estat hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of expenditure

chi2(1) = 29.42
Prob > chi2 = 0.0000

Za ispitivanje ove pretpostavke nacrtali smo dijagram rasipanja reziduala naspram predvienih
vrijednosti. Na dijagramu uoavamo sumnjiv oblik, meutim proveo sam test da potvrdim.

Breusch-Pagan test je signifikantan 2 (1) = 29.42, p = 0.000, to potvruje raniji zakljuak o


naruavanju pretpostavke.

AUTOKORELACIJA
. tsset id
time variable: id, 5 to 339, but with gaps
delta: 1 unit

. dwstat

Number of gaps in sample: 75

Durbin-Watson d-statistic( 6, 145) = .6443435

Pretpostavku smo provjerili zraunavanjem Durbin-Watson d-statistike (6, 145) = 0.6443435 to


ukazuje na to da postoji ekstremno pozitivna autokorelacija te da je ova pretpostavka naruena.

NORMALNOST
. predict r, resid
(28 missing values generated)

. kdensity r, normal

. swilk r

Shapiro-Wilk W test for normal data

9
Variable | Obs W V z Prob>z
-------------+--------------------------------------------------
r | 145 0.92603 8.360 4.806 0.00000

. sktest r

Skewness/Kurtosis tests for Normality


------- joint ------
Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+---------------------------------------------------------------
r | 145 0.0000 0.0039 24.82 0.0000

Na grafikonu sam primjetio da raspored odstupa od normalnog rasporeda, ali sam proveo testove da
potvrdim, oba testa su signifikantna cime sam potvrdio da distribucija reziduala odstupa od normalne
distribucije.

8. U kontekstu razmatranja razvoja distribucije, dajte preporuku na koje vrste prodajnih mjesta
bi se najvie trebala fokusirati distribucija organske hrane.

. tab place

Gdje najee kupujete organsku hranu ? | Freq. Percent Cum.


----------------------------------------+-----------------------------------
U supermarketima/hipermarketima | 62 36.69 36.69
U sepcijaliziranim prodavnicama organsk | 22 13.02 49.70
Na trnicama otvorenog tipa | 51 30.18 79.88
Direktno od proizvodjaa | 27 15.98 95.86
Putem interneta | 4 2.37 98.22
Na eko sajmovima | 3 1.78 100.00
----------------------------------------+-----------------------------------
Total | 169 100.00

9. U kontekstu kreiranja proizvodnog miksa, navedite koju vrstu organske hrane potroai
najvie kupuju?

. mrtab vegetables- honey, title (Vrste organske hrane)

| Percent of Percent
Vrste organske hrane | Frequency responses of cases
------------------------------------------+-----------------------------------
vegetables [Svjee voe i povre] | 156 32.43 91.23
milk [Mlijeko i mlijeni proizvodi] | 97 20.17 56.73
meat [Meso i proizvodi od mesa] | 58 12.06 33.92
bread [Hljeb/kruh i proizvodi od | 64 13.31 37.43
itarica] |
nonalbever [Bezalkoholni napici] | 21 4.37 12.28
honey [Med] | 85 17.67 49.71
------------------------------------------+-----------------------------------
Total | 481 100.00 281.29

Valid cases: 171


Missing cases: 2

Moemo vidjeti da je najei odgovor Svjee voe i povre sa 156 odgovora, to je 32,43%. U koloni
Percent of cases vidimo da je 91,23% ispitanika odgovorilo da najee kupuju svjee voe i povre.
---

10
10. Da li postoji statistiki znaajna razlika izmeu mukaraca i ena [gender] u pogledu
mjesenih izdvajanja na organsku hranu [expenditure]?

. sdtest expenditure, by(gender)

Variance ratio test


------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
male | 43 99.27295 9.955173 65.28043 79.1826 119.3633
female | 104 105.2642 7.606448 77.57085 90.17861 120.3498
---------+--------------------------------------------------------------------
combined | 147 103.5117 6.104775 74.01647 91.44651 115.5768
------------------------------------------------------------------------------
ratio = sd(male) / sd(female) f = 0.7082
Ho: ratio = 1 degrees of freedom = 42, 103

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1


Pr(F < f) = 0.1043 2*Pr(F < f) = 0.2086 Pr(F > f) = 0.8957

Ispod tabele gledamo srednju kolonu (Ha:ratio ! = 1) u kojoj je prikazana vjerovatnoa da dvije grupe
(mukarci i ene) imaju razliite varijanse. Obzirom da je p = 0.2086 zakljuujemo da je test nije
signifikantan, te da je naruena pretpostavka o homogenosti varijanse.

. ttest expenditure, by (gender) unequal

Two-sample t test with unequal variances


------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
male | 43 99.27295 9.955173 65.28043 79.1826 119.3633
female | 104 105.2642 7.606448 77.57085 90.17861 120.3498
---------+--------------------------------------------------------------------
combined | 147 103.5117 6.104775 74.01647 91.44651 115.5768
---------+--------------------------------------------------------------------
diff | -5.991248 12.52851 -30.87216 18.88966
------------------------------------------------------------------------------
diff = mean(male) - mean(female) t = -0.4782
Ho: diff = 0 Satterthwaite's degrees of freedom = 92.4989

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.3168 Pr(|T| > |t|) = 0.6336 Pr(T > t) = 0.6832

11
Obzirom da je p = 0,6336 i da je to vee od potrebnih p < 0,05 moemo zakljuiti da ne postoji
statistiki signifikantna razlika u pogledu mjesenih izdvajanja za organsku hranu izmeu mukaraca i
ena.

12

You might also like