You are on page 1of 508

2017

TENIKAT STATISTIKORE
ME SHUMË NDRYSHORE

ME APLIKIM NË SPSS
REDAKTOR:

PROF. DR. ŞEREF KALAYCI

2017
TEKNIKAT STATISTIKORE ME SHUMË NDRYSHORE
ME APLIKIM NË SPSS
PËRKTHEU NGA TURQISHTJA: KUJTIM HAMELI

REDAKTOR: PROF. DR. SHEREF KALLAJXHË

PËRKTHYER NGA BOTIMI 6

2017
TEKNIKAT STATISTIKORE ME SHUMË NDRYSHORE
ME APLIKIM NË SPSS
AUTORËT
Kapitulli Kapitulli
Doc. Dr. Ali Sait Albayrak 11, 13 Nd. Doc. Dr. Aliye Kayış 14, 19
Doc. Dr. Abdullah Eroğlu 10 Nd. Doc. Dr. Ömer L. Antalyalı 7
Prof. Dr. Şeref Kalaycı 15, 16 Ligj. Nezihe Uçar 17
Ligj. Engin Küçüksille 9, 12 Nd. Doc. Dr. Hakan Demirgil 5
Nd. Doc. Dr. Belma Ak 3, 4 Nd. Doc. Dr. Didar B. İşler 18
Nd. Doc. Dr. Meltem Karaatlı 1 Ligj. Onur Sungur 6
Nd. Doc. Dr. Hidayet Ü. Keskin 8
Nd. Doc. Dr. Eda U. Çiçek 2

REDAKTOR

Prof. Dr. Şeref Kalaycı

Botimi i Gjashtë 2014

Përkthyer 2015
Edituar 2016
Riedituar 2017
FJALA E PËRKTHYESIT

Falendërimet i takojnë Zotit të Madh që ma lehtësoi dhe ma shtoi durimin gjatë
kryerjes së këtij punimi. Falenderoj prindërit e mi për mbështetjen morale, të cilët janë
edhe motivimi im më i madh për çdo punë. Falenderoj të gjithë ata që kanë kontribuar në
kompletimin dhe dizajnimin e këtij libri.

Duke parë mungesën e literaturës shqipe rreth këtij programi dhe nevoja e përdorimit
për këtë program, mora vetëiniciativën për t’i dhënë një kontribut literaturës sonë me
përkthimin e këtij libri, i cili përmban analizat statistikore më të përdorura për hulumtim
në shkencat shoqërore.

I nderuar hulumtues! Ky libër i mrekullueshëm rreth programit SPSS (Statistical
Package for the Social Sciences) i punuar nga një grup profesorësh të Turqisë, do të të
ndihmoj për të kryer analizat statistikore në program hap pas hapi përmes fotografive si
dhe bën interpretimin e rezultateve të përfituara nga analizat. Ky libër është dizajnuar në
mënyrë të tillë që çdo kush i cili nuk ka njohuri rreth SPSS-it, do të jetë në gjendje që të
kryej vetë një analizë në programin SPSS. Me shpresën se ky libër do t’ju shërbej gjatë
kryerjes së hulumtimeve tuaja, ju lë me prezencën e analizave në vazhdim dhe programit të
mirënjohur SPSS.

Për çdo vërejtje, koment apo sugjerim, mund të më shkruani në email adresën time.

Kujtim Hameli

kujtimhameli4@gmail.com

25.07.2015, Stamboll

i
PARATHËNIE

Në ditët e sotme mund të kryhen shumë lehtë shumë analiza statistikore përmes
kompjuterëve dhe programeve të sofistikuara që në të kaluarën ishte e pamundur për t’u
bërë. Në këtë kontekst, teknikat statistikore themelore dhe me shumë ndryshore përdoren
mjaft në universitetet tona nga studentët hulumtues, përmes paketave të ndryshme.

Dhe ne për këtë arsye kemi përgatitur punimin që keni në duar duke përdorur
programin e mirënjohur SPSS në shtetin tonë, për t’iu ndihmuar në aplikimin dhe
interpretimin e rezultateve të teknikave statistikore themelore dhe me shumë ndryshore.

Karakteristika më e rëndësishme e librit është aplikimi i metodës së mësimit aktiv. Pra,
edhe ai i cili nuk ka njohuri të mjaftueshme në nivelin e duhur rreth programit SPSS dhe
statistikës, me anë të librit tonë do të mund të mësojë se si mund t’i bëj analizat e
dëshiruara dhe si të i interpretojë rezultatet e përfituara.

Ideja e shkruarjes së librit filloi nga bisedat me kolegët e mi (nga autorët e librit
ligjëruesit dhe asistentët e hulumtimit) se përgatitja e një libri me aplikime në lidhje me
tema metodologjike do të ishte shumë i dobishëm për një audiencë të gjerë si për
akademikët, hulumtuesit dhe studentët dhe se edhe ata do të jepnin kontribut në
përgatitjen e këtij libri. Përveç kësaj, libri mori formën përfundimtare nga kontributet e
shokëve e mi të ndershëm të punës (Abdullah Eroğlu, Ali Sait Albayrak, Aliye Kayış) me
përgatitjen e kapitujve të tyre.

Kapitujt janë shkruar në mënyrë që mund të lexohen ndaras. Për këtë arsye, në libër
janë përsëritur disa gjëra. Një i cili ka njohuri themelore të statistikës, nuk ka nevojë që të
lexojë kapitujt e mëparshëm për leximin e çfarëdo kapitulli.

Mendimet dhe rekomandimet tuaja rreth këtij libri që menduam të jetë i dobishëm për
një audiencë të gjerë, i presim në email adresën tonë. Në bazë të rekomandimeve do të
provojmë që t’a bëjmë sa më të dobishëm për ju.

Prof. Dr. Sheref KALLAJXHË

kalayci61@yahoo.com

ii
PËRMBAJTJA

FJALA E PËRKTHYESIT ......................................................................................................................................... i
PARATHËNIE .......................................................................................................................................................... ii
PËRMBAJTA ........................................................................................................................................................... iii

1. RREGULLIMI DHE PARAQITJA E TË DHËNAVE........................................................................................ 1
1.1. ORGANIZIMI I TË DHËNAVE................................................................................................................................... 1
1.1.1. SHEMBULL APLIKIMI ....................................................................................................................................... 1
1.1.2. INTERPRETIMI I TABELAVE TË KRIJUARA NË LIDHJE ME RREGULLIMIN DHE
PARAQITJEN E TË DHËNAVE .................................................................................................................................... 3
1.2. ANALIZA E VLERAVE EKSTREME ..................................................................................................................... 10
1.2.1. SHEMBULL APLIKIMI .................................................................................................................................... 10
1.3. SHQYRTIMI I TË DHËNAVE QË MUNGOJNË.................................................................................................. 15
1.3.1. SHEMBULL APLIKIMI .................................................................................................................................... 16
1.4. PLOTËSIMI I MUNGESËS SË TË DHËNAVE .................................................................................................... 28
1.5. PURIFIKIMI SEZONAL ............................................................................................................................................ 31
1.5.1. METODAT E PËRDORURA NË RREGULLIM .......................................................................................... 31
1.5.1.1. MESATARET LËVIZËSE ................................................................................................................... 32
1.5.1.2. MODELI I THJESHTË EKSPONENCIAL I ZBUTJES (SIMPLE EXPONENTIAL
SMOOTHING) ....................................................................................................................................................... 33
1.5.1.3. MODELI I ZBUTJES EKSPONENCIALE TË HOLT’SIT ............................................................ 34
1.5.1.4. ZBUTJA E THJESHTË EKSPONENCIALE E NORMËS ADOPTUESE-PËRGJEGJËSE ... 34
1.5.1.5. MODELI I ZBUTJES EKSPONENCIALE TË WINTER’SIT ...................................................... 35
1.5.2. PURIFIKIMI SEZONAL DHE METODAT E ZBUTJES ........................................................................... 36
1.5.2.1. NDARJA SEZONALE (SEASONAL DECOMPOSITION) .......................................................... 38
1.5.2.2. ZBUTJA EKSPONENCIALE (EXPONENTIAL SMOOTHING) ............................................... 46

2. STATISTIKAT PËRSHKRUESE .....................................................................................................................54
2.1. MATËSIT E TENDENCËS QENDRORE .............................................................................................................. 54
2.1.1. MESATARJA ARITMETIKE ........................................................................................................................... 54
2.1.2. MEDIANA (MESORJA) .................................................................................................................................... 55
2.1.3. MODA (VLERA E MAJËS) .............................................................................................................................. 55
2.2. MATËSIT E DEVIJIMIT NGA MESATARJA ....................................................................................................... 57

iii
2.2.1. VARIANCA........................................................................................................................................................... 57
2.2.2. DEVIJIMI STANDART ..................................................................................................................................... 57
2.3. MATËSIT E DEVIJIMEVE NGA NORMALJA ..................................................................................................... 57
2.3.1. SHPËRNDARJA NORMALE PËR NJË NDRYSHORE ............................................................................. 57
2.3.1.1. SHEMBULL APLIKIMI ....................................................................................................................... 59
2.3.2. NGUSHTËSIA ..................................................................................................................................................... 64
2.3.3 PJERRËSIA ........................................................................................................................................................... 64
2.4. SHEMBULL APLIKIMI ............................................................................................................................................. 64

3. TESTIMI I HIPOTEZAVE.................................................................................................................................70
3.1. PËRCAKTIMI I HIPOTEZAVE ............................................................................................................................... 70
3.1.1. HIPOTEZA ZERO (NULL HYPOTHESIS) .................................................................................................. 70
3.1.2. HIPOTEZA ALTERNATIVE (ALTERNATIVE HYPOTHESIS) ............................................................ 70
3.2. TESTET STATISTIKORE ......................................................................................................................................... 71
3.3. TESTET NJË DHE DY ANËSORE .......................................................................................................................... 71
3.4. GABIMI I LLOJIT TË PARË DHE TË DYTË ....................................................................................................... 73
3.5. NIVELI I RËNDËSISË (α) DHE INTERVALIMI I BESIMIT (1−α) ............................................................. 73
3.6. MADHËSIA E MOSTRËS ......................................................................................................................................... 74
3.6.1. SHEMBULL APLIKIMI .................................................................................................................................... 75

4. TESTET E HIPOTEZAVE PARAMETRIKE ..................................................................................................78
4.1. SUPOZIMET E TESTEVE PARAMETRIKE ........................................................................................................ 78
4.2. TESTI T ......................................................................................................................................................................... 79
4.2.1. TESTI T I DY MOSTRAVE TË PAVARURA (INDEPENDENT SAMPLES T-TEST)..................... 80
4.2.1.1. SHEMBULL APLIKIMI ....................................................................................................................... 80
4.2.2. TESTI T I DY MOSTRAVE TË VARURA .................................................................................................... 83
4.2.2.1. SHEMBULL APLIKIMI ....................................................................................................................... 83
4.2.3. TESTI T NJË MOSTREJE (ONE-SAMPLE T-TEST) ............................................................................... 86
4.2.3.1. SHEMBULL APLIKIMI ....................................................................................................................... 86
4.3. TESTI-Z ......................................................................................................................................................................... 88
4.3.1. TESTI Z NJË MOSTËRSH................................................................................................................................ 88
4.3.1.1. SHEMBULL APLIKIMI ....................................................................................................................... 89
4.3.2. TESTI Z DY MOSTRASH ................................................................................................................................. 89
4.3.2.1. SHEMBULL APLIKIMI ....................................................................................................................... 90
4.4. ANALIZA E VARIANCËS (ANOVA) ..................................................................................................................... 90

iv
5. TESTET E HIPOTEZAVE JOPARAMETRIKE (NON-PARAMETRIC) ...................................................92
5.1. TESTI KATRORI-KI .................................................................................................................................................. 93
5.1.1. TESTI KATRORI-KI I PËRSHTATSHMËRISË DHE SHEMBULL APLIKIMI ................................. 93
5.1.2. TESTI KATRORI-KI I PAVARËSISË DHE SHEMBULL APLIKIMI ................................................... 98
5.1.3. TESTI KATRORI-KI I HOMOGJENITETIT DHE SHEMBULL APLIKIMI .................................... 104
5.2. TESTI RUNS DHE SHEMBULL APLIKIMI ..................................................................................................... 107
5.3. TESTI MAN-WHITNEY U DHE SHEMBULL APLIKIMI ............................................................................ 111
5.4. TESTI WALD-WOLFOWITZ DHE SHEMBULL APLIKIMI ....................................................................... 114
5.5. TESTI WILCOXON SIGNED RANK DHE SHEMBULL APLIKIMI ........................................................... 117
5.6. TESTI KRUSKAL-WALLIS DHE SHEMBULL APLIKIMI ........................................................................... 120
5.7. TESTI FRIEDMAN DHE SHEMBULL APLIKIMI .......................................................................................... 122
5.8. KORRELACIONI SPEARMAN’S RANK DHE SHEMBULL APLIKIMI .................................................... 125

6. ANALIZA E KORRELACIONIT .................................................................................................................... 129
6.1. KOEFICIENTI I KORRELACIONIT TË PEARSON-IT ................................................................................. 130
6.2. KOEFICIENTI I KORRELACIONIT TË PJESSHËM ...................................................................................... 131
6.3. MATËSIT E TJERË TË MARRËDHËNIES ....................................................................................................... 131
6.3.1. PHI ...................................................................................................................................................................... 131
6.3.2. KORRELACIONI RENDOR I SPEARMANIT.......................................................................................... 131
6.3.3. KOEFICIENTI I PROBABILITETIT .......................................................................................................... 132
6.3.4. ETA ..................................................................................................................................................................... 132
6.4. SHEMBULL APLIKIMI 1 ...................................................................................................................................... 132
6.5. SHEMBULL APLIKIMI 2 ...................................................................................................................................... 136
6.5.1. METODA BIVARIATE .................................................................................................................................. 137
6.5.2. METODA E PJESSHME................................................................................................................................. 140
6.5.3. METODA DISTANCES .................................................................................................................................. 141

7. ANALIZA E VARIANCËS (ANOVA – MANOVA) ...................................................................................... 146
7.1. ANOVA NJË DREJTIMSHE................................................................................................................................... 149
7.1.1. SHEMBULL APLIKIMI ................................................................................................................................. 149
7.1.2. DALJET E SPSS-IT DHE INTERPRETIMI .............................................................................................. 153
7.2. ANOVA DY DREJTIMSHE .................................................................................................................................... 158
7.2.1. SHEMBULL APLIKIMI ................................................................................................................................. 158
7.2.2. DALJET E SPSS-IT DHE INTERPRETIMI .............................................................................................. 166
7.3. MANOVA NJË DREJTIMSHE............................................................................................................................... 175

v
7.3.1. SHEMBULL APLIKIMI ................................................................................................................................. 175
7.3.2. DALJET E SPSS-IT DHE INTERPRETIMI .............................................................................................. 179
7.4. MANOVA DY DREJTIMSHE ................................................................................................................................ 188
7.4.1. SHEMBULL APLIKIMI ................................................................................................................................. 188
7.4.2. DALJET E SPSS-IT DHE INTERPRETIMI .............................................................................................. 192

8. ANALIZA E KOVARIANCËS ......................................................................................................................... 217
8.1. AVANTAZHET E APLIKIMIT TË ANALIZËS SË KOVARIANCËS .......................................................... 218
8.2. FUSHAT E PËRDORIMIT TË ANALIZËS SË KOVARIANCËS .................................................................. 218
8.3. SUPOZIMET E ANALIZËS SË KOVARIANCËS ............................................................................................. 219
8.4. SHEMBULL APLIKIMI .......................................................................................................................................... 221
8.4.1. HYRJA E TË DHËNAVE DHE TESTIMI I SUPOZIMEVE ................................................................... 221
8.4.1. APLIKIMI I ANALIZËS SË KOVARIANCËS ........................................................................................... 226

9. REGRESIONI I THJESHTË LINEAR ........................................................................................................... 233
9.1. MODELI I REGRESIONIT TË THJESHTË LINEAR ...................................................................................... 233
9.2. PARASHIKIMI I PARAMETRAVE ..................................................................................................................... 233
9.3. SHEMBULL APLIKIMI .......................................................................................................................................... 234
9.3.1. FORMIMI I MODELIT DHE PARASHIKIMI I PARAMETRAVE ..................................................... 235
9.3.2. INTERPRETIMI I PARAMETRAVE ......................................................................................................... 235
9.4. PARASHIKIMI ME MODELIN E REGRESIONIT .......................................................................................... 236
9.4.1. SHEMBULL APLIKIMI ................................................................................................................................. 236
9.4.2. TË DALURAT NGA SPSS-I DHE INTERPRETIMI ............................................................................... 238

10. SUPOZIMET E TEKNIKAVE STATISTIKORE ME SHUMË NDRYSHORE ..................................... 241
10.1. FUQIA DHE RËNDËSIA E TESTEVE STATISTIKORE............................................................................. 241
10.2. SUPOZIMI I NORMALITETIT .......................................................................................................................... 243
10.2.1. TESTI I NORMALITETIT ME NJË NDRYSHORE.............................................................................. 245
10.2.1.1. Testet Grafikore ............................................................................................................................ 245
10.2.1.2. Testet Analitike Për Normalitetin me një Ndryshore .................................................... 247
10.2.2. SHQYRTIMI I VLERAVE TË NJËSISË DEVIJUESE ME SHUMË NDRYSHORE ...................... 248
10.2.3. TESTI I SHPËRNDARJES NORMALE ME SHUMË NDRYSHORE ............................................... 251
10.3. SUPOZIMI I BARAZIMIT TË MATRICAVE TË KOVARIANCAVE ....................................................... 253
10.3.1. TESTIMI I BARAZISË SË MATRICËS SË KOVARIANCAVE ......................................................... 254
10.4. SUPOZIMI I LINEARITETIT ............................................................................................................................. 257

vi
10.5. KONVERTIMET PËR NORMALITETIN, KOVARIANCAT DHE LINEARITETIN ........................... 258
10.6. RREGULLA TË PËRGJITHSHME PËR KONVERTIMIN (TRANSFORMIMIN) ................................ 259
10.7. SUPOZIMI I LIDHJES SË SHUMËFISHTË LINEARE ................................................................................ 260
10.7.1. REZULTATET E PROBLEMIT TË LIDHJES SË SHUMËFISHTË LINEARE ............................. 261
10.7.2. PËRCAKTIMI I PROBLEMIT TË LIDHJES SË SHUMËFISHTË: VIF DHE INDEKSET
KUSHTËZUESE ........................................................................................................................................................... 262
10.7.3. ZGJIDHJA E PROBLEMIT TË LIDHJES SË SHUMËFISHTË LINEARE ...................................... 264
10.8. PAVARËSIA E GABIMEVE DHE AUTOKORRELACIONI........................................................................ 265
10.8.1. PËRCAKTIMI I AUTOKORRELACIONIT: PËRDORIMI I STATISTIKËS DURBIN WATSON
.......................................................................................................................................................................................... 266
10.8.2. TESTET E HIPOTEZAVE DW.................................................................................................................. 267
10.8.3. STATISTIKA DURBIN H ........................................................................................................................... 267
10.8.4. METODA E AUTOREGRESIONIT – METODA E PËRGJITHËSUAR E KATRORËVE MË TË
VEGJËL........................................................................................................................................................................... 268
10.9. PËRCAKTIMI I LIDHJES SË SHUMËFISHTË DHE AUTOKORRELACIONIT NË SPSS ................ 269

11. ANALIZA E KORRELACIONIT KANONIK ............................................................................................. 275
11.1. QASJE GJEOMETRIKE NDAJ ANALIZËS SË KORRELACIONIT KANONIK ..................................... 276
11.1.1. PARAQITJA GJEOMETRIKE E VLERAVE TË NJËSISË ................................................................... 281
11.2. QASJE ANALITIKE NDAJ ANALIZËS SË KORRELACIONIT KANONIK ............................................ 282
11.3. SUPOZIMET E ANALIZËS SË KORRELACIONIT KANONIK ................................................................ 284
11.4. PËRFITIMI I ANALIZËS SË KORRELACIONIT KANONIK ME SPSS ................................................. 284
11.4.1. PËRDORIMI I DOSJEVE MAKRO NË SPSS ......................................................................................... 285
11.4.2. INTERPRETIMI I REZULTATEVE TË ANALIZËS SË KORRELACIONIT KANONIK ........... 287
11.4.2.1. Statistikat Themelore ................................................................................................................. 287
11.4.2.2. Ndryshoret Kanonike dhe Koeficientët e Korrelacionit Kanonik ............................. 289
11.4.2.3. Testimi i Rëndësisë së Koeficientëve të Korrelacionit Kanonik................................ 291
11.4.2.4. Interpretimi i Koeficientëve të Korrelacionit Kanonik ................................................. 292
11.4.2.5. Rëndësia Praktike e Korrelacionit Kanonik ...................................................................... 293
11.5. RROTULLIMI I NDRYSHOREVE KANONIKE ............................................................................................ 295
11.6. VLEFSHMËRIA E JASHTME E ANALIZËS SË KORRELACIONIT KANONIK .................................. 295
11.7. PËRFITIMI I NDRYSHOREVE KANONIKE TË BESUESHME ............................................................... 296

12. MODELI I REGRESIONIT TË SHUMËFISHTË LINEAR ...................................................................... 299
12.1. MODELI ................................................................................................................................................................... 299
12.2. TESTIMI I HIPOTEZAVE NË MODELIN E REGRESIONIT TË SHUMËFISHTË LINEAR ............ 299

vii
12.3. KOEFICIENTI I PËRCAKTIMIT....................................................................................................................... 300
12.4. ZGJEDHJA E NDRYSHOREVE TË MODELIT .............................................................................................. 300
12.4.1. METODA ENTER ......................................................................................................................................... 300
12.4.2. METODA E SHTIMIT TË NDRYSHOREVE (FORWARD SELECTION)..................................... 301
12.4.3. FUNKSIONI I ELEMINIMIT TË NDRYSHOREVE (BACKWARD SELECTION) ..................... 301
12.4.4. METODA E SHTIMIT DHE LARGIMIT TË NDRYSHOREVE (STEPWISE SELECTION) .... 301
12.5. SHEMBULL APLIKIMI ....................................................................................................................................... 301
12.6. DALJET E SPSS-IT DHE INTERPRETIMI .................................................................................................... 308

13. ANALIZA E REGRESIONIT LOGJISTIK .................................................................................................. 313
13.1. HYRJE ....................................................................................................................................................................... 313
13.2. PËRFITIMI I ANALIZËS SË REGRESIONIT LOGJISTIK ME SPSS ....................................................... 313
13.2.1. NJOHJA E NDRYSHOREVE KLASIFIKUESE (KATEGORIKE) ..................................................... 316
13.2.2. RUAJTJA E NDRYSHOREVE TË REJA NË ANALIZËN E REGRESIONIT LOGJISTIK ........... 317
13.3. ANALIZA E REGRESIONIT LOGJISTIK ME NJË NDRYSHORE TË VETME KATEGORIKE ........ 319
13.3.1. KONCEPTE THEMELORE ........................................................................................................................ 319
13.3.2. PËRFITIMI I ANALIZËS SË REGRESIONIT LOGJISTIK ME NJË NDRYSHORE TË VETME
KATEGORIKE NË SPSS ............................................................................................................................................ 323
13.3.2.1. Informacione në Lidhje me Modelin..................................................................................... 323
13.3.2.2. Vlerësimi i Përshtatshmërisë së Modelit ............................................................................ 323
13.3.2.3. Parashikimi dhe Interpretimi i Parametrave.................................................................... 326
13.3.2.4. Klasifikimi i Njësive ..................................................................................................................... 328
13.3.3. ANALIZA E REGRESIONIT LOGJISTIK DHE ANALIZA E TABELAVE KONTINGJENTE ... 328
13.4. ANALIZA E REGRESIONIT LOGJISTIK ME NDRYSHORE TË PAVARUR METRIKE DHE
KATEGORIKE ................................................................................................................................................................... 329
13.4.1. INFORMACIONET E MODELIT: METODA E ZGJEDHJES HAP PAS HAPI.............................. 331
13.4.2. STATISTIKAT NË LIDHJE ME TESTIN E RËNDËSISË SË MODELIT ....................................... 337
13.4.3. MATJA E MARRËDHËNIES NË ANALIZËN E REGRESIONIT LOGJISTIK .............................. 338
13.4.4. VLERËSIMI I PËRSHTATSHMËRISË SË MODELIT TË REGRESIONIT LOGJISTIK ............ 340
13.4.4.1. Gabimet Jostandarte .................................................................................................................... 340
13.4.4.2. Gabimet Standarte ....................................................................................................................... 341
13.4.4.3. Vlerat e Devijimit (Deviance) .................................................................................................. 342
13.4.4.4. Vlerat e Distancës (Leverage) ................................................................................................. 342
13.4.4.5. Distanca Cook (Cook’s Distance)............................................................................................ 343
13.4.4.6. Vlerat DfBeta .................................................................................................................................. 343
13.4.4.7. Metodat Grafikore ........................................................................................................................ 343

viii
14. MODELI I REGRESIONIT PROBIT (PROBIT REGRESSION MODELS) ......................................... 347
14.1. HYRJE ....................................................................................................................................................................... 347
14.2. ANALIZA PROBIT NË SPSS.............................................................................................................................. 349
14.3. KOEFICIENTËT PROBIT ................................................................................................................................... 351
14.4. SHEMBULL APLIKIMI ....................................................................................................................................... 352

15. ANALIZA FAKTORIALE ............................................................................................................................. 368
15.1. FAZAT E ANALIZËS FAKTORIALE ............................................................................................................... 368
15.1.1. VLERËSIMI I PËRSHTATSHMËRISË SË SETIT SË TË DHËNAVE PËR ANALIZËN
FAKTORIALE............................................................................................................................................................... 368
15.1.2. PËRFITIMI I FAKTORËVE ....................................................................................................................... 369
15.1.3. ROTACIONI I FAKTORËVE ..................................................................................................................... 370
15.1.4. EMËRIMI I FAKTORËVE .......................................................................................................................... 370
15.2. SHEMBULL APLIKIMI ....................................................................................................................................... 370
15.3. TË DALURAT E SPSS-IT DHE INTERPRETIMI PËR ANALIZËN FAKTORIALE ........................... 376
15.3.1. VLERËSIMI I PËRSHTATSHMËRISË SË SETIT SË TË DHËNAVE PËR ANALIZËN
FAKTORIALE............................................................................................................................................................... 376
15.3.2. PËRCAKTIMI I NUMRIT TË FAKTORËVE ......................................................................................... 377
15.3.3. VARIANCAT E PËRBASHKËTA TË NRYSHOREVE ........................................................................ 378
15.3.4. FAZA E ROTACIONIT ................................................................................................................................ 379
15.3.5. EMËRIMI I FAKTORËVE .......................................................................................................................... 380
15.3.6. REZULTATET FAKTORIALE .................................................................................................................. 381

16. ANALIZA DISKRIMINUESE (DISCRIMINANT ANALYSIS)............................................................... 383
16.1. QËLLIMET E PËRDORIMIT TË ANALIZËS DISKRIMINUESE............................................................. 383
16.2. SUPOZIMET E ANALIZËS DISKRIMINUESE ............................................................................................. 383
16.3. MADHËSIA E DUHUR E SETIT TË TË DHËNAVE PËR ANALIZËN DISKRIMINUESE ............... 384
16.4. SHEMBULL APLIKIMI ....................................................................................................................................... 384
16.6. DALJET E SPSS-IT DHE INTERPRETIMI PËR ANALIZËN DISKRIMINUESE ................................ 391
16.5.1. VLERËSIMI I SUPOZIMEVE TË ANALIZËS DISKRIMINUESE.................................................... 391
16.5.2. VLERËSIMI I RËNDËSISË SË FUNKSIONEVE TË NDARJES (DISCRIMINANT) .................. 392
16.5.3. VLERËSIMI I RËNDËSISË SË NDRYSHOREVE TË PAVARURA NË ANALIZËN E
DISKRIMINIMIT ......................................................................................................................................................... 393
16.5.4. FUNKSIONI I DISKRIMINIMIT DHE INTERPRETIMI ................................................................... 394
16.5.5. VLERËSIMI I RËNDËSISË SË ANALIZËS SË DISKRIMINIMIT ................................................... 395

ix
17. ANALIZA E GRUPIMIT (CLUSTER ANALYSIS) ................................................................................... 399
17.1. PROCESI I VENDIMMARRJES PËR ANALIZËN E GRUPIMIT.............................................................. 400
17.1.1. QËLLIMET E ANALIZËS SË GRUPIMIT .............................................................................................. 403
17.1.2. PLANI I HULUMTIMIT NË ANALIZËN E GRUPIMIT ..................................................................... 403
17.1.3. MATJET E NGJASHMËRISË ..................................................................................................................... 403
17.1.4. MATJET E KORRELACIONIT .................................................................................................................. 406
17.1.5. MATJET E DISTANCËS ............................................................................................................................. 407
17.1.6. MATJA E PARTNERITETEVE ................................................................................................................. 410
17.1.7. STANDARTIZIMI I TË DHËNAVE ......................................................................................................... 410
17.1.8. SUPOZIMET E ANALIZËS SË GRUPIMIT ........................................................................................... 411
17.1.9. ZGJEDHJA E NJË ALGORITMI TË GRUPIMIT ................................................................................... 411
17.1.10. GRUPIMI HIERARKIK............................................................................................................................. 412
17.1.11. PËRCAKTIMI I NUMRIT TË GRUPEVE ............................................................................................ 412
17.1.12. KOEFICIENTËT E DISTANCËS ............................................................................................................ 412
17.1.13. GRAFIKU I PEMËS ................................................................................................................................... 413
17.1.14. GRUPIMI JOHIERARKIK ........................................................................................................................ 413
17.1.15. RREGULLIMI I ANALIZËS SË GRUPIMIT ........................................................................................ 415
17.1.16. INTERPRETIMI I GRUPEVE ................................................................................................................. 415
17.1.17. VLEFSHMËRIA DHE PROFILI I GRUPEVE ..................................................................................... 416
17.2. SHEMBULL APLIKIMI ....................................................................................................................................... 416
17.2.1. ANALIZA E GRUPIMIT HIERARKIK .................................................................................................... 416
17.2.2. ANALIZA E GRUPIMIT JOHIERARKIK ................................................................................................ 426

18. MATJA SHUMËDIMENSIONALE (MULTIDIMENSIONAL SCALING) ............................................ 436
18.1. MATJA DHE MATËSI .......................................................................................................................................... 436
18.2. KONCEPTET THEMELORE NË METODËN E MATJES SHUMËDIMENSIONALE ........................ 437
18.3. LLOJET E ANALIZAVE TË MATJES SHUMËDIMENSIONALE ............................................................. 438
18.4. APLIKIMI I ANALIZËS SË MATJES SHUMËDIMENSIONALE ............................................................. 441
18.5. LLOJET E TË DHËNAVE TË PËRDORURA NË METODËN E MATJES SHUMËDIMENSIONALE
............................................................................................................................................................................................... 444
18.6. APLIKIM I SHEMBULLIT .................................................................................................................................. 445

19. ANALIZA E BESUESHMËRISË (RELIABILITY ANALYSIS)............................................................... 464
19.1. SUPOZIMET E ANALIZËS SË BESUESHMËRISË ..................................................................................... 465
19.2. ANALIZAT DHE TESTET NË LIDHJE ME MATËSIT ............................................................................... 465

x
19.3. MODELET E PËRDORURA NË ANALIZËN E BESUESHMËRISË........................................................ 466
19.3.1. MODELI ALFA (α) (CRONBACH ALPHA COEFFICIENT) ............................................................ 466
19.3.2. MODELI ALFA NDARËS MËDYSH (SPLIT HALF) .......................................................................... 467
19.3.3. MODELI GUTTMAN ................................................................................................................................... 467
19.3.4. MODELI PARALEL ..................................................................................................................................... 467
19.3.5. MODELI STRIKT PARALEL ..................................................................................................................... 467
19.4. SHEMBULL APLIKIMI ....................................................................................................................................... 468
19.5. SHEMBULL APLIKIMI ....................................................................................................................................... 471

BURIMET E ZGJEDHURA ................................................................................................................................. 487

xi
1. RREGULLIMI DHE PARAQITJA E TË DHËNAVE

1.1. ORGANIZIMI I TË DHËNAVE
Përpara se të fillohet me analizat statistikore, gjëja e parë që duhet të bëj një
hulumtues është rregullimi i të dhënave të punimit. Në qoftë se punohet me numër të madh
të të dhënave është e dobishme që të shikohet forma e të dhënave dhe pikat e lakimit
përmes tabelave të shpërndarjes së frekuenacave dhe grafiqeve të ndryshme. Më tej, ky stil
është një shfaqje dhe siguron paraqitjen e të dhënave në një mënyrë më të qartë në qoftë se
punohet me shumë ndryshore.

Në punimet statistikore në mënyrë për zbatimin e shumë analizave, shpërndarja e të
dhënave duhet të jetë normale apo afër normales. Për të parë shpërndarjen e të dhënave,
përdoren grafiqe të ndryshme si histogrami, grafiku handle box, grafiku detrended normal,
leaves branches etj. Po ashtu përdoren edhe testet Kolmogrov Smirnov dhe Shapiro Wilks.

1.1.1 SHEMBULL APLIKIMI
Duke përdorur vlerat mujore të indeksit të IMKB-100 si ndryshore të varur dhe
vlerat mujore të interesit të thesarit si ndryshore e pavarur, do të bëhet shpjegimi i
shpërndarjes dhe paraqitjes së të dhënave.

Tabela 1.1: Të Dhënat Mujore Për Indeksin IMKB-100 dhe Normave të Interesit Për
Bonot e Thesarit

Indeksi i të dhënave Normat e interesit Indeksi i të dhënave Normat e interesit
për IMKB-100 për bonot e thesarit për IMKB-100 për bonot e thesarit
2635,14 92,26 19206,00 34,36
2265,94 137,29 16206,00 40,47
2196,38 141,34 14466,00 44,82
2577,54 145,20 13870,00 35,59
2597,91 145,19 13132,06 33,44
2568,16 130,21 11350,30 36,04
3890,83 124,80 13538,44 38,00
4544,07 103,82 8747,68 41,00
5354,03 100,57 9437,21 41,01
5069,22 100,46 10685,07 64,93
4950,21 11,50 8791,60 124,21
5805,45 102,88 8022,72 193,71
5018,28 115,17 12367,36 130,42
6071,12 112,09 10879,83 82,19
6509,92 109,21 11204,24 88,38
8459,48 94,63 9914,61 95,02
15208,78 94,64 9878,88 92,63
16715,00 38,20 7625,87 87,39
15946,00 42,09 9848,76 86,39
15920,00 39,21 11633,93 79,32

1
Në hapin 1, përmes Analyze zgjedhet Descriptive Statistics dhe pastaj Explore.

Hapi 1: Dritarja Për Rregullimin e të Dhënave

Në kutinë Dependent vendoset ndryshorja IMKB dhe në Label Cases By ndryshorja
bonot e thesarit.

Pas kësaj klikohet në tabin Statistics. Në këtë pjesë përzgjedhen Descriptives dhe
Outliers dhe pastaj klikoket në butonin Continue.

Hapi 2: Dritarja e Statistikave Përshkruese dhe Vlerave Outliers

Pastaj klikohet butoni Plots. Te pjesa Boxplots përzgjedhet Factors levels
together, te pjesa Descriptive përzgjedhen Stem-and-leaf dhe Histogram. Së fundi,
përzgjedhet dhe Normality Plots with tests dhe klikohet në butonin Continue.

2
Hapi 3: Dritarja e Grafiqeve

1.1.2. INTERPRETIMI I TABELAVE TË KRIJUARA NË LIDHJE ME
RREGULLIMIN DHE PARAQITJEN E TË DHËNAVE

Tabela 1.2: Numri i të Dhënave Totale të Futura në Aplikim

Cases

Valid Missing Total

N Percent N Percent N Percent

imkb 40 100.0% 0 0.0% 40 100.0%

Tabela 1.2 tregon se nga të dhënat e IMKB-së 40 të dhëna janë përdorur plotësisht.
Në setin e të dhënave nuk ka aspak të dhëna mangu (missing value).

3
Tabela 1.3: Statistikat Përshkruese

Statistic Std. Error

imkb Mean 9128.4505 746.38833

95% Confidence Interval for Lower Bound 7618.7376
Mean
Upper Bound 10638.1634

5% Trimmed Mean 9020.9639

Median 9114.4050

Variance 22283821.307

Std. Deviation 4720.57426

Minimum 2196.38

Maximum 19206.00

Range 17009.62

Interquartile Range 7909.87

Skewness .204 .374

Kurtosis -.941 .733

Një vrojtim numerik paraqet mesataren aritmetike të grupit pjesëtuar me numrin
total të vrojtimeve në grup. Nëse shuma e devijimeve nga vlera mesatare e çdo vrojtimi
pjestohet me numrin e vrojtimeve dhe duke marrë rrënjën katrore gjendet devijimi
standard. Katrori i devijimit standart jep variancën. Në këtë tabelë shihen statistikat
përshkruese në bazë të ndryshores së varur (IMKB). Sipas tabelës, mesatarja aritmetike e
40 të dhënave (IMKB) është gjetur si 9128,4505 dhe devijimi standart për 4720,57426. Po
ashtu, me 95% besueshmëri, janë dhënë vlerat me limitet më të ulëta dhe më të larta
(intervali i besueshmërisë), 7618,7376 dhe 10638,1634. Llogaritja e hapësirës që mbetet
në mes të madhësisë së vlerësuar quhet “interval besueshmërie”.

Mesatarja (mediana) e këtyre të dhënave është 9020,9639. Mesatarja është vlerë e
cila e ndan serinë e të dhënave në dy pjesë të barabarta. Vlerat minimale dhe maksimale të
serisë së të dhënave janë 2196,38 dhe 19206,00.

Në punimet statistikore shpërndarja më e përdorur është shpërndarja normale. Në
përgjithësi, shumë ndodhi shfaqin shpërndarje normale. Për shembull, gjatësia e një grupi
të studentëve tregon një shpërndarje normale. Shpërndarja normale është një shpërndarje
e vazhdueshme dhe mesatarja e popullsisë µ, devijimi standart σ janë shpërndarje.

4
Shpërndarja normale është simetrike. Forma e saj është lakore. Vlera më e lartë e
shpërndarjes simetrike është e barabartë me medianën dhe mesataren aritmetike të saj.

Në këtë tabelë statistikat përshkruese më të rëndësishme janë matësit e kurtozës
(kurtosis) dhe lakueshmërisë (skewness). Këto vlera tregojnë se a janë shpërndarë të
dhënat në mënyrë normale. Në rastet simetrike (lakore e drejtë), kur mesatarja aritmetike
është e barabartë me modën dhe medianën, koeficienti i lakueshmërisë (skewness) do të
jetë zero. Në qoftë se ky barazim prishet, shpërndarja do të lakohet. Me rritjen e lakimit,
moda dhe mesatarja aritmetike do të largohen nga njëra tjetra. Në qoftë se mesatarja është
më e madhe se mediana, shpërndarja e vlerave për njësi do të lakohet në të djathtë
(pozitiv). Në qoftë se mesatarja është më e vogël se mediana, shpërndarja e të dhënave
lakohet në të majtë (negativ). Koeficienti i lakimit merr vlerat ndërmjet –∞ dhe +∞. Por kur
në raste matësi i devijimit merr vlera prej ±3 (sipas disa gjykimeve ±2) pranohet si
normale.

Vlera në tabelë prej 0,204 është koeficienti i lakimit të Fisherit. Pjesëtimi i këtij
koeficienti me gabimin standart të lakimit, jep vlerën e lakimit. Koeficienti i lakimit
standardizohet duke u pjestuar me gabimin e vet standart. Më vonë këto vlera kritike
standarde krahasohen me vlerat në tabelë. Ky përfundim, mund të komentohet për nga
aspekti i lakimit të shpërndarjes normale. Kjo vlerë e përfituar e lakimit është e
pranueshme në nivelin e rëndësisë (sipas nivelit të rëndësisë 5%) ndërmjet vlerave 1,96
ose nën vlerat -1,96.

Sepse, 95% e vlerave në shpërndarjen normale marrin pjesë në mes të devijimit
standart ndërmjet +1,96 dhe -1,96 nga mesatarja. Në këtë rast, kur koeficienti i lakimit
0,204 me gabim të devijimit standart 0 pjestohet me 374 (0,204/0,374) gjendet vlera prej
0,545. Vlera 0,545 tregon që të dhënat janë të shpërndara afër normales sepse gjendet
ndërmjet -1,96 dhe +1,96. Të qenit pozitiv e kësaj vlere tregon që të dhënat janë të lakuara
në të djathtë, kurse në rastin kur është negativ të dhënat janë të lakuara në të majtë. Për
arsye se kjo vlerë është pozitive mund të thuhet se shpërndarja është e lakuar në të djathtë.
Përveç kësaj, shpërndarja e vëzhgimeve kuptohet se është e lakuar në të djathtë edhe për
shkak që mesatarja artimetike e grupit të të dhënave është më e madhe se mediana.

Kurtoza (kurtosis) tregon sa është e drejtë apo e shtypur kurba e shpërndarjes
normale. Koeficienti i shtypjes për një lakore të plotë është zero. Nëse koeficienti i shtypjes
është pozitiv, lakorja është më e drejtë sipas normales. Kurse kur është negativ, lakorja
është më e shtypur sipas normales. Në tabelën 3, koeficienti i lakimit i Fisherit është -0.941.
Kur kjo vlerë të pjesëtohet me gabimin standart të lakimit 0,733 (-0.941/0,733) gjendet
vlera prej 1,284. Për arsye vlera e lakimit gjendet ndërmjet -1,96 dhe +1,96 mund të themi
se nuk është e drejtë.

5
Grafiqet janë paraqitje e të dhënave statistikore në mënyrë që të shihen me sy. Të
dhënat statistikore nuk shprehen vetëm me tabela apo numra. Për më tepër, grafiqet
sigurojnë një paraqitje më të bukur të të dhënave për shqyrtuesin. Grafiqet më të
përdorura janë histogrami dhe fleta e degës (steam and leaf).

Figura 1.1: Paraqitja e Histogramit Për Të Dhënat e Indeksit Të IMKB 100

Vijat e histogramit tregojnë se sa herë përsëriten të dhënat nominale (klasifikuese)
apo ordinale (rendore). Teksa boshti horizontal zakonisht përcakton klasat në një mënyrë
sistematike, vijat vertikale tregojnë frekuencat për secilën kategori dhe përqindjen që
përfaqësojnë. Në qoftë se shikohet histogrami i të dhënave për IMKB-në, vërehet se lakorja
nuk është plotësisht simetrike dhe është e lakuar në të djathtë. Të qenit plotësisht
simetrike nënkupton që të dhënat janë plotësisht të shpërndara normal.

Gjatë shqyrimit të të dhënave, një grafik tjetër i përdorur është edhe grafiku fleta e
degës (steam and leaf). Grafiku steam and leaf, i klasifikon të dhënat sipas shtypjeve në të
majtë dhe përbrenda një klase çdo vrojtim klasifikohet sipas shtypjeve në të djathtë.
Grafiku steam and leaf i përngjan histogramit dhe histogrami numrin e rasteve për
intervale të caktuara e paraqet përmes vijave në grafik, mirëpo nuk mund të specifikojë
detajet e vlerave në interval.

6
Tabela 1.4: Tabela Steam and Leaf Për Indeksin e Të Dhënave Për IMKB 100

Frequency (Frekuencat) Steam & Leaf
7,00 0,222223
6,00 0,445555
3,00 0,667
8,00 0,88889999
5,00 1,0011
4,00 1,2333
4,00 1,4555
2,00 1,66
1,00 1,9
Steam width: 10000,00
Each leaf: 1 case (s)

Për shembull, në Tabelën 1.4, rreshti i parë tregon që ekzistojnë 7 të dhëna të cilat
fillojnë me 2000 dhe 3000.

Figura 1.2: Grafiku i Shpërndarjes Normale Për Të Dhënat e IMKB-së

Për bërjen e analizës së normalitetit të të dhënave, përdoret grafiku i probabilitetit i
cili paraqet të dhënat e vlerave të vrojtuara me atyre të pritura mbi një grafik. Në qoftë se
mostra me të cilën punohet është marrë nga një grup i cili shfaq një shpërndarje normale,
vlerat duhet të mblidhen mbi vijën e drejtë apo përrreth. Po të shohim normalitetin e të
dhënave për IMKB 100, mund të themi se grupi i të dhënave është afër normales për arsye
se të dhënat janë të shpërndara mbi vijën e drejtë.

7
Një grafik tjetër i normalitetit është grafiku i normalitetit pa prirje. Në Figurën 1.3
shihet grafiku Detrended Normal Plot për indeksin e të dhënave të IMKB 100.

Figura 1.3: Grafiku i Normalitetit pa Prirje Për Indeksin e Të Dhënave Për IMKB 100

Në qoftë se një grup i të dhënave tregon shpërndarje normale dhe devijimet e
vlerave të cilat shfaqen në grafikun e probabilitetit “detrended”, pritet që pikat e pritura
nga boshti vertikal “0” të shpërndahen rastësisht deri përreth vijës horizontale pa formuar
ndonjë formë funksioni. Siç shihet në Figurën 1.3, seti i të dhënave për IMKB-në është
shpërndarë afër normales.

Metodë tjetër për analizimin e normalitetit është edhe grafiku handle box. Në
Figurën 1.4 është paraqitur grafiku handle box për indeksin e të dhënave të IMKB-së.

Figura 1.4: Diagrami Handle Box Për Të Dhënat e IMKB-së

8
Diagrami i kutisë është një prej llojeve të grafiqeve që bazohet në përqindje dhe që
përdor statistikat përshkruese. Gjatësia e formës, paraqet hapësirën ndërmjet çerekëve.
Pra, fillon me përqindjen e 25-të dhe mbaron me përqindjen e 75-të. Këto përqindje quhen
Tugey’s Hings. Kutia jep informata rreth tendencës dhe përhapjes qendrore në 50% të
mesit shpërndarjes. Përmes mesatares është e mundur që të përcaktohet tendenca
qendrore, kurse përmes gjatësisë së kutisë shpërndarja e vrojtimeve. Në qoftë se vija e
mesatares gjendet nën qendër, shpërndarja ka lakim pozitiv, në qoftë se gjendet mbi, lakimi
është negativ. Kurse nëse gjendet në mes tregon se të dhënat janë të shpërndara normal.
Siç shihet në Figurën 1.4, nga grafiku i handle box për të dhënat e indeksit IMKB 100, kutia
gjendet më poshtë dhe kjo tregon që të dhënat janë të lakuara në të djathtë. Po ashtu, për
shkak që nuk gjendet ndonjë e dhënë jashtë kutisë, nuk ka vlera ekstreme (outliers).

Tabela 1.5: Testi i Normalitetit Për Të Dhënat e IMKB-së
Tests of Normality

a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

*
imkb .091 40 .200 .958 40 .141

Grafiqet e normalitetit dhe grafiqet e tjera (histogrami, diagrami i kutisë dhe grafiku
steam and leaf) na ndihmojnë për të i kuptuar disa pika. Por testi i normalitetit për grupin e
të dhënave mund të kuptohet duke përdorur testin Kolmogrov-Smirnov dhe Shapiro Wilk.
Kur numri i vrojtimeve është më i vogël se 29, përdoret testi Shapiro-Wilk, kurse kur numri
i vrojtimeve është më i madh se 29, përdoret testi Kolmogrov-Smirnov (Lilliefors). Për
shkak se numri i të dhënave tona është 40, do të përdoret testi Kolmogrov-Smirnov
(Lilliefors). Hipotezën zero H0 dhe hipotezën alternative HA të këtij testi mund t’i
shkruajmë si më poshtë:

H0: Shpërndarja e të dhënave ndjek shpërndarjen normale.

HA: Shpërndarja e të dhënave nuk ndjek shpërndarjen normale.

Sipas nivelit të rëndësisë 5%, për shkak që vlera e të dy testeve (0,2 dhe 0,141) të
indeksit së të dhënave të IMKB 100, janë më të mëdha se 5%, hipoteza H0 pranohet. Pra,
mund të thuhet se të dhënat janë të shpërndara në mënyrë normale.

9
1.2. ANALIZA E VLERAVE EKSTREME (OUTLIERS)
Gjatë analizës së setit së të dhënave, një fazë tjetër është faza e hulumtimit për
vlerat ekstreme. Ekzistojnë dy arsye të rëndësishme për hulumtimin e vlerave ekstreme në
setin e të dhënave:

1. Duke i zbuluar vlerat ekstreme, mund të bëhet nxjerrja e tyre nga seti i të dhënave
për arsye se do të pengojnë përfitimin e rezultateve normale.
2. Vlerat ekstreme në të njëjtën kohë mund të jenë një burim informacioni. Pasi të
zbulohen vlerat ekstreme, kërkohen arsyet e tyre.

Vlerat ekstreme ndahen në dy lloje; vlera shumë ekstreme (extreme value) dhe
vlera ekstreme (outlier value). Arsyet e vlerave ekstreme mund të jenë këto:

1. Hyrja gabuese e të dhënave apo kodim i gabuar,
2. Vrojtimi i rrallë i një rasti.

Mund të ndërhyhet në dy mënyra me vlerat ekstreme:

 Vlerat ekstreme mund të korrigjohen në fazën e pastrimit të të dhënave,
 Hulumtuesi mund të vendos për nxjerrjen e vlerave esktreme në bazë të
rëndësisë së hulumtimit.

Në qoftë se ka ndonjë vlerë ekstreme e cila është paraqitur për ndonjë arsye të
panjohur, atëherë mund të nxirret nga seti i të dhënave.

1.2.1. SHEMBULL APLIKIMI
Më poshtë janë paraqitur orët shtesë të punës së bërë nga 20 punonjës.

Tabela 1.6: Orët Shtesë të Punës së Punonjësve

Punonjësi Ora Punonjësi Ora
1 2 11 6
2 4 12 1
3 3 13 3
4 6 14 5
5 2 15 15
6 6 16 3
7 3 17 5
8 4 18 6
9 12 19 5
10 3 20 14

Për këto të dhëna mund të shohim se cilat vlera janë vlera ekstreme, pra cilët
punonjës kanë punuar më shumë orë për nga punonjësit e tjerë. Për ta bërë këtë, siç u

10
tregua në shembullin e mëparshëm, zgjedhet Analyze  Descriptive Statistics 
Explore. Këtu, në pjesën Dependent bartet “ora”, kurse në pjesën Label Cases by
“punonjësi”. Pastaj nga pjesa Statistics përzgjedhet Outliers. Në figurën e mëposhtme, në
grafikun e kutisë mund të shihen vlerat shumë extreme (extreme values) dhe vlerat e
veçanta (outlier values). Në këtë rast, mund të shihet se 15 punonjës kanë vlera shumë të
larta ekstreme, pra punojnë më shumë orë për nga të tjerët. Mund të shihet se punonjësi i
njëzet dhe nëntë kanë vlera ekstreme. Në të njëjtën kohë, mund të shihet se shpërndarja në
kutinë e mëposhtme ka prirje në të djathtë.

Figura 1.5: Diagrami i Kutisë për Orët Shtesë

Tani të shohim histogramin dhe grafikun e normalitetit të këtyre vlerave.

Figura 1.6: Histogrami i Orëve Shtesë së Punës

11
Në grafikun e histogramit, sikur të dhënat të shpërndaheshin në mënyrë normale, do të
duhej që lakorja të ishte simetrike, por nga grafiku shihet se është e lakuar pak në të
djathtë.

Figura 1.7: Grafiku i Normalitetit Për Orët Shtesë të Punës

Në figurën 1.7, mund të shihet se devijimet nga vija e regresionit janë të shumta. Pra,
shpërndarja nuk është plotësisht normale.

Tabela 1.7: Testi i Normalitetit Për Orët Shtesë të Punës

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

ora .289 20 .000 .793 20 .001

a. Lilliefors Significance Correction

Në analizën e normalitetit të të dhënave, H0 refuzohet ngaqë të dy testet janë më të
vegjël se 5%. Pra, të dhënat nuk janë të shpërndara në mënyrë normale.

Tani, të e kryejmë analizën përsëri duke i nxjerrur vlerat shumë ekstreme dhe vlerat
e veçanta si dhe duke i ndryshuar disa vlera të tjera.

12
Tabela 1.8: Orët Shtesë të Punës të Punonjësve Pas Nxjerrjes së Vlerave Ekstreme

Punonjësi Ora Punonjësi Ora
1 1 11 5
2 3 12 3
3 4 13 4
4 2 14 3
5 5 15 1
6 3 16 1
7 4 17 4
8 2 18 3
10 1 19

Figura 1.8: Histogrami për Orët e Punës Shtesë Pas Nxjerrjes së Vlerave Ekstreme
dhe Shumë Ekstreme

Histogrami është plotësisht simetrik. Pra, të dhënat tani kanë formën plotësisht
normale. Paraqitja e kutisë grafike plotësisht në mes, tregon që të dhënat ndjekin
shpërndarjen normale.

13
Figura 1.9: Diagrami i Kutisë Për Orët Shtesë të Punës Pas Nxjerrjes së Vlerave
Ekstreme dhe Shumë Ekstreme

Përveç diagramit të kutisë (Figura 1.9), kur shikojmë grafikun e normalitetit (Figura
10), mund të vërejmë se devijimet janë më të vogla nga vija e regresionit dhe se janë shumë
afër shpërndarjes normale.

Figura 1.10: Grafiku i Normalitetit Për Orët Shtesë të Punës Pas Nxjerrjes së Vlerave
Ekstreme dhe Shumë Ekstreme

14
Tabela 1.9: Testi i Normalitetit Për Orët Shtesë të Punës Pas Nxjerrjes së Vlerave
Ekstreme dhe Shumë Ekstreme

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

ora .181 17 .140 .902 17 .073

a. Lilliefors Significance Correction

Kur shikojmë testet e normalitetit, të qenit e të dy testeve më të mëdha se 5%,
nënkupton që hipoteza H0 pranohet. Pra, shpërndarja e të dhënave është normale.

1.3. SHQYRTIMI I TË DHËNAVE QË MUNGOJNË
Mungesa e të dhënave (missing values), me të vërtet është një situatë e mundshme
me të cilën mund të përballemi gjatë bërjes së çfarëdo analize. Për shembull, gjatë bërjes së
një ankete, përgjegjësi mund të lë të zbrazët pyetjen në lidhje me të ardhurat. Përsëri,
mund të që të mos i siguroni disa vlera të vrojtimeve në lidhje me disa ndryshore. Çfarë
duhet bërë në të këtilla raste?

Procesi i cili buron nga përgjegjësi apo jashtë tij dhe që i hap rrugën humbjes së të
dhënave, quhet proces i mungesës së të dhënave. Parashikimi i procesit të mungesës së të
dhënave që burojnë nga përgjegjësi është i pamundur. Në këtë situatë, hulumtuesi duhet të
kërkojë se a ekziston ndonjë strukturë e cila e zbulon procesin e mungesës së të dhënave.
Gjatë shqyrtimit të kësaj, hulumtuesi duhet të marrë në konsideratë dy pika të
rëndësishme:

 Të dhënat mangu a janë shpërndarë në mënyrë të rastësishme nëpër vrojtime apo
është krijuar ndonjë strukturë e veçantë?
 Duhet të hulumtohet se sa shpesh ndeshemi me të dhëna mangu.

Disa hulumtues i largojnë nga grupi i të dhënave vrojtimet të cilat i hapin rrugë
mungesës së të dhënave. Në këtë rast, ndonjëherë përveç që zvogëlohet në mënyrë të
konsiderueshme numri i vrojtimeve, mund të ndikojë në mënyrë negative në madhësinë e
mjaftueshme të mostrës. Po ashtu, kjo do të ndikojë në mënyrë te konsiderueshme edhe në
besueshmërinë dhe rezultatet e hulumtimit. Prandaj, kur të përballemi me mungesë së të
dhënave, mund të bëhen këto gjëra:

 Mund të shtohen vlera të reja të vrojtimeve.
 Përmes çasjeve të ndryshme statistikore provohet të gjendet zgjidhje për vlerat që
mungojnë.
15
Qëllimi i shqyrtimit të mungesës së të dhënave është që kuptohet se në cilën
ndryshore dhe në çfarë mase ekziston mungesë e të dhënave, të dhënat a mungojnë vetëm
për një ndryshore apo edhe për tjetrën, në çfarë niveli do të ulet numri i vrojtimeve në
qoftë se fshihet ndryshorja me mungesë të të dhënave.

1.3.1. SHEMBULL APLIKIMI
Në tabelën e mëposhtë janë dhënë vlerat mujore të indeksit të IMKB-100 si
ndryshore e varur dhe vlerat mujore të çmimit të arit të shtetit, indeksit të industrisë së
prodhimit, normave të interesit të depozitave dhe të indeksit të çmimit të konsumatorëve
si ndryshore të pavarura. Nga vlerat e 60 vrojtimeve, ekziston mungesë e disa vlerave.

Tabela 1.10: Të Dhënat Përkatëse Të Mostrës

IMKB-100 ARI SHTET. NOR. INDUS. IÇK
DEPOZ. PRODH.
36,41 208333 37,26 68,5 3,8
, 212833 , 70 4,4
32,94 211503 35,96 79,6 5,2
33,08 208666 35,99 65 ,
, 206500 36,02 71,7 3,1
41,33 203500 36,21 71,5 1,4
53,84 , 36,24 62,5 -0,9
49,39 228250 36,27 67,9 2,5
50,85 , 36,37 79,5 8,7
45,7 232000 36,93 84,3 6,8
, 230000 37,77 , 5
32,56 236500 38,69 72,6 1,7
42,13 254750 40,01 63,6 ,
51,03 272000 42,06 72,5 5,4
, 281000 45,97 81,9 4,4
35,54 , 48,35 66,5 6,6
36,26 311500 51,96 81,3 3,3
35,87 309750 52,13 , 3
30,41 355333 52,75 74,4 ,
33,01 353333 53,82 72,8 4
, 356000 , 80,9 6,1
27,47 378000 57,9 85,1 6,6
40,58 390250 58,14 82,8 5,2
43,69 , , , 4,4
49,26 412200 57,38 76,8 9,4
36,64 440000 56,87 76,8 5
40,77 463750 , 82,1 4,9
36,86 476000 58,01 71,7 3,8
32,97 495600 58,43 80,6 0,9

16
IMKB-100 ARI SHTET. NOR. INDUS. IÇK
DEPOZ. PRODH.
44,07 , 58,42 72,3 0,5
42,64 531100 57,94 78,9 1,3
41,58 531666 57,06 74,8 ,
39,76 , 57,12 85,4 7,4
36,43 566500 57,07 86,8 7,6
37,86 594000 57,54 83 4,9
40,04 614600 57,6 80,9 2,7
43,83 635250 57,66 79,4 5,3
59,24 659000 54,95 80,1 4
58,64 683000 52,74 79,5 4,8
, 718000 52,81 , 4,4
83,76 821250 52,83 83,2 4,7
107,79 876666 52,82 78,1 1,8
100,78 996666 52,82 85,8 4,9
123,57 1003750 52,83 77 2,7
150,8 964500 52,86 90,4 5,6
145,01 1022000 , 90,3 ,
189,77 1126670 52,9 87,1 6,4
206,83 1197500 52,88 92,5 3,6
, 1366250 56,35 86,2 4,4
150,04 1543750 68,67 77,2 6
140,87 1930000 71,42 81 5,2
150,97 2476000 , 73,8 24,7
147,49 , 118,71 69,6 10
197,66 2555000 114,53 71,5 0,9
217,52 2551000 64,46 , 1,7
252,82 2610000 54,46 76,7 2
, 2870000 54,37 83,9 7,2
248,9 2982500 49,74 84,6 9,5
281,81 3030000 59,79 84,7 ,
272,57 3064000 61,79 81,9 6,3

Duke shkuar tek Analyze, Missing Value Analyze në SPSS, mund të bëhet shqyrtimi i
të dhënave që mungojnë.

17
Hapi 1: Menyja e Missing Value Analyze

Në pjesën Estimation, siç shihet më poshtë do të ndeshemi me 4 metoda. Më poshtë
janë dhënë informata të përgjithshme rreth këtyre metodave.

18
Hapi 2: Dritarja e Missing Value Analysis

1. Metoda Listwise (Metoda e Përdorjes së Vrojtimeve të Plota): Në këtë metodë,
merren në konsideratë vetëm vrojtimet e plota. Vrojtimet mangu nuk merren në
konsideratë. Kjo metodë për arsye se merr në konsideratë vrojtimet e plota
sugjerohet të përdoret në rastet kur numri i të dhënave mangu është i vogël. Është
një metodë e cila përdoret shumë. Përveç kësaj, struktura e të dhënave mangu duhet
të jetë plotësisht e rastësishme.
2. Metoda Pairwise: Kjo analizë përfshin ndryshoret të dhënat e të cilave janë të
plota.
3. Metoda e Regresionit: Qëllimi i metodës së regresionit është që me ndihmën e një
apo më shume ndryshoreve të pavarura të testohen vlerat e ndryshores së varur. Në
metodën e regresionit, ndryshorja e varur është ndryshorja mangu e vëzhguar,
kurse ndryshoret tjera janë të pavarura. Kjo metodë sugjerohet të përdoret
veçanërisht në rastet kur numri i të dhënave mangu nuk është i madh. Për ta
përdorur këtë metodë, lidhja ndërmjet ndryshores së varur dhe ndryshores së
pavarur duhet të jetë shumë e fuqishme.
4. Metoda EM (Expectation-Maximization): Metoda EM, është një metodë dy fazash
dhe e cila përsëritet. Faza E jep vlerësimet më të mira të mundshme për të dhënat që

19
mungojnë, kurse faza M jep vlerësime në lidhje me mesataren, devijimin standart
apo korrelacionin për të dhënat që mungojnë. Ky proces vazhdon deri në shkallën e
zvogëlimt të papërfillshëm të ndryshimit në vlerat e parashikuara.

Hapi 3: Dritarja e Missing Value Analysis

Të gjitha ndryshoret barten në pjesën Quantitative Variables. Nga pjesa
Estimation zgjedhet metoda Listwise sepse numri i plotë i vrojtimeve është më i madh se
numri mangu i vrojtimeve. Pas kësaj, shkohet te përzgjedhjet Patterns dhe Descriptives.

Pasi të jetë hyrë në përzgjedhjen Patterns, etiketohen të gjitha zgjedhjet në pjesën
Display. Në të njëjtën kohë, në pjesën Variables, të gjitha ndryshoret transferohen në
pjesën Additional Information For. Pastaj klikohet në butonin Continue.

20
Hapi 4: Dritarja Patterns

Pas kësaj, shkojmë te përzgjedhja Descriptives. Edhe këtu etiketohen të gjitha
alternativat dhe klikohet në butonin Continue.

Hapi 5: Dritarja Descriptives

21
Më poshtë do të shqyrtohen me radhë të gjitha të dalurat, mirëpo në fillim duhet të
bëhet testi i rastësisë për mungesën e të dhënave. Në të dalurat statistikore, aq sa është e
rëndësishme tërheqja e një mostreje nga popullimi, po aq është e rëndësishme rastësia e të
dhënave mangu në një mostër.

Për të dhënë një numër konkluzionesh rreth popullimit, duhet që mostra të mirret
në një madhësi të caktuar nga popullimi. Mundësia e zgjedhjes së njësive nga popullimi që
do të përdoren në mostër duhet të jetë e njëjtë dhe zgjedhja e një njësie nuk duhet të
ndikojë zgjedhjen e një njësie tjetër. Pra, secila njësi duhet të ketë probabilitet të barabartë
për t’u zgjedhur nga popullimi. Kjo situatë quhet rastësi. Në strukturën e të dhënave,
vrojtimet e një ndryshoreje mund të i ndajmë në dy grupe: në vrojtime të cilat kanë
mungesë të të dhënave dhe të atyreve që nuk kanë mungesë. Për të hulumtuar se a ekziston
një dallim i rëndësishëm për nga aspekti i vlerave të ndryshoreve tjera (të dy grupeve)
bëhet testi t, ose ndryshoret reduktohen në dy forma; në ato që kanë mungesë të të
dhënave dhe ato që nuk kanë mungesë të të dhënave. Për shembull, të supozojmë se jemi
duke punuar në një mostër e cila ka dy ndryshore. Njëra ndryshore le të jetë shuma e
qerasë (ndryshorja e varur) dhe ndryshorja tjetër le të jenë të ardhurat (ndryshorja e
pavarur). Në ndryshoren e të ardhurave le të gjendet mungesë e vrojtimeve. Le të e ndajmë
ndryshoren e të ardhurave në dy grupe; në vrojtime mangu dhe në vrojtime të plota dhe në
secilin grup të hulumtojmë se a ka dallim ndërmjet mesatareve të qerasë. Në qoftë se në
këto dy grupe ekziston një dallim jo i rëndësishëm në mesataret e qerasë, atëherë mund të
thuhet se mungesa e të dhënave është e rastësishme. Në këtë situatë, shikohet koeficienti i
korrelacionit të Pearsonit ndërmjet ndryshoreve. Në qoftë se korrelacioni është i ulët,
mund të thuhet se ekziston rastësia në mungesën e të dhënave. Për këtë arsye, në fillim do
të shqyrtohen testet t dhe matrica e korrelacionit.

Hipotezat e rastësisë:

H0: Ekziston rastësi në mungesën e të dhënave.

HA: Nuk ekziston rastësi në mungesën e të dhënave.

Në qoftë se pranohet hipoteza H0, mund të thuhet se ekziston rastësi në strukturën e
të dhënave. Për ta pranuar hipotezën H0, vlera e P-së (Sig.) duhet të jetë më e madhe se 5%.
Sipas kësaj, për arsye se vlerat e ndryshoreve të IÇK-së, indeksit të industrisë së prodhimit,
çmimit të arit shtetëror, normave të interesit të depozitave dhe ndryshores së varur IMKB
janë më të mëdha (vlerat e treguara me ngjyrë të zezë në tabelën e testit T të situatës së
rastësisë) se vlera e P-së (sipas nivelit të rëndësisë 5%), hipoteza H0 refuzohet. Pra, mund
të themi se ekziston rastësi në mungesën e të dhënave.

22
Tabela 1.11: Tabela e Testit T të Situatës së Rastësisë
a
Separate Variance t Tests

normat_de

industria_
prodhimit
shtetëror

pozitore
IMKB

ari_

IÇK
100
IMKB100 t . .4 1.7 -.4 .1
df . 9.3 9.8 6.5 34.9
P(2-tail) . .675 .114 .731 .954
# Present 52 45 48 49 46
# Missing 0 8 6 6 8
Mean(Present) 87.7238 933501.9111 54.5696 78.0592 4.9174
Mean(Missing) . 780072.8750 47.2150 79.1000 4.8750
ari_ t 1.7 . -.5 1.7 -.2
shtetëror df 14.6 . 5.2 5.8 7.4
P(2-tail) .102 . .648 .136 .823
# Present 45 53 48 49 47
# Missing 7 0 6 6 7
Mean(Present) 92.1422 910342.8113 53.0712 78.8510 4.8617
Mean(Missing) 59.3200 . 59.2017 72.6333 5.2429
normat_ t -.2 .0 . -.4 -1.1
depozitore df 3.8 4.8 . 4.7 4.1
P(2-tail) .818 .992 . .724 .330
# Present 48 48 54 50 49
# Missing 4 5 0 5 5
Mean(Present) 87.1083 910783.0417 53.7524 78.0480 4.5041
Mean(Missing) 95.1100 906116.6000 . 79.4200 8.9000
industria_ t -.2 -.1 .4 . 1.7
prodhimit df 2.1 3.3 4.1 . 12.3
P(2-tail) .860 .940 .738 . .122
# Present 49 49 50 55 49
# Missing 3 4 4 0 5
Mean(Present) 87.0318 906926.9184 53.9092 78.1727 5.0347
Mean(Missing) 99.0267 952187.5000 51.7925 . 3.7000
IÇK t -.2 .0 1.0 .7 .
df 5.7 5.8 6.0 5.5 .
P(2-tail) .840 .981 .367 .519 .
# Present 46 47 49 49 54
# Missing 6 6 5 6 0
Mean(Present) 86.6874 911611.7872 54.2251 78.5041 4.9111
Mean(Missing) 95.6700 900402.5000 49.1200 75.4667 .
For each quantitative variable, pairs of groups are formed by indicator variables (present, missing).
a. Indicator variables with less than 5% missing are not displayed.

Ekzistencën e rastësisë mund ta shikojmë edhe përmes matricës së korrelacionit
ndërmjet ndryshoreve.

23
Tabela 1.12: Tabela e Matricës së Korrelacionit të Pearsonit Për Situatën e Rastësisë

Listwise Correlations
ari_shtetër normat_de industria_p
IMKB100 or pozitore rodhimit IÇK
IMKB100 1
ari_shtetëror .924 1
normat_depozitore .361 .531 1
industria_prodhimit .295 .188 .046 1
IÇK .130 .136 -.098 .440 1

Në këtë tabelë mund të shohim koeficientët e korrelacionit të Pearsonit.
Korrelacionet e ulëta tregojnë rastësinë në strukturën e të dhënave mangu për secilën
ndryshore. Në këtë tabelë, jashtë korrelacionit të krijuar ndërmjet ndryshores së varur
IMKB dhe ndryshores së pavarur arit shtetëror (0,924), nuk mund të shihet ndonjë
korrelacion i lartë. Kjo vlerë e lartë është normale sepse IMKB-100 është ndryshore e
varur, kurse çmimi i arit shtetëror është ndryshore e pavarur. Për të ekzistuar rastësia, nuk
duhet të ketë korrelacion të lartë ndërmjet dy ndryshoreve. Në këtë rast, mund të thuhet se
procesi i të dhënave është i rastësishëm në shembullin tonë.
Në tabelën 1.13, në pjesën Listwise janë llogaritur mesataret aritmetike duke i
marrë në konsideratë vetëm vrojtimet e plota për të gjitha ndryshoret, kurse në pjesën All
Values, janë llogaritur mesataret aritmetike duke i marrë në konsideratë të gjitha vlerat. Në
qoftë se shikohen me kujdes mesataret, mund të vërejmë se nuk ekziston ndonjë dallim i
rëndësishëm ndërmjet dy grupeve. Ndryshimet janë shumë të vogla. Edhe nga këtu mund
të themi se struktura e mungesës së të dhënave është e rastësishme. Zaten, kjo qe
përcaktuar nga testi t dhe matrica e korrelacionit, se struktura e të dhënave mangu është e
rastësishme në procesin e rastësisë.
Tabela 1.13: Mesataret e Parashikuara

Summary of Estimated Means
normat_de industria_
IMKB100 ari_shtetëror pozitore prodhimit IÇK
Listwise 89.3500 880133.4571 54.3411 79.4400 4.4343
All Values 87.7238 910342.8113 53.7524 78.1727 4.9111

Në tabelën e mëposhtme e cila përfshin numrin e plotë dhe mangu të vrojtimeve,
janë dhënë numrat e të dhënave mangu dhe përqindjet për secilin vrojtim (në total 60
vrojtime). Teksa për vrojtimet e plota tregohen me hapësirë (bosh), mungesa e të dhënave
është shfaqur me “S”. Vendet e shfaqura me “+”, tregojnë vlerat e mëdha ekstreme. Për

24
shembull, në vrojtimin e parë nuk gjendet asnjë vlerë mangu, kurse në vrojtimin e dytë
gjenden mangu 2 vrojtime dhe përqindja e tyre është 40.

Tabela 1.14: Numrat e Vrojtimeve të Plota dhe Mangu

Missing and Extreme Missing and Extreme
Value Patterns Value Patterns
% Missing

% Missing
# Missing

# Missing
_SHTETËROR

_SHTETËROR
DEPOZITORE

DEPOZITORE
INDUSTRIA E

INDUSTRIA E
PRODHIMIT

PRODHIMIT
IMKB 100

IMKB 100
NORMAT

NORMAT
ARI

ARI
IÇK

IÇK
Case Case
1 0 .0 31 0 .0
2 2 40.0 S S 32 1 20.0 S
3 0 .0 33 1 20.0 S
4 1 20.0 S 34 0 .0
5 1 20.0 S 35 0 .0
6 0 .0 36 0 .0
7 1 20.0 S 37 0 .0
8 0 .0 38 0 .0
9 1 20.0 S 39 0 .0
10 0 .0 40 2 40.0 S S
11 2 40.0 S S 41 0 .0
12 0 .0 42 0 .0
13 1 20.0 S 43 0 .0
14 0 .0 44 0 .0
15 1 20.0 S 45 0 .0
16 1 20.0 S 46 2 40.0 S S
17 0 .0 47 0 .0
18 1 20.0 S 48 0 .0
19 1 20.0 S 49 1 20.0 S
20 0 .0 50 0 .0
21 2 40.0 S S 51 0 .0
22 0 .0 52 1 20.0 + S +
23 0 .0 53 1 20.0 S +
24 3 60.0 S S S 54 0 .0 + +
25 0 .0 55 1 20.0 + S
26 0 .0 56 0 .0 +
27 1 20.0 S 57 1 20.0 S +
28 0 .0 58 0 .0 +
29 0 .0 59 1 20.0 + S
30 1 20.0 S 60 0 .0 +

25
Tabela 1.15: Struktura e Mungesës së të Dhënave
Missing Patterns (cases with missing values)
a
Missing and Extreme Value Patterns

% Missing

ari_shtetëror
# Missing

normat_dep
industria_pr

IMKB100
odhimit

ozitore

IÇK
Case
4 1 20.0 S
13 1 20.0 S
19 1 20.0 S
32 1 20.0 S
59 1 20.0 S +
46 2 40.0 S S
27 1 20.0 S
52 1 20.0 S + +
21 2 40.0 S S
2 2 40.0 S S
5 1 20.0 S
49 1 20.0 S
15 1 20.0 S
57 1 20.0 + S
40 2 40.0 S S
11 2 40.0 S S
55 1 20.0 S +
18 1 20.0 S
7 1 20.0 S
16 1 20.0 S
53 1 20.0 + S
33 1 20.0 S
30 1 20.0 S
9 1 20.0 S
24 3 60.0 S S S

Në tabelën e më sipërme, në rreshtin dhe në kolonën e fundit janë paraqitur
vrojtimet dhe ndryshoret të cilat kanë më shumë mungesë të të dhënave. Vrojtimet e plota
nuk janë paraqitur për të gjitha ndryshoret. Për shembull, në vrojtimin e pesëdhjetë e nëntë
ka një mungesë të dhënash (IÇK), ka tri vrojtime të plota (indeksi i industrisë së prodhimit,
normat e interesit të depozitave, ari shtetëror dhe IMKB100) dhe një nga këto vlera është
ekstreme (ari shtetëror). Kurse në vrojtimin e njëzet e katër, ekzistojnë 3 të dhëna mangu
(indeksi i industrisë së prodhimit, normat e interesit të depozitave dhe ari shtetëror) dhe
ky vrojtim ka më së shumti mungesë të të dhënave. Vrojtimet mangu janë çmimi i arit
shtetëror, normat e interesit të depozitave dhe indeksi i industrisë së prodhimit.

26
Tabela 1.16: Struktura Tabelore e Mungesës së të Dhënave

Tabulated Patterns

c

industria_prodhimit
a

normat_depozitore
Missing Patterns

b

c
Complete if ...

ari_shtetëror
normat_depozi
industria_prod

c
ari_shtetëror

IMKB100
IMKB100

c
IÇK
c
himit

tore

IÇK
Number
of Cases
35 35 89.3500 880133.4571 54.3411 79.4400 4.4343
5 X 40 85.8020 876083.0000 49.1200 72.5000 .
1 X X 43 145.0100 1022000.0000 . 90.3000 .
2 X 37 95.8700 1469875.0000 . 77.9500 14.8000
2 X X 43 . 284416.5000 . 75.4500 5.2500
4 X 39 . 1180937.5000 48.1775 80.9250 4.7750
2 X X 43 . 474000.0000 45.2900 . 4.7000
2 X 37 126.6950 1430375.0000 58.2950 . 2.3500
6 X 41 61.9250 . 59.2017 72.6333 5.3833
1 X X X 46 43.6900 . . . 4.4000
a. Variables are sorted on missing patterns.
b. Number of complete cases if variables missing in that pattern (marked with X) are not used.
c. Means at each unique pattern

Në tabelën më lartë shihet struktura e mungesës së të dhënave. Për shembull, nga
tabela shihet se ekzistojnë 35 vrojtime të plota. Përderisa vrojtimet e tjera janë të plota,
vrojtimet mangu të IÇK-së janë 5. Kur të largohet ndryshorja e IÇK-së nga të dhënat, numri
i vrojtimeve mbetet 40. Në të njëjtën mënyrë, ekziston mungesë e 1 vrojtimi për normat e
interesit të depozitave dhe për IÇK-në. Në qoftë se ky vrojtim largohet nga këto dy
ndryshore, atëherë numri i vrojtimeve të plota do të jetë 43.

Më poshtë është dhënë tabela e fundit. Në këtë tabelë janë paraqitur përqindjet e
mospajtimeve.

27
Tabela 1.17: Përqindjet e Mospajtimeve

a,b
Percent Mismatch of Indicator Variables.
industria_prodhimit normat_depozitore IÇK ari_shtetëror IMKB100
industria_prodhimit 8.33
normat_depozitore 15.00 10.00
IÇK 18.33 16.67 10.00
ari_shtetëror 16.67 18.33 21.67 11.67
IMKB100 15.00 16.67 23.33 25.00 13.33
The diagonal elements are the percentages missing, and the off-diagonal elements are the mismatch percentages
of indicator variables.
a. Variables are sorted on missing patterns.
b. Indicator variables with less than 5% missing values are not displayed.

Tabela e përqindjeve të mospajtimeve paraqet përqindjet e numrit të përgjithshëm
të vrojtimeve për secilën ndryshore çift ku njëra nga ndryshoret ka vlera mangu, kurse
tjetra jo. Për shembull, numri i vrojtimeve mangu për ndonjërin nga IÇK-ja apo industria e
prodhimit është 11. Numri total i vrojtimeve është 60. Përqindja e mospajtimit të këtyre
ndryshoreve është 18,33 (11/60). IMKB dhe ari shtetëror kanë përqindjen më të lartë të
mospajtimit prej 25%.

Veçanërisht në hulumtimet me shumë ndryshore mund të jetë e pamundur
ndonjëherë që të sigurohen të dhëna të plota. Gjatë kryerjes së këtyre hulumtimeve, është
shumë e rëndësishme që paraprakisht të përcaktohet shkalla e mungesës së të dhënave.
Ndonjëherë mund të jetë e nevojshme që të nxirret nga analiza ndryshorja e cila ka
mungesë të të dhënave. Mirëpo, kjo mund të ketë edhe një sërë rreziqesh. Numri i
ndryshoreve do të ulet. Përpos kësaj, në qoftë se është një ndryshore me rëndësi dhe
patjetër duhet të mbahet në hulumtim, atëherë rezultatet e aplikimit mund të jenë shumë
të ndryshme. Në fillim, duhet të shqyrtohet rastësia e procesit të mungesës së të dhënave.
Ky proces bëhet për të gjetur një çasje të problemit me mungesën e të dhënave.

1.4. PLOTËSIMI I MUNGESËS SË TË DHËNAVE
Këtu do të bëjmë fjalë se si të i përfshijmë të dhënat mangu në analizë pa i larguar
nga grupi i të dhënave në rastin kur të ndeshemi me këto të dhëna. Për ta bërë këtë, në
SPSS shkojmë te menyja Transform, Replace Missing Values. Më pas, do të hapet dritarja
e më poshtme.

28
Hapi 1: Menyja e Plotësimit të Mungesës së të Dhënave

Pas kësaj do të hapet dritarja e mëposhtme.

Hapi 2: Dritarja e Plotësimit për të Dhënat Mangu

29
Në pjesën e metodave përzgjidhet sipas dëshirës.

Series mean: Duke marrë mesataren e serive, zëvendësohen vendet e të dhënave
mangu.

Mean of nearby points: Në vendin e vrojtimit mangu vendoset vlera e mesatares
aritmetike e marrë nga vlerat para dhe pas vrojtimit mungesë.

Median of nearby points: Në vendin e vrojtimit mangu vendoset vlera e medianës
e llogaritur nga vlerat nën dhe mbi vrojtimin mangu.

Linear interpolation: Vlera e vrojtimit të plotë të fundit përpara vlerës mangu dhe
vlera e vrojtimit të plotë të parë pas vlerës mangu vendosen në vendet ku ka mungesë. Në
qoftë se vlerat e vrojtimit të parë dhe të fundit të serisë janë mangu, vlerat e humbura nuk
mund të vendosen.

Linear trend at point: Mungesa e të dhënave zëvendësohet nga vlera të
parashikuara nga seria aktuale prej 1 deri në N.

Për shembull, duke marrë në konsideratë mesataren e serive, në qoftë se u jepen
vlera të reja të dhënave mangu, bëhen përzgjedhjet e mëposhtme.

Hapi 3: Dritarja e Plotësimit të të Dhënave Mangu

30
Nga pjesa Method zgjedhet Series Mean dhe barten të gjitha ndryshoret në pjesën
New Variable(s). Klikohet në butonin OK. Vendet e zbrazëta tashmë do të plotësohen dhe
është e mundur që të bëhen analizat e dëshiruara më të dhënat.

1.5. PURIFIKIMI SEZONAL
Metodat e përdorura për parashikimin e vlerave të vëzhgimeve të cilat do të marrin
në të ardhmen duke përdorur vlerat e vëzhgimeve nga e kaluara të cilat ndryshojnë me
kohë quhen analiza e serisë së kohës. Me ndihmën e analizës së serisë së kohës
parashikohet vlera që do të merr një ndryshore në periudhat e ardhshme duke i larguar
ndikimet në serinë e kohës me metoda të përshtatshme të rregullimit (mesatarja e
lëvizshme, rregullimi eksponencial) duke i shqyrtuar trendet, sezonet dhe periudhat e
kaluara të kësaj ndryshoreje, si dhe duke llogaritur pjesën e gabimit të këtij parashikimi.

Ekzistojnë dy qëllime themelore të analizave të serisë së kohës. Qëllimi i parë është
parashikimi i vlerës që do të marrë ndryshorja në të ardhmen, kurse qëllimi i dytë është
zbulimi i strukturës që varet nga koha. Për arsye se ekziston interes më i madh për arsyen e
parë dhe për arsye se ky qëllim përdoret më shumë, këto nuk mund të mbahen ndaras nga
njëra-tjetra. Qëllimi i dytë ka të bëj me disa karakteristika të rëndësishme si, trendet e
serive të kohës, sezonale, thyerjet strukturore etj.

Faza e parë përpara fillimit të analizë së serisë së kohës është shqyrtimi i të dhënave
edhe numerike edhe vizuale. Shqyrtimi numerik dhe vizuel fillon me shqyrtimin e
vëzhgimeve mbi një grafik. Përcaktohen se cilët faktorë sezonal përfshijnë shpërndarjet, në
cilat periudha dhe në çfarë frekuenca shfaqin ndryshime sezonale të dhënat. Në qoftë se
ekziston ndonjë problem me të dhënat mangu dhe vlera ekstreme, këto rregullohen dhe në
këtë mënyrë të dhënat sillen në një formë që mund të përdoren. Faza e dytë e serisë së
kohës është dekompozimi sezonal i faktorëve (seasonal decomposition).

Për të rregulluar lëvizjet e larta dhe të poshtme të metodave të purifikimit, ndarjes
dhe zbutjes së ndikimeve të të gjitha serive të kohës përdoret një formë e krijuar nga
mesatarja e ponderuar e vrojtimeve të kaluara. Këto janë disa metoda statistikore që
parandalojnë luhatjet në periudhë afatshkurtër. Në themel të këtyre metodave është kjo:
Luhatjet e përjetuara në periudhat e kaluara që i përkasin serisë së kohës e cila tregon
ndarjet e rastësishme nga disa kurba të drejta përdoren për të prodhuar një parashikim
apo një seri parashikimesh për të ardhmen.

1.5.1. METODAT E PËRDORURA NË RREGULLIM
Në këtë kontekst, ekzistojnë pesë metoda themelore për rregullimin e luhatjeve të
cilat gjenden në një seri. Karakteristika e përbashkët e të gjitha këtyreve është supozimi se
për të dhënë një parashikim kanë nevojë për seritë e kohës së kaluar dhe për disa mostra
që fromojnë bazë për të dhënat. Ky parashikim supozon se të dhënat e të gjitha serive të

31
kohës kanë disa luhatje dhe rrotullime që përsëriten. Pesë metodat themelore të
rregullimit janë:

1. Metoda e Mesatareve Lëvizëse (Moving Averages)
2. Zbutja e Thjeshtë Eksponenciale (Simple Exponential Smoothing)
3. Zbutja Eksponenciale e Holt’sit (Holt’s Exponential Smoothing)
4. Zbutja Eksponenciale e Wintersit (Winters Exponential Smoothing)
5. Zbutja e Thjeshtë Eksponenciale e Normës Adoptuese-Përgjegëse (Adaptive-
Response-Rate Single Exponentail Smoothing)

Në zgjedhjen e modelit serisë së kohës i bëhet një shqyrtim paraprak. Në fund të
këtij shqyrtimi paraprak mund të shihet se seritë e kohës kanë së paku një nga
komponentët; Trendin, Luhatjet Sezonale, Luhatjet Periodike, Ndërrimin Rassal etj.

Ndikimi i trendit dhe sezonës: Ndikimi sezonal dhe prania e trendit në një seri të
kohës përcaktohet me anë të diagramit të shpërndarjes origjinale. Mirëpo, në këtë diagram
mund që të mos vërehet menjëherë ndikimi sezonal dhe prania e trendit. Në raste të këtilla,
serisë së kohës i bëhet një nga llojet e zbutjes.

Lëvizjet e rastësishme: Ndërrim quhet ndërrimi i cili nuk mund të shpjegohet nga
tri elementet e para të ndërrimit. Mesatarja e ndërrimit të rastësishëm kërkohet që të jetë
zero, kurse varianca e vogël.

Seritë e kohës të cilat nuk kanë trend quhen seri të qëndrueshme të kohës. Për të
zbutur seritë e këtilla të kohës përdoret një nga modelet e metodave të zbutjes, Mesataret
Lëvizëse apo Zbutja e Thjeshtë Eksponenciale.

Përpara se të kalojmë në aplikim e këtyre modeleve, është e rëndësishme dhe e
nevojshme trajtimi i shpjegimeve teorike dhe rezultateve të metodës së mesatareve
lëvizëse dhe metodës së zbutjes eksponenciale të cilat formojnë bazën e funksioneve të
purifikimit sezonal, në mënyrë për interpretimin e aplikimeve.

1.5.1.1. MESATARET LËVIZËSE
Tabela 1.18: Metoda Parashikuese e Metodës së Mesatareve Lëvizëse

Yk – Seria e Kohës Fk (2) – Mesataret Fk (3) – Mesataret
Lëvizëse Dy Periudhshe Lëvizëse Tri Periudhshe
3 - -
6 - -
8 (3+6) / 2 = 4,5 -
4 (6+8) / 2 = 7 (3+6+8) / 3 = 17/3
4 (4+8) / 2 = 6 (6+8+4) / 3 = 18/3
8 (4+4) / 2 = 4 (8+4+4) / 3 = 16/3

32
Fk (2) = Mesataret Lëvizëse Dy Periudhshe

Fk (3) = Mesataret Lëvizëse Tri Periudhshe

Fk = (Yk-1 + Yk-2) / 2

Figura 1.11: Shpërndarja e Serisë së Kohës Yk e Përfituar në Fund të Mesatareve
Lëvizëse (Nga Shkalla e 2-të dhe e 3-të)

9

8

7

6

5 Yk

4 Fk(2)

3 Fk(3)

2

1

0
1 2 3 4 5 6

Përcaktuesi i modelit të mesatareve lëviëzëse sezonale Fk (m) = M është vlera m.
Vlera më e mirë m është ajo vlerë më e vogël e mesatares së katrorit të gabimit (RMSE) të
Fk(m)-ve e cila krijohet me vlerat e ndryshme të m-së. Në Tabelën 1.18 janë të paraqitur
llogaritjet sipas metodës së mesatareve lëvizëse të një serie kohe. Vlerat e reja të
llogaritura nga shkalla e tretë kanë qenë më efektive në zvogëlimin e ndikimeve sezonale
dhe zbutjes së serisë në krahasim me vlerat e llogaritura nga shkalla e dytë.

1.5.1.2. MODELI I THJESHTË EKSPONENCIAL I ZBUTJES (SIMPLE
EXPONENTIAL SMOOTHING)
Zbutja e thjeshtë eksponenciale mund të përdoret si një model i mirë i parashikimit
në rastet kur të dhënat nuk kanë trend apo ndikim sezonal dhe janë të qëndrueshme.

Ft+1 = αYt + (1-α) Ft, 0 < α < 1

Përcaktuesi i këtij modeli është α. Në përgjithësi merret F1=Y1. Parametri α është
koeficienti i zbutjes së të dhënave dhe zbut serinë e kohës në modelin e thjeshtë
eksponencial. Vlerat më të vogla α (0,1 dhe 0,3 pranohen si vlerat më të mira) siguron
përfitimin e vlerave Yt të zbutura më mirë. Kurse koeficienti β është koeficienti i zbutjes së
gabimit, në përgjithësi merr vlera 0,1 ose 0,2.

33
Shembull: α = 0,3

F1 = Y1 (Y1: Paraqet vlerën e vërtetë të vëzhguar në periudhën e parë).

F2 = αY1 + (1-α) Y1 = Y1

F3 = αY2 + (1-α) F2 = αY2 + (1-α) Y1

F4 = αY3 + (1-α) F3 = αY3 + (1-α) [αY2 + (1-α) Y1] = αY3 + α (1-α) Y2 + (1-α)2Y1

Zgjedhen vlera të shumta ndërmjet 0 dhe 1 për α-në dhe për secilën α krijohet seria
e Ft-së dhe nga këto seri zgjedhet α si “Parametër i Modelit të Zbutjes Eksponenciale më të
Thjeshtë” e cila jep vlerën më të vogël të RMSE-së. Vlera shumë të larta të α-së nuk janë të
përshtatshme për modelin e zbutjes së thjeshtë eksponenciale.

1.5.1.3 MODELI I ZBUTJES EKSPONENCIALE TË HOLT’SIT
Në qoftë se seria e kohës është një seri e cila bart ndikime trendi, modeli Holt’s është
modeli më i mirë i zbutjes brenda modeleve eksponenciale të zbutjes, sepse duke e marrë
në llogari ndikimin e trendit, zbutet seria e kohës.

Figura 1.12: Trend Pozitiv

Në Figurën 1.12 mund të shihet një seri kohe e cila ka trend pozitiv. Mesatarja nuk
është e qëndrueshme, tregon rritje në mënyrë të vazhdueshme. Prirja mund të jetë edhe
negative plotësisht në anën e kundërt.

1.5.1.4 ZBUTJA E THJESHTË EKSPONENCIALE E NORMËS
ADOPTUESE-PËRGJEGJËSE
Zbutja e Thjeshtë Eksponenciale e Ndryshores α (αT)

Në Figurën 1.13, mund të shihet një trend i normës së qëndrueshme dhe vrojtimet
janë të qëndrueshme. Mesatarja e lakores është fikse dhe nuk vërehet ndonjë rritje.

34
Figura 1.13: Seria e Qëndrueshme

Në zbutjen e thjeshtë eksponenciale ekziston një grafik i këtillë dhe është stabil.

Në qoftë se kemi një grafik të këtillë, duhet të përdoren α-të e vlefshme (αT) sipas
rasteve që ndryshojnë. Në këtë rast duhet të përdorim modelin e zbutjes së thjeshtë
eksponenciale të normës adoptuese-përgjegjëse.

1.5.1.5. MODELI I ZBUTJES EKSPONENCIALE TË WINTER’SIT
Në qoftë se në Yt ka edhe ndikime sezonale (S) edhe trend linear (T) dhe në qoftë se
dëshirojmë të përdorim një model eksponencial të zbutjes, modeli i Winter’sit është model
i përshtatshëm i parashikimit.
αY
Ft = S − tp + (1 – α) (Ft-1 + Tt-1) -1- Ft-1: Vlera e zbutur e periudhës paraprake.
t

Tt-1: Vlera e trendit në qoftë se ka.

35
βYt
St = + (1 – β) St-p -2-
F

Tt = (Ft – Ft-1) + (1 + ) Tt-1 -3-

Wt+m = (Ft + mTt) St -4- Në Ft + mTt nuk ka sezonalitet.

St: Është parashikimi sezonal.

Wt+m: Paraqet parashikimin për m perdiodat e ardhshme të modelit të Winter’sit.

Formula -1-; Duke i zbutur vlerat Yt nga ndikimet sezonale krijon një seri të re.
Trendi vie në një formë që mund të shihet më lehtë. Gjatë gjetjes së shifrës ndërmjet vlerës
së vërtetë dhe ndikimeve sezonale;

në qoftë se Yt/Ft është më e madhe se 1, gjendet mbi trend dhe ka fryrje.

në qoftë se Yt/Ft është më e vogël se 1, ndikimi sezonal gjendet nën vlerën e trendit.

në qoftë se Yt/Ft është e barabartë me 1, atëherë pothuajse nuk ka ndikime sezonale.
Vlerat e zbutura (Yt: vlera e vërtetë, Ft vlera e zbutur) na purifikojnë nga ndikimet sezonale
dhe na ofrojnë kah trendi.

St-p: vlera e indeksit sezonal e parashikuar përpara periudhës p.

p: numri i sezonave në seri.

Formula -2-, është formula e përcaktimit të ndikimit sezonal.

Formula -3-, është formula e përcaktimit të vlerës së trendit.

Formula -4- jep vlerën e parashikuar të Winter’sit pas periudhës m.

Vlerat α, β, duhet t’i marrim të vogla. Sado që më shumë t’i afrohen 1-shit faktorët
e zbutjes, ndikimi i vlerave të parashikuara në të ardhmen e afërt do të jetë shumë i madh
dhe i rëndësishëm (për shembull, nëse është 0, 9 ose mbi).

Në qoftë se vlerat α, β, janë afër 0-së (nëse është 0, 3 ose nën) ndikimet e
periudhave të kaluara janë të rëndësishme. Pra, nuk janë të rëndësishme vetëm vlerat e
periudhës së kaluar, por edhe vlerat e periudhave të kaluara sepse ende ekzistojnë
ndikimet dhe peshat e tyre dhe këto ndikime janë të shumta.

1.5.2. PURIFIKIMI SEZONAL DHE METODAT E ZBUTJES
Purifikimi sezonal bëhet për të interpretuar më lehtë seritë. Purifikimi sezonal është
procesi i parashikimit dhe kështu i pastrimit të ndikimeve sistematike në serinë e kohës
dhe ndikimeve të varura nga koha. Ky funksion është i nevojshëm për zbulimin e

36
komponentëve themelor të serisë të cilët nuk janë sezonal. Mirëpo, nuk duhet harruar që
purifikimi sezonal është vetëm njëra nga fazat e vlerave ekstreme (outliers) dhe
vëzhgimeve mangu (missing observations) për t’i sjellur seritë në një formë të kuptueshme.
Seritë e kohës mund të shfaqin paqëndrueshmëri të jashtëzakonshme dhe përfshijnë
periudha të përziera me njëra-tjetrën në frekuenca të ndryshme. Analiza tradicionale e
serive të kohës përfshin ndarjen e vëzhgimeve brenda katër komponentëve të ndryshme.
Për këtë arsye, një seri tipike e kohës për vrojtimet ekonomike mund të shkruhet si një
funksion i këtyre katër komponentëve. Këto janë komponenti i trendit (trendi afatgjatë),
sezonal (lëvizje sistematike dhe të varura nga koha), i parregullt (luhatje afatshkurtëra dhe
josistematike) dhe i lëvizjes ciklike.

Tabela 1.19: Komponentët Ndikues në Seritë e Kohës

Nuk ka Ndikim Ndikimi i Trendit Ndikimi i Trendit
Sezonal Aditiv (Shtues) Multiplikativ

Nuk ka
Ndikim
Sezonal

Ndikimi i
Trendit
Aditiv
(Shtues)

Ndikimi i
Trendit
Multiplikativ

Edhe pse ekziston mundësia e vrojtimit të këtyre katër ndikimeve në një seri të
kohës, zakonisht vetëm njëra është ndikuese. Parashikimi i ndryshoreve të trendit dhe
sezonës është relativisht më i lehtë sepse ritmi në këto ndryshore vie pas mostrave të
rregullta të caktuara. Në të njëjtën kohë, është i vështirë parashikimi i lëvizjeve ciklike në
një seri sepse lëvizjet ciklike nuk përfshijnë mostra të rregullta. Sigurisht, parregullsitë e
papritura dhe pjesët plotësisht të parregullta nuk mund të dihen në një seri të kohës.

37
Modeli aditiv supozon se ndikimet sezonale dhe trendore kanë një marrëdhënie
vertikale, kurse modeli multiplikativ supozon se ndikimet sezonale dhe trendore kanë një
marrëdhënie proporcionale. Nuk ka ndonjë informatë precize në lidhje me zgjedhjen e
njërit nga këto dy modele, mirëpo mund të vendoset nga këta tregues në lidhje me luhatjet
e trendit dhe sezonale:

- Në qoftë se luhatjet ndryshojnë në mënyrë proporcionale me trendin, modeli
shtues (aditiv) është më i përshtatshëm. Kurse supozimi multiplikativ është i
lidhur me vertikalitetin e këtyre katër komponentëve. Në këtë model, në
përgjithësi lëvizjet sezonale ndjekin një rrugë fikse në lidhje me trendin.
- Në praktikë, shpesh zgjedhet modeli multiplikativ. Mirëpo, supozimet duhet të
kontrollohen me kujdes dhe duhet të kihen parasysh dallimet ndërmjet modelit
aditiv dhe multiplikativ.

Analiza e purifikimit sezonal në SPSS përbëhet nga zgjedhjet Seasonal
Decomposition, Exponential Smoothing. Në analizë janë përdorur indekset e pagave për orë
në industrinë e eksportit dhe importit nga sektori i duhanit në Turqi të bërë nga periudha
2000:01-2003:12.

1.5.2.1. NDARJA SEZONALE (SEASONAL DECOMPOSITION)
Përpara se të fillojmë me analizën e serisë së kohës, fillimisht në programin SPSS
duhet të përcaktohet periudha e të dhënave. Për të përcaktuar se me cilën datë ka filluar
dhe me cilën datë ka përfunduar seria e kohës që kemi në duar, në SPSS shkohet te menyra
Data – Define Dates.

Hapi 1: Menyja për Përcaktimin e Periudhës së Kohës së Serisë

38
Hapi 2: Dritarja e Përcaktimit të Periudhave Kohore

Në përzgjedhjen
Cases Are
zgjedhet
periudha të cilën
e përfshijnë të
dhënat (Si years,
months, weeks,
days).

Në pjesën Year
shkruhet viti i
fillimit, në
pjesën Months,
data e fillimit.
Klikohet OK.

Për përfundimit të përcaktimit të periudhës së serisë, ndiqet faza për të parë
shpërndarjen e të dhënave mbi grafik, nëpër Graphs  Sequence.

Hapi 3: Menyja e Zgjedhjes së Grafikut të Serisë

39
Hapi 4: Dritarja e Grafikut të Serisë
Në përzgjedhjen
Variables bartet
njëra nga
ndryshoret.

Në pjesën Time
Axis Labels
bartet periudha
e serisë. Në
shembullin tone,
periudha është
12 muaj.

Për të konvertuar
e-bazën në
llogaritëm
zgjedhet Natural
Log Transform,
dallim Seasonal
Difference,
dallim sezonal
Seasonal
Difference.
Në përzgjedhjen Transform, funksioni Natural Log Transform llogarit vlerat
logaritmike (Logaritmi Natyror) në e-bazën e serisë. Për të kryer këtë funksion, duhet që të
gjitha vlerat në seri të jenë pozitive. Funksioni Difference i llogarit dallimet e vlerave që
përcjellin njëra-tjetrën në seri. Shkalla e dallimi nuk merr vlera më të mëdha se 1 apo 2.
Funksioni Seasonally Difference i konvertohn të dhëna duke bërë llogaritje ndërmjet
vlerave të serisë dhe një intervali fiks. Ky konvertim mund të bëhet vetëm pas përcaktimit
të intervalit të kohës me funksionin Define Dates. Zgjedhjet Difference dhe Seasonal
Difference janë të kuptimta vetëm për seritë e kohës dhe seri të ngjashme. Në grafikun e
përfituar mund të vrojtohet shpërndarja e të dhënave brenda kohës dhe cilat ndikime janë
gjetur.

Komponentët sezonal përbëhen nga efekte të shëndosha kur janë të përshtatshëm
për kohën, orientimin dhe madhësinë. Sezonaliteti në një seri kohe përbëhet nga tri pika
(peaks) të cilët përbëhen nga intervale të caktuara të rregullta dhe nga pika të ulëta
(troughs) të cilat janë vazhdimisht të qëndrueshme dhe që përfshijnë lëvizje të cilat kanë
madhësi përafërsisht të njëjtë çdo vit. Komponentët e parregulltë janë luhatje afatshkurtëra
të paparashikuara më parë dhe josistematike. Në seritë të cilat kanë shumë komponentë të
parregullta, ndikimet sezonale dhe trendore mund të marrin një pozitë dominuese mbi

40
trendin e serisë. Komponenti i trendit, lidhja kalendarike dhe ndikimet e parregullta janë
luhatje afatgjata në një seri kohe që nuk shihet dhe janë një reflektim i vrojtimeve të
mëparshme.

Figura 1.14: Seria e Parregullt (Irregular)

Në figurën 1.14 shihet indeksi i eksportit të duhanit (2000:01-2003:12) i cili ka
ndikime të parregullta-pa qëndrueshme (irregular) të serisë së kohës. Për shkak të
ndryshimit në çmimet e blerjes së duhanit, kushteve të kohës dhe kërkesës nga jashtë,
shihet ndikimi i komponentëve të parregullta në eksportin e duhanit.

Figura 1.15: Seria e Trendit

41
Vrojtimet të cilat kanë ndikime të trendit (Figura 1.15), i përket indeksit të pagës
për orë të sektorit të duhanit për periudhën 2000:01-2003:12. Rritjet e vazhdueshme të
cilat shfaqen në paga brenda kësaj periudhe shkaktojnë shfaqjen e ndikimeve të trendit në
seri në drejtim pozitiv. Në këtë seri shihet që në Janar 2003 është përjetuar rënie në indeks
dhe kjo rënie vështirëson përcaktimin e plotë të rritjes së indeksit të pagës në periudhën e
cekur. Në këtë pikë vie në shprehje nevoja e përcaktimit të shpejtësisë së rritjes në seri
ndarjes sezonale për të sjellur serinë në nëj formë më të përdorshme.

Figura 1.16: Ndikimi Sezonal

Në figurën 1.16 shihet se seti për numrin e apartamenteve të ndërtuara sipas numrit
të licencave për periudhën 1991:Q1-2003:Q2 strehon ndikime sezonale. Zvogëlimi i
vëllimit në sektorin e ndërtimit në muajt e dimrit, përshtatshmëria për ndërtim në muajt e
verës dhe rritja e vëllimit të punës në sektor në këto periudha, shkakton përjetimin e
luhatjeve sezonale në mënyrë periodike.

Figura 1.17: Ndikimet Trendore-Sezonale

42
Kurse në Figurën 1.17 është paraqitur indeksi i prodhimit të energjisë elektrike për
periudhën 1997:01-2004:11. Siç mund të shihet, seria e kohës së prodhimit të energjisë
është e strehuar edhe brenda ndikimeve sezonale edhe ndikimeve të trendit. Mund të
thuhet se komponenti i trendit i vrojtuar në prodhimin e energjisë është i lidhur me rritjen
e kërkesës për shtëpi dhe industri. Në të njëjtën kohë, sigurimi i prodhimit të energjisë në
Turqi kryesisht nëpërmjet centraleve hidroelektrike rritet në periudhën e dimrit kur ka shi
mjaftueshëm dhe zvogëlohet në periudhën e verës kur ka shi pak. Purifikimi për të dy
komponentet sezonale nga indeksi i prodhimit të energjisë do të ofroj një rrugë më të lehtë
për të bërë parashikime në lidhje me prodhimin e energjisë në Turqi.

Sjellja e serisë së kohës në një formë që mund të kuptohet dhe përdoret duke i
strehuar komponentët e përfshirë mund të sigurohet me ndihëm e funksionit Ndarja
Sezonale. Purifikimi sezonal në programin SPSS realizohet nga menyja Analyze 
Forecasting  Seasonal Decomposition.

Hapi 5: Menyja e Ndarjes Sezonale

43
Hapi 6: Dritarja e Ndarjes Sezonale
Në përzgjedhjen
Variables barten
ndryshoret.

Zgjedhet një nga
modelet,
multiplikativ ose
aditiv.

Zgjedhet një nga
peshat e
mesatares
lëvizëse, peshat e
barabarta (All
Points Equal) ose
peshat e
llogaritura me
interval +1
(Endpoints
Weighted By 0.5)

Komponenti sezonal për funksionin e purifikimit që do të kryhet me modelin
multiplicative është një faktor i cili strehohet nga ndikimet sezonale për përfitimin e
serisë origjinale. Trendi llogarit komponentët sezonal që sigurojnë që të gjitha nivelet e
serisë të jenë proporcionale. Vrojtimet të cilat nuk përfshijnë ndryshime sezonale, kanë
vetëm një komponent sezonal. Kurse modeli additive siguron nxjerrjen e ndikimeve
sezonale në serin e të dhënave me qëllim për të parë karakteristkat e fshehura të serisë nga
një komponent sezonal. Trendi në këtë përzgjedhje llogarit të gjithë komponentët sezonal
të cilët nuk marrin brenda të gjitha nivelet e serisë. Vrojtimet të cilat nuk përfshijnë
ndryshim sezonal kanë komponentë sezonal zero.

Përzgjedhja Moving Averages Weight përcakton se si do të përfitohet seria e kohës
e llogaritur nga mesataret lëvizëse. All Point Equal llogarit mesataret lëvizëse me një
interval të barabartë periodik dhe të gjitha pikat peshohen në të njëjtën shkallë. Kjo metodë
zakonisht aplikohet kur perioditeti është i parregulltë. Perioditeti është shfaqja e
vazhdimësisë së vrojtimeve në periudha/intervale të caktuara në serinë e kohës.
Përzgjedhja Endpoints Weighted By 0.5 llogarit mesataret lëvizëse me një interval
periodik afër 1.

Për të përfituar faktorët sezonal që do të llogariten dhe për të përfituar vlerat e seisë
së purifikuar në zgjedhjen Save selektohet Add To File. Edhe nga këtu arrihet te seritë e
purifikuara si më poshtë.

44
Hapi 7: Dritarja e Përfitimit të Serisë së Re Pas Ndarjes Sezonale

Hapi 8: Vlerat e Përfituara Pas Ndarjes Sezonale

ERR_1 tregon gabimin në lidhje me të dhënat e eksportit të duhanit, SAS_1 gjendjen
e purifikuar nga sezonaliteti të indeksit së eksportit të duhanit, SAF_1 faktorët sezonal dhe
STC_1 serinë e trendit dhe ciklike. Të njëjtat vlera ERR_2, SAS_2, SAF_2 dhe STC_2 janë për
indeksin e pagës për orë. Kurse shpërndarja e serive të reja është si më poshtë.

Në figurën 1.18, shihen vlerat pas funksionit të ndarjes sezonale të serive të kohës
dhe vlerat e vrojtimeve të para. Vlerat e përfituara pas analizës kanë siguruar kuptimin më
të mirë të ndikimeve sezonale të serisë në gjendjen e ndarë nga komponentët e përfshirë
sipas vlerave fillestare të vrojtimeve. Në këtë mënyrë, mund të kuptohet lehtë se sektori i
ndërtimit është gjallëruar në çerekun e dytë dhe të tretë (Prill-Maj-Qershor dhe Korrik-

45
Gusht-Shtator) dhe është përjetuar rënie në çerekun e parë (Janar-Shkurt-Mars) në
krahasim me periudhat e tjera.

Figura 1.18: Purifikimi Sezonal, Vlerat e Trendit dhe Lëvizjes Ciklike (Numri i
Ndërtimeve, Prodhimi i Energjisë Eksportimi i Duhanit, Indeksi i Pagave)

(Numri i Ndërtimeve) (Prodhimi i Energjisë)

(Eksporti i Duhanit) (Pagat e Punëtorëve)

1.5.2.2. ZBUTJA EKSPONENCIALE (EXPONENTIAL SMOOTHING)
Teknikat Exponential Smoothing ofrojnë parashikimin e vlerave të ardhshme të
serisë së kohës me peshimin e ndikimeve të vrojtimeve të kaluara. Quhen metoda vetë-
adaptive sepse parametrat mund të përditësohen sa herë që shtohet një vrojtim i ri i

46
parashikimeve të kohës së llogaritur. Për të purifikuar serinë me metodën e zbutjes
eksponenciale, shkohet te menyja Analyze  Forecasting  Exponential Smoothing.

Hapi 1: Menyja e Zbutjes Eksponenciale1

Në dritaren e hapur, seritë barten në pjesën Variables, vlerat Seasonal
Decomposition të indeksit të eksportit së duhanit të përfituara pas analizës Seasonal
Decomposition barten në pjesën Seasonal Factors Decomposition. Në pjesën Model
gjendet katër alternativa. Metodat Simple supozon se seria nuk përfshin ndryshime trendi
dhe sezonale. Metoda e zbutjes eksponenciale Holt supozon se seria përfshin trend linear
dhe nuk përfshin ndryshim sezonal. Modeli Winter supozon se seria përfshin trend linear
dhe nuk përfshin ndryshim sezonal në formë multiplikative. Alternativa Custom siguron
komponentët sezonal dhe përcaktimin e trendit. Me zgjedhjen e alternativës Custom,
menjëherë alternativa e mëposhtme jep mundësi për përcaktimin e komponentëve të

1Në verzionet e reja të programit SPSS, funksioni i zbutjes eksponenciale zgjedhet si në fotografi. Megjithatë,
përshkrimet në vazhdim janë përkthimet origjinale të librit.

47
trendit Linear, Exponential (eksponencial) dhe Damped (shuar), komponetëve sezonal
Additive (kontribues) dhe Multiplicative (multiplikativ).

Shënim i Përkthyesit: Këto metoda në versionet e reja të SPSS-it, gjenden tek
alternativa Criteria.

Hapi 2: Dritarja e Zbutjes Eksponenciale

48
Hapi 3: Dritarja e Përcaktimit të Modelit në Procesin e Zbutjes Eksponenciale

Në alternativën Parameters (Parametrat) gjenden 4 parametra, Alfa (α), Gamma
( ), Delta ( ) dhe Pi ( ). Alfa është koeficienti i zbutjes së të dhënave, Gamma është
koeficienti i zbutjës së gabimit dhe Delta është koeficienti i parashikimit të ardhshëm.

Koeficienti Pi përdoret nëse fuqia rritëse e trendit është e ulët ose rritet duke u
zvogëluar (në alternativën Damped). Merr një vlerë ndërmjet 0 dhe 1, por nuk mund të jetë
e barabartë me 1. Vlerat afër 1 tregojnë rritjen duke u zvogëluar fazë-fazë.

Në qoftë se Alfa është afër 1, atëherë përdoret vetëm vlera e vrojtimit të fundit. Në
qoftë se Alfa është e barabarta me 0, vlerat e vrojtuara në periudhën e kaluar vlerësohen
duke marrë për bazë vrojtimet e reja. Alfa përdoret për të gjitha modelet. Gamma merr nëj
vlerë prej 0 dhe 1. Gamma përdoret në modelet me trend linear ose eksponencial ose në
modelet me trend që zvogëlohet dhe ato që nuk kanë ndikime sezonale. Nuk përdoret për
modelin Simple Exponential Smoothing. Koeficienti Delta gjendet ndërmjet 0 dhe 1,
vlerave afër 1 u jepet më shumë peshë. Përdoret në të gjitha modelet e zbutjes
eksponenciale të cilat përfshijnë komponente sezonale. Nuk përdoret për modelet Simple
dhe Holt.

Në alternativën Parameters mund të përcaktohet një vlerë në pjesën Value për
secilin nga katër koeficientët ose mund të detektohet një vlerë me ndihmën e alternativës

49
Grid Search. Për koeficientët Alfa, Gamma dhe Delta mund të futet një vlerë 0-1 ose
ndërmjet këtyre nga ana e përdoruesit në pjesën Value. Për koeficientin Pi duhet të jepet
vetëm një vlerë ndërmjet 0 dhe 1. Nuk mund të jepet vlera 0 ose 1. Në qoftë se zgjedhet
Grid Search duhet të përcaktohet renditja e vlerave të përdorura në bashkimin e
koeficientëve të zbutjes. Gjatë bërjes së analizës vlerat e dhëna të koeficientëve janë vlerat
që i përcakton automatikisht programi SPSS. Me vlerat e dhëna në kutizat Start, Stop dhe
By përkufizohen madhësitë horizontale dhe vertikale (Grid Search) të analizës që do të
bëhet. Start përcakton vlerën fillestare, Stop vlerën e fundit dhe By vlerën rritëse. Vlera
Stop duhet të jetë më e madhe se vlera Start dhe vlera By nuk duhet të tejkaloj dallimin
ndërmjet vlerave Start dhe Stop. Alternativa Grid Search bën llogaritje duke gjetur vlerën
më të përshtatshme ndërmjet 0 dhe 1. Në qoftë se dëshirohet të përdoret vlera më e mirë e
koeficientit, duhet të përzgjedhet alternativa Grid Search.

Në pjesën Save zgjedhen alternativat Add To File dhe Predict From Estimation
Period Through Last Case. Në qoftë se dëshirohet që parashikimet të përcaktohen pas një
periudhe kohore të dëshiruar në vend të vrojtimit të fundit, zgjedhet alternativa Predict
Through dhe në kutizat Year dhe Month përcaktohet koha e vrojtimit.

Pas përfundimit të këtyre fazave, klikohet butoni OK dhe ruhen vlerat e
përshtatshmërisë (Fit) dhe të gabimit (Errors) të llogaritura në faqen hyrëse të të dhënave.
FIT_3 dhe ERR_3 tregon vlerat e përcaktuara të parametrave dhe vlera FIT_4 dhe ERR_4
vlerat e përdorura të koeficientit më të mirë me metodën Grid Search.

Hapi i Fundit: Vlerat e Përfituara pas Zbutjes Eksponenciale

50
Tabela 1.20: Indekset Sezonale dhe Vlerat e Parametrave

Seasonal Indices Seasonal Indices
1 100, 13906 1 100, 13906
2 103, 27524 2 103, 27524
3 102, 36608 3 102, 36608
4 100, 88625 4 100, 88625
5 97, 61954 5 97, 61954
6 98, 38244 6 98, 38244
7 100, 03001 7 100, 03001
8 100, 67875 8 100, 67875
9 99, 42544 9 99, 42544
10 99, 17985 10 99, 17985
11 100, 34540 11 100, 34540
12 97, 67195 12 97, 67195

Initial Values Initial Values
Series Trend Series Trend
100, 76389 - , 09954 100, 76389 - , 09954

The SSE is The 10 Smallest SSE’s are:
Alpha Gamma Delta SSE Alpha Gamma Delta SSE
, 1000000, 1000000, 1000000 753, 74265 , 8000000, 0000000, 0000000 363, 19069
, 7000000, 0000000, 0000000 363, 60829
, 8000000, 0000000, 2000000 367, 33477
, 9000000, 0000000, 0000000 369, 06550
, 7000000, 0000000, 2000000 369, 46458
, 6000000, 0000000, 0000000 371, 07784
, 9000000, 0000000, 0000000 371, 35292
, 8000000, 0000000, 0000000 373, 73998
, 9000000, 0000000, 4000000 374, 37978
, 9000000, 0000000, 6000000 378, 02701

Në Tabelën 1.20, në kolonën e majtë shihen parametrat e futur nga ana e
përdoruesit, vlerat e llogaritura të indeksit sezonal dhe totali i katrorit të gabimit. Në
kolonën e djathtë marrin pjesë vlerat e koeficientit i cili jep gabimin me të vogël ndërmjet
vlerave të futura në alternativën Grid Search. Në fund të secilës metodë vlerat e Seasonal
Indices dhe Initial Values janë të njëjta. Për secilin nga tri parametrat 0, totali i katrorit të
gabimit i llogaritur (SSE) me dhënien e vlerës 1 është 753,74265. Me funksionin Grid
Search vlerat e përfituara nga totali i katrorëve të gabimit më të vogël (SSE: 363,19069) me
vlerat e parametrit të ndryshëm është përdorur si koeficient i vlerave të parametrave α:0,
8, β:0, 0 dhe :0, 0.

51
Vlerat e Indeksit Sezonal (Seasonal Indices) të llogaritur na ofojnë mundësi për të
bërë parashikim në lidhje me serinë e kohës në të ardhmen. Në analizë, seria e kohës kishte
12 muaj perioda dhe vlerat e indeksit sezonal janë llogaritur në formën e 12 muajve
periodë. Sipas kësaj, në muajtë e parë në serinë e kohës, vlera e indeksit të eksportit të
duhanit është realizuar si 100,13906, në muajin e dytë 103,27524 duke u rritur me një
normë prej 3%. Pra, në muajtë e dytë ka një rritje të normës prej 3% në eksportin e duhanit
në krahasim me muajin e parë. Kurse në muajin e 12-të, ekziston një rënie prej 2,5% në
krahasim me muajin e parë. Në këtë mënyrë, mund të bëhet parashikime në përputhje me
këto ndryshime të indeksit për periudhat e ardhshme të serisë së kohës. Kurse Figura 1.19
tregon shpërndarjen e vlerave të zbutura të të dhënave të llogaritura me këto dy metoda.

Figura 1.19: Shpërndarja e të Dhënave Pas Zbutjes Eksponenciale

Vlerat e vrojtimit të parë
për serinë e kohës

Vlerat pas zbutjes për
serinë e kohës

52
53
2. STATISTIKAT PËRSHKRUESE
Gjatë një studimi të bërë, interpretimi i të dhënave vetëm duke i shikuar ato dhe
nxjerrja e një rezultati kuptimplotë është i pamundshëm. Është e nevojshme që të
prezantohen një sërë karakteristikash të këtyre të dhënave. Veçanërisht duhet të
vlerësohet mesatarja e të dhënave dhe shpërndarja e të dhënave rreth kësaj mesatareje si
dhe në çfarë mase është devijuar nga mesatarja.

Në kategorinë e statistikave përshkruese marrin pjesë matësit e tendencës qendrore
si mesatarja, mediana dhe moda, matësit e devijimeve nga mesatarja, si devijimi standart
dhe varianca, si dhe matësit e devijimeve nga normalja si pjerrësia dhe kurtoza.

Me ndihmën e statistikave përshkruese gjatë vlerësimit të rezultateve të përfituara
në fund të një analize të kryer, gjëja e parë që duhet të kihet kujdes është kontrollimi i
rëndësisë statistikore. Rëndësia shprehet me koncepte si rëndësia statistikore, niveli i
rëndësisë apo probabilitetit dhe këto koncepte shprehen me shkronjën P (apo me Sig. në
SPSS).

Mendimi i pranuar përgjithësisht është kur vlera p është më e vogël se 0,05,
rezultatet do të jenë të rëndësishme në mënyrë statistikore. Me fjalë të tjera, në qoftë se
gjasat e rastësisë së një gjetjeje janë më pak se 5%, atëherë ky rezultat konsiderohet i
rëndësishëm statistikisht.

2.1. MATËSIT E TENDENCËS QENDRORE
Në statistikë, një shifër e cila në mënyrë të mjaftueshme shpreh dhe përfaqëson një
numër të termeve quhet mesatare. Mesatarja në të njëjtën kohë identifikon karakteristikat
e serisë. Mesatarja, tregon se vlerat e një seti të dhënash nga cilat mjedise të vlerave janë
mbledhur, për këtë arsye në të njëjtën kohë quhen edhe “matësit e tendencës qendrore”.
Matjet e tendencës qendore përbëhen nga mesatarja aritmetike, mediana dhe moda.

2.1.1. MESATARJA ARITMETIKE
Mesatarja aritmetike është matësi më i shpeshtë i tendencës qendrore. Mesatarja
aritmetike gjendet me pjesëtimin e totalit të të gjitha vlerave të një seti të dhënash me
numrin e të dhënave të setit. Për shembull, mesatarja artimetike e një seti që përbëhet nga
7 të dhëna (3,5,7,5,6,7,9) gjendet në këtë mënyrë:

3+5+8+5+ +8+9
M. A. = =

54
Mesatarja aritmetike ngaqë ndikohet nga të gjitha vlerat në setin e të dhënave nuk
është një statistikë e përshtatshme përshkruese në rastet kur nuk dihen të gjitha vlerat e
setit të të dhënave. Përfitimi i mesatares aritmetike, në mënyrë matematikore shprehet në
këtë mënyrë:

x
M.A. =
N
x në formulë tregon totalin e të dhënave në seri, kurse N numrin e të dhënave.

2.1.2. MEDIANA (MESORJA)
Mediana është vlera e cila merr pjesë plotësisht në mes të setit të të dhënave. Pra,
medianë quhet vlera e cila përkon mu në mes të një serie të renditur dhe që e ndan këtë
seri në dy pjesë të barabarta.

Në qoftë se numri të dhënave në setin e të dhënave është numër tek, mediana e
serive është (n+1) /2. Në qoftë se numri i të dhënave është çift, mediana e serive është
mesatarja aritmetike e 2 të dhënave të mesit.

Për shembull, në qoftë se bëhet renditja e një seti të dhënash (3,5,7,5,6,8,9) nga e
vogla te e madhja (3,5,5,6,7,8,9), mediana e kësaj serie do të jetë (7+1)/2 = 4. Pra, numri që
përkon me pozitën e katërt është 6.

Kurse për një seri të renditur në formën (6,7,8,9,10,11), (6+1) /2 = 3,5. Kjo vlerë
nënkupton që mesatarja e serive gjendet nga mesatarja aritmetike e numrit të tretë dhe të
katërt, pra (8+9) /22 = 8,5

Ngaqë mediana nuk është e ndjeshme ndaj vlerave ekstreme veçanërisht ne rastet
kur vlerat janë të pjerrëta, mund të përdoret në shpërndarjet simetike dhe josimetrike dhe
në të dhënat ekstreme për të cilat nuk dihet seti i plotë i të dhënave.

2.1.3. MODA (VLERA E MAJËS)
Modë quhet vlera e cila paraqitet më së shpeshti në nje set të të dhënave (me fjalë të
tjera, frekuenca më e lartë). Moda mund të përdoret si një matës i tendencës qendrore për
ndryshoret intervalore, proporcionale dhe rendore.

Në seritë e thjeshta (kur nuk ka vlera që përsëriten) nuk mund të llogaritet moda
ngaqë të gjitha frekuancat që përkojnë me X përsëriten 1 herë. Për përcaktimin e modës në
të dhënat e klasifikuara, gjendet vlera X e cila jep vlerën më të lartë të frekuencës në
kolonën e frekuencës. Për shembull, në serinë e mëposhtme të shpërndarë, vlera më e lartë
e frekuencës është 6 dhe këtë vlerë të frekuencës e jep X e cila jep modën e 2 serive.

55
X N
1 2
2 6
3 2
4 1
6 3

Kurse gjetja e modës në të dhënat e grupuara është pak më ndryshe. Në fillim, duhet
të përcaktohet intervali i modës. Intervali i modës në të dhënat e grupuara është intervali
me frekuencën më të lartë. Pasi të gjendet intervali i modës, pastaj llogaritet moda.
Llogaritja e modës bëhet në këtë mënyrë:

1
M0 =l+s ( )
1+

Nga formula, l tregon kufirin më të ulët të modës, s tregon gjerësinë e intervalit, 1
tregon dallim ndërmjet frekuencës së intervalit modal dhe frekuencës paraprake, 2
dallimin ndërmjet frekeuncës së intervalit modal dhe frekuencës pasuese.

Për shembull;

Intervali N
0-4 2
4-8 5
8-12 7
12-16 6

( − 5) 8
0 = 8 + 4( ) = 8 + = 10.
( − 5) + ( − ) 3

Matësit e tendencës qendrore janë të dobishëm për gjetjen e pikës mesatare të të
dhënave, mirëpo gjetja vetëm e pikës mesatare së të dhënave nuk është e mjaftueshme për
një analizë të mirë. Në të njëjtën kohë duhet të analizohet edhe shpërndarja e të dhënave
dhe devijimi i tyre nga mesatarja.

56
2.2. MATËSIT E DEVIJIMIT NGA MESATARJA
2.2.1. VARIANCA
Vlera e variancës gjendet nga pjestimi i totalit të katrorëve të devijimeve nga
mesatarja me totalin e numrit të vlerave totale. Për shembull, në qoftë se mesatarja
aritmetike e serisë (3,5,7,5,6,7,9) është 6, varianca llogaritet në këtë mënyrë:

(3 − ) + (5 − ) + ( − ) + (5 − ) + ( − ) + ( − ) + (9 − )
= 3,14

2.2.2. DEVIJIMI STANDART
Devijimi standart tregon largësinë e vrojtimeve nga mesatarja dhe është e barabartë
me rrënjën katrore të variancës. Për shembull, varianca e serisë (3,5,7,5,6,7,9) është 3,14
(nga llogaritja e mësipërme), kurse devijimi standart do të jetë 3,14 = 1,77.

2.3. MATËSIT E DEVIJIMEVE NGA NORMALJA
2.3.1. SHPËRNDARJA NORMALE PËR NJË NDRYSHORE
Shpërndarja e të dhënave është shumë me rëndësi në punimet statistikore sepse në
hulumtimet statistikore për aplikimin e shumë testeve, shpërndarja duhet që të jetë
normale apo afër normales.

Shpërndarja normale është një shpërndarje e vazhdueshme. Për shembull, një pjesë
e madhe e notave të financave të një pjesë të madhe të studentëve, do të mblidhen për
shkak të mesatares, kurse disa nota, do të shpërndahen anash të reduktuara brenda një
intervali të gjerë konstant. Në qoftë se mesatarja e këtij provimi është 70, numri i
studentëve të cilët kanë marrë notë ndërmjet intervalit 65-70 pritet të jetë më i madh se ai i
intervalit 85-95. Ky është funksioni i densitetit të probabilitetit që i ngjan ziles, i cili
zvogëlohet përgjatë vlerave ekstreme të cilat kalojnë mbi limitet e mesatares. Shpërndarja
normale është një shpërndarje simetrike. Mesatarja aritmetike, moda dhe mediana janë të
barabarta.

57
Figura 2.1: Kurba e Shpërndarjes Normale

Shpërndarja standarte normale e cila me një mesatare 0 dhe devijim standart 1, ka
një frekuencë në formë të ziles. Shpërndarjet normale të cilat kanë një mesatare të
ndryshme nga 0 dhe devijim standart të ndryshëm nga 1, nuk janë shpërndarje normale
standarte. Zakonisht gjatë aplikimeve bëhen krahasime me të këtilla lloje të shpërndarjeve.

Në mostrat me një ndryshore për kërkimin e normalitetit përdoren metodat grafike
si grafiku pa tendencë, diagrami i kutisë, Q-Q, grafiku i histogramit dhe në të njëjtën kohë
testet si Shapiro-Wilks, Kolmogorov-Smirnov.

Në punimet statistikore u përmend më parë se për kryerjen e shumë testeve
shpërndarja duhet të jetë normale apo afër normales sepse largësia e të dhënave nga
normalja shkakton rezultate të gabueshme të analizës dhe rrjedhimisht interpretimet e
bëra do të jenë gabim. Për këtë arsye, të dhënat të cilat nuk tregojnë shpërndarje normale
duhet të konvertohen në atë mënyrë që të tregojnë shpërndarje normale. Shkalla e
pjerrësisë së të dhënave dhe metoda e konvertimit janë paraqitur më poshtë në tabelën 1.

Tabela 2.1: Konvertimet Sipas Lakimit

Lakueshmëri e Lakueshmëri Lakueshmëri Lakueshmëri Lakueshmëri
Moderuar Ekstreme Negative Negative Ekstreme
Pozitive Pozitive (përzgjedhja (përzgjedhja Negative
1) 2)
Konvertimi në Kthimi në një Kovertimi i X2 Mirret vlera e
rrënjë katore shpërndarje apo X3, apo kundërt e
(është e Konvertim pozitive anësore konvertimi (x/ vrojtimit (1/x),
përshtatshme për logaritmik dhe përdor (1-x)) kurse norma
të dhënat e metodën e logit(p) =loge
grumbulluara) përdorur këtu (p/ (1-p))

58
2.3.1.1. SHEMBULL APLIKIMI
Shumat e prodhimit ditor të 10 punëtorëve të një firme janë si më poshtë.

Tabela 2.2: Të Dhënat Përkatesë të Shembullit

Nr. Punëtorëve Shume e Prodhimit
1 50,00
2 200,00
3 80,00
4 92,00
5 25,00
6 18,00
7 42,00
8 82,00
9 22,00
10 40,00
Për të parë në fillim se shumat e prodhimit a ndjekin shpërndarjen normale, të
paraqesim histogramin dhe grafikun e normalitetit. Për ta bërë këtë në SPSS, shkohet te
menyja Graphs Legacy DialogsHistogram. Në dritaren e hapur, ndryshorja “shuma e
prodhimit” transferohet në pjesën Variables. Më vonë, etiketohet përzgjedhja “Display
Normal Curve” dhe klikohet butoni OK. Në fund të këtij funksioni do të përfitohet
histogrami i mëposhtëm.

Figura 2.2: Rezultatet e Histogramit

59
Sipas grafikut të përfituar të histogramit dhe kurbës së shpërndarjes normale, mund
të shihet se ndryshorja nuk ndjek shpërndarjen normale dhe se në mënyrë të
konsiderueshme është e lakuar në të djathtë.
Teksa seti i të dhënave në këtë mënyrë duke mos ndjekur shpërndarjen normale,
nuk është e drejtë që të bëhet ndonjë analizë. Për këtë arsye, ndryshoret duhet të
konvertohen në mënyrë që të ndjekin shpërndarjen normale. Për këtë, të shikojmë dallimin
duke e bërë konvertimin në rrënjë katrore në SPSS. Në fillim, në SPSS, shkohet te menyja
Transform  Compute Variable.
Hapi 1: Menyja Filluese e Funksionit të Konvertimit

Më vonë, në pjesën Target Variable shkruhet emri i të dhënave që do të përfitohen
në fund të konvertimit. Duke e përzgjedhur ndryshoren e shumës së prodhimit, bëhet
bartja në pjesën Numeric Expression. Nga butonat e makinës llogaritëse duke shtypur
butonin e shenjës së yllave shkruhet 0,5 dhe klikohet butoni OK.

60
Hapi 2: Dritarja e Konvertimit në Rrënjë Katrore

Tabela 2.3: Konvertimi i Rrënjës Katrore
Nr. Punëtorëve Shume e Prodhimit Rrënja Katrore
1 50,00 7,07
2 200,00 14,14
3 80,00 8,94
4 92,00 9,59
5 25,00 5,00
6 18,00 4,24
7 42,00 6,48
8 82,00 9,06
9 22,00 4,69
10 40,00 6,32
Në fund të konvertimit në rrënjë katrore, për të parë se të dhënat e reja të përfituara
a ndjekin shpërndarjen normale, bëhet përsëri vizatimi i histogramit.

61
Figura 2.3: Rezultatet e Histogramit e Konvertimit në Rrënjë Katrore

Siç mund të shihet, të dhënat tani jam pak më afër normales. Tani duke bërë
konvertimin logaritmik mund të shohim shpërndarjen e të dhënave.

Për këtë, në SPSS, shkohet te menyja Transform  Compute Variable. Në pjesën
Target Variable shkruhet emri i të dhënave që do të përfitohen në fund të konvertimit të
bërë. Në pjesën Function Group përzgjedhet Arithmetic dhe nga pjesa Functions and
Special Variables përzgjedhet lg10. Pas kësaj në pjesën e makinës llogaritëse klikohet
shigjeta që tregon drejtimin lartë dhe funksioni bartet në pjesën Numeric Expression. Në
vend të ? në pjesën Numeric Expression bartet ndryshorja shuma e prodhimit dhe
klikohet butoni OK.

62
Hapi 3: Dritarja e Konvertimit Logaritmik

Tabela 2.4: Konvertimi Logaritmik
Nr. Punëtorëve Shume e Prodhimit Konvertimi Logaritmik
1 50,00 1,70
2 200,00 2,30
3 80,00 1,90
4 92,00 1,96
5 25,00 1,40
6 18,00 1,26
7 42,00 1,62
8 82,00 1,91
9 22,00 1,34
10 40,00 1,60
Në fund të konvertimit logaritmik, për të parë se të dhënat e reja të përfituara a
ndjekin shpërndarjen normale, bëhet përsëri vizatimi i histogramit. Siç mund të shihet më
poshtë në figurën 4, në fund të konvertimit logaritmik të dhënat e përfituara ndjekin
shpërndarjen normale.

63
Figura 2.4: Rezultatet e Histogramit të Konvertimit Logaritmik

2.3.2. NGUSHTËSIA
Shpërndarja kurtozës (kurtosis) është një matës që jep informata rreth situatës së
pikave më të larta të të dhënave, pra “drejtimit” dhe “rrafshsisë”. Një lakim afër zeros krijon
një formë afër shpërndarjes normale. Një vlerë pozitive e lakueshmërisë është shenjë e një
shpërndarjeje më të drejtë nga normalja. Një vlerë negative e lakueshmërisë është një
shenjë e një shpërndarjeje më të rrafshët nga normalja.

2.3.3. PJERRËSIA
Shpërndarja e pjerrësisë (skewness) është një matës që përcakton se sa ka devijuar
shpërndarja në rrethin e mesatares nga simetria, pra përcakton simetrinë e të dhënave.
Vlera zero është shenjë e një shpërndarjeje simetrike, pra një ekulibrimi mesatar. Pjerrësia
pozitive tregon që ekzistojnë shumë vlera të vogla, kurse pjerrësia negative tregon që
ekzistojnë shumë vlera të mëdha. Në rastin kur mesatarja e çfarëdo seti të të dhënave është
më e madhe se mediana, vihet në pah një shpërndarje e pjerrët në të djathtë, në rastin e
mesatares më të vogël se mediana vihet në pah një shpërndarje e pjerrët në të majtë.

2.4. SHEMBULL APLIKIMI
Shpërndarja e moshave të studentëve të një klase le të jetë si më poshtë në tabelën
2.5. Sipas kësaj, me këtë set të të dhënave mund të analizojmë matësit e tendencës
qendrore (mesataren aritmetike, medianën, modën), matësit e devijimit nga mesatarja

64
(variancën, devijimin standart) dhe matësit e devijimit nga normalja (ngushtësinë,
pjerrësinë).

Tabela 2.5: Të Dhënat Përkatëse të Shembullit

NO MOSHA NO MOSHA
1 21 11 26
2 19 12 21
3 20 13 25
4 21 14 18
5 19 15 20
6 22 16 27
7 23 17 22
8 17 18 24
9 18 19 23
10 20 20 26

Për të grupuar të dhënat që posedojmë dhe për të gjetur frekuncat e këtyre grupeve,
përdoren këto përzgjedhje.

Për të aplikuar metodën Frequencies në SPSS, ndiqen këto faza:

Ananlyze  Descriptive Statistics  Frequencies.

Hapi 1: Menyja Filluese e Metodës Frequencies

65
Hapi 2: Dritarja e Metodës Frequencies

Në dritaren e statistikave në pjesën Central Tendecy etiketohen të gjitha
përzgjedhjet (Mean, Median, Mode, Sum). Ngjajshëm, në pjesën Dispersion dhe
Distribution etiketohen të gjitha përzgjedhjet dhe shtypet tasti Continue.

Hapi 3: Dritarja e Statistikave të Metodës Frequencies

66
Pasi të kthehet në dritaren Frequencies, shtypet tasti OK dhe do të realizohet
analiza. Rezultatet e analizës janë dhënë më poshtë.

Tabela 2.6: Rezultatet e Testit të Metodës Frequencies

Statistics
mosha

N Valid 20

Missing 0
Mean 21.6000
Std. Error of Mean .64645
Median 21.0000
a
Mode 20.00
Std. Deviation 2.89100
Variance 8.358
Skewness .358
Std. Error of Skewness .512
Kurtosis -.778
Std. Error of Kurtosis .992
Range 10.00
Minimum 17.00
Maximum 27.00
Sum 432.00

a. Multiple modes exist. The smallest
value is shown

Në fund të analizës janë përcaktuar statistikat përshkruese për të dhënat e moshës
dhe sipas kësaj mesatarja e serive është 21,16, mediana 21 dhe moda 20. Jashtë këtyre,
vlera minimale e serisë është 17, kurse vlera maksimale është 27. Koeficienti skewness i
serisë është 0,358 dhe vlera kurtosis është −0,778.

67
Tabela 2.7: Rezultatet e Testit të Metodës Frequencies

mosha

Cumulative
Frequency Percent Valid Percent Percent

Valid 17.00 1 5.0 5.0 5.0

18.00 2 10.0 10.0 15.0

19.00 2 10.0 10.0 25.0

20.00 3 15.0 15.0 40.0

21.00 3 15.0 15.0 55.0

22.00 2 10.0 10.0 65.0

23.00 2 10.0 10.0 75.0

24.00 1 5.0 5.0 80.0

25.00 1 5.0 5.0 85.0

26.00 2 10.0 10.0 95.0

27.00 1 5.0 5.0 100.0

Total 20 100.0 100.0

Në këtë tabelë, në kolonën Frequency është treguar se sa herën janë përsëritur
vlerat në lidhje me të dhënat e moshës dhe në kolonën Percent janë dhënë përqindjet e
këtyre vlerave.

Të njëjtat rezultate, mund t’i përfitojmë edhe përmes Analyze  Descriptive
Statistics, me ndihmën e menyve Descriptive, Explore dhe Crosstabs.

68
69
3. TESTIMI I HIPOTEZAVE

3.1. PËRCAKTIMI I HIPOTEZAVE
Testimi i hipotezave paraqet krahasimin e parametrave të një popullimi të definuar
më parë (p.sh. mesatarja e popullimit) me parametrat e përfituara nga masa e mostrës
(p.sh. mesatarja e mostrës). Në qoftë se vlera e mostrës është e afërt me vlerën parametrike
të testuar, hipoteza nuk refuzohet, pranohet drejtëpërsëdrejti. Por në qoftë se vlera e
mostrës është shumë e ndryshme nga vlera parametrike e testuar, hipoteza
drejtëpërsëdrejti refuzohet, nuk pranohet. Për të aplikuar testin e hipotezave, në fillim
duhet definuar hipotezën zero (null hypothesis) dhe hipotezën alternative (alternative
hypothesis).

3.1.1. HIPOTEZA ZERO (NULL HYPOTHESIS)
Hipoteza zero zakonisht shënohet në formën H0 dhe shpreh vlerën parametrike e
cila do të testohet (µ0). Hipoteza zero bazohet në parimin se “nuk ekziston dallim” ndërmjet
vlerës së përcaktuar parametrike me vlerën e realizuar. Hipoteza zero supozohet të jetë e
saktë përderisa të vërtetohet e kundërta. Për këtë aryse, gjatë krijimit të hipotezës zero
duhet të kihet kujdes që të jetë e plotë dhe e qartë në mënyrë statistikore. Për shembull, në
qoftë se dëshirohet të krijohet një hipotezë në lidhje me të ardhurat për kokë banori në një
nga krahinat e Kosovës, duhet të shprehet një numër i caktuar në hipotezën zero. Në këtë
rast, hipoteza zero mund të krijohet në këtë mënyrë.

H0: Të ardhurat për kokë banori të krahinës X janë 3,500€.

3.1.2. HIPOTEZA ALTERNATIVE (ALTERNATIVE HYPOTHESIS)
Hipoteza alternative zakonisht shënohet në formën HA dhe shpreh vlerën e cila
pranohet në rastet kur refuzohet hipoteza zero. Hipoteza alternative pranohet vetëm në
rastet kur hipoteza zero refuzohet.

Në shembullin e më lartë, hipoteza alternative e hipotezës zero duhet të shpreh se të
ardhurat për kokë banori të krahinës X nuk janë 3,500€. Në qoftë se do ta shkruanim në
formë statistikore, do të ishte:

H0: µ = µ0 H0: µ = 3,500 €

HA: µ ≠ µ0 HA: µ ≠ 3,500 €

Siç shihet edhe nga shembulli, hipoteza alternative përfshin vlera të cilat nuk marrin
pjesë në hipotezën zero. Pra, në shembull, në qoftë se pranohet hipoteza alternative duke e

70
refuzuar hipotezën zero, nënkuptohet se vlera e të ardhurave për kokë banori në krahinën
X është e ndryshme nga 3,500€.

3.2. TESTET STATISTIKORE
Rezultatet e një hipotezeje mund të jenë vetëm dy: hipoteza zero pranohet ose
refuzohet. Siç dihet nga statistika, vlerat e shpërndarjes normale mund të konvertohen në
rezultatet e Z-së dhe probabilitetet tregohen në tabelën e z-së. Prandaj, vlera e z-së është
një shembull i statistikave të testit. Për të i testuar hipotezat, duhet të zbulohet një numër
për të përcaktuar se në çfarë vlera hipoteza zero do të pranohet apo do të refuzohet. Kjo
vlerë zakonisht njihet si vlera kritike (critical value) apo vlera e tabelës, ngaqë shikohet nga
tabela. Në qoftë se vlera e llogaritur, është më e vogël se kjo vlerë kritike, hipoteza zero
refuzohet.

3.3. TESTET NJË DHE DY ANËSORE
Emërimi i testeve të hipotezave të krijuara si një dhe dy anësor lidhet me krijimin e
hipotezës alternative. Në qoftë se hipoteza alternative është si më poshtë, kemi të bëjmë me
testin një anësor të majtë.

H0: µ = k

HA: µ < k

Në hipotezën zero, mesatarja e popullimit është e barabartë me k (k paraqet çfarëdo
numri), kurse në hipotezën alternative është më e vogël se k.

Figura 1: Testi Një Anësor i Majtë

71
Në qoftë se në hipotezën alternative, mesatarja e popullimit specifikohet se është me e
madhe se k, këtë radhë kemi të bëjmë me testin një anësor të djathtë.

H0: µ = µ0

HA: µ > µ0

Figura 2: Testi Një Anësor i Djathtë

Në qoftë se hapësira e refuzimit është e ndarë në dy pjesë të barabarta në hipotezë,
kemi të bëjme me testin dyanësor. Në testin dyanësor, kemi të bëjmë me jobarazi në
hipotezën alternative.

Figura 3: Testi Dyanësor

72
3.4. GABIMI I LLOJIT TË PARË DHE TË DYTË
Lloji i Parë i Gabimit: Refuzimi i hipotezës zero kur ajo është saktë. Mundësia e
gabimit të llojit të parë tregohet me α.

Lloji i Dytë i Gabimit: Pranimi i hipotezës zero kur ajo është e pasaktë. Lloji i gabimit
tregohet me β.

Lloji i Parë dhe i Dytë i Gabimit: Për të i kuptuar koncepetet e gabimit të llojit të parë
dhe të dytë, në fillim duhet të kuptohet niveli i rëndësisë (significance level).

3.5. NIVELI I RËNDËSISË (α) DHE INTERVALI I BESIMIT (1−α)
Niveli i rëndësisë është një standart bazë statistikor për të refuzuar hipotezën zero.
Në testimin e hipotezave, në të njëjtën kohë α tregon nivelin e rëndësisë. Qëllimi i nivelit të
rëndësisë, është që të jap një bazë rreth dallimeve të krijuara ndërmjet vlerës së mostrës
dhe parametrave të popullimit që marrin pjesë në hipotezë dhe për të vendosur se dallimet
a janë krijuar rastësisht apo janë të rëndësishme në mënyrë statistikore.

Niveli i përzgjedhur i rëndësisë (α) siguron përcaktimin e zonave të pranimit dhe të
refuzimit në shpërndarjen e mostrës. Në departamentet e inxhinierisë, shëndetësisë etj,
zakonisht përdoret niveli i rëndësisë prej 0,05 ose mund të jenë edhe në vlera më të vogla
0,01, po ashtu mund të përdoren edhe vlera më të mëdha si 0.10 apo edhe më lartë. Ajo
çfarë duhet të kihet kujdes gjatë përzgjedhjes, janë çështjet apo kostot që mund të lindin
me rastin e refuzimit të një hipoteze të saktë zero. Pra, është i rëndësishëm Lloji i Parë i
Gabimit. Po ashtu, edhe rasti me pranimin e një hipoteze jo të saktë zero mund të shkaktojë
rezultate jo të sakta apo kosto shtesë. Këtu pra, kemi të bëjmë me Llojin e Dytë të Gabimit.
Për të shmangur situata të tilla, duhet të përzgjedhet një vlerë e lartë e α-së (p.sh. 0,25 apo
më shumë).

Niveli i rëndësisë mund të shpjegohet edhe përmes konceptit të intervalit të
besueshmërisë. Niveli i rëndësisë prej 5% shpreh intervalin e besueshmërisë prej 95%.
Pra, në qoftë se vlera e testuar është 95% brenda intervalit të besueshmërisë, hipoteza zero
nuk refuzohet. Mirëpo, në qoftë se bie në zonën e mbetur prej 5%, hipoteza zero refuzohet.
Kjo situatë, mund të shihet në figurën e mëposhtme.

73
Figura 4: Zonat e Pranimit dhe Refuzimit të Hopotezës (α = 0,05)

Në bazë të dy llojeve të gabimeve, ekzistojnë edhe dy lloje të vendimeve të sakta:
pranimi i hipotezës së saktë zero dhe refuzimi i hipotezës së gabuar zero. Mundësia e saktë
e pranimit është sa pjesa që e përmbush Lloji i Parë i Gabimit (niveli i rëndësisë). Në qoftë
se niveli i rëndësisë është 0,05, probabiliteti i pranimit të një hipoteze të saktë zeroje është
1,00−α=1,00−0,05=0,95. Në të njëjtën mënyrë, mundësia e refuzimit të një hipoteze të
gabuar zeroje është sa pjesa që e përmbush Lloji i Dytë i Gabimit (1−β). Këto mund të i
përmbledhim në këtë mënyrë:

Vendimi Hipoteza zero e saktë Hipoteza zero jo e saktë

Hipoteza zero pranohet Pranim i saktë (1-α) Lloji i dytë i gabimit (β)

Hipoteza zero refuzohet Lloji i parë i gabimit (α) Refuzim i saktë (1-β)

Shmangia e gabimeve të llojit të parë dhe të llojit të dytë shpesh është e mundur. Për
arsye se mund ta përcaktojmë vetë nivelin e rëndësisë, mund ta kontrollojmë mundësinë e
bërjes së gabimit të llojit të parë. Mënyra për ta kontrolluar llojin e dytë të gabimit është
zgjedhja e përshtatshme e madhësisë së mostrës. Në qoftë se madhësia e mostrës është
konstante, mundësia e paraqitjes së llojit të parë të gabimit ulet dhe rritet mundësia e
paraqitjes së llojit të dytë të gabimit. Në qoftë se tersi të cilin e sjell krijimi i llojit të parë të
gabimit është relativisht më i madh se tersi të cilin e sjell lloji i gabimit të dytë, niveli i
rëndësisë duhet të përcaktohet i ulët.

3.6. MADHËSIA E MOSTRËS
Gjatë shqyrtimit të hulumtimit, numri i njësive që marrin pjesë në zonën e
hulumtimit quhet madhësi e mostrës. Madhësia e mostrës është e rëndësishme si për nga
aspekti i besueshmërisë së hulumtimit, ashtu edhe për kryerjen me lehtësi të hulumtimit.
74
Në qoftë se madhësia e mostrës është më e madhe se sa që duhet të jetë, rriten kostot e
hulumtimit. Zbulimi i madhësisë së mostrës së hulumtimit lidhet me qëllimin e
hulumtuesit. Karakteristikat e hulumtimit, numri i ndryshoreve të përdorur në hulumtim,
karakteristikat e analizave që do të përdoren në hulumtim etj., ndikojnë në përzgjedhjen e
madhësisë së mostrës. Përveç kësaj, së bashku me këta faktorë, madhësia e mostrës mund
të zbulohet edhe në mënyrë kuantitative. Hulumtuesi, mund të përzgjedh një madhësi të
mostrës pasi më parë të përcaktojë gjerësinë e intervalit të besueshmërisë. Për ta llogaritur
madhësinë e mostrës, përdoret formula e mëposhtme.

n = (Z2σ2) / (X−µ)2

n: madhësia e mostrës

σ2: katrori i devijimit standart

Z2: katrori i vlerës Z e cila lexohet nga tabela z në lidhje me vlerën e α-së sipas
intervalit të përcaktuar të besueshmërisë.

(X−µ)2: vlera e mesatares X nga një distancë e caktuar nga µ.

Në rastet e aplikimeve kur nuk dihet varianca e popullimit (σ2), përdoret varianca e
mostrës (S2).

3.6.1. SHEMBULL APLIKIMI
Të parashikohet paga mesatare për orë e punëtorëve të një firme të tekstilit që do të
ketë devijim standart për 10 € nga mesatarja e vërtetë e popullimit, brenda 95% intervalit
të besueshmërisë. Duke u mbështetur në të dhënat e kaluara, devijimi standart i llogaritur
për bizneset është i njohur të jetë 50 €. Në këtë rast, sa duhet të jetë madhësia e mostrës?

Në fillim duhet të dihet se sa është vlera e z-së brenda intervalit të besueshmërisë
95%. Sipas kushteve të shpërndarjes normale, siç shihet edhe më poshtë, hapësira e cila do
të ndahet në tabelën z është 0,475. Vlera e dhënë e z-së në këtë zonë është 1,96.

75
n = (Z2 σ2) / (X−µ)2

n = (1,96)2(50)2 / (10)2

n = (3,8416) (2500) / 100

n = 96,04 96

76
77
4. TESTET E HIPOTEZAVE PARAMETRIKE
Teoria e mostrimit, përveç parashikimit të parametrave të popullimit, mundëson
edhe testimin e hipotezave statistikore. Testet i hipotezave përfshijnë temat për të
hulumtuar supozimet rreth të dhënave të një popullimi nga të dhënat e mostrës, në një
nivel të caktuar të rëndësisë (niveli i gabimit). Këto teste, duke përdor vlerën e njësisë së
mostrës, përcaktojnë nëse informacioni i prodhuar me vlerën e njohur më parë është
statistikisht i rëndësishëm. Në qoftë se ka dallim, rëndësia e këtij dallimi përcakton se a
është e mjaftueshme për të refuzuar hipotezën zero. Në rastin kur dallimi është i
rëndësishëm, hipoteza zero refuzohet dhe në rastin e kundërt pranohet.

Në testet e hipotezave, gjithmonë hipoteza e cila testohet është hipoteza zero.
Zakonisht, për të vendosur në lidhje me hipotezën zero, në të cilën shprehet mosndryshimi
i vlerës së njohur, me parametrat e saj të përcaktuar më parë, duhet bërë përgjithësimi
duke u bazuar në probabilitetin e informacionit të mostrës.2 Në këtë rast, është e
nevojshme që të dihet shpërndarja statistikore e mostrës e cila prodhon informacionin
rreth parametrës së caktuar. Me fjalë të tjera, informacioni në lidhje me parametrat e
popullimit, nuk prodhohet nga statistikat e përfituara nga të dhënat e mostrës, por nga
shpërndarja teorike në përputhje më këto statistika. Për shembull, sipas Teoremës së
Qendrës Kufitare (Central Limit Theorem), në qoftë se vëllimi i mostrës është i madh sa
duhet (n ≥ 30), mesataret e popullimit do të ndjekin shpërndarjen normale, pavarësisht
shpërndarjes së popullimit. Nga testet parametrike, do të shqyrtohet testi T, testi z dhe testi
ANOVA.

4.1. SUPOZIMET E TESTEVE PARAMETRIKE
 Të dhënat duhet të jenë intervale ose proporcionale.
 Të dhënat duhet të ndjekin shpërndarjen normale (vlerat e kurtosës dhe
pjerrësisë duhet të jenë ndërmjet -1 dhe +1).
 Variancat e grupeve duhet të jenë të barabarta (variancat mund të jenë të
ndryshme deri në katër, por jo më shumë).

Gjatë kryerjes së hulumtimit për të vendosur se cilat analiza të përdoren, duhet
përgjigjur tri pyetjeve të mëposhtme:

 Sa grupe të të dhënave kemi në duar?
 Si është lidhja ndërmjet grupeve (e varur – e pavarur)?
 Cilat supozime plotësohen?

2Hipotezat (sugjerimet) rreth popullimit mund të jenë rreth vlerës(ave) së(të) parametrave, një nivel i njohur
më parë, një vlerë standarte apo një vlerë e supozuar.

78
Testet që duhet të aplikohen sipas përgjigjeve alternative të këtyre pyetjeve janë
dhënë në tabelën e mëposhtme:

NUMRI I GJENDJA E TESTI I NEVOJSHËM
GRUPEVE GRUPEVE SUPOZIMET
2 Grup të pavarura Ne qoftë se plotësohen të tri Testi T i pavarur
kushtet
2 Grupe të Në qoftë se një nga kushtet nuk Testi Mann-Whitney U
pavarura është plotësuar (testi jo parametrik)
2 Grupet e varura Në qoftë se së paku supozimi 1 Testi T i varur
dhe 2 përmbushen
2 Grupe të varura Në qoftë se supozimi 1 dhe 2 Testi Wilcoxon
nuk plotësohen (testi jo parametrik)
2 Në qoftë se përdoren të dhëna Testi Katrori-Ki
nominale
3 dhe mbi Grupe të Në qoftë se përmbushen të tri Testi ANOVA
pavarura supozimet
3 dhe mbi Grupe të Në qoftë se një nga supozimet Testi Kruskal-Wallis
pavarura nuk përmbushet (testi jo parametrik)

4.2. TESTI T
Testi T përdoret për të hulumtuar se a ka dallim ndërmjet dy grupe të mostrave për
nga mesataret. Testi T përcakton se a ka dallim të konsiderueshëm mesatarja e një grupi
me mesataren e grupit tjetër. Në testin T, pika kritike është ‘dy’. Testi T gjithmonë krahason
dy mesatare apo dy vlera të ndryshme. Veçanërisht, testi T preferohet në rastet kur
madhësia e mostrës nuk është e madhe, kur nuk dihet devijimi standart i popullimit të
marrë nga mostra dhe kur parametrat e popullimit nuk përdoren në testin e hipotezave.

Teksa shqyrtohen dallimet e grupeve në nivelin e rëndësisë në testin T, është e
rëndësishme të kihen parasysh testet njëanësor (one-tailed) dhe dy anësor (two-tailed). Në
testin dy anësor, nuk është me rëndësi drejtimi pozitiv apo negativ i dallimit të mesatares
së një grupi për nga grupi tjetër. Por në testin një anësor, në një drejtim të caktuar (pozitiv
apo negativ) pritet që mesatarja e grupit të parë te jetë e ndryshme prej mesatares së
grupit të dytë. Për shembull, suksesi i një kampanjeje të reklamës, mund të shoqërohet me
rritjen në shitje. Kështuqë, këtu duhet të aplikohet testi t një anësor. Në raport me
hulumtimin mund të përdoret edhe testi t dy anësor. Për shembull, gjatë vlerësimit të
suksesit të provimit, rritja e notës (pozitive) apo ulja (negative) ngaqë do të jetë e
rëndësishme për analistin, do të ishte më e saktë që në vend të testit t një anësor, të
zgjedhet testi t dy anësorësh. Gjatë aplikimeve, duke e ndarë vlerën Sig 2-tailed të cilën e
përcakton SPSS-i, mund të kalkulohet vlera e një testit njëanësor. Me pak fjalë, vlera e testit
dy anësor, është sa dy herë vlera e tesit një anësor.

79
Në programin SPSS ofrohen tri alternativa të testit: Independent-Samples T Test
(testi t i dy mostrave të pavarura), Paired Samples T Test (testi t i dy mostrave të varura)
dhe One Sample T Test (test t një mostërsh). Testi më i përdor gjatë aplikimeve është testi i
dy mostrave të pavarura.

4.2.1. TESTI T I DY MOSTRAVE TE PAVARURA (INDEPENDENT-
SAMPLES T-TEST)
Testi T i dy mostrave të pavarura bën krahasiminn e dy grupeve të ndryshme të
mostrave. Anëtarët e dy grupeve janë të ndarë nga njëri-tjetri. Në mes të dy grupeve nuk
duhet të ketë anëtarë të përbashkët. (P.sh.: mashkull-femër, studentët e vitit të parë-
studentët e vitit të dytë, njohës i gjuhëve të huaja-mosnjohës i gjuhëve të huaja etj.).

4.2.1.1. SHEMBULL APLIKIMI
Duke përdor matësin e Likertit 5 shkallësh në një anketë të realizuar (5=plotësisht
pajtohem, 4=pajtohem, 3=pjesërisht pajtohem, 2=nuk pajtohem, 1=aspak nuk pajtohem)
kërkohet të përcaktohet se a është burim prestigji institucioni në të cilin punojnë të
anketuarit. Duke i ndarë pjesëmarrësit në dy grupe, meshkuj dhe femra, është bërë
krahasimi i komenteve në lidhje me pyetjen. Në këtë rast, duke e përdorur Testin T të dy
mostrave të pavarura, mund të krahasohen mesataret e dy grupeve (meshkuj-femra).

Tabela 4.1: Të Dhënat Përkatëse të Rastit

(Numri 1 përfaqëson Meshkujt, Numri 2 përfaqëson Femrat)

Gjinia Komenti Gjinia Komenti
1 3 2 4
2 4 2 4
1 3 2 5
2 4 1 2
1 3 1 3
1 4 1 2
2 4 2 3
1 1 1 3
2 4 2 4
2 4 2 5
1 3 2 4
1 3 2 5
2 5 2 4
1 4 1 3
1 3 2 4

80
Pasi të jenë futur të dhënat në SPSS, zgjidhen me radhë: Analyze, Compare Means,
Independent-Samples T Test. (Hapi 1)

Hapi 1: Zgjedhja e Independent-Samples T Testit nga Menyja

Pasi të jetë përzgjedhur, në vazhdim do të paraqitet ekrani i mëposhtëm. (Hapi 2)
Në këtë dritare në pjesën Test Variables vendoset kolona “komenti” e cila përfaqëson
përgjigjet e pjesëmarrësve dhe në pjesën Grouping Variables vendoset “gjinia”. Për të
vazhduar më tutje, bëhen rregullimet e nevojshme në pjesën Define Groups. (Hapi 3)

Hapi 2: Dritarja e Dialogut të Testit T

81
Hapi 3: Dritarja Për Përcaktimin e Grupeve, Independent Samples t-T

Pasi të shkruhen dy grupet e mostrës sonë (mashkull:1, femër:2) në kutizat Group 1
dhe Group 2 si 1 dhe 2, vazhdohet tutje me Continue. Pasi të klikojmë OK do të fitojmë
rezultatet e analizës si më poshtë.

Tabela 4.2: Rezultatet e Independent-Samples t-Testit

Group Statistics
Gjinia N Mean Std. Deviation Std. Error Mean
Interpretimi 1.00 14 2.8571 .77033 .20588
2.00 16 4.1875 .54391 .13598

Independent Samples Test
Levene's
Test for
Equality of
Variances t-test for Equality of Means
95% Confidence
Mean Std. Error Interval of the
Sig. (2- Differenc Differenc Difference
F Sig. t df tailed) e e Lower Upper
Interpretimi Equal .385 .540 -5.518 28 .000 -1.33036 .24109 -1.82421 -.83651
variances
assumed
Equal -5.392 23.019 .000 -1.33036 .24673 -1.84073 -.81998
variances not
assumed

82
Sipas rezultateve të analizës, mesatarja e 14 meshkujve pjesëmarrës është 2,8571
dhe mesatarja e 14 femrave pjesëmarrëse është 4,1875. Pra, femrat pajtohen me mendimin
se institucioni në të cilin punojnë është një burim prestigji, kurse meshkujt nuk pajtohen
me këtë mendim, mirëpo ata shihen të pajtohen pjesërisht (në anketë qenë përcaktuar
vlerat 2=pajtohem, 3=pjesërisht pajtohem. Mesatarja për meshkujt është 2,85). Shihet se
ekziston një dallim i rëndësishëm ndërmjet grupeve. Edhe rezultati i Sig (2-tailed)
(p=0,000) tregon që ekziston një dallim i rëndësishëm ndërmjet mesatareve të grupeve
(Vlera e Sig. është më e vogël se 0.05 brenda intervalit të besueshmërisë 95%). Në këtë
mënyrë, refuzohet hipoteza zero (null) dhe pranohet hipoteza alternative.

H0: Nuk ekziston dallim ndërmjet mesatareve të dy grupeve.

HA: Ekziston dallim ndërmjet mesatareve të dy grupeve.

Në këtë rast, mund të bëhet interpretimi se meshkujt dhe femrat mendojnë ndryshe
në çështjen se a e shohin si burim prestigji institucionin në të cilin punojnë dhe se femrat e
shohin si burim prestigji institucionin në të cilin punojnë.

Në fund të analizës komenti për pjesën Levene’s Test for Equality of Variances
duhet të bëhet sipas Equal variances assumed dhe Equal variances not assumed. Në
qoftë se shpërndarjet nuk tregojnë dallim në masë të rëndësishme, do të ishte më e saktë
që në vend të supozimit të equal variance (shpërndarje e barabartë) të përdoret supozimi
unequal variance (shpërndarje jo të barabarata). Në këtë fushë, vlera e Sig (0,540) tregon
se shpërndarja kërkon dallim dhe në mënyrë statistikore është më e përshtatshme që të
përdoret supozimi i unequal variance. Në shembullin tonë, për arsye se vlera e Sig (2-
tailed) është e kuptimtë (p=0,000) si për equal variance assumed ashtu dhe për variances
not assumed, nuk do të ketë ndonjë ndryshim në interpretimin e analizës.

4.2.2. TESTI T I DY MOSTRAVE TË VARURA
Në testin T të dy mostrave të pavarura përsëri bëjmë krahasimin e mesatareve.
Mirëpo, këtu nuk i kemi dy grupe të ndara. Analizat bëhen mbi grupin e njejtë të mostrës
(p.sh.: masim pritjet e grupit brenda periudhave të ndryshme kohore, sukseset, shpejtësitë
etj.).

4.2.2.1. SHEMBULL APLIKIMI
Një mësimdhënës dëshiron të mas suksesin ndërmjet notave të kollokfiumit dhe
provimit final të studentëve dhe pasi t’i fut notat e kollokfiumit dhe të provimit final të një
grupi prej 20 vetash në SPSS duke përdorur Paired Sampes T Test, mund të vërej dallimin
në rastin e suksesit.

83
Tabela 4.3: Të Dhënat Përkatëse Për Rastin

Testi Provimi Testi Provimi
45 75 77 92
67 73 81 90
60 85 56 70
55 72 45 60
48 56 68 87
62 73 75 95
48 76 49 90
63 80 88 96
72 95 67 80
50 82 87 90

Pasi të jenë futur të dhënat në SPSS, zgjidhen me radhë: Analyze, Compare Means,
Paired-Samples T Test. (Hapi 1)

Hapi 1: Zgjedhja e Paired Samples T Testit nga Menyja

84
Hapi 2: Dritarja e Dialogut Të Paired Samples T Test

Siç shihet nga dritarja, ndryshoret tona testi dhe provimi barten në pjesën Paired
Variables. Pasi të klikoket OK fitojmë rezultatet e mëposhtme.

Tabela 4.4: Rezultatet e Paired-Samples T Test

Paired Samples Statistics

Mean N Std. Deviation Std. Error Mean

Pair 1 Testi 60.3500 20 12.1277 2.7118

Provimi 75.9000 20 12.5526 2.8069

Paired Samples Correlations

N Correlation Sig.

Pair 1 Testi & Provimi 20 .412 .071

Paired Samples Test

Paired Differences

Std. 95% Confidence Interval Sig.
Std. Error of the Difference (2-
Mean Deviation Mean Lower Upper t df tailed)
Pair 1 Testi - Provimi -15.5500 13.3908 2.9943 -21.8171 -9.2829 -5.193 19 .000

85
Sipas rezultateve të analizës, mesatarja e notave të testit të 20 studentëve është
60,35 dhe mesatarja e provimit është 75,90. Vlera Sig (2-tailed) në intervalin 95% të
besueshmërisë është më e vogël se 0,05 (p=0,000). Pra, ekziston një dallim i rëndësishëm
ndërmjet mesatareve të notave të testit dhe provimit. Në këtë rast, ashtu si në rastin e parë
duke e refuzuar hipotezën zero (nuk ekziston dallim ndërmjet mesatareve), do të pranohet
hipoteza alternative (ekziston dallim ndërmjet mesatareve).

Korrelacioni ndërmjet notave të testit dhe provimit është 0,412. Në këtë rast, nuk
mund të thuhet se studentët të cilët kanë notë të lartë në test, do të kenë notë të lartë edhe
në provim dhe studentët që kanë notë të ulët në test, do të kenë notë të ulët edhe në
provim, sepse marrëdhënia (korrelacioni) ndërmjet tyre nuk është i lartë.

4.2.3. TESTI T I NJË MOSTREJE (ONE-SAMPLE T-TEST)
Testi T i një mostre përdoret për të përcaktuar nëse ekziston dallim në masë të
rëndësishme i mesatares që i përket një grupi të një mostreje, nga një vlerë të
parapërcaktuar. Personi i cili do të bëj analizën, krahason mesataren e grupit me vlerën e
përcaktuar apo të dëshiruar (p.sh.: vlerësimi i performancës, përcaktimi i nivelit të suksesit
të një grupi, pritjet e sportistëve nën apo mbi përpjekjet e treguara etj.).

4.2.3.1. SHEMBULL APLIKIMI
Në lidhje me të dhënat e më larta në shembullin e dytë, profesori pret që mesatarja e
provimit të studentëve të jetë 90. Duke aplikuar one sample t-test, mund të shqyrtohet nëse
mesatarja e klasës është ndryshme apo jo nga vlera e pritur 90.

Për të filluar me analizën, në SPSS zgjedhen me radhë: Analyze, Compare Means,
One-Sample T Test. (Hapi 1)

86
Hapi 1: Zgjedhja e One Sample T Testit nga Menyja

Hapi 2: Dritarja e Dialogut të One-Sample T Test

Në ekranin e mësipërm, në pjesën Test Variable(s) bartet ndryshorja, mesataren e
të cilës dëshirojmë ta vlerësojmë. Në pjesën Test Value shënohet vlera e dëshiruar e
mesatares. Në shembullin tonë, për arsye se profesori pret që notat e provimit të jenë 90,
është përshkruar kjo vlerë. Pasi të klikoket OK do të fitohen të dhënat e mëposhtme.

87
Tabela 4.5: Rezultatet e One-Sample T Test

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

Final 20 75,9000 12,5526 2,8069

One-Sample Test

Test Value = 90

95% Confidence Interval of the
Difference

t df Sig. (2-tailed) Mean Difference Lower Upper

Final -5.023 19 .000 -14.1000 -19.9748 -8.2252

Në fund shihet se mesatarja e notës finale është 75,90. Ndërkaq vlera e dëshiruar
ishte 90 (Test Value = 90). Kështu që ekziston një dallim i rëndësishëm ndërmjet
mesatares së realizuar dhe asaj të pritur. Vlera e Sig. (2-tailed) me 95% interval
besueshmërie është më e vogël se 0,05 (p=0,002). Në pjesën Mean Difference është dhënë
dallimi (−14,10) ndërmjet dy mesatareve. Mesatarja e finales është 14,10 pikë më e vogël
se ajo e pritur.

4.3. TESTI-Z
Testi z, ka për qëllim hulumtimin rreth parametrave të një popullimi të
çfarëdoshëm, duke përdorur të dhënat e mostrës, në një nivel të caktuar të rëndësisë (α).
Për aplikimin e testit z, popullimi duhet të ndjek shpërndarjen normale dhe duhet të dihen
parametrat e tij.

4.3.1. TESTI Z NJË MOSTËRSH

Hipotezat të cilat do të krijohen me supozimin se µ parametri i X-it në popullim
është i barabartë me një vlerë teorike si µ0, janë si më poshtë:

H0: µ = µ0

HA: µ ≠ µ0

HA: µ < µ0

HA: µ > µ0

88
Formula e testit z e cila do të përdoret për testimin e këtyre hipotezave është
kështu:

Z = (X - µ0 ) / σ / )

X = mesatarja e mostrës

µ0 = parametri i supozuar i popullimit

σ = devijimi standart i popullimit

n = numri i njësive të mostrës

4.3.1.1. SHEMBULL APLIKIMI
Një grup prej 1500 vetave kanë aplikuar një dietë të veçantë një mujore për
humbjen e peshës. Është vrojtuar se 29 veta të zgjedhur rastësisht nga ky grup në fund të
muajit të kenë humbur peshë mesatarisht 6,7 kg (kilogram). Sipas devijimit standart të
këtij grupi që është 7,1 kg, cila është mundësia që secili nga këta persona përgjatë një muaji
të kenë dhënë së paku 5 kg?

H0: µ < 5

HA: µ > 5

Z = (6,7 – 5) / 7,1 / 9

Z = 1,289

Për ta interpretuar vlerën e llogaritur, duhet të dijmë rregullin e mëposhtëm.

Zllogaritur < Ztabelës => H0 pranohet, HA refuzohet.

Vlera Z e tabelës në nivelin e rëndësisë α = 0,05 është 1, 4. (Vlera e Z-së e cila
korrespondon me zonën 0,4495 në tabelë është 1,64)

Ngaqë vlera e llogaritur e z-së (1,289), është më e vogël se vlera e z-së nga tabela
(1,64), H0 pranohet. Pra, shuma e humbur mujore e kilogramëve është më pak se 5 kg.

4.3.2. TESTI Z DY MOSTRASH
Hipotezat të cilat do të krijohen me rastin e supozimit se parametri µ1 është i
barabartë me një vlerë teorike si µ0 në popullimin e parë dhe se parameri si µ2 është i
barabartë më një vlerë teorike si µ0 në popullimin e dytë janë si më poshtë. Për aplikimin e
testit z dy mostrash, përsëri popullimet duhet të ndjekin shpërndarjen normale, por
popullimet duhet të jenë të pavarura nga njëra-tjetra.

89
H0: µ1 = µ2

HA: µ1 ≠ µ2

HA: µ1 < µ2

HA: µ1 > µ2

Për testimin se H0: µ1 = µ2 është HA: µ1 ≠ µ2 përdoret formula e mëposhtme.

Z=( 1 - )/ 1 +

4.3.2.1. SHEMBULL APLIKIMI
Devijimi standart i një përbërje të gjetur në gjak për donatorët e gjakut meshkujt
(dhënësit e gjakut) është 14,1 ppm (parts per million) dhe 9,5 ppm për donatorët femra.
Mesatarja e 75 meshkujve të zgjedhur rastësisht është 28 ppm dhe 50 femrave të zgjedhur
rastësisht është 33 ppm. Çfarë është mundësia që kjo përbërje e gjakut të jetë e njëjtë
(barbartë) me mesataren e popullimit, për meshkuj dhe femra?

H0: µ1 = µ2 ose H0: µ1 - µ2 = 0

HA: µ1 ≠ µ2 ose HA: µ1 - µ2 ≠ 0

Z = (28−33) / 14,1 / 5 + 9,5 /50

Z = −2,37

Z = 2,37 (Interpretimi i vlerës z bëhet duke marrë vlerën absolute).

Në nivelin α = 0,05 vlera e z-së nga tabela është 1,96. (Vlera e Z-së e cila
korrespondon me zonën 0,4750 në tabelë është 1,96)

Zllogaritur < Ztabelës => H0 pranohet, HA refuzohet.

Për shkak që 2,37 > 1,96, H0 refuzohet. Pra, mesatarja e popullimit për meshkuj dhe
femra nuk është e barabartë.

4.4. ANALIZA E VARIANCËS (ANOVA)
Kjo temë është shpjeguar në detaje në kapitullin e Analizës së Variancës (Kapitulli
7).

90
91
5. TESTET E HIPOTEZAVE JOPARAMETRIKE (NON – PARAMETRIC)
Përpara se të bëhet ndonjë analizë statistikore, në fillim duhet të shikohet se të
dhënat a janë kategorike (nominal, ordinale) apo të vazhdueshme (intervalore,
propocionale). Teksa në të dhënat kategorike aplikohen statistikat jo parametrike, në të
dhënat e vazhdueshme aplikohen statistikat parametrike. Në burimet statistikore, në
përgjithësi ekzistojnë dy lloje të ndryshme të teknikave statistikore: parametrike dhe jo
parametrike. Cili është dallimi ndërmjet këtyre dy grupeve? Përse është i rëndësishëm
dallimi? Testet parametrike (p.sh. testet T, analiza e variancës) prodhojnë supozime në
lidhje me mostrën e nxjerrë nga modeli. Këto supozime shpesh herë janë të lidhura me
formën e shpërndarjes së mostrës (p.sh. shpërndarjes normale). Kurse teknikat jo
parametrike, nuk kërkojnë kërkesa të tilla të rrepta dhe supozime në lidhje me
shpërndarjen e mostrës. Përkundër që janë më pak të paqarta, statistikat jo parametrike
kanë edhe disavantazhe. Testet jo parametrike, janë më të ndjeshme nga testet efektive
parametrike dhe për këtë arsye mund të jenë të pamjaftueshme për të gjetur dallimin
ndërmjet grupeve. Për të dhëna të përshtatshme dhe të fuqishme, është më e saktë që të
përdoren teknikat parametrike. Kurse teknikat joparametrike janë më të përshtatshme për
të dhënat nominale (kategorike) dhe ordinale (rendore). Teknikat joparametrike janë më të
përdorshme për mostra të vogla dhe për ato të dhëna të cilat nuk ndjekin supozimet e
testeve parametrike.

Testet joparametrike janë teste që mund të aplikohen në raste kur ka më pak
kushte. Për të mund të aplikuar pothuajse të gjitha testet parametrike, të dhënat duhet të
ndjekin së paku shpërndarjen normale, variancat duhet të jene homogjene dhe varësisht në
secilin test duhet të sigurohen kushte të ndryshme. Testet parametrike, janë më të
fuqishme dhe elastike për nga testet joparametrike. Përveç që ndihmojnë për të shqyrtuar
efektin e shumë ndryshoreve të pavarura mbi ndryshoren e varur, po ashtu ndihmojnë për
të vlerësuar edhe bashkëveprimet ndërmjet tyre.

Në përgjithësi, teksa me testet joparametrike mund të analizohen të dhënat
numerike nominale, ordinale apo të dhënat me shpërndarje jashtë normales, me testet
parametrike mund të bëhet analiza e të dhënave numerike e cila tregon shpërndarje
normale. Në anën tjetër, teksa aplikimi i testeve jo parametrike mbi të dhënat të cilat
ndjekin shpërndarje normale nuk njihet gabim, aplikimi i testeve parametrike mbi të
dhënat të cilat tregojnë shpërndarje ordinale apo jashtë normales është i papërshtatshëm.
Për të aplikuar secilin test, sigurisht duhet ditur mirë se cilat janë kushtet e nevojshme dhe
si të dhënat do të i përshtaten këtyre kushteve. Në qoftë se nuk dihet se a janë plotësuar
kushtet, përdorimi i testeve joparametrike në analizën e të dhënave është me i sigurt. Por,
në qoftë se aplikohen testet joparametrike pavarësisht së janë plotësuar kushtet e
nevojshme për testet parametrike, atëherë nuk do të jetë përfituar nga avantazhet e
veçanta të testeve parametrike.

92
5.1. TESTI KATRORI-KI
Testi Katrori-Ki është një test që përdoret dhe që zgjidhet shpesh për shkak të
lehtësisë së aplikimit në hulumtimet statistikore. Varësisht qëllimit dhe situatës, testi
Katrori-Ki përbëhet nga tri lloje: testi i përshtatshmërisë, testi i pavarësisë dhe testi i
homogjenitetit.

5.1.1. TESTI KATRORI-KI I PËRSHTATSHMËRISË DHE SHEMBULL
APLIKIMI
Testi Katrori-Ki i cili është një ndër testet që përdoret më së shumti brenda testeve
joparametrike, mat përshtatshmërinë e shpërndarjes së vlerave të grupit të mostrës
(shpërndarje normale etj.) me shpërndarjen e popullimit të përcaktuar në hipotezë. Për
arsye se kërkohet përshtatshmëria apo pajtueshmëria ndërmjet vlerës së pritur dhe vlerës
së përfituar, quhet “testi i përshtatshmërisë”. Gjatë përcaktimit të hipotezës zero
përcaktohet edhe se çfarë shpërndarje kanë të dhënat. Bëhet krahasimi i vlerës së
frekuencës së pritur me vlerën e frekuencës së vrojtuar. Në qoftë se ekziston pajtueshmëri
ndërmjet vlerës së pritur me vlerën e vrojtuar, hipoteza zero pranohet dhe në qoftë se nuk
ka pajtueshmëri duke e refuzuar hipotezën zero, pranohet hipoteza alternative.

SHEMBULL: Një firmë e automobilave dëshiron të mësoj se a ka dallim sasia e
porosisë së marrë nga tregtarët sipas muajve. Shuma e porosive të tregtarëve sipas muajve
(vlerat e vrojtuara) është dhënë më poshtë.

Tabela 5.1: Të Dhënat Përkatëse Për Shembullin

MUAJT SASIA E POROSISË
1 60
2 68
3 63
4 70
5 80
6 95
7 98
8 46
9 75
10 51
11 120
12 125

Pasi të jenë futur të dhënat në SPSS, në mënyrë që SPSS të mund të i përceptojë të
dhënat si frekuencë, fillimisht duhet të bëhet ponderimi i të dhënave duke shkuar te

93
menyja Data, Weight Cases. Në qoftë se aplikohet analiza e Katrorit-Ki pa u realizuar kjo
fazë, nuk do të arrihen rezultate të sakta.

Hapi 1: Përgatitja e të Dhënave Për Testin e Katrorit-Ki

Në ekranin e mëposhtëm zgjidhet butoni Weight cases by. Pas këtij veprimi në
kutizën e aktivizuar Frequency Variable vendoset “sasia e porosisë” e cila përfaqëson
sasinë e porosive të marrura sipas muajve. Pasi të klikohet OK funksioni do të përmbushet.
Pas kësaj, me lehtësi mund të aplikohet testi i Katrorit-Ki, pasi SPSS “sasinë e porosisë” do
ta vlerësojë si frekuencë.

94
Në këtë fazë, për ta bërë testin e Katrorit-Ki, në ekranin e SPPS-it zgjedhen me radhë
Analyze, Nonparametric Tests, Legacy Dialogs, Chi-Square.

Hapi 2: Përcaktimi i të Dhënave si Frekuenca

Hapi 3: Menyja e Katrorit-Ki

95
Hapi 4: Dritarja e Testit të Katrorit-Ki

Në ekranin e mësipërm (Hapi 4), fillimisht “sasia e porosisë” bartet në pjesën Test
Variable List. Në pjesën Expected Range duhet të jetë e përzgjedhur Get from data. Në
pjesën Expected Values në qoftë se nuk do të përcaktohet ndonjë kufi i ulët apo i lartë,
atëherë duhet të jetë e përzgjedhur All categories equal. Pjesa Values përdoret për të
kryer testin e përshtatshmërisë që ndjekin shpërndarjen binomale. Në një rast të tillë,
përzgjedhet butoni Values dhe futen vlerat e pritura në qelizë përmes butonit Add dhe
mund të futen të gjitha vlerat teorike. Për arsye se shembulli ynë paraqet një mostër që
ndjek shpërndarjen normale, të gjitha grupet pranohen të barabarta. Pra, analiza jonë do të
bëhet sipas përzgjedhjes All categories equal.

Në hapin 4, në qoftë se përzgjedhet butoni Options do të përfitohet ekrani i
mëposhtëm. Pasi të përzgjidhen butonat e duhura në këtë ekran, do të përfitohen
informacione përshkruese (mean, median, standart deviation etj.) rreth të dhënave. Më
poshtë do të shpejgohen në më detaje të dhënat e përfituara nga kjo arenë.

96
Hapi 5: Dritarja e Përzgjedhjeve

Në këtë ekran (Hapi 5) pasi të klikohet Continue dhe më pas OK, analiza do të jetë
përmbushur dhe rezultatet do të përfitohen si më poshtë.

Tabela 5.2: Rezultatet e Testit të Katrorit-Ki të Përshatshmërisë

Descriptive Statistics

Std. Percentiles

N Mean Deviation Minimum Maximum 25th 50th (Median) 75th

Sasia_e_porosisë 951 86.7392 25.38133 46.00 125.00 68.0000 80.0000 120.0000

Sasia_e_porosisë

Observed N Expected N Residual

46.00 46 79.3 -33.3
51.00 51 79.3 -28.3
60.00 60 79.3 -19.3
63.00 63 79.3 -16.3
68.00 68 79.3 -11.3
70.00 70 79.3 -9.3
75.00 75 79.3 -4.3
80.00 80 79.3 .8
95.00 95 79.3 15.8
98.00 98 79.3 18.8
120.00 120 79.3 40.8
125.00 125 79.3 45.8
Total 951

97
Test Statistics

Sasia_e_porosisë
a
Chi-Square 89.871
df 11
Asymp. Sig. .000

a. 0 cells (0.0%) have expected
frequencies less than 5. The minimum
expected cell frequency is 79.3.

Në pjesën e parë të rezutateve janë të paraqitura rezultatet e nxjerra nga butoni
Options. Sipas kësaj, sasia totale e porosive është N=951 dhe mesatarja (mean) 86,73. Në
mes të porosive, sasia më e vogël e porosive (minimum) është 46 dhe sasia më e lartë
(maximum) e porosive është 125.

Sipas analizës, janë nxjerrë vlerat e pritura dhe të vrojtuara të porosive (Observed
N dhe Expected N) si dhe Residual e cila tregon dallimin pozitiv apo negativ të vlerave të
vrojtuara dhe të pritura. Në total janë 951 porosi dhe sipas 12 muajve, vlera e pritur për
çdo muaj është llogaritur si 79,3. Qëllimi në testin e Katrorit-Ki është përcaktimi i dallimit
ndërmjet vlerave të realizuara të sasisë së porosive me vlerën e pritur (79,3). Pra, do të
testohet përshtatshmëria ndërmjet vlerës së vrojtuar dhe vlerës së pritur. Në këtë rast,
hipoteza zero dhe alternative mund të shkruhen si më poshtë:

H0: Nuk ekziston dallim ndërmjet sasisë së porosive sipas muajve.

HA: Ekziston dallim ndërmjet sasisë së porosive sipas muajve.

Në shembullin tonë, për arsye se vlera Sig. 0,000 (P<0,05), hipoteza zero refuzohet.
Ekziston një dallim i rëndësishëm ndërmjet sasisë së porosive sipas muajve. Kurse vlera e
Katrorit-Ki (Chi-Square) është përcaktuar si 89.871.

5.1.2. TESTI I KATRORIT-KI TË PAVARËSISË DHE SHEMBULL
APLIKIMI
Testi i Katrorit-Ki të pavarësisë përdoret për të shqyrtuar se a ekziston lidhje
ndërmjet dy apo më shumë grupeve të ndryshoreve. Pra, hulumtohet se a janë të pavarura
ndryshoret nga njëra-tjetra. Hipotezat tona:

H0: Ndryshoret janë të pavarura nga njëra-tjetra.

HA: Ndryshoret nuk janë të pavarura nga njëra-tjetra.

98
Për të aplikuar testin e Katrorit-Ki të pavarësisë, rezultatet e vrojtimeve duhet të
klasifikohen apo grupohen në formë të serive. Ky lloj klasifikimi quhet tabela e
paparashikuar. Kjo tabelë përbëhet nga rreshtat dhe shtyllat në të cilat vendosen
ndryshoret. Në qoftë se në tabelë numri i rreshtave (row) shfaqet me (r) dhe numri i
shtyllave (column) me (c), do të përfitohet një tabele kontigjente (rXc). Në këtë mënyrë,
klasifikimi kryq bëhet për të shqyrtuar lidhjen (varësinë apo jovarësinë) ndërmjet çfarëdo
elementi të rreshtit me elementin e shtyllës. Për këtë arsye, duhet të krahasohen
frekuencat e pritura (expected) me frekuencat e vrojtuara (observed) të çfarëdo elementi
të rreshtit apo shtyllës.

Për të llogaritur testin e Katrorit-Ki përdoret kjo formulë:

( - )
x2 = =1 =1

Në qoftë se X2 > X2α; (r-1) (c-1), hipoteza H0 refuzohet, hipoteza HA pranohet.

Në qoftë se X2 < X2α; (r-1) (c-1), hipoteza H0 pranohet, hipoteza HA refuzohet.

SHEMBULL: Personat e dy regjioneve të ndryshme janë klasifikuar sipas grupeve të
gjakut dhe janë përfituar rezultatet e mëposhtme. Sipas kësaj, testoni lidhjen në nivelin e
rëndësisë α=0,01 ndërmjet regjioneve dhe grupeve të gjakut. (Shënim: Të dhënat e këtij
shembulli janë marrë nga libri i Dr. Bülbül Ergün, “Çözümsel İstatistik”).

H0: Regjionet dhe grupet e gjakut janë të pavarura nga njëra-tjetra. (Nuk ekziston
lidhje ndërmjet regjioneve dhe grupeve të gjakut)

HA: Regjionet dhe grupet e gjakut nuk janë të pavarura nga njëra-tjetra. (Ekziston
lidhje ndërmjet regjioneve dhe grupeve të gjakut)

Tabela 5.3: Të Dhënat Përkatëse Për Shembullin

REGJIONET GRUPET E GJAKUT TOTAL
0 A B AB
Perëndim 30 145 68 37 280
Lindje 60 115 32 13 220
Total 90 260 100 50 500

Në fillim, duhet të gjejmë vlerën tablore të testit të Katrorit-Ki (X2). Për ta bërë këtë,
duhet ditur shkalla e lirisë.

Shkalla e lirisë: v = (r-1) (c-1), r = numri i rreshtave, c = numri i kolonave

Në shembullin tonë shkalla e lirisë është v = (2-1) (4-1)

99
Në shembull, vlera α ishte përcaktuar për 0,01. Në kërë rast, nga tabela e
shpërndarjes së X2, për vlerat v=3 dhe α=0,01, X2=11,34. Në qoftë se vlera të cilën do ta
llogarisim X2 është më e madhe se nga vlera në tabelë, hipoteza H0 do të refuzohet.
(X2>11,34 => H0REF).

Për të llogaritur vlerën e X2 nga formula, së pari duhet të llogaritet frekuenca e
pritur (Eij). Në tabelën e mëposhtë janë të përmbledhura llogaritjet e vlerave të vrojtuara
(Oij) dhe vlerave të pritura (Eij).

Tabela 5.4: Llogaritja e Frekuancave të Pritura

Regjionet Grupet e Gjakut Total
0 A B AB
Perëndim 30 (O11) E11 = 145 (O12) E12= 68 (O13) E13 = 37 (O14) E14 = 280
(280x90)/500 (280x260)/500 (280x100)/500 (280x50)/500
E11=50,4 E12=145,6 E13=56 E14=28
Lindje 60 (O21) E21 = 115(O22) E22 = 32 (O23) E23 = 13 (O24) E24 = 220
(220x90)/500 (220x260)/500 (220x100)/500 (220x50)/500
E21=39,6 E22=114,4 E23=44 E13=22
Total 90 260 100 50 500

( - )
x2 = =1 =1 = (30-50,4)2/50,4 + (145-145,6)2/145,6 + (68-56)2/56 + (37-
28)2/28 + (60-39,6)2/39,6 + (115-114,4)2/114,4 + (32-44)2/44 + (13-22)2/22 = 31,19

Për arsye se x2 = 31,19 > 11,34, hipoteza H0 refuzohet. Pra, ekziston lidhje ndërmjet
regjioneve dhe grupeve të gjakut.

Për ta zgjidhur këtë shembull përmes SPSS-it, bëhen aplikimet e poshtme me radhë.

Hapi 1: Futja e të Dhënave në SPSS

100
Pasi të futen të dhënat siç tregohet më lartë, njëjtë sikur të testi i Katrorit-Ki të
përshtatshmërisë, përmes menysë Data duke zgjedhur “Weight Cases”, bëhet njohja e
vlerave të frekuencës.

Hapi 2: Përgatitja e të Dhënave Për Testin e Katrorit-Ki

101
Hapi 3: Përcaktimi i të Dhënave si Frekuencë

Pas kësaj faze, për të bërë testin e pavarësisë së Katrorit-Ki, bëhen këto udhëzime
me radhë në ekranin e SPSS-it, Analyze, Descriptive Statistics, Crosstabs.

Hapi 4: Menya e Crosstabs

102
Hapi 5: Dritarja e Crosstabs

Në ekranin e mësipërm, pasi të përzgjidhet butoni “Statistics” zgjidhet “Chi-
Square” nga ekrani i ardhshëm.

Hapi 6: Dritarja e Testeve

103
Pasi të përfundohet ky funksion, do të përfitohen rezultatet e mëposhtme.

Tabela 5.5: Rezultatet e Testit të Katrorit-Ki të Pavarur

radha * kolona Crosstabulation
Count

kolona

1.00 2.00 3.00 4.00 Total

radha 1.00 30 145 68 37 280

2.00 60 115 32 13 220
Total 90 260 100 50 500

Chi-Square Tests

Asymp. Sig. (2-
Value df sided)
a
Pearson Chi-Square 31.191 3 .000
Likelihood Ratio 31.710 3 .000
Linear-by-Linear Association 28.126 1 .000
N of Valid Cases 500

a. 0 cells (0.0%) have expected count less than 5. The minimum
expected count is 22.00.

Siç shihet më lartë, vlera e llogaritur e X2 nga SPSS (Pearson Chi-Square) është e
njëjtë me vlerën tonë të cilën e llogaritëm me anë të formulës më parë (X2=31,19). Për
arsye se kjo vlerë ëshë më e madhe nga vlera e tabelës X2, ishte specifikuar se hipoteza H0
do të refuzohej. Të njëjtin interpretim mund ta bëjmë edhe për rezultatet e SPSS-it. Përveç
kësaj, për shkak se edhe vlera e Asym. Sig. (2-sided) është e rëndësishme (0,001<0,01),
bëhet interpretimi se ekziston një lidhje ndërmjet regjioneve dhe grupeve të gjakut.

5.1.3. TESTI I KATRORIT-KI TË HOMOGJENITETIT DHE SHEMBULL
APLIKIMI
Testi i Katrorit-Ki të homogjentitetit përdoret për të përcaktuar se dy mostra të
zgjedhura apo më shumë, të pavarura nga njëra-tjetra, a janë marrë nga i njëjti popullim
apo jo. Hipotezat tona:

H0: Mostrat janë përzgjedhur nga popullimi i njëjtë.

HA: Mostrat nuk janë përzgjedhur nga popullimi i njëjtë.

104
SHEMBULL: Një bankë dëshiron të shqyrtoj se gjendja e suksesit të studentëve të
Fakultetit të Ekonomisë dhe Administrimit, të cilët kanë hyrë në provimin e saj, a dallon
sipas departamenteve (departamentet a janë homogjene për nga aspekti i suksesit).
Gjendjet e suksesit dhe departamentet e studentëve të zgjedhur në mënyrë të rastësishme
nga pjesëmarrësit në provim janë dhënë në tabelën e mëposhtme. Sipas kësaj, në nivelin e
rëndësisë 5%, testoni se a janë homogjene departamentet për nga aspekti i suksesit.

H0: Departamentet janë homogjene për nga aspekti i suksesit.

HA: Departamentet nuk janë homogjene për nga aspekti i suksesit.

Tabela 5.6: Të Dhënat Përkatëse Për Shembullin

Situata e suksesit Departamentet
Administrim Ekonomiks Financa Administratë Total
Biznesi Publike
Të suksesshëm 30 36 24 20 110
Të pa suksëshëm 24 20 18 28 90
Total 54 56 42 48 200

Ky shembull zgjidhet në të njëjtën mënyrë edhe me forumlat e dhëna në testin e
Katrorit-Ki të pavarësisë, po ashtu edhe me ndihmën e SPSS-it.

Në fillim bëhet njohja e frekuencave nga menyja Data, “Weight Cases”. Më tutje,
për të bërë testin e Katrorit-Ki të homogjentitët, ndiqen veprimet e mëposhtme në ekranin
e SPSS-it, Analyze, Descriptive Statistics, Crosstabs.

Hapi 1: Nisja e Testit Ki-Kare

105
Hapi 2: Dritarja Funksionale Crosstabs Për Testin Ki-Kare

Në ekranin e mësipërm, pasi të përzgjidhet butoni “Statistics” zgjidhet “Chi-Square”
nga ekrani i ardhshëm.

Hapi 3: Zgjedhja e Katrorit-Ki Në Menynë Crosstabs

106
Pasi të përfundohet ky funksion, do të përfitohen rezultatet e mëposhtme.

Tabela 5.7: Rezultatet e Testit të Katrorit-Ki të Homogjenitetit
radha * kolona Crosstabulation
Count

kolona

1.00 2.00 3.00 4.00 Total

radha 1.00 30 36 24 20 110

2.00 24 20 18 28 90
Total 54 56 42 48 200

Chi-Square Tests

Asymp. Sig. (2-
Value df sided)
a
Pearson Chi-Square 5.483 3 .140
Likelihood Ratio 5.500 3 .139
Linear-by-Linear Association 2.368 1 .124
N of Valid Cases 200

a. 0 cells (0.0%) have expected count less than 5. The minimum
expected count is 18.90.

Siç shihet më lartë, vlera e llogaritur nga SPSS-i e Pearson Chi-Square është X2=5,48.
Vlera tabelore X2 gjendet nga tabela si 7,82, me shkallë të lirisë (v=3) dhe nivel të rëndësisë
(α=0,05). Për arsye se 5,48< ,8 , pranohet hipoteza H0. I njëjti rezultat arrihet edhe nga
vlera e Sig. në tabelën e mësipërme. Për arsye se vlera e Asym. Sig. (2-sided) p=0,140>0,05,
pranohet hipoteza H0. Pra, departamentet janë homogjene për nga aspekti i suksesit
(mostrat janë përzgjedhur nga popullimi i njëjtë).

5.2. TESTI RUNS DHE SHEMBULL APLIKIMI
Testi Runs përdoret zakonisht për të testuar rastësinë e një mostre. Megjithatë është
me rëndësi të specifikohet një pikë se testi Runs është i nevojshëm për të testuar rastësinë,
por është i pamjaftueshëm. Testi Runs bazohet në serinë e grupeve. Për shembull, seria
AAABBCCC paraqet një seri prej tre grupeve që përbëhet nga 3 shkronja A, 2 B dhe 3C.
AAAABBB është një seri prej dy grupeve dhe ABBBBA një seri prej tre grupeve.

SHEMBULL: Dëshirojmë të testojmë se a tregon rastësi seria e indeksit të industrisë
së prodhimit të metalit bazë për të dhënat përkatëse 2000Q1 – 2005Q1.

107
Tabela 5.8: Të Dhënat Përkatëse Të Shembullit

Vitet Indeksi i industrisë së
prodhimit të metalit bazë
2000Q1 93,5
2000Q2 107,2
2000Q3 105,8
2000Q4 102,9
2001Q1 97,1
2001Q2 100,4
2001Q3 94,5
2001Q4 97,3
2002Q1 92,2
2002Q2 109,3
2002Q3 111,4
2002Q4 115,3
2003Q1 112,3
2003Q2 121,4
2003Q3 122,4
2003Q4 122,9
2004Q1 126,4
2004Q2 135,8
2004Q3 137,7
2004Q4 134,7
2005Q1 135,1

Për ta aplikuar testin Runs në SPSS, ndiqen këto faza: Analyze, Nonparametrics
Tests, Legacy Dialogs, Runs.

108
Hapi 1: Menyja e Testit Runs

Në dritaren e testit Runs, indeksi i industrisë së prodhimit vendoset në pjesën Test
Variable List. Në zgjedhjen e Cut Point-it përcaktohet se cila vlerë do të mirret për bazë
për pikën e prerjes së serisë. Sipas kësaj, testi i rastësisë Runs bëhet sipas medianës,
modës, mesatares apo një pikë prerjeje të veçantë të përcaktuar.

109
Hapi 2: Dritarja e Testit Runs

Tabela 5.9: Rezultatet e Testit Runs
Runs Test

indeksi_i_prodhi
mit
a
Test Value 111.400
Cases < Test Value 10
Cases >= Test Value 11
Total Cases 21
Number of Runs 2
Z -4.029
Asymp. Sig. (2-tailed) .000

a. Median

Sipas të dhënave të përfituara, vlera e Z-së është -4,029 dhe vlera Sig. është 0,000.
Për arsye se –Z < –Z α/ hipoteza e formuluar zero refuzohet (H0: Të dhënat janë të
rastësishme). Pra, të dhënat nuk janë të rastësishme.

110
5.3. TESTI MAN-WHITNEY U DHE SHEMBULL APLIKIMI
Kjo teknikë përdoret për të testuar dallimin ndërmjet dy grupeve të pavaruara të
matura me të dhëna jointervalore. Ky test i cili aplikohet për mostrat e pavarura është një
test joparametrik alternativ i testeve T. Në vend të krahasimit të mesatareve të grupeve si
në testin T, testi Man-Whitney U krahason medianat e grupeve. Vlerat e ndryshoreve të
vazhdueshme i kthen në formë rendore brenda dy grupeve. Në këtë mënyrë, vlerësohet se a
ka dallim ndërmjet rendimit të dy grupeve. Për arsye se të dhënat kthehen në formë
rendore, nuk është me rëndësi shpërndarja e saktë e vlerave.

SHEMBULL: Një firmë e ka ndarë personelin e saj në dy grupe në mënyrë të
rastësishme 10 (A) dhe 11 (B), për të krahasuar dy tastiera të ndryshme të makinës
llogaritëse së prodhimit. Secilit grup i është dhënë makina me standarte të njëjta dhe grupi
A përdor llojin e parë të tastierës, kurse grupi B përdor llojin e dytë të tastierës. Koha
(sekondat) e përfundimit të një funksioni për secilin individ është si më poshtë:

Tabela 5.10: Të Dhënat Përkatëse Të Shembullit

GRUPI A GRUPI B
23 24
18 28
17 32
25 28
22 41
19 27
31 35
24 34
28 27
32 35
33

Sipas kësaj, përmes ndihmës së testit Mann-Whitney U, do të shikohet se a ka dallim
ndërmjet përdorimit të tastierës së parë dhe asaj të dytë.

Bëhet hyrja e të dhënave në SPSS për dy grupet e ndryshoreve. Në fillim, bëhet hyrja
e kohës së përfundimit të funksionit në makinën llogaritëse të individëve si një ndryshore e
vazhdueshme në SPSS. Më vonë për t’i njohur grupet, bëhet hyrja e një ndryshoreje
kategorike (grupi A=1, grupi B=2). Për të aplikuar testin Mann-Whitney U përmes SPSS,
ndiqet kjo procedurë: Analyze, Nonparametric Test, Legacy Dialogs, 2 Independent
Samples.

111
Në dritaren e hapur, ndryshorja përkatëse e kohës së përfundimit të funksionit A
vendoset në pjesën Test Variable List, kurse ndryshorja B e cila strehon vlerat kategorike
transferohet në pjesën Grouping Variable.

Hapi 1: Menyja e Testit Man-Whitney U

112
Hapi 2: Dritarja e Testit Man-Whitney U

Për arsye se për
vlerat e ekipit të
tastierës së parë
kemi përdorur 1
dhe ekipit të
dytë 2, në
kutizën Define
Groups njihen
me numrat 1
dhe 2.

Të dhënat të cilat duhet të shqyrtohen në rezultatet e prodhuara, janë nivelet e
rëndësisë, vlera Z dhe Asymp. Sig (2-tailed). Në qoftë se madhësia e mostrës është më e
madhe se 30, SPSS do të jap vlerën e z-approximation për të dhënat.

Tabela 5.11: Rezultatet e Testit Man-Whitney U

a
Test Statistics

A

Mann-Whitney U 16.000
Wilcoxon W 71.000
Z -2.753
Asymp. Sig. (2-tailed) .006
b
Exact Sig. [2*(1-tailed Sig.)] .005

a. Grouping Variable: B
b. Not corrected for ties.

Në shembullin tonë, është përfituar vlera Z për -2,753 dhe vlera e nivelit të
rëndësisë p për 0,006. Vlera e probabilitetit është sa vlera e (p) 0,05 ose më e vogël. Për
këtë arsye, rezultati është i rëndësishëm për nga ana statistikore dhe në mënyrë
statistikore ekziston një dallim ndërmjet dy grupeve në pikën e lehtësisë së përdorimit të
tastierave.

113
5.4. TESTI WALD-WOLFOWITZ DHE SHEMBULL APLIKIMI
Testi Wald-Wolfowitz përdoret për të testuar se dy mostra a vijnë nga universet të
cilat kanë shpërndarje të njëjtë në dy grupe. Për ta zbatuar këtë test, bëhet renditja duke i
bashkuar vlerat e dy mostrave. Numri i vogël i serive tregon se dy universet i takojnë
shpërndarjeve të ndryshme.

H0: Dy mostrat janë marrë nga universet me shpërndarje të njëjtë.

HA: Dy mostrat janë marrë nga universet me shpërndarje të ndryshme.

SHEMBULL: Në shembullin e mëposhtëm për testin Wald-Wolfowitz, do të testojmë
se indeksi i pagave reale a vjen nga universet të cilat i përkasin të njëjtës shpërndarje për
sektorin e Tekstilit dhe Veshjeve të periudhës 1998Q1 – 2004Q2. Një pikë e rëndësishme
që duhet të theksohet në këtë metodë është se për mostrat e vogla (n1,n2<20) duhet të
ndahen në rend zbritës dy mostrat e pavarura.

Tabela 5.12: Të Dhënat Përkatëse Të Shembullit

Sektori i Paga Sektori i Paga
Tekstilit Veshjeve
1 151,9 2 142,5
1 171,1 2 148,9
1 184,6 2 171,7
1 201,3 2 185,2
1 282,3 2 256,3
1 309,7 2 272,9
1 357,7 2 310,3
1 384,6 2 328,7
1 450,2 2 388,2
1 482,5 2 401,2
1 496 2 454,7
1 513,2 2 478
1 543,9 2 521,7
1 600,1 2 550,8
1 654,7 2 590,6
1 706,4 2 631,9
1 823,8 2 725,4
1 894,9 2 725,6
1 924,7 2 808,6
1 955,7 2 872,4
1 1065,7 2 1008,4
1 1066,9 2 995,8
1 1100,6 2 1022,7
1 1148,9 2 1058,7
1 1279,6 2 1205,7
1 1253,3 2 1232,5

114
Për të i njohur sektoret, bëhet hyrja e një ndryshoreje kategorike (1=Sektori i
Tekstilit, 2=Sektori i Veshjeve). Për të aplikuar testin Wald-Wolfowitz në SPSS, ndiqen këto
faza: Analyze, Nonparametric Test, Legacy Dialogs, 2 Independent Samples.

Në dritaren Two Independent Samples të dhënat e pagave sipas sektoreve
transferohen në pjesën Test Variable List dhe ndryshorja kategorike e sektoreve e cila bën
njohjen e tyre transferohet në pjesën Grouping Variable. Në seksionin e Define Groups,
për sektorin e tekstilit shkruhet numri 1 dhe për sektorin e veshjeve shkruhet numri 2 në
kutizat përkatëse. Kurse në pjesën Test Type, përzgjet testi Wald-Wolfowitz runs dhe
pastaj klikohet OK.

Hapi 1: Menyja e Testit Wald-Wolfowitz

115
Hapi 2: Dritarja e Testit Wald-Wolfowitz

Tabela 5.13: Rezultatet e Testit Wald-Wolfwitz

Frequencies

sektor N

paga 1.00 26

2.00 26

Total 52

a,b
Test Statistics

Asymp. Sig. (1-
Number of Runs Z tailed)
c
paga Exact Number of Runs 28 .280 .610

a. Wald-Wolfowitz Test
b. Grouping Variable: sektor
c. No inter-group ties encountered.

Sipas të dhënave të përfituara nga tabela, vlera p (Sig.) është 0.610 dhe në nivelin e
rëndësisë 0,05 hipoteza H0 pranohet, pra dy mostrat janë marrë nga universet me
shpërndarje të njëjta.

116
5.5. TESTI WILCOXON SIGNED RANK DHE SHEMBULL APLIKIMI
Testi Wilcoxon Signed Rank përdoret për vlerat të cilat përsëriten. Testi Wilcoxon
Signed Rank përdoret në qoftë se mostrat e hulumtimit maten në dy raste apo dy kushte të
ndryshme. Ky test është test joparametrik si alternativë e testit T. Por, në vend të
krahasimit të mesatareve, testi Wilcoxon i konverton të dhënat në korniza të ndryshme
kohore për t’i renditur dhe krahasuar (në formën Koha 1 dhe Koha 2) dhe teston se a ka
dallim në vlera ndërmjet këtyre dy periudhave kohore.

SHEMBULL: Dëshirohet të llogaritet se a ka dallim nga përgjigjet e sakta të provimit
të bërë përpara marrjes së kursit të statistikës me përgjigjet e sakta pas marrjes së kursit të
statistikës pas një muaji, të studentëve që studiojnë statistikë.

Tabela 5.14: Të Dhënat Përkatëse Të Shembullit
P1 P2
0 1
0 1
3 3
-7 4
9 5
9 5
-11 8
11 8
11 8
14 10
16 11
17 12
17 12
18 14

Për ta aplikuar testin Wilcoxon Signed Rank në SPSS, nga dritarja e menysë ndiqen
këto hapa: Analyze, Nonparametric Tests, Legacy Dialogs, 2 Related Samples. Fazat e
aplikimit bëhen si më poshtë.

117
Hapi 1: Menyja e Testit Wilcoxon Signed Rank

Në dritaren e hapur duke i zgjedhur të dy ndryshoret (Provimi1 dhe Provimi2),
barten në kutizën e Test Pair(s) List. Në kutizën Test Type përzgjedhet testi Wilcoxon.

118
Hapi 2: Dritarja e Testit Wilcoxon Signed Rank

Në rezultatet e prodhuara duhet të kihen parasysh dy vlera: vlera Z dhe vlera e cila e
tregon nivelin e rëndësisë Asymp. Sig. (2-tailed). Në qoftë se niveli i rëndësisë është më i
vogël se 0,05 apo është i barabartë, kjo na tregon se ekziston një dallim i rëndësishëm
statistikor ndërmjet dy vlerave.

Tabela 5.15: Rezultatet e Testit Wilcoxon Signed Rank

a
Test Statistics

provimi2 -
provimi1
b
Z -1.229
Asymp. Sig. (2-tailed) .219

a. Wilcoxon Signed Ranks Test
b. Based on positive ranks.

Në shembullin tonë, është përfituar vlera significant prej 0,219 dhe kjo është më e
madhe se 0,05. Sipas kësaj, nuk ka ndonjë dallim në numrin e përgjigjeve të sakta të
studentëvë në krahasim para kursit dhe pas.

119
5.6. TESTI KRUSKAL-WALLIS DHE SHEMBULL APLIKIMI
Testi Kruskal-Wallis (ndonjëherë njihet edhe si testi testi Kruskal-Wallis H), është
alternativë joparametrike e analizës së variancës një drejtimshe (One-way ANOVA). Kjo
analizë mundëson krahasimin ndërmjet tre apo më shumë grupeve, ndryshoret e të cilave
janë të vazhdueshme. Vlerat konvertohen në formë rendore dhe krahasohen mesataret
rendore për secilin grup. Kjo është një analizë ndërmjet grupeve, kështu që njerëz të
ndryshëm duhet të jetë në secilin prej grupeve të ndryshme.

SHEMBULL: Në tabelën e mëposhtme është dhënë numri i fjalive të marra nga faqet
e zgjedhura në mënyrë të rastësishme nga tre romanet rreth dedektivëve të tre
shkrimtarëve të ndryshëm.

Tabela 5.16: Të Dhënat Përkatëse Të Shembullit
Shkrimtari 1 Shkrimtari 2 Shkrimtari 3
13 43 33
27 35 37
26 47 33
22 32 26
26 31 44
37 33
54

Sipas kësaj, duke përdorur testin Kruskal-Wallis të përcaktohet se a ekziston dallim
ndërmjet shkrimtarëve për nga aspekti i gjatësisë mesatare të fjalive. Për ta aplikuar testin
Kruskal-Wallis në SPSS, zgjedhet nga menyja Analyze, Nonparametric Tests, Legacy
Dialogs, K Independent Samples.

Ndryshorja e vazhdueshme numri i fjalive (ndryshore e varur) merret dhe bartet
në kutizën Test Variable List, kurse ndryshorja kategorike shkrimtarët (ndryshore e
pavarur) bartet në kutizën Grouping Variable. Duke klikuar në butonin Define Range
bëhet njohja e radhës së vlerave kategorike minimum 1 dhe maksimum 3. Në pjesën Test
Type përzgjidhet testi Kruskal-Wallis H dhe pastaj klikohet OK.

120
Hapi 1: Menyja e Testit Kruskal-Wallis

Hapi 2: Dritarja e Testit Kruskal-Wallis

121
Nga rezultatet e përfituara, kemi nevojë për vlerat themelore, vlerën Chi-Square,
shkallën e lirisë (df) dhe nivelin e rëndësisë (Asymp. Sig).

Tabela 5.17: Rezultatet e Testit Kruskal-Wallis
Ranks

shkrimtarët N Mean Rank

fjalitë 1.00 5 3.40

2.00 6 12.08

3.00 7 11.64

Total 18

a,b
Test Statistics

fjalitë

Chi-Square 9.146
df 2
Asymp. Sig. .010

a. Kruskal Wallis Test
b. Grouping Variable:
shkrimtarët
Në qoftë se niveli i rëndësisë është më i vogël se 0,05, mund të thuhet se ekziston një
dallim statistikor në mënyrë të rëndësishme ndërmjet tre grupeve të ndryshores së
vazhdueshme. Renditja mesatare e tre shkrimtarëve mund të kontrollohet në kolonën
Mean Ranks në tabelën Ranks. Vlerat Mean Ranks tregojnë se cili shkrimtar ka shkallën
më të lartë të përgjithshme. Niveli i rëndësisë është 0,010 dhe është i vogël se vlera alfa
0,05. Kështu që, mund të themi se ekziston dallim ndërmjet këtyre shkrimtarëve të
romaneve të ndryshme rreth dedektivëve për nga aspekti i gjatësisë mesatare të fjalive.
Sipas vlerave Mean Ranks, shkrimtari i dytë ka numrin më të madh të gjatësisë së fjalive
dhe shkrimtari i parë ka numrin më të vogël të gjatësisë së fjalive.

5.7. TESTI FRIEDMAN DHE SHEMBULL APLIKIMI
Testi Friedman është alternativë joparametrike e analizës së variancës një
drejtimshe për vlerat të cilat përsëriten. Testi Friedman përdoret kur trajtohen mostrat e
njëjta në lidhje me temat dhe kur këto mostra maten në tri apo më shumë pika apo nën tri
kushte të ndryshme.

SHEMBULL: Një listë e cila përbëhet nga 12 emra, u lexohet me zë 10 studentëve të
cilët sapo kishin filluar trajnimin. Nga 12 emrat, katër emra u përkasin personave sportistë
(grupi A), katër të tjerë politikanëve kombëtarë dhe ndërkombëtarë (grupi B) dhe katër
emrat e fundit janë persona të njohur në nivelin kombëtar. Në fund të leximit, kërkohet nga

122
studentët që të përsërisin emrat me aq sa ata kishin mbajtur në mend. Përgjigjet e dhëna
janë si më poshtë.

Tabela 5.18: Të Dhënat Përkatëse Të Shembullit

ANËTARËT A B C D E F G H I J
GRUPI A 3 1 2 4 3 1 3 3 2 4
GRUPI B 2 1 3 3 2 0 2 2 2 3
GRUPI C 0 0 1 2 2 0 4 1 0 2

Për të provuar se a ka dallim ndërmjet niveleve të kujtesës së tre grupeve me testin
Friedman, zgjedhim Analyze, Nonparametric Tests, Legacy Dialogs, K Related Samples
nga programi SPSS.

Hapi 1: Menyja e Testit Friedman

Ndryshoret grupi A, grupi B, dhe grupi C të cilat paraqesin emrat e tre grupeve të
të famshëve barten në kutizën Test Variables. Në pjesën Test Type përzgidhet testi
Friedman.

123
Hapi 2: Dritarja e Testit Friedman

Tabela 5.19: Rezultatet e Testit Friedman

Ranks

Mean Rank

Grupi_A 2.70
Grupi_B 2.00
Grupi_C 1.30

a
Test Statistics

N 10
Chi-Square 10.889
df 2
Asymp. Sig. .004

a. Friedman Test

Rezultatet e përfituara tregojnë se ekziston një dallim i rëndësishëm ndërmjet
kujtesës së emrave të tre grupeve të ndryshme (Asymp. Sig.: 0,004<0,05). Përveç kësaj, nga
tabela Ranks kuptohet se grupi i emrave i të cilave është mbajtur në mend më së shumti
është grupi i sportistëve.

124
5.8. KORRELACIONI SPEARMAN’S RANK ORDER DHE SHEMBULL
APLIKIMI
Korrelacioni Spearman’s Rank Order (rho) përdoret për të llogaritur nivelin e
marrëdhënies ndërmjet dy ndryshoreve të vazhdueshme. Ky test është alternativë
joparametrike e koeficientit të korrelacionit të Pearsonit.

SHEMBULL: Që prej fillimit të përmirësimit të standarteve të shërbimeve të
higjienës dhe shëndetit vërehet një rritje e përgjithshme në jetëgjatësi gjatë shekullit 19
dhe 20. Rritja e jetëgjatësisë mesatare tregon dallim nga shteti në shtet, nga shoqëria në
shoqëri dhe madje nga familja në familje. Më poshtë të dhënat i përkasin një familjeje të
madhe rreth viteve të vdekjes dhe viteve të jetesës së personave. Të shqyrtohet se a ka
rritje në jetëgjatësinë mesatare për këtë familje.

Tabela 5.20: Të Dhënat Përkatëse Të Shembullit

Viti Mosha
1827 13
1884 83
1895 34
1908 1
1914 11
1918 16
1924 68
1928 13
1936 77
1941 74
1964 87
1965 65
1977 83

Në qoftë se vitet e vdekjes i shkruajme si x dhe moshën e vdekjes si y dhe bëjmë
renditjen e tyre, koeficienti pozitiv rho do të tregojë rritjen mesatare të jetëgjatësisë. Për të
parë lidhjen ndërmjet viteve të vdekjes dhe moshës së vdekjes përmes testit të koeficientit
të Spearmanit, në programin SPSS ndjekim këtë procedurë: Analyze, Correlate, Bivariate.

125
Hapi 1: Menyja e Korrelacionit të Spearman’s Rank Order

Të dy ndryshoret barten në pjesën Variables. Në pjesën Correlation Coeficients
përzgjedhet Spearman.

Hapi 2: Dritarja e Korrelacionit Spearman’s Rank Order

126
Tabela 5.21: Rezultatet e Korrelacionit Spearman’s Rank Order

Correlations

viti_i_vdekjes mosha_e_vdekjes

Spearman's rho viti_i_vdekjes Correlation Coefficient 1.000 .507

Sig. (2-tailed) . .077

N 13 13

mosha_e_vdekjes Correlation Coefficient .507 1.000

Sig. (2-tailed) .077 .

N 13 13

Niveli i rëndësisë i koeficientit të korrelacionit (rho) mund të ndikohet nga
madhësia e mostrës. Në një mostër të vogël (si p.sh. N=30), mund të përfitohet një vlerë e
korrelacionit jo shumë e fuqishme e cila nuk është më e vogël se vlera alfa 0,05 në nivelin e
rëndësisë. Në të njëjtën kohë, në mostrat e mëdha (si p.sh. N=100), vlera shumë të vogla të
korrelacionit mund të jenë të rëndësishme. Në këtë pikë, shumë autorë kanë specifikuar se
duhet përcaktuar niveli i rëndësisë, por nuk duhet theksuar. Në shembullin tonë, vlera e
përfituar e rho-së është 0,507 dhe shenja e koeficientit është pozitive. Kjo na tregon se me
kalimin e viteve është rritur edhe jetëgjatësia mesatare. Kur koeficienti i korrelacionit është
prej 0,50 – 1,00 konsiderohet të jetë një lidhje e lartë, prandaj kjo na tregon se ekziston një
lidhje e fuqishme ndërmjet këtyre dy ndryshoreve.

127
128
6. ANALIZA E KORRELACIONIT
Analiza e korrelacionit është një metodë statistikore e cila përdoret për të testuar
marrëdhënien lineare ndërmjet dy ndryshoreve apo mardhënien e një ndryshoreje me dy
apo shumë ndryshore, si dhe për matjen e shkallës së kësaj marrëdhënieje në qoftë se
ekziston.

Qëllimi në analizën e korrelacionit është që të shikohet se çfarë drejtimi do të marrë
ndryshorja e varur (y) kur të ndryshojë ndryshorja e pavarur (x).

Për ta bërë analizën e korrelacionit, çdo dy ndryshore duhet të jetë e vazhdueshme
dhe duhet të ndjekin shpërndarjen normale.

Në fund të analizës së korrelacionit, koeficienti i korrelacionit llogarit se a ekziston
një marrëdhënie lineare dhe në çfarë niveli. Koeficienti i korrelacionit shënohet me “r” dhe
merr vlerat prej −1 deri +1.

Më poshtë, në Figurën 6.1-a është paraqitur rasti kur ekziston një korrelacion
pozitiv ndërmjet dy ndryshoreve. Marrëdhënia është pozitive, në rastin kur me rritjen e
vlerave të ndryshores X kanë tendencë rritjeje edhe vlerat e ndryshores Y ose në rastin kur
vlerat e ndryshores X zvogëlohen, edhe vlerat e ndryshores Y kanë tendencë zvogëlimi.

Në Figurën 6.1-b është paraqitur rasti kur ekziston një korrelacion negativ.
Marrëdhënia është negative, në rastin kur me rritjen e vlerave të njërës ndryshore, vlerat e
ndryshores tjetër zvogëlohen.

Në Figurën 6.1-c është paraqitur rasti kur nuk ekziston korrelacion ndërmjet dy
ndryshoreve.

a. Korrelacion pozitiv b. Korrelacion negativ c. Nuk ekziston korrelacion

Figura 6.1: Rastet e Ndryshme të Korrelacionit

129
Korrelacioni nuk nënkupton marrëdhënien shkak-pasojë. Pra, kur ekziston
korrelacion ndërmjet ndryshoreve A dhe B në model, nuk nënkupton që A do të shkaktojë B
apo B do të shkaktojë A.

6.1. KOEFICIENTI I KORRELACIONIT TË PEARSON-IT
Koeficienti i korrelacionit të Pearsonit përdoret për të matur shkallën e
marrëdhënies së drejpërdrejtë të dy ndryshoreve të vazhdueshme. Me fjalë të tjera,
kërkohet përgjigja e pyetjes se a ekziston një marrëdhënie e rëndësishme ndërmjet dy
ndryshoreve.

Përpara se të llogaritet koeficienti i korrelacionit, duhet të kontrollohet a ekziston
marrëdhënie e drejtpërdrejtë përmes grafikut të shpërndarjes, sepse koeficienti i
korrelacionit duhet të llogaritet vetëm nëse ekziston marrëdhënie e drejtëpërdrejtë.

Koefcienti i korrelacionit shënohet me “r” dhe merr vlerat prej −1 deri +1. Në qoftë
se,

 r = −1; ekziston një marrëdhënie e plotë negative lineare. Pra, kur njëra
ndryshore rritet, tjetra zvogëlohet dhe anasjelltas, kur njëra zvogëlohet, tjetra
rritet. Në këtë rast, edhe trendi i grafikut do të ketë prirje negative.
 r = 1; ekziston një marrëdhënie e plotë pozitive lineare. Pra, kur njëra ndryshore
rritet, edhe tjera rritet dhe anasjelltas, kur njëra zvogëlohet, edhe tjetra
zvogëlohet. Në këtë rast, edhe trendi i grafikut do të ketë prirje pozitive.
 r = 0; nuk ekziston marrëdhënie ndërmjet dy ndryshoreve.

Koeficienti i korrelacionit të Pearsonit llogaritet në këtë mënyrë:

SSxy
r=
SSxx

Nga formula;
n
SSxy = i=1(xi − x ) (yi - y)
n
SSxx = i=1(xi − x )2
n
SSyy = i=1(yi − y )2

Interpretimi për koeficientin e korrelacionit ndërmjet dy ndryshoreve bëhet si më
poshtë:

130
r Lidhja
0,00 – 0,25 Shumë e dobët
0,26 – 0,49 E dobët
0,50 – 0,69 E mesme
0,70 – 0,89 E lartë
0,90 – 1,00 Shumë e lartë

6.2. KOEFICIENTI I KORRELACIONIT TË PJESSHËM
Në disa raste, gjatë kërkimit të lidhjes ndërmjet ndryshoreve teksa mirren nën
kontroll ndikimi i një sërë ndryshoreve, duhet shikuar edhe në lidhjet e tjera ndërmjet
ndryshoreve. Kjo metodë quhet korrelacioni i pjesërishëm. Me këtë metodë, kur të merret
nën kontroll ndryshorja e tretë, mundësohet shpjegimi i korrelacionit të dy ndryshoreve
tjera të mbetura. Arsyeja e përdorimit të kësaj metode është se shpjegon plotësisht
marrëdhënien ndërmjet dy ndryshoreve.

Numri i ndryshoreve të marrura nën kontroll përcakton shkallën e korrelacionit të
pjesshëm. Për ta aplikuar korrelacionin e pjesërishëm, ndryshoret duhet që të kenë lidhje
lineare. Korrelacioni i pjesërishëm përdoret për të zbuluar lidhjen e fshehur ndërmjet
ndryshoreve.

6.3. MATËSIT E TJERË TË MARRËDHËNIES
Në analizën e korrelacionit përdoren edhe matës të tjerë për të matur marrëdhënien
ndërmjet ndryshoreve, përveç koeficientit të korrelacionit të Pearsonit. Këto janë phi,
korrelacioni rendor i Spearmanit, Kendall’s Tau, koeficienti i probabilitetit dhe eta.

6.3.1. PHI
Koeficienti i phi-së përdoret për të kërkuar lidhjen ndërmjet dy ndryshoreve e cila
rezulton më përgjigjen po ose jo. Vlera r e përfituar në fund të analizës, paraqet
korrelacionin ndërmjet ndryshoreve, vëzhgimet e të cilave mund të jenë bipolare dhe ky
koeficient i korrelacionit quhet koeficienti i phi-së.

6.3.2. KORRELACIONIT RENDOR I SPEARMANIT
Në rastet kur shpërndarja e ndryshoreve është normale apo është afër normales
përdoret koeficienti i korrelacionit të Pearsonit, por në rastet kur shpërndarja e
ndryshoreve është larg normales përdoret korrelacioni rendor i Spearmanit. Në rastet kur
nuk përdoren të dhënat e plota të ndryshoreve ose në mungesë të vlerave absolute, është e

131
mundur renditja e të dhënave të disponueshme me numra sipas kualifikimeve të tyre. Në
qoftë se ndryshoret renditen në këtë mënyrë, në këtë rast përdoret korrelacioni rendor i
Spearmanit. Pra, korrelacioni rendor i Spearmanit është një version parametrik i
korrrelacionit të Pearsonit i cili përdor të dhënat rendore.

Korrelacioni rendor i Spearmanit, njëjtë si koeficienti i korrelacionit të Pearsonit
merr vlerat nga −1 deri në +1. Në qoftë se koeficienti i korrelacionit është +1, ekziston një
lidhje e përkryer pozitive lineare ndërmjet ndryshoreve, në qoftë se koeficienti i
korrelacionit është −1, ekziston një lidhje e përkryer negative lineare ndërmjet
ndryshoreve. Në rastin kur koeficienti i korrelacionit të Spearmanit është 0, kjo nënkupton
se nuk ekziston ndonjë lidhje lineare ndërmjet ndryshoreve.

6.3.3. KOEFICIENTI I PROBABILITETIT
Koeficienti i probabilitetit përdoret për të matur lidhjen ndërmjet dy ndryshoreve
nominale. Për llogaritjen e këtij koeficienti përdoret testi i Katrorit-Ki.

6.3.4. ETA
Teknika matëse ETA, përdoret për të matur lidhjen jolineare. Vlerat të cilat i merr
koefcienti janë ndërmjet 0 dhe +1. Mund të përdoret për secilin lloj të ndryshoreve.

6.4. SHEMBULLI APLIKIMI 1
Një kompani dëshiron të mat lidhjen ndërmjet shumës së shitjeve dhe të ardhurave
nga shitja. Shumat e shitjes dhe të ardhurat nga shitja janë dhënë më poshtë sipas viteve.

Hapi 1: Hyrja e Të Dhënave në SPSS

132
Pasi të futen të dhënat në SPSS, shkohet te menyja Analyze, Correlate. Këtu
ndeshemi me 3 përzgjedhje. Nga këto zgjedhet menyja Bivariate. (Përzgjedhjet e tjera do
të shpjegohen në detaje pas këtij shembulli, në këtë shembull do të elaborohet vetëm
metoda Bivariate).

Hapi 2: Menyja e Korrelacionit Bivariate

Nga dritarja e hapur, ndryshoret e shumës së shitjeve dhe të ardhurave nga shitja
barten në pjesën Variables. Më vonë, bëhen përzgjedhjet e bëra më poshtë.

Fare në fund, duke klikuar në butonin Options do të hapet dritarja e përzgjedhjeve.
Në dritaren e hapur, në pjesën Missing Values përzgjedhet Exclude Cases Listwise dhe
pastaj me radhë klikohet Continue, OK dhe do të kryhet analiza.

133
Hapi 3: Dritarja e Korrelacionit Bivariate

Hapi 4: Dritarja e Përzgjedhjeve

Në fund të analizës, SPSS do të jap rezultatet e mëposhtme.

134
Tabela 6.1: Rezultatet e Analizës së Korrelacionit
b
Correlations

shuma_e_shitje të_hyrat_nga_s
ve hitja
**
shuma_e_shitjeve Pearson Correlation 1 .987

Sig. (2-tailed) .000
**
të_hyrat_nga_shitja Pearson Correlation .987 1

Sig. (2-tailed) .000

**. Correlation is significant at the 0.01 level (2-tailed).
b. Listwise N=10

Sipas kësaj, ekziston një lidhje e fuqishme, pozitive dhe e rëndësishme ndërmjet
shumës vjetore së shitjeve dhe të ardhurave vjetore nga shitjet. Koeficienti i korrelacionit
është llogaritur të jetë r=0,987. Nga kjo, mund të themi se me rritjen e shumës së shitjeve
janë rritur edhe të hyrat nga shitja.

Kjo lidhje, mund të shikohet edhe përmes diagramit të shpërndarjes. Në Figurën 6.2,
mund të shihet diagrami i shpërndarjes, i cili tregon lidhjen ndërmjet shumës vjetore të
shitjeve dhe të hyrave vjetore nga shitja. (Për ta bërë diagramin e shpërndarjes nga menyja
e SPSS-it, shkohet te Graphs, Legacy Dialogs, Scatter/Dot. Më pas zgjedhet Simple
Scatter, Define. Në boshtin Y vendoset ndryshorja e varur, në boshtin X vendoset
ndryshorja e pavarur dhe shtypet butoni OK.).

Figura 6.2: Diagrami i Shpërndarjes

135
Vlera e r2 është llogaritur për 0,9742. (Kjo në të njëjtën kohë është vlera në katror e
koeficientit të korrelacionit 0,987). Pra, 97,42% e ndryshimeve në të ardhurat vjetore nga
shitja, arsyetohet nga shuma vjetore e shitjeve. Mund të themi edhe të kundërtën e kësaj
për nga ana e teorisë, pra 97.42% e ndryshimit në shumën e shitjeve mund të shpjegohet
nga ndryshimi në të ardhurat nga shitja. Më fjalë të tjera, një analizë e këtillë, nuk tregon
marrëdhnien shkak-pasojë, mirëpo jep idenë se në çfarë niveli dhe në çfarë drejtimi do të
ndryshojnë ndryshoret.

6.5. SHEMBULL APLIKIMI 2
Të shqyrtohet lidhja ndërmjet të ardhurave vjetore, kohës së trajnimit, përvojës së
punës dhe moshës së 20 punëtorëve të një kompanie. Të dhënat përkatëse të punëtorëve
janë dhënë më poshtë.

Tabela 2: Të Dhënat Përkatëse Të Shembullit
Të ardhurat Vite Vitet e Mosha
vjetore trajnimi përvojës
(10,000 TL)
5,0 2 9 29
9,7 4 18 50
28,4 8 21 41
8,8 8 12 55
21,0 8 14 34
26,6 10 16 36
25,4 12 16 61
23,7 12 9 29
22,5 12 18 64
19,5 12 5 30
21,7 12 7 28
24,8 13 9 29
30,1 14 12 35
24,8 14 17 59
28,5 15 19 65
26,0 15 6 30
38,9 16 17 40
22,1 16 1 23
33,1 17 10 58
48,3 21 17 44

Ndryshoret: të ardhurat vjetore, trajnimi, mosha dhe përvoja.

Në SPSS, shkohet tek Analyze, Bivariate. Këtu kemi 3 metoda të ndryshme.

136
6.5.1. METODA BIVARIATE
Metoda Bivariate, përveç shkallës së rëndësisë bën llogaritjen edhe të koeficientit të
korrelacionit të Pearsonit, koeficientit të Spearmanit si dhe llogarit Kendall’s tau-b.

Hapi 1: Menyja e Korrelacionit Bivariate

Hapi 2: Dritarja e Korrelacionit

137
Në hapin 2, në pjesën Test of Significance ndeshemi me dy zgjedhje: two tailed
dhe one tailed.

Two-tailed: Kjo hipotezë përdoret në qoftë se hipotezat e krijuara kanë orientim të
dyfishtë, pra H0 (null) në formën hipoteza ëshë e barabartë, HA (alternative) në formën
hipoteza nuk është e barabartë. Për shembull, në qoftë se kërkohet përgjigja se studentët e
departamentit të administrim biznesit a i kanë notat e financës të njëjta me studentët e
departamentit të ekonomiksit, hipotezat të cilat do të krijohen duhet të jenë në këtë
mënyrë:

H0: µadministrimbiznesi = µekonomiks ose µadministrimbiznesi - µekonomiks = 0

HA: µadministrimbiznesi ≠ µekonomiks ose µadministrimbiznesi - µekonomiks ≠ 0

One-tailed: Kjo hipotezë përdoret në qoftë se hipotezat e krijuara kanë orientim një
drejtimësh, pra H0 (null) në formën hipoteza është më e madhe ose e barabartë, ose është
më e vogël ose e barabartë, HA (alternative) hipoteza është më e vogël ose më e madhe. Për
shembull, në qoftë se kërkohet përgjigja se studentët e departamentit të administrim
biznesit a i kanë notat e financës më të mëdha për nga studentët e departamentit të
ekonomiksit, hipotezat të cilat do të krijohen duhet të jenë në këtë mënyrë:

H0: µadministrimbiznesi ≤ µekonomiks ose µadministrimbiznesi - µekonomiks ≤ 0

HA: µadministrimbiznesi > µekonomiks ose µadministrimbiznesi - µekonomiks > 0

Gjatë përcaktimit të fuqisë së lidhjes ndërmjet ndryshoreve, zakonisht përdoret
Two-tailed.

Më vone duke klikuar në butonin Options, hapet dritjarja e përzgjedhjeve.

Hapi 3: Dritarja e Përzgjedhjeve

138
Në pjesën Missing Values përballemi me dy përzgjedhje.

Exclude cases pairwise: I konsideron ndryshoret të cilat nuk kanë mungesë të
dhënash.

Exclude cases listwise: I konsideron të dhënat e disponueshme. (Preferohet
përdorimi i kësaj).

Tabela 6.3: Rezultatet e Korrelacionit Bivariate

b
Correlations

të_ardhurat trajnimi përvoja mosha
**
të_ardhurat Pearson Correlation 1 .846 .266 .102

Sig. (2-tailed) .000 .258 .669
**
trajnimi Pearson Correlation .846 1 -.107 .098
Sig. (2-tailed) .000 .654 .680
**
përvoja Pearson Correlation .266 -.107 1 .676
Sig. (2-tailed) .258 .654 .001
**
mosha Pearson Correlation .102 .098 .676 1

Sig. (2-tailed) .669 .680 .001

**. Correlation is significant at the 0.01 level (2-tailed).
b. Listwise N=20

Në fillim, në qoftë se i formulojmë hipotezat:
H0: Nuk ekziston lidhje ndërmjet ndryshoreve.
HA: Ekziston lidhje ndërmjet ndryshoreve.

Në fund të analizës së korrelacionit janë dhënë koeficientët e korrelacionit ndërmjet
ndryshoreve. Sipas kësaj, në nivelin e rëndësisë 5%, vlerat më të vogla se 0,05 teksa
tregojnë se nuk ekzsiton lidhje ndërmjet ndryshoreve, pra hipoteza H0 teksa refuzohet,
vlerat më të mëdha se 0,05 tregojnë se ekziston lidhje ndërmjet ndryshoreve, pra hipoteza
HA pranohet. Në tabelën 6.3, numrat e shënuar me asteriks (**) tregojnë se ekziston
korrelacion ndërmjet ndryshoreve në nivelin e rëndësisë 1%. Sipas kësaj, shihet se
ekziston një korrelacion i lartë dhe pozitiv prej 0,846 ndërmjet të ardhurave vjetore dhe
trajnimit, një korrelacion i dobët dhe pozitiv prej 0,266 ndërmjet të ardhurave vjetore dhe
përvojës dhe një korrelacion shumë i dobët por pozitiv prej 0,105 ndërmjet të ardhurave
vjetore dhe përvojës. Sipas këtij rezultati, korrelacioni më i lartë është ndërmjet
ndryshoreve të të ardhurave vjetore dhe trajnimit. Përndryshe, koeficientët e
korrelacioneve ndërmjet ndryshoreve të trajnimit, moshës dhe përvojës shihet të jenë të
ulët (trajnim – përvojë −0,107, trajnim – moshë 0,098). Kurse koeficienti i korrelacionit

139
ndërmjet përvojës dhe moshës me një vlerë të lartë prej 0,676, është i përshtatshëm sipas
pritjeve tona.
6.5.2. METODA E PJESSHME (PARTIAL)
Metoda e pjesshme e korrelacionit mundëson llogaritjen e lidhjes lineare ndërmjet
dy ndryshoreve duke marrë nën kontroll ndikimin e një apo shumë ndryshoreve. Me fjalë
të tjera, gjendet një marrëdhnie e qartë ndërmjet dy ndryshoreve.
Hapi 1: Menyja e Korrelacionit të Pjesërishëm (Partial)

Hapi 2: Dritarja e Korrelacionit të Pjesërishëm (Partial)

140
Hapi 3: Dritarja e Përzgjedhjeve

Tabela 6.4: Rezultatet e Korrelacionit të Pjesshëm (Partial)

Correlations

Control Variables të_ardhurat trajnimi përvoja

mosha të_ardhurat Correlation 1.000 .844 .268

Significance (2-tailed) . .000 .267

df 0 17 17

trajnimi Correlation .844 1.000 -.236

Significance (2-tailed) .000 . .331

df 17 0 17

përvoja Correlation .268 -.236 1.000

Significance (2-tailed) .267 .331 .
df 17 17 0

Në tabelën 6.4, nga ndryshoret e pavarura, ndryshorja e moshës është marrë nën
kontroll. Sipas kësaj metode të pjesshme, ekziston një korrelacion i fuqishëm pozitiv
ndërmjet trajnimit dhe të ardhurave (0,844).

Lidhja ndërmjet trajnimit dhe të ardhurave ishte më e lartë (r=0,846) përpara se të
merrej ndryshorja e moshës nën kontroll (Tabela 6.3). Kur ndryshorja e moshës të mirret
nën kontroll, kjo marrëdhnie do të zvogëlohet (r=0,844).

6.5.3. METODA DISTANCES
Kjo metodë ka për qëllim që të mas distancën ndërmjet ndryshoreve. Në metodën
Distances dëshirohet që koeficienti i korrelacionit ndërmjet ndryshoreve të jetë i ulët.

141
Hapi 1: Menyja e Korrelacionit Distances

Pasi të hapet dritarja e Distances, të gjitha ndryshoret barten në pjesën Variables.

Hapi 2: Dritarja e Distances

142
Më pas klikohet në butonin Measures.

Hapi 3: Dritarja e Measures

Në dritaren Measure, përzgjedhet Interval nga tri përzgjedhjet dhe nga këtu
përzgjedhet Euclidean distances. Më poshtë te Transform Values, në pjesën Standardize
duhet të jetë e përzgjedhur None dhe pastaj klikohet butoni Continue.

Tabela 6.5: Rezultatet e Metodës Distance

Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent

20 100.0% 0 0.0% 20 100.0%

143
Proximity Matrix

Euclidean Distance

të_ardhurat trajnimi përvoja mosha

të_ardhurat .000 62.164 68.035 105.444
trajnimi 62.164 .000 32.465 147.482
përvoja 68.035 32.465 .000 139.682
mosha 105.444 147.482 139.682 .000

This is a dissimilarity matrix

Sipas të dalurave në fund të analizës, teksa distancat ndërmjet të ardhurave vjetore
me trajnimin dhe përvojën janë pothuajse të njëjta (62,164 dhe 68,035), është një distancë
më e largët me moshën (105,444). Teksa ekziston një distancë e afërt ndërmjet trajnimit
dhe përvojës (32,465), ndryshorja e moshës është e largët nga trajnimi (147,482) dhe nga
përvoja (139,862). Ekzistimi i distancave të largëta të ndryshoreve të pavarura zvogëlon
nivelet e shpjegimit të ndryshores së varur. Siç e kemi parë edhe në analizat e tjera të
mëparshme, ndryshorja e moshës është ndryshorja e cila e ndikon më së paku ndryshoren
e varur (të ardhurat vjetore).

144
145
7. ANALIZA E VARIANCËS (ANOVA – MANOVA)
Analiza e variancës përdoret për të testuar hipotezën në lidhje me atë se a ekziston
dallim ndërmjet dy apo më shumë mesatareve. Për të testuar se a ekziston një dallim i
rëndësishëm ndërmjet dy mesatareve përdoret edhe testi t, por në rastet e krahasimit të
më shumë se dy mesatereve, testi t mund të krijojë probleme. Sado që të jetë e mundur që
me testin t të krahasohen më shumë se dy mesatare në formën dy nga dy ndaras, kjo
mënyrë do të dërgojë në rritjen e madhe të gabimit të llojit të parë. Sa më shumë që të
testohet, lloji i parë i gabimit aq më shumë rritet. Analiza e variancës është një test që
përdoret për të krahasuar më shumë se dy mesatare, pa u rritur niveli i gabimit të llojit të
parë. Në analizën e variancës, hipoteza H0 është në formën se të gjitha mesataret e
popullimit janë të njëjta,

H0 = µ1 = µ2 = µ3 = ... µn Pra nuk ekziston dallim ndërmjet mesatareve

HA: Ekziston dallim se paku ndërmjet dy mesatareve.

Hipoteza H0 testohet me anë të krahasimit të dy vlerave të variancave. E para nga
këto është varianca brenda grupeve (Mean square error MSE). MSE paraqet vlerësimin e
variancës (σ2), qoftë apo jo e saktë hipoteza H0. Vlerësimi i dytë bazohet në variancat e
mesatareve të grupeve (Mean Square Between MSB). MSB është vlerësim i variancës (σ 2)
vetëm nëse hipoteza H0 është e saktë. Në qoftë se hipoteza H0 është gabim, MSB vlerëson
një numër që është më i madh se σ2. Përfundimisht, testi i hipotezave në analizën e
variancës mund të shkruhet në këtë formë:

Në qoftë se MSE dhe MSB janë përafërsisht të sakta  Hipoteza H0 e saktë

Në qoftë se MSB është më e madhe se MSE  Hipoteza H0 e pasaktë

Siç shihet edhe nga këtu, qëllimi themelor në analizën e variancës është që të
kuptohet se a ekziston dallim ndërmjet mesatareve. Për arsye se për të arritur në
përfundim përdoren dy lloje të krahasimeve të variancave është quajtur analiza e
variancës. Testimi i hipotezës bëhet sipas ekzistimit të dallimit ndërmjet variancës të
marrë ndërmjet grupeve dhe variancës së marrë brenda grupeve.

Në analizën e variancës, përdoret vlera F për të testuar hipotezat.

MSB
F=
MSE
Në qoftë se vlera e F-së është më e vogël se vlera e nivelit të dëshiruar të rëndësisë
(vlera e tabelës), hipoteza H0 nuk refuzohet. Pra, arrihet në përfundim se nuk ekziston një
dallim i rëndësishëm ndërmjet mesatareve. Në qoftë se vlera e F-së, është më e madhe se

146
vlera e tabelës, hipoteza H0 refuzohet. Në këtë rast, gjykohet se ekziston një dallim i
rëndësishëm ndërmjet mesatareve.

Në analizën e variancës bëhet fjalë për ndryshoren e varur dhe të pavarur.
Ndryshoreve të pavarura u jepet emri faktorë. Kërkohet ndikimi i faktorëve mbi
ndryshoret e varura. Ndryshorja e pavarur duhet të jetë kategorike, kurse ndryshorja e
varur duhet të jetë metrike. Në qoftë se do ta shpjegonim këtë përmes një shembulli:

Ndryshorja e Pavarur: Gjinia (Mashkull, Femër)

Ndryshorja e Varur: Niveli i Përdorimit të Kompjuterit

Këtu, ndryshorja e pavarur gjinia ka karakterstikë kategorike si dhe kjo ndryshore
ka dy grupe: mashkull dhe femër. Ndryshorja e varur është një ndryshore e cila mat
nivelin e përdorimit të kompjuterit të personave. Në këtë shembull, analiza e variancës
përdoret për të hulumtuar se a ekziston ndonjë dallim në nivelin e përdorimit të
kompjuterit ndërmjet meshkujve dhe femrave. Në qoftë se e vëreni, ndryshorja e pavarur
përbëhet nga dy grupe. Në këtë rast mund të përdoret edhe testi t i cili hulumton dallimin
ndërmjet mesatareve të dy grupeve. Në raste të këtilla, analiza e variancës dhe testi t do të
japin rezultate të njëjta.

Në qoftë se jepet një shembull tjetër në rastet kur ndryshorja e pavarur përbëhet më
shumë se dy grupe:

Ndryshorja e Pavarur: Pozicioni i punës në firmë

Ndryshorja e Varur: Dashuria ndaj punës që e bën

Në këtë shembull, ndryshorja e pavarur përbëhet nga 3 grupe: punëtor,
mbikëqyrës, menaxher. Analiza e variancës përdoret për të hulumtuar ndryshimin
ndërmjet pasionit për punën sipas pozicionit që kanë secili. Një shembull i këtillë, është
plotësisht një shembull i Analizës së Variancës Një Drejtimshe (ANOVA).

ANOVA Një Drejtimshe është analiza më e thjeshtë e variancës. Përbëhet nga dy
ndryshore. Njëra nga këto është ndryshorja e pavarur e cila ka karakteristikë kategorike
dhe ndryshorja tjetër ndryshorja e varur e cila ka karakteristikë metrike. Brenda
ndryshores së pavarur mund të ekzistojnë dy apo më shumë grupe. ANOVA Një
Drejtimshe teston ekzistimin e dallimit ndërmjet mesatareve të ndryshores së varur sipas
grupeve.

Lloji i analizës së variancës ndryshon sipas numrit të ndryshoreve të varura dhe të
pavarura. Më poshtë janë përmbledhur llojet e analizës së variancës sipas numrit të
ndryshoreve të varura dhe të pavarura.

147
Numri i Ndryshoreve të Pavarura
Një Dy
Numri i Një ANOVA Një Drejtimshe ANOVA Dy Drejtimshe
ndryshoreve Më shumë se MANOVA Një MANOVA Dy Drejtimshe
të varura një Drejtimshe

Të mendojmë një shembull të këtillë;

1. Ndryshorja e pavarur: koha e kaluar në vendin e punës së një personi (java e
parë, pas 3 muajve, pas 6 muajve, pas 1 viti)
2. Ndryshorja e pavarur: pozicioni i personit në firmë (punëtor, mbikëqyrës,
menaxher)
3. Ndryshorja e varur: Niveli i pasionit për punën
4. Ndryshorja e varur: Niveli i kënaqësisë nga politikat e firmës
5. Ndryshorja e varur: Niveli i mjaftueshëm i pagës

Për të hulumtuar se koha e personit që ka punuar në pozitën aktuale në firmë a ka
ndikuar në personin që ta dojë punën që e ka bërë, përdoret ANOVA Dy Drejtimshe.
ANOVA Dy Drejtimshe bën testimin e ndryshoreve të varura si një e vetme mbi
ndryshoren e pavarur.

Për të hulumtuar se a ka ndikim pozicioni i personit në firmë në pasionin për punën,
në kënaqësinë nga politikat e firmës dhe në mjaftueshmërinë e pagës përdoret MANOVA
Një Drejtimshe. MANOVA Një Drejtimshe bën testimin e dallimit ndërmjet grupeve të
ndryshores së varur të përmbledhura në një ndryshore dhe ndryshores së pavarur.

Kurse për të hulumtuar se të gjitha ndryshoret e pavarura a kanë ndonjë ndikim mbi
të gjitha ndryshoret e varura përdoret MANOVA Dy Drejtimshe. MANOVA Dy Drejtimshe
vlerëson dallimin duke i krahasuar në total grupet e më shumë se një ndryshoreje të
pavarur sipas më shumë se një ndryshoreje të varur.

Një pikë tjetër me rëndësi në analizën e variancës është numri i mostrave të
grupeve. Sado që numri i mostrave të grupeve të jetë i bararabartë, numri i dallimeve
ndërmjet numrit të mostrave nuk duhet të jetë tepër, edhe në qoftë se kjo nuk është një
parakusht për analizën e variancës. Numri i mostrave sado që të jetë i përafërt me njëra-
tjetrën, analiza e variancës po aq do të jap rezultate të shëndetshme. Po ashtu, numri i
mostrave të grupeve preferohet të jetë mbi 10.

Pas kësaj hyrjeje të shkurtër, në faqet e ardhshme do të jepen detaje gjatë zgjidhjes
së shembujve.

148
7.1. ANOVA NJË DREJTIMSHME
Ekzistojnë dy supozime themelore në Anovën Një Drejtimshe. Sipas këtyre
supozimeve, çdo grup ndjek shpërndarjen normale dhe variancat e grupeve janë
homogjene.

Përpara se të shqyrtohen rezultatet e shembullit të Anovës Një Drejtimshe, duhet të
testohen supozimet. Në përgjithësi, studimet nisen nga testi i homogjentitet të variancave.
Në qoftë se variancat janë homogjene, pranohet se janë siguruar të gjitha supozimet. Për ta
bërë testin e homogjenitetit të variancave në SPSS, zgjidhet Options nga menyja e analizës
së Anovës Një Drejtimshe.

Testimi i supozimeve do të shihet më mirë gjatë prezantimit të shembullit. Në lidhje
me Anovën Një Drejtimshe, janë dhënë të dhënat në Shtojcën 7.1. Në këtë shembull
kërkohet se pozicioni i personit në firmë a ndikon në pranimin e politikave të firmës.

7.1.1. SHEMBULL APLIKIMI
Në SPSS, shkojmë te menyja Analyze, Compare Means, One Way ANOVA.

Ndryshorja e pavarur pozita bartet në pjesën Factor, kurse ndryshorja e varur
pranimi bartet në pjesën Dependent List. Përpara se të përfundojmë me analizën, duhet të
bëhen edhe disa përzgjedhje të tjera. Në menynë One-Way ANOVA gjenden përzgjedhjet
Contrasts, Post Hoc dhe Options.

Hapi 1: Dritarja e ANOVA Një Drejtimshe

Në analiza është e rëndësishme Post Hoc dhe pasi të klikojmë në të, do të hapet
dritarja e mëposhtme.

149
Hapi 2: Dritarja e Post Hoc

Testi Post Hoc është i rëndësishëm për të parë se nga cili grup buron dallimi, në
qoftë se në fund të analizës së variancës është gjetur dallim ndërmjet grupeve. Tabela
ANOVA tregon në përgjithësi se a ka dallim ndërmjet mesatareve të grupeve. Ajo teston se a
janë të njëjta mesataret e të gjitha grupeve, qoftë 3 grupe apo qoftë 10 grupe. Në qoftë se
vetëm ndërmjet dy grupeve ekziston dallim dhe ndërmjet grupeve tjera jo, ANOVA do të jap
rezultatin se “ekziston dallim ndërmjet grupeve”. Mirëpo, me testet Post Hoc mund të
mësojmë se nga buron dallimi dhe ndërmjet cilat grupeve ekziston ky dallim.

Në testin Post Hoc ekzistojnë shumë përzgjedhje. Funksioni themelor i të gjithave
është i njëjtë. Përdoret për të kuptuar se ndërmjet cilat grupeve ekziston dallim. Sipas
algoritmeve të përdorura, niveleve të ndjeshmërisë etj., në përgjithësi japin rezultate të
njëjta edhe në qoftë se ekzistojnë disa dallime të vogla ndërmjet tyre. Përbrenda këtyreve,
më të përdorura gjatë studimeve janë Tukey dhe Bonferroni. Përzgjedhja e vetëm njërës
nga këto është e mjaftueshme, kurse ne kemi përzgjedhur të dyja për të parë dallimin
ndërmjet tyre në shembullin tonë.

Pasi të përfundohen përzgjedhjet, duke klikuar në butonin Continue kthehemi te
menyja kryesore. Përzgjedhja Contrasts përdoret në analizat e niveleve më të larta të
statistikave. Teksa në përzgjedhjen Post Hoc krahasohen dy nga dy mesataret e ndryshores
së varur sipas nëngrupeve të ndryshores së pavarur, me anë të përzgjedhjes Contrasts
mund të bëhen krahasime në nivele më të larta. Për shembull, krahasimi i një grupi me

150
mesataren e përgjithshme të grupeve tjera apo krahasimi i mesatares së përgjithshme të
grupit të dytë dhe të tretë me mesataren e përgjithshme të grupit të parë dhe të pestë,
bëhet përmes Contrasts duke i futur koeficientët e nevojshëm të tyre.

Po ashtu, në rastet kur është e rëndësishme forma e funksionit në lidhje me nivelet e
lidhjes së ndryshores së varur dhe ndryshores së pavarur, është e rëndësishme analiza e
trendit. Për shembull, shuma e çmimit (shpërblimit) dhënë një subjekti le të jetë ndryshore
e pavarur dhe shuma e vrapimit në lidhje me këtë le të jetë ndryshore e varur. Në një
shembull të këtillë, për testimin e formës së funksionit të ndryshores së varur dhe
ndryshores së pavarur sipas pikëpamjeve të ndryshme, mund të përdoret analiza e trendit.
Në raste të këtilla, në përzgjedhjen Contrasts mund të përdoren komponentët e
disponueshëm të trendit. Për arsye se meyja Contrasts përdoret për analiza të niveleve të
larta, nuk do të futemi më shumë në detajet e kësaj menyje.

Në menynë kryesore, në pjesën Options gjenden gjithashtu përzgjedhje të
rëndësishme. Kur të klikojmë në butonin Options, do të hapet dritarja e mëposhtme:

Hapi 3: Dritarja e Përzgjedhjeve

Jep statistikat themelore, si mesataren,
devijimin standart, vlerat e minimumit,
dhe maksimumit për secilin grup.

Jep devijimin standart, gabimin e
devijimit dhe intervalin e besueshmërisë
për modelet fikse dhe intervalin e
besueshmërisë të gabimit standart dhe
variancën ndërmjet komponentëve për
modelet e probabilitetit.

Teston supozimin e homogjentitetit të
variancave të grupeve

Përdoren për krahasimin e mesatareve
të grupeve në rastet kur supozimi i
homogjenitetit të variancave të grupeve
është i pavlefshëm.
Në qoftë se ekziston mungesë në
ndryshoren e varur apo të pavarur në Jep paraqitjen grafike të mesatareve të
analizë, nuk e përdor asnjë rresht në të nën grupeve.
cilin mungojnë të dhënat. Është e
rëndësishme në rastet kur janë Në qoftë se ekziston mungesë në
përcaktuar më shumë se një ndryshore e ndryshoren e varur apo të pavarur në
varur. analizë, nuk e përdor atë rresht në të
cilin mungojnë të dhënat. 151
Më lartë janë dhënë kuptimet për secilën përzgjedhje të menysë Options. Për një
ANOVA standarte, homogjeniteti i variancave është përzgjedhja e cila duhet të testohet
patjetër. Nga rezultatet e testit të supozimit të homogjenitetit të variancës do të kuptohet
vlefshmëria e zbatimit të ANOVA-së Një Drejtimshe. Për këtë arsye, më lartë është
përzgjedhur Homogeneity of variance test. Descriptive është përzgjedhur për t’i parë
rezultatet në kuptim të përgjithshëm. Kjo përzgjedhje jep numrin e mostrave të përdorura
sipas grupeve, mesataret, devijimin standart, gabimin standart të mesatareve, vlerat e
minimumit dhe maksimumit dhe nivelin e besueshmërisë 95%. Përzgjedhja Means plot
mund të përzgjedhet për të parë ndryshimin në mënyrë grafikore të ndryshores së varur
sipas grupeve të ndryshores së pavarur.

Përzgjedhja Fixed and random effects ka të bëjë me mbledhjen e të dhënave nga
kategoritë e ndryshores së pavarur. Në qoftë se të dhënat janë mbledhur nga të gjitha
kategoritë e ndryshores së pavarur quhen modele fikse, kurse në qoftë se të dhënat janë
mbledhur nga një pjesë e kategorive quhen modelet e probabilitetit. Llogaritjet në ANOVA
Një Drejtimshe janë të njëjta për secilin model. Në qoftë se rritet numri i ndryshoreve të
pavarura do të ketë dallime ndërmjet modeleve. Përzgjedhja Fixed and random effects
jep vlerat e përshkruara më lartë në tabelë për ndikimet fikse dhe të rastësishme. Kjo
përzgjedhje përdoret në analizat statistikore të niveleve të larta dhe në të njëjtën kohë do
të jepen më shumë detaje në pjesën ANOVA Dy Drejtimshe. Përzgjedhjet Brown-Forsythe
dhe Welch, përdoren për të bërë krahasime ndërmjet mesatareve në rastet kur nuk është
siguruar supozimi i Anovës, të homogjenitetit të variancave.

Në aplikimin ANOVA Një Drejtimshe, te pjesa e ndryshores së varur mund të
vendosen më shumë se një ndryshore. Në rastin e vendosjes së më shumë se një
ndryshoreje të pavarur, nuk duhet të konsiderohet se të gjitha ndryshoret janë subjekt i të
njëjtës analizë. Në ANOVA Një Drejtimshe, secila ndryshore e pavarur është është subjekt i
ndryshores së varur ndaras dhe rezultatet jepen ndaras. Përzgjedhja e më lartë e Missing
Values merr kuptim në raste të tilla. Në qoftë se është zgjedhur vetëm një ndryshore e
varur dhe vetëm një ndryshore e pavarur, përzgjedhja Exclude cases listwise nuk ka
kuptim. Por në qoftë se janë zgjedhur më shumë se një ndryshore e varur, kjo metodë
përzgjedhet që të mos përdoren vlerat mangu gjatë gjithë analizës. Ngaqë në shembullin
tonë kemi vetëm një ndryshore të varur dhe vetëm një ndryshore të pavarur, cilën do që të
përzgjedhim, rezultatet nuk do të ndryshojnë.

Pasi të bëhen përzgjedhjet mësipër, klikohet butoni Continue dhe pastaj duke
klikuar OK në menynë kryesore të One-Way ANOVA, do të përfitohen rezultatet.

152
7.1.2. DALJET E SPSS-IT DHE INTERPRETIMI
Tabela 7.1: Statistikat Përshkruese

Descriptives
përvetësimi

95% Confidence Interval for

Std. Mean

N Mean Deviation Std. Error Lower Bound Upper Bound Minimum Maximum

punëtor 15 2.3333 .81650 .21082 1.8812 2.7855 1.00 4.00
mbikëqyrës 14 3.7857 .80178 .21429 3.3228 4.2487 2.00 5.00
menaxher 11 4.2727 1.00905 .30424 3.5948 4.9506 2.00 5.00
Total 40 3.3750 1.19158 .18841 2.9939 3.7561 1.00 5.00

Gjëja e parë e cila tërheq vëmendjen në tabelën Descriptives është numri i mostrës
së grupeve. Përderisa do të duhej të ishin 17 punëtorë janë vrojtuar 15, do të duhej të ishin
15 mbikëqyrësa janë vrojtuar vetëm 14. Arsyeja e kësaj është mungesa e vlerave në të
dhëna. Në të dhënat tona kishte 3 vlera mangu dhe në këtë mënyrë në total 3 vlera janë
lënë jashtë analizës. Në tabelë janë dhënë të dhënat statistikore themelore si mesatarja,
devijimi standart etj., për secilin grup.

Tabela 7.2: Testi i Homogjenitetit të Variancës

Test of Homogeneity of Variances
përvetësimi

Levene Statistic df1 df2 Sig.

.497 2 37 .612

Në tabelën 7.2, mund të shihet rezultati i testit të supozimit themelor të ANOVA-së
Një Drejtimshe, homogjenitetit të variancës. Për arsye se këtu vlera e p (Sig. 0,612) është
më e madhe se 0,05, mund të thuhet se variancat janë homogjene. Ngaqë është siguruar
supozimi themelor i analizës së variancës, mund të themi se në fund rezultatet e përfituara
nga analiza e variancës janë të shëndetshme.

153
Tabela 7.3: Tabela e Analizës së Variancës

ANOVA
përvetësimi

Sum of Squares df Mean Square F Sig.

Between Groups 27.503 2 13.751 18.255 .000
Within Groups 27.872 37 .753
Total 55.375 39

Tabela ANOVA teston dallimin ndërmjet grupeve në përvetësimin e politikave të
firmës. Në qoftë se këtu vlera e F-së është më e madhe se vlera e tabelës në nivelin e
rëndësisë 95%, hipoteza H0 do te refuzohet. Natyrisht, këtu nuk nuk është e nevojshme që
të shikojmë nga tabela vlerën e F-së. SPSS jep vlerën e p-së (Sig.) dhe në qoftë se kjo vlerë
është më e vogël se 0,05, hipoteza H0 do te refuzohet. Vlera e p-së (0,000) në tabelën e
mësipërme është më e vogël se 0,005. Prandaj mund të themi se ekziston një dallim
ndërmjet grupeve në përvetësimin e politikave të firmës. Dhe pikërisht, në këtë pikë vijnë
në shprehje testet Post Hoc. Ekziston një dallim ndërmjet grupeve, në rregull, por midis
cilave grupe? Testet Post Hoc japin përgjigjjen e kësaj pyetjeje.

Tabela 7.4: Tabela e Krahasimeve të Shumëta

Multiple Comparisons
Dependent Variable: përvetësimi

Mean 95% Confidence Interval

(I) pozita (J) pozita Difference (I-J) Std. Error Sig. Lower Bound Upper Bound
*
Tukey HSD punëtor mbikëqyrës -1.45238 .32253 .000 -2.2398 -.6649
*
menaxher -1.93939 .34453 .000 -2.7806 -1.0982
*
mbikëqyrës punëtor 1.45238 .32253 .000 .6649 2.2398

menaxher -.48701 .34970 .355 -1.3408 .3668
*
menaxher punëtor 1.93939 .34453 .000 1.0982 2.7806

mbikëqyrës .48701 .34970 .355 -.3668 1.3408
*
Bonferroni punëtor mbikëqyrës -1.45238 .32253 .000 -2.2612 -.6436
*
menaxher -1.93939 .34453 .000 -2.8034 -1.0754
*
mbikëqyrës punëtor 1.45238 .32253 .000 .6436 2.2612

menaxher -.48701 .34970 .516 -1.3640 .3899
*
menaxher punëtor 1.93939 .34453 .000 1.0754 2.8034

mbikëqyrës .48701 .34970 .516 -.3899 1.3640
*. The mean difference is significant at the 0.05 level.

154
Në tabelën e mësipërme janë dhënë rezultatet e testit Tukey dhe Bonferroni. Nga
tabela e mësipërme janë bërë këto krahasime me renditjet e testit Tukey.

Figura 7.1: Përmbledhja e Tabelës së Krahasimeve të Shumëfishta

PUNËTOR

Mesatarja:
2,333
EKZISTON
DALLIM EKZISTON
DALLIM

MBIKËQYRËS
MENAXHER
Mesatarja:
3,7857 Mesatarja:
4,2727

NUK KA DALLIM

Figura 7.1 është përgatitur për të kuptuar më mirë tabelën e krahasimeve të
shumëfishta. Mesataret në lidhje me ndryshoren e varur përvetësimi janë marrë nga tabela
7.1 në kolonën Mean. Dallimet mesatare janë marrë nga tabela 7.4 në kolonën Mean
Difference. Kurse niveli i rëndësisë është marrë nga kolona Sig. në tabelën 7.4. Mund të
thuhet se ekziston një dallim i rëndësishëm për grupet të cilat gjenden nën nivelin e
rëndësisë 0,05.

Pa shikuar në nivelin e rëndësisë, përmes lehtësisë të cilën e ofron SPSS-i mund të
zbulohet se midis cilave grupe ekziston dallim. Me anë të shenjës së asteriksit (*) në
kolonën e mesatareve të dallimeve (Mean Difference) në tabelën 7.4, mund të kuptohet se
midis cilave grupe ekziston dallim për nga mesataret. Mesataret të cilat kanë shenjën *
tregojnë që ndërmjet atyre grupeve ekziston një dallim në nivelin e rëndësisë 0,05.

Sipas këtyre rezultateve;

155
 Mbikëqyrësit i kanë përvetësuar më shumë politikat e firmës në krahasim me
punëtorët. Dallimi ndërmjet tyre është 1,452 dhe kjo gjendet nën nivelin e
rëndësisë 0,05.
 Menaxherët i kanë përvetësuar më shumë politikat e firmës në krahasim me
punëtorët. Dallimi ndërmjet tyre është 1,939 dhe kjo gjendet nën nivelin e
rëndësisë 0,05.
 Nuk ekziston ndonjë dallim i rëndësishëm ndërmjet menaxherëve dhe
mbikëqyrësve në përvetësimin e politikave të firmës. Dallimi ndërmjet tyre
është 0,487 dhe kjo është më e madhe se niveli i rëndësisë 0,05 (0,355).

Përsëri ajo çfarë tërheq vëmendjen në tabelë është se Tukey dhe Bonferroni kanë
dhënë rezultate të njëjta. Në analiza, zakonisht përzgjedhet njëra nga këto. Kurse siç e
cekëm edhe më parë, testi Tukey përdoret më shumë.

Tabela 7.5: Tabela e Nëngrupeve

përvetësimi

Subset for alpha = 0.05

pozita N 1 2
a,b
Tukey HSD punëtor 15 2.3333

mbikëqyrës 14 3.7857

menaxher 11 4.2727

Sig. 1.000 .333

Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 13.100.
b. The group sizes are unequal. The harmonic mean of the group sizes is
used. Type I error levels are not guaranteed.

SPSS-i ka krijuar nëngrupet sipas përvetësimit të politikave të firmës. Nga këto,
grupi i punëtorëve ka formuar një grup të vetëm, kurse mbikëqyrësit dhe menaxherët janë
përfshirë nën një grup së bashku. Përfshirja e mbikëqyrësve dhe menaxherëve në një grup,
përsëri tregon se këto dy grupe nuk kanë karakteristika të dy grupeve të ndara, pra
mbikëqyrësit dhe menaxherët tregojnë karakteristika të njëjta në përvetësimin e politikave
të firmës. Kurse punëtorët janë përcaktuar në një grup të veçantë për arsye se tregojnë
karakteristika të ndryshme edhe nga mbikëqyrësit edhe nga menaxherët.

Grafiku i përfituar nga përzgjedhja Means Plot në menynë Options paraqet në
mënyrë vizuale dallimet e mesatareve të përvetësimit të punëtorëve, mbikëqyrësve dhe
menaxherëve sipas pozitave. Boshti vertikal tregon nivelin e përvetësimit (Mean
Difference), kurse boshti horizontal tregon grupet e pozitave. Ky grafik i cili rezultatet i

156
paraqet në mënyrë vizuale, nuk është i mjaftueshëm për të kuptuar se a ekziston një dallim
i rëndësishëm ndërmjet grupeve. Interpretimi vetëm përmes grafikut pa ndihmën e testeve
tjera, jep rezultate të gabueshme.

Figura 7.2: Grafiku Tregues i Lidhjes Ndërmjet Faktorit të Pozitës dhe
Ndryshores së Përvetësimit

Në qoftë se do të bënim një përmbledhje të shembullit të analizuar në lidhje me
ANOVA-në Një Drejtimshe;

 Pozita aktuale e punëtoreve ndikon në ndjenjën e përvetësimit të politikave të
firmës.
 Punëtorët janë përvetësuesit më të paktë të politikave të firmës.
 Menaxherët dhe mbikëqyrësit i përvetësojnë më shumë politikat e firmës.
 Sado që menaxherët i përvetësojnë politikat e firmës më shumë se mbikëqyrësit,
përsëri nuk ekziston ndonjë dallim i rëndësishëm ndërmjet tyre.

157
7.2. ANOVA DY DREJTIMSHE
Gjatë hulumtimit të ndikimit të dy ndryshoreve të pavarura mbi një ndryshore të
varur, në vend të hulumtimit të ndikimit të ndryshoreve të pavarura mbi ndryshoren e
varur veç e veç, vendosja e tyre në një funksion të vetëm shpesh është më produktive. Kjo
qasje e cila bën llogaritjen e ndikimit të ndryshoreve të pavarura veç e veç mbi ndryshoren
e varur, llogarit edhe bashkëveprimin ndërmjet ndryshoreve të pavarura. Kjo situatë do të
kuptohet më mirë përmes shembullit.

7.2.1. SHEMBULL APLIKIMI
Në Shtojcën 7.2 gjenden dy ndryshore të pavarura. Këto janë pozita e personave në
firmë dhe koha e gjendjes në punë. Kurse ndryshorja e varur është niveli i kënaqëisë së
personave nga puna e bërë. Në këtë shembull, kërkohet të hulumtohet ndikimi i pozitës së
punonjësve (punëtorë, mbikëqyrës, menaxher) në kënaqësinë e marrë nga puna që bëjnë.
Në të njëjtën kohë, kërkohet të matet se a ka ndryshuar niveli i kënaqësisë në fund të javës
së parë, në fund të tre muajve, në fund të gjashtë muajve dhe në fund të një viti në pozitën
në të cilën gjenden. Për shembull, është pyetur një punonjës në lidhje me nivelin e
kënaqësisë në punë në fund të javës së parë pasi ka filluar punën, në fund të tre muajve, në
fund të gjashtë muajve dhe në fund të një viti. Në këtë mënyrë janë pyetur 4 punonjës. Po
ashtu, në të njëjtën mënyrë janë pyetur 4 mbikëqyrësa dhe 4 menaxherë në periudhat e
lartëpërmendura. Në fund, është përfituar tabela në Shtojcën 7.2. Në tabelë gjenden në total
48 të dhëna.

Hulumtimi veç e veç i nivelit të kënaqësisë me pozitën e punës dhe kohën e kaluar
në atë punë, do të ishte një gabim sepse mund të ketë një bashkëveprim ndërmjet këtyre dy
ndryshoreve të pavarura. Për shembull, teksa niveli i kënaqësisë së një punëtori mund të
zvogëlohet me kalimin e kohës, e kundërta mund të jetë për një menaxher. Një menaxher,
me kalimin e kohës do të i përcaktojë vetë politikat dhe do të i përvetësojë më shumë se të
tjerët. Në situata të tilla, në vend që ndryshoret e pavarura të analizohen veç e veç me
ANOVA Një Drejtimshe, është më e kuptimtë që të analizohen përmes një funksioni me
ANOVA Dy Drejtimshe.

Për ta kryer Anovën Dy Drejtimshe në SPSS, shkohet tek Analyze, General Linear
Model¸ Univariate dhe do të paraqitet ekrani i mëposhtëm.

158
Hapi 1: Dritarja ANOVA Dy Drejtimshe

Në qoftë se të gjitha
grupet janë
përfshirë në kuadër
të ndryshores së
pavarur, ndryshoret
e tilla të pavarura
shtohen në pjesën
Fixed Factor(s). Në
kuadër të faktorit të
pozitës janë
shqyrtuar 3 grupe.

Në qoftë se nuk janë
përfshirë të gjitha
grupet në kuadër të
ndryshores së
pavarur, ndryshoret
e tilla shtohen në
pjesën Random
Factor(s). Në
ndryshoren koha
janë shqyrtuar 4
periudha. Qëllimi
këtu është që të
Në analizën e ponderuar të katrorëve më te vegjël (Weighted Least kuptohet se me
Squares Analyses), një ndryshore mund të shtohet si e ponderuar kalimin e kohës a ka
ndryshuar
(Weighting Variable). Nuk është një karakteristikë e cila përdoret
kënaqësia. Përveç 4
shpesh. periudhave të
përmendura këtu,
mund të ketë edhe
Këtu shtohet ndryshorja e pavarur në kombinim me nivelet e
më shumë periudha
faktorit të cilat mund të lidhen me covariate (ndryshore kolektive). të tjera.
Ngaqë kjo është një temë e analizës së kovariancës, këtu nuk do të
futemi në detaje.

Ndryshorja e pavarur kënaqësia bartet në pjesën Dependent Variable. Kemi dy
lloje të ndryshoreve të pavarura dhe këto kanë karakteristika të ndryshme. Ndryshorja e
pavarur pozita strehon të gjitha grupet që na interesojnë. Ndryshoret e këtilla, siç shihet
më lartë, barten në pjesën Fixed Factor(s). Kurse ndryshorja e kohës është më e ndryshme.
Kjo ndryshore përfshin 4 grupe. Këto janë java e parë, 3 muajtë e parë, 6 muajtë e parë dhe
1 vit. Qëllimi këtu është që të hulumtohet se me kalimin e këtyre periudhave a ka
ndryshuar niveli i kënaqësisë. Në qoftë se konsiderohet se këto grupe përfshijnë të gjitha
grupet brenda zonës sonë të interesit, atëherë këto mund të transferohen në pjesën Fix
Factor(s). Në shembullin tonë nuk konsiderohet se këto grupe përfshinë të gjitha grupet e

159
tjera sepse mund të qenë bërë matje p.sh. në fund të një muaji, në fund të 9 muajve apo në
fund të 2 viteve dhe në këtë mënyrë do të ishin krijuar më shumë se 4 grupe. Po të kishin
qenë më shumë se 4 grupe edhe rezultatet do të ndryshonin. Për këtë arsye, ndryshorja
koha është bartur në pjesën Random Factor(s).

Në aplikimin e ANOVA-së Dy Drejtimshe, pjesa me rëndësi kritike është pjesa
Model. Kur të klikohet në butonin Model do të hapet dritarja e mëposhtme. Në shembull
qe përcaktuar se mund të ketë bashkëveprim ndërmjet pozitës dhe kohës. Prandaj, përveç
shikimit të ndikimit kryesor të pozitës mbi kënaqësinë, ndikimit kryesor të kohës mbi
kënaqësinë, në të njëjtën kohë duhet të shikohet edhe ndikimi i bashkëveprimit të pozitës
dhe kohës mbi kënaqësinë. Përcaktimi i këtyre përzgjedhjeve bëhet në pjesën Model. Në
ekranin Model përzgjedhja Full Factorial është e vetëpërzgjedhur. Nga kjo, SPSS do të jep
rezultatin e të gjitha ndërveprimeve të dëshiruara.

Hapi 2: Dritarja e Modelit

Përzgjedhjet Full Factorial dhe Custom ofrojnë mundësinë për të hulumtuar llojet e
ndikimeve të faktorëve mbi ndryshoren e varur. Përzgjedhja Full Factorial llogaritë të
gjitha mundësitë. Pra, llogarit ndikimin kryesor të pozitës, ndikimin kryesor të kohës dhe
ndërveprimin e pozitës dhe kohës si dhe hulumton ndikimin e secilës nga 3 përzgjedhjet mbi
ndryshoren e varur.

160
Në qoftë se përzgjedhet Custom, SPSS jep mundësinë për të zgjedhur se çfarë ndikimi faktorial
po kërkohet mbi ndryshoren e varur. Ndryshoret në pjesën Factors & Covariates barten në
pjesën Model duke pasur kujdes përzgjedhjet në Build Term(s). Për shembull, për të mësuar
ndikimin kryesor të pozitës mbi kënaqësinë zgjedhet Main Effects nga kutiza Build Term(s)
dhe pastaj barten në pjesën Model. Për të mësuar ndikimin e ndërveprimit të pozitës dhe kohës
mbi kënaqësinë, duke i selektuar të dyjat barten në pjesën Model duke përzgjedhur Interaction
nga pjesa Build Term(s). Në ekranin e mësipërm, duke zgjedhur secilën mundësi janë bartur
në pjesën Model. Në këtë mënyrë edhe Full Factorial do të jap rezultatet e njëjta nga dritarja e
mësipërme ku është e vetëpërzgjedhur. Në rastet kur ekzistojnë më shumë se një ndryshore e
pavarur, për të hulumtuar ndërveprimet treshe, katërshe apo pesëshe, nga kutiza Build
Term(s) përdoren përzgjedhjet All 3-way, All 4-way, All 5-way. Në shembullin tonë është e
pakuptimtë të përdoren këto sepse kemi vetëm dy ndryshore të pavarura.

Këtu është e përzgjedhur Type III në mënyrë standarte. Për të llogaritur totalin e katrorëve
këtu gjenden 4 përzgjedhje. Për modele të ndryshme zgjedhen përzgjedhje të ndryshme. Për
shembull, për modelet e dizajneve të ekuilibruara ose modelin e regresionit polinom është e
përshtatshme përzgjedhja Type I. Këtu zakonisht përzgjedhja Type III dhe Type IV përdoren
më shumë. Në Type III është më e lehtë që të interpretohen rezultatet dhe përdoren në të gjitha
modelet, si të ekuilibruara ashtu edhe jo të ekuilibruara. Në qoftë se në shembull nuk ekziston
grup i zbrazët, është e përshtatshme Type III, në qoftë se po Type IV.

161
Duke klikuar butonin Continue vazhdohet tutje. Univariate e cila realizon aplikimin
e ANOVA-së Dy Drejtimshe, ofron edhe përzgjedhjen e grafikut. Përmes grafikut mund të
shohim se si ndryshon ndryshorja e varur me ndikimin e faktorëve. Për ta përfituar
grafikun, në ekranin Univariate klikohet butoni Plots. Përmes ekranit të hapur më poshtë,
mund të përcaktohet vizatimi i grafikut. Boshti vertikal i grafikut është ndryshore e varur
në mënyrë automatike. Në shembullin tonë, vlera e pritur marxhinale e ndryshores sonë të
varur kënaqësia do të paraqitet në boshtin vertikal të grafikut. Ndryshoret e pavarura
shfaqen në 3 mënyra në grafik. Detajet e këtyre 3 përzgjedhjeve janë dhënë afër ekranit të
mëposhtëm. Në shembullin tonë, ndryshorja e kohës teksa tregohet në boshtin horizontal,
ndryshorja e pozitës është përcaktuar që të shfaqet me vija të ndara. Ajo çfarë nuk duhet të
harrohet këtu është që pasi të bëhen përzgjedhjet e nevojshme duhet të shtypet tasti Add.
Përndryshe nuk do të shfaqet grafiku. Pasi të klikokjmë në tastin Add kutizat e
përzgjedhura do të zbrazen. Në këtë mënyrë, në qoftë se dëshirohen grafiqe të formave të
tjera, pas ripërzgjedhjes klikohet butoni Add dhe bëhet shtimi i tyre. Pasi të përfundohet
funksioni, klikohet Continue dhe do të kthehemi te menyja kryesore Univariate.

Hapi 3: Dritarja e Grafikut

Ndryshorja e shtuar në këtë
pjesë do të shfaqet në
boshtin horizontal në grafik.

Ndryshorja e shtuar në këtë
pjesë do të shfaqet me vija
të ndryshme ngjyrash në
grafik.

Ndryshorja e shtuar në këtë
pjesë do të shfaqet me pika
të ndryshme ngjyrash në
grafik.

Testet Post Hoc të cilët qenë përmendur në ANOVA Një Drejtimshe, ekzistojnë edhe
në ANOVA Dy Drejtimshe. Tabela ANOVA tregon dallimin e ndryshores së varur në lidhje
me një faktor dhe në të njëjtën kohë ndërmjet cilave grupe të faktorit ekziston dallimi.
Testet Post Hoc ofrojnë mundësinë për të parë detajet e këtilla. Nga menyja kryesore
Univariate hyhet në përzgjedhjen Post Hoc. Në ekranin e mëposhtëm, ndryshoret të cilat
dëshirohet të jenë subjekte të testit Post Hoc, barten në pjesën Post Hoc Tests for duke i

162
përzgjedhur nga pjesa Factor(s). Ajo çfarë tërheq vëmendjen këtu është mungesa e
ndryshores së kohës e cila qe përcaktuar si Random Factor. Për arsye se ndryshoret e
rastësishme nuk i përfshijnë të gjitha kategoritë, nuk mund të jenë subjekte të testeve Post
Hoc. Në qoftë se testi Post Hoc është i rëndësishëm për këta faktorë, atëherë këta faktorë
do të duhej përcaktuar si Fixed Factor në menynë kryesore Univariate. Siç qe specifikuar
në fillim të shembullit, për neve është me rëndësi të kuptohet dallimi i kënaqësisë në 4
periudhat e përcaktuara kohore në mënyrë të rastësishme dhe në çfarë drejtimi do të
ndryshojnë. Niveli i kënaqësisë veç e veç në këto katër periudha nuk tërheq vëmendjen
tonë. Po të ishte ashtu, kjo do të përcaktohej në Fixed Factor. Për të parë se në çfarë
drejtimi ekziston ndryshimi, këtë do të mund ta vështrojmë përmes përmes grafikut të cilin
e përcaktuam nga përzgjedhja Plots. Ekrani i Post Hoc është si më poshtë.

Hapi 4: Dritarja Post Hoc e Krahasimeve të Shumëfishta për Mesataret e Vrojtuara
Nga rezultatet që do
të përfitohen nga
përzgjedhjet e
pjesës Equal
Variances
Assumed do të
shikohet se a
arrihet supozimi
themelor i Anovës,
homogjeniteti i
variancave. Arritja e
homogjenitetit të
variancave tregohet
nga rezultatet e
Homogeniety Test.
Testi më i përdorur
prej këtyre është
testi Tukey. Dallimi
ndërmjet këtyre
testeve qe treguar
në mënyrë të
thjeshtë në ANOVA
Një Drejtimshe.

Kjo pjesë përdoret për të parë ndryshimet në ndryshoren e varur sipas grupeve të faktorit në
rastet kur nuk sigurohet homogjeniteti i variancave. Në qoftë se është e nevojshmë që sipas
rezultatit të Homogeniety Test, atëherë përdoret rezultati që e jep kjo pjesë. Në rastet kur nuk
ekziston homogjeniteti i variancave, testi më i përdorur këtu është Tamhane’s T .

163
Duke përzgjedhur Tukey nga testet Post Hoc dhe Tamhane’s T2, klikohet në
butonin Continue. Në fund të Homogeneity test, në qoftë se arrihet në përfundim se
variancat janë homogjene, përdoren rezultatet e testit Tukey, kurse në qoftë se arrihet në
përfundim se variancat nuk janë homogjene, përdoren rezultatet e testit Tamhane’s T2.

Në menynë kryesore Univariate, butoni Options ofron kontribute të mëdha për të
interpretuar rezultatet e ANOVA-së Dy Drejtimshe. Duke klikuar në butonin Options do të
hapet menyja e saj. Në këtë meny, ndryshoret e gjendura në pjesën Factor(s) and Factor
Interactions barten plotësisht në pjesën Display Means For. Në këtë mënyrë, do të mund
të shohim mesataret dhe intervalet e besueshmërisë të cilat gjenden nën çfarëdo lloje të
ndikimit të ndryshoreve të pavarura mbi ndryshoren e varur. Përmes komentimit të
tabelave që do të shfaqen si rezultat i kësaj përzgjedhjeje, do të mund të shikojmë se nga
cilat ndryshore të pavarura ndryshon ndryshorja e varur, në cilat grupe të ndryshoreve të
pavarura dhe në çfare drejtime. Në të njëjtën kohë, nga dritarja e mëposhtme Options në
qoftë se përzgjedhet Compare Main Effects do të bëhet përsëri testi Post Hoc për
ndryshoret veç e veç. Këtu ekzistojnë dy pika me rëndësi. E para, në menynë normale Post
Hoc, teksa ndryshoret e identifikuara nuk janë subjekt i Random Variables, me rastin e
përzgjedhjes Compare Main Effects të gjitha ndryshoret do të jenë subjekt i kësaj. Në qoftë
se përzgjedhjet ky opsion, do të bëhen krahasime ndërmjet 4 grupeve të ndryshores së
shembullit tonë kohës. Mirëpo, siç është specifikuar edhe më parë, në shembullin tonë nuk
kemi nevojë për një analizë të këtij lloji. Pika e dytë me rëndësi është se me rastin e
përzgjedhjes së Compare Main Effects krahasohen vetëm ndikimet kryesore të
ndryshoreve dhe nuk bëhet ndonjë analizë në lidhje me ndërveprimin ndërmjet dy
ndryshoreve.

Në ekranin Options, përzgjedhja Homogeneity test përdoret për të testuar
supozimin themelor të analizës së variancës, barazinë e variancave. Më etiketimin e kësaj
përzgjedhjeje, në qoftë se vlera e përfituar në tabelë p (vlera e Sig.) është më e madhe se
0,05, atëherë pranohet se variancat janë homogjene. Mirëpo në disa studime, testi
Homogeneity është i pamjaftueshëm për testimin e supozimit. Për këtë arsye me
etiketimin e Spread vs. level plot mund të kontrollohet barazia e variancave përmes
grafikut që do të përfitohet. Madje në disa raste, në qoftë se testi i homogjenitetit sjell
interpretimin për mosbarazinë e variancave, përzgjedhja Spread vs. level plot përmes
grafikut mund të sjell interpretimin e kundërt.

Në qoftë se në menynë Options etiketohet Descriptives statistics, do të përfitohen
mesataret, devijimet standarte dhe madhësitë e mostrave për të gjitha grupet. Përzgjedhja
Estimates of effect size shpreh nivelin e ndikimit të ndryshoreve të pavarura në
ndryshoret e varura. Estimates of effect size e cila llogarit variancën e shpërndarë për
ndryshoret dhe nivelin total të variancës së mbetur gabim, përveç që tregon ndikimin e

164
ndryshores së pavarur në ndryshoren e varur, tregon edhe se në çfarë niveli gjendet ky
ndikim. Gjatë shqyrtimit të rezultateve të SPSS-it, kjo pjesë do të kuptohet më mirë.

Hapi 5: Dritarja e Përzgjedhjeve

Për të mbajtur në
mend, në pjesën
LSD gjenden testet
Post Hoc Bonferroni
dhe Sidak. Edhe në
qoftë se ndryshorja
e pavarur është
përcaktuar në
Random Factor(s),
këtu ofrohet
mundësia e
krahasimit ndërmjet
grupeve në qoftë se
bëhet kjo
përzgjedhje. Në
qoftë se ju kujtohet
në menynë Post Hoc
nuk i zgjedhnim
ndryshoret e
përcaktuara si
Random Factor.

Intervali i
besueshmërisë që
do të përdoret në
analiza mund të
Përzgjedhjet më të përdorura këtu, gjenden të etiketuara në figurë. ndërrohet nga këtu.
Veçanërisht përzgjedhja Homogeneity test duhet të zgjedhet patjetër. Forma e
Ky test përdoret për të provuar qëndrueshmërinë e bazave të analizës përzgjedhur
së variancës. Supozimi bazë, barazia e variancave analizohet përmes standarte është
këtij testi. 0,05.

Pasi përzgjedhjes së preferencave në mënynë Options klikohet Continue dhe bëhet
kthimi në menynë kryesore Univariate.

Butoni Save që gjendet në menynë kryesore Univariate, shërben për të shtuar
ndryshore të reja në setin e të dhënave. Për shembull, në qoftë se etiketohet
Unstandardized Predicted Values, do të shtohet një kolonë e re në setin e të dhënave,

165
pasi të përfundojmë analizën Univariate. Në këtë meny, do të gjenden vlerat e
parashikuara për secilin rresht. Këto vlera nuk janë gjë tjetër përveçse mesatare. Për
shembull, duke e marrë mesataren e përgjigjeve të mbikëqyrësit të dhënë në fund të tre
muajve, në setin e të dhënave në rreshtin e pozitës do të shkruhet mbikëqyrës dhe në
vendin e kohës tre muaj. SPSS, në këtë mënyrë do të plotësojë të gjithë setin e të dhënave.
Edhe pse në përzgjedhjen Save mund të gjenden etiketime të ndryshme për shtimin e
ndryshoreve të reja, nuk është një meny e cila përdoret shpesh. Mirëpo, është e
rëndësishme në rastet kur të dhënat e reja të krijuara janë të nevojshme për të bërë analiza
të reja. Kjo është një situatë e cila aplikohet në nivelet e larta të statistikës.

Gjithashtu, ngaqë edhe përzgjedhja Contrast përdoret në aplikimet e niveleve të
larta të statistikës, këtu nuk do të ndalemi në detajet e kësaj menyje. Mirëpo, duhet të
tregojmë një dallim me rëndësi prej menysë Contrast të menysë Univariate dhe menysë
Contrast të menysë One-Way ANOVA. Përderisa në One-Way ANOVA ekziston seksioni
për përcaktimin e koeficientëve për të bërë krahasime të kombinimeve ndërmjet grupeve
të ndryshme, nuk ekziston një seksion i tillë në Univariate. Krahasimet e tilla në Univariate
mund të bëhen vetëm duke e shkruar syntax (Nuk bëhet përmes menyve të SPSS-it, por me
kod të programimit përmes gjuhës programore të SPSS-it, ashtu siç ndodh në gjuhët
programore).

Klikohet butoni OK në menynë Univariate dhe do të përfitohen rezultatet.

7.2.2. DALJET E SPSS-IT DHE INTERPRETIMI
Në Tabelën 7.6, është e mundur që të shikohet ndërveprimi ndërmjet pozitës dhe
kohës. Me kalimin e kohës zvogëlohet mesatarja e kënaqësisë së punëtorëve. Mesataret e
mbikqyrësve në lidhje me kohën nuk kanë ndonjë ndryshim serioz. Kurse me kalimin e
kohës, mesatarja e kënaqësisë për menaxherët rritet. Ajo çfarë nuk duhet të harrohet këtu
është se me rezultatet e marra nga Descriptive Statistics mund të bëhet interpretim
vetëm në nivel të përgjithshëm. Pa shikuar në nivelin e rëndësisë, testimi i hipotezave është
një gabim shkencor.

Në fillim të ANOVA Dy Drejtimshe duhet të kontrollohet supozimi themelor,
homogjeniteti i variancave. Për ta bërë këtë, shikohet tabela Leven’s Test of Equality of
Variances.

166
Tabela 7.6: Statistikat Përshkruese
Descriptive Statistics
Dependent Variable: kënaqësia

pozita koha Mean Std. Deviation N

punëtor java e parë 5.2500 1.25831 4

3 muaj 4.5000 .57735 4

6 muaj 2.7500 .95743 4

1 vit 1.7500 .50000 4 Nga rezultatet e Descriptive
Total 3.5625 1.63172 16
Statistics, tërheq vëmendjen
dallimi i mesatareve të
mbikëqyrës java e parë 6.7500 1.25831 4
përgjithshme të punëtorve,
3 muaj 6.5000 .57735 4
mbikëqyrësve dhe
6 muaj 6.0000 .81650 4 menaxherëve në lidhje me
1 vit 6.0000 .81650 4 kënaqësinë. Për të kuptuar sa
Total 6.3125 .87321 16 është i rëndësishëm ky
menaxher java e parë 6.0000 .81650 4 dallim, do të shikohet tabela
3 muaj 8.0000 1.15470 4
e ANOVA-së dhe testet Post
Hoc.
6 muaj 9.2500 .50000 4
1 vit 9.7500 .50000 4
Total 8.2500 1.65328 16
Total java e parë 6.0000 1.20605 12 Sipas ndryshores së kohës
3 muaj 6.3333 1.66969 12
nuk bie në sy ndonjë dallim i
rëndësishëm i mesatareve
6 muaj 6.0000 2.86039 12
të përgjithshme të
1 vit 5.8333 3.45972 12 kënaqësisë së punës.
Total 6.0417 2.39644 48

Tabela 7.7: Testi i Homogjenitetit të Variancave

a
Levene's Test of Equality of Error Variances
Dependent Variable: kënaqësia

F df1 df2 Sig.

.942 11 36 .513

Tests the null hypothesis that the error variance of
the dependent variable is equal across groups.
a. Design: Intercept + pozita * koha + pozita +
koha
Për arsye se vlera e tabelës p (Sig.) është më e madhe se 0,05, arrihet në përfundim
se është siguruar supozimi i homogjenitetit të variancave.

167
Figura 7.3: Devijimet Standarte Sipas Mesatareve të Kënaqësisë

Supozimi i homogjenitetit të variancave mund të kontrollohet edhe nga tabela e
Spread vs. Level Plot of kënaqësia. Me fjalë të tjera, ky grafik është një test vizual i
homogjenitetit të variancave. Dobia shtesë e këtij grafiku është se na ndihmon të kuptojmë
nëse shkelja e supozimit të barazimit të variancave buron nga lidhja ndërmjet mesatareve
të grupeve dhe devijimeve standarte. Boshti vertikal në grafik jep devijimet standarte,
kurse boshti horizontal jep mesataret e grupeve. Në ndryshoren e pozitës gjenden 3 grupe,
kurse në ndryshoren e kohës gjenden 4 grupe. Nëse këto grupe konsiderohen të
mbivendosura në njëra-tjetrën, në total formohen 12 grupe. Kurse në grafikun e mësipërm
gjenden 10 pika. Arsyeja e kësaj është se mesataret e disa nga grupeve janë të barabarta
dhe pikat gjenden njëra mbi tjetrën. Në qoftë se shikojmë intervalet e variancës dhe
shpërndarjet e pikave, do të testohet edhe në mënyrë vizuale se është siguruar supozimi i
homogjenitetit të variancave.

168
Tabela 7.8: Testi i Ndërveprimeve

Tests of Between-Subjects Effects
Dependent Variable: kënaqësia

Type III Sum of Partial Eta
Source Squares df Mean Square F Sig. Squared

Intercept Hypothesis 1752.083 1 1752.083 3319.737 .000 .999
a
Error 1.583 3 .528
pozita Hypothesis 177.542 2 88.771 8.285 .019 .734
b
Error 64.292 6 10.715
koha Hypothesis 1.583 3 .528 .049 .984 .024
b
Error 64.292 6 10.715
pozita * koha Hypothesis 64.292 6 10.715 14.557 .000 .708
c
Error 26.500 36 .736

a. MS(koha)
b. MS(pozita * koha)
c. MS(Error)

Rreshti i pozitës Duke shikuar në këtë Me të dhënat nga kjo
hulumton ndikimin kolonë vendoset rëndësia e kolonë kuptohet shkalla
kryesor mbi kënaqësinë, ndikimit të ndryshores së e ndikimit të ndryshores
rreshti i kohës ndikimin e pavarur mbi ndryshoren e së pavarur mbi
kohës mbi kënaqësinë varur. ndryshoren e varur. Kjo
dhe rreshti pozita*koha kolonë është përfituar
ndikimin e pozitës-kohës nga përzgjedhja
mbi kënaqësinë. Estimates of Effect Size.

Përpara se të interpretojmë Tabelën 7.8, të kemi parasysh një pikë të rëndësishme.
Variancat e llogaritura (totali i katrorëve (sum of squares)) të ndryshoreve dhe
ndërveprimit të ndryshoreve, si dhe gabimet e llogaritura të variancave (error) janë
ndikuar nga formimet e faktorëve të rastësishëm (random) apo fiksë (fixed) të
ndryshoreve. Në shembullin tonë, ndryshorja koha ishtë përcaktuar si random factor. Në
qoftë se kjo ndryshore do të përcaktohej si fixed factor, gabimet e variancave do të
rriteshin. Vlerat në kolonën e rëndësisë (Sig.) do të zvogëloheshin si dhe do të
zvogëloheshin vlerat ne kolonën e ndikimeve (Partial Eta Squared). Në fund do të
konsideronim se është më e rëndësishme, mirëpo do të arrinim në rezultate të vlerave më
të ulëta të ndikimeve dhe vlerave më të larta të gabimeve të variancës. Me fjalë të tjera, me
përcaktimin e një faktori si random factor, vështirësohet arritja e rezultateve të larta të
nivelit të rëndësisë dhe në të njëjtën kohë arrihen rezultate më të besueshme. Siç e kemi
specifikuar më parë, në qoftë se grupet brenda një ndryshoreje nuk shihen të mjaftueshme,

169
atëherë përcaktimi i kësaj ndryshore si random factor është shumë më i përshtatshëm
statistikisht. Arritja e rezultateve të dëshiruara është më e vështirë, por rezultatet do të
jenë më të besueshme.

Në tabelën e mësipërme, në fillim duhet të shikojmë kolonën Sig. Vlerat të cilat janë
më të vogla se 0,05 tregojnë se ndryshoret kanë një ndikim të rëndësishëm mbi ndryshoren
e varur. Sipas tabelës së mësipërme, kuptohet se ekziston një ndikim i rëndësishëm i
pozitës dhe ndërveprimit të pozitës-kohës mbi kënaqësinë. Kurse koha si e vetme nuk ka
ndonjë ndikim të rëndësishëm. Me fjalë të tjera, nuk ka ndonjë dallim të rëndësishëm të
nëngrupeve të kohës mbi nivelin e kënaqësisë. Vlerat në kolonën Partial Eta Squared
përcaktojnë madhësinë e ndikimit të faktorëve. Informatat në lidhje se si janë llogaritur
këto vlera qenë dhënë gjatë shpjegimit të përzgjedhjes Estimates of Effect Size e cila e
siguron këtë kolonë. Siç kuptohet nga llogaritjet, me zvogëlimin e gabimit të variancave
këto vlera rriten. Këto vlera mund të marrin vlera më së shumti deri në 1. Sado më afër që
të jenë ndyshoret afër 1-shit, po aq është ndikimi i tyre. Kjo është mjaft e rëndësishme në
praktikë. Për të arritur në përfundim se ekziston një ndikim i rëndësishëm i ndryshores së
pavarur mbi ndryshoren e varur, është e pamjaftueshme që të thuhet gjithmonë se ekziston
një ndikim i madh i këtij ndikimi. Duke shikuar në tabelë, arrihet në përfundim se ndikimet
e pozitës dhe ndërveprimit të pozitës-kohës janë të larta.

Në qoftë se shikojmë rezultatet e përfituara nga përzgjedhja Estimated Marginal
Means, veçse do të përforcohen rezultatet e arritura më larta.

Tabela 7.9: Tabela e Mesatareve Sipas Ndryshores së Pavarur Pozicionit

2. pozita
Dependent Variable: kënaqësia

95% Confidence Interval

pozita Mean Std. Error Lower Bound Upper Bound

punëtor 3.563 .214 3.127 3.998
mbikëqyrës 6.313 .214 5.877 6.748
menaxher 8.250 .214 7.815 8.685

Në tabelën e mësipërme janë dhënë mesataret, gabimet standarte dhe intervali i
besueshmërisë për punëtorët, mbikëqyrësit dhe menaxherët në lidhje me kënaqësinë. Pika
e parë që duhet të kihet parasysh këtu është mospërputhja e intervaleve të besueshmërisë
të nivelit të kënaqësisë ndërmjet grupeve. Intervali i besueshmërisë për nivelin e
kënaqësisë së punëtorëve është prej 3,127 deri në 3,998. Ai i mbikëqyrësve fillon prej
5,877 deri në 6,748. Nga këtu mund të kuptohet se kënaqësitë e punëtorëve dhe
mbikëqyrësve janë të ndryshme dhe se kënaqësia e punëtorëve është më e ulët. Intervali i
besueshmërisë në lidhje me kënaqësinë e menaxherëve fillon prej 7,815 deri në 8,685. Kjo

170
tregon që kënaqësia e menaxherëve është e ndryshme dhe më e lartë në krahasim me
mbikëqyrësit. Pra, edhe njëherë u vërtetua se ekzistojnë dallime të këtilla ndërmjet
nëngrupeve të faktorit pozita dhe se ky faktor ka ndikim në ndryshoren e varur kënaqësia.
Tabela 7.10: Tabela e Mesatareve Sipas Ndryshores së Pavarur Kohës

3. koha
Dependent Variable: kënaqësia

95% Confidence Interval

koha Mean Std. Error Lower Bound Upper Bound

java e parë 6.000 .248 5.498 6.502
3 muaj 6.333 .248 5.831 6.836
6 muaj 6.000 .248 5.498 6.502
1 vit 5.833 .248 5.331 6.336

Ndryshimet e përmendura në ndryshoren e pozitës nuk janë të vlefshme për kohën.
Këtu mesataret janë të përafërta me njëra-tjetrën dhe intervalet e besueshmërisë
përputhen. Në këtë mënyrë, është vrojtuar përsëri rezultati i arritur më lartë se faktori i
kohës si i vetëm nuk ka ndonjë ndikim të rëndësishëm mbi ndryshoren e kënaqësisë.
Tabela 7.11: Tabela e Mesatareve Sipas Bashkëveprimit të Pozitës-Kohës
4. koha * pozita
Dependent Variable: kënaqësia

95% Confidence Interval

koha pozita Mean Std. Error Lower Bound Upper Bound

java e parë punëtor 5.250 .429 4.380 6.120

mbikëqyrës 6.750 .429 5.880 7.620

menaxher 6.000 .429 5.130 6.870
3 muaj punëtor 4.500 .429 3.630 5.370
mbikëqyrës 6.500 .429 5.630 7.370
menaxher 8.000 .429 7.130 8.870
6 muaj punëtor 2.750 .429 1.880 3.620
mbikëqyrës 6.000 .429 5.130 6.870
menaxher 9.250 .429 8.380 10.120
1 vit punëtor 1.750 .429 .880 2.620

mbikëqyrës 6.000 .429 5.130 6.870

menaxher 9.750 .429 8.880 10.620

171
Edhe të dhënat nga kjo tabelë në lidhje me ndërveprimin pozita-koha mbështesin
rezultatet e mësipërme. Për shembull, intervalet e besueshmërisë së një punëtori nuk
përputhen në lidhje me nivelin e kënaqësisë në javën e parë, nivelin e kënaqësisë në fund të
gjashtë muajve dhe nivelin e kënaqësisë në fund të një viti. Pra ekziston dalllim. Përsëri ky
dallim në fund të javës së parë, në fund të tre muajve dhe në fund të një viti, është vrojtuar
plotësisht në mënyrë të kundërt për menaxherët. Me kalimin e kohës rritet kënaqësia në
punë për menaxherët. Kjo tregon që ndryshorja e kohës edhe në qoftë se nuk ka ndonjë
ndikim të rëndësishëm mbi kënaqësinë, ky ndryshim bëhet i rëndësishëm kur është në
bashkëveprim me ndryshoren e pozitës.
Tabelat e diskutuara të Estimated Marginal Means japin një kontribut të
rëndësishëm për ndryshoret e rastësishme. Këtu vrojtuam dallimet ndërmjet nëngrupeve
të faktorit të kohës të përcaktuar si random factor. Ashtu siç është specifikuar më parë,
testet Post Hoc të cilat bëjnë krahasime ndërmjet grupeve nuk aplikohen për faktorët e
rastësishëm. Në kushtet normale, krahasimet ndërmjet grupeve të faktorëve të rastësishëm
nuk tërheqin shumë vëmendjen, por në rastet kur tërheqin vëmendjen përdoren tabelat
Estimated Marginal Means të cilat u shpjeguan më lartë. Përsëri me testet Post Hoc nuk
mund të bëjmë interpretim mbi bashkëveprimet. Me tabelat Estimated Marginal Means
qe ofruar mundësia për të interpretuar bashkëveprimin e pozitës-kohës.
Testet Post Hoc zbulojnë vetëm dallimet ndërmjet grupeve të faktorëve fiks (fixed)
për ndryshoren e varur. Me testet Post Hoc mund të shohim ndryshimin ndërmjet
nëngrupeve të ndryshores pozita si faktor fiks në shembullin tonë.
Tabela 7.12: Tabela e Krahasimeve të Shumëfishta
Multiple Comparisons
Dependent Variable: kënaqësia
Tukey HSD

Mean 95% Confidence Interval

(I) pozita (J) pozita Difference (I-J) Std. Error Sig. Lower Bound Upper Bound
*
punëtor mbikëqyrës -2.7500 .30334 .000 -3.4914 -2.0086
*
menaxher -4.6875 .30334 .000 -5.4289 -3.9461
*
mbikëqyrës punëtor 2.7500 .30334 .000 2.0086 3.4914
*
menaxher -1.9375 .30334 .000 -2.6789 -1.1961
*
menaxher punëtor 4.6875 .30334 .000 3.9461 5.4289
*
mbikëqyrës 1.9375 .30334 .000 1.1961 2.6789

Based on observed means.
The error term is Mean Square(Error) = .736.
*. The mean difference is significant at the .05 level.

172
Për sigurimin e supozimit të homogjenitetit të variancave shikojmë rezultatet e
testit Tukey HSD. Vlerat të cilat kanë asteriks (*) pranë tyre në kolonën Mean Difference,
tregojnë se ekziston dallim ndërmjet atyre grupeve. Shenja e asteriksit (*) është vendosur
pranë atyreve të cilat gjenden nën 0,05 nga kolona Sig. Ndërmjet mesatares së kënaqësisë
së punëtorit dhe mesatares së kënaqësisë së mbikëqyrësit ekziston një dallim prej 2,75 dhe
ky dallim është i rëndësishëm. Shfaqja e dallimit me -2,75 tregon se mesatarja e punëtorëve
është më e ulët. Mesatarja e kënaqësisë së punëtorëve është për 4,6875 më e vogël se
mesatarja e kënaqësisë së menaxherëve. Kurse mesatarja e mbikëqyrësve është më e vogël
për 1,9375 nga menaxherët. Përfundimisht, ekziston një dallim i rëndësishëm në nivelin e
kënaqësisë ndërmjet të gjitha grupeve të ndryshores së pozitës. Sipas këtyre kushteve, në
qoftë se dëshirohet të krijohen nëngrupe të reja në ndryshoren e pozitës sipas nivelit të
kënaqësisë, do të krijohen 3 grupe të ndara sepse grupet janë plotësisht të ndryshme nga
njëra-tjetra. Tabela e mëposhtme e shpjegon këtë.
Tabela 7.13: Nëngrupet e Krijuara Sipas Ndryshorës së Pavarur Kënaqësisë
kënaqësia
a,b
Tukey HSD

Subset

pozita N 1 2 3

punëtor 16 3.5625
mbikëqyrës 16 6.3125
menaxher 16 8.2500
Sig. 1.000 1.000 1.000

Në grupin e parë gjenden punëtorët. Në grupin e dytë gjenden mbikëqyrësit dhe në
grupin e tretë menaxherët. Kurse vlerat në tabelë janë mesataret e nivelit të kënaqësisë për
secilin grup.

Figura 7.3: Nga grafiku tregues i ndryshimit të kënaqësisë sipas grupeve në
ndryshoren e pavarur,

 Vija e cila tregon rritje u përket menaxherëve
 Vija e cila është përafërsisht konstante u përket mbikëqyrësve
 Vija e cila ka rënie u përket punëtorëve.

Grafiku Estimated Marginal Means of kënaqësia tregon se si ndryshon niveli i
kënaqësive të punonjësve me pozita të ndryshme me kalimin e kohës. Boshti vertikal në
grafik tregon nivelin e kënaqësisë, kurse boshti horizontal tregon kohën. Vija në rritje e
nivelit të kënaqësisë i përket menaxherëve, vija e cila është përafërsisht konstante u përket
mbikëqyrësve dhe vija në rënie punëtorëve.

173
Rezultatet e përfituara nga ANOVA Dy Drejtimshe, mund të i përmbledhim në këtë
mënyrë:

 Kënaqësia në punë e menaxherëve është më e lartë se e mbikëqyrësve dhe
kënaqësia në punë e mbikëqyrësve është më e lartë se e punëtorëve.
 Ndikimi i pozitës së punës është i fuqishëm mbi kënaqësinë e punës.
 Ndikimi i pozitës dhe bashkëveprimit të kohës së kaluar në atë pozitë është i
fuqishëm.
 Nuk mund të bëhet një gjykim i veçantë apo i përgjithshëm për punëtorët,
mbikëqyrësit dhe menaxherët në lidhje me ndryshimin e kënaqësisë me kalimin
e kohës.
 Me kalimin e kohës zvogëlohet kënaqësia në punë e punëtorëve.
 Me kalimin e kohës nuk ndodh ndonjë ndryshim i rëndësishëm në kënaqësinë e
punës për mbikëqyrësit.
 Me kalimin e kohës rritet kënaqësia në punë e menaxherëve.

174
7.3. MANOVA NJË DREJTIMSHE
Në rastet kur një ndryshore e pavarur ndikon më shumë se në një ndryshore të
varur përdoret MANOVA Një Drejtimshe. Hipoza H0 në MANOVA Një Drejtimshe është se
nuk ekziston asnjë ndryshim mesatar në asnjë prej ndryshoreve të varura sipas grupeve të
faktorit. Kurse hipoteza alternative është se ekziston një dallim mesatar së paku në një
ndryshore të varur dhe së paku sipas dy grupeve të faktorit. Me fjalë të tjera, në qoftë se
vrojtohet një dallim ndërmjet mesatareve të ndryshores së varur vetëm nga dy grupe të
ndryshores së pavarur, hipoteza H0 refuzohet. Por nëse nuk gjendet asnjë ndryshim në
mesataret e asnjërës ndryshore të varur sipas grupeve të ndryshores së pavarur, hipoteza
H0 nuk refuzohet.

Supozimet themelore të MANOVA Një Drejtimshe janë të njëjta me të Anovës, por në
të njëjtën kohë supozim shtesë këtu është se kërkohet barazia e kovariancave për shkak që
ekzistojnë më shumë se një ndryshore e varur. Përderisa në ANOVA kërkohej kushti i
homogjenitetit të variancave të grupeve të brendshme të ndryshores së varur sipas
grupeve të ndryshores së pavarur, në MANOVA ekziston supozimi që përgjatë grupeve
korrelacionet ndërmjet ndryshoreve të varura janë të njëjta. Dhe testimi i këtij supozimi
është i mundur përmes SPSS-it.

7.3.1. SHEMBULL APLIKIMI

MANOVA Një Drejtimshe, do të shpjegohet më mirë përmes shembullit në Shtojcën
7.3. Mirëpo, duhet të ceket se do të ndeshemi me shumicën e detajeve të dhëna në ANOVA.
Në fund të aplikimit të Manovës, një pjesë e të dhënave nga SPSS-i janë të njëjta me
rezultatet e Anovës. Mirëpo, këtu unike janë tabela themelore e Manovës dhe disa tabela
tjera shtesë. Për këtë arsye, këtu nuk do të jepen detaje për temat të cilat qenë shpjeguar
gjatë aplikimit të Anovës.

Në shembullin e Shtojcës 7.3, një firmë kërkon të hulumtoj ndikimin e pozitës së
personelit punues femra dhe meshkuj në nivelin e kënaqësisë së punës. Pozita është
përcaktuar si ndryshore e pavarur dhe kënaqësia e femrave dhe kënaqësia e meshkujve
janë përcaktuar si ndryshore të varura. Rreth ndryshores së pozitës qenë përmendur 3
grupe. Këto janë punëtorët, mbikëqyrësit dhe menaxherët.

Për analizën e MANOVA Një Drejtimshe, në SPSS shkohet te menyja Analize,
General Lineal Model dhe nga këtu zgjedhet Multivariate. Në ekranin e hapur,
ndryshoret femrat dhe meshkujt për shkak që janë ndryshore të varura vendosen në pjesën
Dependent Variables, kurse ndryshorja pozita vendoset në pjesën Fixed Factor(s).

175
Hapi 1: Dritarja MANOVA Një Drejtimshe

Ekrani Multivariate ka shumë pak dallime prej ekranit Univariate. Ajo çfarë bie në
sy e para është se këtu nuk ekziston seksioni Randon Factor(s). Në përzgjedhjen
Multiavariate faktorët do të trajtohen plotësit si faktorë fiks. Një dallim tjetër i
Multivariate prej Univariate gjendet në menynë Options. Menyja Options duket si më
poshtë.

176
Hapi 2: Dritarja e Përzgjedhjeve

Në menynë Options, gjenden disa përzgjedhje të ndryshme për nga menyja Options
e Univariate. Këtu më së shumti përdoren Descriptive Statistics, Estimates of Effect Size,
Homogeneity Tests, Spread vs. Level Plot dhe SSCP Matrices. Këto përzgjedhje përveç SSCP
Matrices qenë shpjeguar në ANOVA Dy Drejtimshe. SSCP (Sum-of-squares and cross-
products) matrices përdoret për testimin e ndikimit të modelit nga tabelat e përfituara
me etiketimin e kësaj përzgjedhjeje. Përmes tabelës së totalit të katrorëve, mund të shihen
totali i katrorëve dhe totali i gabimit të katrorëve në lidhje me faktorët. Vlerat Estimates of
Effect Size llogariten me vlerat e përfituara nga matrica SSCP. Kryerja e kësaj llogaritje qe
shpjeguar në menynë Univariate. Në fund, mund të kuptohet ndikimi i faktorëve mbi
ndryshoret e varura.

Në menynë Options për të parë mesataret sipas ndryshores së pavarur dhe
intervalet e besueshmërisë, OVERALL dhe pozita barten në pjesën e djathtë, ashtu siç
shihet në ekranin e mësipërm. Përmes tabelave që do të përfitohen nga këtu, do të jetë e

177
mundur që të bëhen krahasime ndërmjet grupeve të ndryshores së pavarur. Pasi të bëhen
përzgjedhjet e duhura nga menyja Options, klikohet Continue dhe kthehemi në menynë
kryesore të Multivariate.

Në menynë Post Hoc, pozita bartet në pjesën Post Hoc Tests for dhe bëhet
etiketimi i përzgjedhjes Tukey për rastet kur sigurohet homogjeniteti i variancave dhe
përzgjedhjes Tamhane’s T2 për rastet kur nuk sigurohet homogjeniteti i variancave.
Përzgjedhja Post Hoc duket si më poshtë.

Hapi 3: Dritarja Post Hoc e Krahasimeve të Shumëfishta për Mesataret e Vrojtuara

Pasi të bëhen përzgjedhjet e duhura në menynë Post Hoc, duke klikuar butonin
Continue kthehemi te menyja kryesore Univariate.

Në MANOVA Një Drejtimshe, për shkak që ekziston vetëm një ndryshore e pavarur,
bëhet fjalë vetëm për ndikimet kryesore të kësaj ndryshore të pavarur mbi ndryshoren e
varur. Po të kishte pasur edhe një ndryshore tjetër të pavarur, do të duhej të shqyrtohej
edhe ndërveprimi i ndryshoreve të pavarura mbi ndryshoret e varura. Në rastet kur
ekziston vetëm një ndryshore e varur, nuk ka ndonjë kuptim përdorimi i përzgjedhjes
Model në menynë kryesore Multivariate. Vetëm se në menynë Model mund të zgjedhim
178
me cilën metodë të bëhet llogaritja e totalit të katrorëve dhe zaten aty është e përzgjedhur
në mënyrë standarte Type III.

Përsëri në menynë kryesore Multivariate për të parë lidhjen ndërmjet ndryshores
së pavarur dhe ndryshoreve të varura në mënyrë grafikore, mund të përdoret përzgjedhja
Plots, mirëpo kjo nuk është shumë e nevojshme sepse kemi vetëm një ndryshore të
pavarur. Për shembull, në qoftë se vendoset ndryshorja e pavarur pozita në boshtin
horizontal dhe njëra nga ndryshoret e varura në boshtin vertikal do të fitohen dy grafiqe të
ndara. Por siç e cekëm, në qoftë se ka vetëm një ndryshore të varur, kjo përzgjedhje nuk
është e nevojshme.

Në mënynë kryesore Multivariate duke klikuar butonin OK, përfitohen rezultatet e
analizës.

7.3.2. DALJET E SPSS-IT DHE INTERPRETIMI
Tabela 7.14: Rezultatet e Testit të Barazisë së Kovariancave

Box's Test of Equality
a
of Covariance Matrices

Box's M 5.315
F .831
df1 6
df2 46791.805
Sig. .546

Për të testuar supozimin e barazisë së kovariancave të ndryshoreve të varura
përgjatë grupeve në MANOVA, përdoret testi Box’s M. Në qoftë se këtu vlera p (Sig.) është
më e vogël se 0,05, hipoteza refuzohet dhe nuk është siguruar supozimi themelor i barazisë
së kovariancave. Në qoftë se nuk sigurohet barazia e kovariancave rezultatet e
Multivariate shihen me dyshim. Vlera p (Sig.) në tabelën e mësipërme është më e madhe
se 0,05. Me këtë rast është siguruar supozimi themelor i barazisë së kovariancave.
Tabela 7.15: Rezultatet e Testit Levene
a
Levene's Test of Equality of Error Variances

F df1 df2 Sig.

meshkujt 1.482 2 47 .237
femrat .723 2 47 .491

Levene’s Test of Equality of Error Variances bën testimin e supozimit tjetër,
barazinë e variancave ndërmjet grupeve të ndryshoreve të pavarura. Ky test jep rezultate
të ndryshme për secilën ndryshore të varur dhe kontrollon se a është siguruar barazia e

179
variancave ndërmjet grupeve të asaj ndryshoreje të varur sipas grupeve të ndryshores së
pavarur. Në qoftë se vlera p (Sig.) është më e madhe se 0,05, arrihet në përfundim se është
sigurar kushti i barazisë së variancave për atë ndryshore të varur. Sipas tabelës së
mësipërme, mund të konkludojmë se është arritur barazia e variancave për secilin grup të
ndryshoreve të varura meshkuj dhe femra. Vlera p e femrave është 0,491, e meshkujve
0,237 dhe që të dyja janë më të mëdha se 0,05.
Figura 7.5: Devijimet Standarte dhe Mesataret për Meshkujt

180
Figura 7.6: Devijimet Standarte dhe Mesataret për Femrat

Me grafikun e përfituar Spread vs. Level Plot mund të shohim në mënyrë vizuale
barazinë e variancave sipas ndryshoreve të varura meshkujt dhe femrat, e cila u testua me
testin Levene’s Test of Equality of Error Variances. Në tabelën Levene’s Test of Equality
of Error Variances vler p për ndryshoren e meshkujve ishte 0,237 dhe 0,49 për
ndryshoren e femrave. Pra, homogjeniteti i ndryshores së femrave është më kuptimplotë
për nga ndryshorja e meshkujve. Ky dallim mund të vërehet qartë po ashtu në grafiqet
Spread vs. Level Plot. Teksa devijimi standart i shfaqur përmes pikave në grafik ndryshon
ndërmjet 0,77 dhe 0,60 për meshkujt në Figurën 7.5, pikat e krijuara në Figurën 7.6 për
femrat, ndryshojnë ndërmjet 0,59 dhe 0,64. Hapësirat ndërmjet femrave janë më të vogla.
Në fund, sado që është arritur kushti i barazisë së variancave për të dyja ndryshoret e
varura dhe rezultatet e përfituara nga të dyjat sado të jenë të besueshme, rezultatet e
përfituara në lidhje me ndryshoren e varur femrat janë më të shëndetshme sesa rezultatet
e përfituara nga ndryshorja e varur meshkujt.

181
Tabela 7.16: Rezultatet MANOVA Një Drejtimshe për Testimin e Hipotezës H0

a
Multivariate Tests

Hypothesis Partial Eta
Effect Value F df Error df Sig. Squared
b
Intercept Pillai's Trace .990 2277.262 2.000 46.000 .000 .990
b
Wilks' Lambda .010 2277.262 2.000 46.000 .000 .990
b
Hotelling's Trace 99.011 2277.262 2.000 46.000 .000 .990
b
Roy's Largest Root 99.011 2277.262 2.000 46.000 .000 .990
pozita Pillai's Trace 1.148 31.653 4.000 94.000 .000 .574
b
Wilks' Lambda .051 79.004 4.000 92.000 .000 .775

Hotelling's Trace 14.761 166.064 4.000 90.000 .000 .881
c
Roy's Largest Root 14.492 340.552 2.000 47.000 .000 .935

a. Design: Intercept + pozita
b. Exact statistic
c. The statistic is an upper bound on F that yields a lower bound on the significance level.

Kjo pjesë është e rëndësishme për të kuptuar Këto kolona janë pjesa më e
ndikimin e ndryshores së pavarur pozita mbi rëndësishme për të kuptuar
ndryshoret e varura. Testet Pillai’s Test, Hotelling’s rezultatet e analizës Multivariate.
Trace dhe Roy’s Largest Root janë teste me vlera Veçanërisht kolona Sig. e cila teston
pozitive dhe në kolonën Value me rritjen e vlerave hipotezën themelore të Manovës.
konsiderohet se rritet kontributi i ndikimit të Këtu në qoftë se vlerat janë më të
faktorëve në model. Kurse Wilks’ Lambda është një vogla se 0,05, arrihet në përfundim
test i vlerave negative dhe në kolonën Value, me se ekziston një dallim i rëndësishëm
uljen e vlerave konsiderohet se ulet edhe kontributi i së paku ndërmjet dy grupeve të
ndikimit të faktorëve në model. Vlera Hotelling’s faktorëve dhe së paku një
Trace është gjithmonë më e madhe se vlera Pillai’s ndryshoreje të varur. Kurse kolona
Trace. Me zvogëlimin e tyre, këto vlera afrohen më Partial Eta Squared është e
shumë njëra-tjetrës. Përseri vlera Hotelling’s Trace rëndësishme për të kuptuar nivelin
është më e madhe apo e barabartë se vlera Roy’s e ndikimit të faktorëve. Kjo kolonë
Largest Root. Por, në qoftë se ekziston një është përfituar nga etiketimi i
korrelacion i fortë ndërmjet ndryshoreve të varura Estimates of effects size në
apo në qoftë se ndikimi i faktorëve është i dobët mbi menynë Options. Vlerat të cilat i
ndryshoret e varura, këto vlera përafrohen me afrohen 1-shit, tregojnë rritjen e
njëra-tjetrën. Testi më i besueshëm prej këtyre 4 ndikimit. Në shembullin tonë,
testeve është Pillai’s Trace. Kurse më i përdoruri ndikimi i faktorit të pozitës së
është Wilk’s Lambda. femrave apo meshkujve në
kënaqësinë e punës është i qartë.

182
Tabela 7.16, është tabela MANOVA e cila përdoret për të testuar hipotezën H 0. Në
një aplikim standart të MANOVA-së, zakonisht shikohet vetëm kolona Sig. dhe nga kjo
kolonë preferohet vlera Wilk’s Lambda. Në tabelën e mësipërme, sipas vlerës së kolonës
Sig. (e cila është më e vogël se 0,05) hiptoeza H0 refuzohet. Pra, ekziston një dallim
ndërmjet grupeve të femrave dhe meshkujve sipas grupeve të punëtorëve, mbikëqyrësve
dhe menaxherëve.

Në qoftë se është e nevojshme që të interpretohet në më detaje, vlerat tjera në
tabelë ofrojnë shpjegime të rëndësishme. Për shembull, sipas të dhënave të kolonës Partial
Eta Squared, faktori pozita ka një ndikim të fuqishëm mbi kënaqësinë. Përafërsia e vlerave
të testeve Hotelling’s Trace dhe Roy’s Largest Root tregon që ndryshoret e varura
(kënaqësia në punë e femrave dhe kënaqësia në punë e meshkujve) kanë një korrelacion të
lartë ndërmjet veti. Siç e shpjeguam edhe nga tabela, ky nuk është rezultati i vetëm që
mund të dal prej përafërsisë së këtyre vlerave. Mirëpo, mundësia tjetër është mundësia e
ndikimit të dobët të faktorëve dhe për arsye se të dhënat në kolonën Partial Eta Squared
nuk merren parasysh, mbet vetëm një mundësi dhe ajo është korrelacioni i lartë ndërmjet
ndryshoreve të varura.

Tabela 7.17: Matrica SSCP

Kjo matricë përdoret për të
Between-Subjects SSCP Matrix
testuar rëndësinë e ndikimit të
meshkujt femrat
faktorit të pozitës. Këto vlera
Hypothesis Intercept meshkujt 646.130 825.389 janë vlerat e totalit të katrorëve
femrat 825.389 1054.381 dhe rezultateve të kryqëzuara.
pozita meshkujt 111.115 120.905
Kjo matricë përdoret për të
femrat 120.905 146.213
kuptuar ndikimin e gabimit. Këto
Error meshkujt 23.365 -2.945
vlera, përdoren për të kuptuar
femrat -2.945 18.207 shkallën e ndikimit të faktorit.
Based on Type III Sum of Squares Për llogaritjen e vlerave të
kolonës Partial Eta Squared në
tabelën e mëparshme, mund të
shfyrtëzohen vlerat e matricës së
pozitës dhe matrica e gabimit.

Matrica SSCP, edhe pse nuk përdoret shumë për të shqyrtuar rezultatet e analizës,
është e rëndësishme për përfitimin e tabelës Multivariate. Arsyeja përse e kemi vendosur
këtë tabelë këtu nuk është për të nxjerrë ndonjë konkluzion nga kjo, mirëpo që ta kemi më
konkrete në mendje përgatitjen e tabelës Multivariate. Në të njëjtën kohë, nga kjo tabelë
mund të nxirren konkluzione të cilat përdoren në nivelet e larta të statistikës.

183
Tabela 18: Tabela e Analizës së Variancës

Tests of Between-Subjects Effects

Type III Sum Mean Partial Eta
Source Dependent Variable of Squares df Square F Sig. Squared
a
Corrected Model meshkujt 111.115 2 55.558 111.759 .000 .826
b
femrat 146.213 2 73.106 188.717 .000 .889
Intercept meshkujt 646.130 1 646.130 1299.743 .000 .965
femrat 1054.381 1 1054.381 2721.778 .000 .983
pozita meshkujt 111.115 2 55.558 111.759 .000 .826
femrat 146.213 2 73.106 188.717 .000 .889
Error meshkujt 23.365 47 .497
femrat 18.207 47 .387
Total meshkujt 754.000 50
femrat 1195.000 50
Corrected Total meshkujt 134.480 49

femrat 164.420 49

a. R Squared = .826 (Adjusted R Squared = .819)
b. R Squared = .889 (Adjusted R Squared = .885)
Tabela e mësipërme dhe të tjerat pas janë tabelat nga aplikimi i Anovës me të cilat
jemi mësuar tashmë. Në tabelën e mësipërme për të shqyrtuar ndikimin e faktorit pozita,
duhet të shikohet rreshti i pozitës. Janë dhënë rezultatet veç e veç për ndryshoren e varur
meshkujt dhe ndryshoren e varur femrat. Duke shikuar kolonën Sig. mund të arrihet në
përfundim se ekziston një dallim i rëndësishëm ndërmjet mesatareve të kënaqësisë së
punës së femrave sipas nëngrupeve të faktorit pozita. E njëjta gjë është e vlefshme edhe për
meshkujt. Me fjalë të tjera, faktori pozita ndikon në kënaqësinë e punës së femrave dhe
meshkujve sepse për të dytë vlera p (Sig.) është më e vogël se 0,05. Në qoftë se shikohet
kolona Partial Eta Squared, ndikimi i faktorit pozita është mjaft i fuqishëm. Përderisa
vlera për femra është 0,889, ajo për meshkuj është 0,826. Ndikimi i pozitës është i madh në
kënaqësinë e punës si për femrat ashtu edhe për meshkujt dhe njëkohësisht ndikimi i
pozitës është pak më shumë për femrat.

Tabela 7.19: Mesataret e Përgjithshme të Ndryshores së Pavarur

1. Grand Mean

95% Confidence Interval

Dependent Variable Mean Std. Error Lower Bound Upper Bound

meshkujt 3.605 .100 3.404 3.806
femrat 4.605 .088 4.428 4.783

184
Nga tabela 7.19, mund të shikojmë se kënaqësia e punës a është më e lartë për femrat
apo për meshkujt. (Femrat: 4,605, Meshkujt: 3,605). Kufinjtë e ulët dhe të lartë të
intervalit të besueshmërisë nuk përputhen me njëri-tjetrin.

Tabela 7.20: Mesataret e Ndryshoreve të Pavarura Sipas Grupeve të Pozitës

2. pozita

95% Confidence Interval

Dependent Variable pozita Mean Std. Error Lower Bound Upper Bound

meshkujt punëtor 1.882 .171 1.538 2.226

mbikëqyrës 3.333 .166 2.999 3.668

menaxher 5.600 .182 5.234 5.966
femrat punëtor 2.294 .151 1.990 2.598
mbikëqyrës 5.056 .147 4.760 5.351

menaxher 6.467 .161 6.143 6.790

Shumica e rezultateve të përfituara nga tabela Pozita (Tabela 7.20), mund të
nxirren edhe nga tabela Multiple Comparasions (Post Hoc). Ngaqë tabela Post Hoc është
më e lehtë për t’u lexuar, konkuzionet e tilla do të i bëjmë në tabelën Multiple
Comparasions. Rezultatet që mund t’i nxjerrim nga kjo tabelë e që nuk mund t’i nxjerrim
nga tabela Multiple Comparasions kanë të bëjnë me dallimet ndërmjet ndryshoreve të
varura.

Ajo çfarë bie në sy e para në tabelën e mësipërme është mosekzistimi i ndonjë
dallimi të rëndësishëm ndërmjet nivelit të kënaqësisë së femrave punëtore dhe nivelit të
kënaqësisë së meshkujve punëtorë. Teksa intervali i besueshmërisë së punëtorëve meshkuj
fillon prej 1,538 deri në 2,226, ai i punëtorëve ferma fillon prej 1,990 deri në 2,598. Këtu dy
intervale përputhen me njëra-tjetrën. Prandaj, nuk ekziston ndonjë dallim i rëndësishëm
ndërmjet tyre. Rasti i mbikëqyrësve dhe menaxherëve është i ndryshëm. Sipas mesatareve
dhe intervaleve të besueshmërisë në tabelë, femrat mbikëqyrëse për nga meshkujt
mbikëqyrës dhe femrat menaxhere për nga meshkujt menaxherë janë më të kënaqura nga
puna që bëjnë. Konkluzione të këtilla nuk mund të bëhen me testet Post Hoc të cilat
krahasojnë ndryshoret e varura.

Nga tabela Multiple Comparisons (Post Hoc) mund të mësohet se ndërmjet cilave
grupe të ndryshores së pavarur ekziston dallim për secilën ndryshore të varur. Në kolonën
Mean Difference, mund të thuhet se ekziston një dallim ndërmjet atyreve grupe të cilat
pranë kanë asteriks (*). Në të njëjtën mënyrë, nga kolona Sig., vlerat të cilat gjenden nën
0,05 tregojnë që ekziston një dallim ndërmjet grupeve.

185
Tabela 7.21: Tabela e Krahasimeve të Shumëfishta
Multiple Comparisons

95% Confidence

Mean Interval

Difference Std. Lower Upper
Dependent Variable (I) pozita (J) pozita (I-J) Error Sig. Bound Bound
*
meshkujt Tukey HSD punëtor mbikëqyrës -1.4510 .23845 .000 -2.0281 -.8739
*
menaxher -3.7176 .24977 .000 -4.3221 -3.1132

mbikëqyrës punëtor 1.4510* .23845 .000 .8739 2.0281
*
menaxher -2.2667 .24649 .000 -2.8632 -1.6701
*
menaxher punëtor 3.7176 .24977 .000 3.1132 4.3221
*
mbikëqyrës 2.2667 .24649 .000 1.6701 2.8632
*
Tamhane punëtor mbikëqyrës -1.4510 .23211 .000 -2.0358 -.8662
*
menaxher -3.7176 .23955 .000 -4.3272 -3.1081
*
mbikëqyrës punëtor 1.4510 .23211 .000 .8662 2.0358
*
menaxher -2.2667 .26243 .000 -2.9298 -1.6035
*
menaxher punëtor 3.7176 .23955 .000 3.1081 4.3272
*
mbikëqyrës 2.2667 .26243 .000 1.6035 2.9298
*
femrat Tukey HSD punëtor mbikëqyrës -2.7614 .21050 .000 -3.2709 -2.2520
*
menaxher -4.1725 .22048 .000 -4.7061 -3.6390
*
mbikëqyrës punëtor 2.7614 .21050 .000 2.2520 3.2709
*
menaxher -1.4111 .21759 .000 -1.9377 -.8845
*
menaxher punëtor 4.1725 .22048 .000 3.6390 4.7061
*
mbikëqyrës 1.4111 .21759 .000 .8845 1.9377
*
Tamhane punëtor mbikëqyrës -2.7614 .20742 .000 -3.2831 -2.2398
*
menaxher -4.1725 .21824 .000 -4.7259 -3.6192
*
mbikëqyrës punëtor 2.7614 .20742 .000 2.2398 3.2831
*
menaxher -1.4111 .22360 .000 -1.9766 -.8457
*
menaxher punëtor 4.1725 .21824 .000 3.6192 4.7259
*
mbikëqyrës 1.4111 .22360 .000 .8457 1.9766

Based on observed means.
The error term is Mean Square(Error) = .387.
*. The mean difference is significant at the .05 level.

Në tabelën e mësipërme, janë dhënë rezultatet e testeve Tukey dhe Tamhane veç e
veç për secilën ndryshore të varur meshkuj dhe femra. Ngaqë është siguruar kushti i
barazisë së variancave, është e mjaftueshme që të shikohen vetëm rezultatet Tukey.
186
Ndryshimi i mesatares së kënaqësisë ndërmjet punëtorëve dhe mbikëqyrësve të
ndryshores së varur meshkujt është 1,4510 dhe kjo është më e ulët për punëtorët. Dallimi
ndërmjet punëtorëve dhe menaxherëve është 3,7176 dhe kjo është më e ulët për punëtorët.
Dallimi ndërmjet mbikëqyrësve dhe menaxherëve është 2,2667 dhe kjo është më e ulët për
mbikëqyrësit. Për arsye se vlerat p janë më të vogla se 0,05, këto ndryshime janë plotësisht
të rëndësishme. Kurse për femrat, dallimi ndërmjet punëtorëve dhe mbikëqyrësve është
2,7614 dhe kjo është më e vogël për punëtorët. Dallimi ndërmjet punëtorëve dhe
menaxherëve është 4,1725 dhe kjo është më e vogël për punëtorët. Dallimi ndërmjet
mbikëqyrësve dhe menaxherëve është 1,4111 dhe kjo është më e vogël për mbikëqyrësit.
Për arsye se vlerat p janë më të vogla se 0,05, këto ndryshime janë plotësisht të
rëndësishme.
Tabela 7.22: Nëngrupet e Formuara Sipas Ndryshoreve të Pavarura Meshkuj dhe
Femra

meshkujt

Subset

pozita N 1 2 3
a,b,c
Tukey HSD punëtor 17 1.8824

mbikëqyrës 18 3.3333

menaxher 15 5.6000

Sig. 1.000 1.000 1.000

femrat

Subset

pozita N 1 2 3
a,b,c
Tukey HSD punëtor 17 2.2941

mbikëqyrës 18 5.0556

menaxher 15 6.4667

Sig. 1.000 1.000 1.000

Në përfundim, përfitimi i tabelave të mësipërme nuk është surprizë. Për arsye të
dallimeve të mesatareve sipas të gjitha grupeve të faktorit të pozitës në çdo ndryshore të
varur, numri i nëngrupeve të formuara në ndryshoret e varura është sa numri i grupeve të
ndryshores së pavarur. Këto tabela paraqesin mesataret e secilit grup veç e veç për
ndryshoret e varura meshkuj dhe femra. Dallimet ndërmjet grupeve mund të kuptohen në
mënyrë të qartë nga Tabela 7.22.

187
Nga aplikimi i shembullit, sipas rezultateve të analizës MANOVA Një Drejtimshe,
mund të nxjerrim këto konkluzione:

 Faktori i pozitës ndikon në kënaqësinë e punës qoftë për meshkujt apo femrat.
 Me rritjen e pozitës në punë, rritet kënaqësia e punës për femrat.
 Me rritjen e pozitës në punë, rritet kënaqësia e punës për meshkujt.
 Nuk ekziston dallim i kënaqësisë në punë ndërmjet punëtorëve femra dhe
meshkuj
 Femrat të cilat punojnë si mbikëqyrëse dhe menaxhere janë më të kënaqura për
nga meshkujt të cilat punojnë në këto pozita.

Përpara se të kalojmë në analizën MANOVA Dy Drejtimshe, është me dobi që të
mbahet në mend kjo. Ekzistojnë përngjasime të rëndësishme ndërmjet përzgjedhjeve dhe
tabelave të rezultateve të MANOVA Një Drejtimshe dhe përzgjedhjeve dhe tabelave të
rezultateve të ANOVA-së gjatë përdorimit të SPSS-it. Për këtë arsye, për ta kuptuar më lehtë
aplikimin e MANOVA-së Një Drejtimshe, sugjerohet që të lexoni pjesën e ANOVA-së në këtë
libër.

7.4. MANOVA DY DREJTIMSHE
MANOVA Dy Drejtimshe është si një përzierje e ANOVA-së Një Drejtimshe dhe
MANOVA-së Dy Drejtimshe. Hulumtohet ndikimi i dy ndryshoreve të pavarura në më
shumë se një ndryshore të varur. Hipoteza H0 këtu supozon se nuk ekziston asnjë dallim i
mesatareve në asnjë ndryshore të varur sipas grupeve të faktorëve. Në qoftë se vrojtohet
një dallim vetëm në një ndryshore të varur, hipoteza refuzohet.

Gjatë shqyrtimit të temës së MANOVA Dy Drejtimshe, nuk kemi për qëllim të japim
informata shtesë. Duke përdorur përsëri menynë Multivariate për këtë aplikim në SPSS,
menytë e përzgjedhjeve dhe tabelat të cilat do të përfitohen në fund të analizës janë
shpjeguar në mënyrë të detajuar në ANOVA Dy Drejtimshe dhe në MANOVA Një
Drejtimshe. Me një shembull shtesë këtu synohet që të bëhet konsolidimi i temave tjera si
dhe dhënia e një shembulli në lidhje me MANOVA Dy Drejtimshe. Gjatë sqarimit të
shembullit, lexuesi do të udhëzohet për shpjegimin e detajeve në lidhje me menytë që do të
paraqiten dhe tabelat.

7.4.1. SHEMBULL APLIKIMI
Shembulli është shpjeguar në Shtojcën 7.4. Bëhet hulumtimi i ndikimit të pozitës së
punonjësve dhe departamentit në të cilin punojnë mbi kënaqësinë e punës që punojnë,
përvetësimin e politikave të firmës dhe dëshirës për të qëndruar në firmë (përherë).

188
Në SPSS, në pjesën Analyze, General Linear Model, përzgjedhet Multivariate. Në
menynë kryesore Multivariate, ndryshoret pozita dhe departamenti barten në pjesën
Fixed Factor(s), kurse ndryshoret kënaqësia, përvetësimi dhe qëndrueshmëria barten në
pjesën Dependent Variables. Ekrani i menysë kryesore të Multivariate duket si më
poshtë.

Hapi 1: Dritarja MANOVA Dy Drejtimshe

Nga këtu, detajet e përzgjedhjeve Model, Plots dhe Save janë shpjeguar në ANOVA
Një Drejtimshe, detajet e përzgjedhjes Post Hoc janë shpjeguar në ANOVA Një Drejtimshe
dhe ANOVA Dy Drejtimshe dhe detajet e Options janë shpjeguar në MANOVA Një
Drejtimshe. Përsëri për pjesët Covariate(s) dhe WLS Weight janë dhënë shkurtimisht
informata në ANOVA Dy Drejtimshe. Këtu do të tregohen dritaret për etiketimin e
përzgjedhjeve të duhura dhe nuk do të futemi në detaje.

Në pjesën Model, përzgjedhjet e duhura janë të vetëpërcaktuara. Për këtë arsye këtu
nuk mund të kryhet ndonjë funksion. Klikohet në butonin Plots. Nga ekrani i hapur,
ndryshorja departamenti vendoset në pjesën Horizontal Axis, kurse ndryshorja pozita
vendoset në pjesën Separate Lines dhe ekrani do të duket si më poshtë.

189
Në ekranin Plot pasi të përcaktohen boshti horizontal dhe vijat e ndara, duhet të
klikohet butoni Add. Në qoftë se nuk klikohet ky buton, SPSS-i nuk do të i vizatoj grafiqet.
Pastaj duke klikuar në butonin Continue, bëhet kthimi te menyja kryesore Multivariate.

Hapi 2: Dritarja e Grafiqeve

190
Hapi 3: Dritarja e Krahasimeve të Shumëfishta Post Hoc për Mesataret e Vrojtuara

Pastaj klikohet në butonin Post Hoc dhe bëhet transferimi i faktorëve (ndryshoreve
të pavarura) në pjesën Post Hoc Tests for. Përzgjedhen testet Tukey dhe Tamhane’s T2
dhe duke klikuar në butonin Continue bëhet kthimi te menyja kryesore Multivariate.

191
Hapi 4: Dritarja e Përzgjedhjeve

Nga menyja kryesore Multivariate, klikohet butoni Options dhe bëhet hyrja te
menyja Options. Në këtë meny, pozita, departamenti dhe pozita*departamenti
(bashkëveprimi i pozitës me departamentin) barten në pjesën Display Means for. Duke
etiketuar përzgjedhjet Homogeneity tests dhe Estimates of effect size klikohet butoni
Continue. Nga menyja Multivariate klikohet butoni OK dhe përfitohen rezultatet e
MANOVA-së Dy Drejtimshe.

7.4.2. DALJET E SPSS-IT DHE INTERPRETIMI
Në Tabelën 7.23 është dhënë numri i mostrave të secilit nëngrup të ndryshores së
pavarur. Numri i përafërt i mostrave është i rëndësishëm për shëndetin e rezultateve.

192
Tabela 7.23: Madhësitë e Mostrave të Grupeve

Between-Subjects Factors

Value Label N

pozita 1.00 Punëtor 39

2.00 Mbikëqyrës 44

3.00 Menaxher 42
departamenti 1.00 Prodhim 25

2.00 Aksione 26

3.00 Kontabilitet 24

4.00 Marketing 26

5.00 H&Zh 24

Tabela 7.24: Rezultatet e Testit të Supozimit të Barazisë së Kovariancave

Box's Test of Equality
of Covariance
a
Matrices

Box's M 122.279
F 1.212
df1 84
df2 9862.734
Sig. .091

Tabela Box’s M bën testimin e barazimit të matricave të kovariancave. Ngaqë vlera
p (Sig.) është më e madhe se 0,05 arrijmë në përfundim se matricat e kovariancave janë të
barabarta. Mirëpo, përafërsia e vlerave 0,05 dhe 0,091 do të ulë vlerën e rezultateve në një
masë.

Tabela 7.25: Rezultatet e Testit të Supozimit të Variancave

a
Levene's Test of Equality of Error Variances

F df1 df2 Sig.

kënaqësia .887 14 110 .574
përvetësimi .562 14 110 .889
qëndrueshmëria .717 14 110 .754

Sipas tabelës Levene’s Test of Equality of Error Variances është siguruar barazia
e variancave për secilën ndryshore të varur sipas grupeve të ndryshoreve të pavarura.

193
Tabela 7.26: Krahasimet e Shumëfishta
a
Multivariate Tests

Hypothesis Partial Eta
Effect Value F df Error df Sig. Squared
b
Intercept Pillai's Trace .988 2871.129 3.000 108.000 .000 .988
b
Wilks' Lambda .012 2871.129 3.000 108.000 .000 .988
b
Hotelling's Trace 79.754 2871.129 3.000 108.000 .000 .988
b
Roy's Largest Root 79.754 2871.129 3.000 108.000 .000 .988
pozita Pillai's Trace .915 30.645 6.000 218.000 .000 .458
b
Wilks' Lambda .135 61.845 6.000 216.000 .000 .632
Hotelling's Trace 6.014 107.258 6.000 214.000 .000 .750
c
Roy's Largest Root 5.952 216.251 3.000 109.000 .000 .856
departamenti Pillai's Trace 1.100 15.918 12.000 330.000 .000 .367
Wilks' Lambda .104 32.243 12.000 286.033 .000 .530
Hotelling's Trace 6.696 59.522 12.000 320.000 .000 .691
c
Roy's Largest Root 6.403 176.086 4.000 110.000 .000 .865
pozita * departamenti Pillai's Trace .662 3.893 24.000 330.000 .000 .221

Wilks' Lambda .449 4.159 24.000 313.834 .000 .234

Hotelling's Trace .994 4.419 24.000 320.000 .000 .249
c
Roy's Largest Root .711 9.775 8.000 110.000 .000 .416

a. Design: Intercept + pozita + departamenti + pozita * departamenti
b. Exact statistic
c. The statistic is an upper bound on F that yields a lower bound on the significance level.

Nga tabela Multivariate Tests, në përgjithësi përdoren rezutlatet Wilk’s Lambda
sado që testi Pillai’s Trace të jetë testi më i besueshëm,. Në tabelën Multivariate Tests
janë dhënë rezultatet e ndikimeve kryesore të ndryshoreve pozita dhe departamenti mbi
ndryshoret e varura si dhe në të njëjtën kohë ndikimi i bashkëveprimit të ndërveprimit
pozita*departamenti mbi ndryshoret e varura. Në kolonën Sig. të gjitha vlerat janë më të
vogla se 0,05. Sipas vlerave të kolonës Sig. ndikimet e ndryshores së pozitës, ndryshores së
departamentit dhe bashkëveprimit të pozitës*departamentit mbi ndryshoret e varura janë
të rëndësishme. Në qoftë se shikohet kolona Partial Eta Squared, sipas testit Wilks’
Lambda, vlera e pozitës është 0,632, vlera e departamentit është 0,530 dhe vlera e
pozitës*departamentit është 0,234. Duke shikuar këto vlera, ndikimet e ndryshoreve pozita
dhe departamenti janë të fuqishme ndaras dhe në të njëjtën kohë ndikimi i bashkëveprimit
pozita*departamenti është mi i dobët për nga këto dyja.

194
Tabela 7.27: Tabela e Analizës së Variancës

Tests of Between-Subjects Effects

Type III Sum of Mean Partial Eta
Source Dependent Variable Squares df Square F Sig. Squared
a
Corrected Model kënaqësia 432.484 14 30.892 38.708 .000 .831
b
përvetësimi 517.512 14 36.965 48.821 .000 .861
c
qëndrueshmëria 502.061 14 35.862 30.254 .000 .794
Intercept kënaqësia 4082.927 1 4082.927 5116.001 .000 .979
përvetësimi 4775.021 1 4775.021 6306.481 .000 .983
qëndrueshmëria 3960.952 1 3960.952 3341.629 .000 .968
pozita kënaqësia 344.348 2 172.174 215.738 .000 .797
përvetësimi 328.696 2 164.348 217.058 .000 .798
qëndrueshmëria 279.909 2 139.954 118.072 .000 .682
departamenti kënaqësia 58.735 4 14.684 18.399 .000 .401
përvetësimi 133.688 4 33.422 44.141 .000 .616
qëndrueshmëria 203.978 4 50.995 43.021 .000 .610
pozita * departamenti kënaqësia 23.079 8 2.885 3.615 .001 .208
përvetësimi 47.152 8 5.894 7.784 .000 .361
qëndrueshmëria 22.995 8 2.874 2.425 .019 .150
Error kënaqësia 87.788 110 .798
përvetësimi 83.288 110 .757
qëndrueshmëria 130.387 110 1.185
Total kënaqësia 4679.000 125
përvetësimi 5468.000 125
qëndrueshmëria 4688.000 125
Corrected Total kënaqësia 520.272 124

përvetësimi 600.800 124

qëndrueshmëria 632.448 124

a. R Squared = .831 (Adjusted R Squared = .810)
b. R Squared = .861 (Adjusted R Squared = .844)
c. R Squared = .794 (Adjusted R Squared = .768)

Në qoftë se shikojmë Tabelën Test of Between-Subjects, do të vërhet se secila
ndryshore e pavarur ka një ndikim kuptimplotë mbi ndryshoret e varura. Po të vështrojmë
kolonën Sig. për pozitën, departamentin dhe pozita*departamenti do të vërejmë se secila ka
një ndikim të rëndësishëm mbi kënaqësinë, përvetësimin dhe qëndrueshmërinë. Të gjitha
vlerat janë më të vogla se 0,05. Po të vështrojmë kolonën Partial Eta Squared, do të

195
vërejmë se pozita ka ndikimin më të lartë mbi kënaqësinë dhe përvetësimin dhe se
bashkëvepimi pozita*departamenti ka ndikimin më të ulët mbi kënaqësinë dhe
përvetësimin. Përderisa ndryshorja departamenti ka një ndikim më të madh mbi ndryshoret
përvetësimi dhe qëndrueshmëria, ajo ka një ndikim relativisht më të ulët mbi ndryshoren
kënaqësia.

Tabela Multiple Comparisons nuk është vendosur këtu për shkak të madhësisë së
faqes. Në ANOVA Një Drejtimshe, ANOVA Dy Drejtimshe dhe MANOVA Një Drejtimshe
është shpjeguar se si bëhet leximi i kësaj tabele. Në qoftë se shikojmë ndryshoren e pavarur
pozita në tabelën Post Hoc (Multiple Comparisons) do të vërehet se të gjitha pozitat kanë
pikëpamje të ndryshme në lidhje me kënaqësinë në punë, përvetësimin e politikave të
firmës dhe dëshirës për të qëndruar në firmë. Menaxherët janë më të kënaqur në punë, i
përvetësojnë më shumë politikat dhe kanë më shumë dëshirë që të jenë të përhershëm në
punë në krahasim me mbikëqyrësit. Kurse mbikëqyrësit janë më të kënaqur në punë, i
përvetësojnë më shumë politikat dhe kanë më shumë dëshirë që të jenë të përhershëm në
punë në krahasim me punëtorët.

Tabela 7.28: Nëngrupet e Formuara për Ndryshoren e Varur Kënaqësia Sipas
Ndryshores së Pavarur Pozita

kënaqësia
a,b,c
Tukey HSD

Subset

pozita N 1 2 3

Punëtor 39 3.7179
Mbikëqyrës 44 5.5909
Menaxher 42 7.8571
Sig. 1.000 1.000 1.000

Në Tabelën Kënaqësia këto ndryshime mund të vërehen shumë qartë. Vlerat e
paraqitura në tabelë tregojnë mesataret e kënaqësisë për punëtorët, mbikëqyrësit dhe
menaxherët. Ngaqë ekzistojnë dallime të rëndësishme ndërmjet tyre, janë krijuar nëngrupe
të ndryshme. Në qoftë se do të shikonim tabelat e përvetësimit dhe qëndrueshmërisë, do
të vërehen rezultate të ngjashme. Përmes këtyre tabelave mund të shohim përmbledhjen e
rezultateve të arritura nga tabela Multiple Comparisons.

Në qoftë se do të shikonim tabelën Multiple Comparison të përgatitur sipas
ndryshores departamenti (përsëri për shkak të madhësisë tabelës nuk i është dhënë vend
këtu), do të vërejmë se kënaqësia e punës është më e lartë në departamentin H&Zh dhe se
kënaqësia më e ulët e punës është në departamentin e aksioneve. Kënaqësia e punës në
departamentin e marketingut sado që për një shumë është më e vogël, nuk ka ndonjë

196
dallim të rëndësishëm ndërmjet departamentit H&Zh dhe të marketingut në kënaqësinë e
punës.

Përsëri sipas tabelës Multiple Comparisons, departamenti H&Zh dhe departamenti
i marketingut përvetësojnë më shume biznesin dhe departamenti i aksioneve, kontabilitetit
dhe prodhimit përvetësojnë më pak politikat e biznesit. Në lidhje me qëndrueshmërinë në
firmë janë arritur pothuajse rezultate plotësisht të kundërta. Përderisa ata të
departamentit të stoqeve dëshirojnë që të qëndrojnë më shumë në firmë, këta të
departamentit H&Zh dhe të marketingut dëshirojnë më pak që të jenë të përhershëm në
firmë. Në tabelat e mëposhtme këto rezultate mund të vrojtohen në mënyrë më të qartë.

Tabela 7.29: Nëngrupet e Formuara të Ndryshores së Varur Kënaqësia Sipas Ndryshores
së Pavarur Departamenti

kënaqësia
a,b,c
Tukey HSD

Subset

departamenti N 1 2 3 4

Aksione 26 4.7308
Prodhim 25 5.4800
Kontabilitet 24 5.6667 5.6667
Marketing 26 6.1923 6.1923
H & Zh 24 6.8333
Sig. 1.000 .947 .237 .090

Tabela Kënaqësia e cila jep mesataret e kënaqësisë sipas departamenteve tregon se
si mund të klasifikohen nivelet e kënaqësive sipas departamenteve. Niveli i kënaqësisë
është më i lartë për punonjësit në departamentin e Marketingut dhe H&Zh. Kurse
departamenti i stoqeve është departamenti i cili ofron kënaqësinë më të ulët.

197
Tabela 7.30: Nëngrupet e Formuara të Ndryshores së Varur Përvetësimi Sipas
Ndryshores së Pavarur Departamenti

përvetësimi
a,b,c
Tukey HSD

Subset

departamenti N 1 2

Aksione 26 5.1538
Kontabilitet 24 5.2500
Prodhim 25 5.8000
Marketing 26 7.4615
H & Zh 24 7.5417
Sig. .073 .998

Sipas Tabelës Përvetësimi, departamentet të cilat kanë përvetësuar më shumë
biznesin janë departamenti i marketingut dhe H&Zh. Kurse departamentet që kanë
përvetësuar më pak janë ai i stoqeve, kontabilitetit dhe prodhimit. Në qoftë se shikojmë
vlerat p (Sig.) në lidhje me përvetësimin e biznesit, punonjësit e departamentit të
marketingut dhe H&Zh kanë formuar një grup kuptimplotë. Sado që këto vlera të i afrohen
1-shit, grupi do të jetë po aq më kuptimplotë.

Tabela 7.31: Nëngrupet e Formuara të Ndryshores së Varur Qëndrueshmëria sipas
Ndryshore së Varur Departamentit

qëndrueshmëria
a,b,c
Tukey HSD

Subset

departamenti N 1 2 3 4

H & Zh 24 4.1667
Marketing 26 4.4615
Kontabilitet 24 5.6667
Prodhim 25 6.6000
Aksione 26 7.5000
Sig. .874 1.000 1.000 1.000

Tabela Qëndrueshmëria paraqet rezultate interesante. Po të shikojmë tabelën,
punonjësit sado që të mund të jenë të kënaqur nga puna dhe sado që të e përvetësojnë
punën, mund që të mos dëshirojnë të jenë të përhershëm në firmë. Punonjësit e
departamentit të aksioneve përderisa e përvetësojnë më së paku punën, dëshirojnë që të

198
jenë të përhershëm në firmë më shumë se të tjerët. Kurse punonjësit e departamentit të
marketingut dhe H&Zh të cilët e pëvetësojnë më shumë punën, janë ata që mendojnë më
pak të jenë të përhershëm në firmë. Në të vërtet ky rezultat nuk është edhe shumë
interesant. Punonjësit e H&Zh janë njerëz të kualifikuar. Kurse punonjësit e marketingut
janë në një pozitë më shoqërore. Këta punonjës të këtyre departamenteve kanë mundësinë
që të marrin propozime më tërheqëse në çdo moment. Kurse nuk mund të thuhet e njëjta
gjë për departamentin e aksioneve. Sado që të mos jenë të kënaqur nga puna, sado që të
mos e përvetësojnë punën, ata nuk kanë alternativa tjera para tyre. Për këtë arsye, ata
dëshirojnë që të jenë të përhershëm në firmë. Gjatë përcaktimit të politikave të firmës,
duhet të kihen parasysh këta faktorë.

Tani përsëri në qoftë se do konsideronim ndikimet e faktorit pozita dhe ndikimet e
faktorit departamenti mbi ndryshoret e varura, do të kuptohej fare qartë se ekziston një
bashkëveprim ndërmjet këtyre dy faktorëve. Përderisa mesataret e të gjitha ndryshoreve të
varura rriten me kalimin nëpër grupet (punëtor, mbikëqyrës dhe menaxher) e faktorit
pozita, një lidhje e tillë nuk ekziston ndërmjet departamenteve. Veçanërisht sipas
departamenteve, dallimet në ndryshoren e varur qëndrueshmëria janë të ndryshme për nga
dallimet në ndryshoret e varura kënaqësia dhe përvetësimi. Prandaj, duke i marrë parasysh
pozitat në këto departamente, do të arrihen rezultate më të shëndetshme.

Këto që thamë do të kuptohen më mirë në qoftë se shikojmë tabelën
pozita*departamenti e cila gjenden nën titullin Estimated Marginal Means nga
rezultatet e SPSS-it.

Tabela 7.32: Intervalet e Besueshmërisë

3. pozita * departamenti

Dependent 95% Confidence Interval

Variable pozita departamenti Mean Std. Error Lower Bound Upper Bound

kënaqësia Punëtor Prodhim 2.750 .316 2.124 3.376

Aksione 3.125 .316 2.499 3.751

Kontabilitet 3.875 .316 3.249 4.501

Marketing 4.125 .316 3.499 4.751

H & Zh 4.857 .338 4.188 5.526

Mbikëqyrës Prodhim 5.889 .298 5.299 6.479

Aksione 4.000 .298 3.410 4.590

Kontabilitet 5.125 .316 4.499 5.751

Marketing 5.667 .298 5.077 6.257
H & Zh 7.222 .298 6.632 7.812

Menaxher Prodhim 7.750 .316 7.124 8.376

199
Aksione 6.889 .298 6.299 7.479

Kontabilitet 8.000 .316 7.374 8.626

Marketing 8.556 .298 7.965 9.146

H & Zh 8.125 .316 7.499 8.751
përvetësimi Punëtor Prodhim 2.875 .308 2.265 3.485
Aksione 3.125 .308 2.515 3.735
Kontabilitet 4.625 .308 4.015 5.235
Marketing 5.750 .308 5.140 6.360
H & Zh 5.857 .329 5.205 6.509
Mbikëqyrës Prodhim 6.000 .290 5.425 6.575
Aksione 4.222 .290 3.647 4.797
Kontabilitet 4.000 .308 3.390 4.610
Marketing 6.889 .290 6.314 7.464
H & Zh 7.667 .290 7.092 8.241
Menaxher Prodhim 8.500 .308 7.890 9.110
Aksione 7.889 .290 7.314 8.464
Kontabilitet 7.125 .308 6.515 7.735
Marketing 9.556 .290 8.981 10.130
H & Zh 8.875 .308 8.265 9.485
qëndrueshmëria Punëtor Prodhim 3.875 .385 3.112 4.638

Aksione 6.500 .385 5.737 7.263

Kontabilitet 3.500 .385 2.737 4.263

Marketing 3.000 .385 2.237 3.763

H & Zh 2.286 .412 1.470 3.101

Mbikëqyrës Prodhim 7.000 .363 6.281 7.719

Aksione 6.889 .363 6.170 7.608
Kontabilitet 5.750 .385 4.987 6.513

Marketing 4.222 .363 3.503 4.941

H & Zh 3.889 .363 3.170 4.608

Menaxher Prodhim 8.875 .385 8.112 9.638

Aksione 9.000 .363 8.281 9.719

Kontabilitet 7.750 .385 6.987 8.513

Marketing 6.000 .363 5.281 6.719

H & Zh 6.125 .385 5.362 6.888

200
Sipas kësaj tabele, përderisa punëtorët e marketingut dhe H&Zh kanë kënaqësinë
më të lartë në punë dhe kanë përvetësimin më të madh të punës, kanë dëshirë më së paku
të jenë të përhershëm në firmë. Sipas tabelës, e njëjta situatë është e vlefshme edhe për
mbikëqyrësit dhe menaxherët.

Përderisa punëtorët e departamentit të prodhimit dhe aksioneve kanë kënaqësinë
më të ulët të punës dhe përvetësim më të vogël të punës, dëshirojnë që të jenë të
përhershëm në firmë, sidomos punëtorët e departamentit të aksioneve. Niveli më i ulët i
kënaqësisë dhe përvetësimi më i vogël i mbikëqyrësve është në departamentet e aksioneve
dhe kontabilitetit, kurse dëshira më e madhe për të qëndruar në firmë është në
departamentet e prodhimit dhe aksioneve. Niveli më i ulët i kënaqësisë së menaxherëve
është në departamentin e aksioneve, përvetësimi më i ulët i biznesit është në
departamentin e kontabilitetit dhe dëshira më e madhe për të qëndruar në firmë është në
departamentet e prodhimit dhe aksioneve.

Nga Tabela pozita*departamenti është e mundur që të nxirren më shumë
konkluzione, por ky interpretim është i mjaftueshëm për të kuptuar ndërveprimin
ndërmjet pozitës dhe departamentit.

Figura 7.7: Nga grafiku tregues i ndryshimit të kënaqësisë sipas grupeve të
ndryshoreve të pavarura,

 Vija më e lartë u përket menaxherëve
 Vija e mesme u përket mbikëqyrësve
 Vija e poshtme u përket punëtorëve.

Grafiku Estimated Marginal Means of kënaqësia përdoret për të shikuar në
mënyrë vizuale ndryshimin e kënaqësisë sipas departamenteve dhe pozitave. Boshti
horizontal paraqet departamentet, kurse boshti vertikal paraqet nivelin e kënaqësisë. Vija
më e lartë paraqet menaxherët, vija e mesme mbikëqyrësit dhe vija e poshtme punëtorët.
Përmes këtij grafiku mund të kuptohet ndërveprimi pozita*departamenti. Për shembull, një
punëtor i cili punon në departamentin H&Zh, mund më të ketë një nivel më të lartë të
kënaqësisë në punë për nga një shef i departamentit të aksioneve.

201
Figura 7.8: Nga grafiku tregues i ndryshimit të përvetësimit sipas grupeve të
ndryshoreve të pavarura,

 Vija më e lartë u përket menaxherëve
 Vija e mesme u përket mbikëqyrësve
 Vija e poshtme u përket punëtorëve.

Grafiku Estimated Marginal Means of përvetësimi përdoret për të shikuar në
mënyrë vizuale ndryshimin e përvetësimit sipas departamenteve dhe pozitave. Në këtë
grafik, boshti vertikal paraqet nivelin e përvetësimit të politikave të firmës. Vija më e lartë
paraqet menaxherët, vija e mesme mbikëqyrësit dhe vija e poshtme punëtorët. Ndryshimi
në përvetësimin e politikave të firmës sipas departamenteve dhe pozitave mund të shihet
shumë qartë.

202
Figura 7.9: Nga grafiku tregues i ndryshimit të qëndrueshmërisë sipas grupeve të
ndryshoreve të pavarura,

 Vija më e lartë u përket menaxherëve
 Vija e mesme u përket mbikëqyrësit
 Vija e poshtme u përket punëtorëve.

Grafiku Estimated Marginal Means of qëndrueshmëria në lidhje me dëshirën për
të qëndruar në firmë, ashtu si grafiqet e tjera, paraqet në mënyrë vizuale dallimin e
dëshirës për të qëndruar në firmë sipas departamenteve dhe pozitave. Përsëri vija më e
lartë paraqet menaxherët, vija e mesme mbikëqyrësit dhe vija e poshtme punëtorët. Boshti
vertikal këtu përcakton nivelin e qëndrueshmërisë në firmë.

203
Gjatë leximit të grafiqeve një gjë e cila duhet të kihet parasysh është se nuk mund të
bëhet në mënyrë të qartë interpretimi për dallimet ndërmjet grupeve vetëm përmes
grafiqeve. Për të thënë se ekziston një dallim i rëndësishëm ndërmjet dy grupeve, nuk është
e mjaftueshme që të shohim se ekziston një dallim numëror ndërmjet mesatareve. Ekziston
nevoja për testet të cilat tregojnë se sa është kuptimplotë ky dallim. Për këtë arsye, sado që
këto grafiqe janë të dobishme për nga aspekti i paraqitjes vizuale të mesatareve sipas
grupeve, nuk janë të mjaftueshme si të vetme. Interpretimet duhet të bëhen duke përdorur
tabelat e përmendura gjatë shpjegimit, të cilat mundësojnë të kuptojmë dallimet ndërmjet
grupeve.

Në fund, rezultatet që mund të i nxjerrim nga ky shembull janë:

 Menaxherët janë më të kënaqur se mbikëqyrësit dhe mbikyqrësit më të
kënaqur se punëtorët.
 Menaxherët përvetësojnë më shumë punën se mbikëqyrësit dhe
mbikëqyrësit më shumë se punëtorët.
 Menaxherët dëshirojnë që të jenë të përhershëm në firmë më shumë se
mbikëqyrësit dhe mbikëqyrësit më shumë se punëtorët.
 Punonjësit e marketingut dhe H&Zh kanë nivelin më të lartë të kënaqësisë së
punës dhe përvetësimin më të lartë të politikave të firmës dhe në të njëjtën
kohë më së paku dëshirojnë të jenë të përhershëm në firmë.

204
 Ekziston një ndërveprim i rëndësishëm ndërmjet departamenteve dhe
pozitave. Për shembull, përderisa punëtorët e departamentit të prodhimit
dhe stoqeve kanë nivelin më të ulët të kënaqësisë në punë dhe përvetësim
më të ulët të punës, dëshirojnë që të jenë të përhershëm në firmë, sidomos
punonjësit në departamentin e stoqeve.
 Prandaj, gjatë bërjes së analizës, departamentet dhe pozitat duhet të
vlerësohen së bashku. Një gjest i tillë është më i shëndetshëm në krahasim
me interpretime të përgjithshme në lidhje me pozitën apo me interpretime të
përgjithshme në lidhje me departamentin.

Siç qe cekur edhe në fillim nuk ishte synim që të jepen informata të reja në
lidhje me MANOVA Dy Drejtimshe në SPPS për lexuesin. Qëllimi këtu ishte që të bëhej një
konsolidim me të dhënat e analizës së variancës dhe që të sillet në një formë më konkrete
për t’u mbajtur në mend MANOVA Dy Drejtimshe. Kuptimi më i mirë i kësaj teme lidhet me
kuptimin e mirë të temave të shpjeguara më lartë në këtë kapitull.

205
SHTOJCA 7.1
Një firmë dëshiron që të mat ndikimin e pozitës së punëtorëve në pranimin e
politikave të firmës. Në mostër marrin pjesë 17 punëtorë, 15 mbikëqyrës dhe 11
menaxherë dhe janë pyetur se a pajtohen me gjykimin “Politikat e firmës janë si duhet dhe
duhet të përvetësohen”. Është përdorur pesëmatësi i Likertit.

Plotësisht pajtohem :5

Pajtohem :4

Neutral :3

Nuk pajtohem :2

Aspak nuk pajtohem :1

Në vlerësimin e përgjigjeve janë përdorur të dhëna numerike. Të dhënat në SPSS
janë futur në këtë mënyrë

Përvetësimi Pozita
1 2 1
2 3 1
3 2 1
4 3 1
5 3 1
6 1
7 1 1
8 1 1
9 2 1
10 2 1
11 3 1
12 2 1
13 4 1
14 2 1
15 2 1
16 3 1
17 3
18 3 2
19 4 2
20 4 2
21 5 2
22 4 2
23 4 2
24 3 2

206
25 3 2
26 4 2
27 4 2
28 2 2
29 2
30 4 2
31 5 2
32 4 2
33 5 3
34 5 3
35 4 3
36 5 3
37 5 3
38 4 3
39 4 3
40 2 3
41 3 3
42 5 3
43 5 3

207
SHTOJCA 7.2
Të hulumtohet ndikimi i pozitës së punonjësve në firmë dhe kohës së kaluar në atë
pozitë në kënaqësinë e punës. Pozitat e punonjësve dhe koha e kaluar në atë pozitë janë
dhënë më poshtë në formën e numrave.

Punëtor :1 Fundi i javës së parë :1

Mbikëqyrës :2 Fundi i 3 muajve :2

Menaxher :3 Fundi i 6 muajve :3

Fundi i 1 viti :4

Punonjësit janë pyetur në lidhje me kënaqësine e punës në periudhat e cekura. Për
shembull, një mbikëqyrës është pyetur se a është i kënaqur nga puna në fund të javës së
parë pasi ka filluar punën, në fund të 3 muajve, në fund të 6 muajve dhe pas 1 viti. Është
kërkuar që të përzgjedh numrat prej 1 deri në 10 ashtu siç e sheh ai më të përshtatshëm
për të. Këtu, këta numra shprehin:

10: Shumë i kënaqur

1: Aspak i kënaqur.

Të dhënat e mëposhtme janë futur në SPSS.

Ndryshorja e parë pavarur: Pozita

Ndryshorja e dytë e pavarur: Koha

Ndryshorja e Varur: Kënaqësia

Kënaqësia Pozita Koha
1 7 1 1
2 5 1 2
3 4 1 3
4 2 1 4
5 5 1 1
6 5 1 2
7 3 1 3
8 1 1 4
9 5 1 1
10 4 1 2
11 2 1 3
12 2 1 4
13 4 1 1

208
14 4 1 2
15 2 1 3
16 2 1 4
17 5 2 1
18 6 2 2
19 5 2 3
20 5 2 4
21 7 2 1
22 6 2 2
23 6 2 3
24 7 2 4
25 8 2 1
26 7 2 2
27 6 2 3
28 6 2 4
29 7 2 1
30 7 2 2
31 7 2 3
32 6 2 4
33 5 3 1
34 7 3 2
35 9 3 3
36 10 3 4
37 6 3 1
38 9 3 2
39 10 3 3
40 10 3 4
41 7 3 1
42 9 3 2
43 9 3 3
44 10 3 4
45 6 3 1
46 7 3 2
47 9 3 3
48 9 3 4

209
SHTOJCA 7.3
Kërkohet të analizohet se a ndikon pozita e punonjësve sipas gjinisë në kënaqësinë e
punës. Me fjalë të tjera, ndikimi i pozitës së punës a ndryshon sipas femrave apo sipas
meshkujve në kënaqësinë e punës. Në analizë janë mbledhur të dhëna nga 15 femra dhe 15
meshkuj menaxherë, 18 femra dhe 18 meshkuj mbikëqyrës si dhe 17 femra dhe 17
meshkuj punëtorë.

Niveli i kënaqësisë është matur me këtë numër të personelit. Për matjen e
kënaqësisë është përdorur pesëmatësi i Likerit. Këtu;

1 – Nuk jam aspak i kënaqur

7 – Jam shumë i kënaqur.

Ndryshorja e varur: Pozita

Ndryshorja e parë e pavarur: Femrat

Ndryshorja e dytë e pavarur: Meshkujt

Pozita 1: Punëtor

Pozita 2: Mbikëqyrës

Pozita 3: Menaxher

Femra Meshkuj Pozita
1 2 2 1
2 3 1 1
3 2 2 1
4 2 2 1
5 1 2 1
6 2 3 1
7 3 2 1
8 2 2 1
9 3 1 1
10 2 1 1
11 2 2 1
12 2 2 1
13 3 3 1
14 2 2 1
15 2 2 1
16 3 1 1
17 3 2 1

210
18 5 3 2
19 5 3 2
20 4 4 2
21 5 3 2
22 6 2 2
23 5 3 2
24 5 3 2
25 6 4 2
26 5 4 2
27 4 5 2
28 5 4 2
29 5 4 2
30 6 3 2
31 5 3 2
32 5 2 2
33 4 3 2
34 5 4 2
35 6 3 2
36 7 6 3
37 7 5 3
38 6 6 3
39 7 6 3
40 6 4 3
41 6 5 3
42 5 5 3
43 7 6 3
44 7 6 3
45 7 5 3
46 6 6 3
47 7 7 3
48 6 6 3
49 6 6 3
50 7 5 3

211
SHTOJCA 7.4
Dëshirohet të hulumtohet ndikimi i pozitës së punonjësve dhe departamentetit në të
cilin punojnë në kënaqësinë e punës që punojnë, përvetësimin e politikave të firmës dhe
dëshirës për të qëndruar në firmë (përherë). Janë përcaktuar 3 grupe për ndryshoren e
parë të pavarur: punëtor, mbikëqyrës dhe menaxher i nivelit të lartë. Janë përcaktuar 5
grupe për ndryshoren e dytë të pavarur: prodhim, stoqe, kontabilitet, marketing dhe H&Zh
(Hulumtim dhe Zhvillim). Janë mbledhur të dhëna në total prej 125 vetëve nga pozita dhe
departamente të ndryshme në lidhje me kënaqësinë e punës, përvetësimit të politikave të
firmës dhe dëshirës për të qëndruar në firmë.

Përgjigjet e dhëna në lidhje me kënaqësinë e punës;

1 – Nuk jam aspak i kënaqur

10 – Jam shumë i kënaqur

Përgjigjet e dhëna në lidhje me përvetësimin e politikave të firmës;

1 – Nuk i përvetësoj aspak

10 – I përvetësoj plotësisht

Përgjigjet e dhëna në lidhje me dëshirën për të qëndruar në firmë;

1 – Nuk dëshiroj aspak

10 – Dëshiroj shumë.

Të dhënat janë futur si më poshtë në SPSS.

Ndryshorja e parë e pavarur: Pozita

Ndryshorja e dytë e pavarur: Departamenti

Ndryshorja e parë e varur: Kënaqësia

Ndryshorja e dytë e varur: Përvetësimi

Ndryshorja e tretë e varur: Qëndrueshmëria

Pozita 1: Punëtor

Pozita 2: Mbikëqyrës

Pozita 3: Menaxher

212
Departamenti 1: Prodhim

Departamenti 2: Aksionet

Departamenti 3: Kontabilitet

Departamenti 4: Marketing

Departamenti 5: H-Zh.

Pozita Departamenti Kënaqësia Përvetësimi Qëndrueshmëria
1 1 3 4 3 4
2 2 1 6 6 7
3 3 4 9 10 7
4 1 2 3 2 6
5 3 4 7 10 5
6 2 2 4 4 7
7 1 4 5 5 4
8 2 1 5 6 6
9 2 1 5 5 6
10 3 4 9 10 6
11 1 4 4 6 2
12 2 1 7 7 8
13 3 4 8 9 5
14 2 3 5 4 6
15 2 2 4 4 6
16 1 3 4 5 2
17 2 2 5 5 8
18 3 4 10 10 8
19 2 3 6 5 7
20 1 2 4 2 7
21 2 1 7 5 8
22 3 4 8 9 5
23 2 3 5 3 5
24 1 3 4 4 3
25 2 5 5 8 6
26 2 2 3 4 6
27 2 1 5 7 7
28 2 5 8 8 4
29 1 2 3 4 8
30 3 4 9 10 6
31 2 5 6 9 2
32 1 5 5 5 2
33 3 5 8 9 6
34 2 3 6 5 7
35 1 3 4 5 5
36 3 5 9 9 7
37 2 5 7 7 5

213
38 3 5 7 10 5
39 1 5 5 6 2
40 3 5 8 8 7
41 2 2 4 5 8
42 3 5 7 8 6
43 2 5 8 6 3
44 2 1 7 7 8
45 3 5 8 8 5
46 1 3 3 5 4
47 3 5 9 9 6
48 2 5 8 8 4
49 2 3 4 3 5
50 1 2 3 4 8
51 2 5 7 7 3
52 2 1 5 5 6
53 1 5 6 7 3
54 1 3 3 4 2
55 2 4 6 7 5
56 2 4 5 6 3
57 2 1 6 6 7
58 2 5 9 9 5
59 2 5 7 7 3
60 2 2 4 4 6
61 3 1 9 10 10
62 3 1 7 8 8
63 1 5 4 5 1
64 3 2 8 9 10
65 1 1 3 4 6
66 3 2 6 7 8
67 2 3 5 4 6
68 3 3 9 8 9
69 2 2 3 5 7
70 1 2 3 3 5
71 3 3 7 6 7
72 1 4 4 6 3
73 3 4 9 9 7
74 1 5 5 6 4
75 3 3 8 7 8
76 2 2 5 3 6
77 1 1 4 4 5
78 3 3 7 8 7
79 2 3 3 3 3
80 3 3 8 8 6
81 2 2 4 4 8
82 3 1 8 9 9
83 3 4 8 9 5
84 3 3 7 7 7
85 1 5 4 6 1

214
86 1 2 4 5 6
87 3 5 9 10 7
88 3 3 9 6 9
89 1 4 5 7 4
90 3 1 7 8 8
91 1 3 4 5 3
92 2 3 7 5 7
93 1 3 5 6 5
94 2 4 6 7 4
95 1 2 3 3 7
96 1 1 4 3 3
97 3 1 8 7 10
98 2 4 7 6 5
99 1 2 2 2 5
100 3 3 9 7 9
101 1 4 4 5 2
102 1 1 3 3 3
103 1 1 1 2 4
104 3 2 7 8 9
105 3 1 7 9 7
106 2 4 5 8 3
107 1 1 2 2 2
108 3 1 8 8 10
109 2 4 4 6 5
110 3 2 8 7 8
111 3 1 8 9 9
112 3 2 6 9 10
113 1 1 3 2 5
114 1 4 5 7 4
115 3 2 7 8 10
116 2 4 5 6 4
117 1 4 3 5 2
118 3 2 6 8 9
119 2 4 6 7 4
120 3 2 7 8 9
121 1 4 3 5 3
122 1 5 5 6 3
123 3 2 7 7 8
124 2 4 7 9 5
125 1 1 2 3 3

215
216
8. ANALIZA E KOVARIANCËS
Analiza e kovariancës është një zgjatje e analizës së variancës. Analiza e variancës
(ANOVA) përdoret për të gjetur dallimet ndërmjet mesatareve të grupit. Në analizë
tentohet të zbulohet ndikimi i disa ndryshoreve të pavarura (kategorike) mbi një
ndryshore të varur (vazhdueshme). Kurse në analizën e kovariancës tema kryesore është
hulumtimi apo eleminimi i ndryshores së varur e cila ndikon në një ndryshore tjetër të
varur gjatë krahasimit të mesatareve të një ndryshoreje të varur të një apo më shumë
grupi.

Analiza e kovariancës është një metodë statistikore shumë e dobishme dhe e
fuqishme në rastet kur përmbushen supozimet e saj.

Në analizën e kovariancës, gjatë matjes së dallimit ndërmjet mesatareve grupore
përdoren analiza e regresionit dhe analiza e variancës së bashku. Pra analiza e kovariancës,
është një kombinim i analizës së variancës dhe analizës së regresionit. Në fillim, zbatohet
procedura e regresionit, pastaj metoda e analizës së variancës normale mbi vlerat e
korrigjuara. Në këtë mënyrë, bëhet një korrigjim për lidhjen lineare ndërmjet ndryshores
së varur dhe kondryshores (covariate-ndryshore e përbashkët). Në fund të kësaj,
reduktohet gabimi variancor dhe mund të zbulohen dallimet ndërmjet grupeve duke pasur
parasysh dallimet e tjera ndërmjet të dhënave.

Analiza e kovariancës ul gabimin e variancës përderisa arrin të marr nën kontroll
ndryshimin në ndryshoren e varur e cila ndikon në të gjithë grupin.

Ashtu si në analizën e variancës, edhe në analizën e kovariancës gjenden ndryshoret
e varura dhe të pavarura, por si shtim i këtyre ndryshoreve u bashkangjiten edhe një apo
më shumë ndryshore tjera. Këto ndryshore të cilat bashkangjiten quhen “kondryshore
(covariate)”. Shkurtimisht, në analizën e kovariancës gjendet vetëm një ndryshore e varur
dhe disa ndryshore të pavarura dhe kondryshore.

Analiza e kovariancës përdoret si një pjesë përbërëse e teknikave të analizës së
variancës “Një Drejtimshe” (one-way), “Dy Drejtimshe” (two-way) dhe “Shumë
Ndryshoresh” (multivariate). Numri i ndryshoreve të përdorura në analizën e kovariancës
një dhe dy drejtimshe është në këtë mënyrë:

 ANCOVA Një Drejtimshe: një ndryshore e pavarur, një ndryshore e varur, një
apo më shumë kondryshore
 ANCOVA Dy Drejtimshe: dy ndryshore të pavarura, një ndryshore e varur, një
apo më shumë kondryshore.

217
8.1. AVANTAZHET E APLIKIMIT TË ANALIZËS SË KOVARIANCËS
Aplikimi i analizës së kovariancës ka shumë dobi. Këto mund t’i rendisim në këtë
mënyrë:

 Analiza e kovariancës redukton gabimin variancor, në këtë mënyrë rritet vlera F
dhe rritet fuqia e modelit.
 Regresionet ndërmjet grupeve të ndryshme janë të barabarta.
 Po ashtu, analiza e kovariancës është shumë e dobishme në rastet kur madhësia
e mostrës është e vogël apo ndikimi i madhësisë është i vogël.

8.2. FUSHAT E PËRDORIMIT TË ANALIZËS SË KOVARIANCËS

Analiza e kovariancës, në përgjithësi, mund të përdoret në të gjitha fushat dhe
problemet ku përdoret analiza e variancës. ANCOVA, në mënyrë bazike, hulumton se a
ekziston ndonjë dallim i rëndësishëm statstikor ndërmjet grupeve. Dallimi ANCOVA prej
ANOVA është përfshirja e llojit të tretë të ndryshores në setin e ndryshoreve të pavarura
dhe të varura, pra kondryshores.

Për shembull, duke i ndarë në 3 grupe punonjësit e një firme, dëshirohet të
shqyrtohet se a ekziston ndonjë dallim për nga aspekti i shumës së prodhimit të
produkteve të punonjësve ndërmjet grupeve. Mirëpo, shuma e prodhimit për punonjësit
ndryshon në lidhje me përvojën dhe specializimin e tij. Prandaj, për të bërë një analizë sa
më të saktë, përvoja (p.sh. numri i viteve të punimit) duhet të futet si kondryshore në
model. Në këtë mënyrë, pasi të eleminohen dallimet që burojnë nga përvoja dhe
specializimi, mund të bëhet një parashikim më i saktë.

Apo, në qoftë se 3 grupe përbëhen nga kuajt garues, dëshirohet të shqyrtohet se a
ekziston dallim për nga aspekti i shpejtësisë së vrapimit ndërmjet grupeve. Mirëpo,
shpejtësia e një kali garues ndryshon në lidhje me moshën e tij. Prandaj, mosha e kuajve
garues duhet të përfshihet në model si një kondryshore, në këtë mënyrë eleminohet dallimi
që buron nga mosha, zvogëlohet gabimi i modelit dhe do të jetë bërë një analizë më e saktë.

ANCOVA përdoret edhe për të barazuar grupet, në qoftë se grupet nuk janë të
barabarta për çfarëdo arsye. Për shembull, gjatë krahasimit të metodave të ndryshme të
arsimit të përdorura si të dhëna për studentët e zgjedhur jorastësisht, ekziston një dallim i
njohur që në fillim ndërmjet grupeve, si p.sh. zgjuarsia. Në këtë rast, gjatë krahasimit të
klasëve, IQ duhet të futet në model si kondryshore dhe përpara se të krahasohen mesataret
e grupeve, duhet të eleminohet ndikimi i intelegjencës.

ANCOVA mund të përdoret edhe në rastet kur mostra e rastësishme nuk është e
suksesshme. Për shembull, në mostrat e vogla, grupet mund të mos jenë të barabarta edhe

218
në qoftë se është bërë mostër e rastësishme. Në këtë rast, duke përdorur ANCOVA-në ky
problem mund të eleminohet.

8.3. SUPOZIMET E ANALIZËS SË KOVARIANCËS

Që analiza ANCOVA të jetë e vlefshme dhe të mund të interpretohet, duhet që të
përmbushen disa supozime. Këto supozime janë:

Grupet:

 Grupet duhet të jenë të pavarura prej njëra-tjetrës.
 Variancat e grupeve duhet të jenë të barabarta, pra konstante. Me fjalë të tjera,
duhet të sigurohet homogjeniteti i variancave, pra, nuk duhet të jetë variancë e
cila ndryshon.
 Koeficientët e regresionit brenda grupeve duhet të jenë të barabartë.

Ndryshorja e varur:

 Ndryshorja e varur duhet të jetë intervalore apo proporcionale. Përsëri,
ndryshorja e varur duhet të ndjek shpërndarjen normale apo duhet të jetë afër
normales.

Kondryshorja:

 Kondryshorja duhet të jetë në formën intervalore apo propocionale. Ndryshoret
nominale nuk mund të përdoren si kondryshore. Po ashtu, kondryshorja duhet
të përzgjedhet me shumë kujdes. Sidomos, duhet kuptuar mirë teoria në lidhje
me atë çështje dhe duhet siguruar se është e nevojshme përfshirja e asaj
kondryshoreje në model. (Në këtë pikë, është e dobishme që të shikohen
punimet e bëra në lidhje me këtë çështje.)
 Ndryshorja(et) e zgjedhur(a) duhet të jetë(në) e(të) besueshme, pra duhet të jetë
e matur në një mënyrë të pagabuar sepse ANCOVA supozon se kondryshorja
është matur pagabime dhe në mënyrë plotësisht të saktë.
 Në qoftë se do të përdoren më shumë se një kondryshore, nuk duhet të ekzistojë
korrelacion i fortë ndërmjet kondryshoreve të zgjedhura. Në qoftë se ekziston
një korrelacion në shkallë të lartë (r=0,8 dhe më lartë), duhet që të nxirret një
apo më shumë kondryshore.
 Kondryshorja dhe ndryshorja e pavarur duhet të jenë brenda një marrëdhënieje
të drejtë lineare. Në qoftë se nuk ekziston marrëdhënie lineare ndërmjet
kondryshores dhe ndryshores së varur, nuk mund të mirret rendimenti i
dëshiruar nga analiza. Me fjalë të tjera, mospërfillja e këtij supozimi, zvogëlon

219
fuqinë e testit sepse në një rast të këtillë, gabimi i variancës mund të ulet shumë
pak. Ky test është efektiv në rastet kur korrelacioni ndërmjet kondryshores dhe
ndryshores së varur është më i lartë se 0,30. Një marrëdhënie sa më e fortë
lineare mundëson rezultate më të fuqishme të ANCOVA-së. Në qoftë se
marrëdhënia ndërmjet kondryshores dhe ndryshores së varur nuk është lineare,
mund aplikohet testi ANOVA i ndryshores së pavarur. Një zgjedhje tjetër për
sigurimin e marrëdhënies lineare është konvertimi matematikor i ndryshoreve.
Për testimin e linearitetit të marrëdhënies ndërmjet ndryshores së varur dhe
kondryshores, mund të përdoret diagrami i shpërndarjes (scatterplot). (Për ta
bërë këtë, në SPSS zgjedhet menyja Graphs  Scatter. Pastaj zgjedhet Simple 
Define. Në pjesën e boshtit Y vendoset ndryshorja e varur, në boshtin X
kondryshorja, në pjesën Set markers by ndryshorja e pavarur dhe shtypet
butoni OK.)
 Fuqia dhe drejtimi i lidhjes ndërmjet kondryshores dhe ndryshores së varur
duhet të jetë e ngjashme në çdo grup. Kjo situatë njihet si “homogjeniteti i
regresionit të grupeve”. Me fjalë të tjera, nuk duhet të kete ndikim të ndryshores
së pavarur mbi lidhjen ndërmjet kondryshores dhe ndryshores së varur. Pra,
kondryshorja duhet të ketë të njëjtin ndikim mbi ndryshoren e varur të grupeve.
Në figurën 8.1, është paraqitur regresioni në rastet kur është homogjen dhe në
rastin e kundërt, kur nuk është.

Figura 8.1: Homogjeniteti i Regresionit

220
8.4. SHEMBULL APLIKIMI

8.4.1. HYRJA E TË DHËNAVE DHE TESTIMI I SUPOZIMEVE
Në lidhje me lëndën e matematikës, ekzistojnë 3 metoda të ndryshme të shpjegimit,
kërkohet të testohet a ekziston ndonjë dallim ndërmjet këtyre metodave për nga aspekti i
suksesit të studentëve. Për këtë qëllim, me ndihmën e 9 studentëve janë formuar 3 grupe
dhe janë aplikuar metoda të ndryshme në secilin grup. Mirëpo, zgjuarsia (shkathtësitë) e
studentëve në matematikë ndikon në suksesin e mësimit. Prandaj, parimisht për të matur
intelegjencën matematikore të studentëve përpara se të fillohet me analizën, është aplikuar
një test i intelegjencës. Ndryshoret e modelit janë në këtë mënyrë:

 Ndryshorja e varur: Notat e realizuara të studentëve nga provimi i matematikës
 Ndryshorja e pavarur: Grupet
 Kondryshorja: Shkalla e intelegjencës së studentëve (Rezultatet e testit të
aplikuar të intelegjencës).

Hapi 1: Hyrja e të Dhënave në SPSS

Pasi të futen të dhënat në SPSS, përpara se të bëhet analiza e kovariancës, duhet të
testohet siguria e supozimeve të nevojshme në mënyrë që analiza e kovariancës të jetë e
vlefshme. Këto supozime janë supozimet e homogjenitetit të regresionit dhe homogjenitetit
të variancave. Për ta bërë këtë, realizohen këto funksione me radhë:

Analyze  General Linear Model  Univariate.

221
Hapi 2: Menyja Filluese e Analizës së Kovariancës

Në dritaren e hapur duhet të bëhet njohja e ndryshoreve. Këtu; në pjesën
Dependent Variable bartet ndryshorja e varur (nota_provimit), në pjesën Fixed Factor(s)
baret ndryshorja e pavarur (grupi) dhe në pjesën Covariate(s) bartet kondryshorja
(aftësia).

Hapi 3: Dritarja e Analizës së Kovariancës

222
Më vonë, në këtë dritare klikohet në butonin “Model”. Në dritaren e hapur të
Modelit në fillim, nga pjesa Specify Model përzgjedhet Custom. Pastaj, nga ndryshoret në
anën e majtë zgjedhet grupi dhe në pjesën Build Terms klikohet shenja ok, më vonë, duke
përzgjedhur “aftësia” përsëritet funksioni dhe në fund përzgjedhen së bashku grupi dhe
aftësia dhe duke klikuar në butonin Continue mbyllet dritarja.

Hapi 4: Dritarja e Modelit

Më vonë duke klikuar në butonin “Options” hapet Dritarja e Përzgjedhjeve. Në këtë
sektor, nën pjesën Factor(s) and Factor Interactions e cila gjendet nën Estimates
Marginal Means, duke përzgjedhur ndryshoren e pavarur (grupi) klikohet shenja ok dhe
transferohet te pjesa Display Means for. Etiketohet përzgjedhja Compare main effects
dhe nga pjesa Confidence interval adjustment përzgjedhet Bonferroni. Së fundi, në
pjesën Display bëhen etiketimet e treguara më poshtë dhe duke klikuar me radhë
Continue dhe OK, bëhet realizimi i analizës.

223
Hapi 5: Dritarja e Përzgjedhjeve

Rezultatet e përfituara dhe daljet e SPSS-it pas analizës së bërë janë dhënë më
poshtë.

Tabela 8.1: Statistikat Përshkruese

Descriptive Statistics
Dependent Variable: Nota_provimit

Grupi Mean Std. Deviation N

1.00 4.3333 1.52753 3
2.00 8.3333 1.52753 3
3.00 11.3333 1.15470 3
Total 8.0000 3.27872 9

224
Tabela 8.2: Testi Levene

a
Levene's Test of Equality of Error Variances
Dependent Variable: Nota_provimit

F df1 df2 Sig.

1.330 2 6 .333

Tests the null hypothesis that the error variance of
the dependent variable is equal across groups.
a. Design: Intercept + Grupi + Aftësia + Grupi *
Aftësia

Tabela 8.3: Testi i Bashkëveprimit Ndërmjet Subjekteve

Tests of Between-Subjects Effects
Dependent Variable: Nota_provimit

Type III Sum of
Source Squares df Mean Square F Sig.
a
Corrected Model 84.905 5 16.981 46.513 .005
Intercept 1.629 1 1.629 4.461 .125
Grupi 1.415 2 .708 1.938 .288
Aftësia 10.343 1 10.343 28.332 .013
Grupi * Aftësia .129 2 .065 .177 .846
Error 1.095 3 .365
Total 662.000 9
Corrected Total 86.000 8

a. R Squared = .987 (Adjusted R Squared = .966)

Në tabelën e statistikave përshkruese (Descriptive Statistics) janë dhënë mesataret
dhe devijimet standarte të grupeve. Sipas kësaj, devijimet standarte janë të përafërta me
njëra-tjetrën, kurse ekzistojnë dallime të mëdha ndërmjet mesatareve të grupeve.

Përpara se të bëhet analiza e kovariancës, me ndihmën e rezultateve të përfituara,
duhet të testohen supozimet, homogjeniteti i variancave dhe nëse pjerrësia e kondryshores
është e njëjtë në mënyrë të arsyeshme me ndryshoren e varur. Nga këto supozime, për
testimin e supozimit “homogjeniteti i variancave” siç mund të përdoren grafiqet “varianca
vs. mesatarja” apo “devijimi standart vs. mesatarja”, po ashtu mund të përdoren edhe testet
e hipotezave. Këtu është përdorur testi Levene. Sipas rezultatit të Levene’s Test, vlera Sig.
është 0,333 dhe për shkak që kjo vlerë është më e madhe se 0,05, mund të thuhet se është
siguruar supozimi i homogjenitetit të variancave.

225
Sipas supozimit të dytë, duhet të përcaktohet nëse ndryshorja e varur
(nota_provimit) është e njëjtë në mënyrë të arsyeshme me pjerrësinë e kondryshores
(aftësia). Për këtë, duhet të shikojmë rreshtin Grupi*Aftësia në tabelën Test of Between-
Subjects Effects. Në qoftë se ky bashkëveprim është i rëndësishëm statistikisht, hipoteza
“drejtëza është e njëjtë për të dy grupet” refuzohet. Sipas rezultateve në tabelë, vlera e
përfituar Sig. është 0,846 dhe kjo vlerë ngaqë është më e madhe se vlera 0,05 nuk është e
rëndësishme statistikisht dhe pranohet hipoteza “drejtëza është e njëjtë për të dy grupet”.
Me fjalë të tjera, drejtëzat e regresionit janë të barabarta.

Për shpërndarjet tjera normale dhe supozimin e linearitetit, shikoni pjesën e
supozimeve të teknikave statistikore shumë ndryshoresh.

Në fund të analizës, pasi të kuptohet që supozimet janë të vlefshme, mund të kalohet
në analizën e kovariancës.

8.4.2. APLIKIMI I ANALIZËS SË KOVARIANCËS
Për realizimin e analizës së kovariancës, ndiqen me radhë këta hapa:

Analyze  General Linear Model  Univariate.

Hapi 1: Menyja Filluese e Analizës së Kovariancës

Në dritaren e hapur duhet të bëhet njohja e ndryshoreve. Këtu; në pjesën
Dependent Variable bartet ndryshorja e varur (nota_provimit), në pjesën Fixed Factor(s)
bartet ndryshorja e pavarur (grupi) dhe në pjesën Covariate(s) bartet kondryshorja
(aftësia).

226
Hapi 2: Dritarja e Analizës së Kovariancës

Më vonë në këtë dritare klikohet në butonin “Model”. Në dritaren e hapur të
Modelit, nga pjesa Specify Model përzgjedhet Full Factorial dhe shtypet butoni Continue.

227
Hapi 3: Dritarja e Modelit

Më vonë duke klikuar në butonin “Options” hapet dritarja e përzgjedhjeve. Në këtë
sektor, nën pjesën Factor(s) and Factor Interacions e cila gjendet nën Estimates
Marginal Means, duke përzgjedhur ndryshoren e pavarur (grupi) klikohet shenja ok dhe
transferohet në pjesën Display Means for. Etiketohet përzgjedhja Compare main effects
dhe nga pjesa Confidence interval adjustment përzgjedhet Bonferroni. Së fundi, në
pjesën Display bëhen etiketimet e treguara më poshtë dhe duke klikuar me radhë
Continue dhe OK bëhet realizimi i analizës.

228
Hapi 4: Dritarja e Përzgjedhjeve

Rezultatet e përfituara dhe daljet e SPSS-it pas analizës së bërë janë dhënë më
poshtë.

Tabela 8.4: Statistikat Përshkruese

Descriptive Statistics
Dependent Variable: Nota_provimit

Grupi Mean Std. Deviation N

1.00 4.3333 1.52753 3
2.00 8.3333 1.52753 3
3.00 11.3333 1.15470 3
Total 8.0000 3.27872 9

229
Tabela 8.5: Testi i Bashkëveprimit Ndërmjet Subjekteve

Tests of Between-Subjects Effects
Dependent Variable: Nota_provimit

Type III Sum of Partial Eta
Source Squares df Mean Square F Sig. Squared
a
Corrected Model 84.776 3 28.259 115.401 .000 .986
Intercept 1.891 1 1.891 7.723 .039 .607
Aftësia 10.776 1 10.776 44.005 .001 .898
Grupi 26.587 2 13.294 54.288 .000 .956
Error 1.224 5 .245
Total 662.000 9
Corrected Total 86.000 8

a. R Squared = .986 (Adjusted R Squared = .977)

Tabela 8.6: Vlerësimet e Parametrave

Parameter Estimates
Dependent Variable: Nota_provimit

Std. 95% Confidence Interval Partial Eta
Parameter B Error t Sig. Lower Bound Upper Bound Squared

Intercept 4.500 1.069 4.210 .008 1.752 7.248 .780
Aftësia .788 .119 6.634 .001 .483 1.094 .898
[Grupi=1.00] -4.897 .514 -9.537 .000 -6.217 -3.577 .948
[Grupi=2.00] -1.423 .469 -3.036 .029 -2.628 -.218 .648
a
[Grupi=3.00] 0 . . . . . .

a. This parameter is set to zero because it is redundant.

Tabela 8.7: Mesataret e Vlerësuara Margjinale

Estimates
Dependent Variable: Nota_provimit

95% Confidence Interval

Grupi Mean Std. Error Lower Bound Upper Bound
a
1.00 5.209 .315 4.400 6.018
a
2.00 8.684 .291 7.937 9.431
a
3.00 10.107 .340 9.232 10.982
a. Covariates appearing in the model are evaluated at the following
values: Aftësia = 7.1111.

230
Në Tabelën 8.5, sipas nivelit të aftësisë së studentëve në matematikë, ekziston një
dallim i rëndësishëm ndërmjet mesatareve të notave të marra në provimin e korrigjuar të
matematikës (Sepse vlerat Sig. të grupit dhe aftësisë janë 0,001 dhe 0,000). Me fjalë të tjera,
ekziston një marrëdhënie ndërmjet notave të marra në matematikë dhe aftësisë së
studentëve në mësim.
Duke përdorur Tabelën 8.4 dhe Tabelën 8.7, në tabelën e re të përfituar (Tabela 8.8)
mesatarja e notave të grupit të tretë duket e lartë, por kur niveli i aftësisë së grupeve në
matematikë merret nën kontroll, vërehet se ndodhin ndryshim në mesataret e grupeve.
Kështuqë, mesatarja e notave e korrigjuar e grupit të tretë lëviz në 10,1. Përkundër kësaj,
mesataret e korrigjuara të grupit të parë dhe të dytë rriten për 5,2 dhe 8,6 dhe si përfundim
dallimet ndërmjet grupeve janë zvogëluar.
Tabela 8.8: Mesataret e Grupeve dhe Mesataret e Korrigjuara

GRUPI N MESATARJA MESATARJA E KORRIGJUAR
1 3 4,3 5,2
2 3 8,3 8,6
3 3 11,3 10,1

A thua, dallimet ndërmjet mesatareve të korrigjuara ndërmjet grupeve a janë të
rëndësishme? Për këtë, kur shikojmë Tabelën 8.9 (tabela e krijuar duke përdorur tabelat e
mësipërme), kuptohet se dallimi ndërmjet grupeve është i rëndësishëm. (Sepse vlera F
është e rëndësishme).

Tabela 8.9: Rëndësia e Dallimeve të Grupeve

BURIMI I TOTALI I MESATARJA E F NIVELI I
VARIANCËS KATRORËVE KATRORËVE RËNDËSISË
Aftësia 10,776 10,776 44,005 0,001
Grupi 26,587 13,294 54,288 0,000

231
232
9. REGRESIONI I THJESHTË LINEAR
Analiza e regresionit paraqet procesin e shpjegimit të lidhjes ndërmjet një
ndryshoreje të varur dhe një të pavarur (regresioni i thjeshtë) apo lidhjen ndërmjet një
ndryshoreje të varur dhe më shumë se një ndryshoreje të pavarur (regresioni i ponderuar)
me një barazim matematikor.

Në qoftë se në analizën e regresionit lidhja ndërmjet ndryshoreve është lineare
quhet regresion linear dhe e kundërta quhet regresion jo linear. Në këtë libër, do të
shpjegohet vetëm regresioni linear.

9.1. MODELI I REGRESIONIT TË THJESHTË LINEAR
y = β0 + β1x + ε

β0: pikëpreja e boshtit y me drejtëzën

β1: trendi i drejtëzës

ε: gabimi i varur nga probabiliteti

Këtu β0 dhe β1 janë parametrat e llogaritur të popullsisë. Mirëpo, në model është
shtuar termi i gabimit ε që tregon ndryshimin e rastësishëm të të dhënave, për arsye se
mund të ketë ndryshoret të pavarura që nuk merren në konsideratë.

Në qoftë se në praktikë nuk dihet vlerat β0 dhe β1, informatat e dëshiruara rreth
parametrave të popullsisë mund të prodhohen duke marrë një mostër nga popullsia. Në
këtë rast, përdoren b0 dhe b1 si vlera parashikimi.

ŷ = b0 + b1x

ŷ: vlera e parashikuar (vlerësuar).

9.2. PARASHIKIMI I PARAMETRAVE
Parashikimi i parametrave në analizën e regresionit linear bëhet duke përdorur
teknikën e katorëve më të vegjël (Least Squares Method). Këtu, qëllimi është që të gjenden
distancat e pikave të paraqitura në diagramin e shpërndarjes (scatter diagram) dhe
minimizimi total i tyre. Mirëpo, ngaqë ky funksion do të jetë gjithmonë zero në analizën e
regresionit, nuk përdoret për të gjetur vlerat b0 dhe b1.

233
(yi – ŷi) = 0

Në këtë rast, duke gjetur totalin e katrorit të gabimit (devijimi nga ekuacioni i
regresionit), krijohet një funksion të ri.

min (yi – ŷi)2 = min (yi – b0 – b1xi)2

Vlerat optimale b0 dhe b1 të cilat minimizojnë këtë funksion, do të jenë vlerat e
parashikuara β0 dhe β1. Për të gjetur vlerat optimale të cilat e minimizojnë funksionin sipas
funksionit b0 dhe b1, është e mjaftueshme që të merren vlerat të cilat e bëjnë zero derivatin
parcial.
n (x
n (y i=0 i −x)(yi −y)
b1 i=1 i − b0 − b1 xi ) = 0 b1 = n (x −x) (1)
i=0 i

n
b1 i=1(yi − b0 − b1 xi ) = 0 b0 = − 1 (2)

xi: vrojtimi “i” i ndryshores së pavarur, i = 1,2,...,n.

yi: vorjtimi “i” i ndryshores së varur, i = 1,2,...,n.

x: mesatarja e mostrës së ndryshores së pavarur

y: mesatarja e mostrës së ndryshores së varur

n: numri total i vrojtimeve

9.3. SHEMBULL APLIKIMI
Për të gjetur lidhjen ndërmjet shpenzimeve mujore të ushqimit dhe të ardhurave
mujore për person, janë pyetur 30 vetë në lidhje me të ardhurat e tyre mujore dhe
shpenzimet që bëjnë për ushqim dhe janë realizuar të dhënat e mëposhtme.

234
Tabela 9.1: Të Dhënat Përkatëse Për Shembullin

Nr. Shpenzimet për Të ardhurat Nr. Shpenzimet për Të ardhurat
ushqim (100 €) (100 €) ushqim (100 €) (100 €)
1 9 35 16 16 50
2 15 49 17 13 45
3 7 21 18 13 46
4 11 39 19 10 37
5 5 15 20 10 38
6 8 28 21 7 20
7 9 25 22 7 23
8 7 24 23 9 32
9 8 29 24 8 31
10 9 34 25 8 30
11 12 40 26 7 26
12 3 10 27 14 47
13 5 14 28 12 41
14 4 13 29 4 14
15 8 27 30 13 42

9.3.1. FORMIMI I MODELIT DHE PARASHIKIMI I PARAMETRAVE
Modeli: y = β0 + β1x + ε

Ekuacioni i regresionit do të jetë kështu.

y = b0 + b1x

y = shpenzimet për ushqim

x = të ardhurat.

Duke përdorur formulat (1) dhe (2), b0 = 0,314 dhe b1 = 0,283 dhe modeli i
regresionit linear gjendet në këtë mënyrë ŷ = 0,314 + 0, 83x.

9.3.2. INTERPRETIMI I PARAMETRAVE
Parametrat e regresionit b0 dhe b1 mund të komentohen në këtë mënyrë:

b0 është vlera e parashikuar e ndryshores së varur kur x = 0. Në shembullin e më
lartë, kur b0 = 0,314 ka këtë kuptim: Shpenzimet e ushqimit të një personi do të jenë 31,4 €
edhe në qoftë se nuk realizon aspak të ardhura. (Shënim: vlera b0 jo çdo herë mund të
shpreh një kuptim).

235
Vlera b1 është koeficienti i regresionit dhe paraqet shumën e ndryshimit në y me
rritjen e një njësie në x. Kur b1 është pozitive nënkupton që me rastin e rritjes së
ndryshores së pavarur x do të rrite edhe y (lidhje pozitive lineare). Në të njëjtën mënyrë,
kur b1 është negative, me rastin e rritjes së ndryshores së pavarur x, do të zvogëlohet y
(lidhje negative lineare). Sipas kësaj, në shembullin tonë, kur të ardhurat do të rriten për 1
€, shpenzimet e ushqimit do të rriten për 8,3 cent.

9.4. PARASHIKIMI ME MODELIN E REGRESIONIT
Duke përdorur ekuacionin e regresionit, për një vlerë të dhënë të x mund të gjendet
vlera e parashikuar y, mirëpo madhësia x mund të bëjë vlerësime më të mira ndërmjet
vlerave minimale dhe maksimale në setin e të dhënave. Në fakt, për gjetur vlerësime më të
sakta duhet që të krijohet modeli i regresionit (b1, b0) sa herë që të gjendet një e dhënë e re.

PYETJE: Në lidhje me shembullin e mësipërm, sa do të jenë shpenzimet e
parashikuara të ushqimit të një personi i cili ka të ardhura prej 3500 €?

ŷ = 0,314 + 0,283x. = 0,314 + 0,283 (3500) => shpenzimet e parashikuara mujore të
ushqimit do të jenë = 990,814 €.

9.4.1. SHEMBULL APLIKIMI
Përpara se të kalohet në analizën e regresionit të thjeshtë linear duhet të testohen
supozimet e shpërndarjes normale dhe lidhjes lineare (në analizën e regresionit të
shumëfishtë shpërndarja normale e shumë ndryshoreve). Ekzistimi i lidhjes lineare
ndërmjet ndryshoreve mund të shqyrohet përmes diagramit të shpërndarjes. (Për
diagramin e shpërndarjes në SPSS shkohet te menyja Graphs, Scatter. Më vonë zgjedhet
Simple, Define. Në boshtin y vendoset ndryshorja e varur, në boshtin x vendoset
ndryshorja e pavarur dhe klikohet OK. Pastaj mund të vrojtohet se a ekziston lidhje
lineare).

Rreth shpërndarjes normale shikoni kapitullin përkatës në libër.

Për të bërë analizën e regresionit të thjeshtë linear përzgjedhen me radhë Analyze,
Regression, Linear. Pasi të vendosen ndryshorja e varur dhe e pavarur dhe të jetë
zgjedhur metoda e dëshiruar, klikohet OK dhe do të përfitohen rezultatet e mëposhtme.

236
Hapi 1: Menyja e Regresionit të Thjeshtë Linear

Hapi 2: Dritarja e Regresionit të Thjeshtë Linear

237
Hapi 3: Dritarja e Statistikave

9.4.2. TË DALURAT NGA SPSS DHE INTERPRETIMI

Tabela 9.2: Përmbledhje e Modelit
b
Model Summary

Adjusted R Std. Error of the
Model R R Square Square Estimate Durbin-Watson
a
1 .975 .950 .949 .75869 1.863

a. Predictors: (Constant), të_ardhurat
b. Dependent Variable: ushqimet

Në tabelë është dhënë vlera R2. Vlera e gjetur këtu është 0,950. Sipas këtij rezultati,
95% e ndryshimit në ndryshoren e varur shpjegohet nga ndryshorja e pavarur e përfshirë
në model. Me fjalë të tjera, pjesa e ndryshimit prej 95% në shpenzime shpjegohet nga
ndryshimi në të ardhura.

Vlerë me rëndësi e cila duhet të interpretohet në Tabelën 9.3, është vlera F e cila
tregon rëndësinë e modelit dhe vlera Sig. e cila tregon nivelin e rëndësisë. Në qoftë se vlera
F është e rëndësishme, mund të vijmë në përfundim se modeli statistikisht është plotësisht
i rëndësishëm. Modeli jonë i cili shpjegon shpenzimet me të ardhurat është një model i
rëndësishëm.

238
Tabela 9.3: Tabela e Analizës së Variancës

a
ANOVA

Model Sum of Squares df Mean Square F Sig.
b
1 Regression 308.849 1 308.849 536.555 .000

Residual 16.117 28 .576

Total 324.967 29

a. Dependent Variable: ushqimet
b. Predictors: (Constant), të_ardhurat

Dhe në fund, marrin pjesë vlerat e parashikimit të koeficientëve të modelit dhe
vlerat t në lidhje me këto. Sipas Tabelës 9.4, një rritje e 1 njësie në të ardhura, do të rrit
shpenzimet totale të konsumit për 0,283 njësi. Vlerat t në lidhje me këtë koeficient janë të
rëndësishme në çdo nivel (Sig. = 0,000) dhe prandaj koeficienti i ndryshores së të
ardhurave është i rëndësishëm statistikisht.
Tabela 9.4: Parashikimet e Parametrave

a
Coefficients

Standardized
Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) .314 .401 .783 .440

të_ardhurat .283 .012 .975 23.164 .000

a. Dependent Variable: ushqimet

Për ta përmbledhur, rezultati i parashikimit të modelit është si më poshtë:

ŷ = 0,314 + 0,283x

Këtu y paraqet shpenzimet e konsumimit dhe x të ardhurat.

239
240
10. SUPOZIMET E TEKNIKAVE STATISTIKORE ME SHUMË NDRYSHORE
Ashtu si në analizën faktoriale dhe diskriminuese, të gjitha teknikat statistikore me
shumë ndryshore të përdorura në hulumtime bazohen në disa supozime. Këto teknika
ofrojnë shumë mundësi të mëdha për hulumtuesit në njërën anë, por në anën tjetër sjellin
vështirësi më të mëdha për nga pikëpamja e supozimeve në të cilat bazohen këto metoda.
Shqyrtimi i të dhënave për nga aspekti i supozimeve është proces i cili e sfidon më së
shumti hulumtuesin dhe që i merr kohën. Mirëpo, vlefshmëria e testeve statistikore të
përfituara me teknikat përkatëse varet nga sigurimi i këtyre supozimeve. Shqyrtimi me
kujdes i të dhënave siguron parashikim më të mirë dhe vlerësim më të saktë të distancës
shumë-madhësish (Sharma, fq. 374).

Në këtë kapitull trajtohen supozimet dhe ndikimet probabile të devijimeve nga këto
supozime mbi testet statistikore. Në të njëjtën kohë diskutohen edhe konvertimet të cilat
mund të përdoren për sigurimin e përshtatshmërisë së të dhënave ndaj supozimeve, mjetet
e rekomanduara në hulumtimin e përshtatshmërisë së të dhënave ndaj supozimeve dhe
qasjet të cilat mund të zvogëlojnë ndikimet e devijimeve nga supozimet mbi testet
statistikore. Këto supozime janë:

Shpërndarja e shumëfishtë normale: Të dhënat ndjekin shpërndarjen normale
me shumë ndryshore.

Ko-varianca: Matricat e kovariancave janë të barabarta për të gjitha grupet.

Lidhja e shumëfishtë lineare: Nuk ekziston marrëdhënie e rëndësishme lineare
ndërmjet ndryshoreve të pavarura.

Lineariteti: Marrëdhënia ndërmjet ndryshoreve të varura dhe të pavarura është
lineare.

Pavarësia dhe mos-ekzistimi i autokorrelacioneve: Vlerat e njësive të
ndryshoreve janë të pavarura nga njëra-tjetra.

Devijimi nga supozimet e mësipërme ndikon në fuqinë dhe kuptimësinë e testeve
statistikore. Përpara se të kalojmë në qasjet e përdorura për shqyrtimin e këtyre
supozimeve dhe devijimeve nga këto supozime, të përmendim shkurtimisht çështjen e
fuqisë dhe rëndësisë së testeve statistikore.

10.1. FUQIA DHE RËNDËSIA E TESTEVE STATISTIKORE
Me përjashtim të teknikës së grupimit dhe matjes shumë-madhësish, teknikat
statistikore me shumë ndryshore japin konkluzione rreth marrëdhënieve ndërmjet

241
ndryshoreve nga mostrat e nxjerra në mënyrë të rastësishme nga popullsitë ose japin
konkluzione rreth vlerave të popullsisë (Hair dhe të tj., fq. 10). Në rastet kur hulumtohet
mbi popullsinë, është e panevojshme konkludimi në lidhje me popullsinë sepse dallimet
apo marrëdhëniet e përfituara në këtë rast nuk janë të vërteta. Fuqia e testit është
mundësia e të qenit e rëndësishme nga aspekti statistikor. Me fjalë të tjera, është mundësia
e refuzimit të hipotezës zero e cila është vërtetë e gabueshme. Qëllimi themelor për
hulumtuesit është që gjithmonë të përfitojnë rezultate të cilat kanë rëndësi të lartë. Për
shkak të procesit të komplikuar, në përgjithësi, nuk përfillet vlerësimi i fuqisë së testeve
statistikore në analiza. Fuqia e testeve statistikore duhet të trajtohet bashkë me testet e
hipotezave. Në testet e hipotezave, zakonisht haset në dy lloje të gabimeve. Këto janë
gabimet alfa (lloji i parë) dhe beta (lloji i dytë).

Në fazën e përcaktimit të nivelit të rëndësisë së testit (gabimi alfa), e cila është edhe
faza e dytë e testeve të hipotezës, hulumtuesi përcakton edhe nivelin e gabimit beta gjatë
përcaktimit të riskut që mund të marrë përsipër ose gabimit alfa, sepse siç do ta mbajmë në
mend gabimi alfa del në shesh në rastin e refuzimit të hipotezës zero e cila është e saktë
dhe gjatë përcaktimit të nivelit të rëndësisë përcaktohet edhe gabimi beta (pranimi i
hipotezës zero e cila është e gabuar), i cili është lloji i dytë i gabimit. Në rastin e pranimit të
hipotezës zero e cila është gabim, përcaktohen edhe kufinjtë me përcaktimin e gabimit alfa
(zona e pranimit të hipotezës zero 1−α), pra përcaktohet gabimi beta (Orhunbilge, fq. 150).
Në rastet kur vetëm njëri nga dy gabimet është i rëndësishëm për marrësin e vendimit,
atëherë duke e zvogëluar gabimin përkatës, mund të mbyllet njëri sy ndaj rritjes së gabimit
tjetër që duket i parëndësishëm. Mirëpo, në rastet kur të dy gabimet janë të rëndësishme,
zgjidhja e vetme është zvogëlimi i të dy gabimeve duke e rritur vëllimin e mostrës
(Orhunbilge, fq. 150). Marrëdhënia ndërmjet gabimit alfa dhe beta është përmbledhur në
Tabelën 10.1.

Tabela 10.1: Marrëdhëniet Ndërmjet Gabimit të Llojit të I-rë (α) dhe II-të (β)

Vendimi Statistikor
Hipotezat Pranim H0 Refuzim H0
Situata e
Vërtetë

Saktë H0 Vendim i Saktë Vendim i Gabuar
Intervali i Besueshmërisë (1 – α) Gabimi i Llojit të I-rë (α)
Gabim H0 Vendim i Gabuar Vendim i Saktë
Gabimi i Llojit të II-të (β = 1 – α) Fuqia e Testit (1 – β)

Në testet e hipotezave, zgjedhet një nivel i dëshiruar (nominal) alfa nga hulumtuesit.
Për shembull, një nivel alfa prej 5% bart kuptimin e asaj se hulumtimet mund të refuzojnë
hipotezën zero gabimisht me një probabilitet deri në 5% në rastet kur hulumtimi përsëritet
disa herë. Mirëpo, në rastet kur ekziston devijim nga supozimet, norma e refuzimit të
hipotezës zero varur nga fati mund të jetë nën ose mbi nivelin alfa. Për shembull, edhe në

242
qoftë se niveli i zgjedhur alfa i varur nga niveli i devijimit nga supozimi i normalitetit të
shumë ndryshoreve është 5%, niveli i vërtetë alfa mund të jetë 5%. Me fjalë të tjera, barazia
e nivelit norminal alfa me nivelin e vërtetë alfa në testet e hipotezave, varet nga sigurimi i
kushtit të normalitetit dhe supozimeve tjera. Përndryshe, niveli i vërtetë alfa nuk mund të
jetë i barabartë me nivelin nominal alfa.

Kështu, fuqia e testit është e barabartë me vlerën 1 – β dhe paraqet mundësinë e
refuzimit të hipotezës zero e cila është vërtet e gabuar. Në qoftë se fuqia e testit është e
ulët, zvogëlohen nivelet e rëndësisë së llogaritur. Padyshim, hulumtuesi gjithmonë do të
kërkojë nivel të ulët alfa dhe fuqi të lartë të testit. Për këtë arsye, është shumë e
rëndësishme që në hulumtimet shkencore të dihet se si ndikohet fuqia e testeve (1 – β) dhe
rëndësia (niveli alfa) nga devijmet e supozimeve.

10.2. SUPOZIMI I NORMALITETIT3
Shumë teknika parametrike statistikore me shumë ndryshore supozojnë se mostrat
vijnë nga popullsitë me shpërndarje të shumëfishtë normale. Ky supozim, përpos që
lehtson interpretimin e rezultateve dhe disa funksioneve, është i nevojshëm edhe nga
aspekti i teorisë së shpërndarjes (Tadlıdil, fq. 53). Në qoftë se janë të rëndësishme
devijimet nga supozimi i normalitetit, i cili është një nga supozimet më themelore të
teknikave me shumë ndryshore, testet e përfituara e humbin vlefshmërinë për arsye se ky
supozim është i nevojshëm në llogaritjen e statistikave t dhe F. Teknikat me një ndryshore
dhe shumë ndryshore bazohen në supozimin e normalitetit me një ndryshore dhe përveç
kësaj, teknikat me shumë ndryshore bazohen edhe në supozimin e normalitetit me shumë
ndryshore.

Hulumtimet kanë treguar se devijimet nga supozimi i normalitetit në analiza me një
ndryshore (për shembull, ANOVA) dhe shumë ndryshore (për shembull, analiza
diskriminuese, MANOVA) kanë një ndikim të rëndësishëm mbi gabimin alfa (Mardia, 1971;
Glass dhe të tj., 1972; Olson dhe të tj., 1974; Everitt, 1979). Ashtu si në analizën e
diskriminimit, devijimi nga supozimi i normalitetit ndikon në normën e klasifikimit dhe
fuqinë e testeve statistikore.

Shpërndarja normale me tek ndryshore mund të testohet me lehtësi dhe siç do të
tregohet në vazhdim, për konvertimin e shpërndarjes së ndryshoreve të cilat nuk ndjekin
supozimin e normalitetit në shpërndarje normale, mund të aplikohen disa konvertime. Në
mënyrë të thjeshtë, shpërndarja e shumëfishtë normale supozon se çdo ndryshore ndjek

3 Për shpërndarjen e shumëfishtë normale, shikoni Johnson dhe të tj., fq. 127-177, për informata më të
hollësishme dhe të kuptueshme. Ky burim ka një kapitull të hollësishëm dhe lehtë të kuptueshëm për
shpërndarjen e shumëfishtë normale.

243
shpërndarjen normale me një ndryshore dhe se kombinimet e ndryshoreve përkatëse janë
normale. Pra, në qoftë se një ndryshore ndjek shpërndarjen e shumëfishtë normale, në të
njëjtën kohë do të thotë se ndjek edhe shpërndarjen normale me një ndryshore. Mirëpo, e
kundërta nuk mund të thuhet çdo herë. Për këtë arsye, shfaqja e shpërndarjes normale me
një ndryshore nga të gjitha ndryshoret, do të ndihmojë në sigurimin e shpërndarjes së
shumëfishtë normale, edhe në qoftë se kjo nuk jep garancion. Sado që mostrat e mëdha të
zvogëlojnë ndikimin e devijimit nga shpërndarja normale, supozimi i normalitetit duhet të
sigurohet për të gjitha ndryshoret e përfshira në analizë (Hair dhe të tj., fq. 70-73).

Shpërndarja normale me një ndryshore ka lakueshmëri me vlerë zero dhe kurtozë
me vlerë 3. Ndonjëherë, largohet vlera 3 nga kurtoza dhe në këtë mënyrë vlera e kurtozës
bëhet zero në ndryshoret të cilat tregojnë shpërndarje normale. Në këtë mënyrë, vlerat e
lakueshmërisë dhe kurtozës së shpërndarjes normale me një ndryshore bëhen zero.4 Një
shpërndarje e lakuar në të majtë ka vlerë negative, kurse një shpërndarje e lakuar në të
djathtë ka vlerë pozitive. Hulumtimet kanë treguar se në rastet kur devijimi nga
shpërndarja e shumëfishtë normale buron plotësisht nga lakueshmëria, nuk ndikon në
fuqinë e testit (Sharma, fq. 375).

Matjet e kurtozës përdoren për të hulumtuar nëse shpërndarjet e njësive në seri
janë të larguara (platykurtic), sivrike (leptokurtic) ose normale (mesokurtic). Qëllimi i
matjeve të kurtozës është të zbulojë se çfarë shpërndarje shfaqin ndryshoret përreth
mesatares. Është vrojtuar se njësitë në seritë e kurtozës nuk shfaqin ndonjë grupim të
rëndësishëm përreth mesatares (Orhunbilge, 2000, fq. 137-138). Pra, në qoftë se vlera e
kurtozës është pozitive pranohet si sivrike, në qoftë se është negative (ose më e vogël se 3)
e larguar, zero (ose 3) normale. Në qoftë se ndryshoret gjenden në intervalin e kurtozës së
normalizuar −3 dhe +3, saktësisht vlerat e ndryshores tregojnë që vijnë nga një
shpërndarje tipike normale.5 Kurtoza e shpërndarjes ka ndikim mbi fuqinë e testit, mirëpo
ndikimi është më tepër për shpërndarjen e kurtozës sesa shpërndarjen sivrike. Në
hulumtimet e bëra, për shembull për analizën MANOVA është vrojtuar se ndryshoret me
shpërndarje kurtoze ulin në mënyrë serioze fuqinë e testit. Për më keq, në rastin kur
supozimi i normalitetit devijon për më shumë se një grup, kjo tregon që ndikimi rritet edhe
më shumë (Olson, fq. 894-907). Për arsye se supozimi i normalitetit ndikon në fuqinë e
testeve, rekomandohet që të kontrollohet nëse ka devijime të rëndësishme nga supozimi.
Më poshtë, pas shpjegimit të shpërndarjes normale me një ndryshore dhe asaj se si mund
të përcaktohen njësitë devijuese me shumë ndryshore, do të trajtohet shpërndarja normale
me shumë ndryshore.

4 Vlera zero e lakueshmërisë quhet lakueshmëria e Fisherit, kurse vlera e lakueshmërisë 3 quhet
lakueshmëria e Pearsonit. Në aplikime, në qoftë se vlera e lakueshmërisë së Fisherit dhe vlera e kurtozës janë
në intervalin 3 (ose sipas disa autorëve 2), ndryshorja përkatëse pranohet. Me programin statistikor SPSS
llogariten vlerat e lakueshmërisë së Fisherit dhe kurtozës.
5 http://www2.chass.ncsu.edu/garson/pa765/assumpt.htm, 20 Qershor 2004.

244
10.2.1. TESTI I NORMALITETIT ME NJË NDRYSHORE
Këtu ekzistojnë dy qëllime për diskutimin e shpërndarjes normale me një
ndryshore. E para është se testi i shpërndarjes normale me shumë ndryshore është më i
vështirë dhe më i komplikuar dhe se sigurimi i këtij testi varet nga testet me një ndryshore.
E dyta është se edhe në qoftë se të gjitha shpërndarjet margjinale ndjekin shpërndarjen
normale, nuk sigurohet shpërndarja normale e shumëfishtë. Sigurimi i supozimit të
normalitetit me një ndryshore rastiset edhe në rastet kur nuk sigurohet shpërndarja e
shumëfishtë normale. Si rezultat, në rastet kur të dhënat shfaqin devijim nga shpërndarja
normale me shumë ndryshore, duhet të bëhet hulumtimi i ndryshoreve të cilat nuk ndjekin
shpërndarjen normale. Për shpërndarjen normale me një ndryshore përdoren testet
analitike dhe grafikore. Disa nga këto janë shpjeguar më poshtë.

10.2.1.1. Testet Grafikore
Për të testuar supozimin e normalitetit në mënyrën më të thjeshtë dhe grafikore
përdoren grafiqet si histogrami, steam and leaf, kutizë, Q-Q, P-P etj. Grafiku më i përhapur
nga këto, grafiku Q-Q shpjegohet këtu.6 Grafiqet Q-Q përfitohen nga hapat e mëposhtëm
(Johnson dhe të tj., 1992, fq. 152-165):

- Vlerat e njësive me numër n njësish renditen nga më e vogla te më e madhja X 1 <
X2 ... < Xn. Ashtu si në ndryshoret e vazhdueshme, zakonisht ndryshorja e vogël
sa j do të jetë më e vogël ose e barabartë me Xj.
- Norma e njësive më të vogla se Xj llogaritet si (j−0,5)/n. Vlera 0,5 nxirret nga
njësitë për rregullim infinit. Këto norma për çdo j, japin nivelet e probabilitetit
për shpërndarjen normale kumulative standarte, vlerat-z dhe probabilitet e
pritura për shpërndarjen normale përkatëse.7

Grafiku ndërmjet njësive të renditura (Xj) dhe vlerave teorike z quhet grafiku Q-Q.
Grafiku linear tregon shpërndarjen normale, kurse grafiku jolinear shpërndarjen
jonormale.

Për përfitimin e grafiqeve P-P dhe Q-Q me programin SPSS, nga menyja Graphs 
P-P... zgjedhet (ose Q-Q). Nga këtu hapet dritarja e grafikut P-P si në Hapin 1.

6 Për testet grafikore shikoni: M. J. Norusis, SPSS Inc., SPSS for Windows: Base System User’s Guide, Rel. 6.
0, 1993.
7 Vlerat-Z mund të llogariten nga tabela e probabilitetit kumulativ normal ose duke përdorur funksionin

PROBIT nga pakoja e programit statistikor SPSS. Po ashtu, vlerat kumulative normale standarte mund të
llogariten nga programi statistikor NCSS 2001 nga kutiza Analysis-Other-Probability Calculator; nga programi
statistikor Statgrapihcs Plus 3.0 nga kutiza Plot-Probability Distributions llogariten vlerat për pesë njësi në të
njëjtën kohë dhe nga Microsoft Excel, nga funksionet statistikore NORMSTERS.

245
Hapi 1: Dritarja e Shpërndarjes Normale me një Ndryshore dhe Grafikut P-P

Grafiku i përfituar P-P për ndryshoren e normës së pjesëmarrjes së fuqisë punëtore
për provincat e Turqisë është dhënë në Figurën 10.1.

Në Figurën 10.1, pikat nën dhe mbi vijën lineare paraqesin në mënyrë vizuale
devijimin e vlerave të njësisë nga shpërndarja teorike (normale). Siç mund të shihet në
Figurën 10.1, nuk ekzistojnë devijime të rëndësishme nga normaliteti të ndryshores së
normës së pjesëmarrjes së fuqisë punëtore. Statistikat e lakueshmërisë dhe kurtozës,
−0,114 dhe 0,089 e përkrahin këtë mendim.

246
Figura 10.1: Grafiku P-P i Ndryshores për Normën e Pjesëmarrjes së Fuqisë Punëtore

10.2.1.2. Testet Analitike për Normalitetin me një Ndryshore
Testet Katrori-Ki i përshtatshmërisë, Kolmogorov-Smirnov (K-S) Z dhe Shapiro-
Wilks (statistika W) janë disa nga testet analitike të përdorura në vlerësimin e supozimit të
normalitetit. Testi Katrori-Ki i përshtatshmërisë përdoret në hulumtimin e shpërndarjes së
një mostreje, nëse kjo mostër vie nga nje popullsi e cila shfaq një shpërndarje probabile
teorike. Për aplikimin e testit, frekuencat përkatëse të probabilitetit duhet që të jenë 5 ose
më të mëdha (Orhunbilge, 2000, fq. 265-266). Testi K-S z përdoret si alternativë e testit të
Katrorit-Ki të përshtatshmërisë. Për aplikimin e testit të Katrorit-Ki të përshtatshmërisë,
kërkohet që frekuencat përkatëse të jenë së paku 5 ose më të mëdha. Shpërndarja e
frekuencave vizuale kumulative e fituar nga mostra bazohet në krahasimin me
shpërndarjen probabile teorike të supozuar në H0. Statistika K-S z e cila duhet të llogaritet
është e barabartë me ndryshimin absolut maksimal ndërmjet shpërndarjes së frekuencave
vizuale kumulative të vëzhguara (f) dhe shpërndarjes së frekuencave teorike kumulative në
H0. Me fjalë të tjera, K-S z = Max |f – f’ˈ|. Në vitin 1968, me hulumtimet simulime të
realizuara nga Wilks, Shapiro dhe Chen është dëshmuar se testi W është testi më i fuqishëm
në vlerësimin e supozimit të normalitetit (Sharma, 1996, fq. 378). Në qoftë se të dhënat nuk
vijnë një popullsi me shpërndarje normale, duhet të bëhen vlerësime më të hollësishme
duke shqyrtuar treguesit e lakueshmërisë dhe të kurtozës. Statistikat e lakueshmërisë dhe
kurtozës llogariten si më poshtë:

Ze lakueshmërisë = , Ze kurtozës = (Hair dhe të tj., 1995, fq. 72).

247
Në qoftë se vlera e llogaritur Z e tejkalon vlerën kritike, jepet vendim se shpërndarja
nuk është normale sipas karakteristikës përkatëse. Vlera kritike z tregon nivelin e
rëndësisë dhe përfitohet nga Tabela e Shpërndarjes Normale. Për shembull, në rastet kur
vlera e llogaritur z tejkalon vlerën 2,58, supozimi i normalitetit në nivelin e rëndësisë 1%
refuzohet. Vlera tjetër kritike e përdorur shpesh për nivelin e rëndësisë 5% është 1,96.

Statistikat e lakueshmërisë dhe kurtozës në SPSS fitohen me anë të Descriptive
Statistics  Descriptive..., ose Descriptive Statistics  Frequencies.

10.2.2. SHQYRTIMI I VLERAVE TË NJËSISË DEVIJUESE ME SHUMË
NDRYSHORE
Njësitë devijuese me shumë ndryshore mund të përcaktohen duke llogaritur
distancat katrore Mahalanobis (MD2) ndërmjet ndryshoreve të pavarura që do të përdoren
në analizë. Ashtu që distancat katrore Mahalanobis të llogaritur për çdo njësi në analizë
ndjekin shpërndarjen t (MD2 / df) të përfituar me pjesëtimin e numrit të ndryshoreve në
analizë (p ndaj shkallës së lirisë). Për njehsimin e vlerës së secilës njësi duhet që secila njësi
të jetë e rëndësishmë në nivelin e rëndësisë 1%. Pra, vlera (t) e MD2/df duhet të jetë më e
madhe se 5,014 (Hair dhe të tj., 1995, fq. 66-70). Në përgjithësi, nxjerra e vlerave devijuese
nga analiza bën që ndryshoret të ndjekin më shumë shpërndarjen normale dhe në këtë
mënyrë ndryshore që kërkojnë më pak konvertim.

Mirëpo, kjo situatë duhet të interpretohet në mënyrë të duhur në lidhje me nevojën
e nxjerrjes nga analiza të vlerave devijuese. Në këtë kuptim, është e mundur që vlerat
devijuese të ndahen në dy grupe, të mira dhe të këqija. Vlerat e mira devijuese janë njësi që
reflektojnë karakteristikat e popullsisë, kurse vlerat e këqija devijuese janë njësi që nuk
reflektojnë karakteristikën e popullsisë. Në këtë kuptim, vlerat e këqija devijuese duhet të
nxirren patjetër nga analiza, kurse përpara nxjerrjes së vlerave të mira devijuese duhet të
hulumtohet nëse mund të bëhet ndonjë rregullim me ndonjë konvertim të përshtatshëm.

Distancat Mahalanobis në programin SPSS mund të përfitohen nga Analyze 
Regression  Linear ... Save. Kutia e dialogut e përfituar me këtë mënyrë është dhënë në
Hapin 2.

248
Hapi 2: Përfitimi i Distancave Mahalanobis me Programin SPSS

Shënim: MD2 paraqet vlerat e distancës katrore Mahalanobis ndërmjet njësive
(krahinave) F01, F02, F03, F04, F05, F06, F07 dhe F08 sipas grupeve të zhvillimit dhe df
shkallën e lirisë. Statistika MD2/df ndjek përafërsisht shpërndarjen t. Në këtë mënyrë, vlera
MD2/df në nivelin e rëndësisë 1% është 3,355. Për vlerësimin e secilës vlerë të njësive,
niveli i rëndësisë duhet të jetë 1% (t=5,014).

249
Tabela 10.2: Shqyrtimi i Njësive Devijuese Shumë Ndryshoresh

KRAHINAT MD2 DF=P MD2/DF KRAHINAT MD2 DF=P MD2/DF
Adana 9,48 8 1,18 Kocaeli 8,45 8 1,06
Adıyaman 3,71 8 ,46 Konya 15,60 8 1,95
Afyon 7,89 8 ,99 Kütahya 6,27 8 ,78
Ağrı 3,08 8 ,38 Malatya 5,88 8 ,73
Amasya 4,15 8 ,52 Manisa 5,51 8 ,69
Ankara 16,25 8 2,03 K. Maraş 6,03 8 ,75
Antalya 7,13 8 ,89 Mardin 1,77 8 ,22
Artvin 10,47 8 1,31 Muğla 11,64 8 1,45
Aydın 3,05 8 ,38 Muş 7,49 8 ,94
Balıkesir 3,86 8 ,48 Nevşehir 12,52 8 1,57
Bilecik 3,08 8 ,38 Niğde 16,72 8 2,09
Bingöl 3,12 8 ,39 Ordu 17,31 8 2,16
Bitlis 2,74 8 ,34 Rize 7,61 8 ,95
Bolu 5,44 8 ,68 Sakarya 4,14 8 ,52
Burdur 4,70 8 ,59 Samsun 11,86 8 1,48
Bursa 6,82 8 ,85 Siirt 4,43 8 ,55
Çanakkale 10,56 8 1,32 Sinop 7,88 8 ,98
Çankırı 5,90 8 ,74 Sivas 3,31 8 ,41
Çorum 8,13 8 1,02 Tekirdağ 8,70 8 1,09
Denizli 5,53 8 ,69 Tokat 5,37 8 ,67
Diyarbakır 12,02 8 1,50 Trabzon 7,28 8 ,91
Edirne 8,76 8 1,09 Tunceli 10,70 8 1,34
Elazığ 7,66 8 ,96 Şanlıurfa 10,61 8 1,33
Erzincan 8,45 8 1,06 Uşak 3,12 8 ,39
Erzurum 12,32 8 1,54 Van 9,54 8 1,19
Eskişehir 11,14 8 1,39 Yozgat 12,88 8 1,61
Gaziantep 11,93 8 1,49 Zonguldak 9,86 8 1,23
Giresun 6,37 8 ,80 Aksaray 3,94 8 ,49
Gümüşhane 4,84 8 ,61 Bayburt 7,11 8 ,89
Hakkari 9,29 8 1,16 Karaman 3,85 8 ,48
Hatay 10,73 8 1,34 Kırıkkale 8,31 8 1,04
Isparta 4,89 8 ,61 Batman 6,78 8 ,85
İçel 6,31 8 ,79 Şirnak 11,13 8 1,39
İstanbul 24,15 8 3,02 Bartın 9,96 8 1,24
İzmir 6,31 8 ,79 Ardahan 7,45 8 ,93
Kars 4,19 8 ,52 Iğdır 5,05 8 ,63
Kastamonu 2,97 8 ,37 Yalova 10,41 8 1,30
Kayseri 3,29 8 ,41 Karabük 6,00 8 ,75
Kırıklareli 4,09 8 ,51 Kilis 8,37 8 1,05
Kırşehir 3,71 8 4 Osmaniye 6,66 8 ,83

Në lidhje me shqyrtimin e njësive devijuese shumë ndryshoresh, për një shembull
janë përfituar 48 tregues në lidhje me nivelet e zhvillimit socio-ekonomik të 80 krahinave
të Turqisë. Sipas këtyre treguesve, janë përcaktuar njësitë (krahinat) devijuese në numër të
madh me 48 x 80 madhësi ndryshoresh origjinale. Me qëllim të rregullimit ose reduktimit
të njësive devijuese është aplikuar analiza faktoriale mbi distancën e ndryshores me
madhësi 48 x 80 dhe distanca e ndryshores është reduktuar në një distancë faktori prej 8

250
madhësish. Kurse në distancën e faktorit 8 madhësish, është vëzhguar se nuk ka njësi
(krahina) devijuese (Shiko: Tabela 10.2).

10.2.3. TESTI I SHPËRNDARJES NORMALE ME SHUMË NDRYSHORE
Testet e përdorura në hulumtimin e shpërndarjes së shumëfishtë normale mund të
ndahen në dy grupe, si testet e përdorura grafikore dhe analitike në testimin e normalitetit
me një ndryshore, mirëpo për shpërndarjen e shumëfishtë normale gjenden pak teste. Këtu
shpjegohet metoda analitike e bazuar në metodën grafike, e shpjeguar për shpërndarjen
normale një ndryshoresh. Testi grafikor i ngjan grafikut Q-Q të diskutuar në shpërndarjen
normale me një ndryshore. Kurse testet analitike bazohen në vlerësimin e statistikave të
shumta të lakueshmërisë dhe kurtozës. Mirëpo, këto statistika nuk mund të llogariten në
disa programe statistikore. Po ashtu, mosnjohja e shpërndarjes matematikore të
statistikave kufizon përdorimin e testit të normalitetit me shumë ndryshore (Sharma, fq.
380). Për këtë arsye, këtu shpjegohet vetëm metoda grafikore dhe metoda analitike e cila
bazohet në distancën Mahalanobis ndërmjet ndryshoreve të përdorura në metodën
grafikore.

Testi i normalitetit të shumëfishtë fillon me llogaritjen e distancave katrore
Mahalanobis për njësi sipas vlerave qendore (centroid). Në qoftë se popullsitë janë
normale dhe mostrat të mëdha mjaftueshëm (n ≥ 5), këto distanca ndjekin shpërndarjen e
Katrorit-Ki (Johnson dhe të tj., fq. 152-158). Nga këtu, përfitohet grafiku i Katrorit-Ki si më
poshtë (Johnson dhe të tj., fq. 123-129; Sharma, fq. 380-382):8

Distancat katrore Mahalanobis me numër n të njësive totale renditen nga më e vogla
te më e madhja:

1 < < 3 < ... < .

Në fazën e dytë, llogariten përqindjet (j – 0,5) / n me numër njësish j për secilën
vlerë katrore Mahalanobis (MD2).

Në fazën e tretë, llogariten vlera reverse kumulative të Katrorit-Ki për përqindjet e
fituara në fazën e dytë, duke treguar numrin e ndryshoreve p dhe shkallën e lirisë.9

Në fund, vizatohet grafiku nga vlerat e distancës katrore Mahalanobis (MD2) dhe
vlerave të Katrorit-Ki (X2).

8 Në Shtojcën 10.2 është dhënë si shembull testi i shpërndarjes së shumëfishtë normale për një matricë të
dhënash që përbëhet nga 55 ndryshore dhe 73 njësi.
9 Vlerat e Katrorit-Ki mund të llogariten nga tabelat e Katrorit-Ki ose në programin statistikor SAS duke

përdorur funksionin CINV. Po ashtu, vlerat e Katrorit-Ki mund të llogariten në programin statistikor NCSS
2001 nga Analysis – Other – Probability Calculator, në programin statistikor Statgrapihcs Plus 3.0 nga Plot –
Probability Distributions, në Microsoft Excel XP në versionin turqisht nga funksionet statistikore KİKATERS,
ose në versionin anglisht nga funksionet CHIINVERSE.

251
Siç është specifikuar edhe më parë, llogaritet koeficienti i korrelacionit ndërmjet
vlerave të distancës katrore Mahalanobis të renditura në mënyrë analitike dhe vlerave të
Katrorit-Ki dhe ky koeficient i korrelacionit krahasohet me koeficientin e korrelacionit
përkatës të dhënë në Shtojcën 10.1. Sado që në këtë tabelë janë llogaritur koeficientët e
korrelacionit për shpërndarjet me një ndryshore, sigurohen edhe krahasimet konsistente.
Në rast se ky koeficient i korrelacionit i llogaritur sipas testit është më i madh se koeficienti
i korrelacionit kritik, bëhet sigurimi i supozimit të normalitetit me shumë ndryshore
(Sharma, fq. 380-382).

Në qoftë se të dhënat nuk ndjekin shpërndarjen normale, mund të konvertohen në
shpërndarje normale duke aplikuar konvertime të caktuara. Në analizat me shumë
ndryshore, provohet të sigurohet shpërndarja e shumëfishtë normale duke aplikuar
konvertime të përshtatshme në secilën ndryshore, shpërndarja marxhinale e të cilave nuk
është normale.

Tabela 10.3: Konvertimet e Përdorura në Sigurimin e Normalitetit

LLOJI I MATËSIT Konvertim
MADHËSITË ABSOLUTE Rrënja katrore, logaritmike ose
hiperbolike
NORMAT (p)10 Logit(p) = 0,5Log(1− ) ose arcsin (X)
KORRELACIONET (r) Fisher Z = 0,5Log( )
1−
Burimi: Johnson dhe të tj., fq. 220-222.

Konvertimi i ndryshoreve në shpërndarje normale bëhet sipas lakueshmërisë dhe
kurtozës së shpërndarjes. Për shembull, për shpërndarjen e lakueshmërisë zakonisht
konvertimi hiperbolik (1/X) është i përshtatshëm, kurse për shpërndarjen e kurtozës është
konvertimi në rrënjë katrore, logaritmike ose hiperbolike. Mirëpo, hulumtuesi duhet të
zgjedh konvertimin i cili ofron rezultat më të mirë, duke i aplikuar të gjitha konvertimet e
mundshme (Hair dhe të tj., fq. 77). Konvertimi në rrënjë katrore zakonisht jep rezultatin më
të mirë në normalizimin e shpërndarjes së lakueshmërisë në të majtë, kurse konvertimi
logaritmik në normalizimin e shpërndarjes së lakueshmërisë në të djathtë. Po ashtu,
madhësitë absolute sigurojnë rezultate më të mira për konvertimin në rrënjën katrore, për
normat logit ose arcsin (X) dhe për korrelacione konvertimi Fisher-Z (Shiko: Tabela 10.3).
Në rast se nuk sigurohet supozimi i normalitetit me këto konvertime, atëherë normaliteti
mund të sigurohet duke përdorur qasjet analitike.

10 Marrin vlera në intervalin 0 ≤ P ≤ 1.

252
10.3. SUPOZIMI I BARAZIMIT TË MATRICAVE TË KOVARIANCAVE
Probleme të ndryshme të variancës, siç burojnë nga problemet e normalitetit
burojnë edhe nga shpërndarja e ndryshoreve. Gjatë shqyrtimit të gabimeve të analizës së
regresionit në rastin e variancave të ndryshme, shpërndarja e gabimeve i përngjan një koni.
Në këtë rast, në qoftë se koni hapet në të djathtë, duhet të merret e kundërta e ndryshores,
në qoftë se hapet në të majtë, duhet të merret rrënja katrore e ndryshores. Kurse disa
konvertime varen nga lloji i të dhënave. Për shembull, arcsin (X* = 2 arcsin ) ose
konvertimet logaritmike japin rezultatin më të mirë për normat. Konvertimet e aplikuara
në ndryshore duhet të kontrollohen gjithmonë nëse ofrojnë zgjidhje apo jo (Hair dhe të tj.,
fq. 77).

Në rastin e një analize më një ndryshore (për shembull, ANOVA), supozimi sigurohet
në qoftë se matrica e kovariancës është fikse dhe varianca e ndryshores së pavarur është e
barabartë për të gjitha qelitë. Mirëpo, në analizën e diskriminimit dhe në MANOVA,
supozimi mund të sigurohet në rastin kur të gjitha qelitë e matricës së kovariancës janë të
barabarta. Për shembull, të marrim tri varianca në matricën e kovariancës ( 1 , , 3 ) dhe
tri ndryshore të varura që kanë kovarianca ( 1 , 13 , 3 ). Për sigurimin e supozimit të
barazimit të matricave të kovariancave, gjashtë elementet përkatëse të matricës duhet të
jenë të barabarta. Për këtë arsye, mundësia e devijimit nga supozimi i barazimit të
matricave të kovariancave në analizën e diskriminimit dhe në MANOVA është më i lartë se
në analizën ANOVA (Sharma dhe të tj., fq. 383).

Devijimet nga barazia e matricave të kovariancave ndikohen nga gabimet alfa dhe
beta. Mirëpo, nga hulumtimet e bëra simulative është gjetur se ndikimi në gabimin alfa
është më i lartë krahasuar me atë në gabimin beta. Për këtë arsye, shumica e diskutimeve
janë në lidhje me atë se si ndikohet niveli i rëndësisë së testit. Hulumtimet kanë treguar se
niveli i rëndësisë nuk ndikohet nga matricat e kovariancave jo të barabarta në rastin kur
madhësitë e qelive janë të barabarta (Holloway dhe të tj., 1967). Për këtë arsye, ajo çfarë
duhet bërë është përfitimi i madhësive të barabarta të qelive. Përveç kësaj, niveli i
rëndësisë ndikohet në mënyrë serioze nga dallimi i matricës së kovariancës në nivel
mesatar në rastin kur qelitë nuk janë të barabarta. Rezultatet e mëposhtme për analiza dy-
grupshe janë përfituar nga punimet simulative (Holloway dhe të tj., fq. 24-136). Në qoftë se
grupet e vogla kanë variancë më të lartë se grupet e mëdha, testi është liberal dhe niveli
alfa i vërtetë i testit është më i madh se niveli nominal alfa. Në anën tjetër, në qoftë se
grupet e mëdha kanë variancë më të lartë se grupet e vogla, testi është një test holder dhe
niveli i vërtetë alfa i testit është më i vogël se niveli nominal alfa. Këto gjetje janë shpjeguar
shkurtimisht më poshtë (Sharma, fq. 383-384):

Në qoftë se testi është holder (mbajtës) sipas matricës së kovariancave jo të
barabarta, nuk ka nevojë për shqetësim për sigurimin e supozimit të barazimit të

253
kovariancave sepse rëndësitë e ndryshoreve të konvertuara do të vazhdojnë. Në anën
tjetër, duhet shqetësuar për rezultatet të cilat nuk janë të rëndësishme sepse ndryshoret e
konvertuara mund të shëndërrohen në formë të rëndësishme me qëllim për të siguruar
supozimin e kovariancave të barabarta dhe në këtë mënyrë rezultatet e analizës mund të
ndryshojnë.

Në qoftë se testi është liberal sipas matricës së kovariancave të jo të barabarta, nuk
ka nevojë për shqetësim për sigurimin e supozimit të kovariancave të barbarta sepse mos-
rëndësitë e ndryshoreve të konvertuara do të vazhdojnë. Mirëpo, rezultatet e rëndësishme
duhet të shikohen me shqetësim. Në këtë rast, nuk do të dihet nëse rëndësia buron nga
dallimet e vërteta apo nga rastësia e matricave të kovariancave jo të barabarta.

10.3.1. TESTIMI I BARAZISË SË MATRICËS SË KOVARIANCAVE
Analiza diskriminuese, MANOVA dhe shumë teknika të tjera statistikore me shumë
ndryshore supozojnë barazinë e matricave të kovariancave. Me këtë qëllim është
propozuar statistika M nga Box-i në vitin 1949. Statistika Box-M përfitohet me
përgjithësimin e testit Barlett-Box F i cili është test i kovariancës një ndryshoresh (p=1).
Me fjalë të tjera, statistika Box-M e llogaritur për p = 1 është e barabartë me statistikën
Barlett-Box F. Le të supozojmë një grup me numër g i matur për ndryshoren për numër p
dhe se numri i njësive për secilin grup shprehet me nj. Po ashtu, kovariancat ndërmjet
grupit të shprehen me Sj (pjesëtohet me nj – 1). Në këtë mënyrë, Box-M llogaritet si më
poshtë me përgjithësimin e statistikës Barlett-Box F (Tacg, fq. 248-255)

Box – M = (N – g) x Ln|Sw| − =1( - ) x Ln(Sj)

=1( -1)
Këtu, N = =1 dhe Sw = -

Rëndësia e statistikës Box-M testohet me statistikën e Katrorit-Ki dhe F. Këto
parashikime llogariten si më poshtë:

+ 3 -1 1 1 ( +1)( -1)
A1 = ( +1)( -1)
x[ =1 ( -1
)−
-
] dhe v1 = .

( – 1)( + ) 1 1
A2 = ( −1)
x[ =1 ( -1
)−

]

1+ 1
Në qoftë se A2 − 1 > 0, v2 = dhe b = .
- 1 - - (v1 v )

1,
=

1+
Në qoftë se A2 − 1 < 0, v2 = dhe b = (
.
1 - – v )

254
1,
= dhe = M(1 – A1).

Të gjitha statistikat e përdorura në testimin e barazimit të matricave të
kovariancave janë të ndjeshme ndaj supozimit të normalitetit. Statistika Box-M e
rëndësishme tregon matricat e kovariancave jo të barabarta ose devijimin nga normaliteti,
ose të dyjat. Për këtë arsye, përpara përdorimit të statistikës Box-M, së pari duhet të
sigurohet supozimi i shpërndarjes së shumëfishtë normale. Statistika e Katrorit-Ki duhet të
përdoret në rastet kur p<6, g<6 dhe kur për gjitha grupet n j>20. Në rastet e tjera, duhet të
përdoret statistika F. Me statistikën Barlet-Box në një ndryshoresh mund të përcaktohet se
cila ndryshore apo cilat ndryshore e prishin kushtin e barazisë së matricave të
kovariancave.

Në SPSS, testi i barazimit të variancave me një ndryshore mund të përfitohet nga
Analyze  Descriptive Statistics  Explore.

Hapi 3: Përfitimi i Testit të Variancave të Barabarta me Një Ndryshore në SPSS

Përfitimi i Box-M të rëndësishëm, tregon që nuk është siguruar supozimi i matricës
së kovariancave të barabarta. Duke i shqyrtuar variancat e përgjithësuara, mund të
përfitohet një ide rreth variancave të grupit. Në këtë mënyrë, duke i shqyrtuar variancat e
grupeve mund të vendoset nëse testi është liberal apo holder. Për shembull, siç është
specifikuar më lartë, në qoftë se varianca e grupit të vogël është më e madhe, testi është
liberal. Pra, rezultatet e testeve me shumë ndryshore mund të jenë të rastësishme. Prandaj,
analiza duhet të përsëritet pas konvertimit të përshtatshëm i cili bën barazimin e matricës

255
së kovariancave. Për këtë, për të përcaktuar se cila ndryshore ka variancë të ndryshme
sipas grupeve, aplikohen testet me një ndryshore. Për këtë qëllim, përdoret testi Barlett-
Box F. Një nga konvertimet e përdorura në stabilizimin e variancës është edhe konvertimi
në rrënjë katrore. Ky konvertim jep rezultatin më të mirë atëherë kur normat e variancave
të mesatareve të grupeve janë të përafërta me njëra-tjetrën.11

Si shembull, grafiqet e përfituara dhe rezultatet e testit Levene nga statistikat për
ndryshoren e normës së pjesëmarrjes totale të fuqisë punëtore janë dhënë në Tabelën 10.4.
Për arsye se rezultatet e kësaj satistike nuk janë të rëndësishme në nivelin e rëndësisë 5%,
pranohet hipoteza zero (është e vlefshme deklarata e variancave të barabarta). Me fjalë të
tjera, ndryshorja e normës së pjesëmarrjes totale të fuqisë punëtore ka variancë të
barabartë me grupet e zhvillimit.

Tabela 10.4: Testi i Variancave të Barabarta për Normën e Pjesëmarrjes Totale të
Fuqisë Punëtore (X24)

Statistika Levene df1 df2 Rënd. (Sig.)
Sipas Mesatares Aritmetike ,246 2 77 ,783
Sipas Medianës (Mesores) ,203 2 77 ,817
Sipas Medianës së Rregulluar dhe df ,203 2 74,897 ,817
Sipas Mesatares Trimmed (Ekuilibruar) ,233 2 77 ,793
Në SPSS, nga Analyze  Classify  Discriminant, përfitohet statistika Box M e cila
teston barazimin e variancave për matricat e të dhënave me shumë madhësi.

Hapi 4: Përfitimi i Testit të Barazisë së Variancave me Shumë Ndryshore në SPSS

11Për supozimin e variancave të barabarta në të dhënat proporcionale, zakonisht aplikohet konvertimi arcsin.
Po ashtu, me të madhe përdoren edhe konvertimet logaritmike. Konvertimet në rrënjë katrore dhe
logaritmike nuk mund të aplikohen në numrat negativ. Mirëpo, ky problem mund të tejkalohet duke shtuar
një njësi fikse cila do të bëj pozitive të gjitha njësitë e ndryshores përkatëse.

256
10.4. SUPOZIMI I LINEARITETIT
Një nga supozimet e teknikave me shumë ndryshore të cilat bazohen në koeficientët
e korrelacionit si analiza e regresionit të shumëfishtë, analiza faktoriale, modeli i barazisë
strukturore dhe analiza e diskriminit është edhe supozimi i linearitetit. Korrelacionet
lineare të llogaritura për bashkëveprimet të cilat nuk janë lineare, do të paraqesin
gjithmonë marrëdhënien e vërtetë më të ulët.

Figura 10.2: Zgjedhjet e Konvertimit për Supozimin e Linearitetit (Hair dhe të tj., fq.
77)

Për sigurimin e linearitetit ndërmjet dy ndryshoreve mund të aplikohet konvertimi
në numër të shumtë, mirëpo marrëdhëniet të cilat nuk janë lineare mblidhen në katër
grupe (Shiko: Figura 10.2). Secili grafik tregon konvertimet e funksionit kuadratik të
aplikuar si në ndryshoret e varura edhe në ndryshoret e pavarura. Për shembull,
marrëdhënia ndërmjet ndryshoreve, ashtu si në Figurën 10.2-a, mund të bëhet
marrëdhënie lineare duke marrë katrorin e dy ndryshoreve. Në rast kur janë në pyetje
zgjedhjet e konvertimit të shumëfishtë, konvertimet duhet të realizohen nga konvertimi i
mësipërm duke vazhduar më poshtë derisa të sigurohet lineariteti. Për shembull, për të
linearizuar marrëdhënien ndërmjet dy ndryshoreve në Figurën 10.2-b, merret katrori i

257
ndryshoreve të pavarura dhe në ndryshore aplikohen konvertimet me radhë LogY, −1/Y
dhe dhe nga këto zgjedhet ai konvertim që siguron linearitetin. Kurse në Figurën 10.2-c,
ekzistojnë nëntë zgjedhje konvertimi për të siguruar linearitetin. Këto konvertime
realizohen duke i provuar nga lartë drejt poshtë derisa të sigurohet lineariteti.

10.5. KONVERTIMET PËR NORMALITETIN, KOVARIANCAT DHE
LINEARITETIN
Në analizat statistikore ekzistojnë tri qëllime themelore të konvertimit të të
dhënave, si normalizimi, stabiliteti (homoscedasticity) dhe lineariteti. Me disa konvertime,
zakonisht realizohen dy qëllimet e para, e ndonjëherë edhe qëllimi i tretë. Diskutimet e
hollësishme në lidhje me konvertimet mund të gjenden në disa burime (Armitage, 1971;
Draper dhe të tj., 1981; Netter dhe të tj., 1983; Box dhe të tj., 1984; Carrol dhe të tj., 1984).
Këtu shpjegohen shkurtimisht konvertimet më të përdorura.

Konvertimi Logaritmik [X* = LG10 (X) ose LN (X)]: Ky konvertim mund të
aplikohet mbi ndryshoret të cilat i kanë vlerat pozitive, për shkak që nuk mund të mirret
logartimi i numrave negativ. Mirëpo, ky problem mund të tejkalohet duke e shtuar një
ndryshore me numër fiks e cila do t’i bëj pozitive të gjitha vlerat negative. Ky konvertim
përdoret për të stabilizuar variancën, në qoftë se rritet varianca e X-it me rritjen e X-it, për
të normalizuar shpërndarjen X në qoftë se shpërndarja X lakohet në të djathtë dhe për të
linearizuar modelin e ndryshores së varur dhe ndryshoreve të pavarura, në qoftë se tregon
një trend të vazhdueshëm të rritjes.

Konvertimi në Rrënjë Katrore (X* = ): Në qoftë se varianca është
proporcionale me mesataren X, përdoret për të stabilizuar variancën. Konvertimi jep
rezultate më pozitive në rastin kur ndryshorja e varur ndjek shpërndarjen Poisson. Po
ashtu, përdoret për të normalizuar ndryshoren në rastin kur shpërndarja e ndryshoreve
është e lakuar në të majtë.

Konvertimi Hiperbolik (X* = 1/X): Në qoftë se varianca është proporcionale me
fuqinë e katërt të X-it(në qoftë se ka dallime ekstreme ndërmjet njësive të para të X-it),
përdoret për të stabilizuar variancën dhe për të normalizuar shpërndarjen e ndryshores e
cila është kurtoze. Ky konvertim zvogëlon ndikimin e vlerave shumë të mëdha në
ndryshore sepse e kundërta e vlerave të mëdha do të jetë më afër zeros.

Konvertimi Katror (X* = X2): Në qoftë se varianca zvogëlohet sipas mesatares Y,
përdoret për të stabilizuar variancën, për të normalizuar ndryshoren e varur në qoftë se
vlerat e gabimit të ndryshores së varur janë lakuar në të majtë dhe për të linearizuar
lidhjen në qoftë se është një lidhje konvekse nga poshtë drejtë (Figura 10.2-a).

258
Konvertimi Arcsin (X* = Arcsin = Sin-1 ose (X* = 2Arcsin ): Në qoftë se
vlerat e ndryshoreve janë proporcionale përdoret për të stabilizuar variancën. Për
aplikimin e konvertimit, X duhet të jetë pozitiv.

Konvertimi Logit [Logit(p) = 0,5LG10( )]: Në qoftë se vlerat e ndryshoreve

tregojnë proporcione, përdoret për të normalizuar ndryshoret. P merr vlera në intervalin 0
dhe 1.

Konvertimi Fisher Z [Fisher Z = 0,5LG10( )]: Në qoftë se vlerat e ndryshoreve

janë korrelacione, përdoret prë të normalizuar ndryshoret.

10.6. RREGULLA TË PËRGJITHSHME PËR KONVERTIMIN
(TRANSFORMIMIN)
Konvertimi i ndryshoreve është një proces i gjykimit dhe bërjes gabim. Pra, pas
aplikimit të konvertimit në ndryshore duhet të kontrollohet nëse është gjetur zgjidhje.
Konvertimi i aplikuar jogjithmonë mund të jap zgjidhje, mirëpo zvogëlon shkallën e
devijimit nga supozimet. Edhe në qoftë se zvogëlohen devijimet e ndryshoreve të
konvertuara nga supozimet, rezultatet e analizës duhet të mbahen veç nga analiza, për
arsye se vështirësojnë interpretimin dhe rrisin kompleksitetin e tyre. Për këtë arsye,
përpara aplikimi të konvertimit, në qoftë se është e mundur duhet të kontrollohet nëse
është e përshtatshme që ndryshorja të konvertohet në ndonjë njësi të ndryshme matjeje
(Helberg, 2002). Çfarëdo konvertimi, në përgjithësi nuk sjell zgjidhje për problemet në
numër të madh. Për shembull, ndryshoret e lakueshme i hapin rrugës devijimeve të
normalitetit dhe kovariancës. Nga çfarëdo supozimi që të testohet devijimi, konvertimi
mund të aplikohet vetëm në ndryshoret metrike. Gjatë konvertimit, çështje të tjera të cilat
duhet të kihen parasysh janë këto (Hair dhe të tj., fq. 78):

 Për të vrojtuar një ndikim nga konvertimet që mund të shihet me sy, norma e
devijimit standart të mesatares së ndryshores duhet të jetë më e vogël se 4.
 Në qoftë se konvertimi do të aplikohet në një nga dy ndryshoret, duhet të
zgjedhet ajo ndryshore e cila ka normë më të vogël të devijimit standart të
mesatares.
 Në qoftë se nuk ka variancitet të ndryshëm, konvertohen vetëm ndryshoret e
pavarura.
 Varianciteti i ndryshëm mund të rregullohet duke e konvertuar ndryshoren e
varur. Në qoftë se marrëdhënia e variancës së ndryshme, në të njëjtën kohë nuk
është as lineare, duhet të konvertohen edhe ndryshoret e pavarura, pranë
ndryshores së varur.

259
 Konvertimi mund të ndryshoj interpretimin e ndryshoreve. Për shembull,
konvertimi logaritmik e shëndërron marrëdhënien në matje të ndryshimit vizual
(elasticiteti). Çdo herë, duhet të bëhen interpretimet e mundshme të
ndryshoreve të konvertuara.

10.7. SUPOZIMI I LIDHJES SË SHUMËFISHTË LINEARE
Lidhja ndërmjet ndryshoreve të pavarura njihet si lidhje (multikolinearitet) e
shumëfishtë lineare. Në qoftë se marrëdhënia ndërmjet dy ndryshoreve është +1, bëhet
fjale për një varësi të njëjtë, në qoftë se është −1, bëhet fjalë për një varësi të plotë me
drejtim të kundërt, në qoftë se është e barabartë me zero, bëhet fjalë për një pavarësi të
plotë. Gjendja ekstreme e realizuar në rastin e parashikimit të një ndryshore të pavarur nga
një ndryshore tjetër ose ndryshore të tjera të pavarura në rastin e lidhjes së shumëfishtë
quhet singularitet (singularity).12

Lidhja e shumëfishtë zvogëlon fuqinë e parashikimit të ndryshores së pavarur sipas
shkallës së marrëdhëniës që ka ndryshorja e pavarur me ndryshoret e tjera të pavarura. Me
rritjen e lidhjes së shumëfishtë zvogëlohet varianca specifike e shpjeguar nga ndryshorja e
pavarur, kurse përqindja e variancës së përbashkët rritet. Për arsye se varianca e
përbashkët njihet njëherë, përfshirja e ndryshoreve me lidhje të lartë të shumëfishtë në
model, zvogëlon më pak fuqinë e përgjithshme të parashikimit.

Në Figurën 10.3 janë paraqitur variancat specifike dhe të përbashkëta ndërmjet
ndryshoreve të pavarura X1 dhe X2 sipas niveleve të lidhjes së shumëfishtë lineare. Në qoftë
se korrelacioni ndërmjet ndryshoreve është zero, secila nga ndryshoret shpjegon
ndryshimet në normë 42% (0,652) dhe 25% (0,502) në ndryshoren e varur. Mirëpo, me
rritjen e lidhjes së shumëfishtë, varianca totale zvogëlohet. Ende më keq, për shkak të
zvogëlimit të variancës specifike të ndryshoreve të pavarura, është e vështirë të vlerësohet
kontributi individual i këtyre ndryshoreve (Hair dhe të tj., fq. 188-191).

12Në këtë rast, për arsye se një nga ndryshoret do të jetë e panevojshme, duhet të nxirret patjetër nga analiza
për parashikimin e parametrave të modelit.

260
Figura 10.3: Varianca Specifike dhe e Përbashkët Sipas Shkallës së Lidhjes së
Shumëfishtë Lineare (Hair dhe të tj., fq. 190-192)

10.7.1. REZULTATET E PROBLEMIT TË LIDHJES SË SHUMËFISHTË
LINEARE
Problemi i lidhjes së shumëfishtë lineare i hap rrugën problemeve të mëposhtme
(Gujarati, fq. 327-331):

 Në rastin e ekzistimit të lidhjes së shumëfishte lineare të plotë, koeficientët nuk
mund të njihen dhe gabimet standarte të këtyre koeficientëve bëhen të
pafundme. Kjo gjendje ekstreme, siç është specifikuar më parë, quhet
singularitet (singularity).
 Variancat dhe kovariancat e koeficientëve rriten.
 Si rezultat i kësaj ose për shkak të numrit të madh të ndryshoreve të pavarura,
koeficienti i korrelacionit të shumëfishtë të modelit (R2) del i lartë, mirëpo asnjë
nga ndryshoret e pavarura nuk dalin të rëndësishme, ose vetëm disa.

261
 Disa nga ndryshoret e pavarura mund të kenë shenja të papritura (të kundërt
nga teoria).

Në rastin e ekzistimit të lidhjes së shumëfishtë duhet që disa nga ndryshoret e
pavarura të mos merren në model. Mirëpo, cilat ndryshore duhet të nxirren? Hudhja gabim
e një ndryshoreje nga modeli i hap rrugën njohjes gabim (specification error) të modelit.
Njohja gabim e modelit i hap rrugën njëanshmërisë së parametrave që do të llogariten me
mospërfshirjen e ndryshoreve të rëndësishme të cilat duhet të përfshihen në model. Nuk
ekzistojnë rregulla themelore që mund të përdorim në përfshirjen apo mospërfshirjen e
ndryshoreve të pavarura në mode.

10.7.2. PËRCAKTIMI I PROBLEMIT TË LIDHJES SË SHUMËFISHTË:
VIF DHE INDEKSET KUSHTËZUESE
Ekzistojnë disa metoda që përdoren në përcaktimin e problemit të lidhjes së
shumëfishtë (Gujarati, fq. 335-339).

Metoda e parë nga këto është shqyrtimi i matricës së korrelacioneve të thjeshta. Në
qoftë se koeficienti i korrelacionit të thjeshtë ndërmjet dy ndryshoreve të pavarura është i
rëndësishëm, atëherë kjo mund t’i hap rrugën problemit të lidhjes së shumëfishtë.
Megjithatë, jo çdo herë korrelacioni i rëndësishëm i hap rrugën problemit të lidhjes së
shumëfishtë. Një situatë e këtillë sipas Lawrence Klein, mund të mos i hap rrugën problemit
të lidhjes së shumëfishtë në qoftë se koeficienti i korrelacionit të thjeshtë (r) është më i
vogël se koeficienti i korrelacionit të shumëfishtë (R).

Një qasje tjetër në përcaktimin e lidhjes së shumëfishtë është shqyrtimi i
ndryshimeve në koeficientin R2 me rastin e shtimit të ndryshoreve të pavarura në model.
Në qoftë se nuk sigurohet ndonjë zhvillim i rëndësishëm në R2, kjo gjendje mund të jetë një
shenjë e problemit të lidhjes së shumëfishtë. Në analizën diskriminuese fazore (hapash)
ose të regresionit, madhësia R2 mbetet e parëndësishme me shtimin e ndryshoreve të reja
në model.13

Një qasje tjetër e cila mund të përdoret për zbulimin e lidhjes së shumëfishtë është
shqyrtimi i koeficientëve të korrelacionit të pjesërishëm. Në qoftë se koeficientët e
korrelacionit të pjesërishëm dalin të parëndësishëm në rastin kur koeficientët e
korrelacionit të thjeshtë ndërmjet ndryshoreve janë të rëndësishëm, atëherë kjo situatë
mund të jetë një shenjë e problemit të lidhjes së shumëfishtë. Megjithatë, metoda e
korrelacionit të pjesërishëm nuk është çdo herë një qasje efektive. Me fjalë të tjera,

13Në literaturën turke, për analizat e “regresionit fazor” dhe “diskriminuese fazore” përdoren edhe konceptet
“regresioni hapash” dhe “diskriminuese hapash”.

262
problemi i lidhjes së shumëfishtë mund të ekzistoj edhe në rastin kur koeficientët e
korrelacionit të pjesërishëm janë të lartë.

Një metodë tjetër e rëndësishmë e përdorur në përcaktimin e lidhjes së shumëfishtë
është faktorët e rritjes së variancës (VIF = Variance Inflation Factors). Për të paraqitur
llogaritjen e vlerave VIF, të trajtojmë modelin e mëposhtëm i cili përfshin tri ndryshore të
pavarura:14

Y = b0 + b1X1 + b2X2 + b3X3 + e

Vlerat VIF të një modeli prej tri ndryshoresh të pavarura llogariten si më poshtë:

Në hapin e parë, ndryshorja e pavarur X1 mirret si ndryshore e varur dhe llogaritet
koeficienti i korrelacionit të shumëfishtë (R2) me ndryshoret e tjera të pavarura. Në këtë
mënyrë, faktori i rritjes së variancës për ndryshoren X1 llogaritet si VIF(X1) = 1 / (1 − 1 ).

Në hapin e dytë, ndryshorja X2 merret si ndryshore e varur dhe llogaritet R2
ndërmjet ndryshoreve të pavarura X1 dhe X3. Në këtë mënyrë, faktori i rritjes së variancës
për ndryshoren X2 llogaritet si VIF(X2) = 1 / (1 − ).

Në hapin e tretë, ndryshorja X3 merret si ndryshore e varur dhe llogaritet R2
ndërmjet X1 dhe X2. Në këtë mënyrë, faktori i rritjes së variancës për ndryshoren X3
llogaritet në formën VIF(X3) = 1 / (1 − 3 ).

Në qoftë se nuk ka marrëdhënie ndërmjet ndryshores së varur dhe ndryshoreve të
pavarura, atëherë (R2 = 0) VIF = 1. Në qoftë se ka korrelacion të plotë ndërmjet
ndryshoreve të pavarura dhe të varur, atëherë (R2 = 1) VIF = ∞. Në qoftë se R2 = 0,9, VIF = 1
/ (1 – 0,9) = 10 (Webster, fq. 683-684).

Një metodë tjetër e përdorur në përcaktimin e problemit të lidhjes së shumëfishtë
është llogaritja e tolerimeve të ndryshoreve. Vlerat e tolerimeve llogariten në formën T = 1
− . Kështu, tolerime më të vogla nënkupton VIF më të madhe (Gujarati, fq. 338-339).

Një qasje tjetër e përdorur në përcaktimin e problemit të lidhjes së shumëfishtë
është llogaritja e vlerave F duke përdorur barazimet e regresionit ndihmës. Për shembull,
të trajtojmë modelin e tri ndryshoreve të pavarura të mësipërm:

Ndërmjet ndryshores së pranuar të varur dhe ndryshoreve të tjera të pavarura
llogariten koeficientët e korrelacionit të shumëfishtë R1. 23, R2. 13 dhe R3. 12. Më vonë, duke
përdorur koeficientët e korrelacionit të shumëfishtë llogaritet vlera F për secilën ndryshore

14Për faktorët e rritjes së variancën përdoret shkurtesa VIF (Variance Inflation Factors) dhe për indekset
kushtëzuese (Conditional Indexes) përdoret shkurtesa CI.

263
të pavarur. Për shembull, për ndryshoren e pavarur X1, vlera F llogaritet si më poshtë
(Gujarati, fq. 335-336):

R / (k −1)
F1. 23 = (1 - 1.R 3
1. 3 )/ ( –

Në formulë, n paraqet numrin total të njësive të mostrës, kurse k numrin e
parametrave (ose ndryshoren e varur dhe të pavarur në model) që do të parashikohen,
përfshirë termin konstant (k=3). Vlera e llogaritur F krahasohet me një nivel të caktuar alfa
të rëndësisë dhe vlerën kritike F të shkallës së lirisë df1 = k – 2 dhe df2 = n – k + 1. Në qoftë
se vlera e llogaritur F (F1.23) është më e madhe se vlera kritike F, atëherë jepet vendim se
marrëdhënia ndërmjet ndryshores X1 me ndryshoret e tjera të pavarura X2 dhe X3 është e
rëndësishme.

Një metodë tjetër e përdorur në përcaktimin e problemit të lidhjes së shumëfishtë
është llogaritja e numrave të indeksit të kushtëzuar (CI = Condition Index). Numrat e
indeksit të kushtëzuar (CI) llogariten si më poshtë:

CI = /

Në formulë, Vmax paraqet variancën maksimale të shpjeguar (vlerat maksimale
ajgen), kurse paraqet variancën totale të shpjeguar nga ndryshorja i (vlerat ajgen të
ndryshores xi). Varianca totale e shpjeguar nga secila ndryshore dhe numrat e indeksit të
kushtëzuar (CI) mund të përfitohen me shumë programe statistikore. Në qoftë se CI gjendet
ndërmjet 10-30, ekziston problem i lidhjes së shumëfishtë në nivel mesatar, në qoftë se e
kalon 30-shin, ekziston lidhje e fortë e shumëfishtë.

10.7.3. ZGJIDHJA E PROBLEMIT TË LIDHJES SË SHUMËFISHTË
LINEARE
Më poshtë janë dhënë disa nga mënyrat e zgjidhjes së problemit të lidhjes së
shumëfishtë (Gujarati, fq. 339-344).

Një ose më shumë ndryshore të pavarura mund të nxirren nga modeli. Mirëpo, cilat
ndryshore do të nxirren? Një qasje e këtillë mund të dërgojë një njohjen gabim të modelit.15

Ndonjëherë problemi i lidhjes së shumëfishtë mund të zgjidhet duke e rritur
mostrën. Mirëpo, jo çdo herë është e mundur shtimi i njësive në mostër.

Ndryshoret të cilat janë në marrëdhënie me njëra-tjetrën mund të përfshihen në
model si një ndryshore e vetme e cila shpreh totalin e këtyre dy ndryshoreve.

15 Në këtë kontekst, mund të përdoren Analiza e Regresionit Fazor. Mirëpo, kjo metodë mund të jap rezultate
të besueshme në qoftë se lidhja e shumëfishtë buron nga popullsia.

264
Ndryshoret mund të konvertohen duke marrë dallimet e tyre. Mirëpo, një konvertim
i këtillë mund t’i hap rrugë problemit të autokorrelacioneve ndërmjet gabimeve.

Në analizën e regresionit polinom, problemi i lidhjes së shumëfishtë ndeshet më
shpesh. Në funskionet polinome, ndryshoret mund të konvertohen duke marrë dallimet
nga mesataret. Në qoftë se vazhdon problemi i lidhjes së shumëfishtë, ndryshoret e varura
konvertohen në atë mënyrë të pavarur nga njëra-tjetra duke përdorur polinomet
ortogonale. Në polinomet ortogonale, në vend të të dhënave origjinale të ndryshoreve,
vektori i koeficientëve të koduar që pasqyron polinomet me shkallë të ndryshme ndërmjet
ndryshoreve përdoret si ndryshore e pavarur. Korrelacioni ndërmjet ndryshoreve
ortogonale është zero. Derivimi i ndryshoreve ortogonale është shpjeguar nga Kleimbaum-
Kupper-Muller dhe Draper-Smith (Kleinbaum dhe të tj., fq. 228-249).

Në analizën e regresionit përdoret metoda e regresionit ridge e cila është formë e
rregulluar e metodës së katrorëve më të vegjël dhe që mund të parashikoj koeficientët e
regresionit të standartizuar një-anësor.

Mund të përdoret metoda e regresionit të komponentëve themelorë e cila prodhon
komponentë të pavarur nga njëri-tjetri.

10.8. PAVARËSIA E GABIMEVE DHE AUTOKORRELACIONI
Pavarësia e gabimeve (autokorrelacioni) paraqet korrelacionin ndërmjet vlerave të
çfarëdo serie kohe apo serive të bashkuara të kohës.16 Korrelacioni i kryqëzuar (cross
correlation) është marrëdhënia ndërmjet dy serive të ndryshme të kohës. Kurse
korrelacioni rendor (serial correlation) mund të bart kuptimin edhe të autokorrelacionit
edhe të korrelacionit të kryqëzuar. Në praktikë, korrelacioni rendor dhe autokorrelacioni
përdoren në të njëjtin kuptim (Gujarati, fq. 401). Autokorrelacionet e rëndësishme mund të
tregojnë njohjen gabim të modelit. Pra, mund të jetë harruar ndonjë ndryshore e
rëndësishme e modelit ose mund të jetë njohur gabim marrëdhënia funksionale. Në këtë
rast, në qoftë se përdoret metoda e katrorëve më të vegjël, gabimet standarte të
parashikuara në analizën e regresionit do të vlerësohen si të ulët ose mund të arrihen
rezultate të gabueshme në lidhje me rëndësitë e ndryshoreve (Orhunbilge, 1996, fq. 176).

16Për shembull, në analizën e regresionit bëhet fjalë për një autokorrelacion i cili supozon se nuk ka
korrelacion ndërmjet gabimeve. Me simbole shprehet në formën E (eiej) = 0 dhe i ≠ j.

265
10.8.1. PËRCAKTIMI I AUTOKORRELACIONIT: PËRDORIMI I
STATISTIKËS DURBIN WATSON
Statistika Durbin Watson (DW) përdoret për të përcaktuar autokorrelacionin. Lloji i
parë i autokorrelacionit (first order autocorrelation – serial correlation) është i barabartë
me koeficientin e regresionit (autokorrelacionit) ( ) të fuksionit të gabimeve të
njëpasnjëshme.

= -1
et = et−1 + vt dhe këtu =
= -1

Statistika DW llogaritet me formulën e mëposhtme:

= - -1 )
DW = = 2 (1 – )
=1( )

Marrëdhënia ndërmjet autokorrelacionit dhe statistikës DW mund të paraqitet si më
poshtë:

DW = ( - -1 ) / =( −2 -1 + -
)/

Për shkak që termi =1 ësht i afërt me termin = -
,

( −1 ) -1
DW = (1 − )= 2(1 – )

-1
Në barazim, = . Në këtë mënyrë,

në qoftë se = +1, DW 0

në qoftë se = 0, DW 2

në qoftë se = −1, DW 4

266
Tabela 10.5: Kriteret e Vendimit Për Statistikën DW17

Autokorrelacioni Autokorrelacion Autokorrelacion Autokorrelacion Autokorrelacion
i Rëndësishëm i Paspecifikuar Jo i i Paspecifikuar i Rëndësishëm
Pozitiv Pozitiv Rëndësishëm Negativ Negativ
0 dL dU 2 4-dU 4-dL 4
Në qoftë se, 0<DW<dL, ekziston Autokorrelacion i Rëndësishëm Pozitiv
Në qoftë se, dL<DW<dU, ekziston Autokorrelacion i Paspecifikuar Pozitiv
Në qoftë se, dU<DW<2, ekziston Autokorrelacion Jo i Rëndësishëm Pozitiv
Në qoftë se, 2<DW<(4-dU), ekziston Autokorrelacion i Rëndësishëm Negativ
Në qoftë se, (4-dU)<DW<(4-dL), ekziston Autokorrelacion i Paspecifikuar Negativ
Në qoftë se, (4-dL)<DW<4, ekziston Auokorrelacion i Rëndësishëm Negativ

10.8.2 TESTET E HIPOTEZAVE DW (Orhunbilge, 1996, fq. 177)
H0: = 0; H1: > 0: Në qoftë se d<dU, H0 refuzohet në nivelin e rëndësisë së dhënë
(α). Pra, thuhet se ekziston autokorrelacion i rëndësishëm pozitiv.

H0: = 0; H1: < 0: Në qoftë se (4-d)<dU, H0 refuzohet në nivelin e rëndësisë së
dhënë (α). Pra, thuhet se ekziston autokorrelacion i rëndësishëm negativ.

H0: = 0; H1: ≠ 0: Në qoftë se d<dU ose (4-d)<dU, H0 refuzohet në nivelin e
rëndësisë së dhënë ( α). Pra, thuhet se ekziston autokorrelacion i rëndësishëm negativ ose
pozitiv.

Simbolet dL dhe dU të përdorura në tabelë, janë limitet e poshtme (dL) dhe të
sipërme (dU) të rëndësishme të vlerave kritike të tabelës së statistikës DW. Vlerat e limit të
poshtëm dhe të sipërm të statistikës DW ndryshojnë sipas numrit të njësisë së ndryshoreve
(n) dhe numrit të ndryshoreve të pavarura. Për shembull, në qoftë se numri i njësisë së
motrave është 15 dhe numri i ndryshoreve të pavarura 2, në nivelin e rëndësisë 5%, limitet
do të jenë dL = 0,95 dhe dU = 1,54.

10.8.3. STATISTIKA DURBIN H
Autokorrelacioni i modeleve autoregresive nuk duhet të testohet me statistikën DW
sepse në këtë rast statistika DW merr një vlerë afër 2-shit e cila tregon që në përgjithësi
nuk ka autokorrelacion. Me fjalë të tjera, në qoftë se një nga ndryshoret e pavarura është
formë e izoluar (lagged) e ndryshores së varur, atëherë për të testuar autokorrelacionin

17dL dhe dU me radhë, janë vlerat kritike të poshtë dhe të sipërme të tabelës së statistikës DW. Limitet e
poshtme dhe të larta të statistikës DW ndryshores sipas ndryshores (p) dhe njësisë (n). Në shumicën e
burimeve statistikore, statistikat DW mund të përfitohen për nivelet e rëndësisë 1% dhe 5%.

267
përdoret statistika Durbin H në vend të statistikës DW. Testi shpjegohet shkurtimisht më
poshtë:

h= x , h = (1 − )
(1 – ) (1 - )

këtu, DW 2(1 – ) ↔ 1− .

Nga barzimi, paraqet koeficientin e autokorrelacionit, variancën e koeficientit
të ndryshores së varur të izoluar, n madhësinë e mostrës dhe h statistikën Durbin e cila
teston hipotezën zero të testuar me vlerën z në qoftë se mostra është e madhe. Në rastin
kur numri i njësive të vrojtuar është më i madh se 15, statistika DW nuk përdoret. Në këtë
rast, në vend të statistikës DW përdoret norma Von Neumann e zhvilluar për analizën e
regresionit (Orhunbilge, fq. 178-179).

10.8.4. METODA E AUTOREGRESIONIT – METODA E
PËRGJITHËSUAR E KATRORËVE MË TË VEGJËL
Metoda e katrorëve më të vegjël (KMTV) jep rezultate të pavlefshme në rastin e
ekzistimit të autokorrelacionit të rëndësishëm. Në këtë situatë, përdoret metoda e
përgjithësuar e katrorëve më të vegjël. Me këtë metodë, aplikohet metoda e katrorëve më
të vegjël mbi ndryshoret e konvertuara dhe në këtë mënyrë përfitohen gabime standarte
më efektive dhe të vlefshme, intervale të parashikimit dhe teste të hipotezave. Në rastin e
ekzistimit të autokorrelacionit, metoda më e përdorura dhe e përgjithësuar më e thjeshtë e
katorëve më të vegjël është procedura dy-fazash e Cochrane-Orcutt (CO2). Këtu shpjegohet
vetëm metoda Cochrane-Orcutt dy-fazash. Të trajtojmë ekuacionin e regresionit të thjeshtë
si më poshtë, për të shpjeguar procedurën e kësaj metode:

(1) Yt = b0 + b1X1 + et

(2) Yt−1 = b0 + b1Xt−1 + et−1 [për periudhën t−1]

(3) Yt−1 = b0 + b1Xt−1 + et−1 [ekuacioni 2 shumëzohet me vlerën absolute]

(4) Yt − Yt−1 = (b0 − b0) + b1 (Xt − Xt−1) + (et − et−1) = (1 – b)b0 + b1 (Xt − Xt−1) +
(et − et−1) [ekuacioni (1) – ekuacioni (3)]

(5) = + + [rishkruarja e ekuacionit (4)]

Këtu, = Yt − Yt−1, = (1 – )b0, = (Xt Xt−1), = (et − et−1) dhe E( ) = 0.

Siç mund të shihet si më sipër, procedura CO2 plotësohet me pesë faza. Në fazën e
parë, shkruhet modeli i regresionit. Më vonë (faza e dytë), i njëjti model shkruhet përsëri
duke e larguar një periudhë prapa. Në fazën e tretë, vija e regresionit e shkruar në fazën e

268
dytë shumëzohet me vlerën absolute të autokorrelacionit. Në fazën e katërt, nxirret vija e
regresionit e përfituar në fazën e tretë nga vija e regresionit origjinal të shkruar në fazën e
parë. Kurse në fazën e fundit, vija e regresionit e cila nuk përfshin autokorrelacion dhe që
përfitohet në fazën e katërt, rishkruhet përsëri dhe zgjidhet me metodën KMTV.

Vlera e pritur e gabimeve për metodën e katrorëve më të vegjël është zero [E (e) =
0], gabimet e dhëna në ekuacionin me numër 4 tanimë janë të pavarur nga njëra-tjetra dhe
në këtë ekuacion aplikohet metoda e katrorëve më të vegjël.18 Metodat e tjera të përdorura
për zgjidhjen e autokorrelacionit janë këto:19

1. Procedura Cochrane-Orcutt Dy-Fazash (CO2)

2. Procedura Iterative Cochrane-Orcutt (COi) (Cochrane, 1949)

3. Procedura Durbin Dy-Fazash (Durbin, 1960)

4. Procedura Hildreth-Lu (HL)

5. Metoda Prais-Winsten (PW) (Johnson dhe të tj., fq. 321-323)

6. Metoda Theil-Negar (TN)

7. Metoda Bayes

8. Procedura e Probabilitetit Maksimal (ML) (Johnson, fq. 325-326)

9. Metoda e Katrorëve më të Vegjël Jolinear (NLS)

10. Metoda Yule-Walker (YW, metoda dy-fazash e konvertimit të plotë)

11. Metoda Iterative Yule-Walker (WYi)

10.9. PËRCAKTIMI I LIDHJES SË SHUMËFISHTË DHE
AUTOKORRELACIONIT NË SPSS
Në përcaktimin e lidhjes së shumëfishtë lineare në SPSS, përdoret procedura e
analizës së regresionit. Nga menyja zgjedhet Analyze  Regression  Linear
Regression. Nga dritarja e hapur, klikohet përzgjedhja Statistics dhe hapet dialogu i dhënë
në Hapin 5. Këtu, zgjedhet Collinearity Diagnostics për të përfituar statistikat në lidhje me

18 Ekuacioni numër (4) quhet Ekuacioni i Dallimit të Përgjithësuar ose shkurtimisht Metoda e
Autokorrelacionit.
19
Në SPSS, nga Statistics  Time Series  Autoregression mund të përfitohen metoda COi, ML dhe PW.
Procedura Cochrane-Orcutt dy-fazëshe (CO2) është shpjeguar këtu për shkak që është lehtë e kuptueshme.

269
metodat e përdorura gjerësisht për përcaktimin e lidhjes së shumëfishtë lineare, kurse për
përfitimin e statistikës DW (d) të përdorur në përcaktimin e autokorrelacionit zgjedhet
alternativa Durbin Watson (Shiko: Hapi 5).

Hapi 5: Dritarja e Statistikave

270
Shtojca 10.1: Koeficientët e Korrelacionit Kritik për Grafikun e Probabilitetit Normal
Niveli i Rëndësisë
p ,000 ,005 ,010 ,025 ,050 ,100 ,250 ,500 ,750 ,900 ,950 ,975 ,990 ,995
3 ,866 ,867 ,869 ,872 ,879 ,891 ,924 ,966 ,991 ,999 1,000 1,000 1,000 1,000
4 ,784 ,813 ,822 ,845 ,868 ,894 ,931 ,958 ,979 ,992 ,996 ,998 ,999 1,000
5 ,726 ,803 ,822 ,855 ,879 ,902 ,935 ,960 ,977 ,988 ,992 ,995 ,997 ,998
6 ,683 ,818 ,835 ,868 ,890 ,911 ,940 ,962 ,977 ,986 ,990 ,993 ,996 ,997
7 ,648 ,828 ,847 ,876 ,899 ,916 ,944 ,965 ,978 ,986 ,990 ,992 ,995 ,996
8 ,619 ,841 ,859 ,886 ,905 ,924 ,948 ,967 ,979 ,986 ,990 ,992 ,995 ,996
9 ,595 ,851 ,868 ,893 ,912 ,929 ,951 ,968 ,980 ,987 ,990 ,992 ,994 ,995
10 ,574 ,860 ,876 ,900 ,917 ,934 ,954 ,970 ,981 ,987 ,990 ,992 ,994 ,995
11 ,556 ,868 ,883 ,906 ,922 ,938 ,957 ,972 ,982 ,988 ,990 ,992 ,994 ,995
12 ,539 ,875 ,889 ,912 ,926 ,941 ,959 ,973 ,982 ,988 ,990 ,992 ,994 ,995
13 ,525 ,882 ,895 ,917 ,931 ,944 ,962 ,975 ,983 ,988 ,991 ,993 ,994 ,995
14 ,512 ,888 ,901 ,921 ,934 ,947 ,964 ,976 ,984 ,989 ,991 ,993 ,994 ,995
15 ,500 ,894 ,907 ,925 ,937 ,950 ,965 ,977 ,984 ,989 ,991 ,993 ,994 ,995
16 ,489 ,899 ,912 ,928 ,940 ,952 ,967 ,978 ,985 ,989 ,991 ,993 ,994 ,995
17 ,478 ,903 ,916 ,931 ,942 ,954 ,968 ,979 ,986 ,990 ,992 ,993 ,994 ,995
18 ,469 ,907 ,919 ,934 ,945 ,956 ,969 ,979 ,986 ,990 ,992 ,993 ,994 ,995
19 ,460 ,909 ,923 ,937 ,947 ,958 ,971 ,980 ,987 ,990 ,992 ,993 ,995 ,995
20 ,452 ,912 ,925 ,939 ,950 ,960 ,972 ,981 ,987 ,991 ,992 ,994 ,995 ,995
21 ,445 ,914 ,928 ,942 ,952 ,961 ,973 ,981 ,987 ,991 ,993 ,994 ,995 ,996
22 ,437 ,918 ,930 ,944 ,954 ,962 ,974 ,982 ,988 ,991 ,993 ,994 ,995 ,996
23 ,431 ,922 ,933 ,947 ,955 ,964 ,975 ,983 ,988 ,991 ,993 ,994 ,995 ,996
24 ,424 ,926 ,936 ,949 ,957 ,965 ,975 ,983 ,988 ,992 ,993 ,994 ,995 ,996
25 ,418 ,928 ,937 ,950 ,958 ,966 ,976 ,984 ,989 ,992 ,993 ,994 ,995 ,996
26 ,412 ,930 ,939 ,952 ,959 ,967 ,977 ,984 ,989 ,992 ,993 ,994 ,995 ,996
27 ,407 ,932 ,941 ,953 ,960 ,968 ,977 ,984 ,989 ,992 ,994 ,995 ,995 ,996
28 ,402 ,934 ,943 ,955 ,962 ,969 ,978 ,985 ,990 ,992 ,994 ,995 ,995 ,996
29 ,397 ,937 ,945 ,956 ,962 ,969 ,979 ,985 ,990 ,992 ,994 ,995 ,995 ,996
30 ,392 ,938 ,947 ,957 ,964 ,970 ,979 ,986 ,990 ,993 ,994 ,995 ,996 ,996
31 ,388 ,939 ,948 ,958 ,965 ,971 ,980 ,986 ,990 ,993 ,994 ,994 ,996 ,996
32 ,383 ,939 ,949 ,959 ,966 ,972 ,980 ,986 ,990 ,993 ,994 ,995 ,996 ,996
33 ,379 ,940 ,950 ,960 ,967 ,973 ,981 ,987 ,991 ,993 ,994 ,995 ,996 ,996
34 ,375 ,941 ,951 ,960 ,967 ,973 ,981 ,987 ,991 ,993 ,994 ,995 ,996 ,996
35 ,371 ,943 ,952 ,961 ,968 ,974 ,982 ,987 ,991 ,993 ,995 ,995 ,996 ,997
36 ,367 ,945 ,955 ,962 ,969 ,975 ,982 ,988 ,991 ,994 ,995 ,996 ,996 ,997
37 ,364 ,947 ,955 ,962 ,969 ,975 ,982 ,988 ,991 ,994 ,995 ,9966 ,996 ,997
38 ,360 ,948 ,956 ,964 ,970 ,975 ,983 ,988 ,992 ,994 ,995 ,996 ,996 ,997
39 ,357 ,949 ,957 ,965 ,971 ,976 ,983 ,988 ,992 ,994 ,995 ,996 ,996 ,997
40 ,354 ,949 ,958 ,966 ,972 ,977 ,983 ,988 ,992 ,994 ,995 ,996 ,996 ,997
41 ,351 ,950 ,958 ,967 ,972 ,977 ,984 ,989 ,992 ,994 ,995 ,996 ,997 ,997
42 ,348 ,951 ,959 ,967 ,973 ,978 ,984 ,989 ,992 ,994 ,995 ,996 ,997 ,997
43 ,345 ,953 ,959 ,967 ,973 ,978 ,984 ,989 ,992 ,994 ,995 ,996 ,997 ,997
44 ,342 ,954 ,960 ,968 ,973 ,978 ,984 ,989 ,992 ,994 ,995 ,996 ,997 ,997
45 ,339 ,955 ,961 ,969 ,974 ,978 ,985 ,989 ,993 ,994 ,995 ,996 ,997 ,997
46 ,336 ,956 ,962 ,969 ,974 ,979 ,9885 ,990 ,993 ,995 ,995 ,996 ,997 ,997
47 ,334 ,956 ,963 ,970 ,974 ,979 ,985 ,990 ,993 ,995 ,995 ,996 ,997 ,997
48 ,331 ,957 ,963 ,970 ,975 ,980 ,985 ,990 ,993 ,995 ,996 ,996 ,997 ,997
49 ,329 ,957 ,964 3971 ,975 ,980 ,9886 ,990 ,993 ,995 ,996 ,996 ,997 ,997
50 ,326 ,959 ,965 ,972 ,977 ,981 ,986 ,990 ,993 ,995 ,996 ,996 ,997 ,997
55 ,315 ,962 ,967 ,974 ,978 ,982 ,987 ,991 ,994 ,995 ,996 ,997 ,997 ,997
60 ,305 ,965 ,970 ,976 ,980 ,983 ,988 ,991 ,994 ,995 ,996 ,997 ,997 ,998
65 ,296 ,967 ,972 ,977 ,981 ,984 ,989 ,992 ,994 ,996 ,996 ,997 ,997 ,998
70 ,288 ,969 ,974 ,978 ,982 ,985 ,989 ,993 ,995 ,996 ,997 ,997 ,998 ,998
75 ,281 ,971 ,975 ,979 ,983 ,986 ,990 ,993 ,995 ,996 ,997 ,997 ,998 ,998
80 ,274 ,973 ,976 ,980 ,984 ,987 ,991 ,994 ,995 ,997 ,997 ,997 ,998 ,998
85 ,268 ,974 ,977 ,981 ,985 ,987 ,991 ,994 ,995 ,997 ,997 ,997 ,998 ,998
90 ,263 ,976 ,978 ,982 ,985 ,988 ,991 ,994 ,996 ,997 ,997 ,998 ,998 ,998
95 ,257 ,977 ,979 ,986 ,986 ,989 ,992 ,994 ,996 ,997 ,997 ,998 ,998 ,998
100 ,252 ,979 ,981 ,984 ,987 ,989 ,992 ,994 ,996 ,997 ,998 ,998 ,998 ,998

Burimi: Subhash Sharma (1996), Applied Multivariate Techniques, John Wiley, NY, fq. 466

271
Shtojca 10.2: Testi i Shpërndarjes Normale të Matricës me Madhësi 55 x 73 (p=55
dhe n=73)

n X1 X2 X3 X4
1 42,370 0,007 0,993 32,541
2 43,177 0,021 0,979 35,747
3 44,014 0,034 0,966 37,506
4 44,340 0,048 0,952 38,790
5 44,581 0,062 0,938 39,827
6 45,063 0,075 0,925 40,712
7 45,340 0,089 0,911 41,492
8 45,349 0,103 0,897 42,195
9 46,374 0,116 0,884 42,841
10 46,444 0,130 0,870 43,440
11 46,615 0,144 0,856 44,002
12 47,821 0,158 0,842 44,534
13 47,857 0,171 0,829 45,040
14 48,226 0,185 0,815 45,524
15 48,348 0,199 0,801 45,990
16 49,527 0,212 0,788 46,440
17 49,654 0,226 0,774 46,876
18 50,472 0,240 0,760 47,300
19 50,620 0,253 0,747 47,713
20 51,429 0,267 0,733 48,117
21 51,456 0,281 0,719 48,513
22 51,793 0,295 0,705 48,902
23 51,863 0,308 0,692 49,284
24 51,953 0,322 0,678 49,661
25 52,029 0,336 0,664 50,034
26 52,387 0,349 0,651 50,402
27 52,520 0,363 0,637 50,767
28 52,744 0,377 0,623 51,129
29 52,765 0,390 0,610 51,489
30 53,141 0,404 0,596 51,846
31 53,687 0,418 0,582 52,202
32 53,838 0,432 0,568 52,558
33 54,272 0,445 0,555 52,913
34 54,698 0,459 0,541 53,267
35 55,224 0,473 0,527 53,622
36 55,411 0,486 0,514 53,978
37 55,431 0,500 0,500 54,335
38 55,686 0,514 0,486 54,693
39 55,767 0,527 0,473 55,054 Shkalla e Lirisë Vlerat e Korrelacionit Kritik
40 56,092 0,541 0,459 55,417 (df=p) në Nivelin e Rëndësisë 1%
41 56,268 0,555 0,445 55,782 50 0,967
42 56,774 0,568 0,432 56,151 55 0,970
43 57,239 0,582 0,418 56,524 60 0,972
44 57,390 0,596 0,404 56,902 65 0,974
45 28,390 0,610 0,390 57,284 70 0,975
46 58,430 0,623 0,377 57,672 75 0,976
47 58,614 0,637 0,363 58,066 80 0,977
48 58,982 0,651 0,349 58,467 85 0,965

272
49 59,097 0,664 0,336 58,876
50 59,144 0,678 0,322 59,293
51 59,405 0,692 0,308 59,720 Shënim: Në tabelë,
52 59,417 0,705 0,295 60,157 X1 paraqet numrin rendor te njësive
53 59,735 0,719 0,281 60,605 X2, distanat Mahalanobis të renditura nga më e vogla te më e
54 60,009 0,733 0,267 61,067 madhja,
55 60,180 0,747 0,253 61,543 X3, vlerat e përqindjes kumulative të kundërt,
56 60,454 0,760 0,240 62,036 X4, vlerat e Katrorit-Ki.
57 60,752 0,774 0,226 62,547
58 61,317 0,788 0,212 63,079
59 61,807 0,801 0,199 63,634
60 62,197 0,815 0,185 64,216
61 62,353 0,829 0,171 64,830
62 62,774 0,842 0,158 65,480
63 63,206 0,856 0,144 66,173
64 63,225 0,870 0,130 66,917
65 63,668 0,884 0,116 67,724
66 63,693 0,897 0,103 68,608
67 63,755 0,911 0,089 69,592
68 63,997 0,925 0,075 70,707
69 64,656 0,938 0,062 72,003
70 65,185 0,952 0,048 73,569
71 65,420 0,966 0,034 75,578
72 65,499 0,979 0,021 78,471
73 68,587 0,993 0,007 84,203

273
274
11. ANALIZA E KORRELACIONIT KANONIK

Lidhja (korrelacioni) më e njohur në statistikë është lidhja ndërmjet dy ndryshoreve
të rastësishme e shprehur me X dhe Y. Ky koncept i quajtur korrelacioni themelor, merr një
vlerë në intervalin 1. Me fjalë të tjera, në rastin kur dy ndryshore shfaqin shpërndarje
normale, marrëdhënia ndërmjet këtyre ndryshoreve matet me koeficientin e korrelacionit
të momentit multiplikativ të propozuar nga Pearsoni. Nëse ndryshoret nuk janë me matje
metrike ose nuk ndjekin shpërndarjen normale, përdoren Spearman dhe Kendall, si matje
të marrëdhënies joparametrike dhe si alternativë e koeficientit të korrelacionit të
Pearsonit. Në rastet kur numri i ndryshoreve është më shumë se dy, koeficientët e
korrelacionit të pjesërishëm llogariten duke përdorur koeficientët e korrelacionit themelor.
Në rastin kur numri i ndryshoreve është në numër p dhe kërkohet korrelacioni ndërmjet
një nga ndryshoret dhe ndryshores së mbetur p-1, atëherë korrelacioni që do të llogaritet
quhet koeficient i korrelacionit të shumëfishtë. Kurse në analizën e korrelacionit kanonik e
cila është analiza e marrëdhënies më të përgjithshme dhe më të komplikuar, hulumtohen
marrëdhëniet ndërmjet setit të ndryshoreve të marra nga një popullsi (Tatlıdil, fq. 216).
Kështu, analiza e korrelacionit kanonik, në përgjithësi, mund të shprehet si më poshtë:

Y1 + Y2 + Y3 + Y4 + Y5 + ... + Yp = X1 + X2 + X3 + X4 + ... + Xk

(metrike ose jometrike) ↔ (metrike ose jometrike)

Duke u nisur nga këto shpjegime, analiza e korrelacionit kanonik njihet si një
metodë e ndryshoreve të shumta e cila shqyrton marrëdhëniet ndërmjet dy seteve të
ndryshoreve që përbëhen nga shumë ndryshore.

Shumica e metodave të varura janë një formë e veçantë e analizës së korrelacionit
kanonik, si një metodë e përgjithshme. Në qoftë se në analizën e korrelacionit kanonik
ekziston vetëm një ndryshore e vetme e varur, atëherë analiza e korrelacionit kanonik
konvertohet në analizë të regresionit të shumëfishtë. Për arsye se analiza ANOVA dhe
analiza diskriminuese dy-grupshe janë një formë e veçantë e analizës së regresionit të
shumëfishtë, këto dy metoda në të njëjtën kohë janë një formë e veçantë e analizës së
korrelacionit kanonik. Në qoftë se në analizë ekziston vetëm një ndryshore e varur dhe një
e pavarur, atëherë analiza e korrelacionit kanonik shëndërrohet në analizën e korrelacionit
themelor. MANOVA dhe analiza diskriminuese e shumëfishtë janë një formë e veçantë e
analizës së korrelacionit kanonik. Në qoftë se ndryshorja e varur është një ndryshore
nominale me shumë grupe, analiza e korrelacionit kanonik reduktohet në analizën
diskriminuese të shumëfishtë. Së fundmi, në qoftë se ndryshoret shpjeguese tregojnë
grupet e formuara nga faktorët, analiza e korrelacionit kanonik reduktohet në analizën
MANOVA (Sharma, fq. 409). Për analizën e korrelacionit kanonik në programin e SPSS-it,
nuk gjendet ndonjë procedurë, mirëpo mund të përdoret procedura e MANOVA-së për

275
analizën e korrelacionit kanonik (Tabachnick, fq. 222). Për analizën e korrelacionit kanonik
në SPSS, merr pjesë një dosje makro poashtu.

Në anën tjetër, analiza e korrelacionit kanonik i ngjan analizës faktoriale me
ndryshoret kanonike të prodhuara si një funksion linear i ndryshoreve të varura dhe të
pavarura dhe analizës diskriminuese (si funksionet e diskriminimit) me prodhimin e
madhësive të pavarura me qëllim të sigurimit të korrelacioneve maksimale ndërmjet
seteve të ndryshoreve. Me pak fjalë, analiza e korrelacionit kanonik ndihmon në
përcaktimin e madhësisë ose strukturës më të përshtatshme (optimale) e cila do të
maksimizojë marrëdhënien ndërmjet seteve të ndryshores së varur dhe të pavarur.

Analiza e korrelacionit kanonik është një teknikë e cila përdoret në përcaktimin e
marrëdhënieve ndërmjet setit të dy ndryshoreve. Në qoftë se në mënyrë teorike mund të
bëhet ndarja e setit të ndryshores së varur dhe të pavarur ndërmjet dy seteve të
ndryshoreve, qëllimi i analizës së korrelacionit kanonik në këtë rast është të përcaktojë
nëse seti i ndryshores së pavarur ndikon në setin e ndryshores së varur. Mirëpo, në
analizën e korrelacionit kanonik nuk është e domosdoshme ndarja e setit të ndryshoreve
në setin e ndryshores së varur dhe të pavarur (Hair dhe të tj., fq. 444-445; Sharma, 391;
Dillon dhe të tj., fq. 338). Qëllimi i analizës së korrelacionit në këtë rast është përcaktimi i
marrëdhënieve ndërmjet dy seteve të ndryshoreve. Më poshtë është shpjeguar analiza e
korrelacionit kanonik, fillimisht me një qasje gjeometrike, më vonë me një qasje analitike
dhe në fund është bërë interpretimi i rezultateve të fituara me SPSS 11.5

11.1. QASJE GJEOMETRIKE NDAJ ANALIZËS SË KORRELACIONIT
KANONIK
Të dhënat e përdorura në shpjegime janë përfituar në mënyrë të rastësishme nga të
sëmurët që kanë aplikuar me shqetësimin e obezitetit në Spitalin e Fakultetit të Mjekësisë
së Universitetit të Stambollit. Me fjalë të tjera, popullsia e të dhënave janë të sëmurët të
cilët kanë aplikuar me ankesën e obezitetit në Fakultetin e Mjekësisë së Stambollit dhe
teknika e përdorur e mostrimit është mostrimi i thjeshtë i rastësishëm.

Gjenden katër faktorë të mbi të sëmurët: madhësia (cm, X1), pesha trupore (kg, X2),
gjatësia e perimetrit të kockave të kofshës (cm, Y1) dhe gjatësia e perimetrit të muskujve të
matur nga beli e sipër (cm, Y2). Rezultatet e matjes së përfituar nga 20 vetë në hulumtim,
janë dhënë në Tabelën 11.1.20 Të dhënat në Tabelën 11.1 tregojnë hapësirën e një
ndryshoreje katër-madhësish. Për arsye se hapësira e ndryshores katërmadhësish nuk

20
Vlerat e matjes të ndryshores X3 dhe X4 janë dhënë në Tabelën 11.4.

276
mund të tregohet në letër, paraqitja gjeometrike e të dhënave për ndryshoret X dhe Y është
bërë veç e veç.

Tabela 11.1: Tabela e Ndryshoreve të Varura, Pavarura dhe Kanonike

Njësia X1 X2 Y1 Y2 V1 W1 V2 W2
( 1=72,9°) ( 2=5,4°) ( 3=162,9°) ( 4=95,4°)
1 175,25 75,57 109,47 73,91 185,71 128,15 63,32 -145,32
2 180,45 144,78 126,49 71,63 202,85 143,36 59,45 -128,94
3 176,60 118,74 131,83 93,98 194,54 156,02 81,21 -133,92
4 178,50 127,64 137,92 78,99 197,95 156,62 65,71 -133,12
5 165,75 81,91 107,19 78,49 177,46 127,57 68,10 -134,38
6 190,50 137,79 136,91 60,20 211,53 149,24 47,09 -141,61
7 185,25 172,09 148,59 70,10 212,32 163,60 55,85 -126,50
8 183,30 161,29 132,33 77,72 208,52 150,93 64,97 -127,82
9 193,50 135,26 126,75 58,93 214,05 139,26 46,78 -145,22
10 152,56 122,56 135,89 62,99 201,07 149,24 49,96 -138,49
11 174,55 161,29 143,76 76,20 199,91 161,15 62,38 -119,45
12 163,60 172,72 144,02 71,88 210,80 159,92 58,05 -124,74
13 164,90 74,29 118,11 58,42 175,60 130,97 47,08 -135,80
14 162,35 113,03 112,27 72,64 179,51 130,34 61,80 -121,98
15 159,51 81,28 108,46 54,10 171,20 120,42 43,69 -128,60
16 195,56 151,76 138,18 76,45 218,94 155,99 63,16 -142,34
17 165,35 143,51 140,46 65,28 187,76 154,32 51,82 -115,88
18 199,40 161,29 148,84 62,48 224,38 161,23 48,24 -143,21
19 158,50 93,98 122,43 68,83 172,41 138,59 57,05 -123,90
20 165,95 133,99 129,54 69,85 186,70 145,62 57,39 -119,26

Në Figurën 11.1-a dhe 11.1-b janë dhënë diagramet e shpërndarjes të ndryshoreve X
dhe Y. Të supozojmë se në Figurën 11.1-a përcaktohet një bosht V1 i cili formon një kënd
prej Ѳ= 0° nga boshti X1. Projeksionet e pikave mbi boshtin V1 në diagramin e
shpërndarjes formojnë një ndryshore të re e cila është një kombinim linear i ndryshoreve
X. Kurse vlerat e njësisë (V1) të ndryshores së re mund të llogariten me barazimin e
mëposhtëm (Sharma, fq. 392):

V1 = Cos 20°X1 + Sin 20°X2 = 0,940X1 + 0,342X2.

Në mënyrë të ngjashme, në Figurën 11.1-b, përcaktohet një aks i ri W1 i cili formon
një kënd për Ѳ=10° nga boshti Y1. Projeksionet mbi boshtin W1 të pikave në diagramin e
shpërndarjes japin një ndryshore të re e cila është kombinim linear i ndryshoreve Y. Kurse
vlerat e njësive (W1) të ndryshores së re llogariten me barazimin e mëposhtëm:

W1 = Cos 10°Y1 + Sin 10°Y2 = 0,958Y1 + 0,174Y2.

277
Kurse në Tabelën 11. janë dhënë korrelacionet ndërmjet disa vlerave të Ѳ 1 dhe Ѳ2
dhe ndryshoreve të reja të përfituara (V1, W1). Siç mund të shihet, disa nga ndryshoret e
reja të përfituara me kombinime të ndryshme të Ѳ1 dhe Ѳ2 kanë koeficientë më të lartë të
korrelacionit sesa të tjerët. Korrelacioni ndërmjet ndryshoreve V1 dhe W1 është në
maksimum kur këndi ndërmjet V1 dhe X1 është ,9 shkallë (Ѳ1 = 72,9°) dhe këndi
ndërmjet W1 dhe Y1 është 5,4 shkallë (Ѳ2 = 5,4°). Në qoftë se këndeve të çfarëdo kombinimi
linear të bërë me boshtin përkatës X ose Y i shtohet 180°, përfitohen të njëjtat kombinime
lineare. Akset e reja V1 dhe W2 janë paraqitur në Figurën 11.2-a dhe Figurën 11.2-b.

Tabela 11.2: Korrelacionet Ndërmjet Ndryshoreve Kanonike

Këndi Ѳ1 ndërmjet Këndi Ѳ2 ndërmjet
ndryshores X1 dhe V1 ndryshores Y1 dhe W1 Korrelacionet
10° 20° 0,744
20° 10° 0,823
30° 10° 0,852
40° 5° 0,870
60° 5° 0,882
72,9° 5,4° 0,884
75° 5° 0,883
80° 5° 0,882
86° 5° 0,882
252,9° (72,9° + 180°) 185,4° (180° +5,4°) 0,884

Në këtë mënyrë, vlerat e njësive të këtyre ndryshoreve mund të përfitohen me një
nga barazimet e mëposhtme:

V1 = Cos 72,9°X1 + Sin 72,9°X2 = 0,294X1 + 0,956X2

V1 = Cos 252,9°X1 + Sin 252,9°X2 = −0, 94X1 − 0,956X2

W1 = Cos 5,4°Y1 + Sin 5,4°Y2 = 0,996Y1 + 0,094Y2

W2 = Cos 185,4°Y1 + Sin 185,4°Y2 = −0,99 Y1 − 0,094Y2

Vlerat e llogaritura të njësive për koeficientët të cilët ofrojnë korrelacionin
maksimal ndërmjet ndryshoreve V1 dhe W1 janë dhënë në Tabelën 11.1. Koeficienti i
korrelacionit themelor ndërmjet këtyre dy ndryshoreve është 88,4%. Pas përfitimit optimal
të ndryshoreve V1 dhe W1, mund të llogaritet një seti i ri ndryshoresh (për shembull, V2 dhe
W2), i cili i plotëson kushtet e mëposhtme (Sharma, fq. 394):

278
Figura 11.1: Grafiqet e Ndryshores së Varur dhe të Pavarur

a) Grafiqet e Ndryshoreve të Pavarura b) Grafiqet e Ndryshoreve të Varura

 Korrelacioni ndërmjet ndryshoreve të reja V2 dhe W2 është maksimal.
 Setet e reja të ndryshoreve V2 dhe W2 janë të pavarura nga setet e ndryshoreve
të përfituara më herët V1 dhe W1. Me fjalë të tjera, korrelacioni ndërmjet tyre
është zero sepse drejtëzat janë të drejta me njëra-tjetrën (cos90° = 0).

Edhë në Figurën 11.2-a dhe 11.2-b janë dhënë boshtet V2 dhe W2 dhe boshtet X1 dhe
Y1 me këndet e tyre prej 1 ,9 shkallë (Ѳ3 = Ѳ1 + 90 = 1 ,9°) dhe 95,4 shkallë (Ѳ4 = Ѳ2 + 90
= 95,4°), të pavarura nga akset V1 dhe W1. Kurse setet e reja të dyta të ndryshoreve (V2, W2)
përfitohen nga barazimet e mëposhtme:

V2 = Cos 162,9°X1 + Sin 162,9°X2 = −0,95 X1 + 0,294X2

V2 = Cos 342,9°X1 + Sin 342,9°X2 = 0,956X1 − 0,294X2

W2 = Cos 95,4°Y1 + Sin 95,4°Y2 = −0,094Y1 + 0,996Y2

W2 = Cos 275,4°Y1 + Sin 275,4°Y2 = 0,094Y1 − 0,996Y2

Korrelacioni ndërmjet ndryshoreve V2 dhe W2 është i barabartë me 12,9%. Këto
funksione në analizën e korrelacionit kanonik vazhdohen deri në momentin sa nuk mund të
përcaktohet më ndonjë seti i ri ndryshoresh sepse distanca e korrelacionit kanonik mund
të jetë e barabartë më së shumti me numrat e vegjël nga numrat e ndryshores së varur
(ndryshorja Y me numër p) dhe pavarur (ndryshorja X me numër k). Me fjalë të tjera,
numri i ri i ndryshoreve që mund të përcaktohet më së shumti është i barabartë me një
normë më të vogël se vlerat p dhe k (Sharma, 394).

279
Në terminologjinë e korrelacionit kanonik, ekuacionet e mësipërme të cilët japin
vlerat V1 dhe W1 quhen ekuacionet kryesore (primare) të korrelacionit kanonik, kurse
ekuacionet të cilat japin vlerat V2 dhe W2 quhen ekuacionet dytësore të korrelacionit
kanonik. Kurse korrelacionet ndërmjet seteve të ndryshoreve të reja quhen koeficientët e
korrelacionit kanonik.

Kështu, qëllimi i analizës së korrelacionit kanonik mund të shprehet si përcaktimi i
seteve të reja të ndryshoreve të cilët janë funksion linear i ndryshoreve X dhe Y, në mënyrë
që korrelacionet ndërmjet ndryshoreve Vi dhe Wi të jenë maksimale dhe secili set i ri
ndryshoresh të jetë i pavarur nga njëri-tjetri.

Figura 11.2: Grafiqet e Ndryshores se Varur dhe të Pavarur

(a) Grafiku i Ndryshoreve të Pavarura (b) Grafiku i Ndryshoreve të Varura

Qëllimi i korrelacionit kanonik mbi çdo set ndryshoresh (X dhe Y) ngjan mjaft me
analizën e komponentëve themelorë. Dallimi i vetëm vërehet në kriteret e përdorura për
njohjen e akseve të reja. Përderisa analiza e komponentëve themelorë prodhohet në
formën ashtu që ndryshorja e aksit të parë shpjegon variancën maksimale në distancë,
analiza e korrelacionit kanonik prodhohet në formën ashtu që korrelacioni ndërmjet
ndryshoreve të reja të përcaktuara për setin e dy ndryshoreve të bëhet maksimal.
Marrëdhëniet ndërmjet setit të dy të ndryshoreve në aplikim mund të shpjegohen në
mënyrë signifikante me disa ndryshore kanonike. Në këtë kontekst, analiza e korrelacionit
kanonik mund të shihet si një teknikë e reduktimit një-madhësish. Me një shprehje tjetër,
në vend të shqyrtimit të korrelacioneve ndërmjet setit dy ndryshoresh në numër të madh,

280
Tabela 11.3: Vlerat (Pikat) Kanonike të V1, W1, V2 dhe W2

Njësia V1 W1 V2 W2
1 −3,69 −8,70 −16,40 6,75
2 −5,71 −9,95 −14,97 6,31
3 −4,93 −10,51 −16,31 8,67
4 −5,20 −10,86 −15,25 6,98
5 −3,78 −8,56 −15,21 7,27
6 −5,60 −10,65 −16,23 4,96
7 −6,53 −11,59 −14,69 5,90
8 −6,21 −10,43 −14,80 6,91
9 −5,55 −9,88 −16,62 4,94
10 −5,09 −10,59 −15,83 5,27
11 −6,13 −11,27 −13,87 6,61
12 −6,54 −11,26 −14,50 6,14
13 −3,56 −9,23 −16,34 4,98
14 −4,64 −8,90 −13,96 6,58
15 −3,71 −8,48 −14,57 4,62
16 −6,04 −10,86 −16,37 6,70
17 −5,54 −10,95 −13,40 5,47
18 −6,35 −11,55 −16,50 5,07
19 −4,07 −9,63 −14,10 6,06
20 −5,27 −10,16 −13,74 6,09
Mesatarja −5,207 −10,199 −15,083 6,114
Devijimi St. 1 1 1 1

fillimisht çdo set ndryshoresh reduktohet në disa komponente lineare (ndryshore
kanonike) dhe më pas interpretohen vetëm këta komponentë linear. Pra, në analizën e
korrelacionit kanonik, distanca e ndryshores kanonike interpretohet pas reduktimit në
distancën e korrelacionit kanonik. Për shembull, në vend të interpretimit të matricës së
korrelacionit me madhësi p x k ndërmjet ndryshoreve X dhe Y në analizën e korrelacionit
kanonik, është e mjaftueshme vetëm interpretimi i vetëm disave korrelacioneve kanonike.
Kurse numri maksimal i korrelacioneve kanonike që do të interpretohet (m) do të jetë sa
m<min (p, k) dhe nga këto korrelacione kanonike do të interpretohen vetëm ato që janë të
rëndësishme për nga pikëpamja praktike dhe statistikore. Në këtë mënyrë, një qëllim tjetër
i korrelacionit kanonik është përcaktimi në numër më të vogël i korrelacioneve kanonike
që shpjegojnë në mënyrën më të përshtatshme marrëdhëniet ndërmjet setit të dy
ndryshoreve.

11.1.1. PARAQITJA GJEOMETRIKE E VLERAVE TË NJËSISË
Qëllimi i analizës së korrelacionit kanonik mund të paraqitet edhe me distancën e
vlerave të vrojtimeve (njësive). Grafiku i të dhënave mund të paraqitet si ndryshore e

281
vlerave të vrojtimit dhe ndryshoret si pika (ose vektorë) (Sharma, fq. 397). Në Tabelën
11.1, çdo ndryshore mund të paraqitet në distancën e të dhënave 24-madhësish. Vektorët
x1, x2, y1 dhe y2 do të paraqiten në distacën 4-madhësish e cila përfshin distancën e të
dhënave 24-madhësish. Po ashtu, vektorët x1 dhe x2 do të marrin pjesë në një distancë 2-
madhësish e cila përfshin distancën e të dhënave 24-madhësish dhe vektorët y1 dhe y2 do
të marrin pjesë në një distancë 2-madhësish e cila përfshin distancën e të dhënave 24-
madhësish. Siç u specifikua edhe më parë, për shkak që është e pamundur që një distancë
4-madhësish të paraqitet në letër, në Figurën 11.3-a është paraqitur marrëdhënia ndërmjet
vektorëve x1 dhe x2 dhe në Figurën 11.3-b marrëdhënia ndërmjet y1 dhe y2. Figura 11.3-a
jep kosinusin e këndit dhe korrelacionin ndërmjet dy ndryshoreve të pavarura dhe Figura
11.3-b jep kosinusin e këndit dhe korrelacionin ndërmjet dy ndryshoreve të varura.

Figura 11.3: Paraqitja Gjeometrike në Distancën e Vlerave të Njësisë

(a) Grafiku i Ndryshoreve të Pavarura (b) Grafiku i Ndryshoreve të Varura

Qëllimi i analizës së korrelacionit kanonik është të përcaktojë këndin më të ngushtë
ndërmjet ndryshoreve v1 e cila bie në distancën x1 dhe x2 dhe w1 e cila bie në distancën y1
dhe y2. Në këtë mënyrë, korrelacioni ndërmjet vektorëve v1 dhe w1 do të jetë maksimal. Në
të njëjtën kohë, mund të prodhohet seti i vektorëve v2 dhe w2 si i pavarur nga vektorët e
përcaktuar më lartë v1 dhe w1. Po ashtu, Figura 11.3 tregon këta vektorë. Ky proces
vazhdon derisa të pamundësohet njohja e seteve të ri shtesë të vektorëve.

11.2. QASJE ANALITIKE NDAJ ANALIZËS SË KORRELACIONIT
KANONIK
T’i marrim në konsideratë barazimet e mëposhtme:

282
V1 = a11Y1 + a12Y2 + ... + a1pYp

W1 = b11X1 + b12X2 + ... + b1kXk

Barazimet e mësipërme japin ndryshoret V1 dhe W1 të cilat janë funksion linear i
ndryshoreve X dhe Y. C1 le të jetë korrelacioni ndërmjet V1 dhe W1. Qëllimi i korrleacionit
kanonik është të parashikojë korrelacionet a11, a12, ..., a1p dhe b11, b12, ..., b1k të cilët do të
japin vlerën C1 maksimale. Barazimet e mësipërme tregojnë barazimet kanonike,
ndryshoret kanonike V1 dhe W1 dhe koeficientin e korrelacionit kanonik C1 (Sharma, fq.
397-398).

Pas llogaritjes së ndryshoreve kanonike V1 dhe W1 bëhet përcaktimi i setit të
ndryshoreve të tjera kanonike (V2 dhe W2).

V2 = a21Y1 + a22Y2 + ... + a2pYp

W2 = b21X1 + b22X2 + ... + b2kXk

Ndryshoret kanonike V2 dhe W2, me koeficient të korrelacionit C1 ndërmjet tyre
përcaktohen në mënyrë të pavarur nga ndryshoret kanonike V1 dhe W1. Pra, setet e
ndryshoreve kanonike përfitohen të pavarura nga njëra-tjetra. Ky proces vazhdon derisa
koeficienti i korrelacionit (Cm) ndërmjet ndryshoreve kanonik m të jetë maksimal.

Vm = am1Y1 + am2Y2 + ... + ampYp

Wm = bm1X1 + bm2X2 + ... + bmkXk

Me pak fjalë, analiza e korrelacionit kanonik përcaktohet në atë mënyrë që setet e
ndryshoreve kanonike në numër m [(V1, W1), (V2, W2), ..., (Vm, Wm)] janë të pavarur nga
njëri-tjetri, mirëpo koeficientët e korrelacionit ndërmjet këtyre seteve ndryshoresh janë
maksimale (C1, C2, ..., Cm = maksimum). Pra,

C1, C2, ..., Cm = maksimum.

Korrelacioni (Vi, Vj) = 0 dhe i ≠ j

Korrelacioni (Wi, Wj) = 0 dhe i ≠ j

Korrelacioni (Wi, Vj) = 0 dhe i ≠ j.

Nga këtu shihet se ekziston një problem maksimizimi i analizës së korrelacionit
kanonik që duhet të zgjidhet sipas kufizimeve të caktuara. Për detaje teknike shikoni
burimin Sharma (1996).

283
11.3. SUPOZIMET E ANALIZËS SË KORRELACIONIT KANONIK
Rezultatet e analizës së korrelacionit kanonik duhet të vlerësohen nga pikëpamja e
supozimit të linearitetit, shpërndarjes së shumëfishtë normale, variancave të barabarta dhe
lidhjes së shumëfishtë lineare. Supozimi i linearitetit ndikon në rezultatet e analizës së
korrelacionit kanonik në dy mënyra (Hair dhe të tj., fq. 448). E para, në analizën e
regresionit kanonik supozohet se marrëdhënia ndërmjet dy ndryshoreve është lineare. Në
rastet kur marrëdhënia ndërmjet dy ndryshoreve nuk është lineare, duhet të bëhet
konvertimi linear i njërës ose të dy ndryshoreve në qoftë se është e mundur. E dyta,
koeficientët e korrelacionit kanonik pasqyrojnë marrëdhënien lineare ndërmjet dy
ndryshoreve kanonike. Për këtë arsye, në analizën e korrelacionit kanonik, marrëdhëniet të
cilat nuk janë lineare nuk mund të shpjegohen.

Edhe pse në analizën e korrelacionit kanonik supozimi i shpërndarjes normale është
i nevojshëm, mund të përdoren të gjitha ndryshoret metrike. Arsyeja e preferimit të
supozimit të shpërndarjes normale është mundësia e rritjes së marrëdhënies ndërmjet
ndryshoreve përmes standartizimit të tyre. Mirëpo, analiza e korrelacionit kanonik nuk
ndikohet nga devijimet e shpërndarjes normale (për shembull, devijimi nga shpërndarja
normale buron nga shtrembërimi) e cila nuk zvogëlon marrëdhëniet ndërmjet
ndryshoreve.21 Përveç kësaj, për testimin e rëndësisë së funksioneve kanonike në një
mënyrë të përshtatshme, është e nevojshme sigurimi i supozimit të shpërndarjes së
shumëfishtë normale. Për shkak që shpërndarja e shumëfishtë normale nuk mund të
testohet në mënyrë të lehtë, së paku duhet që ndryshoret e analizës të vlerësohen veç e veç
nga aspekti i shpërndarjes normale dhe në qoftë se është e mundur të konvertohen në
shpërndarjen normale ndryshoret të cilat nuk ndjekin shpërndarjen normale.

Në të njëjtën kohë, duhet të vlerësohet edhe ekuilibri i variancave për arsye se ulin
korrelacionet ndërmjet ndryshoreve (Hair dhe të tj., fq. 448). Në fund, lidhja e shumëfishtë
lineare, e cila vështirëson përcaktimin e qartë të ndikimeve të ndryshoreve dhe për këtë
arsye ndikon në mënyrë negative në interpretimin e rezultateve të analizës, duhet të
reduktohet në një nivel të pranueshëm.

11.4. PËRFITIMI I ANALIZËS SË KORRELACIONIT KANONIK ME SPSS
Të dhënat e përdorura në aplikim janë përfituar në mënyrë të rastësishme nga të
sëmurët që kanë aplikuar me ankesën e obezitetit në Spitalin e Fakultetit të Mjekësisë së
Universitetit të Stambollit. Me fjalë të tjera, popullsia e të dhënave janë të sëmurët të cilët

21Në analizën e korrelacionit kanonik mund të përdoren edhe ndryshoret false (të cilat kanë vlera njësish 0
dhe 1) të cilat nuk janë metrike me kusht që të mos jenë në numër të shumtë.

284
kanë aplikuar me ankesën e obezitetit në Fakultetin e Mjekësisë së Stambollit dhe teknika e
përdorur e mostrimit është mostrimi i thjeshtë i rastësishëm. Në total janë matur gjashtë
ndryshore mbi të sëmurët: gjatësia (cm, X1), pesha e trupit (kg, X2), indeksi i masës trupore
(kg/m2, X3), gjatësia e perimetrit të kofshës (cm, Y1), gjatësia e perimetrit të muskujve të
matura nga beli e sipër (cm, Y2) dhe zona e lëkurës (cm2, Y3). Rezultatet e matjes të
përfituara nga 20 vetë në hulumtim dhe komandat makro në SPSS për analizën e
korrelacionit kanonik janë dhënë në Tabelën 11.4. Siç është specifikuar edhe më parë,
ekziston vetëm një dosje makro për analizën e korrelacionit kanonik në SPSS.

11.4.1. PËRDORIMI I DOSJEVE MAKRO NË SPSS
Në programin SPSS ekzistojnë katër dosje makro: canonical correlation, descriptive
statistics, ridge regression dhe SPSS PC+ syntax convertor. Këto dosje gjenden nën klasorin
e SPSS-it (Shiko: Hapi 1). Për përdorimin e dosjeve makro duhet që këto dosje të shkruhen
në një mënyrë të saktë në vendin në të cilin gjenden. Për përdorimin e dosjeve makro,
duhet që të realizohen me radhë funksionet e mëposhtme. Nga editorimi i të dhënave në
SPSS zgjedhet,

File... New... Syntax.

Për të shkruar dosjen makro SPSS me këto komanda hapet një editorim i ri
sintaksor.

Me anë të komandës INCLUDE bëhet qasja në dosjen e nevojshme makro për
analizën e korrelacionit kanonik. Këtu, në thonjëza përcaktohet emri dhe mënyra e klasorit
makro të korrelacionit kanonik.

Include File ‘C: \Program Files\SPSS\Canonical
correlation.spss’.

285
Hapi 1: Dosjet Makro SPSS

Pas shkruarjes së komandës INCLUDE shkruhet sintaksa e nevojshme e analizës së
korrelacionit kanonik. Dosja e plotë makro e shkruar për analizën e korrelacionit kanonik
është dhënë në Tabelën 11.4. Me makron e korrelacionit kanonik përfitohen dy dosje të
ndara. Dosja e parë është dhënë në Tabelën 11.5. Përpara përdorimit, dosja punuese në
SPSS, fillimisht ruhet si dosje e re e përkohshme “cc_tmp1.sav.”. Po ashtu, ndryshoret e
pikëve kanonike të shtuara në të dhënat e dosjes punuese shtohen në editorin e të dhënave
me emrat s1_cv1, s2_cv1, s1_cv2, s2_cv2, s1_cv3, s2_cv3 etj. Numri i ndryshoreve të pikëve
kanonike është sa dy herë sa numrat e vegjël të ndryshoreve që marrin pjesë në SET1 dhe
SET2. Vlerat e njësive të ndryshoreve të pikëve kanonike në aplikimin e shembullit tonë
janë dhënë në Tabelën 11.3.

Include File ‘C: \Program Files\SPSS\Canonical
correlation.spss’.

CANCORR SET1=X1 X2

/SET2=Y1 Y2.

Në fund, pas zgjedhjes së tekstit të duhur të sintaksës përkatëse, sintaksa vihet në
funksion me komandat “Run ... Current” (Shik: Hapi ).

286
Hapi 2: Vënia në Funksion e Dosjes Makro nga Dritarja e Sintaksës

11.4.2. INTERPRETIMI I REZULTATEVE TË ANALIZËS SË
KORRELACIONIT KANONIK
Me shpjegimet e bëra më parë në lidhje me analizën e korrelacionit kanonik
interpretohen rezultatet e SPSS-it të përfituara për distancën e ndryshores katër-
madhësish të përdorur në paraqitjen gjeometrike me qëllim të dhënies së mundësisë së
krahasimit. Rezultatet e SPSS-it të përfituara për këtë set të dhënave janë dhënë në Tabelën
11.5 dhe të dhënat dhe komandat makro të përdorura në përfitimin e këtyre rezultateve
janë dhënë në Tabelën 11.4.

11.4.2.1. Statistikat Themelore
Korrelacionet ndërmjet ndryshoreve X janë dhënë në Tabelën 11.5-1a, korrelacionet
ndërmjet ndryshoreve Y në Tabelën 11.5-1b dhe korrelacionet ndërmjet ndryshoreve X
dhe Y në Tabelën 11.5-1c. Korrelacionet ndërmjet ndryshoreve X dhe Y japin korrelacionet
e ndryshoreve në setin dy-ndryshoresh. Veçanërisht, mund të kuptohet se ekzistojnë
marrëdhënie pozitive lineare të rëndësishme ndërmjet ndryshores Y1 dhe ndryshoreve X1
dhe X2 prej 63,1% dhe 87,8% (Tabela 11.5-1c). Siç mund të shihet, marrëdhëniet ndërmjet
seteve të ndryshoreve (2 x 2) mund të interpretohen lehtë për shkak që matrica e
korrelacionit përbëhet nga katër korrelacione. Mirëpo, duke përdorur një matricë të këtillë
n

287
Tabela 11.4: Komandat Makro SPSS për të Dhënat dhe Korrelacionin Kanonik

Title “Analiza e Korrelacionit Kanonik”
Data List Free / N X1 X2 X3 Y1 Y2 Y3.
Variable Labels
X1 “Gjatësia, cm”
/X2 “Pesha Trupore, kg”
/X3 “Indeksi i Masës Trupore, kg/m-katror”
/Y1 “Gjatësia e Perimetrit të Kofshës, cm”
/Y2 “Gjatësia e Perimetrit të Muskujve të Matur, cm”
/Y3 “Zona e Lëkurës, m-katror”.
Begin Data.
1 175,25 75,57 24,61 109,47 73,91 1,81
2 180,45 144,78 44,46 126,49 71,63 2,30
3 176,60 118,74 37,92 131,83 93,98 2,86
4 178,50 127,64 35,59 137,92 78,99 2,77
5 165,75 81,91 29,81 107,19 78,49 1,78
6 190,50 137,79 36,03 136,91 60,20 2,38
7 185,25 172,09 46,56 148,59 70,10 2,92
8 183,30 161,29 46,78 132,33 77,72 2,59
9 193,50 135,26 36,11 126,75 58,93 2,06
10 152,56 122,56 36,77 135,89 62,99 2,37
11 174,55 161,29 42,63 143,76 76,20 2,89
12 163,60 172,72 48,02 144,02 71,88 2,83
13 164,90 74,29 30,82 118,11 58,42 0,74
14 162,35 113,03 32,81 112,27 72,64 1,83
15 159,51 81,28 31,95 108,46 54,10 1,36
16 195,56 151,76 37,47 138,18 76,45 2,74
17 165,35 143,51 41,05 140,46 65,28 2,58
18 199,40 161,29 40,22 148,84 62,48 2,81
19 158,50 93,98 23,79 122,43 68,83 2,11
20 165,95 133,99 37,02 129,54 69,85 2,34
End Data.

Subtitle "(1) Analiza e Korrelacionit Kanonik".
Include FIle: 'C:\Program Files\SPSS\Canonical
correlation.spss’.
CANCORR SET1=X1 X2
/SET2=Y1 Y2.

*Seti i dy ndryshoreve duhet të ndahet me sembolin /.

nuk është kaq e thjeshtë për të shqyrtuar marrëdhëniet ndërmjet setit dy-ndryshoresh që
përbëhet nga një numër i madh ndryshoresh. Për shembull, numri total i korrelacioneve që
duhet të shqyrtohet ndërmjet setit dy-ndryshoresh që përbëhet nga 15 ndryshore të varura

288
dhe 20 ndryshore të pavarura është 300. Si përfundim, është e vështirë të interpretohen
rezultatet në këtë kapitull për problemet me matje të mëdha.

11.4.2.2. Ndryshoret Kanonike dhe Koeficientët e Korrelacionit
Kanonik
Në aplikimin tonë kemi të bëjmë me një set dy-ndryshoresh çifte kanonike [m=min
(2x2)] që sigurojnë dy koeficientë të korrelacionit kanonik. Çifti i parë kanonik i
ndryshoreve përfitohet me barazimet e mëposhtme (Tabela 11.5-4a dhe Tabela 11.5-4b).

V1 = −0,009X1 – 0,029X2 W1 = −0,0 5Y1 – 0,007Y2

Për arsye se ndryshoret kanonike mund të përcaktohen me ndihmën e koeficientëve
nga barazimet e mësipërme duke përdorur të dhënat e papërpunuara (pastandartizuara),
këta koeficientë quhen koeficientët kanonikë të papërpunuar (raw). Ashtu si në analizën e
diskriminimit, në barazimet kanonike nuk mund të bëhet krahasimi i drejtpërdrejtë i
koeficientëve. Mund të krahasohen vetëm normat e koeficientëve me njëra-tjetrën.
Koeficientët e llogaritur më sipër përfitohen duke përdorur vlerat e ndryshores së
pastandartizuar (me mesatare zero dhe devijim standart 1). Për krahasimin e koeficientëve
të mësipërm të përfituar me programin SPSS me koeficientët e llogaritur në paraqitjen
gjeometrike, fillimisht duhet të bëhet normalizimi i këtyre koeficientëve. Krahasimi mund
të bëhet pas normëzimit të koeficientëve të barazimit të mësipërm V1 me vlerën 0,031
( (0,009 + 0,0 9 ) ) dhe barazimit W1 me vlerën 0,076 ( (0,0 5 + 0,00 ) ). Pra,
0,009 0,0 9
V1 = −0,031 X1 – 0,031 X2 −0,290X1 – 0,936X2

0,0 5 0,00
W1 = 0,0 Y1 – 0,0 5 Y2 −0,996Y1 – 0,094Y2.

Më lartë, koeficientët e përfituar në paraqitjen gjeometrike nga koeficientët e
korrelacionit kanonik të normalizuar janë të barabartë me njëri-tjetrin, me përjashtim të
gabimeve të rrotullimit. Koeficienti i korrelacionit të thjeshtë ndërmjet dy ndryshoreve
kanonike të dhënë më lartë është 88,4% (Tabela 11.5-2) dhe është i barabartë me
koeficientin e korrelacionit maksimal të llogaritur në Tabelën 11.2. SPSS-i po ashtu,
raporton edhe koeficientët e korrelacionin kanonik standart për çdo set dy-ndryshoresh
(Tabela 11.5-5a dhe 11.5-5b). Me këta koeficientë mund të përcaktohen ndryshoret
kanonike duke shfrytëzuar të dhënat standarte dhe mesatarja e këtyre koeficientëve është
e barabartë me zero dhe devijimi standart me 1. Koeficienti i korrelacionit kanonik dytësor
është 12,9% (Tabela 11.5-2) dhe është i barabartë me koeficientin e korrelacionit të
thjeshtë ndërmjet ndryshoreve kanonike të përfituara me barazimet e mëposhtme:

V2 = −0,10 X1 + 0,029X2 W2 = −0,011Y1 + 0,108Y2

289
Tabela 11.5: Rezultatet e Përfituara me Dosjen Makro SPSS
Correlations for Set-1 (1a) Correlations for Set-2 (1b)
X1 X2 Y1 Y2
X1 1,0000 ,6484 Y1 1,0000 ,0846
X2 ,6484 1,0000 Y2 ,0846 1,0000

Correlations Between Set1 and Set-2 Correlations Correlations (2)
(1c) 1 ,884
Y1 Y2 2 ,129
Y1 ,6307 ,0040
X2 ,8781 ,1424
Test that remaining correlations are zero: (3)
Wilk’s Chi-Sq DF Sig.
1 ,216 25,321 4,000 ,000
2 ,983 ,276 1,000 ,600
Raw Canonical Coefficients for Set-1 Raw Canonical Coefficients for Set-2
(4a) (4b)
1 2 1 2
X1 -,009 -,106 Y1 -,075 -,011
X2 -,029 ,029 Y2 -,007 ,108

Std. Canonical Coefficients for Set-1 Std. Canonical Coefficients for Set-2
(5a) (5b)
1 2 1 2
X1 -,107 -1,309 Y1 -,992 -,150
X2 -,927 ,931 Y2 -,066 1,001

Canonical Loading for Set-1 (6a) Canonical Loading for Set-2 (6b)
1 2 1 2
X1 -,709 -,706 Y1 -,998 -,066
X2 -,997 ,082 Y2 -,150 ,989

Cross Loadings for Set-1 (7a) Cross Loadings for Set-2 (7b)
1 2 1 2
X1 -,626 -,091 Y1 -,882 -,008
X2 -,881 ,011 Y2 -,132 ,127

Redunancy Analysis: (8)
Proportion of Variance of Set-1 Explained by Its Own Can. Var. (8a)
Prop Var
CV1-1 ,748
CV1-2 ,252
Proportion of Variance of Set-1 Explained by Opposite Can. Var. (8b)
Prop Var
CV2-1 ,584
CV2-2 ,004
Proportion of Variance of Set-2 Explained by Its Own Can. Var. (8c)
Prop Var
CV2-1 ,509
CV2-2 ,491
Proportion of Variance of Set-1 Explained by Opposite Can. Var. (8d)
Prop Var
CV1-1 ,397
CV1-2 ,008

290
Koeficientët e barazimeve të mësipërme janë matur në atë mënyrë që mesatarja e
ndryshoreve kanonike që do të përfitohen të jetë zero dhe devijimi standart të jetë një. Pas
normalizimit të këtyre koeficientëve, mund të shfaqet me lehtësi se këta koeficientë janë të
barabartë me koeficientët e llogaritur në pjesën e paraqitjes gjeometrike.

11.4.2.3. Testimi i Rëndësisë së Koeficientëve të Korrelacionit
Kanonik
Përpara interpretimit të ndryshoreve kanonike dhe korrelacioneve kanonike, duhet
të vlerësohet rëndësia statistikore e korrelacioneve kanonike. Testet e hipotezës zero dhe
alternative të përdorura në testimin e rëndësisë statistikore të korrelacioneve kanonike,
shkruhen si më poshtë:

H0: C1 = C2 = ... = Cm = 0

H1: C1 ≠ C2 ≠ ... ≠ Cm ≠ 0.

Hipoteza zero e cila shpreh se koeficientët e korrelacionit kanonik janë të barabartë
me zero tregon se matrica e cila përfshin koeficientët e korrelacionit ndërmjet seteve të
ndryshores X dhe Y është e barabartë me zero (RXY = 0). Në testimin e hipotezave të
mësipërme mund të përdoren disa statistika. Këtu shpjegohet shkurtimisht statistika Wilk
Lamda (Λ):

Λ= =1(1 − ci ) = (1 – 0,8842) (1 – 0,1292) = 0,215 (Tabela 11.5-3).

Rëndësia e statistikës Wilk Λ testohet me statistikën e mëposhtme, e cila ndjek
shpërndarjen x2 me shkallë të lirisë p x k (2 x 2 = 4) (Dillon dhe të tj., fq. 353; Sharma, fq.
402-403):
1 1
B = −[n – 1 − (p + k + 1) ln Λ = −[ 0 – 1 − (2 + 2 +1)] ln (0,215) = 25,362

Vlera 25,362 është e rëndësishme në nivelin e rëndësisë 5%. Pra, mund të kuptohet
se koeficientët e korrelacionit kanonik janë të rëndësishëm (Tabela 11.5-3). Statistika e
mësipërme Λ është një test i përgjithshëm i cilin teston të gjithë koeficientët e korrelacionit
kanonik së bashku dhe në të njëjtën kohë. Refuzimi i hipotezës zero tregon që së paku
koeficienti i parë i korrelacionit kanonik është i rëndësishëm dhe pjesa tjetër e
koeficientëve të korrelacionit kanonik me numër m−1 mund të jenë të rëndësishëm ose të
parëndësishëm (Tabachnick, fq. 201-202). Rëndësia e koeficientit të dytë të korrelacionit
kanonik mund të testohet duke e mbajtur jashtë ndikimin e koeficientit të parë të
korrelacionit kanonik. Rëndësia e koeficientit të korrelacionit kanonik r mund të testohet
me lehtësi si më poshtë:

Λr = =1(1 − ci ) = (1 – 0,1292) = 0,983

291
Rëndësia e statistikës së mësipërme Wilk Λr, e cila ndjek shpërndarjen x2 dhe shkallë
të lirisë (p – r) x (k – r), (1 x 1 = 1) mund të testohet me statistikën e mëposhtme:
1 1
Br = −[n – 1 − (p + k + 1) ln Λr = −[ 0 – 1 − (2 + 2 +1)] ln (0,983) = 0,283.

Vlera 0,283 është e barabartë me vlerën e dhënë në Tabelën 11.5-3, me përjashtim
të gabimeve të rrotullimit dhe është e rëndësishme në nivelin e rëndësisë 5% (Tabela 11.5-
3).

11.4.2.4. Interpretimi i Koeficientëve të Korrelacionit Kanonik
Pas vlerësimit të rëndësisë së koeficientëve kanonik, vie faza e interpretimit të
ndryshoreve kanonike. Nga ndryshoret kanonike duhet të interpretohen vetëm ato që janë
signifikante. Interpretimi i ndryshoreve kanonike ngjan me interpretimin e komponentëve
themelorë në analizën e komponentëve themelorë, strukturave (faktorëve) hipotetike në
analizën faktoriale dhe funksioneve diskriminuese në analizën e diskriminimit. Koeficientët
e standartizuar mund të përdoren për këtë qëllim. Koeficientët standart ngjajnë me
koeficientët e standartizuar të regresionit në analizën e regresionit të shumëfishtë.
Koeficientët e standartizuar kanonikë tregojnë peshën standarte në përcaktimin e
ndryshoreve kanonike të ndryshores përkatëse.

Hulumtimet tregojnë se koeficientët e parashikuar në mostrat e vogla dhe në rastet
e lidhjeve të shumta lineare nuk janë stabil. Si rezultat, përdoren koeficientët e
korrelacionit të thjeshtë ndërmjet ndryshoreve kanonike dhe ndryshoreve për
interpretimin e ndryshoreve kanonike. Këta koeficientë quhen ngarkesa kanonike
(canonical loadings). Korrelacionet e ndryshoreve të pavarura X1 dhe X2 me ndryshoren
kanonike V1 janë − 0,9% dhe 99, %, kurse korrelacionet me ndryshoren kanonike V2 janë
−70,6% dhe 8,2% (Tabela 11.5-6a). Në mënyrë të ngjashme, korrelacionet e ndryshoreve të
varura Y1 dhe Y2 me ndryshoret kanonike W1 dhe W2 janë me radhë −99,8%, −15%, − , %
dhe 98,9% (Tabela 11.5-6b). Ndryshoret më të rëndësishme në përcaktimin e ndryshoreve
kanonike V1, V2, W1 dhe W2 janë me radhë X2 (−99, %), X1 (− 0, %), Y1 (−99,8%) dhe Y2
(−98, %). Në aplikimin tonë duhet të interpretohet vetëm çifti i parë i ndryshores kanonike
(V1 dhe W1) për shkak që koeficienti i parë i korrelacionit kanonik është i rëndësishëm.
Ashtu si në analizën faktoriale, qasjet e përdorura për emërimin e strukturave (faktorëve)
hipotetike të rëndësishme në mënyrë teorike ose për emërimin e funksioneve
diskriminuese të rëndësishme në analizën e diskriminimit, edhe në analizën e korrelacionit
kanonik mund të emërohen ndryshoret kanonike duke marrë për bazë karakteristikat e
përbashkëta të ndryshoreve të cilat paraqesin lidhjet më të rëndëisishme me strukturat e
përcaktuara të rëndësishme kanonike. Në këtë rast, nga dyshet e ndryshores së parë
kanonike është e përshtatshme që V1 të emërohet si “pesha trupore” dhe W1 si “gjatësia e
perimetrit të muskulit të kofshës”. Dyshet e ndryshores së dytë të korrelacionit kanonik

292
nuk janë të nevojshme që të emërohen për arsye se koeficienti i dytë i korrelacionit
kanonik nuk është signifikant.

Për vlerësimin e ndikimeve të ndryshoreve X mbi ndryshoret Y, ose të ndryshoreve
Y mbi ndryshoret X, përdoren peshat e standartizuara, ashtu si në teknikën e regresionit të
shumëfishtë dhe diskriminues. Në vlerësimin e përbashkët të koeficientëve të barazimeve
kanonike V1 dhe W1, mund të shihet se shenjat e koeficientëve bien në kundërshtim me
pritjet teorike. Për shembull, përderisa duhej të kishte një lidhje të kundërt ndërmjet
peshës trupore dhe muskujve të matur, rezultatet e përfituara nuk e vërtetojnë këtë situatë.
Siç është specifikuar edhe më parë, analiza e korrelacionit kanonik ndikohet në mënyrë
negative nga problemi i lidhjes së shumëfishtë lineare. Nga shqyrtimet e bëra në lidhje më
këtë problem është vërejtur se kjo buron nga problemi i lidhjes së shumëfishtë lineare.22
Për këtë arsye, gjatë vlerësimit të rezultateve të analizës së korrelacionit kanonik, kjo
çështje duhet të merret parasysh. Me fjalë të tjera, duhet të shmangen interpretimet në
lidhje me shenjat e peshave.

11.4.2.5. Rëndësia Praktike e Korrelacionit Kanonik
Siç është specifikuar edhe më parë, edhe në rastet kur me mostrat e mëdha
përfitohen korrelacione të dobëta kanonike, mund të përfitohen rezultate të rëndësishme.
Në anën tjetër, koeficientët e fortë kanonik, jo gjithmonë mund të tregojnë korrelacione të
forta ndërmjet seteve të ndryshoreve X dhe Y. Arsyeja e kësaj është se koeficientët e
korrelacionit kanonik maksimizojnë korrelacionet ndërmjet komponentëve linear të
ndryshoreve X dhe Y dhe jo variancën e shpjeguar nga setet e ndryshoreve.

Stewart dhe Love (1968) kanë propozuar matjen e tepricës (redundancy measures,
RM) e cila përcakton se cilado ndryshore nga seti i ndryshoreve sa shpjegon variancën e
ndryshores tjetër. Matja RM mund të llogaritet për secilin korrelacion kanonik. Le të
tregojë RMWi/Vi se në çfarë niveli shpjegojnë variancën ndryshoret X në ndryshoret Y për
korrelacionin kanonik Ci. Ashtu siç tregohet më poshtë, vlera e matjes RM mund të
llogaritet në dy etapa:

Në etapën e parë llogaritet vlera W1 e cila është e barabartë me mesataren e peshave
katrore të ndryshoreve Y dhe që tregon se në çfarë niveli shpjegon variancën mesatare në
ndryshoret Y. Pra,

Mesatarja (Y / W1) = =1 .

Këtu, mesatarja (Y / W1) tregon variancën mesatare në ndryshoret Y të shpjeguar
nga ndryshorja kanonike W1, kurse Lij tregon peshën kanonike j të ndryshoreve Y mbi

22Siç dihet, një nga rezultatet negative të lidhjes së shumëfishtë lineare është kundërshtimi i shenjave të
koeficientëve të përfituar me pritjet.

293
ndryshoren kanonike i. Sipas asaj që vlera jep variancën e përbashkët ndërmjet
ndryshoreve kanonike Vi dhe Wi, RM është e barabartë me herësin ndërmjet variancës
mesatare dhe variancës së përbashkët.

= Mesatarja (Y / W1) x

Për të paraqitur se si llogaritet matja RM, vlera mesatare (Y / Wi) llogaritet me
ndihmën e barazimeve të dhëna më sipër:

(−0,998) + (−0,150)
Mesatarja (Y / W1) = = 0,509.

Kjo vlerë është dhënë në Tabelën 11.5-8c. Me formulën e mësipërme, vlera
mund të llogaritet si më poshtë:

= Mesatarja (Y / W1) x = 0,509 x 0,8842 = 0,398.

Vlera RM 0,398 jep të kuptohet se varianca në ndryshoret Y të korrelacionit të parë
kanonik shpjegohet përafërsisht 39,8% nga ndryshoret X (Tabela 11.5-8d). Sipas kësaj,
mund të thuhet se koeficienti i parë i korrelacionit kanonik ka rëndësi praktike në nivel të
ulët. Mirëpo, në qoftë se ndryshorja Y merret si set i ndryshores së pavarur dhe ndryshoret
X si set i ndryshores së varur, vlera llogaritet si më poshtë:

−0, 09 + 0,99
Mesatarja (Y / W1) = = 0,748

= Mesatarja (Y / W1) x = 748 x 0,8842 = 0,585.

Vlera 0,585 tregon se vlera e korrelacionit të parë kanonik ka rëndësi praktike në
nivel mesatar (Tabela 11.5-8b).

Varianca totale e shpjeguar nga ndryshoret e çfarëdo seti dhe që i përket
ndryshoreve të setit tjetër quhet matja e tepricës totale (total redundancy measures).
Indeksi i tepricës totale RY/X (varianca totale e shpjeguar në ndryshoret Y nga ndryshoret
X) i ndryshoreve Y, llogaritet si më poshtë:

RY / X = =1 / = =1 /

Këtu, RY / X tregon matjen e tepricës totale në ndryshoret Y dhe tregon
koeficientin e korrelacionit të shumëfishtë ndërmjet ndryshores Y dhe ndryshoreve të
pavarura X. Pra, vlera totale R (teprica) është e barabartë me mesataren e vlerave të
shumëfishta R2, të përfituara nga vlerat e ndryshoreve, ku secila ndryshore Y merret si e
varur dhe ndryshoret X si ndryshore të pavarura. Në shembullin tonë, vlerat totale R të

294
ndryshoreve Y dhe X janë më radhë 40,6% (0,397 + 0,008) dhe 58,8% (0,584 + 0,004)
(Tabela 11.5-8b dhe 11.5-8d).

11.5. RROTULLIMI I NDRYSHOREVE KANONIKE
Në analizën e komponentëve themelorë dhe në analizën faktoriale është e vështirë
të interpretohen komponentët themelorë ose matricat e faktorëve të cilët nuk i janë
nënshtruar rrotullimit (rotacionit, kthimit).

Për të përfituar një strukturë më të rëndësishme (interpretueshme) në mënyrë
konceptuale, aplikohen metoda të ndryshme të rrotullimit (për shembull, metoda varimax)
në matricat e faktorëve ose komponentëve themelorë (Stevens, fq. 441-443). Për
interpretimin më të thjeshtë të koeficientëve kanonik, mund të mendohet mënyra e njëjtë e
rrotullimit. Kjo situatë në analizën e korrelacionit kanonik është më komplekse për shkak
që rrotullimi aplikohet në dy sete faktorësh në të njëjtën kohë (në çiftet e njëpasnjëshme të
ndryshoreve kanonike). Cliff dhe Krus (1976) kanë paraqitur se si mund të aplikohet në
mënyrë matematikore një proces i këtillë i rrotullimit. Përveç kësaj, Cliff dhe Krus kanë
paraqitur me anë të një shembulli se si mund të realizohet interpretimi i procesit të
rrotullimit në një mënyrë më të thjeshtë.

Me aplikimin e këtij lloji rrotullimi, varianca e shpjeguar mund të shpërndahet në
një mënyrë më të barabartë ndërmjet ndryshoreve kanonike. Me fjalë të tjera,
karakteristika e maksimizimit nuk është më qendra e temës (Stevens, fq. 442). Po të
kujtojmë, nuk është e njëjta gjë me rastin e aplikimit të rrotullimit në faktorët dhe
komponentët themelorë. Mirëpo, hulumtuesit e sakrifikojnë këtë karakteristikë për një
strukturë më të thjeshtë (interpretueshme). Pa dyshim, për t’u siguruar se marrëdhëniet e
rëndësishme mund të shpjegohen pas rrotullimit të ndryshoreve kanonike, funksioni i
rrotullimit aplikohet vetëm mbi korrelacionet e rëndësishme kanonike (Cliff dhe Krus,
1976).

11.6. VLEFSHMËRIA E JASHTME E ANALIZËS SË KORRELACIONIT
KANONIK
Siç u specifikua më lartë, rezultatet e analizës së korrelacionit kanonik nuk mund të
jenë stabile në rastet e lidhjes së shumëfishtë lineare dhe mostrat e mëdha. Në rastet e një
vëllimi të madh mostreje (n>1000) ose një normë e lartë n/p apo n/k (norma e numrit të
njësive të mostrës ndaj numrit të ndryshoreve), mund të testohet vlefshmëria e jashtme e

295
analizës së korrelacionit kanonik me dy metoda, si ndarja e mostrës mëdysh (Split Sample)
dhe mbajtjes (Holdout) (Sharma, fq. 409).

Në metodën e ndarjes së mostrës mëdysh aplikohet analiza e korrelacionit kanonik
për secilën nën-mostër veç e veç. Korrelacionet e larta (përputhshmëritë) ndërmjet
ndryshoreve kanonike në secilën nën-mostër dyshe, vlerësohen si dëshmi e stabilitetit të
koeficientëve kanonik.

Kurse në metodën e mbajtjes, parashikohen ndryshoret kanonike të mostrës së
mbajtur duke përdorur parashikimet e koeficientëve kanonik të një mostreje dhe
krahasohen ndryshoret kanonike përkatëse. Korrelacionet e forta janë dëshmi e stabilitetit
të koeficientëve.

11.7. PËRFITIMI I NDRYSHOREVE KANONIKE TË BESUESHME
Në rastet kur në të dhënat e mostrës ekziston lidhje e shumëfishtë lineare, duhet të
hulumtohet nëse kjo lidhje buron nga mostra apo nga popullsia. Në rastet kur buron nga
popullsia, rritja e vëllimit të mostrës ose zgjedhja e një mostreje të re nga popullsia nuk do
të zgjedh problemin sepse problemi do të vazhdojë edhe në mostrat e tjera që do të nxirren
nga popullsia. Mirëpo, në rastet kur problemi i lidhjes së shumëfishtë lineare buron nga
mostra, atëherë zgjedhja e një mostreje të re apo rritja e vëllimit të mostrës mund të zgjedh
problemin.

Për të përfituar ndryshore kanonike më të besueshme, këto strategji mund të
specifikohen për aplikim, me përjashtim të metodave të vlefshmërisë së jashtme të cekura
më lartë (Stevens, fq. 444-445). Në rastet kur ekziston numër i madh i ndryshoreve në çdo
set ndryshoresh mund të aplikohet analiza e komponentëve themelorë mbi çdo set
ndryshoresh. Në këtë mënyrë, analiza e korrelacionit kanonik mund të aplikohet mbi një
set të dhënadh që nuk bart problemin e lidhjes së shumëfishtë lineare, gjë e cila vështirëson
interpretimin e ndryshoreve kanonike dhe që ka një normë [n / (p + k)] numri të
ndryshoreve n/totale më të mëdha duke përdorur komponentët të cilët janë të pavarur nga
njëri tjetri (ose komponentët e rrotulluar) dhe që bartin një pjesë të rëndësishme të
variancës në vend të ndryshoreve origjinale.

Strategjia tjetër mund të aplikohet në rastet kur numri i ndryshoreve n/totale është
i vlefshëm në nivel mesatar. Në këtë rast, duke zgjedhur setet më të rëndësishme të çdo dy
ndryshoreve, mund të përfitohet numri i normës më të përshtatshme të ndryshores
n/totale.

Në fund, një mënyrë tjetër për të mënjanuar problemin e lidhjes së shumëfishtë
lineare, është përdorimi i teknikës së regresionit kanonik ridge, ashtu në si analizën e

296
korrelacionit. Me këtë qasje koeficientët bëhen të njëanshëm, por mund të bëhen
interpretime më të përshtatshme për shkak që varianca e koeficientëve është më e vogël.
Hulumtimet Monte Carlo (Anderson dhe Carney, 1974; Barcikowski dhe Stevens, 1975) të
cilat kanë hulumtuar ndikimin e rezultateve të përfituara me teknikën e regresionit
kanonik ridge, kanë treguar se me këtë teknikë janë siguruar koeficientët e korrelacionit
ndërmjet ndryshoreve dhe ndryshoreve kanonike dhe rezultatet e përfituara kanë treguar
koeficientë më stabil kanonik.

297
298
12. MODELI I REGRESIONIT TË SHUMËFISHTË LINEAR
Modeli i regresionit të thjeshtë linear mund të jetë i përshtatshëm për shumë
situata, por në jetën reale për të shpjeguar shumë modele, mund të ketë nevojë për dy apo
më shumë ndryshore shpjeguese. Modelet me më shumë se një ndryshore shpjeguese
quhen modeli i regresionit të shumëfishtë linear.

12.1. MODELI
Modeli i Regresionit të Thjeshtë Linear: y = β0 + β1x + ε,

Modeli i Regresionit të Shumëfishtë Linear: y = β0 + β1x1 + ... + β1x1 + ε

Y ndryshorja e varur

Xi ndryshorja e pavarur

βi parametra e vlerësuar

ε gabimi i rastësishëm

ε shpreh se modeli është stokastik dhe përfshin vlerat të cilat nuk janë të përfshira
në model. Në të njëjtë kohë, pasqyron gabimin e rastësishëm gjatë spercifikimit të ndikimit
në model.

Supozimet e modelit të regresionit të shumëfishtë linear janë si më poshtë:

1. Shpërndarja normale.
2. Lineariteti.
3. Mesatarja e gabimit të rastësishëm ëshët zero.
4. Variancë konstante.
5. Mosekzistimi i autokorrelacionit.
6. Mosekzistimi i lidhjeve të shumta ndërmjet ndryshoreve të pavarura.

12.2. TESTIMI I HIPOTEZAVE NË MODELIN E REGRESIONIT
TË SHUMËFISHTË LINEAR
Teksa hipoteza H0 në modelin e regresionit të shumëfishtë linear krijohet në formën
se të gjithë koeficientët e regresionit janë të barabartë me zero (H0: β1 = β2 = ... = βp = 0),
hipoteza HA krijohet në formën se së paku një βi është e ndryshme nga zero. Për të testuar
statistikisht rëndësinë e parametrave veç e veç përdoret testi t dhe për të testuar modelin
se a është i rëndësishëm si i tërë, përdoret testi F.

299
12.3. KOEFICIENTI I PËRCAKTIMIT
Koeficienti i determinimit (R2) tregon se sa përqind e ndryshores së varur
shpjegohet nga ndryshorja e pavarur e përfshirë në model. Vetëm se ajo çfarë duhet të
kihet kujdes në modelin e regresionit të shumëfishtë është se koeficienti i përcaktimit rritet
me rritjen e numrit të ndryshoreve të përfshira në model. Në raste të këtilla, duhet të
kontrollohet koeficienti i rregulluar i përcaktimit (Adjusted R2).

12.4. ZGJEDHJA E NDRYSHOREVE TË MODELIT

Lidhja ndërmjet ndryshores së pavarur dhe ndryshores së varur mund të
shpjegohet më mirë me rritjen e numrit të ndryshoreve. Mirëpo, për arsye se rritja e numrit
të ndryshoreve kërkon matje shtesë, është një punë e vështirë dhe e kushtueshme. Prandaj,
qëllimi duhet të jetë që me sa më pak ndryshore të shpjegohet varianca totale.

Me rastin e shtimit në model, ekzistojnë rrugë të ndryshme për të përcaktuar apo
zgjedhur ndryshoret të cilat sigurojnë rritje të rëndësishme në shpjegimin e variancës së
ndryshores së varur. Rëndësia e zgjedhjes së ndryshoreve rritet në rastet kur ekzistojnë dy
apo më shumë ndryshore të pavarura. Metodat të cilat përdoren më së shpeshti në
zgjedhjen e ndryshoreve janë:

1. Metoda Enter
2. Funksioni i Shtimit të Ndryshoreve (Forward Selection)
3. Funksioni i Eliminimit të Ndryshoreve (Backward Selection)
4. Funksioni i Shtimit dhe Eleminimit të Ndryshoreve (Stepwise Selection)

12.4.1. METODA ENTER
Në metodën Enter, hulumtuesi i përcakton ndryshoret e pavarura të cilat e përbëjnë
modelin. Pas kësaj, vlerësohet suksesi i parashikimit të ndryshoreve të varura të modelit.
Në qoftë se një ndryshore e pavarur nuk mendohet të jetë më e rëndësishme se një tjetër,
atëherë përdoret ky model. Ashtu siç shtohet çdo ndryshore në model, ashtu vlerësohet
edhe kontributi i secilës ndryshore. Në qoftë se ndryshorja e shtuar nuk e rrit fuqinë e
parashikimit të modelit, atëherë nuk ka problem në qoftë se nxirret nga modeli.

300
12.4.2. METODA E SHTIMIT TË NDRYSHOREVE (FORWARD
SELECTION)
SPSS në metodën e përzgjedhjes Forward, i vendos me radh ndryshoret sipas fuqisë
së korrelacionit me ndryshoren e varur. Matet ndikimi i secilës ndryshore të futur në model
dhe ndryshoret të cilat nuk ndikojnë në mënyrë të konsiderueshme nxirren nga modeli.

12.4.3. FUNKSIONI I ELEMINIMIT TË NDRYSHOREVE
(BACKWARD SELECTION)
Me metodën Backward Selection, SPSS i përfshin të gjitha ndryshoret në model.
Ndryshorja e pavarur më e dobëta nxirret nga modeli dhe llogaritet përsëri regresioni. Në
qoftë se në kërë rast modeli dobësohet në mënyrë të konsiderueshme, ndryshorja e
pavarur shtohet prap në model, në qoftë se dobësia nuk është në masë të
konsiduerueshme, ndryshorja e varur largohet nga modeli. Ky proces përsëritet deri sa në
model të mbesin vetëm ndryshoret e dobishme të pavarura.

12.4.4. METODA E SHTIMIT DHE LARGIMIT TË NDRYSHOREVE
(STEPWISE SELECTION)
Me metodën Stepwise, çdo ndryshore futet me radhë në model dhe pastaj modeli
vlerësohet. Në qoftë se ndryshorja e shtuar ofron kontribut, kjo ndryshore qëndron në
model. Mirëpo, për të vlerësuar se të gjitha ndryshoret e tjera a japin kontribut në model,
bëhet testimi përsëri. Në qoftë se nuk japin kontribut në masë të konsiderueshme, nxirren
nga modeli. Në këtë mënyrë, me ndihmën e sa më pak ndryshoreve bëhet shpjegimi i
modelit.

12.5. SHEMBULL APLIKIMI
Të supozojmë se një firmë dëshiron të zbulojë se çfarë ndikimi kanë shpenzimet e
reklamës dhe ndryshimi i çmimit të produktit në të ardhurat totale. Për këtë qëllim, më
poshtë në tabelën 13.1 është dhënë seti i të dhënave në lidhje me të dhënat totale javore,
shpenzimet e reklamës dhe çmimet e produktit. Me rritjen e shpenzimeve të reklamës, në
çfarë masen rriten të ardhurat totale apo të ardhurat totale, në çfarë niveli janë të
ndjeshme ndaj ndryshimit të çmimeve?

Në këtë situatë, modeli mund të shprehet si më poshtë.

Të ardhurat = α0 + β1 (reklama) + β2 (çmimi) + e

301
Tabela 12.1: Të Dhënat e Shembullit

NO TË ÇMIMI REKLAMA NO TË ÇMIMI REKLAMA
ARDHURAT ARDHURAT
1 123,10 1,92 12,40 27 124,20 2,12 8,80
2 124,30 2,15 9,90 28 98,40 2,13 3,20
3 89,30 1,67 2,40 29 114,80 1,89 5,40
4 141,30 1,68 13,80 30 142,50 1,50 17,30
5 112,80 1,75 3,50 31 122,60 1,93 11,20
6 108,10 1,55 1,80 32 127,70 2,27 11,20
7 143,90 1,54 17,80 33 113,00 1,66 7,90
8 124,20 2,10 9,80 34 144,20 1,73 17,00
9 110,10 2,44 8,30 35 109,20 1,59 3,30
10 111,70 2,47 9,80 36 106,80 2,29 7,10
11 123,80 1,86 12,60 37 145,00 1,86 15,30
12 123,50 1,93 11,50 38 124,00 1,91 12,70
13 110,20 2,47 7,40 39 106,70 2,34 6,10
14 100,90 2,11 6,10 40 153,20 2,13 19,60
15 123,30 2,10 9,50 41 120,10 2,05 6,30
16 115,70 1,73 8,80 42 119,30 1,89 9,00
17 116,60 1,86 4,90 43 150,60 2,12 18,70
18 153,50 2,19 18,80 44 92,20 1,87 2,20
19 149,20 1,90 18,90 45 130,50 2,09 16,00
20 89,00 1,67 2,30 46 112,50 1,76 4,50
21 132,60 2,43 14,10 47 111,80 1,77 4,30
22 97,50 2,13 2,90 48 120,10 1,94 9,30
23 106,10 2,33 5,90 49 107,40 2,37 8,30
24 115,30 1,75 7,60 50 128,60 2,10 15,40
25 98,50 2,05 5,30 51 124,60 2,29 9,20
26 135,10 2,35 16,8 52 127,20 2,36 10,20

SHËNIM: Të dhënat janë marrë nga Griffiths dhe Judge “Undergraduate
Econometrics”, John Wiley & Sons Inc., 1997.

Pasi të futen të dhënat në SPSS, ndiqen këto faza: Analyze, Regression, Linear.

302
Hapi 1: Menyja e Regresionit të Shumëfishtë Linear

Hapi 2: Dritarja e Regresionit Linear

303
Për arsye se ndryshoret tona janë në numër të vogël, zgjedhja e metodës “Enter” do
të jetë e saktë.

Hapi 3: Pas kësaj klikohet në butonin Statistics dhe në vazhdim do të ndeshemi me
ekranin e mëposhtëm. Në këtë ekran përzgjedhen të dhënat që dëshirohet të sigurohen
duke klikuar pranë kutizave dhe pastaj klikohet butoni Continue. Për shembull, Estimates
tregon parametrat e modelit, gabimin standart në lidhje me parametrat, vlerën e
standartizuar të parametrave, vlerat e t-së dhe nivelin e rëndësisë së t-së.

Collinearity diagnostics supozon se nuk ekziston lidhje lineare ndërmjet
ndryshoreve të pavarura të modelit të regresionit të shumëfishtë. Në situatat kur ekziston
një lidhje e plotë lineare është e pamundur që të parashikohen parametrat e modelit. Në
lidhjet lineare afër të plotës, parametrat teknikisht mund të parashikohen, por rezultatet
nuk janë te besueshme. Për të hulumtuar se a ekziston një problem i këtillë, përzgjedhjet
kjo kutizë.

Confidence intervals paraqet intervalin e besueshmërisë 95% për çdo koeficient të
regresionit apo matricë të kovariancës.

Hapi 3: Dritarja e Statistikave

Me ndihmën e Model fit listohen ndryshoret e shtuara dhe të nxjerra nga modeli
dhe analizohen R e shumëfishtë, R square, adjusted R square, devijimi i parashikuar
standart dhe tabela e variancës.

304
Përzgjedhja R squared change njëjtë si përzgjedhja stepwise, është e dobishme
atëherë kur të zgjedhet ndonjë metodë statistikore. Tregon se si ndryshon fuqia e modelit
kur një ndryshore e pavarur të shtohet apo të largohet nga modeli.

Descriptives jep mesataren, devijimin standart dhe numri e vlefshëm të rasteve në
analizë.

Part and partial correlations jep korrelacionet.

Koeficienti Durbin Watson përdoret për të testuar autokorrelacionin. Vlerat
ndryshojnë prej 0 deri në 4. Vlera afër 0, tregojnë një korrelacion ekstrem pozitiv, vlerat
afër 4 tregojnë një korrelacion ekstrem negativ, vlerat afër dy-shit tregojnë se nuk ka
autokorrelacion. Vlerat e Durbin Watsonit preferohet të jenë prej 1,5 deri në 2,5.
Autokorrelacioni pozitiv nënkupton se gabimi standart i koeficientit b është shumë i vogël,
kurse autokorrelacioni negativ nënkupton se gabimi standart është shumë i madh.

Pasi të klikojmë në butonin Continue do të kthehemi te dritarja Linear Regression.
Duke klikuar në butonin Plots, etiketohen grafiqet e dëshiruara. Përsëri në fund klikohet
Continue.

Hapi 4: Dritarja e Grafiqeve

Në dritaren Plots kuptimi i vlerave të cilat mund të vendosen në boshtet x dhe y
është si më poshtë:

ZPRED: Vlerat e parashikuara të standartizuara

305
ZRESID: Mbetjet e standartizuara (residual)

DRESID: Vlerat e fshira (residual)

ADJPRED: Vlerat e parashikuara të rregulluara

STRESID: Vlerat Studentized

SDRESID: Vlerat e fshira Studentized

Duke etiketuar pjesën Histogram dhe Normal probability plot, mund të testojmë
dy supozimet e modelit të regresionit të shumëfishtë linear (supozimet e shpërndarjes së
shumëfishtë normale dhe linearitetin).

Në dritaren Linear Regression klikojmë në kutinë SAVE dhe do të hapet dritarja e
mëposhtme.

Hapi 5: Dritarja e Ruajtjes

306
Në pjesën Predicted Values mund të etiketohet një nga cilado zgjedhjet apo mund
të etiketohet zgjedhja e dëshiruar.

Unstandardized paraqet vlerën e parashikuar të modelit për ndryshoren e varur.

Standardized paraqet ndryshimin e vlerës së parashikuar nga vlera e mesatares.

Adjusted paraqet vlerën e parashikuar të rregulluar.

S.E of mean predicitions paraqet gabimin standart të vlerës së parashikuar.

Distances

Përdoret për tri pika të analizave.

Mahalanobis paraqet distancën e Mahalanobisit. Vlerat e larta të kësaj distance
tregojnë se ndryshoret e pavarura kanë një apo më shumë vlera të veçanta (outliers).

Cook’s paraqet distancën e Cookit. Tregon se vlerat e koeficientëve do të
ndryshojnë në masë të konsiderueshme në fund të rezultateve të regresionit.

Leverage Values paraqet vlerat e qendrës leverage. Mat ndikimin e
përshtatshmërisë së regresionit mbi një pikë.

Prediction Intervals

Mean llogarit kufinjtë më të ulët dhe më të lartë të mesatares së parashikuar për
intervalin e parashikuar.

Individual paraqet kufinjtë më të ulët dhe më të lartë të intervalit të parashikuar të
një vrojtimi të vetëm.

Confidence Interval (Intervali i Besueshmërisë). Vlera e vlefshme për intervalin
e mesatares dhe individual është 95%. Për ta bërë të pavlefshme këtë vlerë, jepet një vlerë
më e madhe se 0 dhe më e vogël se 100. Për shembull, 99%.

Residual (Vlerat e Mbetura)

Unstandardized paraqet dallimin ndërmjet vlerës së vrojtuar dhe asaj të
parashikuar.

Standardized paraqet hersin e vlerës së parashikuar me devijimin standart. Këto
vlera njihen si Pearson residuals, mesatarja e tyre është 0 dhe devijimi standart është 1.

Studentized mbetjet studentized.

307
Deleted paraqet dallimin ndërmjet vlerës së ndryshores së varur dhe vlerës së
parashikuar të rregulluar.

Studentized Deleted paraqet hersin ndërmjet mbetjes së fshirë dhe devijimit
standart.

Influece Statistics (Statistikat Ndikuese)

DfBeta (s) paraqet ndryshimin e krijuar në koeficientin e regresionit si rezultat i
nxjerrjes së një ndryshoreje të caktuar.

Standardized DfBeta (s) paraqet ndryshimin në vlerën Beta, pra ndryshimin në
koeficientin e regresionit si rezultat i nxjerrjes së çfarëdo ndryshoreje.

DfFit paraqet ndryshimin në vlerën e parashikuar si rezultat i nxjerrjes së një
ndryshoreje të caktuar.

Standardized DfFit paraqet ndryshimin e vlerës së parashikuar si rezultat i
nxjerrjes së çfarëdo ndryshoreje.

12.6. DALJET E SPSS-IT DHE INTERPRETIMI
Tabela 12.2: Statistikat Përshkruese

Descriptive Statistics

Mean Std. Deviation N

të_ardhurat 120.3231 16.31873 52
çmimi 2.0017 .26771 52
reklama 9.6615 5.11764 52

Tabela e parë është tabela të cilën e kemi përzgjedhur në pjesën e statistikave
descriptives. Kjo tabelë paraqet mesataren aritmetike dhe devijimin standart të
ndryshoreve që i kemi përfshirë në model.

Kurse tabela e dytë paraqet korrelacionet ndërmjet ndryshoreve. Në këtë pikë, nuk
dëshirohet që të ketë korrelacion të fortë ndërmjet ndryshoreve të pavarura sepse në këtë
rast kontributet e ndryshoreve të pavarura në model janë shumë të përafërta njëra me
tjetrën dhe qenia apo mosqenia e ndryshoreve në model nuk e ndikon fuqinë e modelit. Në
qoftë se korrelacioni ndërmjet ndryshoreve të pavarura është 0,80 apo më lartë, ky rast
tregon që ekziston problemi i lidhjeve të shumëfishta. Në këtë rast, hulumtuesi duhet që të i
nxjerr nga modeli disa ndryshore.

308
Tabela 12.3: Rezultatet e Korrelacionit
Correlations

të_ardhurat çmimi reklama

Pearson Correlation të_ardhurat 1.000 -.014 .925

çmimi -.014 1.000 .101

reklama .925 .101 1.000
Sig. (1-tailed) të_ardhurat . .461 .000
çmimi .461 . .237
reklama .000 .237 .
N të_ardhurat 52 52 52

çmimi 52 52 52
reklama 52 52 52

Tabela 12.4: Përmbledhje e Modelit
b
Model Summary

Change Statistics

R Adjusted R Std. Error of the R Square F Sig. F Durbin-
Model R Square Square Estimate Change Change df1 df2 Change Watson
a
1 .931 .867 .862 6.06961 .867 159.828 2 49 .000 2.041

a. Predictors: (Constant), reklama, çmimi
b. Dependent Variable: të_ardhurat

Tabela e përmbledhjes së modelit (Tabela 12.4) është një tabelë me rëndësi. R
Square tregon se sa % e ndryshores së varur shpjegohet nga ndryshoret e pavarura. Në
shembullin tonë, 86,7% e ndryshimit në ndryshoren e varur shpjegohet nga ndryshoret e
çmimit dhe shpenzimeve të reklamës. Kurse pjesa e mbetur prej 13,3% shpjegohet nga
ndryshoret të cilat nuk janë përfshirë në model me anë të gabimit të rastësishëm. Kur të
rritet numri i ndryshoreve të pavarura në model (ndryshoret e shtuara le të jenë çfarëdo)
rritet edhe R2. Për këtë arsye duhet të shikojmë Adjusted R2 sepse Adjusted R2 rritet vetëm
nëse ndryshore janë në lidhje me modelin. Përsëri nga tabela një test me rëndësi është testi
Durbin-Watson i cili tregon se a ekziston autokorrelacion në modelin tonë. Zakonisht,
vlerat e testit Durbin Watson ndërmjet 1,5 – 2,5 tregojnë se nuk ekziston autokorrelacion.

309
Tabela 12.5: Tabela e Analizës së Variancës

a
ANOVA

Model Sum of Squares df Mean Square F Sig.
b
1 Regression 11776.184 2 5888.092 159.828 .000

Residual 1805.168 49 36.840

Total 13581.352 51

a. Dependent Variable: të_ardhurat
b. Predictors: (Constant), reklama, çmimi

Tabela e ANOVA-së është e dobishme për të testuar rëndësinë e modelit si të tërë.
Vlera e F-së në tabelë prej 159,828, tregon se modeli jonë është i rëndësishëm në çdo nivel
si i tërë (Sig. = ,000).

Tabela 12.6: Tabela e Koeficientëve

Në tabelën 6, janë të shfaqura vlerat e parametrave të rezultateve të parashikuara të
modelit dhe vlerat e t-së në lidhje me këto. Vlerat statistikore të parametrave mund të i
shohim për secilën ndryshore veç e veç se janë të rëndësishmë (në nivelin e rëndësisë 5%).
Më lartë teksa bëmë fjalë për vlerën e F-së e cila përdorej për të testuar rëndësinë e modelit
si të tërë, statistika e t-së përdoret për të testuar rëndësinë e ndryshoreve veç e veç.

Siç shihet nga tabela, vlera konstante është gjetur për 104,786. Kuptimi i kësaj është
se edhe në qoftë se shpenzimet e çmimit dhe të reklamës do të jenë zero, firma do të
përfitojë një të ardhur prej 104,79 njësish. Parametri i çmimit është −6,642. Rritja e një
njësie në çmim do të zvogëlojë të ardhurat totale për 6,642 njësi. Ndryshe nga kjo, rritja e
një njësie në shpenzimet e reklamës do të rrisë të ardhurat totale për 2,98 njësi.

Statistika tjera me rëndësi nga tabela, të etiketuara nga pjesa collinearity diagnostics
nga dritarja “STATISTICS” janë vlerat e tolerancës dhe VIF të cilat tregojnë se a ekziston

310
problemi i lidhjeve të shumëfishta. Vlerat e ulëta të tolerancës dhe vlerat e larta VIF
tregojnë se ekzistojnë lidhje të shumëfishta ndërmjet ndryshoreve të pavarura.

Nga tabela në pjesën standardized coeffiecients Beta tregon rendin e rëndësisë së
ndryshoreve të pavarura. (Mos e merrni në konsideratë shenjën e Beta-së.) Ndryshorja me
vlerën më të lartë të Beta-së është ndryshorja më e rëndësishme e pavarur.

Pasi të jenë parashikuar parametrat e modelit, vlerat e parashikuara të ndryshores
së varur dhe vlerat e gabimit të rastësishëm mund të i llogarisim edhe në SPSS. Në figurën e
mëposhtme, në fund të analizës janë shtuar vlerat e parashikuara të ndryshores së varur,
vlerat e standartizuara dhe vlerat e rregulluara në setin e të dhënave. Në këtë mënyrë
ofrohet mundësia për të i krahasuar vlerat e vrojtuara dhe vlerat e realizuara. Për
shembull, teksa vlera e vrojtuar e të ardhurave totale në javën e parë është 123,10, vlera e
parashikuar e të ardhurave totale është gjetur për 129,03. Kurse dallimin ndërmjet vlerës
së vrojtuar dhe vlerës së realizuar e jep gabimi i rastësishëm.

Figura 12.1: Vlerat e Parashikuara, Standardizuara dhe Rregulluara

Ndryshorja e varur Vlerat e parashikuara e rregulluar Vlerat e parashikuara
të standardizuara

311
312
13. ANALIZA E REGRESIONIT LOGJISTIK

13.1. HYRJE
Në një model me shumë ndryshore ku bëhet ndarja e ndryshores së varur dhe
ndryshores së pavarur, parashikimet e përfituara me teknikën e Katrorëve më të Vegjël
(KMTV) janë të pamjaftueshme në rastin kur ndryshorja e varur është një ndryshore e
matjes nominale. Me një shprehje tjetër, variancat e parashikuara nuk janë më minimale
sepse teknika KMTV supozon se ndryshorja e varur ndjek shpërndarjen normale. Kurse kur
ndryshorja e varur është me matës nominal, ky supozim nuk sigurohet.

Nëse ndryshorja e varur në një model të varur është me matje nominale, ndër
teknikat të cilat mund të përdoren si alternativë e teknikës KMTV janë analiza
diskriminuese dhe modeli i regresionit logjistik.

Në një model diskriminues i cili formohet nga dy grupe ose më shumë të ndryshores
së varur, parametrat e modelit llogariten në atë mënyrë që ndan më së miri grupet nga
njëri-tjetri. Mirëpo, për ndarjen e grupeve në një mënyrë më të mirë në analizën
diskriminuese, ndryshoret e pavarura duhet të ndjekin shpërndarjen normale dhe
kovariancat e ndryshoreve të pavarura duhet të jenë të barabarta për çdo nivel grupi. Për
këtë arsye, në rastin e përdorimit të ndryshores/ndryshoreve me matje nominale ose
ordinale (jometrike) ndërmjet ndryshoreve të pavarura në analizën diskriminuese nuk
sigurohen këto dy supozime. Kurse në modelin e regresionit logjistik, nuk kërkohen këto dy
supozime për ndryshoret e pavarura. Modeli i regresionit logjistik shkruhet si më poshtë.

L = ln [ ] = b0 + b1Xi + ei

Për arsye se parametrat e modelit të regresionit logjistik nuk mund të përfitohen në
mënyrë analitike, parashikohen me teknikën e Gjasave Maksimale (Maximum Likelihood =
ML) si një metodë përsëritëse.

13.2. PËRFITIMI I ANALIZËS SË REGRESIONIT LOGJISTIK ME SPSS
Për përfitimin e analizës së regresionit logjistik nga programi SPSS shkohet te
menyja Analyze  Regression  Binnary Logistic.

313
Hapi 1: Menyja e Regresionit Logjistik

 Zgjedhet një ndryshore klasifikuese me dy rezultate. Kjo ndryshore mund të jetë
numerike ose një ndryshore numerike me alfa të shkurtër.
 Zgjedhet një ndryshore e pavarur ose më shumë. Më vonë, nëse dëshirohet të
shqyrtohen ndikimet e ndërveprimeve të këtyre ndryshoreve së bashku mbi
model, pas zgjedhjes së ndryshores përkatëse zgjedhet > a*b >.
 Në qoftë se dëshirohet të formohen grupet e ndryshoreve (blocks) për analizën e
regresionit logjistik , fillimisht zgjedhen ndryshoret e dëshiruara shpjeguese
(covariates) dhe më pas klikohet Next. Ky proces vazhdohet derisa të krijohen të
gjitha blloqet.
 Zgjedhja e modelit të plotë (enter) dhe hap pas hapi (stepwise) në analizën e
regresionit logjistik bëhet nga pjesa Method. Nga këtu, me përjashtim të modelit
të plotë (enter), mund të zhvillohen në total gjashtë modele të regresionit hap
pas hapi, tre hapa përpara (Conditional, LR dhe Wald) dhe tre hapa prapa
(Conditional, LR dhe Wald).
 Në mënyrë opsionale, për zgjedhjen e njësive të ndryshoreve që dëshirohet të
përfshihen në analizë, fillimisht klikohet Select>> dhe nga këtu duke zgjedhur
një ndryshore zgjedhëse klikohet Rule.

314
Hapi 2: Dritarja e Regresionit Logjistik

Njësitë e njohura me kriteret e zgjedhjes përdoren në parashikimin e modelit. Për
shembull, në qoftë se X7 zgjedhet si ndryshore njësie, equals si kriter i zgjedhjes dhe njësia
e ndryshores së njohur merret si e barabartë me 1 (Value = 1), parashikimi i modelit
realizohet vetëm me këto njësi.

Rezultatet statistikore dhe klasifikuese jepen edhe për njësitë e zgjedhura edhe të
pazgjedhura. Ky mekanizëm i jep mundësi hulumtuesit të kontrollojë vlefshmërinë e
modelit të përfituar në rastet e ndarjes së të dhënave në dy grupe, si auditimi i të dhënave
dhe testimi i të dhënave.

Hapi 3: Dritarja e Përzgjedhjes së Njësive të Zgjedhura në Analizë

315
13.2.1. NJOHJA E NDRYSHOREVE KLASIFIKUESE (KATEGORIKE)
Në analizën e regresionit logjistik mund të bëhet njohja se si të përdoren ndryshoret
klasifikuese. Në rastin e njohjes së ndryshoreve klasifikuese në procedurën e analizës së
regresionit logjistik, pranohen si ndryshore të matjes metrike.

Covariates: Përfshin të gjitha ndryshoret e njohura në çfarëdo shtrese të kutizës së
dialogut kryesor. Në qoftë se disa nga këto ndryshore janë ndryshore alfa numerike (string)
ose klasifikuese (kategorike), atëherë këto përdoren vetëm si ndryshore klasifikuese.

Categorical Covariates: Tregon listën e ndryshoreve të njohura si ndryshore
klasifikuese. Afër simboleve të këtyre ndryshoreve paraqitet në kllapa metoda e kodimit që
do të përdoret në krahasim. Ndryshoret e njohura si alfa numerik (të paraqitura me
simbolin < përpara emërimit të ndryshoreve) marrin pjesë përpara në listën Categorical
Covariates. Ndryshoret të cilat duhet të mirren parasysh si ndryshore kategorike nga mesi
i ndryshoreve të pavarura (covariates) barten në listën Categorical Covariates.

Hapi 4: Dritarja e Njohjes së Ndryshoreve Klasifikuese

Change Constrast: Ofron mundësi për ndërrimin e metodës qe do të përdoret në
krahasim. Mund të përdoren shtatë metoda të ndryshme të krahasimit:

 Deviation: Krahason të gjitha klasat me ndikimin e përgjithshëm (overall
effects), me përjashtim të klasës referuese të ndryshores shpjeguese.

316
 Simple: Krahason të gjitha klasat me klasën referuese, me përjashtim të klasës
referuese të ndryshores shpjeguese.
 Difference: Me përjashtim të klasës së parë të ndryshores shpjeguese, krahason
të gjitha klasat me ndikimin e mesatares së klasës paraprake. Kjo metodë në
literaturë njihet edhe si metoda e krahasimit të Helmertit.
 Helmert: Krahason të gjitha klasat me ndikimin e mesatares pasuese, me
përjashtim të klasës së fundit të ndryshores shpjeguese.
 Repeated: Krahason çdo klasë me klasën pasuese, me përjashtim të klasës së
fundit të ndryshores shpjeguese.
 Polynomial: Është metoda e krahasimit polinom ortogonal (drejtë, pavarur). Në
këtë metodë, klasat pranohen si intervale të barabarta. Mund të përdoret vetëm
për ndryshoret numerike (me përjashtim të ndryshoreve alfa numerike/string).
 Indicator: Tregon nëse ka apo jo anëtarësi të klasës krahasuese. Klasa referuese
në matricën e krahasimit paraqitet me një rresht që përbëhet nga zerot.

13.2.2. RUAJTJA E NDRYSHOREVE TË REJA NË ANALIZËN E
REGRESIONIT LOGJISTIK
Rezultatet e përfituara nga regresioni logjistik, mund të ruhen si ndryshore të reja
në editimin e të dhënave.

Hapi 5: Dritarja e Ruajtjes së Ndryshoreve të Reja

317
Predicted Values (Vlerat e Parashikuara): Anëtarësia e grupit (grup
membership) dhe mundësitë (probabilities) të parashikuara me model mund të ruhen si
ndryshore në editimin e të dhënave.

Influence (Vlera Ndikuese): Mund të llogariten vlerat e distancës Cook (Cook’s
Distance), vlerat e Distancës (Leverage Value) dhe vlerat DfBeta të cilat tregojnë ndikimet e
vlerave të njësive të ndryshoreve mbi parashikime.

Residuals (Gabimet): Pesë gabime të ndrsyhme të cilat mund të përdoren në
analizat e tjera mund të ruhen si ndryshore në editimin e të dhënave. Këto gabime janë:
gabimet jostandarte (unstandardized), gabimet logit , gabimet student (studentized),
gabimet e standartizuara (standardized) dhe vlerat e devijimit (deviance).

Për statistikat dhe grafiqet për regresionin logjistik, për vlerat kritike të
probabilitetit për hyrje dhe dalje nga modeli për regresionin hap pas hapi dhe për numrin e
rrotullimeve maksimale dhe vlerave qe do të përdoren në klasifikimin e njësive ofrohen
mundësi të ndryshme të zgjedhjes.

Hapi 6: Dritarja e Zgjedhjeve

318
13.3. ANALIZA E REGRESIONIT LOGJISTIK ME NJË NDRYSHORE TË
VETME KATEGORIKE
Siç dihet në teknikën e KMTV-së lineare, mosshpërndarja normale e gabimeve dhe
mosekzistimi i probabiliteteve të parashikuara në intervalin 0-1, u hapin rrugë problemeve
të tilla, si R2 të ulët dhe varianca të ndryshme. Mirëpo, siç dihet këto nuk janë probleme që
nuk mund të zgjedhen. Për shembull, për të siguruar qëndrimin e probabiliteteve të
parashikuara në intervalin 0-1, analiza e regresionit mund të kufizohet. Po ashtu, duke
përdorur analizën e regresionit të ponderuar mund të sigurohet supozimi i variancave të
barabarta dhe normalitetit duke e rritur vëllimin e mostrës. Shqetësimi më i madh i
modelit KMTV është supozimi i marrëdhënies lineare ndërmjet ndryshores së varur dhe
ndryshoreve të pavarura. Marrëdhënieve ndërmjet ndryshoreve me marrëdhëniet
jolineare mund të shpjegohen më mirë në aplikim.

13.3.1. KONCEPTE THEMELORE
Duke shqyrtuar marrëdhënien ndërmjet gjendjes financiare (GjF) dhe madhësisë
(MA) së firmave nga ndryshoret e dhëna në Tabelën 13.1 është shpjeguar modeli i
regresionit logjistik me një ndryshore të vetme kategorike. Në Tabelën 13.2 ësht paraqitur
shpërndarja sipas ndryshoreve GjF dhe MA dhe duke e përdorur këtë tabelë janë llogaritur
probabilitetet si më poshtë:

Probabiliteti i çfarëdo firme për të mos falimentuar = P(GjF = 1) = 9/18 = 0,50.

Probabiliteti i çfarëdo firme për të falimentuar = P(GjF = 0) = 9/18 = 0,50.

Probabiliteti i çfarëdo firmë për t’u rritur = P(MA = 1) = 8/18 = 0,44.

Probabiliteti i falimentimit të një firme të madhe = P(GjF = 0 | MA = 1) = 2/8 = 0,25.

Probabiliteti i falimentimit të një firme të vogël = P(GjF = 1 | MA = 0) = 3/10 = 0,30.

Më poshtë, tri vlerat e para të probabilitetit të llogaritura sipas një ndryshoreje
quhen probabiletete margjinale, kurse dy vlerat e fundit të probabilitetit quhen
probabiliteti të kushtëzuara. Ndonjëherë, probabilitetet mund të paraqiten edhe si normë e
mundësisë (odds ratio). Për shembull, nga tabela e mëposhtme mund të llogariten normat e
mundësisë si më poshtë.

319
Tabela 13.1: Ndryshoret Përkatëse dhe Njohjet

Firma GjF MA RL FNA NL QA
1 1 1 20 15 5,0 1,5
2 1 0 35 20 8,0 1,2
3 1 1 65 15 4,0 1,5
4 1 1 50 18 5,5 1,0
5 1 1 30 25 3,0 2,0
6 1 1 25 20 9,0 0,5
7 1 0 60 40 8,0 0,5
8 1 0 70 30 7,0 0,8
9 1 1 20 15 9,0 1,5
10 0 0 85 9 2,5 0,9
11 0 0 70 5 1,0 0,8
12 0 0 90 7 0,3 0,6
13 0 0 85 8 1,5 0,7
14 0 0 95 6 0,5 0,3
15 0 1 65 4 1,5 0,8
16 0 0 70 10 2,0 0,9
17 0 1 80 9 0,6 1,2
18 0 0 70 3 1,5 1,1
GjF = Gjendja Financiare: Falimentuar (0), Jofalimentuar (1).
MA = Madhësia e Firmës: E vogël (0), E madhe (1).
RL = Raporti i Levës = Borxhi/Totali i Aktivit.
FNA = Fitimi Neto i Aktivit = Fitimi Neto/Aktivet Neto.
NL = Norma e Likuiditetit = Vlerat Qarkulluese/Borxhet Afatshkurtëra.
QA = Qarkullimi i Aktivit = Shitjet Neto/Totali i Aktivit.

Tabela 13.2: Shpërndarja e Firmave Sipas Ndryshoreve të Gjendjes Financiare dhe
Madhësisë

Gjendja Financiare Madhësia (MA)
(GjF) E Madhe (1) E Vogël (0) Totali
Jofalimentuara (1) 6 3 9
Falimentuara (0) 2 7 9
Totali 8 10 18

Norma e mundësisë së falimentimit të një firmë është NM(GjF = 1) = 9/9 = 1. Pra,
probabiliteti i falimentimit të një firme të dhënë është i barabartë me njëra-tjetrën apo
norma e mundësisë është 1/1.

320
Norma e mundësisë së mosfalimentimit të një firmë të madhe është 3 [NM(GjF = 1 |
MA = 1) = 6/2 = 3]. Kjo normë tregon se probabiliteti i mosfalimentimit të një firmë të
madhe është sa 3 herë probabiliteti i falimentimit.

Norma e mundësisë së mosfalimentimit të një firme të vogël është 0,43 [NM(GjF = 1
| MA = 0) = 3/7 = 0,43]. Kjo vlerë tregon që probabiliteti i mosfalimentimit të një firme të
vogël është sa 0,43 probabiliteti i falimentimit ose 3 firma në 7.

Normat e mundësisë (odds ratio) dhe probabilitetet (probabilities) tregojnë të
njëjtën gjë nga pikëpamje të ndryshme. Konvertimi i probabiliteteve në norma mundësie
ose në probabilitete të normave të mundësisë është gjithmonë i mundur. Përshembull;

P(GjF = 1 | MA = 1) = = = 0,75

dhe

P(GjF = 1 | MA = 1) = = = 3.

Duke marrë logaritmet natyrore të secilës palë të barazimeve NM(GjF = 1 | MA = 1)
= 6/2 = 3 dhe NM(GjF = 1 | MA = 0) = 3/7 = 0,43, arrihen rezultatet e mëposhtme:

ln[NM(GjF = 1 | MA = 1)] = ln(3) = 1,0986.

ln[NM(GjF = 1 | MA = 0)] = ln(0,43) = -0,844.

Duke i bashkuar këty dy barazime, logaritmi natyror i funksionit të mundësisë së
firmave mund të përfitohet si më poshtë:

ln[NM(GjF = 1 | MA)] = −0,844 + 1,098 MA

Në qoftë se firma në këtë barazim është e madhe, MA do të jetë =1, në qoftë se është
e vogël, MA = 0. Përveç kësaj, logaritmi natyrore i normës së mundësisë është një funksion
linear i ndryshores së pavarur (MA). Koeficienti i ndryshores së pavarur MA interpretohet
si koeficientët në analizën e regresionit. Koeficienti pozitiv tregon që me rritjen e
madhësisë rritet edhe logaritmi natyror i normës së mundësisë. Me fjalë të tjera, norma e
mundësisë së mosfalimentimit të një firme të madhe është më e lartë në krahasim me
firmat e vogla. Në përgjithësi, modeli i regresionit logjistik mund të shkruhet si më poshtë
për ndryshoren e pavarur me numër p:

ln[MA(GjF = 1 | X1, X2, X3, ..., Xp)] = B0 + B1X1 + B2X2 + ... + BpXp

ose

L = ln( ) = B0 + B1X1 + B2X2 + ... + BpXp

321
Barazia e mësipërme metrike dhe jometrike e ndryshoreve të pavarura shpreh
logaritmin natyror të normës së mundësisë si një funksion linear të ndryshoreve të
pavarura. Logaritmi natyror i normës së mundësisë njihet edhe si logit dhe në përgjithësi
njihet si regresioni i shumëfishtë logjik ose shkurtimisht modeli i regresionit logjik.
Shpjegimi i hollësishëm i modelit të dhënë më lartë, është bërë fillimisht për një model me
një ndryshore të vetme të pavarur më poshtë.

ln( ) = B0 + B1X1

ose

P=

Nëse P tregon probabilitetin e mosfalimentimit, probabiliteti i falimentimit (1-9)
mund të paraqitet si më poshtë:

1–P=

Nga këtu, mund të shkruhet barazimi i mëposhtëm:

= =

Në qoftë se merret logaritmi i të dy palëve nga barazimi i mësipërm, arrihet te
barazimi i përfituar më parë.

ln( ) = B0 + B1X1

Figura 13.1: Kurba e Regresionit Logjistik

322
Në këtë mënyrë, për modelin logit mund të shkruhen karakteristikat e mëposhtme:

Me rritjen e probabiliteteve nga zero te një, funksioni logit merr vlera ndërmjet −∞
dhe +∞.

Kur ekziston një marrëdhënie lineare ndërmjet ndryshores së varur dhe
ndryshoreve të pavarura të modelit, marrëdhënia ndërmjet probabiliteteve dhe
ndryshoreve të varura nuk është lineare.

Kurse vlerat e probabilitetit të ndryshoreve të pavarura sipas karakteristikave të
dhëna mund të llogariten me ndihmën e barazimit të mëposhtëm:

P=

Figura 13.1 paraqet marrëdhëniet ndërmjet ndryshores së pavarur (X1) dhe
probabiliteteve (P). Kur marrëdhënia ndërmjet probabiliteteve dhe ndryshores së varur
nuk është lineare, marrëdhënia ndërmjet normës së mundësisë dhe ndryshores së pavarur
është lineare. Siç mund të shihet me lehtësi nga marrëdhënia ndërmjet ndryshores së
pavarur dhe probabiliteteve, me rastin e afrimit të ndryshores së pavarur X1 afër +∞, kurba
i afrohet 1-shit, kurse me rastin e afrimit ndaj –∞, kurba i afrohet zeros. Funksioni i cili jep
marrëdhënien ndërmjet ndryshores së pavarur dhe probabiliteteve quhet funksion lidhës.

13.3.2. PËRFITIMI I ANALIZËS SË REGRESIONIT LOGJISTIK ME NJË
NDRYSHORE TË VETME KATEGORIKE NË SPSS
Në Tabelën 13.3 janë dhënë rezultatet e analizës së regresionit logjistik të përfituara
nga ndryshoret e gjendjes financiare (GjF) dhe madhësisë (MA) së 18 firmave të dhëna në
Tabelën 13.1.

13.3.2.1. Informacione në Lidhje me Modelin
Informacionet themelore në lidhje me modelin logit janë dhënë në Tabelën 13.3
(Tabela 13.3-1.1 dhe Tabela 13.3-1.2). Gjendja financiare e firmave është vlerësuar në dy
kategori (1 = jofalimentuar, 0 = falimentuar).

13.3.2.1. Vlerësimi i Përshtatshmërisë së Modelit
Analiza e regresionit logjistik përfitohet me ndryshoren e pavarur kategorike MA.
Një nga statistikat e para është statistika e cila tregon nëse modeli i përfaqëson mirë të
dhënat (Tabela 13.3-2). Hipoteza zero dhe alternative të cilat testojnë vlefshmërinë e
përgjithshme të modelit mund të shkruhen si më poshtë:

323
H0: Modeli teorik i përfaqëson mirë të dhënat.

H1: Modeli teorik nuk i përfaqëson mirë të dhënat.

Siç shihet, në mënyrë që modeli të jetë i vlefshëm duhet që të pranohet hipoteza
zero. Statistika e përdorur për këtë bazohet në metodën e Probabilitetit Maksimal (PM). Në
kontrollimin e hipotezës zero dhe alternative përdoret forma e konvertuar e statistikës L,
−2LogL.23

Në rastin kur modeli nuk i përfaqëson plotësisht të dhënat, probabiliteti (L) 1 dhe
statistika − LogL bëhen zero. Statistika − LogL tregon numrin e parametrave k në model
dhe ndjek shpërndarjen X2 me shkallë të lirisë n-k.

Llogariten dy statistika − LogL të ndryshme për modelin. E para është statistika e
modelit e cila përfshin vetëm termin konstant − LogL ( 4,954); kurse e dyta është
statistika e c ila përfshin edhe modelin e ndryshores së pavarur kategorike, − LogL
(21,215). Shkalla e lirisë së modelit që përfshin vetëm termin konstant është 17 (18-1) dhe
shkalla e lirisë së modelit që përfshin termin konstant dhe ndryshoren MA është 16 (18-2).
Vlera − LogL e modelit të ndryshores fikse dhe kategorike tregon që modeli nuk i
përfaqëson të dhënat mirë në nivelin e rëndësisë 5% (21,215), pra hipoteza zero refuzohet.

Tabela 13.3: Rezultatet e Analizës së Regresionit Logjistik me një Ndryshore të
Vetme Kategorike

(1.1) Case Processing Summary
Unweighted Cases N Percent
Selected Cases Included in Analysis 18 100.0
Missing Cases 0 .0
Total 18 100.0
Unselected Cases 0 .0
Total 18 100.0

(1.2) Dependent Variable Encoding
Original Value Internal Value
Falimentuar 0
Jofalimentuar 1

23 Në përgjithësi, për shkak që statistika L përfitohet si më e vogël se 1, kovertohet në statistikën − LogL.

324
(2) Iteration History
Iteration −2 Log likelihood Coefficients Constant MA
Step 1 1 21,234 −, 800 1,800
2 21,215 −, 847 1,943
3 21,215 −, 847 1,946
4 21,215 −, 847 1,946

(3) Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 3,739 1 , 053
Block 3,739 1 , 053
Model 3,739 1 , 053

(4) Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 21,215 , 188 , 250

(5) Contigency Table for Hosmer and Lemeshow Test
GjF = Falimentuar GjF = Jofalimentuar
Observed Expected Observed Expected Total
1 7 7,000 3 3,000 10
2 2 2,000 6 6,000 8

(6) Classification Table
The cut value Predicted
is, 500 GjF
Observed Falimentuar Jofalimentuar Percentage Correct
Step 1 GjF Falimentuar 7 2 77,8
Jofalimentuar 3 6 66,7
Overall Percentage 72,7

(7) Variables in the Equation
95% C.I. for EXP (B)
B S.E. Wald df Sig. Exp(B) LoWer Upper
Step 1 MA 1,946 1,069 3,313 1 , 069 7, 000 , 861 56, 894
Constant −, 847 , 690 1,508 1 , 220 , 429

325
(8)Probabilitetet e Parashikuara dhe Anëtarësitë e Grupeve të Firmave
No GjF Madhësia P Grupi i Parashikuar No Madhësia P Grupi i Parashikuar
1 1 1 0, 75 1 10 0 0, 30 0
2 1 0 0, 30 0 11 0 0, 30 0
3 1 1 0, 75 1 12 0 0, 30 0
4 1 1 0, 75 1 13 0 0, 30 0
5 1 1 0, 75 1 14 0 0, 30 0
6 1 1 0, 75 1 15 1 0, 75 1
7 1 0 0, 30 0 16 0 0, 30 0
8 1 0 0, 30 0 17 1 0, 75 1
9 1 1 0, 75 1 18 0 0, 30 0

Statistika − LogL përdoret në hulumtimin e kontributeve që kanë në model
ndryshoret e pavarura shtesë. Me shprehje të tjera, statistika − LogL përdoret në
kontrollimin e rëndësisë së koeficientëvë të regresionit logjistik. Hipoteza zero dhe
alternative shkruhen si më poshtë:

H0: ( ) = ( ) dhe H1: ( ≠( )

Këto hipoteza kontrollohen duke përdorur testet e dallimit X2. Dallimi statistikor
ndërmjet modeleve të termit konstant dhe ndryshores së pavarur dhe statistikës − LogL
është se modelet ndjekin shpërndarjen X2. Sipas rezultateve të përfituara, dallimi ndërmjet
statistikave − LogL të dy modeleve është shkalla e lirisë 1 (1 -16) dhe 3,739
( 4,954− 1, 15) dhe është e rëndësishme në nivelin e rëndësisë 5,3% (Tabela 13.3-3). Me
fjalë të tjera, më përfshirjen e ndryshores MA në model, ofrohet një kontribut i
rëndësishëm në parashikimin e gjendjeve financiare të firmave në nivelin 5,3%.

13.3.2.3. Parashikimi dhe Interpretimi i Parametrave
Parashikimet e parametrave të analizës së regresionit logjistik dhe statistikat tjera
përkatëse janë dhënë në Tabelën 13.3 (Tabela 13.3-7). Siç mund të shihet, vlera konstante e
modelit është −0,84 , koeficienti i ndryshores MA −1,94 dhe gabimet standarde të këtyre
parametrave janë 0,690 dhe 1,069 (Tabela 13.3-7). Në këtë mënyrë, modeli në lidhje me
gjendjen financiare (GjF) të firmave mund të shkruhet si më poshtë:

ln( ) = −0,84 + 1,94 MA ↔ = = .

326
Barazimi i mësipërm tregon që ndikimet e ndryshoreve të paravarura mbi
ndryshoren e varur janë multiplikative, pra nuk janë lineare. Me rritjen e një njësie të
ndryshores MA, mundësia e jofalimentimit të firmave rritet për 7 herë ( ). Me fjalë
të tjera, mundësia e jofalimentimit të një firme të madhe në krahasim me një firmë të vogël
është 7 herë më shumë.

Mundësia e jofalimentimit të një firme të dhënë mund të llogaritet më barazimin e
mëposhtëm, duke përdorur barazimin e mësipërm:
1
P= .
1 + -(-0,84 +1,94

Mundësia e jofalimentimit të një firmë të dhënë për MA = 1 llogaritet si më poshtë
duke përdorur barazimin e mësipërm:
1 1
P= = = 0,75.
1 + -(-0,84 +1,94 1 + -1,099

Mundësia e jofalimentimit të një firmë të dhënë për MA = 0 llogaritet si më poshtë
duke përdorur barazimin e mësipërm:
1 1
P= = 1+ 0,84 = 0,30.
1 + -(-0,84

Probabilitetet në lidhje me gjendjet e falimentimit të firmave janë përmbledhur në
Tabelën 13.3 (Tabela 13.3-8). Gabimet standarte të koeficientëve përdoren në llogaritjen e
vlerave t. Vlerat t të termit konstant dhe ndryshores BA janë −1, 8 (−0,84 /0, 90) dhe
1,820 (1,946/1,069). Statistika X2 Wald e cila teston rëndësinë e vlerës konstante dhe
ndryshores së pavarur është e barabartë me katrorin e vlerave t (Tabela 13.3-7). Siç mund
të shihet, ndryshorja konstante dhe MA nuk janë të rëndësishme në nivelin 5%. Nivelet e
rëndësisë të statistikave Wald janë dhënë në kolonën Sig. (Tabela 13.3-7).

Mirëpo, me rritjen e koeficientit të regresionit logjistik si vlerë absolute rriten në
mënyrë jonormale statistika Wald dhe gabimet standarde të parashikuara. Kjo situatë hap
rrugën e pranimit të hipotezës zero, kur në të vërtetë do të duhej që statistika Wald të dalë
e vogël dhe hipoteza zero të refuzohet. Për këtë arsye, nuk rekomandohet përdorimi i
statistikës Wald për kontrollimin e testeve të hipotezave me rritjen e koeficientëve si vlera
absolute. Në vend të kësaj, duke i shtuar apo nxjerrë ndryshoret përkatëse në model,
vlerësohen ndryshimet në statistikën − LogL.

327
13.3.2.4. Klasifikimi i Njësive
Klasifikimi i njësive fillon me llogaritjen e probabiliteteve. Probabilitetet e
parashikuara të njësive në rezultatet e analizës dhe grupi në të cilën merr pjesë çdo firmë
janë paraqitur në Tabelën 13.3-8. Probabiliteti i firmës së parë për të mosfalimentuar
llogaritet si më poshtë:
1 1
P= -(-0,84 +1,94
= = 0,75.
1+ 1 + -1,099

Probabilitet e parashikuara të mosfalimentimit për firmat e vogla është 0,30, për
firma e mëdha 0,75. Me këto vlera të probabilitetit, firmat marrin pjesë në njërën nga këto
dy grupe. Emërimi i njësive në njërën nga këto grupe bëhet sipas vlerës kritike të
supozuar.24 Në këtë mënyrë, firmat të cilat kanë probabilitetin e mosfalimentimit në më të
madh se 0,50 klasifikohen si firma të pafalimentuara, më të vogël se 0,50 klasifikohen të
falimentuara. Rezultatet e klasifikimit në rezultatet e analizës janë përmbledhur veçmas
(Tabela 13.3-6). Sipas kësaj, mund të shohim se nga 9 firmat e pafalimentuara, 6 firma janë
klasifikuar si jo të falimentuara, 3 firma të falimentuara dhe nga 9 firmat e falimentuara, 7
firma janë klasifikuar të falimentuara dhe 2 firma jo të falimentuara (Tabela 13.3-6 dhe
Tabela 13.3-8). Kështu, norma e klasifikimit të saktë për firmat e pafalimentuara është
66,7% (6/9), për firmat e falimentuara 77,8% (7/9) dhe për të gjitha firmat 72,2% (13/18)
(Tabela 13.3-6).

13.3.3 ANALIZA E REGRESIONIT LOGJISTIK DHE ANALIZA E
TABELAVE KONTINGJENTE
Siç është specifikuar edhe më parë, analiza e regresionit logjistik me një ndryshore
të vetme të pavarur kategorike mund të konvertohet në analizën e tabelave (kontigjenteve)
të klasifikimit të dyanshëm. Rezultaet e tabelës së klasifikimit të dyanshëm për ndryshoret
GjF dhe MA janë paraqitur në Tabelën 13.4.

Rezultatet e tabelës së klasifikimit të dyanshëm të dhëna në Tabelën 13.4 dhe
rezultatet e klasifikimit të analizës së regresionit logjistik të dhëna në Tabelën 13.3 shihet
se janë të njëjta (Tabela 13.3-6 dhe Tabela 13.4). Hipoteza zero dhe alternative për tabelat
e klasifikimit të dyanshëm shkruhen si më poshtë:

H0: Nuk ka marrëdhënie ndërmjet GjF-së dhe MA-së.

H1: Ekziston marrëdhënie ndërmjet GjF-së dhe MA-së.

24 Në përgjithësi, vlera kritike (cutoff value) supozohet si 0,50.

328
Matjet e bazuara në x2 tregojnë që marrëdhënia ndërmjet ndryshores GjF dhe MA
është e rëndësishme në nivelin 5,8% (Tabela 13.4-2). Siç mund të shihet, tabela e
klasifikimit të dyanshëm (madhësisë 2 x 2) mund të shqyrtohet me analizën e regresionit
logjistik. Mirëpo, është e qartë se analiza e regresionit logjistik mund të përdoret për
tabelat e klasifikimit shumë madhësish (2 x j). Pa dyshim, në rastin kur ndryshoret e
pavarura dhe të varura janë me matje nominale, përdoren metodat e analizës klasifikuese
shumë-madhësish (Shik: Freeman, 1987, fq. 151-155).

Tabela 13.4: Tabela (Kontigjentet) e Klasifikimit të Dyanshëm

Gjendja Financiare (GjF)
Falimentuar (0) Jofalimentuar (1) Total
MA 0 Count 7 3 10
% within MA 70, 0% 30, 0% 100, 0%
% within GjF 77, 8% 33, 3% 55, 6%
% of Total 38, 9% 16, 7% 55, 6%
1
Count 2 6 8
% within MA 25, 0% 75, 0% 100, 0%
% within GjF 22, 2% 66, 7% 44, 4%
% of Total 11, 1% 33, 3% 44, 4%

Total Count 18
9 9
% within MA 50, 0% 50, 0% 100, 0%
100, 0% 100, 0%
% within GjF 100, 0%
50, 0% 50, 0%
% of Total 100, 0%

Value Approx. Sig.
Nominal by Nominal Phi , 447 , 058
Cramer’s V , 447 , 058
Contigency Coefficient , 408 , 058

13.4. ANALIZA E REGRESIONIT LOGJISTIK ME NDRYSHORE TË
PAVARUR METRIKE DHE KATEGORIKE
Në këtë pjesë do të trajtohet analiza e regresionit logjistik së bashku me ndryshoret
metrike dhe jometrike. Po ashtu, edhe analiza e regresionit logjistik hap pas hapi
(stepwise) do të trajtohet këtu. Të dhënat e përdorura në shpjegim janë dhënë në Tabelën
13.5.

329
Analiza e regresionit logjistik hap pas hapi i përngjan analizës së regresionit hap pas
hapi dhe analizës diskriminuese. Siç dihet, teknika e regresionit logjistik hap pas hapi,
diskriminuese dhe ose e regresionit janë modelet më të mira që përdoren për zbulimin e
setit të ndryshores së pavarur kur ekziston problemi i lidhjeve të shumta ndërmjet
ndryshoreve të pavarura. Modelet hap pas hapi japin rezultate të besueshme në rastin kur
lidhjet e shumta lineare burojnë nga popullsia sepse në këtë rast nuk do të ndryshojnë
rezultatet e mostrave të ndryshme që mund të merren nga popullsia. Mirëpo, në rastin kur
lidhjet e shumëfishta lineare burojnë nga mostra nuk rekomandohet përdorimi i modeleve
hap pas hapi sepse rezultatet e përfituara ndryshojnë nga mostra në mostër (Sharma, 1996,
fq. 317-335). Në këtë rast, problemi duhet të zgjedhet me rritjen e vëllimit të mostrës.

Tabela 13.5: Të Dhënat e Analizës së Regresionit Logjistik të Shumëfishtë dhe
Komandat e SPSS-it

No X1 X2 X3 X4 X5 X6 No X1 X2 X3 X4 X5 X6
1 1 98 35 12 4 3 17 1 55 36 12 5 2
2 1 65 44 5 10 2 18 1 67 33 35 4 2
3 1 22 50 0 7 1 19 0 8 23 12 9 1
4 1 78 60 34 5 3 20 0 0 25 10 2 3
5 1 50 31 4 2 3 21 0 12 39 7 4 2
6 1 21 15 5 7 2 22 0 7 21 19 11 1
7 1 42 15 21 11 3 23 0 15 14 28 5 3
8 1 20 41 10 3 1 24 0 30 27 50 4 1
9 1 33 25 0 6 2 25 0 29 18 30 6 1
10 1 57 32 8 5 3 26 0 9 22 10 5 2
11 1 21 12 28 2 2 27 0 12 25 39 3 1
12 1 10 17 0 3 1 28 0 23 20 25 9 2
13 1 60 40 10 2 2 29 0 34 45 21 5 1
14 1 78 70 8 5 3 30 0 57 39 13 8 2
15 1 9 18 9 5 2 31 0 45 45 9 7 3
16 1 12 23 10 4 2 32 0 42 45 12 9 2
X1: Gjendja e Pagesës së Borxhit (1=paguar, X4: Shuma e Borxhit
0=papaguar) X5: Koha e Kaluar në Punë
X2: Gjendja e Pasurisë X6: Madhësia e Familjes
X3: Niveli i të Ardhurave
LOGISTIC REGRESSION VAR=X1
/METHOD=FSTEP (WALD) X2 X3 X4 X5 X6
/SAVE PRED COOK LEVER DFBETA RESID LRESID SRESID ZRESID DEV
/CLASSPLOT
/PRINT=GOODFIT CORR ITER (1) CI (95)
/CRITERIA PIN (.08) POUT ( .10) ITERATE (20) CUT (.5).

Komandat e SPSS-it të aplikuara në të dhënat në Tabelën 13.5 gjenden në fund të
kësaj tabele. Rezultatet e përfituara me këto komanda janë dhënë në Tabelën 13.6. Gjatë

330
interpretimit të rezultateve, numrat e titujve të dhënë në Tabelën 13.6 janë paraqitur në
qoshe në kllapa.

Në rezultatet e SPSS-it, fillimisht janë dhënë statistikat në lidhje me numrin e njësive
të përfshirë në analizën e regresionit logjistik (Tabela 13.6-1.1). Po ashtu janë paraqitur
vlerat origjinale të ndryshores së varur dhe vlerat e reja të koduara të cilat merren për bazë
në llogaritje (Tabela 13.6-1.2).

13.4.1. INFORMACIONET E MODELIT: METODA E ZGJEDHJES HAP
PAS HAPI
Në fazën e parë shtohet termi konstant në model dhe në rrotullimin e dytë të kësaj
faze rrotullimi përfundon për arsye se statistika − LogL tregon një rënie nën vlerën 0,01
dhe në fund të rrotulimit të dytë të fazës së parë, vlera e termit konstant përfitohet për
0, 51 dhe vlera e statistikës − LogL për 43,8 (Tabela 13. -2.1). Mirëpo, në një model ku
merr pjesë vetëm termi konstant, mund të klasifikohen në mënyrë të saktë vetëm njësitë e
një grupi. Si përfundim, përafërsisht 56,3% e njësive totale në fazën e parë janë klasifikuar
në mënyrë të saktë (Tabela 13.6-2.2). Në rezultatet e përfituara jepet gabimi standart i
termit konstant, statistika Wald e cila teston rëndësinë e ndryshores, niveli i rëndësisë i
statistikës Wald dhe statistika Exp (B) e cila tregon ndryshimin në normën e probabilitetit
kur rritet një ndryshore për një njësi (Tabela 13.6-2.3).

Ashtu si në modelet e tjera me shumë ndryshore, në fazën e ardhshme vendoset se
cila ndryshore do të përfshihet në model. Funksionet e zgjedhjes së ndryshoreve në
analizat e regresionit dhe diskriminuese janë të vlefshme edhe për analizën e regresionit
logjistik. Në kuptim statistikor, asnjë nga algoritmat nuk ofron garanci në sigurimin e
modelit më të mirë. Këtu qasja më e mirë pranohet zgjedhja e modelit sipas kritereve të
përshtatshme teorike, të rëndësisë dhe interpretimit ndërmjet modeleve të ndryshme të
cilat provohen. Duke i shqyrtuar statistikat e tjera të cilat përdoren si alternativë e
statistikës Wald nga ndryshoret të cilat sigurojnë kriteret e dhëna dhe që nuk gjenden në
model, në hapin e ardhshëm merret në model ndryshorja e cila ka nivelin më të lartë të
rëndësisë. Në aplikimin tonë, në hapin e parë në model përfshihet X2 me vlerë 5,781 (sig. =
0,016) (Tabela 13.6-2.4). Në fund të hapit të parë dhe të hapave të tjera, vlerat e
ndryshoreve të cilat nuk gjenden në model dhe nivelet e rëndësisë së këtyre ndryshoreve
jepen në fund të tabelës (Tabela 16.6-3.6). Në çdo fazë, vlerat statistikore totale të
ndryshoreve që nuk gjenden në model (statistikat residale të Katrorit-Ki) jepen nën vlerat e
ndryshoreve. Me statistikat residuale të Katrorit-Ki testohet hipoteza H0 e cila tregon se
koeficientët e ndryshoreve që nuk gjenden në model janë zero. Në qoftë se niveli i
rëndësisë së statistikës residuale të Katrorit-Ki është i vogël, me fjalë të tjera, në qoftë se

331
refuzohet hipoteza H0 e cila teston se të gjithë koeficientët e ndryshoreve janë zero,
vazhdohet me zgjedhjen e ndryshoreve. Në të kundërtën, pra, nëse pranohet hipoteza zero,
përfundon zgjedhja e ndryshoreve. Në qoftë se vazhdohet me zgjedhjen e ndryshoreve
përkundër kësaj, me gjasë të madhe, modeli i përfituar nuk do të përputhet me mostrat e
tjera që do të merren nga popullsia. Në rastin kur përfshihen të gjitha ndryshoret e tjera në
model, vlera e përgjithshme statistikore (overall statistics) do të jetë 14,675 dhe niveli i
rëndësisë i kësaj statistike do të jetë 0,012 (Tabela 13.6-2.4). Për arsye se niveli i rëndësisë
i statistikës së përgjithshme (overall statistics) është mjaft i vogël (0,012), kuptohet se
mund të vazhdohet me zgjedhjen e ndryshoreve.

Vlera totale reziduale e Katrorit-Ki margjinal është 12,227 (p = 1,6%) në fund të
hapit të parë, 8,644 (p = 3,4%) në fund të hapit të dytë, 6,114 (p = 4,7%) në fund të hapit të
tretë dhe 0,789 (p = 37,2%) në fund të hapit të katërt (Tabela 13.6-3.6). Përveç kësaj, në
pjesën e historisë së rrotullimit (iteration history) jepet se cila ndryshore do të përfshihet
në secilin hap (Tabela 13.6-3.1). Në fillim, përfshihet termi konstant në model, në hapin e
parë ndryshorja X2, në hapin e dytë X4, në hapin e tretë X5 dhe në hapin e katërt X3 (Tabela
13.6-3.1). Në fund të hapit të katërt, ndryshorja X6 nuk përfshihet në model sepse nuk
siguron kriterin e hyrjes (PIN = 8%) në modelin e dhënë.

Në Tabelën 13.6 janë dhënë edhe testet Omnibus të cilët testojnë rëndësinë e
parametrave të modelit në çdo hap (Tabela 13.6-3.2). Mund të vërehet se parametrat e
modeleve të përfituar në çdo hap janë të rëndësishme në nivelin e rëndësisë 5% (Tabela
13.6-3.2).

Statistikat në kolonën e Katrorit-Ki tregojnë dallimin (kontributin shtesë) ndërmjet
vlerës − LogL të hapit përkatës dhe vlerës − LogL të hapit paraprak. Për shembull, vlerat e
Katrorit-Ki të hapit (step), blokut (block) dhe modelit (model) në hapin e parë dhe të dytë
mund të llogariten si më poshtë duke përdorur statistikat − LogL të dhëna në pjesën e
historisë së rrotullimit (Tabela 13.6-3.1):

Hapi i Parë (Hapi, Bloku, Modeli) = [− LogL (Fiks)] – [− LogL (Fiks + X2)] = 43,860 –
37,393 = 6,467.

Hapi i Dytë (Hapi) = [− LogL (Fiks + X2)] – [− LogL (Fiks + X2 + X4)] = 37,393 –
31,993 = 5,400.

332
Tabela 13.6: Rezultatet e Analizës së Regresionit Logjistik Hap pas Hapi

(1)Logistic Regression

(1.1) Case Processing Summary
a
Unweighted Cases N Percent
Selected Cases Included in Analysis 32 100.0
Missing Cases 0 .0
Total 32 100.0
Unselected Cases 0 .0

Total 32 100.0

(1.2) Dependent Variable Encoding
Original Value Internal Value
Papaguar 0
Paguar 1

(2) Block 0: Beginning Block

(2.1) Iteration History
Coefficients
Iteration -2 Log likelihood Constant
Step 0 1 43.860 .250
2 43.860 .251

(2.2) Classification Tablea,b
Predicted
X1
Observed Papaguar Paguar Percentage Correct
Step 0 X1 Papaguar 0 14 .0
Paguar 0 18 100.0
Overall Percentage 56.3

(2.3) Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constant .251 .356 .497 1 .481 1.286

333
(2.4) Variables not in the Equation
Score df Sig.
Step 0 Variables X2 5.781 1 .016
X3 .671 1 .413
X4 3.998 1 .046
X5 1.753 1 .186
X6 2.032 1 .154

Overall Statistics 14.675 5 .012

(3) Block 1: Method = Forward Stepwise (Wald)

(3.1) Iteration History
Coefficients
Iteration -2 Log likelihood Constant X2 X4 X5 X3
Step 1 1 37.651 -.941 .034
2 37.396 -1.125 .042
3 37.393 -1.144 .043
Step 2 1 32.863 -.042 .035 -.060
2 32.025 -.070 .048 -.081
3 31.994 -.068 .051 -.086
4 31.993 -.067 .051 -.086

Step 3 1 30.083 1.142 .035 -.063 -.207
2 28.314 1.632 .055 -.088 -.323
3 28.129 1.874 .064 -.098 -.381
4 28.126 1.913 .065 -.100 -.391
5 28.126 1.913 .065 -.100 -.391

Step 4 1 27.343 2.226 .051 -.072 -.215 -.046
2 23.351 3.927 .092 -.118 -.385 -.086
3 22.310 5.343 .124 -.157 -.533 -.113
4 22.192 5.993 .139 -.176 -.599 -.126
5 22.190 6.094 .141 -.179 -.609 -.128
6 22.190 6.096 .1441 .-180 -.609 -.128

334
(3.2) Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 6.467 1 .011
Block 6.467 1 .011
Model 6.467 1 .011
Step 2 Step 5.400 1 .020
Block 11.867 2 .003
Model 11.867 2 .003
Step 3 Step 3.867 .049
Block 15.734 3 .001
Model 15.734 3 .001
Step 4 Step 5.937 1 .015
Block 21.670 4 .000
Model 21.670 4 .000

(3.3.) Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 37.393 .183 .245
2 31.993 .310 .415
3 28.126 .388 .521
4 22.190 .492 .659

(3.4) Classification Table
Predicted
X1
Observed Papaguar Paguar Percentage Correct
Step 1 X1 Papaguar 8 6 57.1
Paguar 7 11 61.1
Overall Percentage 59.4
Step 2 X1 Papaguar 11 3 78.6
Paguar 3 15 83.3
Overall Percentage 81.3
Step 3 X1 Papaguar 9 5 64.3
Paguar 3 15 83.3
Overall Percentage 75.0
Step 4 X1 Papaguar 12 2 85.7
Paguar 2 16 88.9
Overall Percentage 87.5

335
(3.5) Variables in the Equation
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step 1 X2 .043 .019 4.918 1 .027 1.044 1.005 1.084
Constant -1.144 .698 2.689 1 .101 .319
Step 2 X2 .051 .022 5.613 1 .018 1.052 1.009 1.098
X4 -.086 .043 4.064 1 .044 .918 .844 .998
Constant -.067 .839 .006 1 .936 .935
Step 3 X2 .065 .027 5.689 1 .017 1.067 1.012 1.125
X4 -.100 .047 4.554 1 .033 .905 .825 .992
X5 -.391 .228 2.930 1 .087 .676 .432 1.058
Constant 1.913 1.423 1.809 1 .179 6.777
Step 4 X2 .141 .055 6.547 1 .011 1.151 1.034 1.283
X3 -.128 .062 4.281 1 .039 .880 .780 .993
X4 -.180 .080 5.019 1 .025 .836 .714 .978
X5 -.609 .299 4.148 1 .042 .544 .303 .977
Constant 6.096 2.815 4.689 1 .030 444.043

(3.6) Variables not in the Equation
Score df Sig.
Step 1 Variables X3 .965 1 .326
X4 4.905 1 .027
X5 2.502 1 .114
X6 .110 1 .740
Overall Statistics 12.227 4 .016
Step 2 Variables X3 3.399 1 .065
X5 3.452 1 .063
X6 .001 1 .975
Overall Statistics 8.644 3 .034
Step 2 Variables X6 .798 1 .372
Overall Statistics .798 1 .372

Hapi i Dytë (Blok) = Hapi i Parë (Blok) + Hapi i Dytë (Hapi) = 6,467 + 5,400 = 11,867.

Hapi i Dytë (Model) = Hapi i Parë (Model) + Hapi i Dytë (Hapi) = 6,467 + 5,400 =
11,867.

Vlera e probabilitetit log (log likelihood) merr vlera ndërmjet 0 dhe 1. Kjo normë
tregon probabilitetin e parashikimit të ndryshores së varur nga ndryshoret e pavarura.
Logaritmi i numrave më të vegjël se një gjenden ndërmjet 0 dhe infinitit. Statistika LogL

336
parashikohet me algoritmën e gjasës maksimale (ML = Maximum Likelihood). Për arsye se
statistika − LogL përafërsisht ndjek shpërndarjen e Katrorit-Ki, në analizën e regresionit i
ngjan totalit të katrorëve të gabimit të analizës së regresionit. Pra, në qoftë se norma e
mundësisë është 1, statistika − LogL është e barabartë me zero. Afër marrëdhënies
ndërmjet probabiliteteve të parashikuara të cilat tregojnë se si i përfaqëson modeli të
dhënat në secilin hap dhe probabiliteteve të vërteta përmbledhen edhe statistikat − LogL
(Tabela 13.6-3.3). Gjatë shqyrtimit të këtyre statistikave, vërehet se modelet e përfituara në
hapat e mëpastajme i përfaqësojnë të dhënat më mirë. Këtë e tregojnë vlerat më të mëdha
të Cox-Snell dhe Nagelkerke R2 të cilat shprehin shkallën e marrëdhënies ndërmjet
ndryshoreve të varura dhe ndryshoreve të pavarura në modelet e regresionit logjistik dhe
statistika − LogL më e vogël (Tabela 13. -3.3). Në qoftë se modeli i përfaqëson të dhënat
në mënyrë të plotë, probabiliteti do të jetë 1 dhe statistika − LogL do të jetë zero. Për këtë
arsye, statistika − LogL më e vogël gjithmonë shpreh një model më të mirë.

13.4.2. STATISTIKAT NË LIDHJE ME TESTIN E RËNDËSISË SË
MODELIT

Statistika e Katrorit-Ki të Parë ( ): Kur në model ekziston vetëm termi
konstant, kjo tregon gabimin. Me fjalë të tjera, kur në model ekziston vetëm termi konstant,
statistika jep statistikën − LogL. Pra, statistika e Katrorit-Ki të parë është statistika
−2LogL e cila e pranon hipotezën se të gjithë koeficientët B janë zero.

Statistika −2LogL: Në përgjithësi, tregon gabimin e modelit në rastin kur shtohet
një ndryshore e pavarur në analizë. Për këtë arsye, statistika − LogL tregon rëndësinë e
variancës të pashpjeguar në ndryshoren e varur. Kjo statistikë njihet edhe si statistika hobe
e Katrorit-Ki. Të mos qenit e rëndësishme e kësaj statistike tregon gjendjen e dëshiruar në
analizën e regresionit logjistik. Në rezultatet e SPSS-it, kjo statistikë raportohet me emrin
“−2 Log Likelihood”.

Statistika e Katrorit-Ki të Modelit: Kjo statistikë, ashtu si edhe në SPSS njihet si
statistika “Hosmer and Lemeshow G”. Statistika e Katrorit-Ki të modelit, në përgjithësi,
teston modelin e regresionit logjistik. Teston hipotezën zero e cila pohon se asnjë nga
ndryshoret e pavarura nuk tregon ndonjë marrëdhënie lineare të rëndësishme me normën
e mundësisë së varur. Me fjalë të tjera, kjo statistikë kontrollon nëse të gjithë koeficientët e
tjerë logit janë të barabartë me zero, me përjashtim të termit konstant. Statistika e Katrorit-
Ki të modelit është një test i normës së probabilitetit dhe për këtë arsye llogaritet me
ndryshimin ndërmjet statistikës − LogL e cila nuk ka ndryshore të pavarur në model dhe
statistikës − LogL e cila ka ndryshore të pavarura në model. Statistika e Katrorit-Ki të
modelit ndjek shpërndarjen e Katrorit-Ki me një shkallë të lirisë të barabartë me

337
ndryshimin ndërmjet numrit të parametrave të modelit të shqyrtuar dhe parametrave të
modelit me vetëm një term konstant. Vlerat e rëndësishme të Katrorit-Ki të modelit
tregojnë gjendjen e dëshiruar në analizën e regresionit logjistik. Testi i Katrorit-Ki të
modelit i ngjan testit F në analizën e regresionit.

Katrorit-Ki Blok: Statistika e Katrorit-Ki Blok e llogaritur edhe në SPSS tregon
ndryshimin e shfaqur në statistikën e Katrorit-Ki të modelit me rastin e përfshirjes së një
ndryshoreje blok në model. Kjo statistikë, në analizën e regresionit logjistik hap pas hapi
llogaritet me emrin “Step Chi-Square”. Në qoftë se në çdo hap shtohet apo nxirret një
ndryshore e vetme, në mënyrë natyrore, statistikat blok dhe step Katrori-Ki do të jenë të
barabarta. Me rastin e përfshirjes së ndryshores së pavarur kategorike në model testohet
me statistikën blok Katrori-Ki. Në këtë rast, të gjitha ndryshoret kukulla (dummy) në lidhje
me ndryshoren kategorike përfshihen në model si blok.

13.4.3. MATJA E MARRËDHËNIES NË ANALIZËN E REGRESIONIT
LOGJISTIK
Në analizën e regresionit logjistik nuk ekziston ndonjë statistikë e cila i përngjan
statistikës R2 dhe që është e pranuar gjerësisht si në analizën e regresionit. R2 tregon
përqindjen e variancës së shpjeguar të ndryshores së varur, mirëpo varianca e ndryshores
së varur në analizën e regresionit logjistik varet nga shpërndarja probabile (shpërndarja e
frekuencave) e kësaj ndryshoreje. Me fjalë të tjera, varianca e një ndryshoreje të varur dy-
grupshe do të jetë maksimale kur frekuencat e grupeve të jenë të barabarta (50% − 50% =
0,25). Për këtë arsye, nuk është e përshtatshme të krahasohet R2 e analizës së regresionit
logjistik me R2 të analizës së regresionit. Në të njëjtën kohë, në literaturë u është dhënë
vend disa statistikave R2 për analizën e regresionit logjistik (Nagelkerke, 1991, fq. 691-
692). Më poshtë janë shpjeguar shkurtimisht vetëm statistikat R2 të cilat mund të
përfitohen me SPSS. Për statistikat e tjera të ngjashme R2, mund të shikohen burimet e
fusnotave (DeMaris, 1992; Nagelkerke, 1991, fq. 691-692; Menard, 1995, fq. 23). Këto
statistika përdoren në vlerësimin e përshtatshmërisë së modelit.

Cox dhe Snell R2: I ngjan statistikës R2 të shumëfishtë sipas bazës së probabilitetit.
Statistika më e vogël se vlera maksimale, zakonisht vlera 1, vështirëson interpretimin e saj.
Në aplikimin tonë, statistika Cox dhe Snell R2 është gjetur përafërsisht si 49,2% në hapin e
katërt (në modelin e fundit) (Tabela 13.6-3.3). Kjo normë tregon që ekziston një
marrëdhënie prej 49,2% ndërmjet ndryshores së varur dhe ndryshoreve të pavarura.

Nagelkerke R2: Statistika Cox dhe Snell R2 është zhvilluar me qëllim që të sigurojë
marrjen e vlerave ndërmjet 0 dhe 1. Statistika Nagelkerke R2 është përfituar si 66% në

338
hapin e katërt (Tabela 13.6-3.3). Kjo statistikë tregon që ekziston një marrëdhënie afërsisht
prej 66% ndërmjet ndryshores së varur dhe ndryshoreve të pavarura.

Në Tabelën 13.6 janë dhënë rezultatet e klasifikimit për secilin hap me ndihmën e
vlerës kritike 0,50 (cutoff value) dhe probabiliteteve të parashikuara (Tabela 13.6-3.4). Nga
tabela shihet se normat e klasifikimit të saktë të përgjithshëm janë 59,4% në hapin e parë,
81,3% në hapin e dytë, 75% në hapin e tretë dhe 87,5% në hapin e katërt (Tabela 13.6-3.4).
Përveç kësaj, në tabelë është dhënë edhe numri i njësive të klasifikuara gabim dhe saktë në
çdo hap (Tabela 13.6-3.4). Po ashtu, janë dhënë edhe koeficientët e ndryshoreve që marrin
pjesë në model në çdo hap, gabimet standarte të këtyre koeficientëve, statistikat Wald,
nivelet e rëndësisë (sig.), statistikat Exp (B) dhe intervalet e besueshmërisë për statistikat
Exp (B) (Tabela 13.6-3.5). Në këtë mënyrë, duke përdorur informacionet nga hapi i fundit,
modeli i regresionit logjistik mund të shkruhet si më poshtë:

L = ln = 6,096 + 0,141X2 – 0,128X3 – 0,180X4 – 0,609X5

Ose

= =

Nga barazimi i mësipërm ekziston marrëdhënie pozitive ndërmjet logaritmit të
normës së mundësisë dhe ndryshores X2, kurse ndërmjet ndryshoreve të tjera,
marrëdhënie negative. Me barazimin e sipërm arrihet vlera e kolonës Exp (B) në fazën e
katërt në Tabelën 13.6 (Tabela 13.6-3.5). Për shembull, mund të llogariten nga =
444,043, = 1,151, = 0,880, = 0,836 dhe = 0,544. Këto
statistika tregojnë se në çfarë niveli do të rritet norma e mundësisë me rritjen e një njësie
të ndryshores përkatëse, në rastin kur ndryshoret e tjera të modelit mbahen konstante. Siç
është specifikuar edhe më parë, në qoftë se koeficienti B është pozitiv tregon që do të rritet
norma e mundësisë, në qoftë se është negativ do të zvogëlohet dhe në qoftë se është zero
nuk do të ndryshojë. Në aplikimin tonë, me përjashtim të ndryshores X2, koeficientët e
ndryshoreve tjera janë me shenjë negative (Tabela 13.6-3.5). Intervalet e besueshmërisë
95% të statistikës Exp (B) në hapin e katërt mund të llogariten si më poshtë për
ndryshoren X2.

= (1,034 ↔ 1, 83).

Testet e rëndësisë së koeficientëve të regresionit logjistik për mostrat e mëdha
bëhen me statistikën Wald e cila ndjek shpërndarjen X2. Statistika Wald e një ndryshoreje
të pavarur e cila e ka shkallën e lirisë të barabartë me një është e barabartë me katrorin e
normës së gabimit standart të koeficientit të regresionit logjistik të ndryshores përkatëse.

339
Statistika Wald e ndryshoreve kategorike ndjek shpërndarjen X2 me një mungesë të numrit
të grupeve (df=G-1). Për arsye se koeficienti i regresionit logjistik të ndryshores X2 në
hapin e katërt është 0,141 dhe gabimi standart i tij 0,055, statistika Wald është 6,547
(0,141/0,055)2. Nivelet e rëndësisë së statistikave Wald janë dhënë në kolonën (sig.). Mund
të shihet se të gjithë koeficientët e regresionit logjistik në hapin e katërt janë të
rëndësishëm në nivelin e rëndësisë 5% sipas statistikës Wald.

13.4.4. VLERËSIMI I PËRSHTATSHMËRISË SË MODELIT TË
REGRESIONIT LOGJISTIK
Në statistikë është shumë e rëndësishme vlerësimi i vlefshmërisë së modelit të
zhvilluar. Në analizën e regresionit shikohet në shpërndarjen e gabimeve të ndryshme
(jostandarte, standarte, student dhe Jackknife), matjet e marrëdhënies dhe treguesit e
lidhjeve të shumëfishta (Shiko: Kleinbaum dhe të tj., 1998, fq. 181-227). Edhe në vlerësimin
e përshtatshmërisë së modelit të regresionit logjistik përdoren qasje të ngjashme. Në
vlerësimin e përshtatshmërisë së modelit, në përgjithësi shikohen dallimet standarte
ndërmjet probabiliteteve të vërteta dhe probabiliteteve të parashikuara. Më poshtë janë
shpjeguar shkurtimisht gabimet e tjera të cilat mund të llogariten me procedurën e
regresionit logjistik (Norusis dhe të tj., 1999, fq. 56-61).

13.4.4.1. Gabimet Jostandarte
Gabimet jostandarte (ei) janë të barabarta me ndryshimin ndërmjet probabiliteteve
të vërteta dhe probabiliteteve të parashikuara. Në aplikimin tonë, probabiliteti i
mosfalimentimit të firmës së dytë (P2) është 93,5% (Shiko Tabela 13.7). Kështu, gabimi
jostandart për këtë firmë është 0,0 5 (1 − 0,935 = 0,05) (Shiko Tabela 13.7). Nëse gabimet
e modelit janë me matje logite, atëherë këto gabime quhen gabime logit. Gabimet logit
llogariten me formulën e mëposhtme:

Gabimi Logit = (1 − )

Kështu, gabimi logit i njësisë së dytë në aplikimin tonë mund të llogaritet si më
poshtë (Shiko Tabela 13.7):
0,0 5
Gabimi Logit = = = 1,069.
(1 − ) 0,935 0,0 5

340
Tabela 13.7: Grafiqet e Probabilitetit Normal për Vlerat e Devijimit

Gabımet Vlerat DfBeta
n P Cook Lever e Logit Standa Devia- Fiks X2 X3 X4 X5
-age -rt nce
1 ,999 ,000 ,000 ,000 1,000 ,004 ,006 ,000 ,000 ,000 ,000 ,000
2 ,935 ,014 ,170 ,065 1,070 ,264 ,368 ,106 ,005 -,003 -,007 -,002
3 ,190 1,694 ,285 ,810 5,252 2,062 1,821 -1,737 -,042 ,064 ,001 ,225
4 ,571 1,214 ,618 ,429 1,750 ,866 1,058 -1,204 ,017 ,029 ,043 -,094
5 ,999 ,000 ,006 ,001 1,001 ,027 ,038 ,005 ,000 ,000 ,000 -,001
6 ,879 ,028 ,168 ,121 1,138 ,371 ,508 ,369 ,006 -,009 -,011 -,011
7 ,410 1,570 ,522 ,590 2,436 1,198 1,334 -,655 ,005 -,032 ,013 ,300
8 ,515 ,233 ,198 ,485 1,943 ,971 1,152 ,322 -,004 ,011 -,005 -,059
9 ,980 ,001 ,057 ,020 1,020 ,142 ,200 ,084 ,002 -,002 -,003 -,006
10 ,996 ,000 ,018 ,004 1,004 ,062 ,087 ,020 ,000 ,000 -,001 -,002
11 ,783 ,136 ,328 ,217 1,278 ,527 ,700 ,780 ,009 -,016 ,000 -,084
12 ,971 ,003 ,080 ,029 1,030 ,173 ,243 ,144 ,002 -,002 -,004 -,011
13 ,998 ,000 ,011 ,002 1,002 ,040 ,057 ,010 ,000 -,000 ,000 -,001
14 ,975 ,003 ,100 ,025 1,025 ,159 ,223 ,054 ,002 -,000 -,003 -,009
15 ,600 ,122 ,155 ,400 1,666 ,816 1,010 ,666 ,002 -,010 -,011 -,018
16 ,650 ,081 ,131 ,350 1,538 ,733 ,928 ,617 ,003 -,007 -,010 -,040
17 ,983 ,001 ,045 ,017 1,017 ,131 ,185 ,063 ,002 -,001 -,002 -,006
18 ,932 ,016 ,179 ,068 1,073 ,271 ,376 ,173 ,005 -,004 -,001 -,026
19 ,034 ,003 ,082 -,034 -1,035 -,188 -,263 ,099 ,003 -,002 -,002 -,016
20 ,473 ,304 ,253 -,473 -1,896 -,946 -1,131 -,780 ,007 -,002 ,003 -,076
21 ,292 ,091 ,181 -,292 -1,413 -,643 -,832 ,092 ,009 -,012 -,002 -,009
22 ,003 ,000 ,020 -,003 -1,003 -,058 -,081 ,017 ,000 ,000 ,000 -,002
23 ,161 ,043 ,183 -,161 -1,193 -,439 -,593 ,119 ,006 -,001 -,013 -,019
24 ,011 ,001 ,062 -,011 -1,011 -,104 -,146 ,044 ,001 -,001 -,002 -,003
25 ,240 ,085 ,213 -,240 -1,316 -,562 -,741 ,184 ,005 ,000 -,017 -,028
26 ,430 ,109 ,127 -,430 -1,753 -,868 -1,060 -,323 ,005 ,002 ,002 -,007
27 ,014 ,001 ,061 -,014 -1,015 -,120 -,170 -,047 ,001 -,001 -,002 -,003
28 ,040 ,004 ,091 -,040 -1,042 -,204 -,285 ,121 ,003 -,002 -,004 -,017
29 ,158 ,030 ,137 -,158 -1,188 -,434 -,587 ,312 ,006 -,009 -,010 -,019
30 ,876 1,163 ,142 -,876 -8,040 -2,653 -2,042 -1,160 -,046 ,032 ,055 -,058
31 ,691 ,460 ,169 -,694 -3,269 -1,506 -1,539 -,223 -,014 -,001 ,028 ,000
32 ,204 ,068 ,209 -,204 -1,257 -,507 -,676 ,504 ,007 -,010 -,005 -,065

13.4.4.2. Gabimet Standarte
Gabimet standarte përfitohen me pjesëtimin e gabimeve jostandarte (ei) me
devijimin e tyre standart. Gabimet standarte llogariten si më poshtë:

Zi = (1− )

Gabimi standart i njësisë së shtatë, llogaritet si më poshtë:
0,590
Z7 = = 1,198.
0,410 x 0,590

341
Gabimi standart i çdo njësie mund të shihet si një komponent i statistikës së
përshtatshmërisë X2. Gabimet standarte për mostrat e mëdha ndjekin shpërndarjen
normale me mesatare 0 dhe devijim standart 1.

13.4.4.3. Vlerat e Devijimit (Deviance)
Devijimi i secilës njësi, llogaritet si më poshtë. Vlerat e devijimit për firmat e
jofalimentuara llogariten si më poshtë:

Devijimi = − (Pi ) .

Vlera devijuese e njësisë së parë përfitohet si më poshtë:

Devijimi1 = − (0,999) = 0,006.

Kurse formula e cila duhet të përdoret për firmat e falimentuara është kështu:

Devijimi = − − (1 − Pi ).

Për shembull, devijimi i njësisë së fundit llogaritet si më poshtë:

Devijimi = − − (1 − 0, 04 ) = −0, .

Vlera të larta të devijimit tregojnë që modeli nuk i përfaqëson mirë të dhënat
përkatëse. Vlerat e devijimit për mostrat e mëdh përafërsisht ndjekin shpërndarjen
normale.

13.4.4.4. Vlerat e Distancës (Leverage)
I përngjan konceptit në analizën e regresionit.25 Vlerat e distancës përdoren me
qëllim të përcaktimit të njësive të cilat kanë ndikim të madh mbi vlerat e parashikuara.
Vlerat e distancës marrin vlera ndërmjet 0 (plotësisht joefektive) dhe 1 (plotësisht
efektive). Mesatarja e vlerave të distancës është e barabartë me normën p/n. P-ja, përfshirë
edhe termin konstant, tregon numrin e parametrave të parashikuar në model dhe vëllimin
e mostrës n. Në këtë mënyrë krahasohen vlerat e distancës me vlerat mesatare të distancës.
Po ashtu, në rastet kur probabiliteti i parashikuar i çfarëdo njësie është më i vogël se 10%
apo më i madh se 90%, pra, edhe nëse njësia është një njësi me ndikim, mund të llogariten
vlerat e distancës të vogla.

25Vlerat e distancës (leverage) për analizën e regresionit ose regresionit logjistik dhe vlera ekstreme (outlier)
janë dy koncepte të ndryshme dhe prandaj nuk duhet të përzihen me njëra-tjetrën.

342
13.4.4.5. Distanca Cook (Cook’s Distance)
Vlerat e distancës Cook tregojnë ndikimin e çfarëdo njësie mbi model. Distanca Cook
tregon se sa do të ndryshojnë koeficientët e regresionit logjistik me rastin e nxjerrjes së një
njësie të caktuar nga modeli. Distanca Cook llogaritet si më poshtë:

DCi = ( )
1-

Zi në formulë tregon gabimet e standartizuara, kurse hi tregon vlerën e distancës
(leverage). Siç mund të shihet me lehtësi nga formula, distanca Cook varet edhe nga gabimi
standart edhe nga vlera e distancës. Distanca Cook për njësinë e tretë në aplikimin tonë
llogaritet si më poshtë.
0, 85
DC3 = 2,0622 (1- 0, ) = 1,694.
85

13.4.4.6. Vlerat DfBeta
Statistika tjera me rëndësi të përdorura në vlerësimin e përshtatshmërisë së
analizës së regresionit logjistik janë edhe vlerat DfBeta. Vlera DfBeta tregon ndryshimin e
shfaqur në koeficientët e modelit me rastin e nxjerrjes së ndonjë njësie nga modeli. Këto
vlera për cilëndo ndryshore, përfshirë edhe termin konstant, llogariten si më poshtë. Për
shembull, në rastin e nxjerrjes së njësive i nga modeli, vlerat DfBeta për termin konstant
dhe ndryshoren e parë llogariten si më poshtë:
() () () ()
DfBeta( 0 ) = B0 − 0 DfBeta( 1 ) = B1 − 1

() ()
Në barazime shihen parametrat e llogaritur 0 0 dhe 1 me nxjerren e njësive i
nga modeli.

13.4.4.7. Metodat Grafikore
Statistikat e përshtatshmërisë të diskutuara më lartë ruhen në editimin e të dhënave
në SPSS për t’u përdorur në analizat e tjera (Shiko Tabela 13.7). Duke i përdorur statistikat
e përshtatshme nga këto, mund të përfitohen probabiliteti normal dhe grafiqet e tjera. Në
figurën 13.6 janë dhënë grafiqet probabile të vlerave të devijimit (deviance). Vlerat
devijuese shfaqin devijime të vogla nga shpërndarja normale. Kjo situatë buron nga mos-
aftësia e shpjegimit të modelit nga disa njësi.

343
Figura 13.2: Grafiqet e Probabilitetit Normal të Vlerave Devijuese
(a) Grafiku Normal Q-Q të Vlerave Devijuese (b) Grafiku Normal P-P pa Trend të Vlerave Devijuese

Në Figurën 13.2 janë dhënë grafiqet e gabimeve standarte (Figura 13.2-a) dhe
vlerave të distancës (leverage) (Figura 13.2-b) sipas renditjes së njësive. Nga grafiqet
shihet se disa nga gabimet standarte dhe vlerat e distancës qëndrojnë pak larg nga vlerat e
tjera. Kurse në Figurën 13.3 janë dhënë shembull grafiqet e vlerave DfBeta sipas renditjes
së njësive të ndryshoreve X2 dhe X3. Duke i shqyrtuar këto grafiqe, për shembull, në qoftë
se nxjerret njësia e tridhjetë nga analiza, koeficienti i ndryshores X3 do të pësoj një
ndryshim prej 0,032, në qoftë se nxjerret njësia e tretë nga analiza, koeficienti i ndryshores
X2 do të ketë një ndryshim prej −0,04 .

Figura 13.3: Grafiqet e Gabimeve Standarde dhe Vlerave të Distancës

(a) Radha e Njësive dhe Gabimet Standarte (b) Radha e Njësive dhe Vlerat e Distancës

344
Figura 13.4: Grafiqet DfBeta për Ndryshoret X2 dhe X3

(a) Radha e Njësive dhe Vlerat DfBeta (b) Radha e Njësive dhe Vlerat DfBeta

345
346
14. MODELI I REGRESIONIT PROBIT

(PROBIT REGRESSION MODELS)

14.1. HYRJE
Modelet kategorike të varura apo të cilat përbëhen prej përgjigjjeve si po-jo, i
suksesshëm-pasuksesshëm dhe që kodohen (dichotomous) me 0 dhe 1, quhen modele
ndryshoresh të varura bipolare. Për vlerësimin e këtyre modeleve përdoren qasje të
ndryshme si Probabiliteti Linear, Logit (logjistik) dhe Probit.

Analiza Probit është një model që përdoret si alternativë e regresionit logjistik
(logistic regression). Këto analiza janë të përngjashme me njëra-tjetrën dhe vlerësimet e
probabilitetit të secilës metodë janë të përafërta. Përderisa në analizën e regresionit
logjistik përdoren log odd (bastet), në analizën probit përdoret shpërndarja normale
kumulative (cumulative normal distribution).

Supozimi i analizës probit gjendet nga funksioni response Yi* = α + βXi + ui. Këtu, Xi
është ndryshore e cila mund të vrojtohet, por Yi* ndryshore e cila nuk mund të vrojtohet.
Kurse në aplikim, vlera e vrojtuar është Yi. Në qoftë se Yi>0, Yi=1, përndryshe merr vlerën
Yi=0. Këtë mund ta shprehim si më poshtë:

Në qoftë se Yi=1, α + βXi + ui > 0

Në qoftë se Yi=0, α + βXi + ui ≤ 0.

Në qoftë se për ndryshoren e standartizuar normale z, (z) e njohim si funksion të
shpërndarjes normale kumulative, pra, në qoftë se (z) = P(Z ≤ z), atëherë

P(Yi = 1) = P (ui > –α – βXi) = 1 - ( )

P(Yi = 0) = P (ui ≤ –α – βXi) = ( )

(Burimi: Ramanathan, Ramu, Introductory Econometrics with applications 4th
edition)

Në rastin kur në modelin probit gjenden më shumë se një ndryshore e
pavarur:

Pr (Y = 1 / X) = (Xβ).

347
Kjo vlerë shpreh mundësinë e ndryshores së varur (response) Y të jetë 1, kur jepet
vektori i ndryshores së pavarur X.

Këtu, është shpërndarja normale standarde e probabilitetit. Xβ quhet
rezultati apo indeksi probit dhe ndjek shpërndarjen normale. Koeficienti probit β shpreh
rritjen e devijimit standart β (standard deviation) të një njësie të vlerësuar në rezultatin
probit (në vlerën standarte z).

Funksioni log-mundësisë (log-likelihood) i modelit probit:

ln L = ln (xjb) + ln(1 (xjv)).

Këtu wj është vlera vlera peshuese e cila do të largoj ndryshueshmërinë e variancës
gabim në model.

Ekzistojnë dy arsye pse modeli logjistik është më i njohur se modeli probit;
interpretimi i normave të probabilitetit (odds rations) të koeficientëve logjistik
eksponencial dhe përdorimi i regresionit logjistik më shumë si mjet diagonstik i modelit.

Analiza probit në SPSS edhe pse është rregulluar kryesisht për përgjigjet e shumës
së dozave (dose-response) të njësive të aplikuara në eksperimentet e bëra në fushën e
mjekësisë, ajo mund të përdoret edhe për qëllime më të gjera. Analiza probit siguron
mundësi për vlerësimin e ndikimit të ndryshores së pavarur të nevojshme për të arritur në
një nivel të caktuar të ndryshores së varur (response), për shembull, mund të kërkohet
vlerësimi i shumës së dozës së ndikimit të mediave në një hulumtim. Të shqyrtojmë
shembullin e mëposhtëm në lidhje me këtë.

SHEMBULL: Me analizën probit mund të hulumtohet se sa do të ndikojë një helm i
prodhuar për insekte në milingona dhe sa duhet të jetë shuma (doza) e nevojshme e ilaçit
për t’u përdorur. Për një studim të këtillë duhet të përgatitet një eksperiment. Në këtë
eksperiment krijohen grupet e mostrave (milingonat) mbi të cilat do të aplikohen doza të
ndryshme të përzierjes së ilaçit dhe pasi të jetë aplikuar doza mbi secilin grup, ruhet numri
i secilës milingonë të ngordhur nga ndikimi i ilaçit. Me aplikimin e analizës mbi setin e
përfituar të të dhënave, ashtu siç mund të përcaktojmë fuqinë e lidhjes ndërmjet nivelit të
ngordhjes së milingonave nga doza e ilaçit, mund të përcaktojmë edhe shumën e dozës së
nevojshme për vdekjen e milingonave në një nivel të caktuar (p.sh., 95% e milingonave janë
ndikuar nga ky ilaç).

348
14.2. ANALIZA PROBIT NË SPSS
Për të aplikuar analizën probit në SPSS zgjedhet Analyze  Regression  Probit.
Pasi të hapet dritarja Probit Analysis bëhet njohja e ndryshoreve. Klikohet butoni OK dhe
kryhet analiza probit.

Fazat e aplikimit të analizës probit në programin SPSS janë si më poshtë:

Hapi 1: Menyja Filluese e Analizës Probit

349
Hapi 2: Dritarja e Analizës Probit

Response Frequency: Është ndryshorja e varur e koduar me 0 apo 1, ndryshe
quhet edhe ‘response count’.

Total Observed: Kjo ndryshore është ndryshore e cila i ka të gjitha vlerat 1. Përmes
komandës Compute e cila gjendet në alternativën Transform, mund të krijohet një
ndryshore e re e cila i ka të gjitha vlerat 1 (e barabartë me numrin e vrojtimeve). Probit
përdoret për të llogaritur nivelet e kësaj ndryshoreje të pavarur të vlerave 0 dhe 1.

Factor: Është ndryshore e pavarur kategorike. Mund të përzgjedhet sipas dëshirës.
Në qoftë se është përcaktuar një faktor, probit, nivelet faktoriale të kësaj ndryshore i merr
si të rreme (dummy) në model. Në qoftë se është njohur çfarëdo ndryshore kategorike,
përmes komandës Degine range bëhet njohja e niveleve minimale dhe maksimale të
ndryshores.

Covariate(s): Është alternativa e cila njeh ndryshoren e pavarur të vazhdueshme
(continues) e cila gjendet së paku një ndryshore e këtillë që shpjegon ndryshoren e varur
në model.

350
Transform: Mund të bëhen analiza me dryshoret e pavarura në SPSS përderisa nuk
janë të përcaktuara dhe pa u bërë ndonjë konvertim. Në qoftë se duhet të konvertohen
ndryshoret e pavarura zgjedhet njëra, natural log apo ln.

Hapi 3: Dritarja e Përzgjedhjeve

Jep frekuencat e vrojtuara dhe të
pritura për secilën situatë.

Jep nivelin potencial të medianës
për secilin nivel faktorial dhe
limitet e besueshmërisë 95%. Kjo
alternativë mund të përdoret
nëse është njohur çfarëdo faktori
dhe ekziston vetëm një ndryshore
e pavarur e vazhdueshme në
model.

Nëse është njohur çfarëdo faktori,
teston hipotezën se nivelet
faktoriale a kanë pjerrësinë
(slope) e përbashkët.

Shpreh numrin e nevojshëm maksimal të iteracioneve për përfitimin e vlerësimit në
metodën e përdorur për vlerësimin e parametrave.

14.3. KOEFICIENTËT PROBIT
Koeficientët probit, vektori β, përkojnë me koeficientët e regresionit në regresion,
kurse në regresionin logit apo logjistik përkojnë me koeficientët logit. Të gjithë paraqesin
ndikimin e koeficientëve. Zakonisht në logit dhe në probit për të dhënat e njëjta arrihen
rezultatet e njëjta, mirëpo koeficientët logit dhe probit janë të ndryshëm për nga rëndësia
dhe madhësia. Koeficientët logit për ndryshoren e njëjtë përkojnë përafërsisht sa 1.8 herë
koeficientët probit.

Koeficientët probit shprehin se sa do të krijoj ndryshim ndryshimi i një njësie (unit)
që do të bëhet në ndryshoren e pavarur nga shpërndarja normale kumulative në

351
ndryshoren e varur. Pra, koeficienti probit mat ndikimin që do të krijojë ndryshorja e
pavarur në vlerën standarte Z të ndryshores së varur.

Madhësia numerike e koeficientëve të vlerësuar probit nuk ka ndonjë rëndësi dhe
ndonjë interpretim të veçantë, koeficientët probit japin vetëm drejtimin dhe shkallën e
marrëdhënies. Vlerat e larta me shenjë pozitive shprehin ndikimin pozitiv të funksionit të
probabilitetit, kurse vlerat me shenjë negative shprehin ndikimin negativ të funksionit të
probabilitetit. Me fjalë të tjera, këta koeficientë japin fuqinë e ndikimit të marrëdhënies që
do të krijohet gjatë probabilitetit të vrojtuar të ndryshores së varur.

SHEMBULL: Në një studim është hulumtuar se a ndikojnë ndryshoret e pavarura
Arsimi (Vitet) dhe Mosha (Vitet) në mendimet e personave rreth politikës (identiteti politik
a është liberal apo jo). Për të vlerësuar mundësinë normale kumulative të të qenurit liberal
është aplikuar analiza Probit mbi setin e të dhënave dhe është përfituar modeli i vlerësuar
më poshtë. (Vlerat e vlerësuara Y, janë vlerat standarte z)

Y = −0,3349 – 0,0829 (Mosha) – 0,0216 (Arsimi)

Koeficienti i prerjes këtu −0,3349 shpreh vlerën standarte z të një personi i cili ka
ndryshoren e arsimit dhe moshës 0 (Ky koeficient jep vlerën e ndryshores së varur Y në
rastet kur ndryshorja e pavarur është 0 (zero) edhe në qoftë se nuk është kuptimplotë për
këtë pyetje). Përderisa vlera z rritet 0,00826 për një rritje të një njësie në moshë, kjo vlerë
zvogëlohet 0,0216 për çdo vit të arsimit.

Vlerat e vlerësuara probit të modelit, pra vlerat-z mund të shprehen duke përdorur
kushtet e probabilitetit. Për shembull, mundësia e të qenurit liberal e një personi, arsimi
dhe mosha e të cilit janë zero është vlera 0,3707 e cila korrespondon me shpërndarjen
normale standarte z = −0,3349. Pra, në qoftë se një person ka një karakteristikë të këtillë,
mundësia e mendimit liberal është përafërsisht 37,1%.

14.4. SHEMBULL APLIKIMI
Më poshtë në setin e të dhënave janë paraqitur ndryshorja e pranimit të 60
studentëve të huaj në një universitet dhe ndryshorja e disa karakteristikave të studentëve.
(Burimi: Ramanathan, Ramu, Introductory Econometrics With Applications, 4th edition)

1−
=
0−

GPA: Mesatarja kumulative gjatë studimeve

BIO: Pikët nga testi i pranimit në fakultetin e mjekësisë nga seksioni i biologjisë
(MCAT – Medical College Admissions Test)

352
CHEM: Pikët e MCAT nga seksioni i kimisë

PHY: Pikët e MCAT nga seksioni i fizikës

RED: Pikët e MCAT nga seksioni i leximit

PRB: Pikët e MCAT nga seksioni i problem-zgjidhje

QNT: Pikët e MCAT nga seksioni numerik

AGE: Mosha e kandidatit

GJINIA: Gjinia e kandidatit ( 1 nëse mashkull, 2 nëse femër)

Duke marrë në konsideratë ndryshoret e mësipërme dhe duke aplikuar procedurën
e analizës probit, të vlerësojmë lidhjen ndërmjet ndryshores ACCEPT (pranoj) dhe
ndryshoreve të tjera për të dhënat e dhëna më poshtë.

Tabela 14.1: Të Dhënat e Shembullit

GENDER
ACCEPT

CHEM

QNT
RED
PHY

PRB
GPA

AGE
BIO

0 3,47 10 10 10 9 10 11 22 1
1 3,80 12 10 9 6 5 6 22 0
0 3,96 10 10 9 10 8 9 22 1
1 3,02 13 10 10 8 7 7 22 0
0 2,90 10 9 8 8 7 7 21 1
1 2,78 10 10 9 6 6 7 21 0
1 3,00 13 13 11 9 9 9 23 1
0 3,00 10 9 8 8 9 7 24 0
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
1 4,00 10 14 13 13 14 12 26 0
0 2,40 9 7 8 6 6 5 24 1
0 3,88 12 11 9 8 7 7 23 0
0 2,66 9 8 11 6 5 4 23 1
1 3,67 13 12 14 13 13 13 23 0
1 2,08 7 7 6 8 6 7 22 1
0 2,78 7 10 9 7 7 6 22 0
0 2,77 5 2 3 5 4 4 22 1
0 3,91 7 5 8 5 4 4 22 0

353
Përpara se të fillohet me analizën, duhet të krijohet kolona e vrojtimeve totale të
cilat kanë vlerat 1. Kjo kolonë krijohet si më poshtë.

Hapi 1: Dritarja e Përfitimit të Kolonës së Vrojtimeve me Vlerë 1

Numeric Expression: Për kolonën total observed (vrojtimet totale) nga menyja
Transform-Compute hapet dritarja Compute Variable. Duke e emëruar ndryshoren bëhet
barazimi me 1 dhe duke klikuar butonin OK përfitohet kolona e cila i ka të gjitha vlerat 1.

354
Hapi 2: Dritarja e Analizës Probit

Më vonë, ndryshoret përkatëse barten në pjesën Covariate(s). Në hapin 3 mund të
shihet forma e bartjes së ndryshoreve.

355
Hapi 3: Dritarja e Analizës Probit

356
Hapi 4: Dritarja e Define Range

Bëhet njohja e nivelit të ndryshorëve faktorialë. Në shembullin tonë
ndryshorja gjinia (gender) është koduar si 0 për femrat dhe 1 për meshkujt.

Rezultatet e Analizës Probit për shembullin tonë janë si më poshtë:

Tabela 14.2: Rezultatet e Analizës Probit

Data Information

N of Cases

Valid 60
a
Rejected Out of Range 0
Missing 0
Number of Responses >
0
Number of Subjects
Control Group 0
GENDER 0 33
1 27

a. Cases rejected because of out of range group values.

357
**********PROBIT ANALYSIS**********
Parameter estimates converged after 30 iterations.
Optimal solution found.

Paramter Estimates (PROBIT model: (PROBIT (p)) = Intercept + BX)

Parameter Estimates

Regression
Parameter Coeff. Std. Error Coeff./S.E.
a
PROBIT age -,00051 ,08866 -,00571

bio ,16145 ,13929 1,15910 Japin vlerën e llogaritur
chem ,18408 ,14949 1,23141
standarde Z.

gpa -,12147 ,48795 -,24893

phy ,24907 ,14390 1,73091 Koeficientët e regresionit
prb -,00943 ,18683 -,05048 nuk janë të rëndësishëm
qnt -,00651 ,17715 -,03675
statistikisht sipas vlerës z.

red ,07642 ,21173 ,36095
b
Intercept 0 -5,78737 2,68521 -2,15528
Janë të rëndësishëm në 1%.
1 -5,14635 2,60340 -1,97678

a. PROBIT model: PROBIT(p) = Intercept + BX
b. Corresponds to the grouping variable GENDER.

Chi-Square Tests
a
Chi-Square df Sig.
PROBIT Pearson Goodness-of-Fit
50.332 50 .461
Test
a. Since Goodness-of-Fit Chi square is NOT significant, no heterogeneity factor
is used in the calculation of confidence limits.

-------------------------------------------

Covariance (below) and Correlation (above) Matrices of Parameters Estimates.

358
age bio chem gpa phy prb qnt red
age 0786 14311 10060 ,15152 ,16235 -,00225 ,05561 14834
bio 00177 01940 ,33603 ,16712 04728 -,02995 ,16612 10781
chem 00133 ,00700 02235 ,18537 ,28659 ,06311 01600 ,24892
gpa ,00655 ,01136 ,01352 23810 ,07291 ,14426 ,24353 ,12696
phy ,00207 00095 ,00617 ,00512 02071 ,02363 ,12046 ,15669
prb ,00004 ,00078 00176 01315 00064 ,03491 ,49465 ,53777
qnt ,00087 ,00410 00042 ,02105 ,00307 -,01637 03138 ,09054
red 00278 00318 ,00788 ,01312 ,00477 -,02127 ,00340 004483

Shpreh variancën-kovariancën dhe matricat e korrelacionit ndërmjet
ndryshoreve të vazhdueshme të pavarura (Vlerat me të zeza janë vlerat e
korrelacionit).

**********PROBIT ANALYSIS**********
Observed and Expected Frequencies

gender age Number of Observed Expected Residual Prob
subjects responses responses
0 22,00 1,0 1,0 ,553 ,447 ,55258
0 22,00 1,0 1,0 ,778 ,222 ,77784
0 21,00 1,0 1,0 ,467 ,533 ,46722
0 24,00 1,0 ,0 ,338 -,338 ,33756
0 27,00 1,0 ,0 ,034 -,034 ,03366
0 28,00 1,0 ,0 ,000 ,000 ,00002
0 24,00 1,0 1,0 ,657 ,343 ,65747
0 25,00 1,0 ,0 ,154 -,154 ,15374
0 22,00 1,0 ,0 ,290 -,290 ,28992
0 22,00 1,0 1,0 ,603 ,397 ,60272
0 22,00 1,0 ,0 ,069 -,069 ,06945
0 22,00 1,0 1,0 ,648 ,352 ,64834
0 22,00 1,0 ,0 ,917 -,917 ,91673
0 26,00 1,0 1,0 ,973 ,027 ,97299
0 23,00 1,0 ,0 ,668 -,668 ,66768
0 23,00 1,0 1,0 ,990 ,010 ,99026
0 22,00 1,0 ,0 ,311 -,311 ,31078
0 22,00 1,0 ,0 ,112 -,112 ,11210
0 28,00 1,0 1,0 ,970 ,030 ,97020
0 33,00 1,0 ,0 ,326 -,326 ,32627
0 27,00 1,0 1,0 ,543 ,457 ,54326
0 24,00 1,0 1,0 ,268 ,732 ,26804
0 22,00 1,0 1,0 ,682 ,318 ,68151
0 22,00 1,0 1,0 ,751 ,249 ,75123
0 24,00 1,0 1,0 ,677 ,323 ,67672
0 21,00 1,0 ,0 ,023 -,023 ,02307
0 26,00 1,0 ,0 ,163 -,163 ,16272
0 23,00 1,0 1,0 ,906 ,094 ,90591
0 23,00 1,0 ,0 ,007 -,007 ,00651
0 22,00 1,0 ,0 ,188 -,188 ,18795

359
0 22,00 1,0 ,0 ,086 -,086 ,08584
0 22,00 1,0 ,0 ,522 -,522 ,52245

1 22,00 1,0 ,0 ,813 -,813 ,81300
1 22,00 1,0 ,0 ,755 -,755 ,75450
1 21,00 1,0 ,0 ,600 -,600 ,60042
1 23,00 1,0 1,0 ,988 ,012 ,98789
1 26,00 1,0 1,0 ,719 ,281 ,71939
1 22,00 1,0 1,0 ,908 ,092 ,90820
1 22,00 1,0 1,0 ,868 ,132 ,86804
1 22,00 1,0 1,0 ,893 ,107 ,89338
1 23,00 1,0 ,0 ,021 -,021 ,02095
1 21,00 1,0 1,0 ,931 ,069 ,93110
1 23,00 1,0 1,0 ,768 ,232 ,76759
1 23,00 1,0 ,0 ,012 -,012 ,01233
1 24,00 1,0 ,0 ,365 -,365 ,36453
1 23,00 1,0 ,0 ,716 -,716 ,71559
1 22,00 1,0 1,0 ,162 ,838 ,16165
1 22,00 1,0 ,0 ,001 -,001 ,00057
1 23,00 1,0 1,0 ,563 ,437 ,56346
1 25,00 1,0 ,0 ,333 -,333 ,33296
1 33,00 1,0 1,0 ,858 ,142 ,85827
1 31,00 1,0 ,0 ,011 -,011 ,01138
1 24,00 1,0 ,0 ,186 -,186 ,18624
1 22,00 1,0 ,0 ,128 -,127 ,12726
1 22,00 1,0 1,0 ,663 ,337 ,66328
1 23,00 1,0 1,0 ,927 ,073 ,92703
1 21,00 1,0 1,0 ,651 ,349 ,65107
1 23,00 1,0 1,0 ,247 ,753 ,24698
1 30,00 1,0 1,0 ,999 ,001 ,99947

Siç shihet nga rezultatet e mësipërme, është bërë vlerësimi i pikave të përputhjes
për femrat (0) dhe për meshkujt (1) dhe janë përfituar vlerësimet e modelit për secilin
grup. Vlerat standarte z të parametrave të vlerësuara në model janë dhënë nga kolona
Coeff./S.E. Në vazhdim, duke shikuar cilëndo tabelë të shpërndarjes standarte normale
mund të llogariten vlerat p dhe të bëhet krahasimi me vlerën kritike të përcaktuar α.
Zakonisht vlera kritike e α-së është 1% apo 5%. Vlera e z-së e cila korrespondon me këto
vlera (në testimin e hipotezave dy drejtimshe) merr vlerat përafërsisht 2,58 dhe 1,96.
Vlerësimet e parametrave me përjashtim prej pikave të prerjes (intercept) nuk janë gjetur
të rëndësishme në nivelin 1% dhe 5% për asnjërin grup.

Për të njëjtin shembull, pa bërë ndonjë ndarje gjinore është shqyrtuar analiza probit
për marrëdhënien ndërmjet pikëve të biologjisë dhe pranimit në fakultetin e mjekësisë dhe
është vlerësuar modeli i mëposhtëm:

360
Y = −3,06647 + 0,33273 (bio)

Vlerësimet parametrike të modelit, siç është dhënë më poshtë, janë gjetur
statistikisht të rëndësishme. Koeficienti i përputhjes −3,06447 jep vlerën standarte z për
secilin kandidat i cili ka ndryshoren bio 0. Një rritje në ndryshoren bio shkakton rritjen e
një njësie për 0,33273 në vlerën-z.

Vlerat e përfituara të analizës probit, pra vlerat z, mund të shprehen duke përdorur
tabelën e shpërndarjes normale. Këto vlera janë dhënë në pjesën Observed and Expected
Frequencies, gjegjësisht në kolonën observed responses (ose prob). Për shembull,
përderisa mundësia për t’u pranuar në fakultetin e mjekësisë për një kandidat me pikë të
biologjisë bio=12 është 0,823 ose 82,3%, mundësia e një kandidati me pikë të biologjisë
bio=13 është 89,6%.

Tabela 14.3: Rezultatet e Analizës Probit
**********PROBIT ANALYSIS**********

Parameter estimates converged after 11 iterations.

Optimal solution found.

Parameter Estimates (PROBIT model (PROBIT (p)) = Intercept + BX):

Regression Coeff. Standard Error Coeff./S.E

Bio ,33273 ,09270 3,58912

Janë të rëndësishme
statistikisht.
Intercept Standard Error Intercept/S.E.

-3,06647 ,87510 -3,50414

Pearson Goodness-of-Fit Chi Square = 56,190 DF = 58 P = ,543

Since Goodness-of-Fit Chi Square is NOT significant, no heterogeneity factor is used in the calculation of confidence
limits.

------------------------------------------------------------------

361
**********PROBIT ANALYSIS**********

Observed and Expected Frequencies

bio Number of Observed Expected Residual Prob
subjects responses responses
10,00 1,0 ,0 ,603 -,603 ,60288
12,00 1,0 1,0 ,823 ,177 ,82285
10,00 1,0 ,0 ,603 -,603 ,60288
13,00 1,0 1,0 ,896 ,104 ,89595
10,00 1,0 ,0 ,603 -,603 ,60288
10,00 1,0 1,0 ,603 ,397 ,60288
13,00 1,0 1,0 ,896 ,104 ,89595
10,00 1,0 ,0 ,603 -,603 ,60288
8,00 1,0 1,0 ,343 ,657 ,34287
7,00 1,0 ,0 ,230 -,230 ,23045
2,00 1,0 ,0 ,008 -,008 ,00817
12,00 1,0 1,0 ,823 ,177 ,82285
9,00 1,0 ,0 ,471 -,471 ,47133
11,00 1,0 1,0 ,724 ,276 ,72359
9,00 1,0 ,0 ,471 -471 ,47133
12,00 1,0 1,0 ,823 177 ,82285
13,00 1,0 1,0 ,896 104 ,89598
7,00 1,0 1,0 ,230 770 ,23045
6,00 1,0 ,0 ,142 -,142 ,14229
7,00 1,0 ,0 ,230 -,230 ,23045
9,00 1,0 1,0 ,471 ,529 ,47133
9,00 1,0 1,0 ,471 ,529 ,47133
12,00 1,0 ,0 ,823 -,823 ,82285
11,00 1,0 1,0 ,724 ,276 ,72359
6,00 1,0 ,0 ,142 -,142 ,14229
10,00 1,0 1,0 ,603 ,397 ,60288
9,00 1,0 ,0 ,471 -,471 ,47133
12,00 1,0 ,0 ,823 -,823 ,82285
9,00 1,0 ,0 ,471 -,471 ,47133
13,00 1,0 1,0 ,896 ,104 ,89598
7,00 1,0 1,0 ,230 ,770 ,23045
7,00 1,0 ,0 ,230 -,230 ,23045
5,00 1,0 ,0 ,080 -,080 ,08033
7,00 1,0 ,0 ,230 -,230 ,23045
9,00 1,0 1,0 ,471 ,529 ,47133
7,00 1,0 ,0 ,230 -,230 ,23045
8,00 1,0 ,0 ,343 -,343 ,34287
10,00 1,0 1,0 ,603 ,397 ,60288
9,00 1,0 1,0 ,471 ,529 ,47133
10,00 1,0 ,0 ,603 -,603 ,60288
6,00 1,0 ,0 ,142 -,142 ,14229
8,00 1,0 1,0 ,343 ,657 ,34287
7,00 1,0 ,0 ,230 -,230 ,23045
9,00 1,0 1,0 ,471 529 ,47133

362
6,00 1,0 ,0 ,142 -142, ,14229
9,00 1,0 1,0 ,471 ,529 ,47133
7,00 1,0 1,0 ,230 ,770 ,23045
11,00 1,0 1,0 ,724 ,276 ,72359
10,00 1,0 1,0 ,603 ,397 ,60288
10,00 1,0 1,0 ,603 ,397 ,60288
11,00 1,0 1,0 ,724 ,276 ,72359
7,00 1,0 ,0 ,230 -,230 ,23045
10,00 1,0 1,0 ,603 ,397 ,60288
10,00 1,0 ,0 ,603 -,603 ,60288
14,00 1,0 1,0 ,944 ,056 ,94428
13,00 1,0 1,0 ,896 ,104 ,89598
7,00 1,0 ,0 ,230 -,230 ,23045
10,00 1,0 ,0 ,603 -,603 ,60288
6,00 1,0 ,0 ,142 -,142 ,14229
10,00 1,0 ,0 ,603 -,603 ,60288

E njëjta analizë është shqyrtuar edhe sipas grupeve të gjinisë dhe janë përfituar
rezultatet e mëposhtme:

Modeli i vlerësuar për gjininë 0, pra femrat është në formën,

Y = −3,66997 + 0,36967 (bio) dhe

modeli i vlerësuar për meshkujt,

Y = −3,09905 + 0,36967 (bio).

Vlerat z të cilat korrespondojnë me vlerësimet e parametrave të mësipërme janë të
rëndësishme statistikisht në nivelin e gabimit 1%. Në këtë rast, mundësitë e pjesëmarrjes
do të jenë të ndryshme në lidhje me dy grupet.

Përderisa koeficienti i përputhjes −3,66997 jep vlerën standarte z për kandidatët
femra të cilat kanë ndryshore BIO zero, koeficienti −3,09905 shpreh vlerën standarte z për
kandidatët meshkuj, ndryshorja BIO e të cilëve është zero. Një rritje e një njësie në
ndryshoren bio për secilin grup, shkakton një rritje njësie prej 0,36967 në vlerën z.

Në qoftë se vlerat e përfituara të modelit, pra vlerat z shprehen nga kushtet e
probabilitetit duke përdorur tabelën e shpërndarjes normale standarte (siç janë dhënë në
kolonën observed responses (ose prob) nga pjesa Observed and Expected Frequencies),
mundësitë e pranimit në fakultetin e mjekësisë, për shembull për një kandidat femër me 12
pikë nga biologjia janë 0,778 ose 77,8% dhe për të njëjtat pikë, mundësitë e pranimit për
një kandidat mashkull janë 0,090 ose 90,9%. (Rezultatet e gjetura janë përfituar nga
përkufizimet e barabarta të cilat korrespondojnë me ndryshoren e biologjisë në model për

363
meshkujt dhe femrat. Për të bërë krahasime ndërmjet niveleve të pranimit ndërmjet
meshkujve dhe femrave duhet të përfitohet një model i ri pa bërë kufizime dhe
interpretimet duhet të bëhen sipas këtyre rezultateve.)

Tabela 14.4: Rezultatet e Analizës Probit
**********PROBIT ANALYSIS**********

DATA Information

60 unweighted cases accepted.

0 cases rejected because of out-of-range group values.

0 cases rejected because of missing data.

0 cases are in the control group.

Group information.

Gender Level N of Cases Label

0 33 0

1 27 1

MODEL Information

ONLY Normal Sigmoid is requested.

---------------------------------------------------

>Warning # 13520

>All the ratios (respose count over observation count) adjusted for the specified natural response rate are out of
range. The plot is skipped.

**********PROBIT ANALYSIS**********

Parameter estimates converged after 15 iterations.

Optimal solution found.

Parameter Estimates (PROBIT model (PROBIT (p)) = Intercept + BX):

Regression Coeff. Standard Error Coeff./S.E

Bio ,3697 ,10073 3,66976

Janë të rëndësishme
statistikisht.
Intercept Standard Error Intercept/S.E. gender

-3,66997 1,01510 -3,61537 0

-3,09905 ,91046 -3,40383 1

364
Pearson Goodness-of-Fit Chi Square = 53,432 DF = 57 P = ,610

Parallelism Test Chi Square = 1,000E-08 DF = 1 P = 1,000

Since Goodness-of-Fit Chi Square is NOT significant, no heterogeneity factor is used in the calculation of confidence
limits.

**********PROBIT ANALYSIS**********

Observed and Expected Frequencies

gender bio Number of Observed Expected Residual Prob
subjects responses responses
0 12,00 1,0 1,0 ,778 ,222 ,77817
0 13,00 1,0 1,0 ,872 ,128 ,87196
0 10,00 1,0 1,0 ,511 ,489 ,51065
0 10,00 1,0 ,0 ,511 -,511 ,51065
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 2,00 1,0 ,0 ,002 -,002 ,00169
0 12,00 1,0 1,0 ,778 ,222 ,77817
0 9,00 1,0 ,0 ,366 -,366 ,36581
0 9,00 1,0 ,0 ,366 -,366 ,36581
0 13,00 1,0 1,0 ,872 ,128 ,87196
0 6,00 1,0 ,0 ,073 -,073 ,07325
0 9,00 1,0 1,0 ,366 ,634 ,36581
0 12,00 1,0 ,0 ,778 -,778 ,77817
0 10,00 1,0 1,0 ,511 ,489 ,51065
0 12,00 1,0 ,0 ,778 -,778 ,77817
0 13,00 1,0 1,0 ,872 ,128 ,87196
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 10,00 1,0 1,0 ,511 ,489 ,51065
0 10,00 1,0 ,0 ,511 -,511 ,51065
0 8,00 1,0 1,0 ,238 ,762 ,23804
0 9,00 1,0 1,0 ,366 ,634 ,36581
0 9,00 1,0 1,0 ,366 ,634 ,36581
0 11,00 1,0 1,0 ,654 ,346 ,65408
0 10,00 1,0 1,0 ,511 ,489 ,51065
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 10,00 1,0 ,0 ,511 -,511 ,51065
0 13,00 1,0 1,0 ,872 ,128 ,87196
0 7,00 1,0 ,0 ,140 -,140 ,13956
0 10,00 1,0 ,0 ,511 -,511 ,51065
0 6,00 1,0 ,0 ,073 -,073 ,07325
0 10,00 1,0 ,0 ,511 -,511 ,51065

1 10,00 1,0 ,0 ,725 -,725 ,72496

365
1 10,00 1,0 ,0 ,725 -,725 ,72496
1 10,00 1,0 ,0 ,725 -,725 ,72496
1 13,00 1,0 1,0 ,956 ,044 ,95605
1 8,00 1,0 1,0 ,444 ,556 ,44365
1 11,00 1,0 1,0 ,833 ,167 ,83330
1 12,00 1,0 1,0 ,909 ,091 ,90938
1 7,00 1,0 1,0 ,305 ,695 ,30454
1 7,00 1,0 ,0 ,305 -,305 ,30454
1 9,00 1,0 1,0 ,590 ,410 ,59016
1 11,00 1,0 1,0 ,833 ,167 ,83330
1 6,00 1,0 ,0 ,189 -,189 ,18915
1 9,00 1,0 ,0 ,590 -,590 ,59016
1 9,00 1,0 ,0 ,590 -,590 ,59016
1 7,00 1,0 1,0 ,305 ,695 ,30454
1 5,00 1,0 ,0 ,106 -,106 ,10552
1 9,00 1,0 1,0 ,590 ,410 ,59016
1 8,00 1,0 ,0 ,444 -,444 ,44365
1 9,00 1,0 1,0 ,590 ,410 ,59016
1 6,00 1,0 ,0 ,189 -,189 ,18915
1 7,00 1,0 ,0 ,305 -,305 ,30454
1 6,00 1,0 ,0 ,189 -,189 ,18915
1 7,00 1,0 1,0 ,305 ,695 ,30454
1 10,00 1,0 1,0 ,725 ,275 ,72496
1 11,00 1,0 1,0 ,833 ,167 ,83330
1 10,00 1,0 1,0 ,725 ,275 ,72496
1 14,00 1,0 1,0 ,981 ,019 ,98107

366
367
15. ANALIZA FAKTORIALE
Analiza faktoriale është një nga teknikat statistikore me shumë ndryshore e cila
përdoret gjerësisht për të reduktuar numrin e ndryshoreve që janë në lidhje me njëra
tjetrën në një numër të vogël të faktorëve të rëndësishëm dhe të pavarur nga njëri-tjetri
(Kleinbaum, Miller 1998: 601). Termi i Analizës Faktoriale përfshin teknika të ndryshme
nga njëra-tjetra, por që në të njëjtën kohë janë të lidhura ndërmjet vete. Këto teknika janë
Principal Component Analysis, Principal Factor Analysis, Image Factoring, Maximum
Likelihood Factoring, Alpha Factoring, Unweighted Least Squares Factoring, Generalized
ose Wieghted Least Squares Factoring. Metoda më e përdorur prej këtyre metodave të
analizës faktoriale në përfitimin e faktorëve është Analiza e Komponentëve Themelorë
(Principal Component Analysis – PCA). Në këtë metodë, llogaritet faktori i parë i cili e
shpjegon variancën maksimale ndërmjet ndryshoreve. Për të shpjeguar në shumë
maksimale variancën e mbetur përdoret faktori i dytë. Kjo situatë vazhdon në këtë mënyrë
(Rreth numrit të faktorëve do të jepen shpjegime në faqet e ardhshme). Pika me rëndësi
këtu është që në fund të analizës të mos ketë korrelacion ndërmjet faktorëve, me fjalë të
tjerë faktorët duhet të jenë ortogonalë.

Në analizën faktoriale nuk është i disponueshëm seti i ndryshores së varur dhe
ndryshores së pavarur, kjo e fundit e cila tenton të shpjegojë ndryshoren e varur ashtu si në
analizën e regresionit. Në analizën faktoriale duke i grumbulluar ndryshoret të cilat kanë
korrelacione të larta ndërmjet vete, kemi të bëjmë me krijimin e ndryshoreve të
përgjithshme (faktorë). Qëllimi këtu është që:

 Të zvogëlohet numri i ndryshoreve,
 Të zbulohet struktura e lidhjes së ndryshoreve, me fjalë të tjera të bëhet
klasifikimi i ndryshoreve.

15.1. FAZAT E ANALIZËS FAKTORIALE
Në analizën faktoriale ekzistojnë katër faza themelore. Këto janë: vlerësimi i
përshtatshmërisë së setit së të dhënave për analizën faktoriale, përfitimi i faktorëve,
rotacioni i faktorëve dhe emërimi i faktorëve.

15.1.1. VLERËSIMI I PËRSHTATSHMËRISË SË SETIT SË TË
DHËNAVE PËR ANALIZËN FAKTORIALE
Për të vlerësuar përshtatshmërinë e setit së të dhënave për analizën faktoriale
përdoren 3 metoda. Këto janë krijimi i matricës së korrelacioneve, testi Barlett dhe testi
Kaiser-Meyer-Olkin (KMO).

368
1. Krijimi i matricës së korrelacioneve për të gjitha ndryshoret e përdorura
në analizë: Hapi i parë për të zbuluar përshtatshmërinë e setit së të dhënave për
analizën faktoriale është shqyrtimi i koeficientëve të korrelacioneve ndërmjet
ndryshoreve. Këtu dëshirohet që të ekzistojnë korrelacione të larta ndërmjet
ndryshoreve sepse sado të larta që të janë korrelacionet ndërmjet ndryshoreve,
aq është e lartë mundësia për krijimin e faktorëve të përbashkët të ndryshoreve.
Me fjalë të tjera, ekzistimi i korrelacioneve të larta ndërmjet ndryshoreve tregon
se faktorët e përbashkët të ndryshoreve janë matur në forma të ndryshme.
Ekzistimi i korrelacioneve të dobëta ndërmjet ndryshoreve është shenjë se
ndryshoret nuk do të formojnë faktorë të përbashkët.
2. Testi Barlett (Barlett test of Sphericity): Teston mundësinë e ekzistimit të
korrelacioneve të larta së paku ndërmjet një pjese të ndryshoreve në matricën e
korrelacionit. Për të vazhduar me analizën, duhet që të refuzohet hipoteza zero
“Matrica e korrelacioneve është një matricë njësie”. Refuzimi i hipotezës zero
tregon se ekzistojnë korrelacione të larta ndërmjet ndryshoreve, me fjalë të tjera
tregon se seti i të dhënave është i përshtatshëm për analizën faktoriale (Hair dhe
të tjerët, 1998: 374).
3. Matësi i mjaftueshmërisë së mostrës Kaiser-Meyer-Olkin (KMO): Është një
indeks i cili krahason madhësinë e koeficientit të korrelacionit të vrojtuar me
madhësinë e koeficientit të korrelacionit të pjesërishëm. Niveli i KMO-së duhet të
jetë mbi 0,5. Sado i lartë jetë niveli, aq është më i mirë seti i të dhënave për të
bërë analizën faktoriale. Vlerat e KMO-së dhe interpretimet janë si më poshtë
(Sharma 1996: 116)

Vlerat e KMO-së Interpretimi
0,90 Përkryer
0,80 Shumë mirë
0,70 Mirë
0,60 Mesatare
0,50 Dobët
nën 50 Nuk pranohet

15.1.2. PËRFITIMI I FAKTORËVE
Qëllimi në këtë fazë është që të përfitohen sa më pak faktorë të cilët do të
përfaqësojnë lidhjen ndërmjet ndryshoreve në shkallë të lartë. Në lidhje se sa faktorë do të
përfitohen, ekzistojnë kritere të ndryshme (Dunteman 1989: 16):

369
1. Vlera Eigen (Eigenvalues): Statistika Eigen i pranon si të rëndësishëm faktorët
të cilat janë më të mëdhenj se 1. Faktorët më të vegjël se statistika Eigen 1 nuk
merren parasysh.
2. Testi Scree: Grafiku i testit Scree (grafiku i vijave) tregon variancën totale në
lidhje me secilin faktor. Faktorët e gjendur deri te pika e cila merrë formë
horizontale në grafik pranohen si faktorët maksimal që do të përfitohen.
3. Metoda e përqindjes së variancës totale: Nëse kontributi në shpjegimin e
variancës totale të cilitdo faktor të shtuar bie nën 5%, nënkupton që është
arritur numri maksimal i faktorëve.
4. Kriteri Joliffe: Të gjithë faktorët nën 0,7 nxirren nga modeli.
5. Kriteri i shpjegimit të variancës: Numri i cili shpjegon 90% të variancës
pranohet si i mjaftueshëm.
6. Përcaktimi i numrit të faktorëve nga ana e hulumtuesit: Vendimi i vetë
hulumtuesit rreth numrit të faktorëve.

15.1.3. ROTACIONI I FAKTORËVE
Qëllimi i rotacionit të faktorëve është që të përfitohen faktorë të cilët mund të
emërohen dhe të interpretohen. Metoda më e përdorur e rotacionit është Rotacioni
Ortogonal. Në rotacionin ortogonal, faktorët e përfituar nuk kanë korrelacione ndërmjet
vete. Kurse në korrelacionin jo ortogonal (oblique) faktorët kanë korrelacione ndërmjet
vete. Me fjalë të tjera, nuk janë të pavarur nga njëri-tjetri. Në rotacionin ortogonal përdoren
tri metoda. Këto janë varimax (metoda më e përdorur), equamax dhe quartimax. Kurse
metodat Promax dhe Direct Oblimin përdoren gjatë kryerjes së rotacionit oblique. Në
qoftë se seti i të dhënave ëshë shumë i madh preferohet rotacioni Promax.

15.1.4. EMËRIMI I FAKTORËVE
Në lidhje me emrimin e faktorëve janë dhënë informata gjatë interpretimit të të
dalurave të SPSS-it.

15.2. SHEMBULL APLIKIMI
Më poshtë janë dhënë 14 norma të cilat tregojnë gjendjen financiare të 96 firmave të
industrisë së prodhimit. Qëllimi ynë është që këto 14 ndryshore t’i reduktojmë në sa më
pak faktorë. Simbolet e 14 ndryshoreve dhe emërimi i tyre është në këtë formë:

ROA: Fitimi Neto / Totali i Aktivës PM: Fitimi Përpara Tatimit /
Kapitali
GM: Fitimi Bruto / Shitjet Neto

370
OM: Fitimi EBIT STFDTA: Borxh. Af.Shkurt. / Pas.
Tot.
NPM: Fitimi Neto / Shitjet Neto
NSE: Shitjet Neto / Totali i
NSTA: Shitjet Neto / Pasuria Totale
Kapitalit
ATR: Norma e Testit Acid
NSFA: Shitjet Neto / Pasuria Fikse
FL: Borxhet Totale / Pasuria Totale
CR: Raporti Aktual
DE: Borxhet Totale / Kapitali
CR2: Raporti i Keshit
Në programin SPSS, futen ndryshoret në data editor si më poshtë. Kolona e parë
tregon ndryshoren e parë, kolonat tjera tregojnë ndryshoret tjera me radhë.

Hapi 1: Futja e të Dhënave në SPSS

Për të kryer analizën faktoriale, shkohet tek Analyze, Dimension Reduction, Factor.

371
Hapi 2: Menyja e Analizës Faktoriale

Më vonë, siç shihet në dritaren e hapit 3, të gjitha ndryshoret barten në pjesën
Variables.

Hapi 3: Dritarja e Analizës Faktoriale

372
Hapi 4: Përzgjedhja e Ndryshoreve në Analizën Faktoriale

Siç shihet më lartë, në menynë e Analizës Faktoriale gjenden disa zgjedhje si
Descriptives, Extraction, Rotation, Scores dhe Options. Për të mund përfunduar
analizën, duhet që të etiketohen disa pjesë nga këto përzgjedhje. Kur të klikohet në butonin
Descriptives do të hapet dritarja e mëposhtme dhe nga këto përzgjidhen Initial solution,
KMO dhe Barlett’s test of sphericity dhe pastaj klikohet butoni Continue.

Hapi 5: Dritarja e Statistikave Përshkruese

373
Kur të klikohet në butonin Extraction, do të hapet dritarja e mëposhtme në hapin 6.
Siç është specifikuar në fillim të kapitullit, zgjedhim metodën e përfitimit të faktorëve
Principal componets. Pas kësaj zgjedhen me radhë Correlation matrix, Eigenvalues
over 1 (shikoni metodat e përfitimit të faktorëve), në qoftë se hulumtuesi dëshiron
përzgjedh vet numrin e faktorëve përzgjedh Number of factors (por kjo nuk preferohet),
Unrotated factor solution dhe Scree plot.

Hapi 6: Dritarja e Metodës së Përfitimit të Faktorëve

Kur të klikohet në butonin Rotation, siç shihet në hapin 7, përzgjedhen Varimax
dhe Rotated solution.

374
Hapi 7: Dritarja e Rotacionit

Duke klikuar në butonin Scores zgjedhet një nga metodat Regression, Bartlett dhe
Anderson-Rubin, e cila do ta ruaj ndryshoren si rezultat të faktorit. Kur të përzgjedhet një
nga këto metoda, mund të përfitojmë rezultate të faktorëve (factor scores) të cilat mund të
përdoren si ndryshore në analizat tjera (p.sh. Regresion i Shumëfishtë Linear apo Analiza e
Ndarjes). Rezultatet e faktorëve do të shihen si fac1_1, fac2_1, fac3_1 në faqen filluese të të
dhënave.

Hapi 8: Dritarja e Rezultateve Faktoriale

Kur të shtypet butoni Options, në qoftë se përzgjedhet Exclude cases listwise, nuk
do të mirren në konsideratë vlerat e humbura të ndryshoreve (missing values). Përzgjedhja

375
Exclude cases pairwise merr në konsideratë ndryshoret, të dhënat e të cilave janë të
plota. Kurse përzgjedhja Replace with mean, në vend të vlerave të humbura, përdor
mesataren aritmetike në lidhje me ndryshoret përkatëse. Përzgjedhja Sort by size bën
klasifikimin e ndryshoreve sipas peshës së faktorëve në matricën e rrotulluar faktoriale.

Hapi 9: Dritarja e Përzgjedhjeve

15.3. TË DALURAT E SPSS-IT DHE INTERPRETIMI PËR ANALIZËN
FAKTORIALE
Më poshtë janë paraqitur rezultatet dhe interpretimet më të rëndësishme të
analizës faktoriale.

15.3.1. VLERËSIMI I PËRSHTATSHMËRISË SË SETIT SË TË
DHËNAVE PËR ANALIZËN FAKTORIALE
Siç shihet në tabelën e mëposhtme, testi KMO është 71,3% (,713). Për arsye se
71,3>0,50, mund të themi se seti i të dhënave është i përshtatshmëm për analizën
faktoriale. Testi i dytë të cilën do të shikojmë është testi Barlett. Siç shihet nga tabela, testi
Barlett është i rëndësishëm (Sig.). Kjo do të thotë që ekzistojnë korrelacione të larta
ndërmjet ndryshoreve, me fjalë të tjera seti i të dhënave tona është i përshtatshmëm për
analizën faktoriale.

376
Tabela 15.1: Rezultatet e KMO-së dhe Testit Barlett

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .713
Bartlett's Test of Approx. Chi-Square 631.722
Sphericity df 91

Sig. .000

Për vlerësimin e përshtatshmërisë së setit së të dhënave për analizën faktoriale
mund të shikohet edhe matrica e korrelacionit. Në qoftë se koeficientët e korrelacionit
ndërmjet ndryshoreve janë 0,30 dhe më sipër, kjo tregon që do të krijohen faktorë me
probabilitet të lartë. Në qoftë se numri i ndryshoreve është i madh, atëherë interpretimi i
matricës së korrelacionit është i vështirë.

15.3.2. PËRCAKTIMI I NUMRIT TË FAKTORËVE
Ekzistojnë metoda të ndryshme për përcaktimin e numrit të faktorëve. Në
shembullin tonë ne patëm përzgjedhur statistikën Eigen e cila merr në konsideratë faktorët
më të mëdhenj se 1.

Në Tabelën 15.2, janë 4 faktorë më të mëdhenj se vlera 1 (Eigenvalues). Faktori i
parë e shpjegon 21,050% variancën totale (në kolonën e djathtë të fundit). Faktori i parë
dhe faktori i dytë së bashku e shpjegojnë variancën 39,482%. Kurse katër faktorët së
bashku e shpjegojnë variancën 70,757%.

Tabela 15.2: Numri i Faktorëve në Lidhje me Vlerën Eigen dhe Përqindja Shpjeguese e
Variancës

Initial Eigenvalues Rotation Sums of Squared Loadings
% of Cumulative % of Cumulative
Component Total Variance % Total Variance %
1 4.136 29.541 29.541 2.947 21.050 21.050
2 2.942 17.803 47.345 2.580 18.432 39.482
3 2.042 14.588 61.933 2.469 17.634 57.115
4 1.235 8.824 70.757 1.910 13.642 70.757
5 .827 5.908 76.666
6 .681 4.863 81.528
7 .636 4.543 86.071
8 .453 3.238 89.309
9 .397 2.832 92.141
10 .337 2.405 94.545
11 .283 2.022 96.567
12 .219 1.567 98.135
13 .200 1.425 99.560
14 .62 .440 100.000

377
Gjatë përcaktimit të numrit të faktorëve që do të futen në rotacion, mund të
përdoren edhe metoda të tjera përveq statistikës Eigen. Për shembull, më poshtë në
Figurën 15.1, numri i faktorëve përcaktohet deri në pikën kur vija e pjerrësisë fillon të
humb në grafik. Sipas kësaj, pas faktorit të 4-të, vija e grafikut do të fillojë të humb trendin
në masë të konsiderueshme. Nga kjo, numrin e faktorëve mund ta kufizojmë në 4 apo 5
faktorë.

Figura 15.1: Grafiku i Analizës Faktoriale

15.3.3. VARIANCAT E PËRBASHKËTA TË NDRYSHOREVE
Communality (variancat e përbashkëta) paraqet shumën e variancës që një
ndryshore e ndan bashkë me ndryshoret e tjera që marrin pjesë në analizë (Hair dhe të
tjerët, 1998: 365). Në analizën faktoriale, duke i nxjerrur nga analiza ndryshoret të cilat
kanë varianca të ulëta (p.sh. nën 0,50) mund të bëhet përsëri analiza faktoriale. Në këtë
rast, do të rriten edhe KMO edhe vlera statistikore e variancës së shpjeguar.

Në qoftë se vlera communality del mbi 1, në këtë situatë ose seti i të dhënave është i
vogël ose janë përcaktuar numër i madh apo numër i vogël i faktorëve në hulumtim. Në
tabelën e mëposhtme, ndryshoret të cilat kanë variancën e përbashkët më të lartë janë ROA
dhe NSE.

378
Tabela 15.3: Tabela e Variancës së Përbashkët

Communalities

Initial Extraction

roa 1.000 .771
nse 1.000 .771
nsfa 1.000 .704
nsta 1.000 .705
gm 1.000 .525
om 1.000 .624
pm 1.000 .852
npm 1.000 .822
cr 1.000 .610
atr 1.000 .813
cr2 1.000 .746
fl 1.000 .690
de 1.000 .580
stfdta 1.000 .692

Extraction Method: Principal
Component Analysis.

15.3.4. FAZA E ROTACIONIT
Qëllimi i rotacionit është që të përfitohen faktorë të rëndësishëm dhe që mund të
interpretohen. Më poshtë në Tabelën 15.4 shihet matrica e faktorëve të rrotulluar (Rotated
Component Matrix). Kjo matricë është rezulati përfundimtar i analizës faktoriale. Në
matricë mund të shihen korrelacionet ndërmjet ndryshores origjinale dhe faktorit të saj.
Ndryshorja e cila ka peshën më të madhë nën një faktor të caktuar nënkupton që ajo
ndryshore ka një lidhje të përafërt me atë faktor. Në qoftë se numri i të dhënave
(vrojtimeve) është 350 dhe më lartë, pesha e faktorit duhet të jetë 0,30 dhe më shumë.
Kurse peshat 0,50 dhe më lartë pranohen si vlera shumë të mira (Hair dhe të tjerët 1998:
385).

Në shembullin tonë, në Tabelën 15.4 janë dhënë 4 faktorë (kolona) dhe peshat e
secilës ndryshore nën faktorë (factor loadings – koeficienti i korrelacioneve ndërmjet
ndryshoreve dhe faktorëve). Nga tabela, ndryshorja ROA ka peshën më të madhe nën
faktorin 1 (,807), ndryshorja OM, përsëri edhe kjo ka peshën më të madhe nën faktorin e

379
parë (,757). Ndryshorja FL ka peshën më të madhe nën faktorin 2 (,807), ndryshorja ATR
nën faktorin 3 (,878) dhe ndryshorja NSFA nën faktorin 4 (,806).

Tabela 15.4: Matrica e Faktorëve të Rrotulluar

a
Rotated Component Matrix

Component

1 2 3 4

roa .807 -.067 .095 .327
om .757 .052 -.213 -.062
pm .730 -.542 .159 .008
npm .710 -.551 .116 -.015
gm .674 .127 .160 -.173
fl -.046 .807 -.189 .037
de -.083 .737 -.156 -.079
atr -.012 -.189 .878 .070
cr2 .346 -.059 .783 .102
cr -.017 -.180 .753 .101
stfdta .221 .537 -.543 .246
nsfa .146 .074 .167 .806
nsta -.167 -.369 .086 .730
nse -.068 .514 -.090 .702

Extraction Method: Principal Component
Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
a. Rotation converged in 6 iterations.

15.3.5. EMËRIMI I FAKTORËVE
Për të bërë emërimin e faktorëve, duhet të bëhet grupimi i ndryshoreve të cilat kanë
peshë më të madhe nën një faktor. Për shembull, në tabelën 4, ndryshoret ROA (,807), OM
(,757), PM (,730), NPM (,710) dhe GM (,674) kanë peshën më të madhe nën faktorin 1
(ndryshoret të cilat kanë pesha të vogla nën faktorin 1 nuk merren parasysh). Këto
ndryshore kanë të bëjnë plotësisht me fitimin e firmës, kështuqë faktorin e parë mund ta
emërojmë si faktori i fitimit. Në të njëjtën mënyrë, ndryshoret FL (,807), DE (,737) dhe
STFDTA (,537) kanë peshën më të madhe nën faktorin 2. Këto tri ndryshore kanë të bëjnë
me strukturën financiare të firmës, kështu që faktorin e dytë mund ta emërojmë si faktori i
strukturës financiare. Nën faktorin e tretë, ndryshoret ATR (,878), CR2 (,783), CR (,753)
kanë peshën më të madhe. Këto tri ndryshore kanë të bëjnë me likuiditetin e firmës, kështu

380
që faktorin e tretë mund ta emërojmë si faktori i likuiditetit. Nën faktorin e katërt,
ndryshoret NSFA (,806), NSTA (,730) dhe NSE (,702) kanë peshën më të madhe.
Karakteristika e përbashkët e këtyre ndryshoreve është produktiviteti, kështu që këtë
faktor mund ta emërojmë si faktori i produktivitetit.

15.3.6. REZULTATET FAKTORIALE
Qëllimi i analizës faktoriale ishte që setin e të dhënave ta reduktonte në numër sa
më të vogël dhe më të rëndësishëm të faktorëve. Para se të fillonim me analizën faktoriale
kishim 14 ndryshore. Pas analizës faktoriale, 14 ndryshoret u reduktuan në 4 faktorë. Në të
njëjtën kohë, kemi përfituar edhe rezultatet e faktorëve ashtu sa numri i faktorëve. Me fjalë
të tjera, është përfituar kolona e rezultateve të faktorëve (factor scores) për secilën
ndryshore. Rezultatet e përfituara të faktorëve duhet të plotësojnë kushtin e shpërndarjes
normale dhe nuk duhet të kenë probleme me lidhje të shumëfishta. Rezultatet e faktorëve
të përfituara mund të përdoren në analiza të tjera duke qenë ndryshore në vete. Pasi të
përfundojmë analizën e rezultateve të faktorëve, mund të i shohim këto në faqen e parë, aty
ku kemi bërë hyrjen e të dhënave (Shikoni hapin 10: Dritarja e rezultateve të faktorëve).

Hapi 10: Rezultatet e Faktorëve

Për më shumë detaje rreth analizës faktoriale, shikoni Bryant dhe Yarnold (1995),
Dunteman (1989), Gorsuch (1983), Hutcheson dhe Sofroniou (1999), Kim dhe Muller
(1978a, 1978b), Morrison (1990).

381
382
16. ANALIZA DISKRIMINUESE (DISCRIMINANT ANALYSIS)
Analiza diskriminuese është një nga teknikat statistikore me shumë ndryshore e cila
ka për qëllim të vlerësoj marrëdhënien ndërmjet ndryshores(ve) së varur(a) kategorike
dhe ndryshoreve të pavarura metrike.

16.1. QËLLIMET E PËRDORIMIT TË ANALIZËS DISKRIMINUESE
 Mund të përdoret për të vlerësuar anëtarësinë e grupit, me fjalë të tjera, për të
vendosur se një e dhënë (vrojtim, subjekt, ndodhi) në cilin grup të ndryshores do
të marrë pjesë.
 Duke përdorur barazinë e funksionit të diskriminimit, ndihmon ndarjen e të
dhënave në grupe.
 Mund të përdoret për të zbuluar si ndryshojnë mesataret aritmetike të
ndryshoreve të pavarura ndërmjet grupeve.
 Mund të përdoret për të identifikuar se ndryshoret e pavarura sa mund të
shpjegojnë variancën e ndryshores së varur.
 Mund të përdoret për të identifikuar ndryshoret të cilat janë efektive dhe ato që
nuk janë janë gjatë ndarjes së grupeve.
 Mund të përdoret për të testuar klasifikimin e të dhënave të vlerësuara.

16.2. SUPOZIMET E ANALIZËS DISKRIMINUESE
Për të shmangur mundësinë e klasifikimit gabim në analizën diskriminuese;

 ndryshoret duhet të ndjekin shpërndarjen e shumëfishtë normale,
 matricat e kovariancave duhet të jenë të barabarta për të gjitha grupet dhe
 duhet të mos ekzistojë problemi i lidhjeve të shumëfishta lineare ndërmjet
ndryshoreve të pavarura.

(Për detajet e supozimeve të analizës diskriminuese, shikoni kapitullin e
supozimeve të teknikave statistikore me shumë ndryshore).

Lachenbruch (1975) ka paraqitur se një mospërfillje e lehtë e supozimeve të
shpërndarjes së shumëfishtë normale dhe kovariancave të barabarta (dy supozimet shumë
të rëndësishme të analizës diskriminuese) nuk ndikon në masë të konsiderueshme në
rezultatet e analizës. Klecka (1980), ka treguar se shpesh ndryshoret dikotomike
(rezultatet dyshe si po, jo) të cilat shkelin rregullin e shpërndarjes normale, nuk do të
ndikojnë në rezultatet e analizës diskriminuese. Po ashtu, në qoftë se shpërndarja e të
dhënave nuk është normale dhe në masë të konsiderueshme ka pabarazi në madhësitë e

383
grupeve, mund të përdoret analiza e regresionit logjistik në vend të analizës diskriminuese.
Në analizën e regresionit logjistik nuk ekziston kushti në lidhje me karakteristikën e
shpërndarjes së ndryshoreve të pavarura. Mirëpo, në rastet kur regresioni logjistik nuk
mund të përdoret për tri apo më shumë kategori të ndryshoreve të varura, duhet patjetër
të përdoret analiza diskriminuese.

16.3. MADHËSIA E DUHUR E SETIT TË TË DHËNAVE PËR ANALIZËN
DISKRIMINUESE
Madhësia e duhur e setit të të dhënave për analizën diskriminuese duhet të jetë së
paku prej 100, ku për çdo ndryshore duhet të jenë minimum 20 të dhëna.

Detajet e analizës diskriminuese do të shpjegohen përmes aplikimit të shembullit të
mëposhtëm.

16.4. SHEMBULL APLIKIMI
Të supozojmë se dëshirojmë të bëjmë një hulumtim mbi studentët të cilët e
përfundojnë me sukses programin e masterit në një universitet dhe mbi ata të
pasuksesshëm. Çështjet të cilat jemi kureshtarë të indentifikojmë janë karakteristikat
ndarëse të studentëve të suksesesshëm dhe atyre të pasuksesshëm, një student potencial a
do të jetë i suksesshëm apo i pasukesshëm, si ndryshojnë mesataret aritmetike të
ndryshoreve të pavarura ndërmjet grupeve, ndryshoret e pavarura sa e shpjegojnë
variancën në ndryshoren e varur, ndryshoret efektive në ndarjen e grupeve të suksesshme
dhe të pasuksesshme. Për këtë qëllim, do të përdoren rezultatet e provimit pranues të
masterit (PPM), mesataret e notave të studentëve (MN) dhe provimi i gjuhës për nënpunës
civil (PGNC, origjinal KDPS)26. Për këtë arsye, është siguruar lista e studentëve të
sukseshëm (diplomuar) dhe atyre të pasukesshëm, si dhe rezultatet e provimit pranues
(PPM), mesataret e notave (MN) dhe rezultatet e provimit të gjuhës për nënpunësit civil
(PGNC) nga Instituti i Shkencave Shoqërore të një universiteti tonë.27 Këtu, kemi dy grupe
të ndryshores së varur (1: grupi i studentëve të suksesshëm, 2: grupi i studentëve të
pasukesshëm). Në analizën diskriminuese mund të jenë më shumë se dy grupe (kategori)
në ndryshoren e varur. Kurse ndryshoret tona të pavarura janë ndryshorja PPM, MN dhe
PGNC (në fakt, është ideale që analiza diskriminuese të bëhet me numër më të madh të
ndryshoreve të pavarura).

26 KDPS (Kamu Personeli Dil Sınavı) është një provim shtetëror për turqit për të zbuluar nivelin e njohurive të
gjuhëve të huaja për punonjësit e sektorit publik.
27 D.m.th. Turqisë.

384
Ndryshoret tona të pavarura dhe të varura, futen në programin SPSS, ashtu siç
shihet më poshtë. Kolona e parë paraqet ndryshoren e varur (30 rreshtat e parë me numrin
1 paraqesin studentët e suksesshëm, kurse prej rreshtit 31 deri te 60 me numrin 2 janë
vendosur studentët e pasuksesshëm). Në rreshtin e parë mund të shihen pikët e PP,
mesatares së notës MN dhe rezultatet e provimit PGNC për një student që e ka përfunduar
me sukses programin e masterit. Duke zbritur tutje, mund të shihen rastet e studentëve të
tjerë.

Hapi 1: Hyrja e të Dhënave në SPSS

Pasi të bëhet hyrja e të dhënave si më sipër, për bërjen e analizës diskriminuese,
përzgjedhet Analyze  Classify  Discriminant.

385
Hapi 2: Menyja e Analizës Diskriminuese

Pas kësaj, duhet të bëhet pozicionimi i ndryshoreve të pavarura dhe të varura në
dritaren e analizës diskriminuese.

Hapi 3: Dritarja e Analizës Diskriminuese

386
Në fillim, siç shihet në Hapin 4, duke e selektuar ndryshoren e varur grupin, e bartim
në pjesën Grouping Variable dhe klikojmë në butonin Define Range e cila gjendet
menjëherë përfundi. Në dritaren e hapur, në pjesën minimum shkruajmë 1 dhe në pjesën
maksimun 2 (studentët e suksesshëm qenë cilësuar me 1, të pasuksesshëm 2) dhe pastaj
klikojmë Continue. (Po të kishin qenë më shume se dy grupe, p.sh. katër grupe, në pjesën
minimum do të duhej të shkruanim 1 dhe në pjesën maksimum 4).

Hapi 4: Dritarja e Ndryshores së Varur

Më vonë, siç shihet në Hapin 5, ndryshoret tona të pavarura, PPM, MN, PGNC barten në
pjesën Independents.

387
Hapi 5: Dritarja e Ndryshoreve të Pavarura

Në menynë e analizës diskriminuese gjenden alternativat Statistics, Method,
Classify dhe Save. Klikohet në butonin Statistics dhe etiketohen alternativat Box’s,
Unstandardized dhe Within-group correlations. Gjatë selektimit të ndryshoreve, mund
të zgjedhim metodën e ndarjes hap pas hapi (stepwise).

Hapi 6: Dritarja e Statistikave

Kur të klikohet në butonin Method, hapet dritarja stepwise method (Hapi 7). Këtu,
përzgjedhim alternativën Wilks’ Lambda për krjimin e barazisë së ndarjes (discriminant).

388
Kjo metodë, synon të minimizojë vlerën e secilës ndryshore të re e cila hyn në barazinë e
ndarjes.

Kurse vlera F në pjesën Criteria paraqet vlerat të cilat duhet të përdoren me rastin e
përfshirjes së një ndryshoreje në model apo për nxjerrjen e saj nga modeli. Këto vlera janë
3,84 dhe 2,71 dhe pranohen në nivelin e rëndësisë prej 0,5 dhe 0,10. Në pjesën Display
përzgjedhim alternativën summary of steps. Po të zgjedhnim si metodë Mahalanobis
distance në vend të Wilks’s Lambda, do të duhej të përzgjedhnim F for pairwise
distances. Më vonë, duke klikuar Continue, vazhdohet me analizën.

Hapi 7: Dritarja e Ndarjes Hap pas Hapi

Kur të klikojmë në butonin Classify, (Hapi 8), zgjedhim alternativën All groups
equal në qoftë se numri i grupeve të krahasuara të ndryshores së varur është i njëjtë (në
shembullin tonë kemi 30 studentë të suksesshëm dhe 30 studentë të pasuksesshëm). Po të
mos ishte numri i grupeve i barabartë do të duhej të përzgjedhnim alternativën Compute
from group sizes. Kurse nga pjesa Display, në qoftë se numri i vrojtimeve nuk është
shumë i madh, duhet të përzgjedhet patjetër alternativa Casewise result. Kjo alternativë
tregon rezultatet diskriminuese për secilin subjekt, grupin përkatës, mundësinë e të
qenurit në një grup etj. Një alternativë tjetër që duhet të selektojmë dhe e cila ofron
informata të dobishme është Summary table. Përmes përzgjedhjes së kësaj alternative,
mund të shoshim rezultatet e klasifikimit të saktë dhe të pasaktë si përqindje si dhe me
numra për secilin grup. Alternativa Within-groups bën klasifikim e ndryshoreve në lidhje
me matricat e kovariancave për të gjitha grupet. Kurse nën Plot marrin pjesë alternativat e
grafikut.

389
Hapi 8: Dritarja e Klasifikimit

Në qoftë se dëshirojmë të marrim grafiqet e grupeve të gjitha së bashku me një
vend apo ndaras, përzgjedhim alternativat Combined-groups apo Separate-groups. Për
përfitimin e grafikut të alternativës combined-groups, numri i grupeve duhet të jetë më
shumë se dy. Territorial map paraqet formatin e grafikut të mesatareve të grupeve kur
numri i grupeve në ndryshoren e varur është më shumë se dy. Kurse alternativa e cila
gjendet në fund të dritares Replace missing values with mean përdoret kur në setin e të
dhënave ekziston mungesë e të dhënave (Shikoni pjesën e shqyrtimit të mungesës së të
dhënave në libër).

Hapi 9: Dritarja e Ruajtjes

Në dritaren Save e cila merr pjesë në analizën diskriminuese, i selektojmë të gjitha
alternativat dhe së fundi duke klikuar OK në dritaren filluese, do të përfitohen rezultatet e
analizës diskriminuese.

390
16.5. DALJET E SPSS-IT DHE INTERPRETIMI PËR ANALIZËN
DISKRIMINUESE
Më poshtë janë prezantuar rezultatet dhe interpretimet të cilat i konsideruam si më
të rëndësishme për nga aspekti i analizës ndarëse.

16.5.1. VLERËSIMI I SUPOZIMEVE TË ANALIZËS
DISKRIMINUESE
Për një analizë diskriminuese optimale dhe për të minimizuar klasifikimin e
gabueshëm, duhet të sigurohen disa supozime. Supozimet më të rëndësishme të analizës
diskriminuese ishin kovariancat e barabarta, lidhjet e shumëfishta dhe shpërndarja
normale. Për testimin e supozimit të barazisë së kovariancave përdoret testi Box’s M. Këtu,
hipoteza zero është në formën “matricat e kovariancave të grupeve janë të barabarta”. Siç
shihet më poshtë në Tabelën 16.1, hipoteza zero nuk refuzohet në nivelin e rëndësisë (,05).
Pra, grupet janë të barabarta për nga aspekti i matricave të kovariancave. Kështu që në këtë
mënyrë është realizuar supozimi i barazimit të kovariancave në shembullin tonë. Në qoftë
se numri i vrojtimeve do të ishte shumë i madh, devijimet e vogla nga homogjeniteti do të
shkaktonin një rezultat të rëndësishëm (sig.). Supozimi jonë i dytë ishte që të mos
ekzistonte problemi i lidhjeve të shumta ndërmjet ndryshoreve. Për këtë, mund të
shikojmë korrelacionet ndërmjet ndryshoreve të varura. Në qoftë se korrelacioni ndërmjet
dy ndryshoreve është më i madh se 70, atëherë njëra nga ndryshoret duhet të lihet jashtë
analizës ose ndryshoret duhet të bashkohen. Siç mund të shihet më poshtë në Tabelën 16.2,
nuk ekzistojnë korrelacione të cilat mund të konsiderohen shumë të larta ndërmjet
ndryshoreve. (Për supozimin e shpërndarjes së shumëfishtë normale, shikoni kapitullin e
supozimeve të teknikave statistikore me shumë ndryshore).

Tabela 16.1: Test Box’s M

Test Results

Box's M 8.375
F Approx. 2.687

df1 3

df2 605520

Sig. .055

Tests null hypothesis of equal
population covariance matrices.

391
Tabela 16.2: Matrica e Korrelacionit

Pooled Within-Groups Matrices

PPM MN PGNC

Correlation PPM 1.000 .484 .630

MN .484 1.000 .514

PGNC .630 .514 1.000

16.5.2. VLERËSIMI I RËNDËSISË SË FUNKSIONEVE TË NDARJES
(DISRCRIMINANT)
Për të përcaktuar se sa i rëndësishëm është funksioni (funksionet) e diskriminimit
shikohen statistikat Canonical Correlation, Eigenvalue dhe Wilks’s Lambda.

Canonical Correlation mat lidhjen ndërmjet rezultateve të diskriminimit dhe
grupeve si dhe tregon totalin e variancës të shpjeguar. Më poshtë në Tabelën 16.3, vlera
Canonical Correlation është ,855. Për interpretimin e kësaj vlerë marrim katrorin e saj
(,8552 = ,73). Pra, modeli mund të shpjegojë 73% të variancës në ndryshoren e varur
(studentët të cilët e kanë përfunduar me sukses programin e masterit dhe ata që nuk kanë
mundur ta përfundojnë).

Tabela 16.3: Statistika e Vlerës Eigen

Eigenvalues

Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
a
1 2.719 100.0 100.0 .855
a. First 1 canonical discriminant functions were used in the analysis.

Sado qe vlera Eigen të jetë më e madhe, nënkupton që pjesa më e madhe e variancës
së ndryshores së varur do të shpjegohet nga ai funksion. Vlera Eigen edhe pse nuk është një
vlerë precize, pranohet si e mirë mbi 0,40. Në rezultatet e shembullit tonë statistika Eigen
është 2,719 dhe mund të themi se funksioni ynë siguron një ndarje (diskriminim) të mirë.
Ngaqë ndryshorja e varur përbëhet nga dy kategori, do të jetë vetëm një funksion i
diskriminimit.

Më poshtë në Tabelën 16.4, statistika Wilks’ Lambda tregon pjesën (normën) e
pashpjeguar të totalit të variancës në rezultatet e ndarjes nga dallimet ndërmjet grupeve.
Në shembullin tonë, siç shihet më poshtë, përafërsisht 27% (,269) e totalit të variancës së
rezultateve të ndarjes nuk është shpjeguar nga dallimet ndërmjet grupeve.

392
Tabela 16.4: Statistika Wilks’ Lambda (U)

Wilks' Lambda

Test of Function(s) Wilks' Lambda Chi-square df Sig.

1 .269 74.870 2 .000

Dallimi i shpjeguar më lartë nga Wilks’ Lambda shërben për një qëllim. Këtu Wilks’
Lambda teston rëndësinë e statistikës Eigenvalue për secilin funksion diskriminues. Në
shembullin tonë është vetëm një funksion dhe është i rëndësishëm.

16.5.3. VLERËSIMI I RËNDËSISË SË NDRYSHOREVE TË
PAVARURA NË ANALIZËN E DISKRIMINIMIT
Për vlerësimin e rëndësisë së ndryshoreve të pavarura duhet të shikohen
koeficientët e funksionit të diskriminit dhe pesha (loadings) e secilës ndryshore të pavarur
në matricën structure. Në Tabelën 16.5 janë dhënë koeficientët e funksionit të
standartizuar të diskriminimit. Siç shihet në tabelë, në ndarjen e grupeve të studentëve të
suksesshëm dhe të pasuksesshëm, ndryshoret e pavarura, rezultatet e provimit pranues
(PPM) dhe mesatarja e notave të studentëve (MN) janë dallues të rëndësishëm. Koeficientët
e tyre janë ,503 dhe ,654. Këta koeficientë, pranojnë koeficientin beta në analizën e
regresionit. Pra, tregojnë rëndësinë relative të ndryshoreve të pavarura në vlerësimin e
ndryshores së varur. Kurse Provimi i Gjuhës për Nënpunësit Civil (PGNC) shihet të mos jetë
një ndryshore efektive në ndarjen e studentëve në të suksesshëm dhe të pasuksesshëm
(Nuk merr pjesë ne Tabelën 16.5).

Tabela 16.5: Koeficientët e Funksionit të Ndarjes

Standardized
Canonical
Discriminant
Function
Coefficients

Function

1

MN .503
PPM .654

Matrica Structure është një matricë e cila mund të përdoret për të vlerësuar
rëndësinë e ndryshoreve të pavarura. Matrica Structure paraqet korrelacionet ndërmjet
funksionit të diskriminimit me secilën ndryshore. Ngaqë në shembullin tonë kemi një

393
funksion, ekziston vetëm një kolonë. Kur numri i kategorive në ndryshoren e varur të jetë
më i madh, edhe numri i funksioneve të ndarjes do të jetë më i madh. Secila kolonë tregon
një funksion. Korrelacionet këtu janë të ngjashme me peshët (loadings) e faktorëve në
analizën faktoriale.

Tabela 16.6: Matrica e Strukturës (Structure)

Structure Matrix

Function

1

PPM .898
MN .820
PGNC .671

Sipas matricës së strukturës funksionet e diskriminimit me korrelacionet më të larta
janë me rend ndryshorja PPM, NM dhe PGNC. Ndryshorja e pavarur PGNC nuk është një
vlerësues i rëndësishëm.

16.5.4. FUNKSIONI I DISKRIMINIMIT DHE INTERPRETIMI
Funksioni i diskriminimit (Discriminant Function) i quajtur edhe canonical root
është një kombinim linear i ndryshoreve të pavarura. Kështu pra:

Z = α + b1X1 + b2X2 + bnXn

Këtu, ndarja (diskriminimi) Z është Z score ( njihet edhe si rezultati Z), α constant
dhe b-të janë koeficientët e diskriminimit, kurse X-et janë ndryshoret e pavarura. Ky
ekuacion i ngjan regresionit të shumëfishtë. Mirëpo, këtu b-të maksimizojnë distancën
ndërmjet mesatareve të ndryshoreve të pavarura.

Tabela 16.7: Koeficientët e Diskriminimit Kanonik

Canonical Discriminant
Function Coefficients

Function

1

MN .088
PPM .144
(Constant) -15.213
Unstandardized
coefficients

394
Tabela 16.7 paraqet koeficientët e pastandartizuar të diskriminimit. I referohet
betave të pastandartizuara në regresionin e shumëfishtë. Pra, përdoren për të krijuar
modelin e vlerësuar saktë që mund të përdoret në klasfikimin e vrojtimeve të reja. Në qoftë
se do të shkruanim funksionin e diskriminimit:

Z = −15,213 + ,088 (MN) + ,144 (PPM)

Në qoftë se do të llogarisnim rezultatin Z të kandidatit të parë që ka përfunduar
programin e masterit:

Z = −15,213 + ,088 (83) + ,144 (76)

Z = 3,075

Rezultatet Z të kandidatëve do të marrin pjesë në rezultatet e SPSS-it në qoftë se nga
dritarja Classify selektohet Casewise results. Shenjat plus apo minus të koeficientëve nuk
janë me rëndësi. Ato tregojnë vetëm lidhjen pozitive apo negative të ndryshoreve të
pavarura me ndryshoren e varur.

Më poshtë në Tabelën 16.8, janë paraqitur rezultatet e mesatareve të funksionit të
diskriminimit (grupi 1 që ka përfunduar me sukses programin e masterit dhe grupi 2 të
pasuksesshmit). Mesatarja e grupit të parë është 1,621, kurse e grupit të dytë −1,621.

Tabela 18.8: Mesataret e Funksionit të Diskriminimit të Grupeve

Functions at
Group Centroids

Function

grupi 1

1.00 1.621
2.00 -1.621

Unstandardized
canonical
discriminant
functions evaluated
at group means

16.5.5. VLERËSIMI I RËNDËSISË SË ANALIZËS SË
DISKRIMINIMIT
Në analizën diskriminuese, suksesi i analizës është përqindja e klasifikimit të saktë.
Pra, sado që përqindja e klasifikimit të saktë është e lartë, analiza është aq e suksesshme.

395
Më poshtë në Tabelën 16.9, personat e përfshirë në mostër janë klasifikuar në mënyrë të
saktë 93%. Në shembullin tonë, nga 30 personat të cilët kanë kryer me sukses programin e
masterit janë vlerësuar 29 në mënyrë të saktë dhe 1 person është klasifikuar gabim. Nga 30
personat të cilët nuk kanë mundur ta kryejnë me sukses programin e masterit janë
klasifikuar saktë dhe 3 prej tyre janë klasifikuar gabim. Në qoftë se do t’i shprehnim me
përqindje, 96,7% e atyreve që e kanë kryer me sukses programin e masterit janë
klasifikuar drejtë dhe 3,3% gabim. Kurse 90% e atyreve që nuk kanë mundur ta kryejnë me
sukses programin e masterit janë klasifikuar drejtë dhe 10% gabim.

Për të vlerësuar saktësinë e këtij klasifikimi, duhet të llogarisim kriteret e
mundësisë relative dhe kriteret e mundësive maksimale. Madhësia e mostrës sonë
përbëhej nga 60 vetë. 30 vetë përbënin grupin e parë, kurse 30 të tjerët grupin e dytë. Me
fjalë të tjera, 50% përbënte grupin e parë, 50% grupin e dytë. Kështu që, vlera e llogaritur e
mundësisë është 50%. Kurse në shembullin tonë (në pjesën e poshtme të Tabelës 16.9),
vlera e klasifikimit të saktë është 93,3% dhe kjo është më e madhe se 50%. Pra, saktësia e
klasifikimit të analizës sonë është më e madhe se kriteri i mundësisë.

Të supozojmë se madhësia e mostrës sonë nuk është e barabartë 30-30, por grupi i
parë përbëhet nga 10 vetë, kurse grupi i dytë nga 50 vetë, në këtë rast, a do të mund të
thonim se nuk ekziston mundësia e normës 93% e klasifikimit të saktë? Gjëja e parë që
duhet të bëjmë për këtë është llogaritja e përqindjeve të grupit të parë dhe të dytë.
Përqindja e grupit të parë brenda totalit është = 0,17 (10 / 60) dhe përqindja e grupit të
dytë brenda totalit është = 0,83 (50 60). Në qoftë se do të llogaritnim kriterin e mundësisë
relative duke përdorur këto vlera: Kriteri i mundësisë relative = 0,26 (0,102 + 0,502). Niveli
i klasifikimit të saktë (93,3%) është më i lartë se vlerat e kriterit të mundësisë relative
(26%). Po ashtu, niveli i klasifikimit të saktë (93%) është më i lartë se kriteri i mundësisë
maksimale (83%). Në këtë mënyrë, përqindja e lartë e klasifikimit të saktë tregon që
analiza është bërë me sukses.

396
Tabela 16.9: Rezultatet e Klasifikimit

a,c
Classification Results

Predicted Group Membership

grupi 1.00 2.00 Total

Original Count 1.00 29 1 30

2.00 3 27 30

% 1.00 96.7 3.3 100.0

2.00 10.0 90.0 100.0
b
Cross-validated Count 1.00 29 1 30

2.00 3 27 30

% 1.00 96.7 3.3 100.0

2.00 10.0 90.0 100.0

a. 93.3% of original grouped cases correctly classified.

Gjatë aplikimit të shembullit patëm pyetur se cilat janë karakteristikat ndarëse të
studentëve të suksesshëm dhe atyre të pasuksesshëm. Në fund të analizës diskriminuese
mësuam se këto janë ndryshoret PPM dhe MN. Ndryshorja PGNC nuk kishte ndonjë rëndësi
ndërmjet grupeve. Një përgjigjje tjetër që dëshironim të mësonim ishte si ndryshojnë
mesataret aritmetike të ndryshoreve të pavarura ndërmjet grupeve. Kjo përgjigje mund të
merret nga tabela “Group Statistics” (nuk e pamë të nevojshme të e vendosim tabelën e saj).
Një përgjigjje tjetër që ishim kureshtarë të dinim ishte e pyetjes se sa ndryshoret e
pavarura e shpjegonin variancën në ndryshoren e varur. Përgjigjja e kësaj pyetjeje që
shpjeguar gjatë interpretimit të Tabelës 16.3.

397
398
17. ANALIZA E GRUPIMIT (CLUSTER ANALYSIS)
Analiza e grupimit është një metodë statistikore me shumë ndryshore e cila
përdoret shpesh për të bërë klasifikimin e të dhënave të grupuara sipas ngjashmërive.

Qëllimi parësor i analizës së grupimit që është një nga teknikat analizore me shumë
ndryshore, është që të bëj grupimin e individëve apo objekteve duke marrë si bazë
karakteristikat e tyre të ngjashme. Me fjalë të tjera, analiza e grupimit ofron informata
përmbledhëse për hulumtuesin duke bërë grupimin e të dhënave të pagrupuara sipas
ngjashmërive të tyre. Analiza e grupimit, në të njëjtën kohë përdoret për qëllime të
ndryshme, si për përcaktimin e llojeve të grupeve, parashikimin e grupeve, testimin e
hipotezave, vlerësimin e grupeve në vend të të dhënave dhe gjetjen e vlerave të veçanta.

Analiza e grupimit fokusohet në grupet të cilat formohen nga llogaritja e vlerave të
të gjitha ndryshoreve të individëve apo objekteve të vrojtuara në hulumtim. Për të gjetur
ngjashmëritë ndërmjet individëve apo objekteve përdoren matjet e distancës, matjet e
korrelacionit ose matjet e përngjasimeve të të dhënave cilësore.

Analiza e grupimit bën grupimin e individëve apo objekteve në të njëjtin grup, të
cilët përngjajnë me njëri-tjetrin sipas kritereve të përzgjedhjes së përcaktuar më parë
(p.sh., përgjegjësit e anketës, produktet, sëmundjet dhe/ose inputet e tjera të pavarura). Në
fund të analizës, homogjeniteti brenda grupeve të formuara dhe heterogjeniteti ndërmjet
tyre është shumë i lartë. Pra, individët/objektet e një grupi të cilët ngjajnë në mes vete, nuk
do të ngjajnë me individët/objektet e një grupi tjetër. Në fund, në qoftë se klasifikimi është i
suksesshëm, objektet brenda grupit do të jenë shumë të përafërta me njëra-tjetrën
gjeometrikisht, kurse grupet e ndryshme do të jenë shumë larg nga njëra-tjetra.

Në analizën e grupimit, koncepti ndryshore është shumë me rëndësi dhe është
shumë i ndryshëm nga analizat e tjera me shumë ndryshore. Në analizën e grupimit, bëhet
krahasimi i ndryshoreve duke përdorur karakteristikat e tyre sepse ndryshorja e analizës
së grupimit nuk përfshin vetëm karakteristikat të cilat përcaktojnë objektet. Dallimi i
analizës së grupimit prej analizës ndarëse (diskriminuese) është se përcaktimi i grupeve
përfitohet në fund të analizës, ndërsa në analizën diskriminuese përcaktimi bëhet më parë.
Pra, në analizën e grupimit, matrica e të dhënave nuk mund të ndahet në analizën e
parashikuar dhe nëngrupe të kritereve.

Analiza e grupimit i ngjan analizës faktoriale për nga disa mënyra. Ashtu si në
analizën faktoriale, edhe në analizën e grupimit ndryshoret, nuk i ndajmë në dy grupe, e
pavarur dhe e varur. Një mënyrë tjetër e cila i ngjan analizës faktoriale është edhe
grumbullimi i individëve apo objekteve të hulumtimit të cilët kanë ngjashmëri ndërmjet
vete, pra kriteri i klasifikimit.

399
Po ashtu dallimi themelor ndërmjet matësit shumëdimensional i cili siguron
matricat e afërsisë dhe paraqitjen e saj vizuale dhe analizës së grupimit e cila i ka këto
karakteristika është se matja shumëdimensionale ofron paraqitjen hapësinore të afërsisë,
kurse analiza e grupimit ofron paraqitjen e afërsive në formë të pemës. Veçanërisht gjatë
vlerësimit të metodave të grupimit hierarkik, teksa grupet e vogla vrojtohet të përshtaten
ndërmjet vete dhe të formojnë grupe të rëndësishme, është e mundur që përmes grafikut të
pemës të mos jenë të rëndësishme grupet e mëdha ekstreme. Për këtë arsye, në analizën e
grupimit mund të nxirret ndonjë kuptim nga mospërngjasime e voglat, por është e vështirë
të interpretohen mospërngjasimet e mëdha. Megjithatë, analiza e matësit
shumëdimensional, përkundër analizës së grupimit, ka karakteristikën e vlerësimit të
mospërngjasimeve të mëdha apo nxjerrjes së kuptimeve nga këto mospërngjasime.

Analiza e grupimit është një teknikë mjaft e dobishme për të analizuar të dhënat e
situatave të ndryshme. Për shembull, një hulumtues ka mbledhur të dhënat me anë të
anketës, por numri i madh i vrojtimeve i vështirson grupimin e të dhënave dhe nxjerrjen e
kuptimit të tyre. Në këtë situatë, analiza e grupimit do të bëj grupimin e të gjitha vrojtimeve
sipas kritereve të cilat i përcakton hulumtuesi dhe të dhënat do të reduktohen ose do të
formojnë grupe të cilat japin informata të përgjithshme.

Po ashtu, hulumtuesit mund të kenë dobi nga analiza e grupimit në rastet kur
dëshirojnë që të zhvillojnë supozime në lidhje me karakteristikat e të dhënave apo kur
dëshirojnë të testojnë supozimet më parë. Për shembull, një hulumtues supozon se
shprehitë e tregtisë në një hapësirë në të cilën pihet vazhdimisht alkooli janë të ndryshme
nga ajo në të cilën pihet ndonjëherë alkooli. Në këtë rast, me analizën e grupimit
përcaktohen ngjashmëritë dhe dallimet ndërmjet hapësirës në të cilën pihet vazhdimisht
alkooli dhe asaj në të cilën pihet ndonjëherë alkooli dhe sipas këtij rezultati zhvillohen
supozimet.

17.1. PROCESI I VENDIMMARRJES PËR ANALIZËN E GRUPIMIT
Ashtu si në analizat e tjera me shumë ndryshore, edhe aplikimi i analizës së grupimit
bëhet duke kaluar nëpër disa faza të caktuara.

400
Figura 17.1: Procesi i Marrjes së Vendimi Për Analizën e grupimit

401
402
17.1.1. QËLLIMET E ANALIZËS SË GRUPIMIT
Qëllimi parësor i analizës së grupimit është ndarja e vrojtimeve të përfituara në
fund të hulumtimit në dy apo më shumë grupe duke marrë për bazë ngjashmëritë e tyre.
Përdorimi më i përgjithshëm i analizës së grupimit është më qëllim hulumtimi. Analiza e
grupimit përdoret shpesh për të zhvilluar një klasifikim objektiv. Ndarjet e përfituara në
fund të analizës mund të ndihmojnë në krijimin e supozimeve në lidhje me strukturën e
objekteve. Përsëri analiza e grupimit e cila shihet si një teknikë hulumtimi, në të njëjtën
kohë përdoret edhe për qëllime testimi.

17.1.2. PLANI I HULUMTIMIT NË ANALIZËN E GRUPIMIT
Pas përcaktimit të qëllimeve dhe përzgjedhjes së ndryshoreve, hulumtuesi përpara
se të fillojë hulumtimin duhet të u përgjigjet këtyre tri pyetjeve: (1) A janë identifikuar
linjat kryesore të hulumtimit apo këto kufizime duhet të fshihen? (2) Çfarë duhet të jetë
matja e ngjashmërive të vrojtimeve? (3) A duhet të ketë standarte të të dhënave? Për t’iu
përgjigjur këtyre pyetjeve ekzistojnë qasje të ndryshme. Në të njëjtën kohë, asnjëra nga
këto qasje nuk janë të mjaftueshme për të dhënë një përgjigje të qartë dhe të saktë dhe për
fat të keq shumica e qasjeve japin rezultate të ndryshme për të dhënat e njëjta.

17.1.3. MATJET E NGJASHMËRISË
Qëllimi themelor në analizën e grupimit është që të zbulohen ngjashmëritë apo
largësitë/afërsitë ndërmjet individëve apo objekteve të vrojtuara. Ngjashmëria, e kundërta
e konceptit të largësisë, tregon afërsinë e dy objekteve me njëra-tjetrën kur ekziston numër
i madh i ngjashmërive dhe largësinë ndërmjet dy objekteve kur ekziston numër i vogël i
ngjashmërive. Zgjedhja e matjes së ngjashmërive ndryshon sipas të dhënave kategorike
dhe metrike. Të Dhënat Kategorike: Mënyra më e thjeshtë për të zbuluar ngjashmëritë e
dy objekteve është zbulimi i karakteristikave të cilat shfaqin më shumë ngjashmëri
ndërmjet dy objekteve. Kjo matje bëhet me të dhëna kategorike. Për shembull, gjatë bërjes
së një hulumtimi në lidhje me blerësit e automobilave, mund të identifikohen tri
karakteristika të cilave blerësit u kushtojnë vëmendje. Këto janë:

Modeli (klasik, sportiv, tipit familjar) (1, 2, 3)

Le të jetë vlera (1) për zgjedhësit e modeleve klasike, (2) për zgjedhësit e modeleve
sportive dhe (3) për zgjedhësit e modeleve familjare.

Shteti (Japonia, Franca)

Le të jetë vlera (1) për zgjedhësit e automobilave të prodhimit japonez, (2) për
zgjedhësit e automobilave të prodhimit francez.

403
Le të jenë ngjyrat (kaltër, bardhë, kuqe, zezë) (1, 2, 3, 4)

Le të jetë vlera (1) për zgjedhësit e ngjyrës së kaltër, (2) për zgjedhësit e ngjyrës së
bardhë, (3) për zgjedhësit e ngjyrës së kuqe dhe (4) për zgjedhësit e ngjyrës së zezë.

Le të jenë përzgjedhjet e automobilave të 5 klientëve të intervistuar si më poshtë.

Tabela 17.1: Preferencat e Klientëve të Automobilave

Karakteristikat e Përzgjedhjes së Automobilave
Klientët Modeli Shteti Ngjyra
1 2 2 3
2 2 1 4
3 1 1 2
4 3 1 1
5 3 2 3

Siç kuptohet nga tabela, vrojtimet përbëhen nga 5 klientë. Në total gjenden 10 lidhje
dyfishe. Këto janë (1,2), (1,3), (1,4), (1,5), (2,3), (2,4), (2,5), (3,4), (3,5), (4,5). Për të
identifikuar ngjashmëritë ndërmjet cilave do dy vrojtimeve, duhet të bëhen vlerësime sipas
secilës ndryshore. Në qoftë se vlerësimi i dy klientëve është i njëjtë për një ndryshore,
dallimi është 0. Ato të cilat kanë totalin më të lartë të këtyre vlerave, nënkupton që janë më
të afërta me njëra-tjetrën (përngjajnë më shumë).

Në qoftë se do ta shpjegonim shembullin; bëhet krahasimi i Rr12 me klientin e parë
dhe të dytë. Që të dy, klienti i parë dhe i dytë kanë përzgjedhur modelin sportiv të makinës
dhe për secilin klient përzgjedhjet e modelit janë dhënë me (2). Në këtë situatë, ngaqë
vlerësimet e të dy klientëve janë të njëjta gjatë krahasimit, shënohet (1) në barazimin Rr12
për ndryshoren e modelit. Përsëri vazhdojmë me krahasime dhe shikojmë vlerat e dhëna të
klientëve për nga aspketi i shtetit. Meqë klienti i parë ka përzgjedhur makinat e prodhimit
francez, shkruajmë (2). Kurse meqë klienti i dytë ka përzgjedhur makinat e prodhimit
japonez, shkruajmë (1). Në këtë rast, ngaqë përzgjedhjet e tyre janë të ndryshme nga njëra-
tjetra, për ndryshoren e shtetit, shënohet (0) në barazimin Rr12 për ndryshoren e shtetit.
Përsëri në të njëjtën mënyrë, klienti i parë ka përzgjedhur ngjyrën e kuqe (3), kurse klienti i
dytë ka përzgjedhur ngjyrën e zezë (4). Ngaqë përzgjedhjet e ngjyrave të klientëve janë të
ndryshme, shënohet (0) për Rr12 për ndryshoren e ngjyrës. Pastaj bëhet mbledhja e këtyre
shënimeve. Klientët të cilët kanë totalin më të lartë të këtyre vlerave, janë ata që përngjajnë
më shumë me njëri-tjetrin.

404
Tabela 17.2: Përzgjedhjet e Automobliave të Klientëve

Karakteristikat e Përzgjedhjes së Automobilave
Klientët Modeli Shteti Ngjyra
1 2 2 3
2 2 1 4

Rr12 = 1+0+0= 1 Rr13 = 0+0+0= 0 Rr14 = 0+0+0= 0 Rr15 = 0+1+1= 2

Rr23 = 0+1+0= 1 Rr24 = 0+1+0= 1 Rr25 = 0+0+0= 0 Rr34 = 0+1+0= 1

Rr35 = 0+0+0= 0 Rr45 = 1+0+0= 1

Në këtë rast mund të thuhet se klientët të cilët përngjajnë më shumë ndërmjet veti
janë klientët me numër 1 dhe 5 (Rr15). Kurse është e vështirë që të bëhet interpretim për
ngjashmëritë e tjera. Për të shpëtuar nga kjo situatë dhe për të shprehur ngjashmëritë me
matje më të qarta, duhet që të vlerësohet pesha e secilit vrojtim. Meqë ndryshorja e modelit
është 3-matëse, ndryshorja e shtetit 2-matëse dhe ndryshorja e ngjyrës 4-matëse, këto
vlera kanë pesha pranuese dhe shumëzohen me vlerat e dhëna.

Rr12 = (3) 1+(2) 0+(4) 0= 3 Rr13 = (3) 0+(2) 0+(4) 0= 0 Rr14 = (3) 0+(2) 0+(4) 0= 0

Rr15 = (3) 0+(2) 1+(4) 1= 6 Rr23 = (3) 0+(2) 1+(4) 0= 2 Rr24 = (3) 0+(2) 1+(4) 0= 2

Rr25 = (3) 0+(2) 0+(4) 0= 0 Rr34 = (3) 0+(2) 1+(4) 0= 2 Rr35 = (3) 0+(2) 0+(4) 0= 0

Rr45 = (3) 1+(2) 0+(4) 0= 3

Gjatë shqyrtimit të vlerave të gjetura, përsërit klientët të cilët ngjajnë më shumë
janë Rr15, pra klienti i parë dhe i pestë. Klienti i parë dhe i dytë, mund të thuhet se
përngjajnë më shumë me njëri-tjetrin, por ngjashmëritë nuk mund t’i shprehin në mënyrë
të qartë (me shumëzimin e peshave është gjetur vlera “3”) kurse në rastin e parë kanë
vlerat “1”, si dhe klienti i katërt dhe i pestë (përsëri me shumëzimin e peshave është gjetur
vlera “3”) në krahasim me të tjerët sepse me pranimin e vlerave matëse si pesha, vlerat më
të larta të arritura tregojnë klientët të cilët ngjajnë më së shumti.

Në një matje të ngjashmërive, në qoftë se të gjitha ndryshoret janë kategorike,
përdoret metoda e krahasimit të koeficientëve. Por, në rastet kur njëra ndryshore ka pasur
një matje të ndryshme, nuk përdoret metoda e krahasimit të koeficientëve. Për këtë arsye
është zhvilluar metoda e devijimeve absolute dhe metoda e shumës së ndryshimit të
katrorit. Metoda e devijimeve absolute llogarit dallimet ndërmjet vrojtimeve sipas vlerave
absolute, kurse metoda e shumës së ndryshimit të katrorit llogarit këto dallime sipas
katrorëve. Për shembull, në qoftë se tri ndryshore janë matur me Matjen e Likertit dhe një

405
ndryshore është matur me matje proporcionale, ngjashmëritë ndërmjet vrojtimeve nuk
përcaktohen me metodën e krahasimit të koeficientëve, por me metodën e shumës së
ndryshimit të katrorit.

Në analizën e grupimit, këto tri metoda veçanërisht kanë një rol të rëndësishëm në
matjen e ngjashmërive: matjet e korrelacionit, matjet e largësisë dhe matjet e partneriteve
(përbashkimeve). Secila nga këto metoda tregon një rrugë të veçantë të ngjashmërisë në
lidhje me qëllimin e llojit të të dhënave. Për matjet e ngjashmërive/largësive përdoren të
dhënat kategorike ose metrike. Përderisa për matjet e korrelacionit dhe largësisë janë të
nevojshme të dhënat metrike, për matjen e parterneriteve janë të nevojshme të dhënat
kategorike (jometrike).

17.1.4. MATJET E KORRELACIONIT
Në matjen e ngjashmërive, parimisht mirret në konsideratë korrelacioni ndërmjet
vrojtimeve çifte. Rrjedhimisht, koeficienti i korrelacionit paraqet korrelacionin
(ngjashmërinë) ndërmjet dy vrojtimeve. Korrelacioni i lartë tregon për ekzistimin e
ngjashmërive, kurse korrelacioni i ulët tregon për mungesën e ngjashmërive.

Tabela 17.3: Matja e Ngjashmërive: Korrelacioni

Vrojtimi
Vrojtimi 1 2 3 4 5 6 7
1 1.00
2 -.147 1.00
3 .000 .000 1.00
4 .087 .516* -.824 1.00
5 .963* -.408 .000 -.060 1.00
6 -.466 .791* -.354 .699* -.645 1.00
7 .891* -.516 .165 -.239 .963* -.699 1.00

Vlerat me (−) janë korrelacione me drejtim negativ dhe shprehin mosngjashmëritë
ndërmjet vrojtimeve.

Vlerat me (*) janë korrelacione të larta me drejtim pozitiv dhe shprehin
ngjashmëritë ndërmjet vrojtimeve.

Kurse të tjerat janë koeficientë me korrelacion të ulët.

Siç kuptohet nga tabela e mësipërme, me korrelacionet ndërmjet vrojtimeve mund
të krahasohen dy grupe të ndryshme. Parimisht, në qoftë se vlerësojmë ngjashmëritë e
vrojtimit të parë me vrojtimet e tjera, koeficientët e korrelacionit të vrojtimit të parë, të
pestë dhe të shtatë janë të larta (0,963*, 0,891) dhe mund të themi se këto kanë mostra të

406
ngjashme në mes vete. Në të njëjtën mënyrë, mund të shihet se koeficientët e korrelacionit
të vrojtimit të dytë, katërt dhe gjashtë janë të larta (0,516*, 0,791*), por të ulëta me
vrojtimet e tjera (0,000) apo edhe negative (−0,408, −0,516). Kjo do të thotë që vrojtimi i
dytë ka ngjashmëri të larta me vrojtimin e katërt dhe të gjashtë, por ngjashmëritë me të
tjerat janë të vogla ose në drejtim të kundërt. Vrojtimi i tretë ka një korrelacion negativ
(−0,824, −0,354) ose të ulët (0,000, 0,165) me të gjitha vrojtimet tjera dhe mund të
parashikohet që do të formojë një grup të vetëm. Gjatë shqyrtimit të kolonës së katërt,
mund të shihet se vrojtimi i katërt ka një ngjashmëri të lartë me vrojtimin e gjashtë (0,699)
dhe përsërimi vrojtimi i katërt me vrojtimet e tjera ka një ngjashmëri me drejtim negativ
(−0,060, −0,239). Në kolonën e pestë mund të vëzhgohet që vrojtimi i pestë ka një
ngjashmëri të lartë me vrojtimin e shtatë (0,963) dhe një lidhje me drejtim negativ me
vrojtimin e gjashtë. Në kolonën e gjashtë, vrojtimi i gjashtë ka një koeficient negativ të
korrelacionit me ndryshoren e shtatë, pra, mund të kuptohet që këto vrojtime nuk kanë
ngjashmëri ndërmjet vete. Korrelacionet tregojnë madhësitë e mostrave në njërën anë dhe
krahasimet ndërmjet vetë vrojtimeve në anën tjetër në lidhje me ndryshoret. Mirëpo,
matjet e korrelacionit përdoren rrallë sepse në analizën e grupimit nuk u jepet rëndësi
vrojtimeve, por madhësisë së vrojtimeve në lidhje me ndryshoret.

17.1.5. MATJET E DISTANCËS
Matjet e korrelacionit, si aplikime intuitive të cilat përdoren në shumicën e
teknikave me ndryshore të shumta, zakonisht nuk përdoren në analizën e grupimit për
matjen e ngjashmërive. Matësi (matja) e distancës së ngjashmërive mat afërsinë e
vrojtimeve në lidhje me ndryshoret brenda grupeve të ndryshoreve dhe përdoret shpesh
për matjen e ngjashmërive.

Tabela 17.4: Matësi i Ngjashmërive: Distanca e Euklidit (Euclidean)

Vrojtimi
Vrojtimi 1 2 3 4 5 6 7
1 nc
2 3.32 nc
3 6.86 6.63 nc
4 10.24 10.20 6.00 nc
5 15.78 16.19 10.10 7.07 nc
6 13.11 13.00 7.28 3.87 3.87 nc
7 11.27 12.16 6.32 5.10 4.90 4.36 nc

nc: nuk janë llogaritur distancat.

Në tabelën e mësipërme janë matjet e distancave të ngjashmërive të shtatë
vrojtimeve dhe janë zbuluar rezultate të ndryshme nga matjet e korrelacionit. Përderisa

407
vrojtimi i parë, krijon një grup me vrojtimin e dytë dhe të tretë (3,32, 6,86), vrojtimi i
katërt, vrojtimi i pestë, vrojtimi i gjashtë dhe vrojtimi i shtatë krijojnë një grup tjetër
(10,24, 15,75, 13,11, 11,27). Këto grupe, përkundër vlerave të ulëta korrespondojnë me
vlera të mëdha dhe gjenden dallime të vogla dhe ngjashmëri të mëdha brenda grupeve. Në
vend të zgjedhjes së matjeve të korrelacionit, një hulumtues i cili përdor matjet e
përgjithshme të distancave, do të bëj interpretime shumë të ndryshme të rezultateve.
Grupet të cilat marrin për bazë matjet e korrelacionit formohen sipas mostrave të
ngjashme dhe jo sipas ndryshoreve të ngjashme. Grupet e formuara sipas matjeve të
distancës bëjnë krahasimin e ngjashmërive brenda ndryshoreve por mostrat mund të jenë
shumë të ndryshme nga njëra-tjetra. Matja më e përdorur e distancës është distanca e
Euklidit. Distanca e Euklidit supozon se ekzistojnë dy pika, respektivisht koordinatat dy
dimensionale (X1, Y1) dhe (X2, Y2). Distanca e Euklidit ndërmjet pikave është gjatësia e
vërtetë e një hipotenuze trekëndëshe. Ky koncept, mund t’i përgjithësoj në mënyrë të lehtë
ndryshoret e shtuara.

Në disa situata përdoren matjet alternative të shprehura si shuma e ndryshimeve
absolute të vrojtimeve ose shuma e ndryshimeve të katrorit. Kjo metodë quhet edhe
funksioni i distancës absolute apo city-block. Qasja city-block mund t’i ndaj dallimet e
llogaritura nën kushte të caktuara, por edhe mund të shkaktojë disa probleme. Në rastin
kur nuk ekziston lidhje ndërmjet ndryshoreve dhe pranohet sikur ekziston një lidhje e tillë,
grupet e formuara nuk do të jenë të vlefshme.

Një problem tjetër është edhe matja e ndryshoreve me matje të ndryshme. Për
shembull, supozojmë se kemi tri vrojtime A, B dhe C dhë bëhet një matje dy ndryshoresh.
Nga këto dy ndryshore, njëra le të jetë koha e harxhuar për të parë reklamën e një produkti
(minuta/sekonda) dhe mundësia e blerjes (përqindja).

Tabela 17.5: Kohët e Shikimit të Reklamës Sipas Vrojtimeve

Vrojtimi Mundësia e Blerjes (%) Minuta Sekonda
A 60 3.0 180
B 65 3.5 210
C 63 4.0 240

Distanca e thjeshtë të Euklidit, distanca absolute e Euklidit, shuma e ndryshimit të
katrorëve dhe distanca city-block të llogaritura me këto vlera janë paraqitur në tabelën e
mëposhtme. Sado që vlerat e distancave të jenë më të vogla, nënkupton që
ngjashmëritë/afërsitë janë po aq të mëdha.

Në qoftë se do të llogaritnim distancën e Euklidit, katrorëve të Euklidit dhe city-block
për çiftin e vrojtimeve A-B;

408
Distanca e Thjeshtë e Euklidit: (60-65)2 + (3,0-3,5)2 = 5, 5 = 5,025

Distancat e Kohës së Shikimit me Bazë Minutat

Çiftimi i Distanca e Distanca e Distanca
Vrojtimit Thjeshtë e Katrorëve City-Block
Euklidit të Euklidit
A-B 5.025 25.25 5.5
A-C 3.162 10.00 4.0
B-C 2.062 4.25 2.5

Distanca e Katrorëve të Euklidit: (60-65)2 + (3,0-3,5)2 = 25,25

Distanca City-Block: (60-65) + (3,0-3,5) = 5,5

Të njëjtat llogaritje janë bërë edhe për çiftin e vojtimeve A-C dhe B-C dhe janë
arritur vlerat e mësipërme në tabelë. Siç mund të kuptohet nga tabela, vrojtimet të cilat
përngjajnë më shumë njëra-tjetrës janë B dhe C (2,062, 4,25, 2,5) dhe vrojtimet A dhe C.
Kurse vrojtimet të cilat përngjajnë më pak njëra-tjetrës jane vrojtimet A dhe B (5,025,
25,25, 5,5). Të gjitha matjet e distancave japin rezultate në të njëjtën mënyrë, por distanca e
Euklidit e cila tregon katrorët e ndryshimeve absolute tregon rezultate të ndryshme.

Ndryshimet në matjet e njërës nga ndryshoret shkakton ndryshime në rezultatet e
ngjashmërisë. Kur në vend të kohës së shikimit minutave të merren sekondat, rezultatet e
paraqitura do të ndryshojnë si në tabelën e mëposhtme.

Tabela 17.6: Dallimet e Distancave Ndërmjet Vrojtimeve

Çiftimi i Distanca e Distanca e Distanca
Vrojtimit Thjeshtë e Katrorëve City-Block
Euklidit të Euklidit
A-B 30.41 925 35
A-C 60.07 3609 63
B-C 30.06 904 32

Në tabelën e mësipërme, mund të shihet se vrojtimet të cilat ngjajnë më shumë janë
B dhe C. Në këtë tabelë, vrojtimet të cilat ngjajnë më pak janë vrojtimet A dhe C. Përderisa
vrojtimet A dhe B përngjanin më pak kur koha e shikimit ishte marrë për minutat, gjatë
vlerësimit të sekondave, vlera e ngjashmërisë është rritur ndërmjet tyre. Matja e
ndryshores së kohës së shikimit ka një vend me rëndësi në llogaritje, kurse ndryshorja e
mundësisë së blerjes është më pak e rëndësishme. Gjatë llogaritjeve kur koha e shikimit
merret për minuta edhe mundësitë e blerjes shihet të kenë një peshë më të madhe. Për këtë

409
arsye, hulumtuesit duhet të specifikojnë patjetër në qoftë se kanë përdorur një matje të
ndryshores e cila është e mjaftueshme për të ndryshuar zgjidhjen e rezultateve. Prandaj,
rekomandohet qe hulumtuesit t’i shmangin matjet e ndryshoreve të cilat në masë të
mjaftueshme do të ndryshojnë rezultatet ashtu si në këtë shembull.

Një metodë tjetër standarte e përdorur në përgjithësi është edhe metoda e Distancës
Mahalanobis e cila bën kombinim drejtëpërdrejtë. Metoda e distancës Mahalanobis
llogaritet në atë mënyrë që distancat ndërmjet vrojtimeve mund të krahasohen me R2 të
analizës së regresionit.

Një hulumtues gjatë përdorimit të një matjeje të distancës duhet të kujtoj problemet
e specifikuara të saj. Rasti më i zakonshëm është kur matjet e ndryshme të distancës
dërgojnë në rezultate të ndryshme të grupeve. Hulumtuesit rekomandohen që të përdorin
metoda të ndryshme, të krahasojnë rezultatet me informata teorike dhe me shembuj të
punuar më parë.

17.1.6. MATJA E PARTERNITETEVE
Matja e partneriteteve të ngjashmërive (association measures of similarity)
përdoret vetëm në krahasimet e të dhënave jometrike. Për shembull, përgjigjet në formën
“po” apo “jo” janë të dhëna jometrike. Matja e partneriteteve të ngjashmërive bën
krahasime ndërmjet çdo dy përgjegjësve apo vlerëson shkallën e pajtimit. Forma më e
thjeshtë e matjes së parteriteteve të ngjashmërive është dhënia e përqindjes së formës së
përshtatjes të përgjigjedhënësve të cilët i janë përgjegjur pyetjes me “po” apo “jo”.

17.1.7. STANDARTIZIMI I TË DHËNAVE
Përpara se hulumtuesit të zgjedhin matjen e ngjashmërive, duhet t’i përgjigjen kësaj
pyetjeje: A është bërë standartizimi i të dhënave përpara llogaritjes së ngjashmërive?
Përgjigja e kësaj pyetjeje shpjegon disa pika të rëndësishme. Veçanërisht shumica e
matjeve të distancave janë mjaft të ndjeshme ndaj matësve të ndryshëm apo madhësive
ndërmjet ndryshoreve. Ashtu si në shembullin e mësipërm, ku rezultatet qenë ndryshuar
me rastin e ndryshimit të minutave në sekonda për kohën e shikimit. Zakonisht ndryshoret
të cilat tregojnë shpërndarje të madhe (devijim të madh standart), ndikojnë më shumë në
rezultatet e ngjashmërisë.

Me shtimin e ndryshoreve, edhe matjet e ndryshoreve mund të tregojnë dallim nga
njëra-tjetra. Për këtë arsye, të dhënat duhet të standartizohen përpara se të futen në
analizë. Për shembull, në qoftë se një pjesë e ndryshoreve është matur me matjen e Likertit,
pjesa tjetër mund të jetë matur me para, metër, litër, vit etj. Marrja e këtyre ndryshoreve së
bashku në analizë është gabim dhe do të shkaktojë rezultate të gabueshme. Prandaj, të
gjitha ndryshoret e analizës duhet të shprehen me të njëjtën vlerë.

410
Forma më e zakonshme e standardizimit është “rezultati Z” që bën konvertimin e
çdo ndryshoreje në vlera standarte. Për këtë përdoret formula “z = (xi-µ) / σ”. Sipas kësaj
formule, të gjitha vlerat konvertohen në një formë që mesatarja aritmetike ëshët “0” dhe
devijimi standart “1”. Në këtë mënyrë, bëhet standardizimi i të dhënave duke i sjellur të
dhënat e matjeve të ndryshme në një bazë të njëjtë. Në ditët e sotme, këto funksione bëhen
përmes programeve kompjuterike. Me programet e avancuara kompjuterike mund të
bëhen analizat e grupeve duke bërë procesimin e shumë ndryshoreve dhe vrojtimeve të
cilat nuk janë të standartizuara.

17.1.8. SUPOZIMET E ANALIZËS SË GRUPIMIT
Analiza e grupimit është një metodë e avancuar objektive për vlerësimin e
karakteristikave të strukturës së vrojtimeve. Në analizën e grupimit, hulumtuesit duhet të
përzgjedhin një mostër të besueshme e cila do të përfaqësojë në mënyrë të saktë
strukturën e popullimit. Hulumtuesit duhet të kuptojnë se suksesi i analizës së grupimit
është i lidhur me zgjedhjen e një mostreje të mirë. Prandaj duhet të bëhen përpjekje për të
zgjedhur një mostër të besueshme dhe rezultatet duhet të jenë në atë mënyrë që mund të
përgjithësojnë popullimin.

Me rritjen e numrit të ndryshoreve duhet të rritet edhe numri i vrojtimeve.
Përforcimi i sistemeve kompjuterike dhe rritja e vazhdueshme e përdorimit të programeve
të avancuara statistikore, ka ndikuar në rritjen e dëshirës së hulumtuesve për të zvogëluar
numrin e ndryshoreve dhe vrojtimeve. Por sipas një mendimi të përgjithshëm, numri i
vrojtimeve duhet të jetë sa 3-4 herë numri i ndryshoreve.

17.1.9. ZGJEDHJA E NJË ALGORITMI TË GRUPIMIT
Funksioni i grupimit bëhet në dy mënyra: grupimi hierarkik dhe grupimi
johierarkik. Metoda më e përdorur është metoda e grupimit hiearkik. Kjo metodë ndahet në
në dy pjesë, grupimi hierarkik kumulativ (agglomerative hierarchical clustering) dhe
grupimi hierarkik diviziv (divisive hierarchical clustering). Metoda më e përdorur dhe
aktive e grupimit hierarkik është metoda e hierarkisë kumulative. Kjo metodë, në fillim bën
grumbullimin e të gjitha vrojtimeve në një grup, pastaj ato vrojtime të cilat janë më shumë
kundër këtij grupi i ndan nga ky grup dhe mundëson krijimin e një grupi tjetër. Metoda
vendos vetë se sa grupe duhet të krijohen. Pjesa më superiore e metodës hierakike
kumulative është se mund të lexohet dhe interpretohet lehtë. Kurse pjesa më problematike
është mosqenia fikse dhe besueshmëria e ulët.

Ndryshe nga kjo, metoda më e përdorur në grupimin johierarkik është metoda e k-
mesatareve (k-means clustering). Grupimi johierarkik ndahet në tri teknika. Këto janë
pragu vijues (sequential threshold), pragu paralel (paralel threshold) dhe ndarja optimale
(optimizing partitioning). Rezultatet e secilës nga tri teknikat janë të përafërta me njëra-
411
tjetrën dhe përdorimi i vetëm njërës është i mjaftueshëm. Përdorimi i të dyjave, si metodës
hierarkike dhe johierarkike është i dobishëm sepse ofrohet mundësia për të krahasuar se
rezultatet e cilës metodë janë më të përshtatshme.

17.1.10. GRUPIMI HIERARKIK

Metoda më e përdorur brenda metodës hierarkike kumulative është metoda e
lidhjeve (linkage methods). Po ashtu përdoren edhe metoda e variancës dhe metoda
centrale. Metodat e lidhjes ndahen në tri pjesë, lidhja e vetme (single linkage), lidhja e plotë
(complete linkage) dhe lidhja mesatare (average linkage). Kurse funksionet e tyre;

Metoda e lidhjes së vetme: Kryesisht bazohet në distancën më të shkurtër. Bën
gjetjen e dy vrojtimeve të cilat janë më të përafërta me njëra-tjetrën dhe krijohet faza e
parë e bërthamës së grupit. Pas kësaj, gjen dy vrojtore të tjera të përafërta me njëra tjetrën
ose një vrojtore tjetër e cila gjendet afër kësaj selie të grupit dhe bën zgjerimin e grupit. Në
këtë mënyrë, mund të krijohet më shumë se një grup.

Metoda e lidhjes së plotë: I përngjan metodës së lidhjes së vetme. Dallimi i vetëm
është fillimi nga dy ndryshore të largëta.

Metoda e lidhjes mesatare: Nuk fillon nga vrojtimet ekstreme. Merr për bazë
vrojtimin i cili gjendet në mes të grupit.

Metoda e Variancës (Metoda Ward’s): Merr për bazë distancën mesatare të
vrojtimit që gjendet në mes të grupit nga vrojtimet e tjera që gjenden në grup. Ka dobi nga
devijimi total i katrorëve.

Metoda e Qendrës: Merr për bazë mesataret e vrojtimeve të cilat përbëjnë një grup.
Në qoftë se në një grup ka vetëm një vrojtim, vlera e këtij vrojtimi pranohet si qendër.

17.1.11. PËRCAKTIMI I NUMRIT TË GRUPEVE

Një çështje tjetër kritike në metodën e grupimit hierarkik është përcaktimi i numrit
të grupeve. Problemi i përcaktimit të numrit të grupeve nuk ekziston në grupimin
johiearkik sepse në grupimin johierarkik numri i grupeve mund të përcaktohet më parë.
Por në grupimin hiearkik, përcaktimi i numrit të grupeve varet nga vendimi i rezultateve të
analizës. Ky përcaktim mund të bëhet në tri mënyra.

17.1.12. KOEFICIENTËT E DISTANCËS

Koeficientët e distancës mund të merren si matje për përcaktimin e numrit të
grupeve. Në këtë rast koeficientët e tabelës kumulative apo grafiku i pemës mund të jenë

412
përcaktues. Në fund të temës, gjatë shqyrtimit të shembullit, do të vërehet një rritje e
madhe e koeficientëve në fazën e shtatëmbëdhjetë, tetëmbëdhjetë dhe nëntëmbëdhjetë
(79.667,172.667, 328.600).

17.1.13. GRAFIKU I PEMËS
Gjatë shqyrtimit edhe të grafikut të pemës nëpër aplikimet e shembujve, mund të
arrihen rezultatet e njëjta. Vrojtimet e shembullit në vazhdim, shihet të grupohen më
shumë në tri grupe (14- - - 18), (2- - - 20) dhe (3- - - 15). Në grupin e parë dhe të dytë
gjenden 6 vrojtime dhe në grupin e tretë 8 vrojtime. Këto vrojtime janë përcaktuar pranë
grafikut të pemës.

Programi SPSS, do të shfaq dritaren e mëposhtme për grumbullimin hierarkik.

Figura 17.2: Dritarja e Grupimit Hierarkik

Këtu në qoftë se dëshirojmë që programi të bëj vetë grupimin etikohet përzgjedhja
“None”, në qoftë se dëshirohet një grupim fiks etikohet përzgjedhja “Sing solution”, në qoftë
se dëshirohet një interval i caktuar i grupeve (p.sh. më së paku 2 dhe më së shumti 4),
etiketohet përzgjedhja “Range of solutions”.

17.1.14. GRUPIMI JOHIERARKIK
Metoda e përdorur në grupimin johierarkik është metoda e grupimit të k-
mesatareve. Këtu mund të përcaktohet më parë numri i grupeve. Kjo bëhet duke u bazuar
në njohuritë dhe përvojat e hulumtuesit. Pastaj bëhet zgjedhja e vojtimeve tipike për secilin
grup. Vrojtimet e ngjashme, grupohen një nga një përrreth vrojtimit tipik. Këtu duke
përdorur llojet e testit ANOVA shikohen mesataret e secilit vrojtim që përbëjnë grupin

413
sipas ndryshoreve. Avantazhi më i lartë është besueshmëria. Përkundër kësaj problemi i
vetëm është interpretimi i vështirë.

Edhe grupimi johierarkik ndahet në tri pjesë përbrenda vetes. Këto janë pragu
vijues (sequential threshold), pragu paralel (paralel threshold) dhe ndarja optimale
(optimizing partitioning). Rezultatet e secilës nga tri teknikat janë të përafërta me njëra-
tjetrën dhe përdorimi i vetëm njërës është i mjaftueshëm.

Ngaqë në grupimin e k-mesatareve numri i grupeve përcaktohet nga hulumtuesi,
është e nevojshme që të sqarohen disa çështje. E para është numri i përsëritjeve të
funksioneve (iteration numbers) dhe kriteri i konvergjencës (convergence criterion).
Burimet sugjerojnë që funksionet duhet të përsëriten më së shumti deri në dhjetë herë dhe
kriteri i konvergjencës të jetë një numër i vogël sipas mundësive ndërmjet 0 dhe 1. Me
zvogëlimin e kësaj norme, hudhja e vrojtimeve nëpër grupe është më e besueshme.

Një çështje tjetër kritike në grupimin e mesatareve k është edhe distanca e
anëtarësisë së grupit të vrojtimeve nga qendra e grupit të vrojtimeve. Këto dy të dhëna
tregojnë edhe homogjenitetin e vrojtimeve që bëjnë pjesë në grup, edhe afërsinë ndërmjet
tyre. Po ashtu, qendrat fillestare të grupit dhe mesataret e ndryshoreve të çdo grupi
gjenden me ANOVA.

Qendrat e Para të Grupeve: Është e nevojshme që të dihen qendrat e grupeve të
përcaktuara më parë sipas ndryshoreve. Qendrat e para grupore nuk janë mesatare
aritmetike, ato tregojnë vetëm qendrën e çdo grupi sipas asaj ndryshoreje.

Informatat e Përsëritjes: Tregojnë numrin e pësëritjeve të funksionit. Sugjerohen
deri në 10 përsëritje (iteracione). Por në qoftë se grupimi ndodh me më pak funksione,
atëherë përsëritja nuk ka nevojë që të vazhdohet deri në 10.

Anëtarësia e Grupeve: Është një nga daljet me të rëndësishme në grupimin
johierarkik. Këtu përcaktohet se cili vrojtim është anëtar i cilit grup. Nga kjo tabelë është e
mundshme që të gjendet distanca e anëtarit të secilit vrojtim nga grupi në të cilin gjendet.
Në këtë mënyrë ëshë e mundur që të identifikohen vrojtimet më të rëndësishme brenda
grupit. Hulumtuesit mund të nxjerrin rezultate të rëndësishme nga kjo tabelë. Për
shembull, duke i sjellur së bashku anëtarët e një grupi dhe duke vrojtuar karakteristikat e
përbashkëta, mund të bëhet emërimi i vrojtimeve në këtë grup. Ky funksion edhe pse i
përngjan emërimit në analizën faktoriale, në analizën faktoriale përderisa emërohen
ndryshoret, në analizën e grupimeve emërohen vrojtimet.

Qendrat e Fundit të Grupeve: Është një tjetër dalje me rëndësi në analizën e
grupimit johierarkik. Tregojnë mesataret e ndryshoreve sipas grupeve. Përfshin rezultate
shumë të rëndësishme rreth ndryshoreve dhe grupeve.

414
Distancat Ndërmjet Qendrave të Fundit të Grupeve: Ky rezultat tregon largësinë
e një grupi nga një grup tjetër. Vlerat e distancës ndërmjet dy grupeve sado që të jenë të
vogla në krahasim me të tjerat, mund të thuhet se këto dy grupe janë po aq të afërta njëra
me tjetrën në krahasim me grupet tjera. Me rritjen e vlerave të distancës, ngjashmëria
zvogëlohet. Këto rezultaten bëhen më të kuptimta dhe më të rëndësishme pas emërimit të
grupeve.

Rezultatet ANOVA: Rezultatet ANOVA në analizën e grupimit përdoren për të
mësuar dallimet e ndryshoreve sipas grupeve. Dallimet e ndryshoreve sipas grupeve janë
normale sepse me analizën e grupimit dallimi ndërmjet grupeve është përcaktuar në
nivelin më të lartë. Të dhënat nga ANOVA përdoren vetëm për qëllime përshkruese.

Numri i Njësive në Grupe: Është e rëndësishme se sa anëtar gjenden në secilin
grup. Nuk është kusht që numri i anëtarëve të jetë i njëjtë në çdo grup por as nuk
preferohet situata kur ekzistojnë dallime të mëdha ndërmjet numrit të anëtarëve të
grupeve.

17.1.15. RREGULLIMI I ANALIZËS SË GRUPIMIT
Që të jetë e pranueshme një zgjidhje e analizës së grupimit duhet që hulumtuesi të
shqyrtojë strukturat themelore që prezantojnë grupet. Mirëpo duhet të kihet kujdes në
rastet e jashtëzakonshme kur grupet përbëhen vetëm nga një apo dy vrojtime apo kur
madhësitë e grupeve janë plotësisht të ndryshme nga njëra-tjetra. Një hulumtues gjatë
shqyrtimit të rezultateve i cili ndeshet me grupe të cilat kanë madhësi shumë të ndryshme
nga njëra-tjetra, në fillim duhet që të shqyrtojë literaturën, të krahasojë rezultatet e
arritura me studimet e bëra më parë dhe të krahasojë rezultatet e arritura me qëllimet dhe
pritjet e hulumtimit.

Një problem tjetër janë grupet një vrojtimshe. Në qoftë se ekzistojnë vrojtime të tilla
të veçanta, këto vrojtime mund të nxirren nga analiza qysh në fillim. Në qoftë se ka grupe
një anëtarësh (një vrojtim apo në krahasim me grupet e tjera shumë i vogël), hulumtuesi
duhet të vendos këtë: Ky grup a tregon një strukturë të vlefshme brenda mostrës? Në qoftë
se jo, ky vrojtim mund të nxirret. Në qoftë se nxirret një vrojtim, sidomos kur punohet me
zgjidhje hierarkike, hulumtuesit duhet që ta përsërisin analizën e grupimit dhe duhet të
bëhet njohja e grupeve përsëri.

17.1.16. INTERPRETIMI I GRUPEVE
Rreshti i parë në analizën e grupimit hierarkik, tregon fazën e parë të analizës së
grupimit dhe kolona e fazës tregon se nga sa grupe përbëhet zgjidhja. Nën titullin “Grupet e
Kombinuara” në Grupin 1 mund të shihen dy vrojtimet me të përafërta me njëra-tjetrën.
Kështu, pas kësaj, kolona “Koeficientët” mat distancën ndërmjet grupeve. Ky koeficient

415
njihet si distanca e katrorëve euklidian (sqaured euclidean distance) dhe sado që të jetë i
vogël ky numër, tregon që vrojtimet po aq (ngjajnë) janë më afër njëra-tjetrës. Kolona “Faza
e Parë e Paraqitjes së Grupeve” tregon se në cilën fazë formohet një grup. Kurse kolona
“Faza e Ardhshme” tregon se dy vrojtimet e atij rreshti në cilën fazën do të formojnë një
grup duke u bashkuar me një vrojtim tjetër. Në fazën e dytë dy vrojtimet e dyta shihet të
jenë më të përafërta me njëra-tjetrën. Lidhjet ndërmjet vrojtimeve gjatë fazave dhe
interpretimet do të tregohen në më detaje gjatë shqyrtimit të shembullit. Të gjitha fazat
vazhdojnë derisa të arrihet në fazën e fundit. Në fazën e fundit, tashmë distancat ndërmjet
vrojtimeve do të jenë rritur. Në fund, të gjitha vrojtimet janë futur nën një grup. Ky
shpjegim është i mundur të bëhet edhe përmes grafikut të pemës, duke e lexuar nga e majta
në të djathtë.

17.1.17. VLEFSHMËRIA DHE PROFILI I GRUPEVE
Vlefshmëria e cila garanton besueshmërinë e punimit të hulumtuesit shpreh se
zgjidhja e grupimit përfaqëson popullimin e përgjithshëm dhe në këtë mënyrë mund të
bëhet përgjithësimi për objektet/individët e tjerë dhe se kjo është e pandryshueshme. Për
të krahasuar rezultatet e analizës së grupimit dhe për të vlerësuar qëndrueshmërinë e
rezultateve ekzistojnë metoda të ndryshme nga analiza e grupimit. Në të njëjtën kohë, për
shkak të kufizimeve të kohës dhe kostove apo mosarritja me lehtësi te klientët prej të cilëve
janë mbledhur të dhënat, nuk është edhe aq e mundur që të aplikohen këto qasje. Një qasje
e përgjithshme e pranuar në vlerësimin e vlefshmërisë është ndarja e mostrave në dy
grupe. Bëhet analiza e grupimit për secilin grup të ndarë dhe krahasohen rezultatet. Në një
formë tjetër, merren qendrat e grupeve nga njëri grup dhe këto qendra përdoren për të
njohur grupet e tjera të grupit të dytë. Pastaj kontrollohet vlefshmëria duke i krahasuar
rezultatet ndërmjet dy grupeve.

Pasi të krahasohen rezultatet e analizës së grupimit hiearkik dhe grupit johierarkik të
vrojtimeve të ndryshoreve të përcaktuara, mund të përcaktohet profili i grupeve. Tabela
më e rëndësishme e cila do të përdoret në përcaktimin e profilit është “qendrat finale të
grupeve”. Gjatë shqyrtimit të grupeve, mund të bëhet interpretim rreth karakteristikave të
këtyre grupeve dhe duke i identifikuar profilet e tyre mund t’u jipen emra grupeve.

17.2. SHEMBULL APLIKIMI
Një pronar galerie duke shqyrtuar profilet e klientëve dëshiron të identifikojë se a
ekziston ndonjë dallim ndërmjet profesionit të klientëve, rrjedhimisht statusit të të
ardhurave dhe pikëpamjeve ndaj automobilave. Në fund të hulumtimit, pronari i galerisë
do t’i ndryshojë shërbimet në lidhje me grupin shënjestër të cilët interesohen më shumë
me makina dhe për të siguruar kënaqësinë konsumatore. Duke përdorur teknikën e

416
anketës, është kërkuar vlerësimi i deklaratave më poshtë nga një grup i mostrës i përbërë
nga 20 vetë të cilët janë zgjedhur në mënyrë të rastësishme gjatë ardhjes në galeri. Anketa
është përgatitur me 7 Matjet e Likertit dhe është kërkuar nga pjesëmarrësit që të
identifikojnë edhe profesionin e tyre.

X1: Më pëlqen që të merrem (interesohem) me makina.

X2: Blerja e makinës e vështirëson buxhetin tim.

X3: Në ditët e sotme është e domosdoshme që të kesh një makinë.

X4: Gjatë blerjes së makinës në fillim i kushtoj kujdes çmimit.

X5: Nuk i di karakteristikat e makinave.

X6: Nuk më pëlqen që ta ndërroj makinën time.

Shembulli në fillim është zgjidhur me metodën e analizës së grupimit hierarkik dhe
pastaj me metodën e analizës së grupimit johiearkik.

17.2.1. ANALIZA E GRUPIMIT HIERARKIK
Hapi 1: Gjashtë deklaratat e 20 vrojtimeve janë ngarkuar si më poshtë në “Data
Editor”. Këtu gjatë njohjes së ndryshoreve, llojet e ndryshoreve X1....X6 duhet të jenë
“numeric” dhe ndryshorja e profesionit duhet të jetë “string”.

417
Hapi 1: Hyrja e të Dhënave në SPSS

Hapi 2: Nga komanda “Analyze” përzgjedhjet “Classify” dhe pas kësaj përzgjedhet
komanda “Hierarchical Cluster”.

418
Hapi 2: Menyja Filluese e Analizës së Grupimit

Hapi 3: Në dritaren e hapur, ndryshoret X1...X barten në kutinë “Variable(s)” dhe
ndryshorja “profesioni” bartet në kutizën “Label Cases By”.

Hapi 3: Dritarja e Analizës së Grupimit

419
Hapi 4: Në fillim klikohet në komandën “Statistics” dhe bëhet etiketimet e
nevojshme të treguara më poshtë.

Hapi 4: Dritarja e Statistikave

Hapi 5: Duke klikuar “Continue” bëhet kthimi te dritarja kryesore dhe pastaj
klikojmë komandën “Plots” ku bëhen etiketimet e mëposhtme.

Hapi 6: Përsëri duke klikuar butonin “Continue” bëhet kthimi te dritarja kryesore.
Këtë radhë duke klikuar komandën “Methods” hapet dritarja e më poshtme dhë bëhen
përzgjedhjet e nevojshme.

420
Hapi 5: Dritarja e Grafiqeve

Hapi 6: Dritarja e Metodave

421
Në fund duke klikuar “Continue” bëhet kthimi në dritaren kryesore dhe për fitimin e
rezultateve klikohet “OK” dhe përfitohen rezultatet e mëposhtme.

Tabela 17.7: Rezultatet e Analizës së Grupimit

a,b
Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent

20 100.0 0 .0 20 100.0

a. Squared Euclidean Distance used
b. Ward Linkage

Tabela e mësipërme tregon se analiza është kryer nga 20 vetë dhe tregon
përdorimin e distancës së katrorëve euklidian dhe metodës Ward.

Agglomeration Schedule

Cluster Combined Stage Cluster First Appears

Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage

1 14 16 1.000 0 0 6
2 6 7 2.000 0 0 7
3 2 13 3.500 0 0 15
4 5 11 5.000 0 0 11
5 3 8 6.500 0 0 16
6 10 14 8.167 0 1 9
7 6 12 10.500 2 0 10
8 9 20 13.000 0 0 11
9 4 10 15.583 0 6 12
10 1 6 18.500 0 7 13
11 5 9 23.000 4 8 15
12 4 19 27.750 9 0 17
13 1 17 33.100 10 0 14
14 1 15 41.333 13 0 16
15 2 5 51.833 3 11 18
16 1 3 64.500 14 5 19
17 4 18 79.667 12 0 18
18 2 4 172.667 15 17 19
19 1 2 328.600 16 18 0

422
Rreshti i parë tregon fazën e parë të analizës së grupimit dhe përbëhet nga 19 grupe.
Nën titullin “Grupet e Kombinuara” (Cluster Combined), në Grupin 1, vrojtimi i
katërmbëdhjetë (pra student) me vrojtimin e gjashtëmbëdhjetë (pra punëtor) në Grupin 2,
shihet të jenë vrojtimet më të përafërta me njëra-tjetrën. Kështu, kolona e ardhshme
“Koeficientët” mat distancën ndërmjet vrojtimeve dhe distanca ndërmjet këtyre dy
vrojtimeve shihet të jetë 1. Ky koeficienti njihet si distanca e katrorëve euklidian (squared
euclidean distance) dhe tregon se këto dy vrojtime janë më të përafërta me njëra-tjetrën.
Kolona “Faza e Parë e Paraqitjes së Grupeve” (Stage Cluster First Appears) tregon se në
cilën fazë formohet një grup. Kurse kolona “Faza e Ardhshme” tregon se dy vrojtimet e atij
rreshti në cilën fazë formojnë një grup duke u bashkuar me një vrojtim tjetër. Për shembull,
në rreshtin e parë, faza e ardhshme shihet të jetë faza e gjashtë. Pra vrojtimi i
katërmbëdhjetë dhe gjashtëmbëdhjetë të cilët marrin pjesë në këtë rresht, do të formojnë
grupin e parë në fazën e gjashtë duke marrë edhe një tjetër në mesin e tyre. Kur të shkohet
në fazën e gjashtë, shihet se vrojtimi i dhjetë (polic) u bashkangjitet vrojtimit të
katërmbëdhjetë dhe të gjashtëmbëdhjetë dhe se në kolonën “Faza e Parë e Paraqitjes së
Grupeve” në fazën e gjashtë në “Grupi ” është formuar një grup.

Në fazën e dytë, vrojtimet më të përafërta janë vrojtimi i gjashtë dhe i shtatë
(inxhinier dhe student). Distanca ndërmjet tyre është 2. Në fazën e shtatë, duke iu
bashkangjitur një vrojtim tjetër këtyre dyve, formohet një grup. Po të shikojmë fazën e
shtatë, mund të vërejmë se vrojtimi i dymbëdhjetë (tregtar) u bashkohet vrojtimit të
gjashtë dhe të shtatë dhe në kolonën “Grupi 1” të “Fazës së Parë të Paraqitjes së Grupeve”
është formuar grupi i dytë.

Kur të shikojmë fazën e tretë, mund të vërejmë bashkimin e vrojtimit të dytë dhe të
trembëdhjetë (pensioner dhe kontabilist). Distanca ndërmjet tyre është 3,5. Këta do të
grupohen në fazën e pesëmbëdhjetë duke marrë një të ngjashëm. Kur të shikohet faza e
pesëmbëdhjetë, shihet se këtyre u është shtuar vrojtimi i pestë (shërbyes civil). Në këtë
grup formohet selia e tretë e një grupi. Por këtu shfaqet një situatë e ndryshme. Nga “Faza
e Parë e Paraqitjes së Grupeve” në “Grupin ” shihet grupi i tretë dhe në të njëjtën kohë në
“Grupin ” shihet numri 11. Kjo tregon që vrojtimi i pestë është element i grupit të tretë
dhe në të njëjtën kohë në fazën e ardhshme do të jetë element i grupit të njëmbëdhjetë.

Të gjitha fazat vazhdojnë në këtë mënyrë derisa të arrihet në fazën e
nëntëmbëdhjetë. Tashmë në fazën e nëntëmbëdhjetë distancat ndërmjet vrojtimeve janë
rritur dukshëm. Në fund, të gjitha vrojtimet janë mbledhur nën një grup të vetëm. Ky
shpjegim është i mundur të bëhet edhe përmes grafikut të pemës duke e lexuar nga e majta
në të djathtë.

423
Tabela 17.8: Grafiku i Pemës

Gjatë shqyrtimit të shembullit, vërehet një rritje e madhe e koeficientëve në fazën e
shtatëmbëdhjetë, tetëmbëdhjetë dhe nëntëmbëdhjetë (79.667,172.667, 328.600). Kurse në
grafikun e pemës, vrojtimet shihet të jenë ndarë më shumë në tri grupe (14- - - 18), (2- - -
20) dhe (3- - - 15). Në grupin e parë dhe të dytë gjenden 6 vrojtime dhe në grupin e tretë 8
vrojtime. Këto vrojtime janë përcaktuar pranë grafikut të pemës. Gjatë shqyrtimit të
koeficientëvë të distancës dhe grafikut të pemës, mund të shihet qartë që do të jenë tri
grupe. Por në rastin kur janë 2 grupe apo 4 grupe, për të parë se në cilin grup do të jenë
vrojtimet dhe sa vrojtime do të jenë në secilin grup, etiketohet përzgjedhja “Range of
solutions”.

424
Hapi 7: Përcaktimi i Numrit të Dëshiruar të Vrojtimeve në Grupet e Përfituara

Pasi të bëhen përzgjedhjet e duhura klikohet butoni Continue dhe do të paraqiten
rezultatet e mëposhtme në “Data Editor”.

Në qoftë se dëshirohet që numri i grupeve të jetë katër, në grupin e katërt paraqitet
vetëm vrojtimi i tetëmbëdhjetë (profesor). Kjo nuk është një zgjidhje logjike. Në qoftë se

425
dëshirohet që të jenë 2 grupe, në grupin e parë paraqiten 8 vrojtime dhe në grupin e dytë
12 vrojtime. Prirja e vrojtimit të katërt (profesor), dhjetë (polic), katërmbëdhjetë (student),
gjashtëmbëdhjetë (profesor) dhe nëntëmbëdhjetë (shërbyes civil) të grupit të dytë për të
formuar një grup përbrenda vetes mund të shihet edhe nga grafiku i pemës. Në këtë rast,
grupi duhet të ndahet në dy pjesë për vrojtimet e tjera të mbetura në grup, gjë që kjo tregon
se numri ideal i grupeve është tre.

17.2.2. ANALIZA E GRUPIMIT JOHIERARKIK
Hapi 1: Gjashtë deklaratat e 0 vrojtimeve janë ngarkuar si më poshtë në “Data
Editor”.

Hapi 1: Hyrja e të Dhënave në SPSS

426
Hapi 2: Nga komanda “Analyze” përzgjedhet “Classify” dhe komanda “K-Means
Cluster”.

Hapi 2: Menyja Filluese e Analizës së Grupimit Johierarkik

Hapi 3: Në dritaren e hapur ndryshoret X1...X6 barten në kutinë “Variables dhe
ndryshorja “profesioni” në kutizën “Label Cases by”. Numri i grupeve përcaktohet 3.
Klikohet në komandën “Iterate” dhe hapet dritarja përkatëse.

427
Hapi 3: Dritarja e Analizës së Grupimit Johierarkik

Hapi 4: Pasi të hapet dritarja “Iterate”, përcaktohet 10 “Maximum Iterations” dhe
0, “Convergence Criterions”.

Hapi 4: Dritarja e Iteracionit

428
Hapi 5: Përzgjedhja e radhës është komanda “Save”. Kur të klikohet në komandën
“Save” do të hapet dritarja përkatëse dhe bëhen etiketimet e nevojshme si më poshtë.
Rezultati i këtyre etiketimeve nuk është në dalje, por do të renditen afër vrojtimeve në
“Data Editor”.

Hapi 5: Dritarja e Ruajtjes së Ndryshoreve të Reja

Hapi 6: “QCL_1” e cila do të shfaqet në Data Editor tregon për secilën ndryshore në
cilin grup ndodhet dhe “QCL_ ” tregon distancën e secilit vrojtim nga qendra e grupit.

Hapi 6: Paraqitja e Vrojtimeve të Përfituara në Ekranin e të Dhënave në SPSS

429
Hapi 7: Në fund, duke klikuar komandën “Options” bëhen etiketimet e mëposhtme.

Hapi 7: Dritarja e Përzgjedhjeve

Dhe krejt në fund, klikohet butoni Continue dhe OK dhe përfitohen rezultatet e
mëposhtme.

Tabela 17.9: Qendrat e Para të Grupeve

Initial Cluster Centers

Cluster

1 2 3

Më pëlqen që të merrem me
4.00 2.00 7.00
makina.
Blerja e makinës e
6.00 3.00 2.00
vështirëson buxhetin tim.
Në ditët e sotme është e
domosdoshme që të kesh 3.00 2.00 6.00
një makinë.
Gjatë blerjes së makinës në
7.00 4.00 4.00
fillim i kushtoj kujdes çmimit.
Nuk i di karakteristikat e
2.00 7.00 1.00
makinave.
Nuk më pëlqen që t’a
7.00 2.00 3.00
ndërroj makinën time.

430
Qendrat e para të grupeve (Initial Cluster Centers): Siç u përcaktua më parë që
do të jenë tri grupe, është e dobishme që të gjenden qendrat e këtyre grupeve të
ndryshoreve. Vlerat e qendrave të grupeve, tregojnë qendrat e secilit grup në lidhje me atë
ndryshore.

Tabela 17.10: Tabela e Përsëritjeve (Iteration History)

a
Iteration History

Change in Cluster Centers

Iteration 1 2 3

1 2.154 2.102 2.550
2 .000 .000 .000

a. Convergence achieved due to no or small
change in cluster centers. The maximum
absolute coordinate change for any center is
.000. The current iteration is 2. The minimum
distance between initial centers is 7.746.

Tabela e Përsëritjeve (Iteration History): Tabela e përsëritjeve jep numrin e
përsëritjeve. Në shembull, qenë sugjeruar më shumë 10 përsëritje. Mirëpo programi tregon
se në 2 përsëritje janë formuar 3 grupe. Prandaj, nuk ka qenë e nevojshme të bëhen 10
përsëritje.

431
Tabela 17.11: Anëtarësia e Grupeve (Cluster Membership)

Cluster Membership

Case Number profesioni Cluster Distance

1 Doktor 3 1.414
2 Pensioner 2 1.323
3 Investues 3 2.550
4 Profesor 1 1.404
5 Shërbyes civil 2 1.848
6 Inxhinier 3 1.225
7 Student 3 1.500
8 Doktor 3 2.121
9 Amvise 2 1.756
10 Polic 1 1.143
11 Punëtor 2 1.041
12 Tregtar 3 1.581
13 Kontabilist 2 2.598
14 Student 1 1.404
15 Avokat 3 2.828
16 Punëtor 1 1.624
17 Arkitekt 3 2.598
18 Profesor 1 3.555
19 Shërbyes civil 1 2.154
20 Infermiere 2 2.102

Tabela e Anëtarësisë së Grupeve (Cluster Membership): Nga kjo tabelë mund të
nxirren rezultate me rëndësi. Për shembull, duke i vlerësuar së bashku vrojtimet e secilit
grup (kolona cluster) dhe duke i shqyrtuar karakteristikat e përbashkëta të këtyre grupeve
mund t’u jipet një emër i përbashkët.

432
Tabela 17.12: Qendrat e Grupeve të Fundit (Final Cluster Centers)

Final Cluster Centers

Cluster

1 2 3

Më pëlqen që të merrem me
3.50 1.67 5.75
makina.
Blerja e makinës e
5.83 3.00 3.63
vështirëson buxhetin tim.
Në ditët e sotme është e
domosdoshme që të kesh 3.33 1.83 6.00
një makinë.
Gjatë blerjes së makinës në
6.00 3.50 3.13
fillim i kushtoj kujdes çmimit.
Nuk i di karakteristikat e
3.50 5.50 1.88
makinave.
Nuk më pëlqen që t’a
6.00 3.33 3.88
ndërroj makinën time.

Kjo tabelë jep mesataret e gjashtë ndryshoreve në 3 grupe. Për shembull, grupit të
tretë i pëlqen më shumë që të merret me makina (5,75), kurse grupit të parë (3,50) i pëlqen
më së paku.

Tabela 17.13: Distancat Ndërmjet Qendrave të Fundit të Grupeve

Distances between Final Cluster Centers

Cluster 1 2 3
1 5.568 5.698
2 5.568 6.928
3 5.698 6.928

Nga kjo tabelë mund të themi se grupi i parë dhe grupi i dytë janë më të përafërt me
njëri-tjetrin dhe se grupi i dytë dhe grupi i tretë janë më larg njëri-tjetrit. Kjo do të thotë që
grupi i parë merr pjesë në mes të grupit të dytë dhe grupit të tretë.

433
Tabela 17.14: Numri i Vrojtimeve Përkatëse Për Secilin Grup

Number of Cases in each
Cluster

Cluster 1 6.000

2 6.000

3 8.000
Valid 20.000
Missing .000

Në tabelën e mësipërme janë dhënë numrat e vrojtimeve përkatëse për secilin grup.

Tabela 17.15: Rezultatet e ANOVA-së së Analizës së Grupimit

ANOVA

Cluster Error

Mean Square df Mean Square df F Sig.

Më pëlqen që të merrem me
29.108 2 .608 17 47.888 .000
makina.
Blerja e makinës e
13.546 2 .630 17 21.505 .000
vështirëson buxhetin tim.
Në ditët e sotme është e
domosdoshme që të kesh 31.392 2 .833 17 37.670 .000
një makinë.
Gjatë blerjes së makinës në
15.713 2 .728 17 21.585 .000
fillim i kushtoj kujdes çmimit.
Nuk i di karakteristikat e
22.537 2 .816 17 27.614 .000
makinave.
Nuk më pëlqen që t’a
12.171 2 1.071 17 11.363 .001
ndërroj makinën time.

Rezultatet e ANOVA-së brenda analizës së grupimit duhet të përdoren për të
mësuar dallimet e ndryshoreve sipas grupeve. Dallimet e ndryshoreve sipas grupeve janë
normale sepse analiza e grupimit e ka krijuar vetë këtë ndryshim dhe e ka bërë maksimal
dallimin ndërmjet grupeve. Kështu që, shpërndarja e vrojtimeve nëpër grupe nuk është e
rastësishme.

434
435
18. MATJA SHUMËDIMENSIONALE
(MULTIDIMENSIONAL SCALING, MDS)

Analiza e matjes shumëdimensionale është një metodë statistikore e dobishme
për zbulimin e marrëdhënieve ndërmjet objekteve duke përfituar nga distancat, në rastet
kur nuk janë të njohura marrëdhëniet ndërmjet objekteve, mirëpo mund të llogariten
distancat ndërmjt tyre.

Fusha e aplikimit të analizës shumëdimensionale është jashtëzakonisht e gjerë.
Mund të aplikohet edhe në ndryshoret metrike edhe në ndryshoret jometrike. Po ashtu, jep
mundësinë e rregullimit të objekteve të ndryshme në mënyrën më të mirë me më pak
madhësi të mundura sipas ngjashmërive dhe dallimeve të tyre.

Shkurtimisht, MDS-ja ndihmon në përcaktimin e marrëdhënieve ndërmjet objekteve
të cilat shfaqen në një hapësirë prej k-madhësish, duke i shfaqur objektet në një hapësirë
konceptuale me më pak madhësi (dy, tri) në një formë shumë të afërt me pozitën e tyre
origjinale. Qëllimi i përgjithshëm i analizës është nxerrja në shesh e strukturës së objekteve
në një formë të afërt të formës origjinale (duke përdorur vlerat e distancës) me më pak
madhësi që është e mundur. Me anë të kësaj teknike sigurohet reduktimi i marrëdhënieve
komplekse ndërmjet objekteve apo individëve në matricën e të dhënave shumë-
dimensionale në madhësi të cilat mund të kuptohen dhe shpjegohen më lehtë.

MDS-ja është një metodë e dobishme edhe për zbulimin e ngjashmërive, përveç
dallimeve. Në këtë kontekst është një metodë e cila përdoret në shumë fusha, si mjekësi,
psikologji, shkencat shoqërore, hulumtimet e marketingut etj. Për shembull, në marketing,
në zgjedhjen e llojeve dhe markave të veturave të ndryshme nga individët, përdoret
metoda MDS për të zbuluar ngjashmëritë apo dallimet e individëve dhe veturave nga njëri-
tjetri. Në të njëjtën mënyrë, në mjekësi, analiza e matjes shumëdimensionale përdoret për
të zbuluar ngjashmëritë e përcaktuara të cilat dalin në shesh gjatë diagnozës së grupeve të
të sëmundjeve të caktuara ose në psikologji për të zbuluar dallimet ndërmjet qëndrimeve
të personave.

18.1. MATJA DHE MATËSI
Në MDS është shumë e rëndësishme matja e të dhënave dhe përcaktimi se sipas cilit
lloj të matjes janë matur. Në MDS përcaktohet teknika e matjes së matricës së distancës
sipas llojit të të dhënave. Në këtë kontekst, do të shpjegohet shkurtimisht tema e matjes
dhe teknikat e matjes.

436
Matja paraqet vrojtimin e çfarëdo karakteristike të të gjallëve, gjësendeve apo
ngjarjeve dhe rezultatet e vrojtimit, pra shkallët e karakteristikës së vrojtuar shprehen me
numra dhe simbole.

Në përdorimin efektiv dhe të dobishëm të teknikave statistikore është shumë i
rëndësishëm matësi i miratuar me anë të hulumtimeve statistikore. Matësi është paraqitje
e rezultateve të matjes sipas rregullave të caktuara dhe në bazë, ekzistojnë katër lloje të
matësit. Këta janë:

 Matësi klasifikues; është lloji më i thjeshtë i matjes i cili siguron vetëm njohjen
e objekteve që janë në shqyrtim me anë të numrave dhe simboleve të
përcaktuara. Mirëpo numrat dhe simbolet e përcaktuara këtu kryejnë vetëm
funksionin e emrit. Për shembull, për nivelin e edukimit mund të bëhet një
klasifikim në këtë mënyrë: 1-Shkollë e mesme, 2-Bachelor, 3-Master, 4-
Doktoraturë.
 Matësi renditës; ashtu si në matësin klasifikues, objektet e ngjashme të
vlerësuara shprehen përsëri me numër ose simbol të njëjtë, mirëpo ka edhe
karakteristikën e të shprehurit se ku gjendet një objekt i vlerësuar në krahasim
me tjetrin. Për shembull, në një anketë e cila mat prirjen tonë, renditja mund të
bëhet në formën nga më e mira te më e keqja, si 1: Pajtohem plotësisht, 2:
Pajtohem, 3: I Pavendosur, 4: Nuk Pajtohem, 5: Nuk Pajtohem Aspak.
 Në matësin intervalor distancat ndërmjet objekteve mund të maten dhe
interpretohen. Ky matës është krijuar me pranimin e intervaleve të barabarta
ndërmjet numrave. Për shembull, intervali ndërmjet 5 dhe 10 është i barabartë
me intervalin ndërmjet 45 dhe 50. Matja e temperaturave të ajrit mund të jetë në
formën 10 shkallë, 15 shkallë, 20 shkallë.
 Në matësin proporcional pika zero është një vlerë e vërtetë dhe tregon
mosekzistimin e një gjëje. Po ashtu, ekziston proporcion ndërmjet matjeve. Për
shembull, në qoftë se njërit nga objekteve i është dhënë vlera 1, tjetrës 3, tjetrës
6, mund të thuhet se objekti i shprehur me 6 është gjashtë herë më i madh se ai i
shprehur me 1 dhe dy herë më i madh se ai i shprehur me 3. Pesha, gjatësia,
shpenzimet, rroga mujore janë shembuj të vlerave proporcionale.

18.2. KONCEPTET THEMELORE NË METODËN E MATJES
SHUMËDIMENSIONALE
Kushti i aplikimit të MDS-së është paraqitja e marrëdhënieve ndërmjet njësive apo
objekteve në qoftë se mund të përfitohet matrica e distancës, në rastet kur nuk mund të
përcaktohen në mënyrë të plotë marrëdhëniet ndërmjet individëve apo objekteve.

437
Metoda MDS është një metodë e cila nuk kërkon supozimin e shpërndarjes në lidhje
me të dhënat. MDS-ja ofron përcaktimin e distancave të konfiguracionit (configuration
distances) të një MDS-je që përfaqëson me më pak gabime distancat ndërmjet objekteve
(data distances) të llogaritura në lidhje me llojin e ndryshoreve, me anë të çfarëdo metode
të regresionit (linear, polinominal, monotik).

Në metodën e MDS-së bëhet konfigurimi grafik i distancave ndërmjet njësive ose
objekteve të përfituara nga matrica e të dhënave të distancuara në një distancë me më pak
madhësi, gjë e cila quhet konfigurim grafik. Për të përfituar konfigurimin grafik, matrica e
distancës duhet që të konvertohet në koordinata të konfigurimit grafik me më pak gabime.

Distancat origjinale ndërmjet n objekteve apo njësive përpunohen si distanca
absolute. Sipas këtyre distancave, për të përfituar një konfigurim gjeometrik më të
përshtatshëm dhe me më pak madhësi duhet të përfitohet një sistem i koordinatave të
konfigurimit sa më afër distancave origjinale. Matësi i cili mat përshtatshmërinë ndërmjet
distancave origjinale dhe distancave konfigurative (configuration distance) quhet matësi
i stresit. Distancat konfigurative llogariten sipas metodave të ndryshme nga vlerat
origjinale. Për shembull, në qoftë se të dhënat janë me matës intervalor ose proporcional,
distancat parashikuese (konfigurative) sipas distancave të të dhënave llogariten me
regresion linear.

18.3. LLOJET E ANALIZAVE TË MATJES SHUMËDIMENSIONALE
MDS-ja, varësisht llojit të të dhënave aplikohet në tri forma, MDS Metrike (metric
multidimensional scaling), Gjysmë Metrike dhe MDS Jometrike (non-metric dimensional
scaling).

Teknikat Jometrike kanë për qëllim gjetjen e distancës me madhësi minimumi
(k=2, 3, 4) për të përfituar paraqitjen grafike të të dhënave dhe vendosjen e secilit objekt
apo individ në madhësi sipas rendit të zgjedhjes. Gjetjet tregojnë skemën e rendit të secilës
pikë të secilës madhësi dhe për këtë arsye nuk janë metrike. Kështu, me përdorimin e kësaj
teknike, të dhënat e përfituara janë të dhëna jometrike. Shpesh këto teknika japin rezultate
shumë të dobishme për shkak që nuk janë të dobëta dhe të paqarta.

Teknikat Metrike supozojnë se distancat e matricës janë të matura me matës
proporcional (ose së paku me matës intervalor të barabartë). Si rezultat, edhe pikat e
përfituara në rregullimin grafikor do të përfitohen me matje proporcionale, ashtu si të
hyrat.

Teknikat Gjysmë Metrike supozojnë se të dhënat përfitohen sipas metodës së
matjes renditëse dhe si rezultat do të përfitohen gjetje metrike. Kjo situatë nënkupton
438
supozimin se distancat e dalura nga prodhimi i teknikave gjysmë metrike përafërsisht janë
të matura me matës intervalor të barabartë. Me këtë teknikë arrihen te të dhëna të matura
në matës proporcional të përshtatshme me radhën e të dhënave origjinale nga radha e të
dhënave të distancës (pra nga të dhënat e ngjashme). Në këtë mënyrë, përfitohen
ngjashmëri proporcionale (ose metrike) në fund të vendosjes së stimujve në distancë të
krijuar nga madhësitë përkatëse, ashtu duke mos i prishur të gjitha rendet e ngjashmërisë.

Me pak fjalë, në qoftë se të dhënat që do të analizohen janë matur në shkallë të
matjes klasifikuese ose rendore përdoret metoda e matjes jometrike ose gjysmë metrike,
në qoftë se janë matur në shkallë të matjes intervalore ose proporcionale përdoret metoda
e matjes metrike. Në metodën e matjes metrike përdoren vlerat e distancës direkte në
përcaktimin e pozicionit të një vrojtimi të dhënë, kurse në metodën e matjes jometrike
përdoren numrat rendor në vend të vlerave të distancës ndërmjet vrojtimeve.

Lloji i të dhënave luan rol të rëndësishëm në përzgjedhjen metrike apo jo metrike të
MDS-së. Në qoftë se të dhënat që do të analizohen me MDS përcaktojnë dallimet, atëherë
matrica e dallimeve (dissimilarity) duhet të përfshijë të dhëna sasiore dhe të gjitha matjet e
dallimeve (dissimilarity) duhet të jenë të llogaritura me metodën e njëjtë të matjes
(metrike). Në qoftë se të dhënat janë të dhëna shumë ndryshoresh dhe matrica e të
dhënave përfshin ndryshore sasiore, dyshe, frekuenca, emërore dhe rendore, duhet të
bëhen konvertime në vlera të përshtatshme, si dhe matrica e dallimeve duhet të llogaritet
në mënyrë sasiore. Për matricat e bazuara në distancat sasiore dhe metrike aplikohet MDS
metrike, kurse për të dhënat skorike, rendore dhe kategorike aplikohet MDS jometrike.

Në rastet kur MDS-ja përdoret si metodë e reduktimit të të dhënave dhe nëse
veçanërisht të dhënat janë sasiore, përdoret analiza faktoriale si metodë alternative. Në
qoftë se MDS do të përdoret për të përcaktuar grupet sipas fenomeve të ngjashme që
krijojnë, si metodë alternative mund të përdoret metoda e analizës së grupimit fazor ose
mesatereve k. Përpara aplikimit të MDS-së është e rrugës që të diskutohet aplikueshmëria
e metodave të përmendura. Do të jetë përdorim i gabuar i metodës shqyrtimi i rezultateve
duke aplikuar MDS-së në të dhënat në të cilat mund të aplikohet analiza faktoriale për
reduktimin e të dhënave dhe përcaktimin e strukturës së faktorëve. Dallimi themelor
ndërmjet matjes shumëdimensionale dhe analizës së grupimit është se matja
shumëdimensionale ofron paraqitjen hapësinore të afërsive, kurse analiza e grupimit ofron
paraqitjen e afërsive në formë të pemës. Një dallim tjetër është se në analizën
shumëdimensionale objektet vlerësohen veç e veç në zbërthim duke u konsideruar të
pavarura nga njëra-tjetra. Kjo nuk është e mundur të realizohet me analizën faktoriale ose
të grupimit. Po ashtu, ndryshe nga analizat e tjera, në analizën e matjes shumëdimensionale
nuk përdoren ndryshore. Në vend të ndryshoreve, përdoren matjet globale të ngjashmërive
ndërmjet objekteve. Në këtë mënyra, ndryshorja e varur parqitet si ngjashmëri ndërmjet
objekteve.

439
Metoda MDS bën zgjidhje duke përdorur matricat e distancës. Për këtë arsye duhet
të llogariten matricat e distancës të përshtatshme për llojin e të dhënave. Matrica e
distancave MDS trajtohet si Matrica e Dallimeve.

Në qoftë se të dhënat janë përfituar me matje intervalore ose proporcionale, vlerat
dissimilarity llogariten në formën e distancës Euklid, distancës Katrore të Euklidit, Blok,
Minkowski, Chebychev, Customized etj.

Distanca e Euklidit dhe Distanca Katrore e Euklidit është një matës i cili
përcakton distancat ndërmjet njësive i dhe j (vrojtimeve) nga një matricë e të dhënave të
madhësisë n*p në formën e matjes së drejtpërdrejtë (distanca e Euklidit) ose në formën e
distancave katrore (distanca katrore e Euklidit). Distanca e Euklidit gjendet duke marrë
për rrënjë katrorin e totalit të katrorëve të dallimeve sipas ndryshores p të njësive i dhe j.
Distanca katrore e Euklidit llogaritet sikurse distanca e Euklidit. Sipas ndryshoreve
distancat e përfituara shkruhen drejtpërdrejtë në matricë duke mos marrë për rrënjë
katrorin e distancës totale.

Metoda Chebychev krijon matricën e distancave duke llogaritur maksimumin
ndërmjet ndryshoreve në formë të ndryshimit absolut.

Block krijon matricën e distancave në formën e totalit të dallimit absolut ndërmjet
ndryshoreve.

Minkowski llogarit totalin e dallimeve absolute ndërmjet ndryshoreve nga rrënja p
deri në fuqinë p.

Customized llogarit totalin e dallimeve absolute ndërmjet ndryshoreve nga rrënja r
deri në fuqinë p.

Në qoftë se të dhënat janë me matës binor (binary) llogariten me një nga format e
distancës, distancës së Euklidit, distancës Katrore të Euklidit, Size Difference, Pattern
Difference, Variancës ose Lance-Williams.

Distanca binore e Euklidit llogaritet me anë të tabelave katër-sysh.

Distanca binore katrore e Euklidit llogaritet si numër i mostrave konfliktuale
ndërmjet vete, vlera minimale e saj është 0 dhe nuk ka kufi të lartësisë.

Size Difference është indeks asimetrik. Merr vlera ndërmjet 0 dhe 1.

Pattern Difference, Variance, Lance and Williams llogariten me ndihmën e tabelave
katër-sysh.

440
Në qoftë se të dhënat janë vlera numërimi (count) atëherë llogariten në formën e
matjes së distancës chi-square ose matjes phi-square. Chi-Square teston barazinë e setit të
dy frekuencave duke u bazuar në katrorin-ki. Phi-Square është e barabartë me katrorin-ki
të normalizuar me rrënjën katrore të frekuencave të bashkuara.

Në qoftë se të dhënat janë përfituar me matës të ndryshëm, atëherë paraprakisht
vlerat duhet të standartizohen. Në të dhënat dyshe (binary) nuk mund të aplikohet
transformim. Metodat e përdorura më shpesh të standartizimit janë këto:

 Konvertim në rezultatet Z: vlerat kthehen në rezultate z në mënyrë që
mesatarja e tyre është e barabartë me 0 dhe devijimi standart me 1. Aplikohet në
të dhënat e përfituara me matës proporcional ose intervalor dhe në të dhënat që
supozohet se shfaqin shpërndarje normale.
 Konvertim në intervalin −1 dhe +1: vlerat konvertohen në intervalin −1 dhe
+1 duke u pjesëtuar me intervalin e ndryshimit të sekuencave të të dhënave.
Është një metodë konvertimi e cila preferohet në rastet kur vlerat marrin pjesë
në struktura heterogjene dhe ekstreme.
 Konvertim në intervalin 0 dhe 1: vlerat konvertohen në intervalin 0 dhe 1
duke u pjesëtuar me intervalin e ndryshimit pas marrjes së ndryshimit të vlerës
minimale. Është një metodë e konvertimit e cila preferohet në rastet kur vlerat
marrin pjesë në një strukturë heterogjene dhe ekstreme, në mënyrë për t’i
konvertuar vlerat në pozitive dhe në formën që do të ndryshojnë në intervalin 0
dhe 1.
 Konvertimi i vlerës maksimale në formën që të jetë një: secila vlerë
konvertohet në intervalin+1 dhe vlerës minimale duke u pjesëtuar me vlerën
maksimale të sekuencës së të dhënave. Kjo metodë përdoret në qoftë se
dëshirohet që vlerat e sekuencës të kenë vlerën maksimale 1.
 Konvertimi në formën që mesatarja të jetë 1: secila vlerë pjesëtohet me
mesataren e sekuencës. Aplikohet në rastet kur kërkohet që mesatarja e
sekuencës së re të konvertuar të jetë pozitive ose 1.
 Konvertimi në vlera të cilat e kanë devijimin standart 1: secila vlerë
konvertohet duke u pjesëtuar me devijimin standart të sekuencës. Aplikohet në
rastet kur kërkohet që devijimi standart i sekuencës së re të konvertuar të jetë 1.

18.4. APLIKIMI I ANALIZËS SË MATJES SHUMËDIMENSIONALE
Metoda MDS është një familje e metodave e cila përfshin shumë metoda brenda
vetes. Mirëpo, hapat themelor të aplikimit tregojnë ngjashmëri me hapat e aplikuar në
metodën klasike MDS. Këta hapa mund të përmbledhen në gjashtë faza:

441
1. Zgjedhja e një metode të përshtatshme të transformimit sipas llojit të të dhënave
dhe përfitimi i të dhënave duke i konvertuar ato në varësi të kësaj zgjedhjeje. Në
qoftë se të dhënat janë përfituar sipas matësve të ndryshëm, atëherë aplikimi i
saj është i vështirë.
2. Llogaritja e matricës së përshtatshme të distancave në varësi të llojit të të
dhënave.
3. Vendoset se në çfarë madhësi hapësire mund të shfaqen objektet apo njësitë n të
cilat kanë matricë të të dhënave me p ndryshore dhe p madhësi. Në aplikim
zakonisht zgjedhen madhësitë 2, 3, 4 dhe përfitohen zgjedhjet MDS për secilën
nga këto madhësi. Po ashtu, për çdo k llogaritet përshtatshmëria e zgjedhjeve
(matja stress) për matricën origjinale të distancave dhe jepet vendim se në
çfarë madhësie është realizuar zgjedhja e përshtatshme dhe cila zgjedhje do të
aplikohet.
4. Regresioni i distancave të konfiguracionit dij sipas distancave të të dhënave
llogaritet sipas llojit të të dhënave. Sipas llojit të të dhënave zgjedhet një nga
metodat e përshtatshme të regresionit, linear, polinominal ose monotik. Me anë
të ekuacionit të përcaktuar të regresionit përcaktohen distancat parashikuese të
konfiguracionit. Këto distanca të parashikuara quhen pabarazi (disparity).
Edhe matrica e përfituar nga këto distanca quhet Matrica e Pabarazisë
(disparity).
5. Me qëllim për të përcaktuar përshtatshmërinë ndërmjet distancave të
konfiguracionit dhe distancave të parashikuara, llogaritet statistika e stresit, si
një statistikë e përshtatshme. Statistika e stresit llogaritet në forma të ndryshme,
si Kruskal Stress Statistics, Young Stress Statistic etj. Statistika Kruskal Stress
llogaritet duke marrë rrënjën katrore të raportit të distancave të konfiguracionit
të parashikimit të dallimeve ndërmjet matjeve konfigurative dhe matjeve
konfigurative të parashikuara dhe shpreh përshtatshmërinë ndërmjet
distancave të të dhënave dhe distancave konfigurative. Vlera Stress është një
matës i dobishëm në përcaktimin e përshtatshmërisë së numrit të madhësive të
përdorur në rregullimin grafikor të përfituar në fund të analizës
shumëdimensionale. Matja stress e cila është një matje e përshtatshmërisë apo
nivelit të përshtatshmërisë ka një përdorim të gjerë në analizën
shumëdimensionale. Për shkak që vlerat e mëdha të matjes stress mund të
nënkuptojnë përshtatshmëri të keqe nga ajo e dëshiruar, është e mundur që ky
matës të shihet si tregues i përshtatshmërisë së keqe.
6. Përfitohen koordinatat e njësive apo objekteve sipas madhësisë k. Duke u
shfaqur këto koordinata në hapësirë me madhësi k paraqiten pozicionet e secilës
njësi apo objekt sipas njësisë apo njësive tjera. Përmes interpretimit të këtyre
paraqit